de Gruyter Lehrbuch Walter · Einführung in die Analysis 2
Rolf Walter
Einführung in die Analysis 2
≥
Walter de Gruyter Berlin · New York
Prof. Dr. Rolf Walter Fachbereich Mathematik Institut für Analysis Universität Dortmund Vogelpothsweg 87 44227 Dortmund E-Mail:
[email protected] " Gedruckt auf säurefreiem Papier, das die US-ANSI-Norm über Haltbarkeit erfüllt. ISBN 978-3-11-019540-8 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. " Copyright 2007 by Walter de Gruyter GmbH & Co. KG, 10785 Berlin. Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Konvertierung von LaTeX-Dateien des Autors: M. Pfizenmaier, Berlin. Einbandgestaltung: Martin Zech, Bremen. Druck und Bindung: Druckhaus »Thomas Müntzer«, Bad Langensalza.
Vorwort Die Strecke hat kein Geheimnis. Das Geheimnis ist in der Sphäre. (Thomas Mann: Die Geschichten Jaakobs)
Nachdem sich der erste Band hauptsächlich mit den reellen Zahlen und ihren Funktionen beschäftigt, wird nun der Sprung ins Höherdimensionale vollzogen. Das beginnt mit den Räumen der Anschauung, der Ebene und dem dreidimensionalen Raum. Der Blick öffnet sich dann zum n-dimensionalen Raum Rn und weitet sich schließlich zu den unendlich-dimensionalen Räumen, deren Punkte z.B. Funktionen sein können. Diese Öffnung gilt nicht nur für die Konvergenzbegriffe (die bereits bei den metrischen Räumen eine entsprechende Verallgemeinerung erfahren haben) sondern gerade auch für die Differentialrechnung und mit — gleichem Recht — für die Integralrechnung. Dabei führt das erweiterte Gesichtsfeld fast von alleine zu einer größere Transparenz der Dinge, die das Verständnis sehr erleichtert. Im Licht dieser Philosophie stehen die Themen dieses Bandes unter der Überschrift Analysis in Vektorräumen. Es ist schon sehr erstaunlich, welch innige Symbiose Analysis und Geometrie dabei eingehen. Das zeigt sich nicht nur in einer geometrischen Sprache, die sich (mit gehöriger Präzision) in solchen Räumen entwickelt hat, sondern in der ganzen Denkweise, die das Formale mit vertrauten Mustern korrespondieren lässt. Die Grundsätze, die im Vorwort von Band 1 beschrieben sind, bestehen natürlich unverändert weiter, ebenso wie die Danksagungen, die erneut und gerne bekräftigt seien. Der Leser gehe nun frisch ans Werk, so wie es bei Thomas Mann in dem Roman „Der junge Joseph“ heißt: Mache deinen Sinn hell, scharf und heiter! Dortmund im Juni 2007
Rolf Walter
Zum Gebrauch des Buches Teil 1 umfasst die Kapitel 1 bis 9, Teil 2 die Kapitel 10 bis 14. Alle Kapitel sind in Abschnitte mit zweistelligen Unternummern gegliedert. In jedem Abschnitt fängt die Nummerierung von Definitionen, Formeln usw. neu an, wobei Sätze, Definitionen, Beispiele und Bemerkungen gemeinsam mit großen lateinischen Buchstaben durchgezählt sind. Verweise erfolgen im gleichen Abschnitt ohne dessen Nennung, an anderen Stellen unter Anfügung des zitierten Abschnitts in eckigen Klammern; z.B. verweist „Satz E[5.1]“ auf Satz E des Abschnitts 5.1. Bei einem Zusatz werden stets die Voraussetzungen beibehalten. Das Ende eines Beweises wird durch das Symbol „"“ angedeutet, die Zeichen „´“ und „µ“ signalisieren eine Definitionsgleichung, wobei der Doppelpunkt auf der Seite der neu eingeführten Größe steht. Generalvoraussetzungen eines Kapitels oder Abschnitts gelten auch für die zugehörigen Aufgaben und Anmerkungen. Die #-Teile sind nützliche, aber optionale Ergänzungen. Von ihnen wird im „ungesternten“ Haupttext kein Gebrauch gemacht (wohl aber in anderen #-Teilen). Bei den Aufgaben signalisiert der Stern den Bezug zu einem #-Teil oder einen etwas höheren Schwierigkeitsgrad. Die nötigen mengentheoretischen Begriffe sind in einem Anhang zusammengestellt. Dieser ist zur Zeit in Kurzfassung elektronisch verfügbar unter der Adresse http://www.mathematik.uni-dortmund.de/lsvii/Preprints/mengen.pdf Folgende dort getroffene Konvention sei hier hervorgehoben: Sind A.x/; B.x/ Aussageformen auf der Menge M , so ist die Formel: A.x/ H) B.x/ eine Kurznotation für die Formel: 8 x 2 M W A.x/ H) B.x/. Von dieser Verabredung wird gelegentlich Gebrauch gemacht, um lange formelmäßige Sequenzen etwas abzukürzen. Dabei ist die Menge M meistens aus dem Zusammenhang klar. Die Standardmengen der Mathematik sind folgendermaßen bezeichnet: N Z Q R C
Menge der natürlichen Zahlen (ohne 0) Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der reellen Zahlen Menge der komplexen Zahlen.
Das Anhängen des Indexes 0 bedeutet hier die Hinzunahme der Null; z.B. ist N0 die Menge der natürlichen Zahlen zusammen mit 0. Die Marken „C“ und „%“ bezeichnen
viii entsprechende Vorzeichenbeschränkungen; z.B. ist RC die Menge aller positiven, RC 0 die Menge aller nichtnegativen reellen Zahlen. Die Darstellung der Analysis ist vollständig und in sich abgeschlossen. Aber die Mathematik ist immer offen für neue Probleme, Lösungen und Entwicklungen. Wer weitere Publikationen kennen lernen möchte, sei auf die Literaturliste am Ende hingewiesen. Dort findet sich auch ein ausführliches Stichwortverzeichnis für auftretende Begriffe. Hinweise auf die Literaturliste erfolgen durch Nennung der Autoren zusammen mit dem entsprechenden Erscheinungsjahr in eckigen Klammern (Beispiel: Artin[1931]). Das Stichwortverzeichnis ist ein nützliches Hilfsmittel zur Ergänzung der im Text reichlich angegebenen Bezüge; es enthält auch die Lebensdaten der zitierten Wissenschaftler.
Inhaltsverzeichnis Vorwort
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
Zum Gebrauch des Buches . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
10 Differentialrechnung mehrerer Veränderlicher 10.1 Normierte Vektorräume . . . . . . . . . . . 10.2 Totale Differenzierbarkeit . . . . . . . . . . 10.3 Funktionen einer Veränderlichen . . . . . . 10.4 Spezielle Räume . . . . . . . . . . . . . . 10.5 Richtungsableitung und partielle Ableitung 10.6 Totale und partielle Ableitung . . . . . . . 10.7 Taylor-Formel für mehrere Veränderliche . 10.8 Extrema bei mehreren Veränderlichen . . . 10.9 Zusammenhang und Wegzusammenhang . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. 1 . 1 . 16 . 24 . 35 . 54 . 58 . 79 . 89 . 104
11 Integralrechnung mehrerer Veränderlicher . . . . 11.1 Stetige Abbildungen kompakter Intervalle . . . 11.2 Stetige Abbildungen kompakter Quader . . . . 11.3 Nullmengen . . . . . . . . . . . . . . . . . . . 11.4 Das Lebesgue-Integral . . . . . . . . . . . . . 11.5 Vollständigkeit und Konvergenzsätze . . . . . . 11.6 Lebesgue-Maß und Integration über Teilmengen 11.7 Uneigentliche Integrale . . . . . . . . . . . . . 11.8 Berechnungstechniken für mehrfache Integrale 11.9 Satz von Fubini und Transformationsformel . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
111 112 124 145 157 176 188 210 224 246
12 Umkehrung differenzierbarer Abbildungen . . 12.1 Der Umkehrsatz . . . . . . . . . . . . . . . . 12.2 Implizite Funktionen . . . . . . . . . . . . . 12.3 Extrema mit Nebenbedingungen . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
278 279 299 307
13 # Ergänzungen zur Analysis . . . . . . . . . . . . . . . . 13.1 Lokale Integrierbarkeit und die Lp -Räume . . . . . . . 13.2 Messbare Mengen . . . . . . . . . . . . . . . . . . . . 13.3 Messbare Abbildungen . . . . . . . . . . . . . . . . . 13.4 Die Mittelwertsätze der Integralrechnung, Produktsatz
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
314 314 332 336 354
. . . .
x
Inhaltsverzeichnis
13.5 Die Gammafunktion – Einführung und Bericht . . . . . . . . . . . . 365 13.6 Die Einzigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . 375 14 # Ergänzungen zur Topologie . . . . . . . . . . . . . . . 14.1 Weiteres über den Zusammenhang . . . . . . . . . . 14.2 Globale Winkelfunktionen und Abbildungsgrad . . . 14.3 Vervollständigung – metrische Räume, reelle Zahlen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
383 383 388 415
Literatur (Ergänzungen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 Wichtige Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 Sachregister . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
Inhaltsverzeichnis Vorwort
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
Zum Gebrauch des Buches . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
10 Differentialrechnung mehrerer Veränderlicher 10.1 Normierte Vektorräume . . . . . . . . . . . 10.2 Totale Differenzierbarkeit . . . . . . . . . . 10.3 Funktionen einer Veränderlichen . . . . . . 10.4 Spezielle Räume . . . . . . . . . . . . . . 10.5 Richtungsableitung und partielle Ableitung 10.6 Totale und partielle Ableitung . . . . . . . 10.7 Taylor-Formel für mehrere Veränderliche . 10.8 Extrema bei mehreren Veränderlichen . . . 10.9 Zusammenhang und Wegzusammenhang . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. 1 . 1 . 16 . 24 . 35 . 54 . 58 . 79 . 89 . 104
11 Integralrechnung mehrerer Veränderlicher . . . . 11.1 Stetige Abbildungen kompakter Intervalle . . . 11.2 Stetige Abbildungen kompakter Quader . . . . 11.3 Nullmengen . . . . . . . . . . . . . . . . . . . 11.4 Das Lebesgue-Integral . . . . . . . . . . . . . 11.5 Vollständigkeit und Konvergenzsätze . . . . . . 11.6 Lebesgue-Maß und Integration über Teilmengen 11.7 Uneigentliche Integrale . . . . . . . . . . . . . 11.8 Berechnungstechniken für mehrfache Integrale 11.9 Satz von Fubini und Transformationsformel . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
111 112 124 145 157 176 188 210 224 246
12 Umkehrung differenzierbarer Abbildungen . . 12.1 Der Umkehrsatz . . . . . . . . . . . . . . . . 12.2 Implizite Funktionen . . . . . . . . . . . . . 12.3 Extrema mit Nebenbedingungen . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
278 279 299 307
13 # Ergänzungen zur Analysis . . . . . . . . . . . . . . . . 13.1 Lokale Integrierbarkeit und die Lp -Räume . . . . . . . 13.2 Messbare Mengen . . . . . . . . . . . . . . . . . . . . 13.3 Messbare Abbildungen . . . . . . . . . . . . . . . . . 13.4 Die Mittelwertsätze der Integralrechnung, Produktsatz
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
314 314 332 336 354
. . . .
x
Inhaltsverzeichnis
13.5 Die Gammafunktion – Einführung und Bericht . . . . . . . . . . . . 365 13.6 Die Einzigkeit der reellen Zahlen . . . . . . . . . . . . . . . . . . . . 375 14 # Ergänzungen zur Topologie . . . . . . . . . . . . . . . 14.1 Weiteres über den Zusammenhang . . . . . . . . . . 14.2 Globale Winkelfunktionen und Abbildungsgrad . . . 14.3 Vervollständigung – metrische Räume, reelle Zahlen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
383 383 388 415
Literatur (Ergänzungen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 Wichtige Symbole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 Sachregister . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
10 Differentialrechnung mehrerer Veränderlicher Am Ende des ersten Bandes hatten wir Funktionen mehrerer Veränderlicher betrachtet und einige Aspekte studiert, die hauptsächlich auf der eindimensionalen Analysis beruhten. Dabei wurden n reelle Veränderliche zu einem n-Tupel zusammengefasst. Diese bilden in ihrer Gesamtheit den Raum Rn . Der Raum Rn trägt die Struktur eines Vektorraums, wenn man die grundlegenden Operationen der Addition und Multiplikation von n-Tupeln komponentenweise erklärt, wie in der linearen Algebra (und zu Beginn des Kapitels 9) erklärt. Wir gehen nun einen Schritt weiter, indem wir allgemein Abbildungen zwischen Vektorräumen betrachten. Dadurch betten wir die Theorie der Funktionen mehrerer Veränderlicher ein in die Analysis in Vektorräumen. So werden wir auch unabhängig von der endlichen Dimension und erreichen gleichzeitig eine Befreiung von Koordinaten. Viele Aussagen von früher finden sich in diesem allgemeineren Rahmen wieder, vor allem solche, die von der Anordnung der reellen Zahlen unabhängig sind. Die koordinatenfreie Behandlung von Vektorräumen macht vieles übersichtlicher, und sie entspricht dem modernen Trend in Analysis und linearer Algebra. Wir behandeln primär reelle Vektorräume. Die Modifikationen für komplexe Vektorräume machen keine Mühe; sie werden im weiteren Verlauf mitdiskutiert. Vektorräume werden bei der allgemeinen Behandlung mit V; W; : : : bezeichnet, ihre Elemente, die Vektoren mit u; v; : : : und die Skalare (also hier die reellen Zahlen) mit ˛; ˇ; : : :. Für die Elemente u; v eines Vektorraums V und Skalare ˛; ˇ sind zwei Operationen definiert, nämlich die Summe u C v und das (skalare) Vielfache ˛ ' v D ˛v, wobei die Ergebnisse jeweils wieder Elemente von V sind. Diese Verknüpfungen gehorchen bestimmten Rechenregeln, die man so zusammenfassen kann: V ist eine kommutative Gruppe bzgl. C mit Neutralelement 0, dem Nullvektor, und es gilt stets .˛ Cˇ/u D ˛uCˇu;
.˛ˇ/u D ˛.ˇu/;
1'u D u;
˛.uCv/ D ˛uC˛v:
Statt ˛v wird gelegentlich v˛ oder auch v ' ˛ geschrieben. Im Falle ˛ ¤ 0 schreibt u man ˛1 ' u oft als ˛ und manchmal zur Platzersparnis als u=˛.
10.1 Normierte Vektorräume Für die Zwecke der Analysis müssen die Vektorräume eine Zusatzstruktur tragen, damit topologische Begriffe sinnvoll werden. Sehr bewährt als Zusatzstruktur hat sich der Normbegriff.
2
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
A. Definition. Eine Norm auf dem Vektorraum V ist eine Abbildung von V in R, u 7! kuk, mit folgenden Eigenschaften: (N.1) (N.2)
kuk > 0
für u ¤ 0
k˛uk D j˛j kuk
(N.3) ku C vk 0 kuk C kvk
(Definitheit) (positive Homogenität) (Dreiecksungleichung).
Das Paar .V; k k/ heißt dann ein normierter Vektorraum (ebenso V selbst, wenn die Norm aus dem Zusammenhang klar ist). Setzt man in (N.2) ˛ D 0 bzw. ˛ D %1, so erhält man zusammen mit (N.1) die Regeln: kuk D 0 () u D 0; k % uk D kuk: Eine Norm ordnet also jedem Vektor u 2 V in bestimmter Weise eine nichtnegative reelle Zahl kuk zu, die auch als Länge von u bezeichnet wird. Wie beim Betrag in I[1.1] ergeben sich aus den obigen Regeln die modifizierten Dreiecksungleichungen: ˇ ˇ ku % vk $ ˇ kuk % kvk ˇ;
ˇ ˇ ku C vk $ ˇ kuk % kvk ˇ:
Tatsächlich kann man den dortigen Beweis einfach übernehmen, wenn man überall die Betragsstriche durch die Normstriche ersetzt. Wir reproduzieren dies nochmals, werden aber in Zukunft dieses Ersetzungsschema einfach zitieren. Hier gilt also unter Verwendung von (N.3): kuk D k.u % v/ C vk 0 ku % vk C kvk. Daraus folgt ku % vk $ kuk % kvk. Vertauschung von u und v liefert ku % vk $ kvk % kuk, also die erste Behauptung. Ersetzen von v in dieser durch %v liefert die zweite Behauptung. Ganz allgemein spielen Normen in Vektorräumen eine ähnliche Rolle wie der Betrag in R. Eine große Erleichterung liefert der folgende A. Zusatz. Ein normierter Vektorraum .V; k k/ wird durch die Festsetzung d.u; v/ ´ ku % vk
für u; v 2 V
zu einem metrischen Raum. Beweis. Wir überprüfen die Metrikaxiome aus A[6.1]: Zu (D.1): Unmittelbar klar aus der Definition, da ku % vk D kv % uk.
Abschnitt 10.1 Normierte Vektorräume
3
Zu (D.2), (D.3): Es ist ku % vk stets $ 0 und D 0 genau wenn u % v D 0, also für u D v. Zu (D.4): Man berechnet d.u; w/ D ku % wk D k.u % v/ C .v % w/k 0 ku % vk C kv % wk D d.u; v/ C d.v; w/; womit alles gezeigt ist.
"
Die Bedeutung der Norm kuk ist die eines Maßes für die Länge eines Vektors u 2 V . Demgegenüber ist die Distanz d.u; v/ ein Maß für den Abstand zweier Elemente u; v 2 V . Jeder Vektor u ¤ 0 in V kann auf 1 normiert werden, d.h. man kann den zugehörigen u bilden. Es gilt ja: Einheitsvektor kuk - u 1 - kuk - D kuk kuk D 1: Die Aussage des Zusatzes hat eine enorme Bedeutung. Denn nun können wir alle Begriffe und Sätze, die wir in Kapitel 6 für metrische Räume aufgestellt haben, auf normierte Vektorräume anwenden. Hinzu kommt die Erleichterung, dass Distanzen mit der Norm ausgedrückt werden können, sodass viele Abschätzungen aus der eindimensionalen Theorie übertragen werden können. Insbesondere können wir Folgendes feststellen: B. Definition und Satz (Grenzprozesse für normierte Vektorräume). Da ein normierter Vektorraum .V; k k/ zugleich ein metrischer Raum .V; d / ist, sind alle Begriffe der metrischen Räume hierauf anwendbar. Grundlegend sind wieder die Bälle B.a; r/; B.a; r/ bzw. die Sphären S.a; r/, speziell die mit Zentrum a D 0, die jetzt so bezeichnet werden: ˇ , ˚ B.r/ ´ B.0; r/ D u 2 V ˇ kuk < r ˇ , ˚ B.r/ ´ B.0; r/ D u 2 V ˇ kuk 0 r ˇ , ˚ S.r/ ´ S.0; r/ D u 2 V ˇ kuk D r : Ein Ball bzw. eine Sphäre mit Radius r D 1 heißt ein Einheitsball bzw. eine Einheitssphäre. Ist zusätzlich das Zentrum a D 0, so spricht man von dem Einheitsball bzw. der Einheitssphäre. Anstatt alles mittels der Metrik d oder mit Bällen auszudrücken, geht dies auch direkt mit der Norm. Dann erhält man meistens gleiche Formulierungen wie in R, wobei nur der Betrag durch die Norm zu ersetzen ist. Z.B.:
4 (i)
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Die Folge .uk /k2N in V ist konvergent, wenn gilt: 9 a 2 V 8 " > 0 9 N D N."/ 2 N 8 k > N W kuk % ak < ":
(ii) Sei .W; jjj jjj/ ein weiterer normierter Vektorraum. Die Abbildung F W A ! W mit A - V ist stetig in a 2 A, wenn gilt: 8 " > 0 9 ı D ı."/ > 0 8 u 2 A; ku % ak < ı W jjjF .u/ % F .a/jjj < ": (iii) Es gilt B.a; r/ D B.a; r/. Beweis. Der Nachweis von (iii) ist eine typische Anwendung des genannten Übertragungsschemas. Man kann einfach die Argumente aus Beispiel I(v)[6.4] wörtlich übernehmen, wenn man die dortige spezielle Norm durch die jetzige allgemeine Norm ersetzt. " C. Bemerkung. Wie in Abschnitt 3.3 gibt es auch hier weitere Varianten, um die Stetigkeit in B(ii) anders (aber äquivalent) auszudrücken. Z.B. gilt analog zu Satz C[3.3], wenn man die Stelle u in der Form u D a C h schreibt: Ist a isolierter Punkt von A, so ist F immer stetig in a. Ist a Häufungspunkt von A, so ist F in a dann und nur dann stetig, wenn (1)
lim F .a C h/ D F .a/
h!0
gilt. Dabei ist h 2 V natürlich so zu wählen, dass a C h in A liegt. Gleichwertig mit (1) kann man auch schreiben: (2)
lim .F .a C h/ % F .a// D 0:
h!0
Oftmals hat man für einen und denselben Vektorraum V verschiedene „Maßbestimmungen“, also verschiedene Normbegriffe. Man muss dann wissen, wann diese zur gleichen Topologie führen. In Spezialfällen sind wir dieser Frage schon früher nachgegangen; vgl. den Beginn von Abschnitt 7.3 und von Kapitel 9. Hier folgt die allgemeine Fassung: D. Definition. Zwei Normen k k1 und k k2 auf dem gleichen Vektorraum V heißen äquivalent, wenn es Konstanten 112 > 0 und 121 > 0 gibt, sodass für alle u 2 V gilt: kuk1 0 112 ' kuk2 ;
kuk2 0 121 ' kuk1 :
Obwohl die Bälle und Sphären bei äquivalenten Normen unterschiedlich aussehen können (Beispiele in Abschnitt 10.4), bleiben wichtige Folgebegriffe invariant:
5
Abschnitt 10.1 Normierte Vektorräume
E. Satz. Äquivalente Normen führen zu den gleichen topologischen Grundbegriffen (z.B. Offenheit, Abgeschlossenheit, Häufungspunkt, Abschluss, Inneres, Rand, Dichtheit und Kompaktheit von Teilmengen, Konvergenz von Folgen sowie Grenzwert, Stetigkeit und Homöomorphie von Abbildungen). Dasselbe gilt für die entsprechenden gleichmäßigen Varianten, die Beschränktheit und Vollständigkeit von Teilmengen sowie die Cauchy-Eigenschaft von Folgen. Bei den Begriffen, die sich auf Abbildungen zwischen Vektorräumen beziehen, gilt die Invarianz bzgl. der äquivalenten Abänderung der Metriken in Definitions- und Zielraum. Beweis von E. Der Grund ist wie früher die gegenseitige Abschätzbarkeit der Distanzen und die daraus folgende Möglichkeit der Ballinklusionen wie in A[7.3]: ku % ak1
0, sodass kLu % L0kW < 1 für ku % 0kV < ı gilt (Stetigkeit in 0). Dies bedeutet: kukV < ı H) kLukW < 1: Daraus folgen mit der Homogenität der Norm und der von L die Schlüsse: - - / 1-ı ı 2 ı u < 1 H) kLukW < : L kukV 0 1 H) - u- 0 < ı H) 2 V 2 2 ı W Also tut es 1 ´ 2=ı. Aus (ii) folgt (iii): Man schließt so: - u - D 1 H) u ¤ 0 H) kukV -V H)
- / u -L kukV
1-
W
01
1 kLukW 0 1 H) kLukW 0 1 ' kukV : kukV
Da die letzte Ungleichung für u D 0 trivial ist, folgt (iii) mit + ´ 1. Aus (iii) folgt (i): Aus (iii) folgt aufgrund der Linearität kLu1 % Lu2 kW D kL.u1 % u2 /kW 0 + ' ku1 % u2 kV : + ist also gleichzeitig eine Lipschitz-Konstante für L. Daraus ergibt sich die (sogar gleichmäßige) Stetigkeit von L; vgl. J[6.2]. " F. Zusatz. Ist L linear und stetig, so ist L Lipschitz-stetig, also insbesondere gleichmäßig stetig. " G. Definition. Es sei L.V; W / ´ die Menge der linearen Abbildungen von V in W L.V; W / ´ die Menge der stetigen linearen Abbildungen von V in W : Im Falle V D W schreibt man L.V / ´ L.V; V / und L.V / ´ L.V; V /. Eine bijektive lineare Abbildung L W V ! W , heißt toplinear, wenn sie zugleich topologisch ist, also L und L&1 beide stetig sind. Der Raum L.V; W / ist nun selbst wieder ein normierter Vektorraum:
7
Abschnitt 10.1 Normierte Vektorräume
H. Definition und Satz. Man definiert für L 2 L.V; W / ˇ , ˚ kLkV W ´ sup kLukW ˇ kukV 0 1 2 RC 0: Dann gilt: (i) (ii)
kLukW 0 kLkV W ' kukV
für alle u 2 V :
L.V; W / ist ein Untervektorraum von L.V; W /.
(iii) k kV W ist eine Norm auf L.V; W /, die zum Normpaar k kV ; k kW gehörende Operator-Norm. Beweis. Dass das Supremum in RC 0 liegt, ist aus F(ii) klar. Zu (i): Für u D 0 ist die Behauptung trivial. Für u ¤ 0 haben wir wieder unter Ausnutzung der Homogenitäten: - / 1u - ' kuk 0 kLk kLukW D -L V W ' kukV : V kukV -W Zu (ii) und (iii): Sei L1 ; L2 2 L.V; W /. Zu zeigen ist: L1 C L2 2 L.V; W /. Die Linearität von L1 C L2 ist bekannt. Die Stetigkeit von L1 C L2 folgt aus der Abschätzung k.L1 C L2 /ukW D kL1 u C L2 ukW 0 kL1 ukW C kL2 ukW
(N.3)
0 kL1 kV W ' kukV C kL2 kV W ' kukV
(i)
D .kL1 kV W C kL2 kV W / ' kukV : unter Beachtung von F(iii). Spezialisiert man Anfang und Ende der Kette auf kukV 0 1, so erkennt man kL1 C L2 kV W 0 kL1 kV W C kL2 kV W : Sei L 2 L.V; W /; % 2 R. Zu zeigen ist: %L 2 L.V; W /. Die Linearität von %L ist bekannt. Für u 2 V gilt k.%L/ukW D j%j ' kLukW :
8
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Betrachtet man diese Ungleichung für kukV 0 1, so sieht man mittels F(ii), dass %L stetig ist. Durch Übergang zu den Suprema folgt weiter k%LkV W D j%j ' kLkV W : Von den Normaxiomen für k kV W fehlt jetzt nur noch (N.1). Aber diese Regel ist ebenfalls erfüllt: Aus kLkV W D 0 folgt nach (i) für alle u 2 V : kLukW D 0, also " Lu D 0, somit L D 0. Daher gilt kLkV W > 0, falls L ¤ 0. I. Satz. Seien .V; k kV /, .W; k kW / und .Z; k kZ / normierte Vektorräume. Dann gilt: Ist L 2 L.V; W / und M 2 L.W; Z/, so ist M ı L 2 L.V; Z/ und kM ı LkV Z 0 kM kW Z ' kLkV W : Beweis. Für u 2 V gilt H(i) H(i) kM ı L.u/kZ D kM.L.u//kZ 0 kM kW Z 'kLukW 0 kM kW Z 'kLkV W 'kukV : Daraus folgen beide Behauptungen.
"
Konvexität Dies ist ein geometrischer Begriff, der auch in der Analysis eine große Bedeutung hat: J. Definition. Sei V ein reeller Vektorraum. (i)
Die Verbindungsstrecke zweier Punkte u; v 2 V ist die Menge aller Punkte u C t.v % u/ D .1 % t/u C tv
mit t 2 Œ0; 12:
(ii) Eine Teilmenge A - V heißt konvex, wenn sie mit je zwei Punkten u; v stets auch deren Verbindungsstrecke enthält, d.h. wenn gilt u; v 2 A; t 2 Œ0; 12 H) .1 % t/u C tv 2 A: (iii) Ist A - V konvex, so nennt man eine Funktion f W A ! R konvex, wenn gilt für alle u; v 2 A und t 2 Œ0; 12 gilt f ..1 % t/u C tv/ 0 .1 % t/f .u/ C tf .v/: Ist %f konvex, so nennt man f konkav.
9
Abschnitt 10.1 Normierte Vektorräume
Deutet man t als Zeit, so befindet sich der „laufende“ Punkt .1 % t/u C tv der Verbindungsstrecke zur Zeit t D 0 in u und zur Zeit t D 1 in v. Die Verbindungsstrecke ist Teil der Verbindungsgeraden, deren Punkte man in der Form .1%t/uCtv erhält, wenn t alle reellen Zahlen durchläuft. (Im Falle u D v reduzieren sich Verbindungsstrecke und Verbindungsgerade auf die einpunktige Menge fug.) Die folgenden Bilder zeigen anschauliche Beispiele im zweidimensionalen Fall:
u u A
A v
v
Konvexe Menge A
Nichtkonvexe Menge A
Bei V D R ist jedes Intervall J - R konvex. Ein Vergleich mit A[8.6] lehrt, dass in diesem Fall die neue und die alte Definition für die Konvexität einer Funktion f W J ! R zusammenfallen. K. Satz. Jeder offene Ball B.a; r/ und jeder abgeschlossene Ball B.a; r/ eines normierten Vektorraums .V; k k/ ist konvex. Beweis. Sei z.B. der abgeschlossene Fall behandelt: Hier ergibt sich der Beweis aus folgender Schlusskette für t 2 Œ0; 12: u; v 2 B.a; r/ H) ku % ak 0 r; kv % ak 0 r H) k.1 % t/u C tvk D k.1 % t /.u % a/ C t.v % a/k 0 .1 % t/ ku % ak C t k.v % ak 0 .1 % t/r C t r D r. Analog schließt man für B.a; r/.
"
Funktionen von mehreren vektoriellen Veränderlichen Solche Abbildungen sind auf einem kartesischen Produkt von Vektorräumen definiert. Wir beschreiben zunächst den Fall zweier vektorieller Veränderlicher, also Abbildungen, deren Definitionsmenge im kartesischen Produkt von zwei normierten Vektorräumen .V; k kV / und .W; k kW / liegt. Entsprechend der in 6.4 getroffenen Konvention
10
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
sei das kartesische Produkt V ( W mit der Maximumsmetrik versehen. Tatsächlich ist dieses kartesische Produkt ein Vektorraum unter den Verknüpfungen .v; w/ C .v 0 ; w 0 / ´ .v C v 0 ; w C w 0 /;
˛ ' .v; w/ ´ .˛v; ˛w/;
und es kann wiederum normiert werden durch die Festsetzung: k.v; w/kV W ´ max fkvkV ; kwkW g: Die Normaxiome kann man ohne Mühe verifizieren. Man nennt diese Norm die Maximumsnorm von V (W . Wenn nichts anderes gesagt ist, wird V (W stets mit dieser Maximumsnorm versehen. Klar ist auch, dass die Metrik zu dieser Maximumsnorm nichts anderes ist als die Maximumsmetrik der Metriken der einzelnen Normen: - -.v; w/ % .v 0 ; w 0 /D max f-v % v 0 -V ; -w % w 0 -W g: VW (Die Striche haben hier natürlich nichts mit der Ableitung zu tun, sondern dienen als Marken zur Bezeichnung weiterer Elemente.) Ebenso wie lineare Abbildungen brauchen auch bilineare Abbildungen keineswegs stetig zu sein. Man hat jedoch analog zu F(iii): L. Satz. Sind .V; k kV /; .W; k kW /; .Z; k kZ / normierte Vektorräume und ist die Abbildung B W V ( W ! Z bilinear, so ist B dann und nur dann stetig, wenn es eine Konstante , $ 0 gibt, sodass für alle v 2 V und w 2 W gilt (3)
kB.v; w/kZ 0 , ' kvkV ' kwkW :
Beweis. Aus der Stetigkeit von B folgt (3): Dies folgt der gleichen Spur wie oben bei Satz F: Da B speziell in .0; 0/ stetig ist, gibt es zu " D 1 ein ı > 0 mit kB.v; w/kZ 0 1 für kvkV ; kwkW 0 ı: Mit der Homogenität folgt daraus (3), wobei , ´ 1=ı 2 . Aus (3) folgt die Stetigkeit von B: Schreibt man die Argumente v 0 ; w 0 in der Form v 0 D v C h, w 0 D w C k, so ist für die Stetigkeit in .v; w/ gemäß Bemerkung C zu zeigen (4)
lim
.B.v C h; w C k/ % B.v; w// D 0:
.h;k/!.0;0/
Nun berechnet man aufgrund der Bilinearität (5)
B.v C h; w C k/ % B.v; w/ D B.h; w/ C B.v; k/ C B.h; k/:
11
Abschnitt 10.1 Normierte Vektorräume
Hieraus folgt aufgrund von (3) die Vorausabschätzung kB.v C h; w C k/ % B.v; w/kZ 0 , ' khkV ' kwkW C , ' kvkV ' kkkW C , ' khkV ' kkkW 0 , ' .k.v; w/kV W ' k.h; k/kV W C k.h; k/k2V W /; "
aus der man die Behauptung (4) abliest.
M. Beispiel. Speziell ergibt sich aus den Sätzen F und L die Stetigkeit der grundlegenden Vektorraum-Operationen C W V ( V %! V;
' W R ( V ! V:
Man beachte, dass die erste Abbildung linear (aber i. Allg. nicht bilinear) ist. N. Bemerkung. # Was hier für das kartesische Produkt zweier Vektorräume beschrieben ist, geht auch für kartesische Produkte von endlich vielen Vektorräumen V1 ; : : : ; VN . Dabei sei die Norm von Vj einfach mit k kj bezeichnet. Wiederum ist V1 ( ' ' ' ( VN ein Vektorraum, normiert durch die Maximumsnorm k.u1 ; : : : ; uN /k ´ max fku1 k1 ; : : : ; kuN kN g: Eine multilineare Abbildung M von V1 ( ' ' ' ( VN in einen weiteren Vektorraum Z mit Norm k kZ ist dann und nur dann stetig, wenn es eine Konstante , $ 0 gibt, sodass stets gilt kM.u1 ; : : : ; uN /kZ 0 , ' ku1 k1 ' ' ' kuN kN :
(6)
Der Beweis läuft in der ersten Richtung wie oben bei Satz L. Für die andere Richtung benötigt man eine zu (5) analoge Umformung, die hier etwas komplizierter ist. Aufgrund der Multilinearität ergibt sich für die fragliche Differenz ein Ausdruck der Gestalt M.u1 C h1 ; : : : ; uN C hN / % M.u1 ; : : : ; uN / D M.h1 ; u2 ; : : : ; uN / C ' ' ' C M.u1 ; : : : ; uN &1 ; hN / C M.h1 ; h2 ; u3 ; : : : ; uN / C ' ' ' C M.u1 ; : : : ; uN &2 ; hN &1 ; hN / :: : C M.h1 ; : : : ; hN /: Dabei sind in den Zeilen nach dem Gleichheitszeichen immer mehr der Argumente hj und immer weniger der Argumente uj beteiligt: In der ersten dieser Zeilen sitzt jeweils ein hj an seinem Platz und die restlichen Plätze werden von den jeweiligen uj
12
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
eingenommen. In der zweiten dieser Zeilen sind zwei Plätze mit den entsprechenden hj besetzt, der Rest mit den zugehörigen uj , usw. In der letzten dieser Zeilen gibt es nur noch einen Summanden, nämlich den, wo alle Plätze von den hj eingenommen werden. Wendet man auf alle diese Terme die Voraussetzung (6) an, so ergibt sich nach Abzählung der Summanden kM.u1 C h1 ; : : : ; uN C hN / % M.u1 ; : : : ; uN /k 0 ! N X N 0, k.h1 ; : : : ; hN /kk k.u1 ; : : : ; uN /kN &k : k kD1
Aus dieser Abschätzung folgt in der Tat lim
.M.u1 C h1 ; : : : ; uN C hN / % M.u1 ; : : : ; uN // D 0:
.h1 ;:::;hN /!.0;:::;0/
Halbnormen In manchen Situationen kommt eine Abschwächung des Normbegriffs vor, bei der auf die positive Definitheit verzichtet wird: O. Definition. Eine Halbnorm (oder Seminorm) auf dem Vektorraum V ist eine Abbildung von V in R, u 7! kuk, mit folgenden Eigenschaften: (HN.1) (HN.2)
kuk $ 0 k˛uk D j˛j kuk
(HN.3) ku C vk 0 kuk C kvk
(Semidefinitheit) (positive Homogenität) (Dreiecksungleichung).
Bei einer Halbnorm gilt zwar der Schluss: u D 0 H) kuk D 0, aber nicht die Umkehrung. Es kann also Vektoren u ¤ 0 mit der Norm kuk D 0 geben. Einige elementare Dinge laufen wie bei einer Norm, z.B. die modifizierte Dreiecksungleichung und die Definitionen für Grenzwert und Stetigkeit. Jedoch sind Grenzwerte i. Allg. nicht eindeutig bestimmt! Tatsächlich folgt aus limn!1 un D a und ka % bk D 0 auch limn!1 un D b, wie man unmittelbar mittels (HN.3) erkennt. Eine Halbnorm in V kann stets auf eine Norm zurückgeführt werden, indem man Vektoren a; b 2 V mit ka % bk D 0 identifiziert. Formal läuft das auf die Konstruktion eines Quotientenraumes hinaus. Man betrachte nämlich die Menge ˇ , ˚ N ´ u 2 V ˇ kuk D 0 :
Abschnitt 10.1 Normierte Vektorräume
13
Mittels (HN.2) und (HN.3) sieht man, dass N ein Untervektorraum von V ist. Deswegen kann man den Quotientenraum V =N bilden. Setzt man nun für die Elemente von V =N , das sind die Äquivalenzklassen u C N , ku C N k ´ kuk ; so ist diese Definition repräsentantenunabhängig (denn mit der modifizierten Dreiecksungleichung folgt aus u C N D v C N sofort kuk D kvk), und sie erweist sich als eine Norm im Sinne von Definition A für den Quotientenraum V =N . Die Konvergenz einer Folge uk ! a in V ist dann äquivalent zur Konvergenz der Folge uk C N ! a C N in V =N All diese Dinge sind leichte Konsequenzen aus den Axiomen (HN.1) bis (HN.3). P. Bemerkung. Für einen komplexen Vektorraum Z wird der Normbegriff durch die gleichen Axiome definiert wie in A, nur dass die positive Homogenität (N.2) auch für komplexe Skalare gefordert wird. Es soll also für alle z 2 Z und alle ˛ 2 C gelten k˛zk D j˛j ' kzk : Dabei ist j˛j der Betrag in C. Ein komplexer Vektorraum Z kann immer auch als reeller Vektorraum aufgefasst werden. Denn es sind speziell die skalaren Vielfachen ˛'z mit reellen ˛ und z 2 Z bildbar, und man sieht leicht, dass hiermit die Axiome eines reellen Vektorraums erfüllt sind. Eine Norm auf Z im eben definierten komplexen Sinne ist dann zugleich eine Norm im Sinne von Definition A für die reelle Auffassung von Z. In dieser Weise kann ein komplexer normierter Vektorraum immer auch als reeller normierter Vektorraum betrachtet werden. Entsprechendes gilt für Halbnormen auf komplexen Vektorräumen. Hinweis zur Symbolik: Werden mehrere normierte Vektorräume betrachtet, so wollen wir in Zukunft davon absehen, ihre Normen unterschiedlich zu bezeichnen, jedenfalls solange keine Verwechslungsgefahr besteht. Tatsächlich sollte beim Auftreten des Symbols kuk vorab klar sein , aus welchem Raum u stammt, und dann ist eben die für diesen Raum vereinbarte Norm zu verwenden. Aufgaben und Anmerkungen 1. Zeige: Jede Norm k k auf R ist von der Form kxk D c ' jxj mit festem c > 0. 2. Sei A eine nichtleere offene Menge des normierten Vektorraums V . Man beweise, dass sich jedes Element von V als Linearkombination von höchstens zwei Elementen aus A darstellen lässt.
14
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
3. Zeige für die Bälle eines normierten Vektorraums V : @B.a; r/ D @B.a; r/ D S.a; r/: .B.a; r//ı D B.a; r/; 4. Man beweise, dass jeder offene Ball B.a; r/ eines normierten Vektorraums V homöomorph zu V ist. Lösungshinweis: O.B.d.A. kann man a D 0 wählen. Dann betrachte man die Abbilru dung u 7! 1Ckuk . 5. # Die Einheitssphäre des normierten Vektorraums V sei durch N 2 N offene Bälle B.ak ; rk / mit Radien rk < 1 überdeckt, also S.1/ - B.a1 ; r1 / [ ' ' ' [ B.aN ; rN /. Man beweise, dass der Vektorraum V von den Vektoren a1 ; : : : ; aN aufgespannt wird, also insbesondere endliche Dimension besitzt. 6. # Aus Aufgabe 5 folgere man a) In einem normierten Vektorraum V unendlicher Dimension ist kein abgeschlossener Ball kompakt (Satz von Riesz). b) In einem normierten Vektorraum V unendlicher Dimension ist der Abschluss A einer offenen, nichtleeren Teilmenge A niemals kompakt. 7. Zeige: Zwei Normen k k1 , k k2 auf einem Vektorraum V sind dann und nur dann äquivalent, wenn sie die gleiche Topologie erzeugen (d.h. zu dem gleichen System von offenen Teilmengen führen). Lösungshinweis: Die „nur dann“-Richtung ist in Satz E ausgesprochen. Bei der „dann“Richtung überlege man, dass der Ball vom Radius 1 um 0 bzgl. der Norm k k2 einen Ball vom Radius r > 0 um 0 bzgl. der Norm k k1 enthält. Daraus folgt mit der Homogenität: kuk2 0 .2=r/ kuk1 für alle u 2 V . Vertauschung der Rollen der beiden Normen liefert dann eine entsprechende Ungleichung in der anderen Richtung. 8. Sei V ein normierter Vektorraum und U ein abgeschlossener Untervektorraum von V . Man zeige, dass der Quotientenraum V =U ˚durch folgende Festsetzung zu einem ˇ , normierten Vektorraum wird: kv C U k ´ inf kv C uk ˇ u 2 U . Weiter zeige man, dass die kanonische Projektion V ! V =U , v 7! v C U , stetig ist. 9. Für je drei normierte Vektorräume V , W und Z beweise man, dass die Komposition L.V; W / ( L.W; Z/ ! L.V; Z/, .L; M / 7! M ı L, stetig ist. 10. Zeige: Ist L W V ! W eine lineare und stetige Abbildung zwischen normierten Vektorräumen, so ist die Operator-Norm von L auch darstellbar durch ˇ ˚ , ˇ kLuk 0 + ' kuk für alle u 2 V : kLkV W D min + 2 RC W V 0 11. Sei ' ¤ 0 eine stetige Linearform auf dem normierten Vektorraum V , d.h. ' W V ! R ist linear und stetig. Man beweise für die Distanz vom Kern: dKern ' .u/ D
j'.u/j k'k
15
Abschnitt 10.1 Normierte Vektorräume
für alle u 2 V . Zur Distanzfunktion vgl. Beispiel K(i)[6.2]. 12. Seien wie in Satz L normierte Vektorräume V; W; Z gegeben. Die Gesamtheit der bilinearen Abbildungen von V ( W in Z sei mit L.V; W I Z/ bezeichnet, die Teilmenge der stetigen unter diesen mit L.V; W I Z/. Für B 2 L.V; W I Z/ definiere man ˇ ˚ , (7) kBk ´ sup kB.v; w/k ˇ kvk 0 1; kwk 0 1 2 RC 0 und zeige in Analogie zu H und Aufgabe 10: (i)
kB.v; w/k 0 kBk ' kvk ' kwk für alle v 2 V und w 2 W .
(ii)
L.V; W I Z/ ist ein Untervektorraum von L.V; W I Z/.
(iii) (7) definiert eine Norm auf L.V; W I Z/. (iv)
o n ˇ ˇ kB.v; w/k 0 , ' kvk ' kwk für alle v 2 V; w 2 W . kBk D min , 2 RC W V Z 0
13. Ist V ein normierter Vektorraum, so beweise man, dass die Auswertungsabbildung L.V / ( V ! V , .L; u/ 7! L.u/, stetig ist. 14. Bei den Abbildungen von V ( W in Z haben i. Allg. weder die bilinearen etwas zu tun mit den linearen noch umgekehrt die linearen mit den bilinearen. Man zeige nämlich genauer: Ist eine Abbildung B W V ( W ! Z zugleich linear und bilinear, so ist B D 0. 15. # Man schreibe die (5) entsprechende Umformung auf a) für C.u1 C h1 ; u2 C h2 ; u3 C h3 / % C.u1 ; u2 ; u3 / im Fall einer trilinearen Abbildung C ; b) für Q.u1 C h1 ; u2 C h2 ; u3 C h3 ; u4 C h4 / % Q.u1 ; u2 ; u3 ; u4 / im Fall einer quadrilinearen Abbildung Q. 16. Sei / eine Hyperebene des Vektorraums V , d.h. / ist von der Gestalt / D fx 2 V j '.x/ D cg; wobei ' W V ! R eine nichtverschwindende Linearform und c eine reelle Konstante ist. Die vier mit / verknüpften Halbräume sind die Mengen fx 2 V j '.x/ > cg;
fx 2 V j '.x/ < cg;
fx 2 V j '.x/ $ cg;
fx 2 V j '.x/ 0 cg:
Die ersten beiden heißen offen, die letzten beiden abgeschlossen, obwohl dies keine topologische Bedeutung zu haben braucht. Man zeige: a) Jeder Halbraum ist konvex.
16
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
b) Ist H ein Halbraum in V und L W V ! V eine bijektive lineare Abbildung, so ist auch L.H / ein Halbraum im V (vom gleichen Typ). # c) Sind die offenen Halbräume fx 2 V j '.x/ > cg und fx 2 V j 6.x/ > d g (' ¤ 0, 6 ¤ 0 Linearformen auf V , c; d reelle Konstanten) als Punktmengen gleich, so sind auch die zugehörigen abgeschlossenen Halbräume fx 2 V j '.x/ $ cg und fx 2 V j 6.x/ $ d g als Punktmengen gleich, und hieraus wiederum folgt mit einem , > 0: 6 D ,', d D ,c.
d) Ist V von endlicher Dimension n $ 1, so gibt es zu jeder Basis v1 ; : : : ; vn von V einen offenen Halbraum der Gestalt fx 2 V j '.x/ > 0g, der alle Basisvektoren vj enthält.
10.2 Totale Differenzierbarkeit Wir betrachten zwei normierte Vektorräume .V; k k/ und .W; k k/, deren Normen entsprechend der letzten Vereinbarung gleich bezeichnet seien, sowie eine offene (nichtleere) Teilmenge A - V . Hauptzweck ist das Studium einer Abbildung F W A ! W durch die Methode der Linearisierung. In der elementaren Differentialrechnung hatten wir schon diskutiert, wie die Ableitung dazu dienen kann, die Änderung der Funktionswerte auf lineare Weise zu approximieren. Der Leser vergleiche dazu vor allem die Variante (##) in G(ii)[4.1]. Analog suchen wir hier nach einer linearen Abbildung, die die Änderung unserer Funktion F in der Umgebung einer festen Stelle besonders gut approximiert. Diese wird dann die Ableitung sein. Aus der Ableitung als einer reellen Zahl wird also jetzt die Ableitung in Gestalt einer linearen Abbildung. Die Elemente des Definitionsraums V werden nun meistens durch x oder a bezeichnet, wobei x i. Allg. variabel gedacht ist und a fest. Den Zusatzvektor x % a, der von a nach x führt, nennen wir i. Allg. h ´ x % a, sodass also x D a C h gilt. A. Definition. Sei A eine offene Teilmenge von V . Die Abbildung F W A ! W heißt differenzierbar in a 2 A, wenn eine lineare und stetige Abbildung L W V ! W existiert sowie eine Abbildung R mit der Eigenschaft: (1)
F .a C h/ D F .a/ C L.h/ C R.h/;
wobei
lim
h!0
R.h/ D 0: khk
Das Bestehen der ersten Gleichung in (1) wird zunächst für alle h 2 V mit x ´ a C h 2 A gefordert. (Die Abbildung R bildet also diese h nach W ab.) Es reicht jedoch, dass diese Gleichung für alle a C h in einer Umgebung B.a; %/ von a besteht. Für a C h … B.a; %/ kann man nämlich L beibehalten und R.h/ durch L.h/ ´ F .a C h/ % F .a/ % L.h/ festsetzen, ohne die zweite Gleichung in (1) zu verletzen, da
17
Abschnitt 10.2 Totale Differenzierbarkeit
diese eine Grenzwerteigenschaft für h ! 0 ausdrückt. Man beachte, dass x D a C h genau dann im Ball B.a; %/ um a liegt, wenn h im gleichgroßen Ball B.%/ um den Nullpunkt 0 enthalten ist. In Zukunft werden wir sagen, eine Eigenschaft gelte nahe a bzw. für kleine h, wenn es eine Umgebung von a bzw. von 0 gibt, in der sie richtig ist. Aus der zweiten Gleichung in (1) folgt, dass R.h/ selbst gegen 0 konvergiert (für h ! 0). Schreibt man nämlich R.h/ D khk '
R.h/ khk
für h ¤ 0
und setzt
R.h/ für h ¤ 0 khk sowie r.a/ beliebig in W , so ist die zweite Gleichung in (1) äquivalent mit limh!0 r.h/ D 0, und aus R.h/ D khk ' r.h/ r.h/ ´
folgt limh!0 R.h/ D 0. Bei der Relation (1) handelt es sich um eine Approximation der Funktionswerte F .aC h/ nahe a als Summe aus dem konstanten Term F .a/ und einem linearen Anteil L.h/. Der Approximationsfehler R.h/ wird auch als Restglied bezeichnet. Dieses geht stärker als linear gegen 0, was besagen soll, dass es selbst dann noch gegen 0 konvergiert, wenn es mit khk durchdividiert wird. Man nennt deswegen R.h/ einen Term höherer Ordnung (im Vergleich zu den davor genannten Termen F .a/ und L.h/). Diese Überlegung zeigt: Anstelle von (1) kann äquivalent gefordert werden kann, dass neben dem linearen und stetigen L eine nahe 0 definierte Funktion r existiert mit (2)
F .a C h/ D F .a/ C L.h/ C khk r.h/;
wobei
lim r.h/ D 0:
h!0
Wie gesagt, auf den Funktionswert r.0/ kommt es hierbei nicht an. Man kann ihn z.B. als 0 wählen (in diesem Fall wird r stetig in 0). Bei der so definierten Differenzierbarkeit geht es strenggenommen nicht um eine lineare Approximation der Funktionswerte, sondern um eine lineare Approximation der Änderung von Funktionswerten gegenüber der Änderung der Argumente. Dies wird besonders deutlich, wenn man die Gleichung in (1) etwas umstellt: F .a C h/ % F .a/ D L.h/ C R.h/: A. Zusatz. Ist F in a differenzierbar, so ist F in a auch stetig und der lineare Anteil L in (1) oder (2) ist eindeutig bestimmt. Man nennt L die Ableitung von F in a, geschrieben als F 0 .a/ oder .DF /.a/: F 0 .a/ ´ .DF /.a/ ´ L 2 L.V; W /:
18
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Genauer sagt man auch, F sei in a total differenzierbar oder Fréchet-differenzierbar mit der totalen oder Fréchet-Ableitung L. Beweis. Die Stetigkeit von F in a liest man aus (2) ab. Dies impliziert ja lim F .aCh/ D F .a/. h!0
Zur Eindeutigkeit von L sei neben (2) mit analogem e L und e r: F .a C h/ D F .a/ C e L.h/ C khk e r.h/;
wobei
lim e r.h/ D 0:
h!0
Dann folgt durch Subtraktion der Reihe nach 0 D 0 C L.h/ % e L.h/ C khk ' .r.h/ % e r.h// .L % e L/h D khk ' .e r.h/ % r.h//: Zu gegebenem " > 0 gibt es ein ı > 0 mit ke r.h/ % r.h/k < " und a C h 2 A für 0 < khk < ı. Damit wird k.L % e L/hk 0 khk ' " für khk < ı, also wegen der Homogenität für alle h. Mit H[10.1] folgt kL % e Lk 0 " für jedes " > 0, also kL % e Lk D 0, somit L D e L. " B. Bemerkung. Beim Wechsel zu äquivalenten Normen in V und W ändert sich die Differenzierbarkeit und die Ableitung L nicht, da kR.h/k entsprechend nach unten und khk oben abgeschätzt werden kann. C. Beispiele. (i) Ist F .x/ D c D const., so ist F 0 .a/ D 0. Denn (1) ist erfüllt mit L ´ 0; R ´ 0. (ii) Ist F W V ! W eine stetige affine Abbildung, d.h. F .x/ D c C M x mit konstantem c 2 W und M 2 L.V; W /, so ist F 0 .a/ D M . Denn man hat F .a C h/ D c C M.a C h/ D c C M a C M h D F .a/ C M h; also ist (1) erfüllt mit L ´ M und R ´ 0. Speziell gilt L 0 .a/ D L für jede lineare Abbildung L 2 L.V; W / und beliebiges a 2V. D. Satz. Seien F; G W A ! W in a 2 A differenzierbar und ˛ 2 R. Dann sind auch F C G und ˛ ' F in a differenzierbar, und es gilt: .F C G/0 .a/ D F 0 .a/ C G 0 .a/;
.˛ ' F /0 .a/ D ˛ ' F 0 .a/:
19
Abschnitt 10.2 Totale Differenzierbarkeit
Beweis. Bei F C G hat man lediglich die beiden Gleichungen (1) für F und G zu addieren. Analog wird ˛ ' F behandelt, indem man (1) mit ˛ durchmultipliziert. " E. Satz (Kettenregel). Gegeben seien normierte Vektorräume V; W; Z, offene Mengen A - V , B - W sowie Abbildungen F W A %! W;
G W B %! Z
mit
F .A/ - B:
Ist F in a 2 A differenzierbar und G in b ´ F .a/ differenzierbar, so ist G ı F in a differenzierbar und .G ı F /0 .a/ D G 0 .F .a// ı F 0 .a/: Beweis. Nach Voraussetzung gilt: F .a C h/ D F .a/ C Lh C khk r.h/;
L ´ F 0 .a/;
G.b C k/ D G.b/ C M k C kkk s.k/;
M ´ G 0 .b/;
lim r.h/ D 0
h!0
lim s.k/ D 0:
k!0
Durch Einsetzen kommen wir an die Komposition heran: .G ı F /.a C h/ D G.F .a C h// 3 . D G F .a/ C Lh C khkr.h/ „ƒ‚… „ ƒ‚ … b µk D G.b/ C M.k/ C kkk s.k/ - 3 . 3 . D G.b/ C M Lh C khkr.h/ C -Lh C khk r.h/-s Lh C khk r.h/ - 3 . D G.b/ C MLh C khk M.r.h// C -Lh C khk r.h/-s Lh C khk r.h/ : „ ƒ‚ … µ T .h/ Der letzte Ausdruck hat schon die Gestalt, die für die Behauptung anzustreben ist. Es muss nur noch gezeigt werden, das T .h/ stärker als linear gegen 0 strebt. Dazu schätzt man ab: 3 . - 3 .kT .h/k 0 khk ' kM k ' kr.h/k C kLk ' khk C khk ' kr.h/k ' -s Lh C khk r.h/ - : In der erreichten Schranke kann man khk ausklammern, und was verbleibt geht für h ! 0 termweise gegen null: kr.h/k ! 0, kLkCkr.h/k ! kLk, LhCkhk r.h/ ! 0 und schließlich s .Lh C khk r.h// ! 0. " Bezüglich der Inversenbildung besteht zunächst folgendes Analogon zu Satz D[4.2]:
20
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
F. Satz (Differenzierbarkeit der Umkehrabbildung). Es seien A - V und B - W offene Teilmengen und F W A ! B eine Abbildung mit folgenden Voraussetzungen: (i)
F ist bijektiv;
(ii)
F ist in a 2 A differenzierbar und die Ableitung F 0 .a/ W V ! W ist bijektiv mit stetiger Umkehrung F 0 .a/&1 W W ! V ;
(iii) die Inverse F &1 W B ! A ist in b ´ F .a/ stetig. Dann ist F &1 in b differenzierbar und .F &1 /0 .b/ D .F 0 .a//&1 : Beweis. Falls man schon weiß, dass die Inverse F &1 in b differenzierbar ist, so ist die Berechnung ihrer Ableitung sehr einfach. Man wendet einfach auf die Gleichungen F &1 ı F D idA und F ı F &1 D idB die Kettenregel und Beispiel C(ii) an und erhält .F &1 /0 .b/ ı F 0 .a/ D idV und F 0 .a/ ı .F &1 /0 .b/ D idW , woraus .F &1 /0 .b/ D .F 0 .a//&1 folgt. Wir beweisen nun die Behauptung allein unter den genannten Voraussetzungen. Dabei sei zur Abkürzung L ´ F 0 .a/ und G ´ F &1 gesetzt. O.b.d.A. können wir a D 0 und b D 0 annehmen. Denn anstelle von F bzw. G kann man die Abbildungen ˆ.x/ ´ F .a C x/ % b bzw. ‰.y/ ´ G.b C y/ % a betrachten. Die Argumentation startet ähnlich wie in D[4.2] durch (teilweise) Auflösung der Approximationsgleichung F .x/ D Lx C kxk ' r.x/;
lim r.x/ D 0
x!0
nach dem Urbild: Für beliebiges y 2 B setzen wir y D F .x/ mit x 2 A, also x D G.y/, und schließen der Reihe nach so: y D L.G.y// C kG.y/k ' r.G.y// L&1 y D G.y/ C kG.y/k ' L&1 .r.G.y/// (3)
G.y/ D L&1 y % kG.y/k ' L&1 .r.G.y///:
Dabei erfolgt der Übergang von der ersten Zeile zur zweiten durch Anwenden von L&1 und von der zweiten zur dritten durch Umstellen. Das letzte Produkt in (3) wird sich als geeignetes Restglied für die Differenzierbarkeit von G in 0 herausstellen. Dazu schätzen wir aus (3) die Größe kG.y/k ab: kG.y/k 0 -L&1 y - C kG.y/k ' -L&1 .r.G.y///- :
21
Abschnitt 10.2 Totale Differenzierbarkeit
Da L&1 stetig ist, gilt mit eine Konstanten c > 0: -L&1 .w/- 0 c kwk für alle w 2 W . Damit folgt weiter kG.y/k 0 c kyk C kG.y/k ' c ' kr.G.y/k ; also
c ' kyk ; 1 % c kr.G.y//k falls y nahe genug bei 0 liegt, nämlich so, dass der Nenner rechts positiv wird. Das geht; denn aus y ! 0 folgt r.G.y// ! 0 wegen der Stetigkeit von G in 0 und wegen r.x/ ! 0 für x ! 0. Bringt man diese Abschätzung von kG.y/k in das letzte Produkt der Gleichung (3) ein, so erkennt man, dass G in 0 differenzierbar ist mit der Ableitung L&1 . " kG.y/k 0
Die Stetigkeit der Inversen F &1 in b folgt nicht aus den übrigen Voraussetzungen, wie schon bei der elementaren Variante D[4.2] geschildert. Unter stärkeren Regularitätsannahmen werden später hinreichende Bedingungen für die (lokale) Bijektivität von F und die (lokale) Existenz einer stetigen Inversen F &1 gewonnen. Vgl. die Sätze C[12.1] und D[12.1] für den Fall endlicher Dimension sowie Analysis 3 bei unendlicher Dimension. Die Produktregel lässt sich in einer sehr universellen Form aussprechen, indem man stetige bilineare Abbildungen heranzieht, wie sie in Satz L[10.1] diskutiert wurden. Wie dort seien V; W; Z normierte Vektorräume und (4)
B WV (W !Z
eine bilineare und stetige Abbildung. Solch eine Abbildung kann als ein stetiges vektorielles Produkt bezeichnet werden. G. Satz (allgemeine Produktregel). Sei B (4) ein stetiges vektorielles Produkt. Außerdem seien F W A ! V und G W A ! W zwei Abbildungen, definiert auf einer offenen Teilmenge A eines weiteren normierten Vektorraums U . Sind F; G in a 2 A differenzierbar, so ist auch die Abbildung P W A ! Z mit P .x/ ´ B.F .x/; G.x// in a differenzierbar, und es gilt für alle h 2 U P 0 .a/h D B.F 0 .a/h; G.a// C B.F .a/; G 0 .a/h/: Beweis. Man muss den Ausdruck P .a C h/ in der obigen Weise zerlegen, wobei natürlich die entsprechenden Zerlegungen für F und G bekannt sind: F .a C h/ D b C Lh C R.h/;
b ´ F .a/;
L ´ F 0 .a/;
G.a C h/ D c C M h C S.h/;
c ´ G.a/;
M ´ G 0 .a/;
lim
R.h/ D0 khk
lim
S.h/ D 0: khk
h!0
h!0
22
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Damit wird zunächst P .a C h/ D B.F .a C h/; G.a C h// D B.b C Lh C R.h/; c C M h C S.h//: Entwickelt man den letzten Ausdruck mit den Bilinearitätsregeln und sortiert die Glieder gleich nach dem Auftreten von h, so ergibt sich P .a C h/ D CP C LP .h/ C RP .h/ mit CP ´ B.b; c/ D P .a/ LP .h/ ´ B.Lh; c/ C B.b; M h/ RP .h/ ´ B.R.h/; c/ C B.b; S.h// C B.Lh C R.h/; M h C S.h//: Diese Zerlegung von P .a C h/ ist nun tatsächlich von der gewünschten Bauart. Denn CP ist unabhängig von h, und LP .h/ ist offensichtlich linear in h und auch stetig, wie man durch Anwendung von (3)[10.1] sieht: kLP .h/k 0 , ' kLk ' khk ' kck C , ' kbk ' kM k ' khk : Schließlich gilt analog kRP .h/k 0 , ' kbk ' kS.h/k C , ' kR.h/k ' kck C , ' .kLk ' khk C kR.h/k/ ' .kM k ' khk C kS.h/k/; also
kRP .h/k D 0: h!0 khk lim
An dem Ausdruck für LP .h/ liest man die Behauptung ab.
"
H. Beispiel. Sind f W A ! R und G W A ! W in a 2 A differenzierbar, so erhält man als Spezialfall der Produktregel .f ' G/0 .a/ D f 0 .a/G.a/ C f .a/G 0 .a/I denn die Abbildung R ( V ! W , .˛; u/ 7! ˛u ist bilinear und stetig. I. Definition. Ist die Abbildung F W A ! W in jedem a 2 A differenzierbar, so heißt F differenzierbar. Dann ist die Ableitung definiert als Abbildung: F 0 W A %! L.V; W /;
x 7%! F 0 .x/:
Ist diese Abbildung stetig, so heißt F stetig differenzierbar oder von der Klasse C 1 . Statt F 0 kann wieder DF geschrieben werden.
23
Abschnitt 10.2 Totale Differenzierbarkeit
J. Beispiel. Ist F D L 2 L.V; W / selbst linear und stetig, so folgt nach Beispiel C(ii): F 0 .x/ D L für alle x 2 V . Eine lineare und stetige Abbildung besitzt also eine konstante Ableitung. Die Umkehrung wird im nächsten Abschnitt diskutiert. K. Bemerkung. Im Gegensatz zum Eindimensionalen (A[4.1]) wird hier die Ableitung nur bei offener Definitionsmenge A erklärt. Der Grund ist, dass man bei beliebigem A Probleme mit der Eindeutigkeit bekommt, wenn ein a 2 A zwar Häufungspunkt ist, aber z.B. nur auf niederdimensionalen Teilmengen von A erreichbar ist (ein konkretes Beispiel folgt sogleich). Auf R kann so etwas nicht passieren, da R bereits von zwei Punkten aufgespannt wird, also erst recht von jeder Umgebung eines Häufungspunkts (geschnitten mit A). L. Beispiel. Sei V ´ R2 , W ´ R, A ´ R ( f0g, F .t; 0/ ´ t für .t; 0/ 2 A sowie a ´ .0; 0/. Ist % irgendeine reelle Zahl und die lineare Abbildung L% W R2 ! R definiert durch L% ..; 3/ ´ . C %3, so gilt mit R ´ 0: F ..; 0/ D F .0; 0/ C L% ..; 0/ C R..; 0/ für alle ..; 0/ 2 A; also wäre – bei analoger Beibehaltung der Definition A – jedes solche L% Ableitung von F in a, die Ableitung also nicht eindeutig bestimmt. Aufgaben und Anmerkungen 1. Äquivalente Formulierungen der Differenzierbarkeit von F W A ! W in a 2 A sind folgende: a) Es gibt eine lineare und stetige Abbildung L W V ! W und eine Abbildung R W A ! W mit: F .x/ D F .a/ C L.x % a/ C R.x/;
wobei
lim
x!a
R.x/ D 0: kx % ak
b) Es gibt eine lineare und stetige Abbildung L W V ! W und eine Abbildung r W A ! W mit: F .x/ D F .a/ C L.x % a/ C kx % ak r.x/;
wobei
lim r.x/ D 0:
x!a
c) Mit der Landau-Symbolik (6[3.5]) lautet die Forderung von Definition A F .a C h/ D F .a/ C L.h/ C o.khk/; .h ! 0/ und die von a) F .x/ D F .a/ C L.x % a/ C o.kx % ak/; .x ! a/:
24
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
2. Die reelle Funktion f W A ! R habe in a 2 A eine relative Extremalstelle. Zeige: f 0 .a/ D 0. 3. Die reelle Funktion f W A ! R sei auf dem Abschluss A stetig und auf A selbst differenzierbar. Ist A kompakt und f auf dem Rand @A D A n A gleich null, so existiert ein a 2 A mit f 0 .a/ D 0. Das ist eine höherdimensionale Verallgemeinerung des Satzes von Rolle B[4.3]. Allerdings ist dieser schöne Satz nur bei endlicher Dimension von V wirksam. Denn in einem normierten Raum unendlicher Dimension kann der Abschluss einer offenen nichtleeren Menge niemals kompakt sein. Vgl. Aufgabe 6[10.1].
10.3
Funktionen einer Veränderlichen
Wir behandeln hier den Sonderfall, dass der Definitionsraum eindimensional ist, nämlich R selbst (mit dem Betrag als Norm). Der Zielraum W sei ein beliebiger normierter Vektorraum W mit der Norm k k. Gegenüber der allgemeinen Situation gibt es zwei markante Unterschiede: Zum einen kann man hier Ableitungen als Vektoren auffassen, zum anderen braucht die Definitionsmenge nicht offen zu sein. Sie darf von der gleichen Allgemeinheit sein wie in der elementaren Differentialrechnung des Abschnitts 4.1, z.B. ein Intervall von beliebigem Typ (halboffen, abgeschlossen usw.). A. Lemma. Die linearen Abbildungen L von R in W sind genau die der Form t 7! t 'c mit festem c 2 W . Dabei gilt c ´ L.1/. Es ist L.R; W / D L.R; W /, und für jedes L hieraus gilt kLk D kL.1/k. Beweis. Wir arbeiten mit der Standard-Basis von R, das ist die 1. Für eine lineare Abbildung L W R ! W schreiben wir L.t/ D L.t '1/ D t 'L.1/ D t 'c und erhalten so die gewünschte Gestalt mit c ´ L.1/. Umgekehrt ist jede Abbildung der Gestalt L.t / ´ t ' c linear und auch stetig; denn es gilt kL.t/k D kt ' ck D kck ' jtj. Durch Supremumsbildung für die t mit jt j 0 1 folgt hieraus kLk D kck. " Man kann auch sagen: Die Korrespondenz zwischen L und c durch c D L.1/ ist bijektiv, linear und normtreu, kurz: L.R; W / Š W
normtreu isomorph.
Wir betrachten nun die Situation (1)
F W A %! W;
A - R;
a 2 A Häufungspunkt von A:
25
Abschnitt 10.3 Funktionen einer Veränderlichen
Die Differenzierbarkeit von F in a im totalen Sinne ist analog zu A[10.2] so zu fassen: F .a C h/ D F .a/ C L.h/ C R.h/;
wobei
lim
h!0
R.h/ D 0: jhj
Mit der obigen speziellen Gestalt von L bedeutet dies F .a C h/ D F .a/ C hc C R.h/;
wobei
lim
h!0
R.h/ D 0: jhj
Es soll also ein c 2 W und eine Abbildung R W A ! W geben, sodass dies für aCh 2 A erfüllt ist. Dabei reicht es wieder, die h 2 R auf kleine Werte zu beschränken. Außerdem kann im Limes rechts statt jhj genauso gut h geschrieben werden. Stellt man die Gleichung hierin nach R.t/ um, so ergibt sich äquivalent: lim
h!0
F .a C h/ % F .a/ D c: h
Man kommt also auf die Definition der Differenzierbarkeit mittels Differenzenquotient zurück! Auf diesen Zusammenhang war bereits in G(ii)[4.1] hingewiesen worden. B. Folgerung. Die Funktion (1) ist genau dann in a total differenzierbar, wenn der Grenzwert des Differenzenquotienten existiert. In diesem Fall fasst man die Ableitung nicht als lineare Abbildung, sondern als das zugehörige Element von W auf, setzt also F 0 .a/ ´ lim
h!0
F .a C h/ % F .a/ 2 W: h
"
Die Regeln für diesen modifizierten Ableitungsbegriff sind inhaltlich die gleichen, z.B. folgt wie früher aus der Differenzierbarkeit die Stetigkeit in a. Gelegentlich ändert sich aber die äußere Gestalt (entsprechend der Korrespondenz in Lemma A), z.B. bei der Kettenregel so: C. Satz (Varianten der Kettenregel). (i)
Gegeben seien normierte Vektorräume W; Z und Abbildungen
F W A %! W;
G W B %! Z;
mit:
A - R, B offen in W , F .A/ - B:
Ist F im Häufungspunkt a 2 A differenzierbar und G in b ´ F .a/ differenzierbar, so ist auch G ı F in a differenzierbar und .G ı F /0 .a/ D G 0 .F .a//F 0 .a/ 2 W: (ii) Gegeben seien normierte Vektorräume V; Z und Abbildungen F W A %! R;
G W B %! Z;
mit:
A offen in W , B - R, F .A/ - B:
26
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Ist F in a 2 A differenzierbar und G im Häufungspunkt b ´ F .a/ von B differenzierbar, so ist auch G ı F in a differenzierbar, und es gilt für alle h 2 V .G ı F /0 .a/h D G 0 .F .a// ' F 0 .a/h 2 Z: Beweis. Die generelle Fassung E[10.2] gilt auch hier in beiden Fällen, wie man am dortigen Beweis sieht: .G ı F /0 .a/ D G 0 .F .a// ı F 0 .a/: Im Fall (i) kann man diese Gleichung speziell auf 1 2 R anwenden und erhält nach Lemma A die Behauptung. Bei (ii) kann man diese Gleichung auf h 2 V anwenden, was .G ı F /0 .a/h D G 0 .F .a//.F 0 .a/h/ ergibt, und dann beachten, dass die Anwendung der Abbildung G 0 .F .a// auf die Zahl F 0 .a/h dasselbe bewirkt wie die Multiplikation des Vektors G 0 .F .a// mit dieser Zahl. " Ein entscheidender Schritt ist: D. Satz (Konstanzkriterium). Sei J ein Intervall und F W J ! W differenzierbar mit F 0 .t/ D 0 für alle t 2 J . Dann ist F konstant. Beweis. Sei zunächst J D Œa; b2 kompakt mit a < b. O.B.d.A. können wir a D 0 und F .a/ D 0 annehmen (denn sonst kann man F .a C t/ % F .a/ betrachten). Es ist dann J D Œ0; b2. Der Nachweis gelingt nicht wie im elementaren Fall D[4.3], da beim vorliegenden Abbildungstyp der Mittelwertsatz nicht in der gewohnten Weise zur Verfügung steht. Wir verwenden hier eine interessante andere Beweismethode, die so genannte Induktion im Kontinuum. Dabei versucht man, eine Behauptung vom linken Ende eines Intervalls an immer weiter nach rechts hin voran zu schieben, bis man (hoffentlich) das ganze Intervall abdecken kann. Wir geben uns ein festes " > 0 vor und betrachten die Menge ˇ , ˚ /" ´ c 2 Œ0; b2 ˇ kF .t/k 0 " ' t für alle t 2 Œ0; c2 : Es werden also alle bei 0 startenden Teilintervalle betrachtet, auf denen ein „sublineares Wachstum“ mit dem Koeffizienten " herrscht, und die Gesamtheit der zugehörigen rechten Intervallenden gebildet. Die Hoffnung ist natürlich, dass diese bis zum gegebenen Ende b hin reichen. Diese Erwartung erfüllt sich. Wir zeigen nämlich: Zwischenbehauptung: c # ´ sup /" D b. Ist dies bewiesen, so gilt für t 2 Œ0; bŒ: kF .t/k 0 " ' t , also (für " # 0): kF .t/k D 0, somit (wegen der Stetigkeit von F ): F .t/ D 0 für t 2 Œ0; b2. Das ist aber die Behauptung.
Abschnitt 10.3 Funktionen einer Veränderlichen
27
Zwischenbeweis: Zunächst ist 0 2 /" , also /" ¤ ¿ („Induktionsanfang“). Weiter ist /" abgeschlossen. Sei nämlich .cn / eine Folge in /" und c ´ limn!1 cn . Um c 2 /" nachzuweisen, geben wir ein t 2 Œ0; cŒ vor. Dann existiert ein cn mit t < cn (Meidungsprinzip). Wegen cn 2 /" gilt kF .t/k 0 "t für t 2 Œ0; cŒ, also wegen der Stetigkeit von F auch auf für t 2 Œ0; c2. Hiernach ist c 2 /" . Da /" abgeschlossen ist, gilt c # 2 /" . Angenommen nun, es wäre c # < b („Induktionsschritt“). Da F 0 .c # / existiert, gibt es ein positives ı < b % c # mit: - F .c # C h/ % F .c # / 0 # für 0 < h < ı: % F .c / - 0 mit B.x0 ; ı/ - A und betrachten für festes h 2 V mit khk < ı die Abbildung G W Œ0; 12 %! W;
G.t/ ´ F .x0 C th/:
Man bewegt sich also geradlinig weg von x0 . Nach C(i) berechnet man G 0 .t/ D F 0 .x0 C th/h D 0, also ist nach Satz D: G.1/ D G.0/, somit F .x0 C h/ D F .x0 / D F .a/, also B.x0 ; ı/ - N .
x0+h x0+th x0 B(x0,δ)
δ
2) A n N ist offen: Sei b 2 A n N Teil 1), angewandt auf ˇ .b/ ¤ F .a/. Nach ˚ , also F , b anstelle a ist die Niveaumenge x 2 A ˇ F .x/ D F .b/ offen. Somit existiert eine Umgebung U von b, in der F .x/ D F .b/ gilt. In U ist also F .x/ ¤ F .a/, somit U - A n N. $ Da A D N [ .A n N / und N ¤ ¿ folgt, weil A zusammenhängend ist: A n N D ¿, also N D A.
Zu (ii): Aus F 0 .x/ D G 0 .x/ folgt .F % G/0 .x/ D 0, also ist F % G nach (i) konstant. Zusammen mit F .a/ % G.a/ D 0 folgt, dass die Konstante null ist, also F D G. "
Abschnitt 10.3 Funktionen einer Veränderlichen
29
H. Folgerung (Charakterisierung stetiger affiner Abbildungen). Für eine differenzierbare Abbildung F W A ! W , A ein Gebiet in V , sind äquivalent: (i)
F 0 D L D const.
(ii) Es gibt ein c 2 W , so dass F .x/ D c C Lx für alle x 2 A, d.h. F ist Restriktion einer affinen Abbildung auf A mit dem linearen Anteil L. Beweis. Die Richtung (ii) H) (i) ist in C(ii)[10.2] ausgesprochen. Die Richtung (i) H) (ii) beweist man so: Aus F 0 D L folgt .F % L/0 D 0, also nach Satz G: F % L D c D const. 2 W , d.h. F D c C L (alles auf A). " Die Produktregel nimmt für Funktionen einer Veränderlichen folgende Gestalt an: I. Satz (Produktregel). Seien V; W; Z normierte Vektorräume, B W V ( W ! Z bilinear und stetig, A - R sowie F W A ! V und G W A ! W zwei Abbildungen. Sind F; G im Häufungspunkt a 2 A differenzierbar, so ist auch H W A ! Z mit H.t/ ´ B.F .t/; G.t// in a differenzierbar und H 0 .a/ D B.F 0 .a/; G.a// C B.F .a/; G 0 .a//: Beweis. Die Rechnung verläuft analog wie bei der allgemeinen Fassung G[10.2], indem man die Funktionsdifferenz H.a C h/ % H.a/ mittels der Bilinearität von B in einen in h linearen Anteil und einen Restterm aufspaltet, der nach Division durch h immer noch gegen 0 konvergiert (für h ! 0). " J. Beispiel. Ein konkreter Fall hierzu ist: Zu f W A ! R und G W A ! W sei die Abbildung H ´ f G W A ! W definiert durch H.t/ ´ f .t/ ' G.t/. Hier ist B W R ( W ! W die Bildung des skalaren Vielfachen: B.˛; w/ ´ ˛w, was bilinear und stetig ist (da k˛wk D j˛j kwk). Sind f; G in a 2 A differenzierbar, so auch f G und .f G/0 .a/ D f 0 .a/ ' G.a/ C f .a/ ' G 0 .a/: Dies wird insbesondere angewandt, wenn f oder G konstant ist. In diesen Fällen schmilzt die rechte Seite auf einen Summanden zusammen.
Höhere Ableitungen Mehrfache Differenzierbarkeit ist bei den vektoriellen Funktionen einer Veränderlichen genauso erklärbar wie früher in der eindimensionalen Theorie (A[8.3]):
30
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
K. Definition. Für eine Abbildung des Typs (1) sind höhere Ableitungen induktiv definierbar: F 00 .a/ ´ .F 0 /0 .a/ F 000 .a/ ´ .F 00 /0 .a/ :: : falls die jeweils niedrigere Ableitung in einer Umgebung von a (geschnitten mit A) existiert und in a differenzierbar ist. Natürlich ist F .0/ .a/ wieder als F .a/ definiert. L. Beispiel. Es gilt folgende Charakterisierung vektorwertiger Polynome: Für eine N -mal differenzierbare Funktion F W J ! W (J Intervall, N 2 N0 ) sind äquivalent: (i)
F .N C1/ D 0.
(ii) Es gibt c0 ; : : : ; cN 2 W , so dass F .t/ D cN t N C cN &1 t N &1 C ' ' ' C c1 t C c0
für alle t 2 J :
Zu (ii) H) (i): Dies folgt durch Rechnung mit der Ableitungsregel aus Beispiel J. Zu (i) H) (ii): Im Gegensatz zu dem eindimensionalen Beweis in H[8.3] argumentieren wir hier ohne Taylor-Formel einfach per vollständiger Induktion nach N : Induktionsanfang für N D 0: Aus F 0 D 0 folgt F D const. µ c0 nach Satz D. Induktionsschluss von N % 1 auf N für N $ 1: Vorausgesetzt ist also F .N C1/ D 0. Dies bedeutet .F 0 /.N / D 0. Also ist F 0 nach Induktionsvoraussetzung von der Form F 0 .t/ D dN &1 t N &1 C dN &2 t N &2 C ' ' ' C d0 Die Funktion
/ G.t/ ´ F .t / %
mit dN &1 ; dN &2 ; : : : ; d0 2 W:
dN &1 N dN &2 N &1 t C t C ' ' ' C d0 t N N %1
1
hat dann die Ableitung G 0 .t/ D F 0 .t/ % .dN &1 t N &1 C dN &2 t N &2 C ' ' ' C d0 / D 0; ist also konstant, etwa D c0 . So folgt F .t/ D
dN &1 N dN &2 N &1 t C t C ' ' ' C d0 t C c 0 : N N %1
Abschnitt 10.3 Funktionen einer Veränderlichen
31
Schreibweisen: Die höheren Ableitungen werden auch folgendermaßen bezeichnet: ˇ k ˇ k d F dk d kF d F ˇ .k/ .a/ µ µ F ; F µ F .k/ .a/ µ ˇ dt k dt k ˇ dt k dt k a
und (mit einer gewissen Vorsicht): .F .t//.k/ ´ F .k/ .t/. # Nochmals Induktion im Kontinuum Diese Technik kann mit Erfolg in ähnlich gelagerten Fällen angewendet werden. Hier folgt eine Situation, bei der die Durchführung eher einfacher ist als oben. Im Prinzip geht es immer darum, von lokalen Eigenschaften in R auf globale Eigenschaften zu schließen. Sei f W J ! R eine Funktion, definiert auf einem Intervall J - R. M. Definition. Man nennt f lokal injektiv, wenn zu jedem t 2 J eine Umgebung U.t/ ´ U.t; ı t / existiert, sodass f auf J \ U.t/ injektiv ist. Analog werden die Begriffe lokal monoton bzw. lokal streng monoton gefasst. Allgemein kann man definieren, dass eine Eigenschaft für f lokal erfüllt ist, wenn zu jedem t 2 J eine Umgebung U.t/ existiert, sodass die Restriktion von f auf J \ U.t/ diese Eigenschaft besitzt. N. Satz. Ist f lokal streng monoton, so ist f streng monoton. Stetigkeit ist hierbei nicht erforderlich. Auch ist nicht vorausgesetzt, dass die Restriktionen von f auf die genannten Umgebungen gleichen Monotoniesinn haben. Zu beweisen ist gerade, dass dies doch einheitlich erfolgt. Beweis von N. Sei zunächst J D Œa; b2 kompakt mit a < b. Es werde der Fall betrachtet, dass f bei a zunächst streng monoton wachsend ist, d.h. bei Einschränkung auf Œa; b2 \ U.a/. (Der Fall, dass f zunächst streng monoton fallend ist, kann analog behandelt werden.) Wir betrachten die Menge ˇ , ˚ / ´ c 2 Œa; b2 ˇ f auf Œa; c2 streng monoton wachsend : Es werden also alle bei a startenden Teilintervalle betrachtet, auf denen f streng monoton wächst, und es wird die Gesamtheit der zugehörigen rechten Intervallenden gebildet. Die Hoffnung ist natürlich, dass diese bis zum gegebenen Ende b hin reichen. Dazu bilden wir das Supremum c # ´ sup / und werden zeigen: c # D b.
32
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Dann wird folgen, dass f auf Œa; bŒ streng monoton wächst. Da f auf Œa; b2 \ U.b/ streng monoton ist, wächst f also insgesamt streng monoton (da auf Œa; bŒ \ U.b/ nur genau ein Monotoniesinn herrschen kann). Zunächst ist Œa; b2\U.a/ c # < b, * * in / enthalten, insbesondere / ¤ ¿. Wäre nun a < # # so wäre f auf a; c streng monoton wachsend und auf Œa; b2 \ U.c / entwe-
der streng monoton * * wachsend oder aber streng monoton fallend. Da auf der „linken Hälfte“ a; c # \ U.c # / aber streng monotones Wachsen* vorliegt, * wäre f auf Œa; b2 \ U.c # / streng monoton wachsend und damit auf ganz a; c # [ U.c # /. Dies widerspricht der Wahl von c # als Supremum. Somit ist c # D b. Ein beliebiges Intervall J (mit mehr als einem Punkt) kann wieder durch eine Folge solcher kompakter Intervalle ausgeschöpft werden. Auf jedem ist f streng monoton, und der Monotoniesinn vom ersten Intervall vererbt sich sukzessive auf die nachfolgenden, also schließlich auf ganz J . " Im Fall der Stetigkeit ist die strenge Monotonie auf einem Intervall äquivalent mit der Injektivität (A[3.6]). So ergibt sich die nachstehende
O. Folgerung. Ist f W J ! R stetig und lokal injektiv, so ist f injektiv.
"
Im Höherdimensionalen ist dieser Schluss nicht erlaubt. Man sehe hierzu die Diskussion in Abschnitt 12.1, insbesondere in den Bemerkungen F[12.1] Aufgaben und Anmerkungen 1. Man beweise folgende Varianten der Konstanzkriterien: a) Für die differenzierbare Funktion F W J ! W , definiert auf dem Intervall J , gelte stets: F .t/ ¤ 0 H) F 0 .t/ D 0: Dann ist F konstant. b) Seien V; W normierte Vektorräume und A ein Gebiet in V . Für die differenzierbare Abbildung F W A ! W gelte stets: F .x/ ¤ 0 H) F 0 .x/ D 0: Dann ist F konstant. 2. Sei J ein Intervall und k 2 R gegeben. Man zeige in Analogie zu I(iii)[4.3]: Eine differenzierbare Funktion F W J ! W erfüllt dann und nur dann die Differentialgleichung F 0 D kF , wenn sie von der Form ist: F .t/ D e kt C mit konstantem C 2 W .
33
Abschnitt 10.3 Funktionen einer Veränderlichen
3. Die differenzierbare Abbildung F W V ! W zwischen normierten Vektorräumen V; W sei positiv homogen vom Grad ˛ 2 R, d.h. es gelte für alle x 2 V und alle t > 0: F .tx/ D t ˛ F .x/: Man beweise die Eulersche Relation F 0 .x/x D ˛F .x/; gültig für alle x 2 V . 4. Die Beweismethode des Konstanzkriteriums D kann noch weiter ausgebaut werden. Z.B. gilt Folgendes: Die Funktionen F W Œa; b2 ! W und ' W Œa; b2 ! R seien stetig und in 2a; bŒ differenzierbar und dort kF 0 .t/k 0 ' 0 .t/. Dann folgt kF .b/ % F .a/k 0 '.b/ % '.a/: Dieser „Satz vom endlichen Zuwachs“ wird im Haupttext nicht verwendet. Stattdessen reicht eine einfachere Fassung, die auf dem Hauptsatz der Differential- und Integralrechnung beruht; vgl. im Folgenden G[11.1]. Lösungshinweis: Wie oben bei Satz D kann man F und ' auf ganz Œa; b2 als differenzierbar annehmen und dort kF 0 .t/k 0 ' 0 .t/ voraussetzen. Denn sonst kann man Teilintervalle Œ˛; ˇ2 mit a < ˛ < ˇ < b betrachten und in der Behauptung kF .ˇ/ % F .˛/k 0 '.ˇ/ % '.˛/ dann ˛ gegen a und ˇ gegen b streben lassen. Weiter kann man o.B.d.A. a D 0 und F .a/ D 0, '.a/ D 0 annehmen. Nun betrachtet man bei gegebenem " > 0 wie oben die Menge ˇ , ˚ /" ´ c 2 Œ0; b2 ˇ kF .t/k 0 '.t/ C "t für alle t 2 Œ0; c2 : und zeigt c # ´ sup /" D b. Dafür reichen dann die gleichen Schritte wie zuvor: 0 2 /" („Induktionsanfang“) und Widerlegung von c # < b („Induktionsschluss“). Zum zweiten Schritt deduziert man aus der Differenzierbarkeit von F und ' in c # für ein geeignetes positives ı < b % c # : - -F .c # C h/ % F .c # /- 0 -F 0 .c # /- h C " h 2 " ' .c # /h 0 '.c # C h/ % '.c # / C h 2
für h 2 Œ0; ıŒ:
0
Durch Kombination dieser Ungleichungen ergibt sich für diese h: -F .c # C h/- 0 '.c # C h/ C ".c # C h/ im Widerspruch zur Wahl von c # . Somit ist c # D b, und aus der Definition der Menge /" folgt kF .t/k 0 '.t/ C "t für t 2 Œ0; bŒ, also kF .b/k 0 '.b/, indem man t gegen b und " gegen 0 streben lässt.
34
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
5. Ist die Funktion F W Œa; b2 ! W stetig und in 2a; bŒ differenzierbar, so beweise man die folgenden Verallgemeinerungen von E[9.1]: a) Gilt kF 0 .t/k 0 M auf 2a; bŒ mit einer Konstanten M $ 0, so ist kF .b/ % F .a/k 0 M.b % a/. Lösungshinweis: Wähle in Aufgabe 4 '.t/ ´ .b % a/t. b) Aus a) folgt
kF .b/ % F .a/k 0 sup -F 0 .t/- ' .b % a/: a 0 derart dass für alle x 2 Rn gilt kxkˇ 0 1 ' kxk˛
d.h.
kL ı '.x/k C k'.x/k 0 1 ' k'.x/k :
Da ' surjektiv ist, folgt hieraus für alle v 2 V : kLvk C kvk 0 1 ' kvk
d.h.
kLvk 0 .1 % 1/ kvk :
Somit ist L stetig nach F[10.1].
"
E. Satz. Ist V ein Vektorraum endlicher Dimension, so gilt: (i)
Auf V existiert eine Norm.
(ii)
Je zwei Normen auf V sind äquivalent.
(iii) Alle Eigenschaften von Rn aus (1) übertragen sich auf V mit beliebiger Norm. Beweis. Zu (i): Wir wenden die obige Argumentation etwas anders: Sei wieder ein VektorraumIsomorphismus ' W Rn ! V gewählt. Ist k k eine Norm auf Rn , so erhalten wir eine Norm auf V in Gestalt der durch ' &1 induzierten Norm: kvk# ´ -' &1 .v/- : Tatsächlich ist dies so gemacht, dass die von kvk# durch ' induzierte Norm auf Rn gerade wieder die Ausgangsnorm k k ist. Mit anderen Worten: Bei gegebenem
39
Abschnitt 10.4 Spezielle Räume
Vektorraum-Isomorphismus ' W Rn ! V entspricht die Gesamtheit der Normen auf Rn der Gesamtheit der Normen auf V vermöge: k k $ k k# . Zu (ii): Aufgrund dieser Korrespondenz übertragen sich die Äquivalenz-Ungleichungen zwischen je zwei Normen auf Rn auf genau die gleichen Äquivalenz-Ungleichungen zwischen den zugehörigen Normen auf V (mit gleichen Schranken 112 ; 121 ). Zu (iii): Die Entsprechung k k $ k k# ist so gebaut, dass ' nicht nur VektorraumIsomorphismus ist, sondern auch normerhaltend. Somit gelten alle in Bezug auf eine Norm auf Rn festgestellten Eigenschaften genauso für die zugehörige Norm auf V . Bezüglich einer Norm auf Rn ist aber (1) nach Folgerung B erfüllt. " Normierte Vektorräume ohne Dimensionsbeschränkung Wir betrachten jetzt Situationen, in denen die Dimensionsbeschränkungen entfallen. Ein wichtiger Raumtypus entsteht, wenn die Norm durch ein Skalarprodukt erzeugt wird. F. Definition und Satz. Ein Euklidischer Vektorraum ist ein reeller Vektorraum V zusammen mit einer symmetrischen, positiv definiten Bilinearform h ; i W V ( V ! R, genannt Skalarprodukt. Die Regeln für ein solches Skalarprodukt lauten kurz zusammengefasst: u 7%! hu; vi ist linear für jedes v 2 V ; Durch die Definition juj ´
hu; vi D hv; ui ; p
hu; ui > 0 für u ¤ 0:
hu; ui
wird V dann zu einem normierten Vektorraum. Synonym mit „Euklidischer Vektorraum“ wird die Bezeichnung (reeller) Prä-HilbertRaum gebraucht. Skalarprodukte und ihre Folgebegriffe werden in der linearen Algebra ausführlich diskutiert, weswegen wir uns etwas kürzer fassen können. Bei endlicher Dimension wird der Name „Euklidischer Vektorraum“ bevorzugt, bei unendlicher Dimension der Name „Prä-Hilbert-Raum“, jedoch soll dies keine scharfe Festlegung sein. Beweis von F. Eine Konsequenz aus den Regeln für das Skalarprodukt ist die Cauchy/ Schwarz-Ungleichung: j hu; vi j 0 juj ' jvj; gültig für alle u; v 2 V , wobei Gleichheit genau für linear abhängige u; v eintritt. Den in der linearen Algebra üblichen Beweis findet man auch in G[8.6].
40
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Von den Normaxiomen sind (N.1), (N.2) unmittelbar klar. Die Dreiecksungleichung (N.3) folgt aus der Cauchy/Schwarz-Ungleichung aufgrund der folgenden Rechnung: ju C vj2 D hu C v; u C vi D hu; ui C 2 hu; vi C hv; vi 0 juj2 C 2juj ' jvj C jvj2 D .juj C jvj/2 ; wie schon einmal in F(iv)[8.6] ausgeführt.
"
In der folgenden Beispielsammlung werden vor allem wichtige Funktionenräume vorgestellt. Diese sind i. Allg. nicht von endlicher Dimension. Anhand solcher Räume sieht man auch, dass lineare Abbildungen nicht notwendig stetig sind, wenn sie in einem unendlich-dimensionalen Raum starten. G. Beispiele. (i) Die in Beispiel C genannte 2-Norm auf Rn entsteht aus dem Standard-Skalarprodukt hx; yi ´ x1 y1 C ' ' ' C xn yn nach dem Muster in F. (ii) Die obigen speziellen Normen auf Rn lassen sich für Funktionen „nachahmen“, indem die Summen durch Integrale ersetzt werden. Wir betrachten die Menge aller stetigen Funktionen auf einem kompakten Intervall , ˚ ˇ wobei a < b: C 0 Œa; b2 ´ f ˇ f W Œa; b2 %! R stetig ; Mit den argumentweisen Operationen (F[3.1]) ist C 0 Œa; b2 ein Vektorraum, dessen Neutralelement die Nullfunktion 0 (0.t/ D 0 für alle t 2 Œa; b2) ist. Analog zu den Beispielen in C kann man die folgenden Normen auf C 0 Œa; b2 bilden: Z b jf j 1-Norm kf k1 ´ a
s Z kf k2 ´
a
b
jf j2
kf k1 ´ max jf j Œa;b-
2-Norm Maximumsnorm oder 1-Norm:
Hierin bezeichnet jf j die Funktion t 7! jf .t/j. Die Normeigenschaften im Falle „1“ und „1“ sind leicht aus den Betragsregeln und der positiven Definitheit des Integrals B[5.2] deduzierbar. Im Falle „2“ folgen sie gemäß F, da die 2-Norm durch ein Skalarprodukt auf C 0 Œa; b2 erzeugt wird, nämlich durch Z b fg: hf; gi ´ a
41
Abschnitt 10.4 Spezielle Räume
Die definierenden Eigenschaften sind unmittelbar klar. Dieses Skalarprodukt ist analog gebaut zum Standard-Skalarprodukt in Rn („Multiplikation gleichstelliger Komponenten und Summation, sprich Integration“). C 0 Œa; b2 ist also mit der 2-Norm ein Prä-Hilbert-Raum, und die Cauchy/Schwarz-Ungleichung lautet hierfür: 0Z a
b
!2 fg
0Z 0
a
b
! 0Z ' f 2
a
b
! g
2
;
wobei die Gleichheit genau dann stattfindet, wenn f; g linear abhängig sind, d.h. reelle Zahlen ˛; ˇ mit .˛; ˇ/ ¤ .0; 0/ existieren, so dass ˛f .t/Cˇg.t/ D 0 für alle t 2 Œa; b2 gilt. H. Bemerkungen. (i) Wird der Raum C 0 Œa; b2 mit der 1-Norm ausgestattet, so soll er genauer als 0 C1 Œa; b2 bezeichnet werden. Varianten dieses Raums sind grundlegend für den Aufbau der Integralrechnung in Kapitel 11. Tatsächlich führt die Vervollständigung solcher Räume geradewegs zum Lebesgue-Integral, wie in Definition A[11.4] näher dargelegt wird. (ii) Auch der Raum C 0 Œa; b2 mit der 2-Norm ist ein in der Integralrechnung wichtiger Prä-Hilbert-Raum. Er heiße entsprechend C20 Œa; b2. 0 Œa; b2 genannt. Er hängt (iii) Der Raum C 0 Œa; b2 mit der 1-Norm werde analog C1 eng mit der gleichmäßigen Konvergenz zusammen: Dazu betrachten wir eine Folge 0 f1 ; f2 ; : : : in C1 Œa; b2. Sie besteht aus stetigen Funktionen
f1 W Œa; b2 %! R f2 W Œa; b2 %! R :: : Ist f W Œa; b2 %! R eine weitere stetige Funktion, so bedeutet die auf die 1-Norm bezogene Konvergenz limk!1 fk D f : Zu jedem " > 0 existiert ein N D N."/ 2 N, so dass kfk % f k1 < " für alle k > N gilt, d.h. jfk .t/ % f .t/j < "
für alle k > N und alle t 2 Œa; b2:
0 Dies ist gerade die gleichmäßige Konvergenz! Die Konvergenz in C1 Œa; b2 bzgl. der Maximumsnorm ist also äquivalent mit der gleichmäßigen Konvergenz.
42
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
I. Beispiele. (i) Auf C 0 Œa; b2 sind die 1-Norm und die 1-Norm nicht äquivalent. Zwar gilt in der einen Richtung kf k1 0 .b % a/ ' kf k1 I
;; ; ;;
denn das ist gerade die Standard-Abschätzung für Integrale. Aber es besteht keine Ungleichung in der anderen Richtung. Der Grund ist folgender: Es existiert eine Funktionenfolge .fk /k2N in C 0 Œa; b2 mit 1 kfk k1 D 1 1 kfk k1 D %! 0: k
f
a
t 0
b
}
Man nehme eine stückweise affine Funktion wie im nebenstehenden Bild mit festem Maximum 1 und Integral 21 ' 1 ' k2 D k1 .
k
2/k
Angenommen es bestünde eine Ungleichung kf k1 0 1 ' kf k1 mit festem 1 > 0 für alle f 2 C 0 Œa; b2. Dann wäre diese auch für die fk richtig, also 1 0 1 ' k1 für alle k 2 N, was nicht möglich ist. Anschaulich: Es gibt stetige positive Funktionen mit großem Maximum und kleinem Flächeninhalt. Man kann das auch so ausdrücken: Die Identität auf C 0 Œa; b2 ist nicht stetig, wenn C 0 Œa; b2 als Definitionsraum mit der 1-Norm und als Zielraum mit der 1-Norm versehen wird.
Als „Nebenprodukt“ erhalten wir mittels Satz D, dass C 0 Œa; b2 keine endliche Dimension besitzt. Dies kann man natürlich auch dadurch zeigen, dass man eine Folge von Funktionen gk konstruiert, von denen jeweils endlich viele (aber in beliebiger Anzahl) linear unabhängig sind, z.B. die Polynomfolge gk .t/ D t k für k D 0; 1; 2; : : : (jeweils eingeschränkt auf Œa; b2). (ii) Differentiation und Integration als lineare Abbildungen. Für a < b ist 9 = C 0 Œa; b2 der Vektorraum der stetigen Funktionen ; f W Œa; b2 %! R. 1 C Œa; b2 der Vektorraum der stetig differenzierbaren Wir versehen beide Räume mit der Maximumsnorm k k1 und betrachten Differentiation und Integration als Abbildungen der folgenden Art: D %%%%! C 0 Œa; b2; C 1 Œa; b2 % .%%%%% J
.Df /.t/ ´ f 0 .t/;
Z .Jf /.t/ ´
t a
f .*/ d *:
Beide Abbildungen D; J sind linear (nach den elementaren Differentiations- und Integrationsregeln). Übrigens gilt DıJ D idC 0 Œa;b- (das ist der Hauptsatz der Differential-
43
Abschnitt 10.4 Spezielle Räume
und Integralrechnung A[5.2]), allerdings nicht J ı D D idC 1 Œa;b- , was aber hier keine Rolle spielt. Der Integrationsoperator J ist stetig: Es gilt nämlich für f 2 C 0 Œa; b2 ˇZ t ˇ ˇ ˇ ˇ f .*/ d * ˇˇ 0 max jf j ' .t % a/ 0 kf k1 ' .b % a/; ˇ Œa;b-
a
also kJf k1
ˇ ˇZ t ˇ ˇ ˇ D max ˇ f .*/ d * ˇˇ 0 kf k1 ' .b % a/: t 2Œa;ba
Der Differentiations-Operator D ist unstetig: Dazu betrachtet man z.B. die Funktionenfolge / 1 1 t %a k : fk .t/ ´ k b%a Es gilt kfk k1 D max jfk j D fk .b/ D Œa;b-
1 ' 1 %! 0I k
fk konvergiert also auf Œa; b2 gleichmäßig gegen 0. Jedoch ist fk0 .t/ ´
/
t %a b%a
1k&1
'
1 ; b%a
also
kDfk k1 D max jfk0 j D fk0 .b/ D Œa;b-
1 : b%a
Somit ist es nicht möglich, dass eine Ungleichung kDfk k1 0 1 ' kfk k1 mit festem 1 $ 0 besteht. J . Definition. Ein vollständiger normierter Vektorraum heißt Banach-Raum. Ein vollständiger Prä-Hilbert-Raum heißt Hilbert-Raum. In einem Banach-Raum V gilt also das Cauchy-Kriterium: Eine Folge .vk / in V besitzt dann und nur dann einen Grenzwert in V , wenn sie eine Cauchy-Folge ist. Jeder Hilbert-Raum ist natürlich auch ein Banach-Raum. K. Beispiele. (i)
Jeder normierte Vektorraum endlicher Dimension ist ein Banach-Raum (Satz E).
(ii)
Jeder Euklidische Vektorraum endlicher Dimension ist ein Hilbert-Raum (Satz E).
0 (iii) Der Raum C1 Œa; b2 ist vollständig, also ein Banach-Raum. Dies ist eine Konsequenz aus dem Cauchy-Kriterium für gleichmäßige Konvergenz (J[6.5]) und dem obigen Resultat in H(iii).
44 (iv)
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Räume aus stetigen Funktionen mit der 1- oder 2-Norm wie C10 Œa; b2 und C20 Œa; b2 sind i. Allg. nicht vollständig. Dazu sei auf die Integralrechnung verwiesen, insbesondere auf Beispiel Q[11.2].
In einem Banach-Raum kann man die gleichen Konsequenzen für die absolute Konvergenz von Reihen ziehen wie früher aus der Vollständigkeit in R. Man braucht nur die Betragsstriche durch die Norm zu ersetzen. So übertragen sich z.B. die hinreichenden Bedingungen für die gleichmäßige Konvergenz aus Abschnitt 8.2 auf folgende Weise: L. Satz und Definition. Sei M eine beliebige (nichtleere) Menge, V ein BanachRaum und .Fk / eine Folge von Funktionen Fk W M ! V . Dann gilt: P (i) Konvergiert die Reihe kFk .x/k gleichmäßig in M , so konvergiert auch die P F .x/ gleichmäßig in M . Unter dieser Voraussetzung sagt man, die Reihe Reihe k P Fk .x/ konvergiert absolut-gleichmäßig. (ii) Majorantenkriterium für die gleichmäßige Konvergenz von FunktionenreiP hen: Ist 1k eine konvergente Reihe mit reellen Gliedern 1k $ 0 und gilt für alle k und alle x 2 M kFk .x/k 0 1k ; P so konvergiert die Fk .x/ absolut-gleichmäßig. Unter P Reihe P dieser Voraussetzung heißt die Reihe 1k eine konvergente Majorante der Reihe Fk .x/. Beweis. Beide Teile beruhen auf Abschätzungen für die Differenzen von Teilsummen der beteiligten Reihen: - X m m X X - m .x/k 0 1k ; 0 F .x/ kF k k - kDnC1 -kDnC1 kDnC1 genau wie in (1)[8.2]. Die Anwendung des Cauchy-Kriteriums in V bzw. in R liefert dann zunächst die punktweise Konvergenz und durch Grenzübergang m ! 1 dann auch die gleichmäßige Konvergenz, wie jeweils in (i) bzw. (ii) behauptet. " M. Bemerkungen. Die speziellen Normen auf Rn aus Beispiel C und ihre Integralgegenstücke auf C 0 Œa; b2 aus Beispiel G lassen sich in eine ganze Serie von Normen einbetten. Die beiden Fälle seien der Reihe nach behandelt: (i)
Man definiert für festes p 2 Œ1; 1Œ die so genannte p-Norm 3 .1=p kxkp ´ jx1 jp C ' ' ' C jxn jp :
für x D .x1 ; : : : ; xn / 2 Rn :
45
Abschnitt 10.4 Spezielle Räume
Für p D 1 und p D 2 ergeben sich speziell die Normen aus Beispiel C. Von den Normaxiomen für k kp sind (N.1), (N.2) unmittelbar klar. Zum Nachweis der Dreiecksungleichung (N.3) für x; y muss man die Hölder-Ungleichung F(iv)[8.6] heranziehen. Es reicht, p > 1 zu betrachten. Zu diesem p sei dann das konjugierte q gewählt, also 1 p 1 C D 1; d.h. qD > 1: p q p%1 Weiter sei zunächst S´
n X
jxk C yk jp > 0
kD1
angenommen. Dann schätzt man ab: SD
n X
jxk C yk j ' jxk C yk jp&1
kD1
0
n X
jxk j ' jxk C yk jp&1 C
kD1
0
/X n
jyk j ' jxk C yk jp&1
kD1
11=q 11=p / X n .p&1/q p ' jxk C yk j jxk j
kD1
C
n X
/X n
kD1
11=p / X 11=q n jyk jp ' jxk C yk j.p&1/q ;
kD1
kD1
wobei zuletzt zweimal die Hölder-Ungleichung verwendet wurde. Hieraus folgt weiter S0
// X n
p
jxk j
kD1
11=p
C
/X n
11=p 1 jyk j S 1=q ; p
kD1
also nach Division durch S 1=q : kx C ykp 0 kxkp C kykp : Im Falle S D 0 ist dies trivial richtig, da dann x C y D 0. Diese Dreiecksungleichung der p-Norm wird auch die Minkowski-Ungleichung genannt. Die 1-Norm ist nun der Grenzfall der p-Norm für p ! 1, d.h. es gilt für x 2 Rn : (2)
kxk1 D lim kxkp : p!1
46
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Da beide Seiten positiv homogen sind, genügt der Nachweis unter der Zusatzannahme kxk1 D 1. Dann gilt 3 .1=p 1 0 kxkp D jx1 jp C ' ' ' C jxn jp 0 n1=p ; da jeder Summand zwischen 0 und 1 liegt und mindestens einer gleich 1 ist. Mittels Einschnürung folgt hieraus 1 0 lim kxkp 0 lim n1=p D n0 D 1; p!1
p!1
und darin ist die Behauptung enthalten. (ii) # Analog lassen sich für Integrale die speziellen Normen aus Beispiel G in eine
Schar von p-Normen einbetten, indem man für stetiges f W Œa; b2 ! R definiert 0Z !1=p kf kp ´
b
a
jf .t/jp dt
;
wobei wieder p konstant mit p $ 1 ist. Der Nachweis der Normeigenschaften geschieht in der gleichen Weise wie bei (i), indem die Hölder-Ungleichung statt auf Summen auf Integrale angewendet wird. Da dies zunächst nicht gebraucht wird, sei die detaillierte Ausführung auf Abschnitt 13.1 verschoben, wo dann auch gleich der allgemeine Integralbegriff zur Verfügung steht. Eine nützliche Anwendung der Operator-Norm ist die Offenheit der linearen Gruppe, die wir hier zunächst für den endlich-dimensionalen Fall behandeln: N. Satz. Sei V ein normierter Vektorraum endlicher Dimension. Dann ist die Menge GL.V / der regulären linearen Selbstabbildungen von V offen im Raum L.V / D L.V / aller linearen Selbstabbildungen von V . Genauer gilt: 1 / 1 L0 2 GL.V / H) B L0 ; - &1 - - GL.V /: -L 0
Die Gleichheit L.V / D L.V / besteht nach Satz D. Regularität einer linearen Abbildung L W V ! V bedeutet, dass L bijektiv ist. Aus der linearen Algebra ist bekannt, dass dies im endlich-dimensionalen Fall schon dann der Fall ist, wenn L injektiv ist, d.h. wenn der Kern von L nur aus der 0 besteht. Die Gesamtheit der regulären linearen Abbildungen L W V ! V ist die lineare Gruppe GL.V /. -) ( - , alBeweis von N. Sei L 2 GL.V / und L aus dem genannten Ball B L0 ; 1= -L&1 0 - 0 &1 so kL % L0 k < 1= -L0 -. Hieraus folgt für die Abweichung der Komposition L&1 0 L von der Identität I - &1 - - -L L % I - D -L&1 .L % L0 /- 0 -L&1 - ' kL % L0 k < 1: 0 0 0
47
Abschnitt 10.4 Spezielle Räume
Weiter gilt für alle v 2 V - &1 - -L Lv % v - 0 -L&1 L % I - ' kvk : 0 0 Wir zeigen damit, dass der Kern von L gleich f0g ist: Angenommen, - es gäbe ein- v ¤ 0 in V mit -Lv D 0, so-folgte aus der letzten Ungleichung kvk 0 -L&1 0 L % I ' kvk, &1 " also 1 0 L0 L % I , ein Widerspruch. In dieser Aussage kann der Radius des Balls nicht werden. Dies sieht man - vergrößert - D 1 und kL % L0 k D 1, aber schon am Beispiel L0 D I , L D 0. Hier ist -L&1 0 L ist nicht regulär. Somit gibt es bereits auf dem Rand des Balls B.I; 1/ Elemente, die nicht zu GL.V / gehören. In Analysis 3 wird Satz N auf beliebige Banach-Räume ausgedehnt werden (mit anderer Beweismethode). # Komplexe Prä-Hilbert-Räume Ein komplexer Prä-Hilbert-Raum Z liegt vor, wenn seine reelle Auffassung ein PräHilbert-Raum mit Skalarprodukt im obigen Sinne ist und die Multiplikation mit i bzgl. dieses Skalarprodukts eine Isometrie darstellt. Das bedeutet: O. Definition. Ein komplexer Prä-Hilbert-Raum Z ist ein komplexer Vektorraum zusammen mit einer Abbildung h ; i W Z ( Z ! R, die für ˛ 2 R und z; w 2 Z folgende Regeln erfüllt: h˛z; wi D ˛ hz; wi ; sowie
hz; wi D hw; zi ;
hz; zi > 0 für z ¤ 0
hiz; iwi D hz; wi :
Natürlich wird man die reelle, symmetrische und positiv definite Bilinearform h ; i als das reelle Skalarprodukt von Z bezeichnen. In dieser Sichtweise kann ein komplexer Prä-Hilbert-Raum wie ein reeller Prä-Hilbert-Raum behandelt werden. Als Folgegröße dieses reellen Skalarprodukts definiert man in einem komplexen PräHilbert-Raum ein so genannter Hermitesches Skalarprodukt H W Z ( Z ! C durch die Formel H.z; w/ ´ hz; wi C i hz; iwi ; d.h. der Realteil von H.z; w/ ist hz; wi und sein Imaginärteil ist hz; iwi. P. Lemma. Das Hermitesche Skalarprodukt erfüllt für 1 2 C und z; w 2 Z folgende Regeln: (L)
H.1z; w/ D 1H.z; w/
(K)
H.z; w/ D H.w; z/
(P)
H.z; z/ > 0 für z ¤ 0:
48
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Beweis. Zu (L): Dass H im ersten Argument R-linear ist, also H.˛z; w/ D ˛H.z; w/ für reelle ˛ gilt, sieht man der Definition von H unmittelbar an. Weiter gilt stets (3)
˝ ˛ hiz; wi D i 2 z; iw D % hz; iwi :
Damit folgt H.iz; w/ D hiz; wi C i hiz; iwi D % hz; iwi C i hz; wi D i.hz; wi C i hz; iwi/ D iH.z; w/ und für 1 D ˛ C iˇ 2 C mit ˛; ˇ 2 R H.1z; w/ D H..˛ C iˇ/z; w/ D H.˛z; w/ C H.iˇz; w/ D ˛H.z; w/ C iˇH.z; w/ D 1H.z; w/: Zu (K): Man rechnet mit (3) so: H.w; z/ D hw; zi % i hw; izi D hz; wi % i hiz; wi D hz; wi C i hz; iwi D H.z; w/: Zu (P): Dies ergibt sich aus H.z; z/ D hz; zi C i hz; izi D hz; zi; denn für den Imaginärteil gilt hz; izi D 0, wie man aus (3) erkennt, indem man dort w D z setzt. " Aus diesen Regeln ergibt sich weiter für 1 2 C H.z; 1 w/ D 1H.z; w/: H ist also im ersten Argument C-linear und im zweiten Argument C-antilinear. Für die Norm in einem komplexen Prä-Hilbert-Raum hat man jzj ´
p
hz; zi D
p
H.z; z/;
und mit den obigen Rechenregeln erkennt man leicht, dass es sich wirklich um eine Norm im Sinne der komplexen Vektorräume handelt, d.h. für 1 2 C gilt j1zj D j1j ' jzj: Ist ein komplexer Prä-Hilbert-Raum bzgl. dieser Norm vollständig, so heißt er ein komplexer Hilbert-Raum.
49
Abschnitt 10.4 Spezielle Räume
Q. Bemerkung. Ein komplexer Prä-Hilbert-Raum kann auch durch Vorgabe eines (beliebigen) Hermiteschen Skalarprodukts definiert werden, was in der Literatur oft so gemacht wird. Sei nämlich Z ein komplexer Vektorraum und H W Z ( Z ! C eine Funktion mit den obigen Eigenschaften (L), (K), (P). Definiert man dann H0 bzw. H1 als Real- bzw. Imaginärteil von H.z; w/: H.z; w/ µ H0 .z; w/ C iH1 .z; w/; so berechnet man aus diesen Eigenschaften, dass H0 eine reelle, symmetrische und positiv definite Bilinearform auf (der reellen Auffassung von) Z ist sowie H1 .z; w/ D H0 .z; iw/; d.h. H0 kann die Rolle des obigen Skalarprodukts h ; i übernehmen und H entsteht aus diesem durch die anfangs beschriebene Vorschrift. Die Definitionen eines komplexen Prä-Hilbert-Raums ausgehend von h ; i bzw. H sind also vollkommen gleichwertig. Die erstgenannte ist etwas intuitiver, da sie auf dem reellen Hintergrund aufbaut. R. Beispiele. Standardbeispiele für komplexe Prä-Hilbert-Räume sind: (i)
Cn mit dem Hermiteschen Skalarprodukt H.z; w/ ´
n X
zj wj
j D1
für z D .z1 ; : : : ; zn / 2 Cn und w D .w1 ; : : : ; wn / 2 Cn . Setzt man jeweils zj D xj C iyj , wj D uj C ivj mit reellen xj ; yj ; uj ; vj , so lautet das zugehörige reelle Skalarprodukt n X .xj uj C yj vj /: hz; wi D j D1
(ii) Der Raum der komplexen stetigen Funktionen f W Œa; b2 ! C mit dem Hermiteschen Skalarprodukt Z b f .t/g.t/ dt: H.f; g/ ´ a
Mit den reellen Zerlegungen f D ' C i6 und g D , C i) lautet das zugehörige reelle Skalarprodukt Z hf; gi D
a
b
.'.t/,.t/ C 6.t/).t// dt:
50
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Aufgaben und Anmerkungen 1. Für die in C eingeführten Normen auf Rn beweise man die folgenden gegenseitigen Abschätzungen: p kxk1 0 kxk1 0 n ' kxk1 ; kxk1 0 kxk2 0 n ' kxk1 ; p kxk2 0 kxk1 0 n ' kxk2 : Diese drücken also auf konkrete Weise aus, dass diese drei Normen paarweise äquivalent sind. Man zeige darüber hinaus, dass die Koeffizienten in diesen Ungleichungen optimal sind, d.h. bei den unteren Schranken nicht vergrößert und bei den oberen Schranken nicht verkleinert werden können. 2. Für die Elemente eines Prä-Hilbert-Raums beweise man die ParallelogrammIdentität ) ( ju C vj2 C ju % vj2 D 2 juj2 C jvj2 und folgere daraus die Ungleichung ) ( ju C vj2 0 2 juj2 C jvj2 mit Gleichheit genau für u D v. 3. Gegeben seien Elemente u1 ; : : : ; um eines Prä-Hilbert-Raums, für die gilt r ˇ ˇ ˇuj ˇ < 2.m % 1/ ; j D 1; : : : ; m: m ˇ ˇ Man zeige: Es gibt i ¤ j mit ˇui % uj ˇ < 2. Lösungshinweis: Man beweise zunächst die Identität ˇ X ˇ2 X Xˇ ˇ ˇ ˇ ˇui % uj ˇ2 D m ' ui ˇ : jui j2 % ˇ i<j
i
i
4. Eine lineare Abbildung L W V ! W zwischen Prä-Hilbert-Räumen .V; h ; i/ und .W; h ; i/ heißt Isometrie, wenn L das Skalarprodukt invariant lässt, d.h. wenn für alle u; v 2 V gilt hLu; Lvi/ D hu; vi/. Zeige: Äquivalent hiermit ist auch die (scheinbar schwächere) Bedingung: jLuj D juj für alle u 2 V . 5. Eine lineare Abbildung L W V ! W zwischen zwei Prä-Hilbert-Räumen wird eine Ähnlichkeit genannt, wenn sie Vielfaches L D ˛T einer Isometrie T W V ! W mit einem ˛ ¤ 0 ist. Für eine lineare Abbildung L W V ! W zwischen Prä-Hilbert-Räumen mit L ¤ 0 beweise man die Äquivalenz folgender Eigenschaften:
Abschnitt 10.4 Spezielle Räume
51
(i)
Winkelinvarianz: Für alle u; v 2 V mit u ¤ 0, v ¤ 0, Lu ¤ 0, Lv ¤ 0 gilt ^.Lu; Lv/ D ^.u; v/.
(ii)
Orthogonalitätsinvarianz: Aus hu; vi D 0 folgt stets hLu; Lvi D 0.
(iii) L ist eine Ähnlichkeit. Hinweis: Für u ¤ 0 und v ¤ 0 aus einem Prä-Hilbert-Raum ist der Winkel zwischen u; v definiert durch hu; vi : ^.u; v/ ´ arccos juj ' jvj Eine Homothetie H W V ! W ist eine Abbildung der Form H.u/ D ˛T .u/ C c, wobei T W V ! W eine Isometrie sowie ˛ 2 R und c 2 W sind. Im Fall ˛ D 1 spricht man von einer Bewegung, im Fall ˛ D 0 von einer Translation. 6. Sei .V; h ; i/ ein Euklidischer Vektorraum endlicher Dimension und b W V ( V ! R eine symmetrische Bilinearform mit folgender Eigenschaft: hu; vi D 0 H) b.u; v/ D 0: Zeige: Es gibt ein ˛ 2 R derart, dass für alle u; v 2 V gilt: b.u; v/ D ˛ hu; vi. 7. Sei V ein Vektorraum, W ein Prä-Hilbert-Raum mit dem Skalarprodukt h ; i und zugehöriger Norm k k sowie ' W V ! W eine injektive lineare Abbildung. Man zeige, dass durch hu; vi# ´ h'.u/; '.v/i ein Skalarprodukt h ; i# auf V definiert wird. Man sagt, es sei von h ; i durch ' induziert.
Man überlege, dass die zu h ; i# gehörende Norm diejenige ist, die von k k durch ' induziert ist. 8. Seien a1 ; : : : ; ak linear unabhängige Elemente des normierten Vektorraums V . Man beweise die Existenz einer Zahl r > 0 mit der Eigenschaft: Sind b1 2 B.a1 ; r/; : : : ; bk 2 B.ak ; r/, so sind b1 ; : : : bk ebenfalls linear unabhängig. Linear unabhängige Vektoren darf man also etwas „verwackeln“, ohne die lineare Unabhängigkeit zu stören. Lösungshinweis: Man wähle ein 1 > 0 derart, dass k˛1 a1 C ' ' ' C ˛k ak k $ 1 ' .j˛1 j C ' ' ' C j˛k j/ für alle ˛j 2 R gilt. Für jedes r 2 20; 1Œ beweise man dann die Behauptung durch Widerspruch. 9. Man zeige mit Hilfe des Identitätssatzes O(ii)[8.5], dass in der Folge der Polynomfunktionen 1; t; t 2 ; : : : (eingeschränkt auf das Intervall Œa; b2) jeweils endlich viele linear unabhängig sind, also der Raum C 0 Œa; b2 unendliche Dimension besitzt.
52
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
10. # Man zeige, dass wie im Fall des Rn auch für Funktionen f 2 C 0 Œa; b2 gilt kf k1 D lim kf kp : p!1
11. # Die Cauchy/Schwarz-Ungleichung ist in einem komplexen Prä-Hilbert-Raum nicht nur für das reelle Skalarprodukt h ; i, sondern auch für das Hermitesche Skalarprodukt H gültig, und zwar in der Form jH.z; w/j 0 jzj ' jwj mit Gleichheit genau dann, wenn z; w komplex linear abhängig sind. Lösungshinweis: Man überlege, dass für jede komplexe Zahl 1 gilt: j1 j D max fRe .e i t 1/ j t 2 Rg; setze hierin 1 ´ H.z; w/ und wende auf die rechte Seite die reelle Cauchy/SchwarzUngleichung an. 12. Für zwei normierte Vektorräume V; W zeige man: a) Ist dim V < 1, so ist die Teilmenge der injektiven L 2 L.V; W / offen in L.V; W /. b) Ist dim W < 1, so ist die Teilmenge der surjektiven L 2 L.V; W / offen in L.V; W /. Lösungshinweis: Man verwende Aufgabe 8. 13. Auf folgende Weise ist es möglich, den Satz über die gliedweise Differentiation G[5.5] auf vektorwertige Abbildungen zu verallgemeinern und zugleich die Voraussetzung der stetigen Differenzierbarkeit abzuschwächen. Man zeige nämlich: Sei W ein Banach-Raum und .Fk / eine Folge differenzierbarer Abbildungen Fk W Œa; b2 ! W mit den Eigenschaften: (i)
Für wenigstens ein t0 2 Œa; b2 existiert lim Fk .t0 / 2 W . k!1
(ii) Die Folge der Ableitungen
Fk0
konvergiert gleichmäßig auf Œa; b2.
Dann existiert (4)
lim Fk .t/ µ F .t/ glm. auf Œa; b2;
k!1
und F ist differenzierbar sowie (5)
lim Fk0 .t/ D F 0 .t/
k!1
glm. auf Œa; b2:
53
Abschnitt 10.4 Spezielle Räume
Lösungshinweis: Der Beweis beruht auf dem Cauchy-Kriterium für gleichmäßige Konvergenz J[6.5] und der folgenden, darauf hinzielenden Vorausabschätzung: kFk .t/ % F` .t/ % .Fk .s/ % F` .s//k 0 sup -Fk0 .z/ % F`0 .z/- ' jt % sj ; z2Œa;b-
gültig für alle Indizes k; ` und alle t; s 2 Œa; b2. Sie ergibt sich aus Aufgabe 5[10.3] b), angewandt auf Fk % F` . Das Supremum existiert in R aufgrund der Voraussetzung (ii). Tatsächlich kann es durch Steigerung von k; ` beliebig klein gemacht werden, und darauf stützt sich alles. Man argumentiere nämlich so: Ist " > 0 gegeben, so existiert ein Index N mit - 0 -F .z/ % F 0 .z/- < " für alle k; ` > N und alle z 2 Œa; b2 ` k kFk .t0 / % F` .t0 /k < " für alle k; ` > N : Die Vorausabschätzung impliziert damit für alle n; m > N und alle t; s 2 Œa; b2: (6)
kFk .t/ % F` .t/ % .Fk .s/ % F` .s//k 0 " ' jt % sj
speziell für s D t0 : kFk .t/ % F` .t / % .Fk .t0 / % F` .t0 //k 0 " ' jt % t0 j für alle n; m > N und alle t 2 Œa; b2, zusammengefasst also kFk .t/ % F` .t/k 0 " ' .b % a/ C " D .b % a C 1/ ' " für alle k; ` > N : Das beinhaltet die Cauchy-Eigenschaft der Folge .Fk /, sodass nach J[6.5] die Grenzfunktion F W Œa; b2 ! W der Fk als gleichmäßiger Limes existiert. Differenzierbarkeit von F an beliebiger Stelle c 2 Œa; b2: Hierzu betrachte man die Differenzenquotienten F .t/ % F .c/ Fk .t/ % Fk .c/ ; D.t/ ´ t %c t %c als Abbildungen von A ´ Œa; b2 n fcg in W . Auf A konvergieren dann die Dk gleichmäßig gegen D. Ist nämlich wiederum " > 0 gegeben, so liefert die Abschätzung (6) für s D c, Grenzübergang ` ! 1 und Division durch jt % cj Dk .t/ ´
kDk .t/ % D.t/k 0 " für alle k > N und alle t 2 A: Die Vertauschungsrelation aus Aufgabe 8[6.5] zeigt nun lim lim Dk .t/ D lim lim Dk .t/ D lim D.t/
k!1 t!c
t!c k!1
t!c
einschließlich der Existenz der Grenzwerte. Dabei hat man die zitierte Aufgabe zunächst auf beliebige Folgen .t` / in A mit Grenzwert c anzuwenden. Der Grenzwert lim t!c D.t/ ist nichts anderes als die Ableitung F 0 .c/. Hinweis: Im Fall W D R kann der Rückgriff auf die Aufgabe 5[10.3] entfallen; die obige Vorausabschätzung ist dann eine Folge des Mittelwertsatzes.
54
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
10.5
Richtungsableitung und partielle Ableitung
Wie in Abschnitt 10.2 betrachten wir jetzt wieder zwei normierte Vektorräume .V; k k/ und .W; k k/, deren Normen gleich bezeichnet seien, sowie eine offene (nichtleere) Teilmenge A - V und darauf eine Abbildung F W A ! W . Die totale Ableitung an einer festen Stelle a 2 A approximierte das Änderungsverhalten der Funktionswerte von F in allen von a ausgehenden Richtungen, d.h. für F .a C h/ mit beliebigem h „kleiner“ Norm. Die so genannte Richtungsableitung ist eine Abschwächung hiervon: man beschränkt sich auf eine feste Richtung. Bei der Richtungsableitung gibt man sich einen Vektor h 2 V vor, bildet die Gerade durch a mit Richtungsvektor h und beobachtet das Änderungsverhalten von F längs dieser Geraden. Genauer: A. Definition. Die Richtungsableitung von F in a 2 A längs h 2 V ist die Ableitung von t 7! F .a C t h/ in 0, falls existent. Sie wird dann durch F 0 .aI h/ bezeichnet:
a+th
a h
F .a C th/ % F .a/ 2 W: t!0 t Die Abbildung t 7! F .a C th/ ist zumindest in einer Umgebung von 0 2 R definiert, da t 7! a C th stetig ist und für t D 0 den Wert a hat. F 0 .aI h/ ´ .t 7%! F .aCt h//0 .0/ D lim
Im Falle h D 0 gilt stets F 0 .aI 0/ D 0. B. Bemerkungen. (i) Existiert F 0 .aI h/, so existiert auch F 0 .aI %h/ D %F 0 .aI h/ mit beliebigem % 2 R. Für % D 0 ist dies trivial, und für % ¤ 0 hat man mit der Substitution t% µ * F .a C * h/ % F .a/ F .a C t%h/ % F .a/ D%' ; t * woran man die Behauptung abliest. Wegen dieser „Homogenitätseigenschaft“ kann man sich bei der Richtungsableitung eigentlich auf die Vektoren h 2 V mit khk D 1 beschränken (was in den Anwendungen manchmal so gemacht wird). Formal einfacher ist es aber, auch khk ¤ 1 zuzulassen, wie wir es hier tun. (ii) gilt
Existiert F 0 .a/ total, so existiert die Richtungsableitung für alle h 2 V , und es F 0 .aI h/ D F 0 .a/h:
55
Abschnitt 10.5 Richtungsableitung und partielle Ableitung
Für h D 0 ist dies wieder klar, und für h ¤ 0 hat man mit L ´ F 0 .a/: F .a C t h/ D F .a/ C L.th/ C R.th/; also
F .a C t h/ % F .a/ R.th/ ' khk : D L.h/ C t t khk Da der erste Faktor im letzten Summanden für t ! 0 gegen 0 konvergiert, folgt die Behauptung. (iii) Die Umkehrung von (ii) gilt nicht: Selbst wenn die Richtungsableitung bei festem a für alle h 2 V existiert und linear von h abhängt, braucht in a keine totale Differenzierbarkeit zu herrschen: C. Beispiel. Sei f W R2 ! R in klassischer Notation definiert durch 8 3 ˆ < 2x y für .x; y/ ¤ .0; 0/ f .x; y/ ´ x 6 C y 2 ˆ : 0 für .x; y/ D .0; 0/: Für a D .0; 0/ existieren alle Richtungsableitungen f 0 .aI h/ und sind 0; denn für h D .u; v/ ¤ .0; 0/ gilt: 1 1 2t 4 u3 v f ..0; 0/ C t.u; v// % f .0; 0/ D f .tu; tv/ D ' 6 6 t t t t u C t 2v2 Dt'
2u3 v %! 0 t 4 u6 C v 2
.t %! 0/:
Insbesondere hängt f 0 .aI h/ linear von h ab. Jedoch ist die Funktion f in a D .0; 0/ nicht total differenzierbar, sogar nicht einmal stetig!
z
x
y
56
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Längs y D x 3 entsteht in der Höhe 1 eine gekrümmte „Straße“, die bei x D 0 unstetig unterbrochen ist. Einsetzen von y D x 3 in die Funktionsdefinition gibt nämlich f .x; x 3 / D 1 für x ¤ 0, während f .0; 0/ D 0 ist; vgl. obiges Bild. (Ein Bild kann allerdings die Unstetigkeit nicht korrekt wiedergeben. Die Absenkung um die z-Achse herum ist in Wirklichkeit „unendlich dünn“; sie besteht nur längs der z-Achse.) Eine ähnliche Konstruktion erfolgte in D[6.4]. Wir gehen jetzt zu dem Spezialfall über, dass der Raum V der Rn ist. In Rn gibt es eine ausgezeichnete Basis, bestehend aus den Vektoren e1 ´ .1; 0; : : : ; 0/ e2 ´ .0; 1; : : : ; 0/ :: : en ´ .0; 0; : : : ; 1/; die so genannte Standard-Basis. Somit sind auch die Richtungsableitungen längs der Vektoren ej besonders ausgezeichnet. Im Falle der Existenz werden sie als partielle Ableitungen bezeichnet: D . Definition. Sei A eine offene nichtleere Teilmenge von Rn und F W A ! W eine Abbildung in den normierten Vektorraum W sowie a 2 A. Die j -te partielle Ableitung von F in a ist die Richtungsableitung F in a längs des j -ten Standardbasisvektors ej von Rn , falls existent. Sie wird dann durch .@j F /.a/ bezeichnet: F .a C tej / % F .a/ 2 W: t !0 t
.@j F /.a/ ´ F 0 .aI ej / D lim
Wird a D .a1 ; : : : ; an / gesetzt, so ist .@j F /.a/ dasselbe wie die Ableitung der Funktion einer Veränderlichen j ^ .! 7 F .a1 ; : : : ; . ; : : : ; an / in aj : Es werden also alle Variablen xk festgehalten (D ak ) bis auf xj und von dieser Funktion einer Veränderlichen die Ableitung im Sinne von B[10.3] gebildet. Diese Übereinstimmung beruht auf der Gleichung F .a1 ; : : : ; aj C t; : : : ; an / % F .a1 ; : : : ; aj ; : : : ; an / F .a C tej / % F .a/ D : t t Es handelt sich um das gleiche Vorgehen wie bei den partiellen Ableitungen reellwertiger Funktionen in Abschnitt 9.2. Tatsächlich kommt man für den Spezialfall W D R genau auf die Definition A[9.2] zurück.
Abschnitt 10.5 Richtungsableitung und partielle Ableitung
57
In jedem Fall sind diese Begriffe invariant gegenüber Wechsel zu äquivalenten Normen in Definitions- und Zielraum, da diese Invarianz generell für Grenzwerte besteht. Schreibweisen: Die Richtungsableitung wird manchmal auch so bezeichnet: ˇ @F @F ˇˇ 0 F .aI h/ µ : .a/ µ @h @h ˇa Für partielle Ableitungen sind wie in Abschnitt 9.2 zusätzliche Symbole in Gebrauch: ˇ @F ˇˇ @F .a/ µ µ Fxj .a/ µ Fj .a/: .@j F /.a/ µ @xj @xj ˇa Natürlich wird die Existenz der partiellen Ableitungen in vielen Fällen für weitere Argumentstellen anstelle a gegeben sein. Dann werden die entsprechenden Funktionen analog bezeichnet, nämlich unter Weglassung von a. Z.B. bezeichnet @j F die Abbildung x 7! .@j F /.x/, usw. Statt des „del-Symbols“ @j F wird oft auch Dj F geschrieben. Die Schreibweisen, in denen xj vorkommt, sind mit Vorsicht zu gebrauchen; in ihnen darf für xj nichts substituiert werden. Auch beim Symbol Fj ist Vorsicht geboten, da es mit eventuell vorkommenden Komponenten von F verwechselt werden kann. Sichere Schreibweisen sind auf jeden Fall @j F D Dj F . Manchmal wird statt .@j F /.a/ auch @j F .a/ geschrieben. Die Klammern um @j F sind jedoch klarer, da die zwei Ausdrücke .@j F /.a/ und @j .F .a// durchaus verschiedene Bedeutung haben. Der zweite Ausdruck ist nämlich gleich null, da er die partielle Ableitung der Konstanten F .a/ darstellt. Aufgaben und Anmerkungen 1. Die Funktion f W R2 ! R sei in klassischer Notation definiert durch 8 3 ˆ < x für .x; y/ ¤ .0; 0/ f .x; y/ ´ x 2 C y 2 ˆ : 0 für .x; y/ D .0; 0/: Man zeige: a) f ist überall, insbesondere an der Stelle .0; 0/, stetig. b) In a ´ .0; 0/ existieren die Richtungsableitungen f 0 .aI h/ für alle h 2 R2 . Man berechne diese und beweise, dass die Abbildung h 7! f 0 .aI h/ nicht linear ist.
58
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
2. Betrachtet werde eine Abbildung F W A ! W (A offen in V ), und es seien a 2 A, h 2 V und t0 2 R mit a C t0 h 2 A gegeben. Man beweise: Existiert die Richtungsableitung F 0 .a C t0 hI h/, so ist die Funktion t 7! F .a C th/ in t0 differenzierbar und .t 7! F .a C th//0 .t0 / D F 0 .a C t0 hI h/: 3. Gegeben sei eine Abbildung F W A ! W (A offen in V ). Zeige: a) Ist F konstant, so existieren alle Richtungsableitungen und sind Null: F 0 .xI h/ D 0 für alle x 2 A und h 2 V . b) Ist A ein Gebiet und gilt F 0 .xI h/ D 0 für alle x 2 A und h 2 V , so ist F konstant. Lösungshinweis zu b): Man kann genauso vorgehen wie bei Satz G[10.3].
10.6
Totale und partielle Ableitung
Als Prototyp der Abbildungen zwischen endlich-dimensionalen Vektorräumen behandeln wir jetzt den Fall V D Rp , W D Rn , der für das konkrete Rechnen besondere Bedeutung hat. Es geht hier also um Abbildungen zwischen Zahlräumen des Typs (1) Rp S offen j F A %! Rn 1 0 1 0 0 1 F1 F1 .x1 ; : : : ; xp / x1 C B B B :: C : C : :: x D @ : A 7%! F .x1 ; : : : ; xp / D @ A ; kurz: F D @ :: A : Fn .x1 ; : : : ; xp /
xp
Fn
Dabei ist links oben nun einmal in vertikaler Schreibweise angedeutet, dass A eine offene (nichtleere) Teilmenge von Rp ist. Für die Tupel als Rechenobjekte wird hier die Spaltenschreibweise bevorzugt, da wir die Matrizenrechnung verwenden werden. Nach wie vor sollen jedoch Argumentlisten als Zeilen geschrieben werden. Verbunden mit einer solchen Funktion sind Abbildungsgleichungen der Art y1 D F1 .x1 ; : : : ; xp / (2)
:: : yn D Fn .x1 ; : : : ; xp /:
Jedem p-Tupel x D .x1 ; : : : ; xp / aus A wird ein n-Tupel y D .y1 ; : : : ; yn / aus Rn zugeordnet. Die F1 ; : : : ; Fn sind skalare Funktionen, die Komponenten von F . Die
59
Abschnitt 10.6 Totale und partielle Ableitung
Bedeutung der Abbildungsgleichungen ist die, dass ihr Bestehen äquivalent ist mit y D F .x/. Bei p D 1 kommt man auf den Wegtypus von Abschnitt 9.1 zurück, bei n D 1 auf den Skalartypus von Abschnitt 9.2. Für p D n D 1 ergeben sich die Funktionen der eindimensionalen Analysis. An Veranschaulichungsmöglichkeiten bei allgemeinem n; p hat man: & Als Feld im Sinne des Physikers: Jedem Punkt x D .x1 ; : : : ; xp / wird ein Vektor y D .y1 ; : : : ; yn / zugeordnet oder „angeheftet“. Allerdings ist in den Anwendungen das y lediglich das Komponenten-n-Tupel eines Vektors aus einem anderen Vektorraum der Dimension n, der von Rn verschieden sein darf, z.B. einer elektrischen oder magnetischen Feldstärke.
x
y
Zeichnen kann man natürlich nur für niedrige Dimensionen n; p. & Als Deformation: Man beobachtet die Verzerrung der Koordinatenlinien in A unter F : F(x) x
F F(a)
a
Man kann sich die Definitionsmenge als Gummimasse vorstellen, die mit der Abbildung F verzerrt wird, sodass ursprünglich geradlinige Teile danach eine gekrümmte Form annehmen. Koordinatenlinien in einem Raum Rp sind generell die Geraden parallel zu einer Koordinatenachse, also von der Form a C Rei für ein a 2 Rp und ein i 2 f1; : : : ; pg. Wie gesagt, für die Tupel als Rechenobjekte im Matrizenkalkül wird die Spaltenschreibweise verwendet. Eine Spalte mit den Einträgen c1 ; : : : ; cn kann platzsparend als .c1 ; : : : ; cn /> geschrieben werden, wobei das hochgestellte Zeichen > allgemein das Transponieren bezeichnet. Außerhalb des Matrizenkalküls ist es ziemlich egal,
60
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
ob Tupel als Spalten oder Zeilen aufgefasst werden (aber innerhalb einer Rechnung natürlich einheitlich). Nun betrachten wir den Fall einer offenen Definitionsmenge A und setzen zunächst voraus, dass die Abbildung F (1) in a 2 A total differenzierbar ist. Die Ableitung in a liefert dann eine lineare Approximation der „Differenzvektoren“: x % a 7%! F .x/ % F .a/ D L.x % a/ C R.x/: Lineare Abbildungen L W Rp ! Rn sind hier im endlich-dimensionalen Fall von alleine stetig. Ein Hauptmerkmal bei diesem Abbildungstyp ist, dass die Ableitung als eine lineare Abbildung L W Rp ! Rn durch eine Matrix dargestellt werden kann. Beide Räume besitzen ja ausgezeichnete Basen, die Standard-Basen, bezüglich derer eine umkehrbar eindeutige Beziehung zwischen linearen Abbildungen und Matrizen besteht. Konkret gestaltet sich diese Zuordnung so, dass in die i -te Spalte der Matrix von L das Bild des i-ten Standardbasisvektors ei 2 Rp unter L eingetragen wird. Diese Einträge sind nun einfach partielle Ableitungen: A. Satz. Existiert F 0 .a/ für ein a 2 A, so gilt einschließlich der Existenz aller Größen: 1 0 .@i F1 /.a/ C B :: (i) .@i F /.a/ D @ 1 0 i 0 p. A; : .@i Fn /.a/
(ii) Die Matrix von F 0 .a/ bzgl. der Standard-Basen von Rp und Rn lautet: 1 0 .@1 F1 /.a/ ' ' ' .@p F1 /.a/ Jacobi-Matrix C B :: :: oder (3) Ja .F / ´ @ A : : Funktionalmatrix. .@1 Fn /.a/ ' ' ' .@p Fn /.a/ Mit der Jacobi-Matrix wird viel gearbeitet werden; man kann sich die Anordnung ihrer Elemente dadurch merken, dass in ihren Spalten der Vektor aus (1), rechts unten, erscheint, jedoch sukzessive abgeleitet nach x1 ; : : : ; xp . Beweis von A. Zu (i): Die Existenz von @i F .a/ ist klar aus B(ii)[10.5]. Es handelt sich um die Ableitung einer Funktion einer Veränderlichen (xi ) im Sinne von D[10.5]), also ist die Berechnung wie in A[9.1] und C[9.1] komponentenweise möglich. Zu (ii): Die Anwendung der Ableitung auf den i -ten Standardbasisvektor gibt gerade den eben berechneten Vektor: F 0 .a/ei D F 0 .aI ei / D .@i F /.a/. Daraus folgt die Behauptung nach Definition der Matrix einer linearen Abbildung. "
61
Abschnitt 10.6 Totale und partielle Ableitung
Die Menge aller reellen Matrizen mit p Spalten und n Zeilen wird hier durch R.p;n/ bezeichnet. Jede Matrix hieraus heißt eine .p ( n/-Matrix. B . Definition. Verwendet man in den Zahlräumen Rp und Rn ausschließlich die Standard-Basen, so wird die lineare Abbildung F 0 .a/ 2 L.Rp ; Rn / in der Schreibweise häufig mit der Jacobi-Matrix Ja .F / 2 R.p;n/ identifiziert. Man schreibt also anstelle von (3) 1 0 .@1 F1 /.a/ ' ' ' .@p F1 /.a/ C B :: :: (4) F 0 .a/ D @ A: : : .@1 Fn /.a/ ' ' '
.@p Fn /.a/
Die Operationen für Matrizen sind so gemacht, dass sie den Operationen für die linearen Abbildungen entsprechen, die sie darstellen. Insbesondere entspricht die Matrizenmultiplikation der Komposition der zugehörigen linearen Abbildungen. Wir können daher festhalten: C. Satz (Übertragungsprinzip). Die Rechenregeln aus den Sätzen D bis F in Abschnitt 10.2 übersetzen sich mittels der Konvention B in den Matrizenkalkül mit praktisch den gleichen Formeln. Lediglich bei der Kettenregel ist das Ergebnis statt mit der Komposition von linearen Abbildungen mit dem Matrizenprodukt aufzuschreiben: .G ı F /0 .a/ D G 0 .F .a// ' F 0 .a/ D G 0 .F .a//F 0 .a/: Wie üblich wird das Matrizenprodukt durch einen Punkt oder einfach durch Hintereinanderschreiben bezeichnet. " Diese Rechengesetze, insbesondere die Kettenregel, sind an Einfachheit und Transparenz unschlagbar. Das trifft sowohl für die frühere abstrakte Fassung zu, wo die Ableitung eine lineare Abbildung ist, wie auch für die jetzige konkrete Situation, wo die Ableitung als Matrix aufgefasst werden kann. Allerdings benötigt man für das konkrete Rechnen oft noch explizitere Formeln, die sich aber einfach ergeben, indem man auf die Bedeutung der Matrizenoperationen zurückgreift. Für skalare Vielfache und Summen ist das unmittelbar klar. Für die Komposition wird dies in der folgenden Bemerkung im Einzelnen beschrieben. Dabei hat man genau zu beachten wie das Matrizenprodukt rechnerisch ausgeführt wird, nämlich nach dem Schema: „Zeilen des ersten Faktors mal Spalten des zweiten Faktors“. D. Bemerkung (Umschreibung der Kettenregel). Für den Kompositionstyp F G Rp %! Rq %! Rn
q
gilt:
X @Gk @Fj @.G ı F /k .a/ D .F .a// ' .a/: @xi @yj @xi j D1
62
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Im Vergleich zur obigen Kettenregel in Satz C sieht das relativ kompliziert aus, entspricht dem aber genau, wenn man berücksichtigt, dass im Bruchstrichsymbol der partiellen Ableitungen der „Zählerindex“ die Zeilen der Jacobi-Matrix nummeriert und der „Nennerindex“ die Spalten. Der Kürze halber ist nur der Typ der Abbildung aufgeschrieben. Natürlich darf F auch auf einer Teilmenge von Rp definiert sein, wobei stets die Komposition wirklich ausführbar sein muss und die nötigen Differenzierbarkeitsannahmen über F und G gemacht werden müssen. Klassischerweise wird die obige Kettenregel in sehr lockerer Form auch so formuliert: Für den Kompositionstyp q
.x1 ; : : : ; xp / 7! .y1 ; : : : ; yq / 7! .z1 ; : : : ; zn / gilt:
X @zk @yj @zk D ' : @xi @yj @xi j D1
Warnung: Das ist natürlich eher eine Merkregel denn eine präzise Rechenanweisung! Für die Indizes gilt allemal 1 0 i 0 p, 1 0 j 0 q, 1 0 k 0 n. Bisher wurde vorausgesetzt, dass die totale Ableitung an einer Stelle existiert und die totale Ableitung dann durch partielle Ableitungen ausgedrückt, die ja von selbst existieren. Umgekehrt erhebt sich die Frage, ob aus den partiellen Ableitungen die Existenz der totalen Ableitung gefolgert werden kann. Generell ist das sicher nicht möglich, wie das Beispiel C[10.5] lehrt. Jedoch gilt unter zusätzlicher Voraussetzung der Stetigkeit: E. Satz. Sind alle partiellen Ableitungen @i Fj in A existent und in a 2 A stetig, so ist F in a total differenzierbar. Es gelten dann die Formeln aus Satz A. Beweis. 1) Wir behandeln zunächst den skalaren Fall f W A ! R. In Rp werde die Maximumsnorm k k1 zugrunde gelegt. Sei ein Ball B.a; r/ - A gewählt, und sei weiter h 2 Rp mit khk1 < r betrachtet, wobei 0 1 0 1 h1 a1 B :: C B :: C h D @ : A: a D @ : A; ap
hp
Um von a nach a C h zu gelangen, führen wir „Zwischenpunkte“ zi 2 A ein, sodass jeweils nur eine Variable geändert wird. Mit vollständiger Induktion sei nämlich definiert: z0 ´ a; zi ´ zi&1 C hi ei ; i D 1; : : : ; p;
also zp ´ a C h:
63
Abschnitt 10.6 Totale und partielle Ableitung
Dabei sind alle zi in B.a; r/, also in A. Tatsächlich verläuft der ganze Polygonzug, gebildet von den Verbindungsstrecken sukzessiver zi , ganz in B.a; r/. Wir nennen einen solchen Polygonzug einen Koordinatenhaken. Ein solcher erlaubt, von einem beliebigen Punkt des Rp zu einem anderen beliebigen Punkt des Rp zu gelangen, indem man sich jeweils nur parallel zu den Achsen bewegt.
x3
z3 = a + h z =a 0 x1
Nun stellen wir die Funktionsdifferenz mittels einer Teleskopsumme dar: f .a C h/ % f .a/ D
x2
z1 z2
p X ( ) f .zi / % f .zi&1 / : i D1
Alle Terme rechts heben sich heraus bis auf %f .z0 / D %f .a/ und f .zp / D f .a C h/. Für die Summanden der Teleskopsumme gilt nach dem Mittelwertsatz G[4.3], da jeweils nur eine Veränderliche läuft: f .zi / % f .zi &1 / D f .zi &1 C hi ei / % f .zi &1 / D .@i f /.e z i / ' hi ; wobei e z i die Gestalt e z i D zi&1 C 4i hi ei mit 4i 2 20; 1Œ hat, also auf der Verbindungsstrecke von zi &1 und zi liegt. Damit wird p X .@i f /.e z i /hi f .a C h/ % f .a/ D i D1
also (5)
p p X X ( ) f .a C h/ % f .a/ % .@i f /.a/hi D .@i f /.e z i / % .@i f /.a/ hi : i D1
„
ƒ‚ … µ +.h/
iD1
„
ƒ‚ µ R.h/
…
Hierin ist der erste Ausdruck +.h/ offensichtlich linear von h abhängig, definiert also eine Linearform + W Rp ! R, und der zweite Ausdruck erweist sich als das „richtige“ Restglied; denn es gilt p X ˇ ˇ ˇ.@i f /.e jR.h/j 0 z i / % .@i f /.a/ˇ ' khk
1
i D1
:
64
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Hieraus liest man ab, dass R.h/= khk1 für h ! 0 gegen 0 strebt; denn die Zwischenstellen e z i konvergieren gegen a und die @i f sind nach Voraussetzung stetig in a. Zusammen mit (5) folgt die Behauptung. 2) Im vektoriellen Fall F W A ! Rp gilt nach 1) für jedes einzelne j 2 f1; : : : ; ng: Fj .a C h/ D Fj .a/ C +j .h/ C Rj .h/;
jRj .h/j D 0: h!0 khk1 lim
mit Linearformen +j . Die vektorielle Zusammenfassung ergibt F .a C h/ D F .a/ C L.h/ C R.h/; wobei
0
1 +1 .h/ C B L.h/ ´ @ ::: A ; +n .h/
1 R1 .h/ C B R.h/ ´ @ ::: A ; 0
Rn .h/
lim
h!0
-Rj .h/1 khk1
Hierin ist L offensichtlich linear, so dass insgesamt die Behauptung folgt.
D 0: "
Ist F an jeder Stelle von A differenzierbar, so ist die Ableitung nach der Identifikation B definiert als matrizenwertige Abbildung F 0 W A ! R.p;n/ mit Werten entsprechend Satz A(ii). Man schreibt dann argumentfrei 1 0 @1 F1 ' ' ' @p F1 B :: C (6) F 0 D @ ::: : A @1 Fn
'''
@p Fn
und nennt dies wiederum die Jacobi-Matrix oder Funktionalmatrix von F . Verwendet man die Namen für die „Ausgangs-“ und „Bildvariablen“ wie bei den Abbildungsgleichungen in (2), so wird in klassischer Notation auch folgende Symbolik für die Jacobi-Matrix gebraucht: 0 1 @y1 @y1 ' ' ' B @x1 @xp C B C B :: C : : F 0 µ B :: C : B C @ @yn @yn A ''' @x1 @xp Die Auswertung an einer festen Stelle a kann wie sonst auch durch Anhängen von „.a/“ oder eines senkrechten Strichs mit dem „Index“ a bezeichnet werden. F. Definition. Die Abbildung F W A ! Rn heißt von der Klasse C r , wenn alle ihre Komponenten Fj von der Klasse C r sind.
65
Abschnitt 10.6 Totale und partielle Ableitung
Durch Kombination der Sätze A und E erhält man unmittelbar: G. Folgerung (zur Koinzidenz). Die Abbildung F W A ! Rn ist von der Klasse C 1 im Sinne der Definition I[10.2] genau dann, wenn dies im obigen Sinne zutrifft. Äquivalent damit ist auch, dass F 0 W A ! R.p;n/ existiert und stetig ist. " Das praktischen Rechnen mit solchen Abbildungen erfolgt oft mit anderen Namen für die Variablen. Wegen der Vielzahl der Veränderlichen ist es nicht möglich, bei einer Standardnotation wie z.B. „y D f .x/“ zu verharren. Man muss da flexibel sein. Bei p D 2 schreibt man z.B. .u; v/ statt des allgemeinen x und bei n D 3 z.B. .x; y; z/ anstelle des allgemeinen y. Aber es geht auch mit anderen Namengebungen, die im Einzelfall entweder nahe liegen oder ggf. vereinbart werden müssen. (Generell ist man ja in der Mathematik frei bei der Bezeichnung von Variablen.) Abbildungen mit p D n kommen sehr oft vor bei der „Einführung neuer Koordinaten“. Davon wird in Analysis 3 systematisch die Rede sein. Hier seien zunächst zwei markante Beispiele erwähnt: H. Beispiele. (i) Polarkoordinaten in der Ebene. Damit verbunden sind die Gleichungen aus R[4.4] x D r cos ' y D r sin '; mit denen aus den Polarkoordinaten r; ' die kartesischen Koordinaten x; y berechnet werden. Unabhängig von diese Deutung ist hierdurch eine Abbildung F W R2 ! R2 definiert: .r; '/ 7! .x; y/, die offensichtlich von der Klasse C 1 ist. Die Jacobi-Matrix lautet in klassischer Notation 1 0 @x @x 1 B @r @' C / cos ' %r sin ' C B : F 0 D B @y @y C D sin ' r cos ' A @ @r @' (ii) Polarkoordinaten im Raum. Ein Punkt .x; y; z/ 2 R3 wird auch hier aufgebaut aus dem Abstand r vom Ursprung und zwei Winkelgrößen +; ˇ in folgender Weise: z
x D r cos + cos ˇ r
y D r sin + cos ˇ z D r sin ˇ:
x
λ
β
y
66
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Die anschauliche Bedeutung ist die: Sei ˇ der Winkel zwischen .x; y; z/ ¤ .0; 0; 0/ und der .x; y/-Ebene. Die Projektion von .x; y; z/ auf die .x; y/-Ebene hat dann die Euklidische Länge r cos ˇ, also gelten mit dem dortigen Polarwinkel + die ersten beiden Gleichungen. Die Projektion von .x; y; z/ auf die z-Achse ist r sin ˇ, d.h. es gilt die dritte Gleichung. Betrachtet man den Punkt .x; y; z/=r auf der Einheitssphäre, so entsprechen +; ˇ den geographischen Koordinaten auf der Erdkugel, nämlich + der geographischen Länge und ˇ der geographischen Breite. Unabhängig von der Anschauung ist hierdurch eine Abbildung F W R3 ! R3 definiert: .r; +; ˇ/ 7! .x; y; z/, die wiederum von der Klasse C 1 ist. In klassischer Notation hat sie die Jacobi-Matrix 0 @x @x @x 1 B @r B B @y F0 D B B @r B @ @z @r
@+ @y @+ @z @+
@ˇ C 0 C cos + cos ˇ @y C C D @ sin + cos ˇ @ˇ C C sin ˇ @z A @ˇ
%r sin + cos ˇ r cos + cos ˇ 0
1 %r cos + sin ˇ %r sin + sin ˇ A : r cos ˇ
I. Bemerkung. Die Abbildungen des Typs F W Rp ! Rn mit p < n dienen dazu, niederdimensionale Gebilde in einem höherdimensionalen Raum zu erfassen, z.B. Kurven in der Ebene oder Flächen im Raum. Davon wird ausführlich in Analysis 3 bei den Mannigfaltigkeiten die Rede sein. Der Fall p D 1 war bereits in Abschnitt 9.1 im Rahmen der Wege behandelt worden. Obwohl der allgemeine Mannigfaltigkeitsbegriff erst später eingeführt werden kann, sei hier schon darauf hingewiesen, dass durch Abbildungen der Art F W A ! Rn (A offen in Rp / wichtige und interessante Teilmengen von Zahlräumen erzeugt werden, nämlich in Gestalt der Bildmengen F .A/. Dies trifft vor allem zu, wenn F von einer bestimmten Klasse C r mit r $ 1 und der Rang der Ableitung F 0 .x/ konstant gleich p ist. In diesem Fall nennen wir F ein p-dimensionales Flächenstück im Rn (der Klasse C r ). Allgemeine Mannigfaltigkeiten im Rn werden sich in einer bestimmten Weise aus den Bildern F .A/ solcher Flächenstücke zusammensetzen. Der Sonderfall n D 1 Für n D 1 handelt es sich um eine skalare Funktion f W A ! R (A offen in Rp ), wie bereits hinsichtlich der partiellen Ableitung in Abschnitt 9.2 diskutiert. Ist f in a 2 A differenzierbar, so ist die Jacobi-Matrix ein Zeilen-p-Tupel, der so genannte Gradient: ( ) (7) f 0 .a/ D .@1 f /.a/; : : : ; .@p f /.a/ µ .grad f /a : Das ist allerdings eine vorwiegend rechnerische Definition. Tatsächlich ist die Ableitung im basisfreien Sinne nicht ein Vektor, sondern eine Linearform, nämlich die
67
Abschnitt 10.6 Totale und partielle Ableitung
lineare Abbildung h 7! f 0 .a/h von Rp in R. Um den Gradienten basisfrei als Vektor zu erkennen, muss man die Euklidische Standard-Metrik des Rp heranziehen, definiert durch das Standard-Skalarprodukt h ; i. Es gilt nämlich (8)
f 0 .a/h D h.grad f /a ; hi
für alle h 2 Rp ;
weil die Multiplikation der „Zeilenmatrix“ .grad f /a mit der „Spaltenmatrix“ h gerade mit dem Standard-Skalarprodukt erfolgt. Anders ausgedrückt: Der Gradient .grad f /a ist der Vektor des Rp , dual bzgl. des Skalarprodukts h ; i zur Linearform f 0 .a/ W Rp ! R. Da .grad f /a hierdurch eindeutig bestimmt ist, kann (8) gut als basisfreie Definition des Gradienten dienen. J. Bemerkung (Deutung des Gradienten). Die linke Seite von (8) ist auch gleich der Richtungsableitung von f in a längs h, also gleich der Ableitung von t 7! f .a C th/ in 0. Ist jhj D 1, so nennt man diese Ableitung den Anstieg von f in a längs h. In welche Richtung h muss man vom festen Punkt a ausgehen, um den maximalen Anstieg zu erzielen? Wir suchen also das Maximum von f 0 .a/h für alle h 2 Rp mit jhj D 1. Die Antwort ist hier durch die Cauchy/Schwarz-Ungleichung möglich. Es gilt nämlich ˇ ˇ f 0 .a/h D h.grad f /a ; hi 0 ˇh.grad f /a ; hiˇ 0 j.grad f /a j ' jhj D j.grad f /a j: Falls .grad f /a ¤ 0 ist, so herrscht Gleichheit an beiden Stellen, genau wenn h mit einem positiven Faktor zu .grad f /a proportional ist, also für h D 1 ' .grad f /a mit 1 2 RC . Das bedeutet: h D .grad f /a =j.grad f /a j. Somit gilt: Ist .grad f /a ¤ 0, so weist .grad f /a in Richtung des stärksten Anstiegs von f in a, und j.grad f /a j ist dieser stärkste Anstieg. Analog ist
ˇ ˇ f 0 .a/h D h.grad f /a ; hi $ %ˇh.grad f /a ; hiˇ $ %j.grad f /a j ' jhj D %j.grad f /a j:
mit der entsprechenden Gleichheitsdiskussion. Somit: Ist .grad f /a ¤ 0, so weist %.grad f /a in Richtung des schwächsten Anstiegs (= stärksten Abfallens) von f in a, und %j.grad f /a j ist dieses stärkste Abfallen. Ist .grad f /a D 0, so erhalten wir: Alle Anstiege im festen Punkt a sind D 0. Dieser Fall steht in Beziehung zu den Extrema, was in Abschnitt 10.8 diskutiert wird. Wenn bei der Kettenregel einer der Zielräume gleich R ist, so kann sie auf den Gradienten umgeschrieben werden, z.B. in folgender Konstellation: K. Bemerkung (Umschreibung der Kettenregel). Für den Kompositionstyp f 1 R %! Rp %! R
˝ ˛ gilt: .f ı 1/0 .a/ D f 0 .1.a//1 0 .a/ D .grad f /..a/ ; 1 0 .a/ :
68
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Das ist analog zu verstehen wie in Bemerkung D: Die Abbildung 1 darf auch auf einer Teilmenge A - R definiert sein, ebenso f auf einer offenen Menge B - Rp , und es sollen folgende Voraussetzungen gelten: 1.A/ - B, 1 ist im Häufungspunkt a 2 A von A differenzierbar und f in f .a/. Der Beweis ergibt sich unmittelbar aus Satz C(i)[10.3] und Gleichung (8). L . Beispiel. Ist die skalare Funktion f die Höhenfunktion in einer Landschaft, so weist der Gradient bei a in die Richtung des stärksten Anstiegs, also dorthin, wo es von a aus am steilsten aufwärts geht. Diese Richtung ist, wie man anschaulich weiß, senkrecht zu den Höhenlinien. Tatsächlich ist es so, dass wenn eine Höhenlinie durch einen differenzierbaren Weg t 7! 1.t/ dargestellt wird, aus f .1.t// D const. durch Differenzieren folgt: .f ı 1/0 .t/ D 0, also nach der vorangehenden Bemerkung K ˝ ˛ .grad f /..t/ ; 1 0 .t/ D 0:
100 grad f - grad f 90
80
Der Tangentialvektor an die Höhenlinie ist also jeweils orthogonal zum Gradienten der Höhenfunktion. Man beachte: Die Objekte a, 1 0 .t/, .grad f /..t/ gehören der Ebene an, über der sich das Gelände erhebt. Sie haben nichts mit dem dreidimensionalen Raum zu tun, in dem sich das Gelände befindet. M. Bemerkung. Es stellt sich die Frage, wie bei nicht offener Definitionsmenge die Differenzierbarkeit zu fassen ist. Schon früher haben wir darauf hingewiesen, dass dann schon in erster Ordnung Probleme mit der Eindeutigkeit der Definition entstehen können; vgl. K[10.2] . Aus dieser Schwierigkeit gibt es folgenden Ausweg: Bei nichtoffener Definitionsmenge A ) Rn gilt F W A ! Rp als von der Klasse C r mit r $ 1, wenn F auf eine offene Obermenge von A als C r -Abbildung fortsetzbar ist. Allerdings muss man beachten, dass die Werte der partiellen Ableitungen von der Art der Fortsetzung abhängen können.
Zur Holomorphie Für Funktionen des Typs (9a)
f W B %! C;
B offene Teilmenge von C;
69
Abschnitt 10.6 Totale und partielle Ableitung
hatten wir in Definition J[7.3] den Begriff der Holomorphie über eine komplexe Kettenregel eingeführt. Diese kann man jetzt in eine Bedingung für die reelle JacobiMatrix umformulieren. Dazu schreiben wir f in der Form (9b)
f .z/ D u.x; y/ C iv.x; y/ für z D x C iy 2 B;
wobei .x; y/ reelle kartesische Koordinaten von R2 in klassischer Notation sind. Die Vorgabe einer komplexen Funktion f (9) ist also äquivalent zur Vorgabe eines Paars u; v reeller Funktionen, d.h. einer Abbildung / 1 u 2 (10) F W B ! R mit F D : v Wir nennen F (10) die reelle Auffassung von f (9). N . Satz. Die Funktion f (9) ist dann und nur dann holomorph, wenn ihre reelle Auffassung F (10) von der Klasse C 1 ist und deren Funktionalmatrix die Bedingungen ux D vy ;
(11)
uy D %vx
erfüllt. Diese heißen die Cauchy/Riemannschen Differentialgleichungen. eWB! Beweis. Die Holomorphiedefinition J[7.3] war: Es gibt eine stetige Funktion f C, sodass für alle stetig differenzierbaren Wege 1 W Œ˛; ˇ2 ! B die Komposition f ı 1 W Œ˛; ˇ2 ! C differenzierbar ist mit der Ableitung e ı 1/ ' 1 0 : .f ı 1/0 D . f
(12)
Das ist eine spezifisch komplexe Kettenregel, die nicht dasselbe ist wie die obigen Kettenregeln, da der letzte Malpunkt die Multiplikation in C bezeichnet. Zur Umformulierung dieser Bedingung sei ein solcher C 1 -Weg in B durch 1 D . Ci3 dargestellt, wobei .; 3 zwei reelle Funktionen auf dem Intervall Œ˛; ˇ2 sind. Weiter sei eD e analog zu f D u C iv gesetzt: f u C ie v mit zwei reellen Funktionen e u; e v auf B. Dann lautet die linke Seite von (12) nach Bemerkung D .f ı 1/0 D .ux ı 1/. 0 C .uy ı 1/30 C i..vx ı 1/. 0 C .vy ı 1/30 / und die rechte e ı1/'1 0 D .e .f u ı1 Ci e v ı1/.. 0 Ci30 / D .e u ı1/. 0 %.e v ı1/30 Ci..e u ı1/30 C.e v ı1/. 0 /: Die Gleichheit in (12) ist also äquivalent mit .e u ı 1/. 0 % .e v ı 1/30 D .ux ı 1/. 0 C .uy ı 1/30 .e u ı 1/30 C .e v ı 1/. 0 D .vx ı 1/. 0 C .vy ı 1/30 :
70
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Soll dies für alle diese Wege gelten, so bedeutet dies äquivalent (per Koeffizientenvergleich): (13)
e u D ux ;
e v D %uy
e u D vy ;
e v D vx ;
da an einer festen Stelle jeder Vektor aus R2 als Tangentialvektor einer C 1 -Kurve durch die Stelle vorkommt und da außerdem die Stelle in B frei gewählt werden kann. Die Gleichungen (13) liefern genau dann eine widerspruchsfreie Bestimmung für e D e e e u; e v , wenn (11) gilt, und in diesem Fall wird f u C ie v D ux C ivx , also f " stetig, genau wenn ux ; vx (und dann automatisch uy ; vy ) es sind. In der reellen Auffassung sind holomorphe Abbildungen dadurch charakterisiert, dass sie von der Klasse C 1 sind und die Jacobi-Matrix die spezielle Gestalt / 1 / 1 ux uy ux %vx F0 D D vx vy vx ux besitzt. Diese bedeutet, dass die Ableitung im reellen Sinn an jeder Stelle ein Vielfaches einer eigentlichen Drehung von R2 ist, also entweder 0 oder aber eine eigentliche Ähnlichkeit von R2 auf sich. Aufgaben und Anmerkungen 1. Im Anschluss an Bemerkung I diskutiere man die folgende Beispiele von Abbildungen F W A ! R3 (A offen in R2 ). Insbesondere berechne man die Ableitung in Gestalt der Jacobi-Matrix, ermittle jeweils den Rang derselben und veranschauliche (evtl. mit Computerhilfe) die Bildmengen. Dabei ist es sehr nützlich, die Bilder der Koordinatenlinien in A unter F mit zu behandeln, da hierdurch ein sehr anschauliches „Kurvennetz“ auf dem Bild F .A/ entsteht. Man entscheide auch, ob es sich um Flächenstücke im R3 handelt (ggf. nach geeigneter Restriktion auf eine möglichst große Teilmenge von A). a) Sei A offen in R2 , f W A ! R von der Klasse C 1 . Dann sei F gegeben durch 1 0 x F W A ! R3 mit F .x; y/ ´ @ y A : f .x; y/ Dies ist also die Graphendarstellung der skalare Funktion f , wie zu Beginn des Abschnitts 9.2 betrachtet. Zeige insbesondere, dass F immer vom Rang 2 ist. b) Ein senkrechter Kreiszylinder vom Radius r > 0 entsteht als Bild von 0 1 r cos ' F W R2 ! R3 mit F .'; z/ ´ @ r sin ' A : z
71
Abschnitt 10.6 Totale und partielle Ableitung
Es folgen die Bilder zu den Beispielen a) und b). z
z
x y
Graph
y
x
Zylinder
Allerdings wird der Zylinder mehrfach überdeckt, da zwei Werte von ', die sich um ein ganzes Vielfaches von 2' unterscheiden, zum gleichen Bildpunkt führen. Man könnte F durch Restriktion injektiv machen, z.B. durch Einschränkung auf 20; 2'Œ ( R, aber dann ist das Bild nicht der ganze Zylinder. c) Eine rationale Parametrisierung der Einheitssphäre S2 wird gegeben durch 1 0 2u 1 A; @ 2v F W R2 ! R3 mit F .u; v/ ´ 2 u C v 2 C 1 u2 C v 2 % 1 wie sie in komplexer Schreibweise in (12)[7.3] aufgeschrieben wurde. Man zeige auch, dass F injektiv ist sowie F .R2 / D S2 n fe3 g. (F ist Spezialfall einer „stereographischen Projektion“, die allgemein in Aufgabe 18 definiert wird.) Sphäre
z
x
y rational parametrisiert
z
x
y transzendent parametrisiert
d) Eine transzendente Parametrisierung von S2 wird gegeben durch 0 1 cos + cos ˇ F W R2 ! R3 mit F .+; ˇ/ ´ @ sin + cos ˇ A : sin ˇ
72
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Es ist die übliche Erfassung der Sphärenpunkte durch geographische Koordinaten, nämlich die geographische Länge + und die geographische Breite ˇ, wobei zur Erreichung der Injektivität wieder geeignete Restriktionen durchzuführen wären. Es handelt sich um das höherdimensionale Analogon der transzendenten Parametrisierung der S1 (O[4.4]). 2. Von den Spezialfällen der Kettenregel zwischen Zahlräumen wurde einer in Bemerkung K behandelt. Alle weiteren entstehen, indem einer oder zwei der vorkommenden Räume gleich R gesetzt werden. Die sechs möglichen Kompositionstypen sind .
F
a) R %! Rq %! Rn ; '
.
d) R %! R %! Rn ;
f
.
b) Rp %! R %! Rn ; .
f
e) R %! Rq %! R;
f
F
c) Rp %! Rq %! R f
'
f) Rp %! R %! R:
Man überlege nach dem Muster von Bemerkung K die jeweiligen Umformulierungen der Kettenregel unter Beachtung der Identifikation von B[10.3] und ggf. der Definition des Gradienten in (8) (unter Benennung der genauen Voraussetzungen). Außerdem soll wie in Bemerkung D in jedem Fall die komponentenweise Formulierung der Kettenregel aufgeschrieben werden. Lösungshinweis: Die resultierenden Varianten der Kettenregel lauten: a) .F ı 1/0 .a/ D F 0 .1.a//1 0 .a/. b) .1 ı f /0 .a/h D 1 0 .f .a// ' f 0 .a/h D 1 0 .f .a// ' h.grad f /a ; hi für h 2 Rp . ˝ ˛ c) h.grad .f ı F //a ; hi D .grad f /F .a/ ; F 0 .a/h für h 2 Rp . d) .1 ı '/0 .a/ D 1 0 .'.a// ' ' 0 .a/.
˝ ˛ e) .f ı 1/0 .a/ D f 0 .1.a//1 0 .a/ D .grad f /..a/ ; 1 0 .a/ . f)
.' ı f /0 .a/ D ' 0 .f .a// ' f 0 .a/ oder auch .grad .' ı f //a D ' 0 .f .a// ' .grad f /a .
3. Die Abbildungen, die in Aufgabe 2 mit 1 bezeichnet wurden, sind diejenigen, die dem Wegtypus von Abschnitt 9.1 am nächsten stehen. Sei z.B. der Typ a) genauer betrachtet: 1 W A %! Rq ;
F W B %! Rn
mit:
A - R, B offen in Rq , 1.A/ - B:
Ist 1 im Häufungspunkt a 2 A von A differenzierbar und F in b ´ 1.a/ differenzierbar, so ist F ı 1 in a differenzierbar und .F ı 1/0 .a/ D F 0 .b/1 0 .a/. Dies ergibt sich aus der allgemeinen Fassung .F ı 1/0 .a/ D F 0 .b/ ı 1 0 .a/ durch Anwendung auf h D 1 2 R. (Eine „Gradientenvariante“ existiert hier nicht, wenn n > 1). Sei nun A D J ein Intervall mit nichtleerem Inneren und seien 1 sowie F von der Klasse C 1 . Dann ist 1 dasselbe wie ein C 1 -Weg in Rq und F ı 1 der Bildweg von 1 unter F (wiederum von der Klasse C 1 ). Die Gleichung .F ı 1/0 .t/ D .F 0 .1.t//1 0 .t/ sagt dann, dass jeweils der Tangentialvektor des Bildwegs aus dem Tangentialvektor des Ausgangswegs durch Anwendung einer lineare Abbildung entsteht, nämlich der
73
Abschnitt 10.6 Totale und partielle Ableitung
Ableitung von F an der betreffenden Stelle. (Für die höheren Ableitungen von Wegen ist so ein einfaches Transformationsgesetz nicht mehr möglich.) Wird Rq mit dem Standard-Skalarprodukt versehen, so sind neben der Länge von Tangentialvektoren (j1 0 .t/j) auch Winkel zwischen sich schneidenden Wegen definierbar: Sei neben dem C 1 -Weg 1 W J ! Rq ein zweiter C 1 -Weg e 1 W e J ! Rq betrachtet. Gilt 1.a/ D e 1 .e a/ für ein a 2 J und ein e a2 e J , so ist der Winkel zwischen 1 und e 1 an dieser Stelle definiert durch den Winkel zwischen den zugehörigen Tangentialvektoren: ^.1 0 .a/; e 1 0 .e a//, vorausgesetzt diese sind beide ¤ 0. 4. Man zeige, dass die folgenden Abbildungen differenzierbar sind und berechne ihre partiellen und totalen Ableitungen: p a) r W R3 n f0g ! R mit r.x; y; z/ ´ x 2 C y 2 C z 2 1 b) , r wie in a) r c) g W RC ( R ! R mit g.x; y/ ´ x y . 5. Die Leibniz-Regel aus H[9.2] soll auf variable Integrationsgrenzen ausgedehnt werden. Sei wie dort J - R ein Intervall und f W Œ˛; ˇ2 ( J ! R stetig, ebenso existiere die partielle Ableitung fp W Œ˛; ˇ2 ( J ! R und sei stetig. Ferner seien differenzierbare Funktionen g; h W J ! Œ˛; ˇ2 gegeben. Definiert man nun ‰ W J ! R durch Z h.p/ ‰.p/ ´ '.t; p/ dt; g.p/
so gilt: ‰ 0 .p/ D '.h.p/; p/ ' h0 .p/ % '.g.p/; p/ ' g 0 .p/ C
Z
h.p/ g.p/
fp .t; p/ dt:
6. Sei F W A ! Rn eine differenzierbare Abbildung, definiert auf einem Gebiet A 2 Rp und f W Rn ! R eine differenzierbare Funktion derart, dass .grad f /F .x/ stets orthogonal zum Bild F 0 .x/ ist. Zeige, dass f auf dem Bild von F konstant ist. 7. Als Vorbereitung für die nächste Aufgabe beweise man folgenden Hilfssatz: Lemma. Sei Cij k , i; j; k 2 f1; : : : ; ng, ein dreifach indiziertes System reeller oder komplexer Zahlen, das symmetrisch in den ersten beiden Indizes und antisymmetrisch im ersten und dritten Index ist: Cij k D Cj ik und Cij k D %Ckj i . Dann folgt Cij k D 0. 8. Sei F W A ! Rn eine Abbildung der Klasse C 2 , definiert auf einem Gebiet A Rn . Man zeige: Ist F 0 .x/ für jedes x 2 A eine Isometrie von Rn , so ist F selbst eine Bewegung, d.h. von der Form F .x/ D T x C c mit einer festen Isometrie T von Rn und festem c 2 Rn . Lösungshinweis: Man beachte, dass für die Spalten Fj D @j F der Funktional-Matrix ˝ ˛ gilt: Fi ; Fj D ıij und differenziere diese Orthogonalitätsrelationen nach xk .
74
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
9. Man zeige, dass die Zylinderaufwicklung der Ebene F W R2 ! R3 , 1 0 cos u F .u; v/ ´ @ sin u A ; v an jeder Stelle eine isometrische Ableitung besitzt, aber keineswegs als Ganzes eine Isometrie ist. Die Aussage von Aufgabe 8 ist also bei unterschiedlichen Dimensionen p < n nicht richtig. Man deutet die Abbildung F anschaulich. 10. Ist f W B ! C eine holomorphe Funktion, so gilt die komplexe Kettenregel (11)[7.3] auch in folgender allgemeinerer Version: Sei g W A ! B (A - R) im Häufungspunkt a 2 A von A differenzierbar. Dann ist auch f ı g in a differenzierbar und .f ı g/0 .a/ D f 0 .g.a// ' g 0 .a/. Lösungshinweis: Man gehe über die reelle Auffassung F von f . 11. Man zeige, dass die reelle Auffassung F einer holomorphen Funktion f stets den Rang 0 oder 2 besitzt, also niemals den Rang 1. Hinweis: Der Rang einer differenzierbaren Abbildung vom Typ F W Rp ! Rn an einer Stelle a ist generell definiert als der Rang der Ableitung F 0 .a/. 12. Sei f W B ! C eine holomorphe Funktion, definiert auf einem Gebiet B - C, mit konstantem Betrag jf .z/j D const. Zeige, dass f selbst konstant ist. Diese Aussage ist stark verallgemeinerungsfähig. Vgl. Aufgabe 8[12.1] beim Inversionssatz. 13. $ Sei f W B ! C eine holomorphe Funktion, definiert auf einem Gebiet B - C, mit der reellen Auffassung F W B ! R2 . Man beweise die Äquivalenz folgender Eigenschaften: (i)
Für alle z 2 B ist jf 0 .z/j D 1.
(ii)
Für alle z 2 B ist F 0 .z/ eine eigentliche Isometrie von R2 , d.h. eine Isometrie und det F 0 .z/ D 1.
(iii) F ist Restriktion einer eigentlichen Bewegung von R2 , d.h. f ist von der Gestalt f .z/ D e i1 z C c mit festem 4 2 R und festem c 2 C. 14. Die komplexe Abbildung f W B ! C habe die reelle Auffassung F W B ! R2 von der Klasse C 1 mit nirgends verschwindender Ableitung. Man beweise die Äquivalenz folgender Eigenschaften: (i)
f ist holomorph.
(ii)
F ist orientierungs- und winkeltreu.
75
Abschnitt 10.6 Totale und partielle Ableitung
(iii) F ist orientierungs- und rechtwinkeltreu. F heißt orientierungstreu, wenn die Determinante der Ableitung immer positiv ist: det F 0 .z/ > 0 für alle z 2 B. (Ist diese Determinante stets negativ, so heißt F orientierungsumkehrend.) Die Winkeltreue bedeutet: Wann immer zwei reguläre C 1 -Wege in B sich mit dem Winkel ( schneiden, so schneiden sich auch die Bildwege unter F mit dem gleichen Winkel (. Die Rechtwinkeltreue bedeutet: Wann immer zwei reguläre C 1 -Wege in B sich orthogonal schneiden, so tun dies auch die Bildwege unter F . Eine Abbildung F W B ! R2 mit der Eigenschaft (ii) heißt direkt konform. In der Klasse der C 1 -Abbildungen F W B ! R2 mit nullstellenfreien Ableitungen entsprechen also die direkt konformen Abbildungen genau den holomorphen Funktionen f W B ! C mit nullstellenfreien komplexen Ableitungen. Lösungshinweis: Aufgaben 4 und 5 in Abschnitt 10.4. 15. Allgemein wird eine differenzierbare Abbildung F W A ! Rn (A offen in Rp , p 0 n) konform genannt, wenn jede Ableitung F 0 .x/, x 2 A, Vielfaches einer isometrischen Abbildung von Rp nach Rn ist: F 0 .x/ D ,.x/ ' T .x/;
T .x/ W Rp ! Rn Isometrie:
Man zeige: Äquivalent damit ist die Existenz einer nichtnegativen Funktion + W A ! RC 0 mit jF 0 .x/hj D +.x/jhj für alle x 2 A; h 2 Rp : Ist F von der Klasse C r mit r $ 1, so folgt, dass + automatisch die Klasse C r&1 hat. Ist + überall positiv, so nennt man F eigentlich konform. In diesem Fall gilt immer F 0 .x/ D +.x/ ' T .x/ mit Isometrien T .x/ W Rp ! Rn . Falls F die Klasse C r mit r $ 1 besitzt, so haben die Objekte + und T die Klasse C r&1 . Im Fall p D n folgt insbesondere j det F 0 .x/j D +.x/n ; ist zusätzlich stets det F 0 .x/ > 0 (d.h. F orientierungstreu), so heißt F direkt konform. Eine direkt konforme Abbildung ist immer auch eigentlich konform. 16. Die Spiegelung oder Inversion an der Einheitssphäre Sn&1 ist definiert als Abbildung S W Rn n f0g ! Rn n f0g mit S.x/ ´
x ; jxj2
x ¤ 0:
Alle metrischen Begriffe beziehen sie hierbei auf die Euklidische Standardstruktur von Rn , und es sei n $ 2. Die Abbildung S ist bijektiv und ihre eigene Inverse; denn S ı S D idRn nf0g .
76
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Geometrisch erhält man S.x/ aus x im Falle jxj > 1 indem man von x aus alle Tangenten an Sn&1 legt. Diese berühren Sn&1 längs einer Hyperebene. Deren Schnitt mit der Geraden, aufgespannt von x ergibt S.x/; vgl. das folgende Bild: x
Inversion
x
S(x)
S(x) 0
in der Ebene
0
im Raum
Für jxj D 1 ist S.x/ D x, und für je x j < 1 mit e x D S.x/ ist S.e x / bestimmt durch S.e x / D x. Man zeige: (i)
S ist eigentlich konform. x%y . (ii) jS.x/ % S.y/j D jxj ' jyj 1 . (Die Spiegelung an der Einheitssphäre ist also (iii) Es gilt det S 0 .x/ D % jxj2n nicht orientierungstreu, sondern orientierungsumkehrend.)
Lösungshinweis zu (ii): Man nutze aus, dass S mit jeder Isometrie T W Rn ! Rn kommutiert, d.h. für x ¤ 0 gilt S.T .x// D T .S.x//. Dadurch reicht es, det S 0 .x/ für x D jxje1 zu berechnen. 17. Durch Anwendung der Dreiecksungleichung auf die Bilder dreier Element x; y; z aus Rn nf0g unter der Spiegelung an der Einheitssphäre beweise man die Ungleichung von Ptolemäus jx % yj ' jzj 0 jy % zj ' jxj C jz % xj ' jyj : Diese gilt trivial auch in den Fällen, bei denen eines oder mehrere der Elemente x; y; z gleich 0 sind. Lösungshinweis: Aufgabe 16(ii). Ist die Ungleichung von Ptolemäus auch für Elemente x; y; z eines Prä-Hilbert-Raums erfüllt?
77
Abschnitt 10.6 Totale und partielle Ableitung
18. Die stereographische Projektion P W Rn&1 ! Rn ist definiert durch P .x/ ´ N C
2 .x % N /: jx % N j2
Dabei wird Rn&1 aufgefasst als der Koordinatenraum aller n-Tupel x 2 Rn mit letzter Koordinate xn D 0, und N sei der Nordpol: 0 1 0 B :: C B C N ´ B:C : @0A 1
0
1 x1 B :: C B C x ´ B : C; @xn&1 A 0
Geometrisch erhält man P .x/ aus x, indem man die Verbindungsgerade von x und N mit der Einheitssphäre Sn&1 schneidet. P .x/ ist dann der Schnittpunkt. Tatsächlich sieht man an der obigen Darstellung, dass P .x/ auf dieser Verbindungsgeraden liegt, und außerdem berechnet man jP .x/j2 D jN j2 C
4 4 hN; x % N i C jx % N j2 D 1: 2 jx % N j „ ƒ‚ … jx % N j4 0%1 x3
P(x) x2 x1
x
Man zeige: (i)
P ist injektiv.
(ii) Bild P D Sn&1 n fN g. (iii) P ist eigentlich konform. Genauer gilt: jP 0 .x/hj D
2 ' jhj; jxj2 C 1
x; h 2 Rn&1 :
78
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
19. Die direkt konformen Abbildungen sind in der Dimension n D 2 vollständig charakterisiert als die reellen Auffassungen der holomorphen Funktionen mit nirgends verschwindender Ableitung (Aufgabe 14). In der Dimension n D 1 sind alle C 1 -Funktionen auf offenen Intervallen mit nullstellenfreier Ableitung eigentlich konform. # In den Dimensionen n $ 3 gilt der Satz von Liouville: Ist F W A ! Rn eine eigentlich konforme Abbildung der Klasse C 3 , definiert auf einem Gebiet A - Rn , so ist F die Restriktion auf A einer Komposition aus Homothetien und einer Inversion an der Einheitssphäre. Die Komposition kann von der Form H ı S ı K gewählt werden, wobei K eine Translation, S eine Inversion an der Einheitssphäre und H eine Homothetie von Rn ist (oder F selbst ist die Restriktion einer Homothetie.) Eine solche Abbildung F ist sphärentreu, d.h. Punkte, die auf einer Sphäre oder Hyperebene von Rn liegen, haben Bilder, die ebenfalls auf einer Sphäre oder Hyperebene liegen. Das darf sich auch „mischen“, d.h. Punkte einer Hyperebene (bzw. Sphäre) können Bilder haben, die auf einer Sphäre (bzw. Hyperebene ) liegen. Vgl. z.B. Flanders[1966].
20. Metrikabhängigkeit des Gradienten. Ist die Funktion f W A ! R (A offen in Rp ) in a differenzierbar, so ist die Ableitung als lineare Abbildung f 0 .a/ W Rp ! R allein aus der Vektorraumstruktur des Rp heraus bestimmt, da die Ableitung unabhängig von der gewählten Norm ist. Dagegen hängt der Gradient, definiert durch f 0 .a/h D h.grad f /a ; hi
für alle h 2 Rp ;
von der zusätzlichen Struktur des Rp als Euklidischer Vektorraum ab. Man zeige nämlich: a) Aus der linearen Algebra weiß man: Ist neben dem Standard-Skalarprodukt h ; i eine weitere symmetrische, positiv definite Bilinearform b W Rp ( Rp ! R gegeben, so existiert (genau) eine lineare Selbstabbildung B W Rp ! Rp , mit: b.u; v/ D hu; Bvi
für alle u; v 2 Rp :
b) In dieser Situation ist der Gradient von f bzgl. b definiert durch f 0 .a/h D b.(Grad f /a ; h/ für alle h 2 Rp : Man beweise damit den folgenden Zusammenhang zwischen den beiden Gradienten .Grad f /a D B &1 .grad f /a : c) # Ist .grad f /a ¤ 0, so existiert zu jedem Vektor v ¤ 0 in Rp , der mit .grad f /a einen Winkel < '=2 bildet, ein geeignetes Skalarprodukt b auf Rp , sodass der zugehörige Gradient (Grad f /a D v wird. d) # Ohne die Winkelbedingung ist die Aussage von c) falsch.
Abschnitt 10.7 Taylor-Formel für mehrere Veränderliche
10.7
79
Taylor-Formel für mehrere Veränderliche
Analog zu den höheren Ableitungen im Eindimensionalen besteht die Rolle der höheren partiellen Ableitungen in der verfeinerten Approximation durch Polynome. Wie die Funktion selbst sind diese Polynome natürlich von mehreren Veränderlichen abhängig. Der Zugang hierzu gestaltet sich recht einfach, da man lediglich die eindimensionale Situation in jeder vom Zentrum ausgehenden Richtung anzuwenden hat. Wir führen diesen Leitgedanken zunächst für skalare Funktionen f W A ! R mit offener Definitionsmenge A - Rn aus. A. Satz (Taylor-Formel). Sei f 2 C sC1 .A/ für ein s $ 0, und seien a 2 A und h D .h1 ; : : : ; hn / 2 Rn so gegeben, dass die Strecke von a nach a C h in A enthalten ist, d.h. a C th 2 A für 0 0 t 0 1. Dann gilt: X 1 X .@i f /.a/ ' hi C .@i @j f /.a/ ' hi hj C ' ' ' 2Š i i;j 1 X C .@i1 ' ' ' @is f /.a/ ' hi1 ' ' ' his C Rs .h/; sŠ
f .a C h/ D f .a/ C
i1 ;:::;is
wobei 1 Rs .h/ D sŠ
Z
X i1 ;:::;isC1
1
0
.1 % t/s .@i1 ' ' ' @isC1 f /.a C th/ dt ' hi1 ' ' ' hisC1
(Integral-Restglied) D
1 .s C 1/Š
X
.@i1 ' ' ' @isC1 f /.a C 4h/ ' hi1 ' ' ' hisC1 :
i1 ;:::;isC1
(Lagrange-Restglied) Die zweite Darstellung gilt mit einem geeigneten 4 2 Œ0; 12. Der Punkt a wird das Zentrum genannt. In diesem Abschnitt laufen die Summationsindizes von 1 bis n (es sei denn, es ist etwas anderes vermerkt), und h wird als Zeile aufgefasst. Beweis von A. Zur Reduktion auf den eindimensionalen Fall betrachtet man die Hilfsfunktion ' W Œ0; 12 %! R;
'.t/ ´ f .a C th/ D f .a1 C th1 ; : : : ; an C thn /;
80
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
worin die ai die Komponenten von a bezeichnen. Nach dem Satz von Taylor aus G[8.3] gilt für ': (1a)
'.1/ D '.0/ C ' 0 .0/ ' 1 C
' 00 .0/ 2 ' .s/ .0/ s ' 1 C ''' C ' 1 C Rs ; 2Š sŠ
mit 1 (1b) Rs D sŠ
Z 0
1
.1 % t/s ' .sC1/ .t/ dt D
1 ' ' .sC1/ .4/ .s C 1/Š
für ein 4 2 Œ0; 12:
Die Berechnung der Ableitungen ' 0 ; ' 00 ; : : : geschieht mittels der Kettenregel in der Variante von K[10.6] auf induktive Weise: X ' 0 .t/ D .@i f /.a C th/ ' hi i
. X3X ' 00 .t/ D .@j @i f /.a C th/ ' hj hi :: : ' .s/ .t/ D :: :
i
j
X
.@i1 ' ' ' @is f /.a C th/ ' hi1 ' ' ' his
i1 ;:::;is
Dies zeigt auch, dass ' in C sC1 liegt. Einsetzen in (1) ergibt ohne Umschweife die Behauptung. " Wie im Eindimensionalen gliedern sich die Terme in der Taylor-Formel nach der Anzahl der auftretenden Faktoren hi . Diese Anzahl ist der so genannte Homogenitätsgrad. Wir bezeichnen die Summe aller Terme vom festen Homogenitätsgrad r mit Tr .h/: 1 X .@i1 ' ' ' @ir f /.a/ ' hi1 ' ' ' hir Tr .h/ ´´ rŠ i1 ;:::;ir
und nennen dies den (homogenen) Anteil r-ten Grades der Taylor-Formel. Damit schreibt sich die Taylor-Formel selbst als f .a C h/ D
s X
Tr .h/ C Rs .h/:
rD0
Will man die Stelle a bzw. auch die Funktion f mitbezeichnen, so kann man statt des Symbols Tr .h/ auch das genauere Symbol Tr .aI h/ bzw. .Tr f /.aI h/ verwenden.
81
Abschnitt 10.7 Taylor-Formel für mehrere Veränderliche
In der Taylor-Formel kann im Restglied nochmals der homogene Anteil .s C 1/-ten Grades abgespalten werden, indem man schreibt esC1 .h/: Rs .h/ D TsC1 .h/ C R
(2)
esC1 .h/ wird hierdurch definiert. Der Witz ist, dass man R esC1 .h/ erneut in einer R Integralform darstellen kann, an der die Stärke des Nullwerdens ablesbar ist. Hierfür sei die Definitionsmenge als Ball (bezüglich irgendeiner Norm k k) angenommen. Man erhält so die folgende Verbesserung des Restglieds, die manchmal sehr nützlich ist: B. Folgerung. Sei f 2 C sC1 B.a; %/. Dann nimmt die Taylor-Formel aus Satz A für alle h 2 Rn mit khk < % die Gestalt an: f .a C h/ D
sC1 X
esC1 .h/ Tr .h/ C R
rD0
mit
lim
h!0
esC1 .h/ R khksC1
D 0:
esC1 .h/ Man sagt für die zuletzt aufgeschriebene Grenzwertrelation: Das Restglied R geht stärker als in der Ordnung s C 1 gegen 0. Beweis. Die Integral-Darstellung liefert aus (2) esC1 .h/ D Rs .h/ % TsC1 .h/ R 1 D sŠ %
Z
X i1 ;:::;isC1
1 .s C 1/Š
1
0
.1 % t/s .@i1 ' ' ' @isC1 f /.a C th/ dt ' hi1 ' ' ' hisC1
X
.@i1 ' ' ' @isC1 f /.a/ ' hi1 ' ' ' hisC1 :
i1 ;:::;isC1
1 der zweiten Summe künstlich als IntesC1 Z 1 D .1 % t/s dt;
Nun stellt man den zusätzlichen Faktor gral dar,
1 sC1
0
und kann dann die Glieder der beiden Summen miteinander verrechnen: Z 1 1 X e .1 % t/s di1 :::isC1 .t/ dt ' hi1 ' ' ' hisC1 ; RsC1 .h/ D sŠ 0 i1 ;:::;isC1
mit
di1 :::isC1 .t/ WD .@i1 ' ' ' @isC1 f /.a C th/ % .@i1 ' ' ' @isC1 f /.a/:
82
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Hieraus deduziert man folgende Abschätzung: esC1 .h/j 0 jR
1 sŠ
X
ˇ ˇ max ˇ.@i1 ' ' ' @isC1 f /.aCk/%.@i1 ' ' ' @isC1 f /.a/ˇ'khksC1 1 :
i1 ;:::;isC1
kkk#khk
Da die Differenz, von der das Maximum gebildet wird, wegen der Stetigkeit der .s C 1/-ten Ableitungen für h ! 0 gegen 0 konvergiert, ergibt sich hieraus esC1 .h/j jR khksC1 1
%! 0
.h %! 0/:
Aufgrund der Äquivalenz je zweier Normen in Rn bleibt dies erhalten, wenn khk1 durch khk ersetzt wird. " Bei festem a und r spielt die Funktion h 7! rŠTr .h/ die Rolle einer totalen Ableitung der Ordnung r von f in a und kann dementsprechend durch f .r/ .a/ bezeichnet werden. Ihre Auswertung für h 2 Rn lautet dann (3)
.f .r/ .a//.h/ ´ f .r/ .aI h/ ´ rŠ.Tr f /.aI h/ X D .@i1 ' ' ' @ir f /.a/ ' hi1 ' ' ' hir ; i1 ;:::;ir
wobei der zweite Formelteil als weitere Bezeichnungsvariante benutzt werden kann. Algebraisch handelt es sich bei f .r/ .a/ ebenso wie bei .Tr f /.a/ um eine homogene polynomiale Funktion vom Grad r. Die Taylor-Formel aus Satz A schreibt sich damit als (4)
f .a C h/ D
s X f .r/ .aI h/ rD0
mit dem Integral-Restglied (5)
Rs .h/ D
1 sŠ
Z
1
0
rŠ
C Rs .h/
.1 % t/s f .sC1/ .a C thI h/ dt
bzw. dem Lagrange-Restglied (6)
Rs .h/ D
1 f .sC1/ .a C 4hI h/: .s C 1/Š
Rein äußerlich herrscht damit eine große Ähnlichkeit zur eindimensionalen Version der Taylor-Formel. In der Summe am Ende von (3) bestehen noch Zusammenfassungsmöglichkeiten von Summanden aufgrund der Symmetrien der höheren partiellen Ableitungen nach dem Satz von Schwarz (E[9.2] und G[9.2]).
Abschnitt 10.7 Taylor-Formel für mehrere Veränderliche
83
C. Beispiel. Sei n D 2 und a D .x0 ; y0 /, h D .u; v/ gesetzt. Dann lautet die TaylorFormel einer C 3 -Funktion f bis zur Ordnung 3 in klassischer Bezeichnungsweise f .x0 C u; y0 C v/ D D f .x0 ; y0 / C fx .x0 ; y0 /u C fy .x0 ; y0 /v ƒ‚ … „ Anteil erster Ordnung . 1 3 C fxx .x0 ; y0 /u2 C 2fxy .x0 ; y0 /uv C fyy .x0 ; y0 /v 2 „2Š ƒ‚ … Anteil zweiter Ordnung . 1 3 C fxxx .x0 ; y0 /u3 C 3fxxy .x0 ; y0 /u2 v C 3fxyy .x0 ; y0 /uv 2 C fyyy .x0 ; y0 /v 3 „3Š ƒ‚ … Anteil dritter Ordnung Ce R3 .h/:
Die Zahlkoeffizienten z.B. im Anteil dritter Ordnung entstehen, da man auf drei Weisen zweimal nach x und einmal nach y ableiten kann: fyxx , fxyx , fxxy , was wegen der Symmetrie genau 3fxxy ergibt, und analog bei 3fxyy . Auf systematische Weise werden solche Möglichkeiten zur Zusammenfassung am Ende dieses Abschnitts diskutiert. Nach dem Anteil erster Ordnung (i.w. der ersten Ableitung oder dem Gradienten) ist vor allem die Ableitung zweiter Ordnung von Interesse: D. Definition. Ist f W A ! R von der Klasse C 2 und a 2 A, so bezeichnen wir die zweite totale Ableitung f .2/ .a/ auch durch .Hf /a . Diese ist eine quadratische Form mit der Auswertung X .@i @j f /.a/ ' hi hj ; h D .h1 ; : : : ; hn /: (7) .Hf /a .h/ ´ f .2/ .aI h/ D i;j
Sie wird die Hesse-Form von f in a genannt und besitzt die Koeffizientenmatrix 1 0 2 .@1 f /.a/ ' ' ' .@1 @n f /.a/ C B C B : : B C :: :: Hesse-Matrix: (8) .Hf /a D B C A @ .@n @1 f /.a/ ' ' ' .@2n f /.a/ Die Hesse-Matrix .Hf /a ist nach dem Satz von Schwarz symmetrisch. Die zur HesseForm gehörende symmetrische Bilinearform sei bei Bedarf so bezeichnet: X (9) .Hf /a .h; k/ ´ .@i @j f /.a/ ' hi kj ; i;j
Hierin figuriert neben der einen vektoriellen Veränderlichen h D .h1 ; : : : ; hn / 2 Rn eine zweite vektorielle Veränderliche k D .k1 ; : : : ; kn / 2 Rn .
84
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Ebenso wie bei der Jacobi-Matrix in (3)[10.6] wird das Symbol für die Hesse-Matrix in (8) auch ohne Argument a auf beiden Seiten gebraucht. E. Bemerkungen. (i)
Für s D 1 schreibt sich die Taylor-Formel in Folgerung B so: f .a C h/ „ ƒ‚ … x ?
Funktionswert an Nachbarstelle
D
f .a/ „ƒ‚… x ? konstanter Anteil
C
1 e2 .h/ h.grad f /a ; hi C .Hf /a .h/ C R „ƒ‚… ƒ‚ … „ 2 ƒ‚ … „ x x x ? ? ? linearer Anteil
quadratischer Anteil
Restglied
Diese Formel ist die Basis für die Behandlung der Extrema im nächsten Abschnitt. (ii) (10) (11)
Im Matrizenkalkül lassen sich die Formeln (7), (9) folgendermaßen schreiben: .Hf /a .h/ D h.Hf /a h> .Hf /a .h; k/ D h.Hf /a k > :
Dabei ist h als Zeile aufgefasst, und das hochgestellte Zeichen > bedeutet das Transponieren, also den Übergang zur entsprechenden Spalte. Die rechten Seiten sind eigentlich .1 ( 1/-Matrizen, die jedoch mit ihren Einträgen identifiziert werden sollen. (iii) Der Gradient grad f wird im Matrizenkalkül laut Definition (7)[10.6] als Zeile aufgefasst. Er definiert natürlich auch eine Abbildung in den Rn , und wird als solche durch die entsprechende Spalte 1 0 @1 f C B .grad f /> D @ ::: A @n f
dargestellt. Bildet man von dieser Abbildung die Jacobi-Matrix, so ergibt sich gerade die Transponierte der Hesse-Matrix, also wegen deren Symmetrie sie selbst. So folgt J.grad f /> D Hf: Kurz und etwas ungenau: Die Hesse-Matrix „ist“ die Jacobi-Matrix des Gradienten. Um eine vollständige Darstellung der Funktionswerte f .a C h/ zu erhalten (nicht nur eine Approximation), geht man wie im Eindimensionalen von der Taylor-Formel zur Taylor-Reihe über. Das bedeutet, dass man den Grenzübergang s ! 1 anstrebt.
Abschnitt 10.7 Taylor-Formel für mehrere Veränderliche
85
Dafür muss natürlich die betreffende Funktion f von der Klasse C 1 vorausgesetzt werden, damit die eingehenden partiellen Ableitungen beliebiger Ordnung r 2 N0 existieren. Dann lautet die Taylor-Reihe von f mit Zentrum a entsprechend (4) 1 X f .r/ .aI h/
(12)
rD0
rŠ
mit dem Restglied wie in (5) oder (6). Diese Taylor-Reihe braucht weder zu konvergieren noch die Funktion darzustellen. Die Entscheidung über die Darstellung läuft wie im Eindimensionalen: Sie ist genau dann gewährleistet, wenn das Restglied für s ! 1 gegen 0 geht. Für die Überprüfung dieser Bedingung wird man natürlich diejenige Restgliedform wählen, mit der man am besten durchkommt. Bei einer vektorwertigen Abbildung F W A ! Rm kann man die Taylor-Formel (oder die Taylor-Reihe) für jede einzelne Komponente F` ansetzen und dann vektoriell zusammenfassen. Die Lagrange-Form des Restglieds hat allerdings keine einheitliche vektorielle Gestalt, da die Zwischenstellen von ` abhängen können. Wir führen dies im niedrigsten Fall s D 0 explizit durch. Für jede einzelne Komponente läuft das auf den gewöhnlichen Mittelwertsatz hinaus: Ist die Strecke von a nach a C h wieder in A enthalten, so gilt für die reelle Funktion '` W Œ0; 12 ! R; nach dem Mittelwertsatz
'` .t/ ´ F` .a C th/
'` .1/ % '` .0/ D '`0 .4` /
mit einem 4` 2 20; 1Œ. Aufgrund der Kettenregel ist '`0 .4` / D
n X .@i F` /.a C 4` h/ ' hi ; i D1
also F` .a C h/ % F` .a/ D
n X .@i F` /.c` / ' hi ; iD1
wobei die Zwischenstellen neu bezeichnet sind: c` ´ a C 4` h. Die vektorielle Zusammenfassung ergibt hieraus: 1 1 0 Pn 1 0 0 F1 .a/ F1 .a C h/ i D1 .@i F1 /.c1 / ' hi C C B :: C B B :: :: A: A%@ : AD@ @ : : Pn Fm .a/ Fm .a C h/ i D1 .@i Fm /.cm / ' hi In dieser Formel kann die rechte Seite in Gestalt eines Matrizenprodukts geschrieben werden. So folgt insgesamt:
86
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
F. Satz. Sei F W A ! Rm mit den Komponenten F1 ; : : : ; Fm auf der offenen Menge A - Rn differenzierbar, und seien a 2 A und h D .h1 ; : : : ; hn / 2 Rn so gegeben, dass die Strecke von a nach a C h in A enthalten ist. Dann gibt es Punkte c1 ; : : : ; cm auf dieser Strecke derart, dass 1 0 1 0 h1 .@1 F1 /.c1 / : : : .@n F1 /.c1 / C B B :C : : :: :: F .a C h/ % F .a/ D @ A ' @ :: A : .@1 Fm /.cm / : : :
.@n Fm /.cm /
hn
Im Fall h ¤ 0 können die Zwischenpunkte c` im Inneren der Strecke gewählt werden, d.h. sie sind von der Form c` D a C 4` h mit geeigneten 4` 2 20; 1Œ für ` D 1; : : : ; m. " Bei beliebiger Ordnung s > 0 ergeben sich unter den entsprechenden Differenzierbarkeits- und Stetigkeitsannahmen durch vektorielle Zusammenfassung die gleichen Formeln wie in Satz A (mit Ausnahme des Lagrange-Restglieds), Folgerung B, (3), (4), (5) und (12), wobei eben f als F zu lesen ist und im Zielraum Rm eine beliebige Norm verwendet werden darf. (Eine Darstellung durch Matrizen ist bei den höheren Taylor-Gliedern allerdings nicht mehr möglich.) Analog zur ersten Ableitung könnten die totalen Ableitungen Ts höherer Ordnung ebenfalls basisfrei definiert werden. Wir verzichten hier auf diese Variante, da höhere Ableitungen in der Mehrzahl der Anwendungen, insbesondere bei partiellen Differentialgleichungen, in der partiellen Gestalt geschrieben werden. Ein weiterer Gesichtspunkt ist, dass die erste Ableitung invariant gegenüber differenzierbaren Transformationen ist (genauer gesagt: mit der Ableitung solcher Transformationen kommutiert). Bei den höheren Ableitungen ist dies nicht mehr der Fall, sodass in der Analysis auf (nichtlinearen) Mannigfaltigkeiten höhere Ableitungen a priori nicht basisfrei existieren, sondern nur unter Zugrundelegung zusätzlicher Strukturelemente (wie Riemannscher Metriken oder kovarianter Zusammenhänge). Dann aber muss der zugehörige Ableitungsbegriff höherer Ordnung ohnehin neu gefasst werden. Die Taylor-Formel mit Multiindizes Die Summe (3) für die r-te totale Ableitung hat nr Summanden, da die Indizes i1 ; : : : ; ir unabhängig voneinander die Zahlen von 1 bis n durchlaufen. Jedoch kommen in dieser Summe viele gleiche Summanden vor, was an der Symmetrie der partiellen Ableitungen liegt; vgl. das Beispiel C. Die Symmetrie kann man nun zur Vereinfachung dieser Summe ausnutzen, indem man so genannte Multiindizes einführt. Wir beschreiben dies anhand einer skalaren Funktion f W A ! Rm (im zuletzt erwähnten vektorwertigen Fall geht es genauso).
Abschnitt 10.7 Taylor-Formel für mehrere Veränderliche
87
G . Definition und Satz. Ein Multiindex der Dimension n ist ein n-Tupel ˛ D .˛1 ; : : : ; ˛n / mit nichtnegativen ganzzahligen Komponenten ˛i . Hierfür setzt man: j˛j ´ ˛1 C ' ' ' C ˛n
und
˛Š ´ ˛1 Š ' ' ' ˛n Š:
Für h D .h1 ; : : : ; hn / 2 Rn schreibt man h˛ ´ h˛1 1 ' ' ' h˛nn : und analog D˛ f ´
@j˛j f : @x1˛1 ' ' ' @xn˛n
Die Funktion f wird also ˛1 -mal nach x1 ,. . . ,˛n -mal nach xn abgeleitet. Die Auswertung dieses Ausdrucks an einer Stelle a wird wie gewohnt durch .D ˛ f /.a/ bezeichnet. Damit gilt für die r-te totale Ableitung (13)
f .r/ .aI h/ D
X rŠ .D ˛ f /.a/ ' h˛ ; ˛Š
j˛jDr
wobei die Summe über alle Multiindizes ˛ der Dimension n mit j˛j D r zu bilden ist. Beweis. Um von der Summe in (3) zu (13) zu gelangen, sammelt man zu vorgegebenem Multiindex ˛ D .˛1 ; : : : ; ˛n / mit j˛j D ˛1 C ' ' ' C ˛n D r in (3) alle Terme .@i1 ' ' ' @ir f /.a/'hi1 ' ' ' hir , die gleich .D ˛ f /.a/'h˛ sind. Das sind diejenigen, bei denen unter den Indizes i1 ; : : : ; ir ˛1 -mal der Index 1,. . . ,˛n -mal der Index n vorkommt. Die Anzahl m dieser Terme bestimmt sich aus der Gleichung rŠ D m ' ˛1 Š ' ' ' ˛n Š. Denn es kommen insgesamt rŠ solche Systeme i1 ; : : : ; ir in Frage, und diese zerfallen in m Teilsysteme, jedes von der Anzahl ˛1 Š ' ' ' ˛n Š, weil die Plätze, an denen die 1 steht, noch untereinander permutiert werden können, . . . und ebenso die, an denen die n steht. Somit ist m D rŠ=˛Š. Macht man das für alle in der Summe (13) vorkommenden Multiindizes ˛, so hat man genau alle Summanden aus (3) erfasst. " Die Taylor-Formel aus Satz A lautet damit: (14)
f .a C h/ D
X .D ˛ f /.a/ ' h˛ C Rs .h/: ˛Š
j˛j#s
Dies hat formal wieder die gleiche Gestalt wie im Eindimensionalen. Da alle Terme, die aufgrund der Symmetrien der partiellen Ableitungen gleich sind, nunmehr mit den richtigen Anzahlkoeffizienten zusammengefasst sind, enthält die Multiindex-Gestalt der Taylor-Formel deutlich weniger Summanden als die ursprüngliche Form, die andererseits leichter herzuleiten ist.
88
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
H. Beispiel. Für n D 2 und r D 3 war in Beispiel C der Term dritter Ordnung aufgeschrieben worden. Dessen Koeffizienten ergeben sich jetzt aus (13) über die Aufzählung der möglichen Multiindizes so: Multiindex ˛ W
.3; 0/
.2; 1/
.1; 2/
.0; 3/
rŠ=˛Š D 6=˛Š W
6=3Š D 1
6=.2Š1Š/ D 3
6=.1Š2Š/ D 3
6=3Š D 1:
Aufgaben und Anmerkungen 1. Man berechne die Taylor-Formel der folgenden reellen Funktionen mit der Definitionsmenge A und dem Zentrum a bis zu den Termen der Ordnung s, wie angegeben. Der „Zuwachsvektor“ h kann z.B. mit .u; v/ im R2 bzw. .u; v; w/ im R3 bezeichnet werden. y a) A ´ f.x; y/ 2 R2 j x ¤ 0g, f .x; y/ ´ arctan , a ´ .1; 0/, s ´ 2 x 1%y b) A ´ f.x; y/ 2 R2 j 1 % x C y ¤ 0g, f .x; y/ ´ , a ´ .0; 0/, 1%xCy s´3 x c) A ´ f.x; y; z/ 2 R3 j yz ¤ 0g, f .x; y; z/ ´ , a ´ .0; 1; 1/, s ´ 3 yz d) A ´ R3 , f .x; y; z/ ´ sin.xy C xz C yz/, a ´ .0; 0; 0/, s ´ 2. 2. Bei der Schraubenlinie war in Aufgabe 1b)[9.1] herausgekommen, dass der Mittelwertsatz nicht für Wege in Rn mit n $ 3 gilt. Ein anderes Beispiel ist die Abbildung 1 W RC ! R2 mit / 21 t : 1.t/ ´ ln t Man zeige nämlich: Es gibt kein h ¤ 0 mit 1 C h > 0 und kein 4 mit 1.1 C h/ % 1.1/ D h1 0 .1 C 4h/: Damit ist auch klar, dass der Satz von Taylor für vektorielle Funktionen F W A ! Rm bei m $ 2 mit der Lagrange-Gestalt des Restglieds i. Allg. nicht richtig ist. .
f
3. Eine Kettenregel zweiter Ordnung für den Kompositionstyp R %! Rn %! R: Ist J ein Intervall in R, A offen in Rn sowie 1 W J ! A ein C 2 -Weg und f W A ! R eine C 2 -Funktion, so gilt für t 2 J : ˝ ˛ .f ı 1/00 .t/ D .Hf /..t/ .1 0 .t// C .grad f /..t/ ; 1 00 .t/ : 4. Ist A - konvex, so kann die Konvexität einer Funktion f W A ! R (J[10.1]) äquivalent so ausgedrückt werden: Für jede gerade Strecke 1 W J ! A (d.h. 1.t/ D
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
89
.1 % t/u C tv mit u; v 2 A, t 2 Œ0; 12) ist f ı 1 W J ! R konvex. Im Fall, dass f von der Klasse C 2 ist, zeige man: f ist dann und nur dann konvex, wenn die Hesse-Form .Hf /x für alle x 2 A positiv semidefinit ist. Lösungshinweis: Aufgabe 3 und D[8.6]. 5. Wird .Hf /a nicht als Matrix. sondern als lineare Abbildung .Hf /a W Rn ! Rn aufgefasst, so treten anstelle der Formeln in E(ii) die folgenden: .Hf /a .h/ D hh; .Hf /a hi D h.Hf /a h; hi .Hf /a .h; k/ D hh; .Hf /a ki D h.Hf /a h; ki :
10.8 Extrema bei mehreren Veränderlichen Wie im Eindimensionalen ist die Lösung von Extremwertaufgaben ein wichtiges Thema der Analysis, das unter entsprechenden Voraussetzungen mit der Differentialrechnung behandelt werden kann. Die Taylor-Formel ist dafür ein sehr geeignetes Werkzeug, da sie aus dem Verhalten von Ableitungen an einer festen Stelle Auskunft geben kann über die Beschaffenheit der Funktion in einer Umgebung. In Normalfall genügt es, bis zur Ordnung 2, also hier bis zur Hesse-Matrix, vorzustoßen. Es erhebt sich dabei die Frage, was an die Stelle der Vorzeichen der zweiten Ableitung tritt. Die „richtige“ Verallgemeinerung ist die Definitheit der Hesse-Form. Das ist dann allerdings keine rein skalare Bedingung mehr. Die Entscheidung, ob sie erfüllt ist, kann trotzdem mit sehr einfachen Verfahren getroffen werden. Aber es gibt auch Hilfsmittel aus der linearen Algebra, die das leisten und die hier mitdiskutiert werden. Dieser Abschnitt ist naturgemäß rein reell orientiert. Denn Extrema komplex- oder vektorwertiger Funktionen gibt es nicht im gewohnten Sinne, weil die Zielmengen nicht angeordnet sind. Die folgenden Grundbegriffe sind so einfach, dass sie ohne weiteres auch für metrische Räume formuliert werden können. Wir tun dies der universellen Anwendbarkeit zuliebe, gehen dann aber gleich zu der konkreten Situation über. Sei f W X ! R eine reelle Funktion, definiert auf einem metrischen Raum X. A. Definition. (i) Ein Punkt a 2 X heißt lokale oder relative Minimalstelle, wenn eine Umgebung U.a; "/ existiert, sodass für alle x 2 U.a; "/ gilt (m)
f .x/ $ f .a/I
der Funktionswert f .a/ heißt dann ein lokales oder relatives Minimum von f .
90
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
(ii) Ein Punkt a 2 X heißt (absolute) Minimalstelle, wenn (m) für alle x 2 X gilt; der Funktionswert f .a/ heißt dann das (absolute) Minimum von f . Entsprechende Definitionen hat man für lokale und absolute Maximalstellen und Maxima, wobei lediglich die Ungleichung (m) durch (M)
f .x/ 0 f .a/I
ersetzt wird. Der Oberbegriff für „Maximum“ und „Minimum“ ist Extremum. Eine lokale Extremalstelle heißt strikt oder streng, wenn die Umgebung U.a; "/ zusätzlich so wählbar ist, dass f .x/ D f .a/ in ihr nur für x D a möglich ist. Eine absolute Extremalstelle heißt strikt oder streng, wenn f .x/ D f .a/ in X nur für x D a möglich ist. Jedes absolute Extremum ist natürlich auch relatives Extremum. Absolute Extrema sind eindeutig bestimmt. Dagegen kann es mehrere relative Extrema und auch mehrere Extremalstellen geben. Das ist alles analog zu eindimensionalen Fall. Die Funktion, deren Extrema zu bestimmen sind, wird oft auch Zielfunktion genannt. Von jetzt ab werden hier nur noch Funktionen f W A ! R betrachtet, deren Definitionsmengen A Teilmengen des Rn sind. Der Raum Rn darf mit einer beliebigen Norm k k versehen sein, auf die sich dann auch die Umgebungen U.a; "/ von Rn beziehen. Die Umgebungen (in der Relativtopologie) von A sind dann die Durchschnitte A \ U.a; "/. Man erkennt ohne Mühe, dass die Begriffe der obigen Definition A nicht von der gewählten Norm abhängen. Für n D 2 sehen Extrema in der Graphendarstellung anschaulich so aus:
z
x Minimum
y Maximum
91
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
Das allgemeine Extremalprinzip D[6.5] garantiert die Existenz absoluter Extrema bei kompakter Definitionsmenge A und stetiger Zielfunktion f . Allerdings macht dieses Prinzip keine Aussage darüber, wie die Extrema bestimmt werden können. Darum geht es jetzt, wobei die Hilfsmittel der Differentialrechnung, insbesondere der Gradient und die Hesse-Matrix herangezogen werden. Folgende Begriffe werden dafür verwendet: Gegeben sei eine reelle symmetrische Matrix mit n Zeilen und n Spalten: 0
g11 B :: GD@ : gn1
:::
1 g1n :: C 2 R.n;n/ ; : A
gij D gj i :
: : : gnn
Verbunden mit G sind die quadratische Form:
Q.h/ ´
die Bilinearform: Q.h; k/ ´
n X i;j D1 n X
gij hi hj gij hi kj ;
i;j D1
wobei h D .h1 ; : : : ; hn /;
k D .k1 ; : : : ; kn /
vektorielle Veränderliche aus Rn in Zeilenform sind. Das Q mit einem solchen Argument ist also eine reelle Funktion auf Rn , das Q mit zwei solchen Argumenten eine reelle Funktion auf Rn ( Rn , die in beiden Argumenten linear ist und darüber hinaus symmetrisch: Q.h; k/ D Q.k; h/. Unter Voraussetzung der Symmetrie bestimmt jedes der drei Objekte: „(n ( n)-Matrix“, „quadratische Form“, „Bilinearform“ die anderen beiden eindeutig. Diese Zusammengehörigkeit wird oft mit dem Wort assoziiert bezeichnet. Man nennt G auch die Koeffizientenmatrix von Q. P B. Bemerkung. Ist ein Ausdruck der Form ni;j D1 1ij hi hj mit eventuell unsymmetrischen Koeffizienten gegeben, so kann dieser in einen Ausdruck mit symmetrischen Koeffizienten umgeschrieben werden: n X i;j D1
n 1 X 1ij hi hj D .1ij C 1j i /hi hj : 2 i;j D1
Die neuen Koeffizienten gij ´ .1ij C 1j i /=2 erfüllen offensichtlich gij D gj i .
92
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
C. Definition. Man nennt die symmetrische Matrix G (oder die assoziierte Form Q) (i)
positiv definit (Symbol: G > 0 oder Q > 0), wenn gilt: Q.h/ > 0 für alle h ¤ 0;
(ii)
positiv semidefinit (Symbol: G $ 0 oder Q $ 0), wenn gilt: Q.h/ $ 0 für alle h;
(iii) negativ definit (Symbol: G < 0 oder Q < 0), wenn gilt: Q.h/ < 0 für alle h ¤ 0; (iv)
negativ semidefinit (Symbol: G 0 0 oder Q 0 0), wenn gilt: Q.h/ 0 0 für alle h;
(v)
indefinit, wenn es ein hC 2 Rn gibt mit Q.hC / > 0 und zugleich ein h& 2 Rn existiert mit Q.h& / < 0.
Wie in der eindimensionalen Theorie starten wir mit notwendigen Bedingungen. Dabei tritt an die Stelle der ersten Ableitung der Gradient und an die Stelle der zweiten Ableitung die Hesse-Matrix: D. Satz (notwendige Bedingungen für relative innere Extrema). Ist a 2 Aı relative Extremalstelle im Inneren, so gilt: (i)
falls f in a partiell differenzierbar ist: .grad f /a D 0I
(ii) falls f in einer Umgebung von a von der Klasse C 2 ist: & a relative Minimalstelle
H)
.Hf /a $ 0
& a relative Maximalstelle
H)
.Hf /a 0 0:
Beweis. Zu (i): Wir betrachten für festes i die partielle Funktion i ^ 'i ../ ´ f .a1 ; : : : ; . ; : : : ; an /: Für diese ist . D ai eine innere relative Extremalstelle, da eine Umgebung von ai durch . 7! .a1 ; : : : ; .; : : : ; an / in eine Umgebung von a D .a1 ; : : : ; ai ; : : : ; an / hinein abgebildet wird (Stetigkeit von kanonischen Injektionen E[6.4]). Somit gilt laut A[4.3]: 0 D 'i0 .ai / D .@i f /.a/: Zu (ii): Sei a z.B. relative Minimalstelle. Mit geeignetem " > 0 gilt dann unter Hinzuziehung der Taylor-Formel E(i)[10.7]: 0 0 f .a C h/ % f .a/ D
1 e2 .h/ .Hf /a .h/ C R 2
für khk < ":
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
93
Der Unterschied von f .a/ zu den benachbarten Funktionswerten wird also hauptsächlich durch die Hesse-Form bestimmt. Mit der Substitution h # tv .t 2 R/ folgt hieraus der Reihe nach 1 e2 .tv/ .Hf /a .tv/ C R 2 e2 .tv/ 1 R ' kvk2 0 0 .Hf /a .v/ C 2 t 2 kvk2
00
00
1 .Hf /a .v/ 2
für jt j 0 1, kvk < " für 0 < jtj 0 1, 0 < kvk < ": für 0 < kvk < ":
Hierin wird beim Übergang von der ersten zur zweiten Zeile durch t 2 dividiert und beim Übergang zur dritten Zeile der Grenzwert für t ! 0 gebildet. Da .Hf /a .v/ bei Multiplikation von v mit s den Faktor s 2 abspaltet, gilt das Resultat .Hf /a .v/ > 0 nicht nur für 0 < kvk < ", sondern für alle v ¤ 0. Analog schließt man im Falle eines relativen Maximums (oder man betrachtet %f anstelle von f ). " E. Definition. Ein a 2 Aı mit .grad f /a D 0 heißt stationäre oder kritische Stelle. Satz D besagt also, dass eine relative innere Extremalstelle stets kritische Stelle ist. Wie im Eindimensionalen gilt hiervon nicht die Umkehrung. Für die hinreichenden Bedingungen benötigt man folgendes F. Lemma. Ist Q W Rn ! R eine positiv definite quadratische Form, so gibt es Konstanten m1 > 0; m2 > 0 derart, dass für alle h 2 Rn gilt m1 khk2 0 Q.h/ 0 m2 khk2 : Beweis. Die symmetrische, positiv definite Bilinearform zu Q macht Rn zu einem Euklidischen Vektorraum, dessen Norm h 7! khkQ natürlich von der Standard-Norm verschieden sein kann (F[10.4]). Jedoch ist die Norm k kQ zur gegebenen Norm k k äquivalent (A[10.4]). Quadriert man die Äquivalenzbedingung für diese beiden Normen, so folgt die Behauptung. " G. Satz (hinreichende Bedingungen für relative innere Extrema). Sei f in einer Umgebung von a 2 Aı von der Klasse C 2 . Dann gilt: (i)
Ist .grad f /a D 0 und .Hf /a > 0, so ist a lokale strikte Minimalstelle von f .
(ii) Ist .grad f /a D 0 und .Hf /a < 0, so ist a lokale strikte Maximalstelle von f .
94
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Beweis. Sei z.B. der Fall (i) behandelt: Nach Taylor gilt wie bei Satz D: f .a C h/ % f .a/ D
1 .Hf /a .h/ C khk2 ' e r 2 .h/; 2
lim e r 2 .h/ D 0;
h!0
wobei wir diesmal den nach 0 strebenden Teil des Restglieds als e r 2 .h/ herausgehoben haben. Zur quadratischen Form 12 .Hf /a wählen wir nun m1 > 0 gemäß Lemma F und dann " > 0 derart, dass je r 2 .h/j < 12 m1 für 0 < khk < " gilt. Damit wird: 1 1 f .a C h/ % f .a/ $ m1 khk2 % khk2 ' m1 D m1 khk2 > 0 2 2
für 0 < khk < ";
und darin ist die Behauptung enthalten. Analog geht es im Fall (ii) (oder man betrachtet %f anstelle f ).
"
H. Satz. (i)
Ist .grad f /a D 0 und .Hf /a indefinit, so ist a sicher keine lokale Extremalstelle. Es gibt dann in jeder Umgebung von a kleinere und größere Funktionswerte als f .a/; für dieses Verhalten sagt man auch: a ist ein Sattelpunkt.
(ii) Ist .grad f /a D 0 und .Hf /a semidefinit, so ist mit .Hf /a alleine keine Entscheidung möglich. Beweis. Zu (i): Bei einer lokalen Extremalstelle ist nach Satz D die Hesse-Matrix zwangsläufig semidefinit. Dann kann sie aber nicht indefinit sein. Man beachte: Semidefinit ist die genaue logische Verneinung von indefinit!
z
y
x Sattelpunkt
95
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
Zu (ii): Wir werden gleich an den Beispielen in R sehen, dass bei semidefiniter Hesse" Matrix sowohl Extrema wie auch keine Extrema vorliegen können. Feststellung der Definitheit Wir beschreiben zunächst ein elementares Rechenschema, einen Algorithmus, mit dem man die Definitheitseigenschaften einer quadratischen Form ermitteln kann. Die gegebene Form Q W Rn ! R sei explizit dargestellt durch (1)
Q.h/ D
n X
gij hi hj ;
gij D gj i ;
h D .h1 ; : : : ; hn /:
i;j D1
Die Terme mit i D j heißen rein (quadratisch), die mit i ¤ j gemischt (quadratisch). Wenn es keine rein quadratischen Terme gibt, ist das Definitheitsverhalten von vornherein klar: I. Lemma. Eine Form Q ¤ 0 (1), die nur gemischt quadratische Terme enthält, ist stets indefinit. Beweis. Ist gi i D 0 für alle i 2 f1; : : : ; ng und etwa gpq ¤ 0, so gilt für die entsprechenden Standardbasisvektoren ep ; eq : Q.ep C eq / D 2gpq , Q.ep % eq / D %2gpq , sodass Q Werte unterschiedlichen Vorzeichens annimmt. " Es reicht also, den Fall weiter zu behandeln, dass wirklich reine Terme vorkommen. Das Ziel ist dann, folgende Gestalt zu erreichen: (2) Q.h/ D ˇ1 .h1 C˛12 h2 C' ' 'C˛1n hn /2 Cˇ2 .h2 C˛23 h3 C' ' 'C˛2n hn /2 C' ' 'Cˇn h2n :
Jede nachfolgende Klammer enthält eine Variable hi weniger. (Dabei dürfen die Variablen auch permutiert werden.) Unter gewissen Voraussetzungen ist dieses Ziel erreichbar durch ein rekursives Verfahren, dessen Schritte auf der quadratischen Ergänzung beruhen. J. Lemma. Ist für die quadratische Form Q (1) die Voraussetzung g11 ¤ 0 erfüllt, so besteht eine Darstellung der Gestalt (3)
12 / n n X 1 X e g ij hi hj C g1j hj Q.h/ D g11 h1 C g11 j D2
i;j D2
mit symmetrischen Koeffizienten e g ij D e gj i für i; j 2 f2; : : : ; ng.
96
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Beweis. Der Ausdruck in (1) kann folgendermaßen umgeformt werden, indem man alle Terme, die h1 enthalten, zusammenschreibt: 1 / n n X 2 X 2 Q.h/ D g11 h1 C g1j h1 hj C gij hi hj g11 / D g11 %
j D2
h21
1 g11
i;j D2
n n 3 1 X .2 1 1 X C 2h1 ' g1j hj C g1j hj g11 g11
/X n
j D2
g1j hj
j D2
12
C
j D2
n X
gij hi hj :
i;j D2
Fasst man nun die beiden letzten Summen mit neuen symmetrischen Koeffizienten zusammen, so folgt die Behauptung. " Das Lagrange-Verfahren besteht nun in der rekursiven Anwendung von Lemma J: Enthält die letzte Summe in (3) noch reine Terme, so kann man mit ihr genauso weitermachen, usw. Ist im Verlauf dieser Schritte für einige Variable die spezielle Klammergestalt (2) erreicht und sind dann nur noch gemischte Glieder für die restlichen Variablen vorhanden, so ist die Form ebenfalls indefinit. Man kann nämlich den Unterraum betrachten, der durch Nullsetzen der erreichten Klammern definiert ist, und auf diesem für den verbleibenden quadratischen Ausdruck das Lemma I anwenden. Eine Permutation der Variablen muss man natürlich zulassen, da vielleicht schon im ersten Schritt g11 D 0 aber ein anderes gpp ¤ 0 ist, und entsprechend bei den späteren Schritten. Insgesamt ergibt sich schon im Verlauf des Verfahrens, dass die Form indefinit ist, oder die Gestalt (2) ist (nach eventueller Permutation der Variablen) vollständig erreichbar. In diesem zweiten Fall kann man die Definitheit anhand der Koeffizienten ˇi abklären: K. Satz (Lagrange-Kriterium). Besitzt die quadratische Form Q die Darstellung (2), so gelten die Äquivalenzen: (i)
Q > 0 () alle ˇi > 0;
(ii)
Q $ 0 () alle ˇi $ 0;
(iii) Q < 0 () alle ˇi < 0; (iv)
Q 0 0 () alle ˇi 0 0;
(v)
Q indefinit () ein ˇi > 0, ein anderes ˇj < 0.
Beweis. Man betrachtet die lineare Abbildung L W Rn ! Rn , definiert durch die
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
97
Abbildungsgleichungen k1 ´ h1 C ˛12 h2 C ' ' ' C ˛1n hn k2 ´ h2 C ˛23 h3 C ' ' ' C ˛2n hn :: : kn ´ hn : Da diese Gleichungen rekursiv (von unten nach oben) nach den hi aufgelöst werden können, ist L bijektiv. Dann hat die Form e 1 ; : : : ; kn / ´ ˇ1 k12 C ' ' ' C ˇn kn2 Q.k e ist laut (2) für k D L.h/ den gleichen Wert wie Q für h. Das Werteverhalten von Q aber unmittelbar an den ˇi ablesbar. " L. Beispiele. (i)
Sei n D 3 und Q wie in der ersten Zeile vorgegeben. Dann läuft das LagrangeVerfahren folgendermaßen: Q.h/ ´ ´ h21 C 4h22 C 11h23 % 2h1 h2 % 4h1 h3 C 10h2 h3 D h21 % 2h1 h2 % 4h1 h3 C 4h22 C 11h23 C 10h2 h3 D h21 % 2h1 .h2 C 2h3 / C .h2 C 2h3 /2 % .h2 C 2h3 /2 C 4h22 C 11h23 C 10h2 h3 D .h1 % .h2 C 2h3 //2 C 3h22 C 6h2 h3 C 7h23 D .h1 % h2 % 2h3 /2 C 3.h22 C 2h2 h3 C h23 / % 3h23 C 7h23 D .h1 % h2 % 2h3 /2 C 3.h2 C h3 /2 C 4h23 : Hierbei werden zunächst die h1 -Terme gesammelt, sodann diese quadratisch ergänzt, dann die h2 -Terme gesammelt und diese quadratisch ergänzt, usw. In diesem Beispiel ist also ˇ1 D 1, ˇ2 D 3, ˇ3 D 4, somit Q > 0.
(ii) Sei n D 3 und Q wie in der ersten Zeile vorgegeben. Dann läuft die quadratische
98
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Ergänzung zunächst folgendermaßen: Q.h/ ´ ´ h21 C h22 C 4h23 % 2h1 h2 % 4h1 h3 C 10h2 h3 D h21 % 2h1 h2 % 4h1 h3 C h22 C 4h23 C 10h2 h3 D h21 % 2h1 .h2 C 2h3 / C .h2 C 2h3 /2 % .h2 C 2h3 /2 C h22 C 4h23 C 10h2 h3 D .h1 % .h2 C 2h3 //2 C 6h2 h3 : Bezüglich h2 ; h3 ist jetzt keine quadratische Ergänzung möglich. Aber man sieht ohne weitere Umformung, dass die Form indefinit ist: Für h1 D h2 C 2h3 wird die erste Klammer 0, und wenn zusätzlich .h2 ; h3 / D .1; 1/ bzw. .h2 ; h3 / D .1; %1/ gewählt wird, ist der Wert von Q gleich 6 bzw. %6. Den gleichen Zweck der Definitheitsermittlung erfüllen zwei weitere Resultate, die zusätzliche Hilfsmittel aus der linearen Algebra erfordern. Es handelt sich dabei nicht um Algorithmen, wie oben beim Lagrange-Verfahren, sondern um fertige Formeln. Die Begründungen seien hier nur skizziert; sie werden ausführlich in der linearen Algebra behandelt. Zunächst existiert ein Verfahren mit Determinanten: Man bildet aus der Koeffizientenmatrix 1 0 g11 : : : g1n B :: C 2 R.n;n/ ; gij D gj i G D @ ::: : A gn1
: : : gnn
die folgenden n Determinanten nach dem Linksoben-Schema: ˇ ˇ ˇg11 : : : g1k ˇ ˇ ˇ ˇ :: ˇ ; k D 1; : : : ; n: Dk ´ ˇ ::: : ˇˇ ˇ ˇgk1 : : : gkk ˇ Es sind dies die Abschnittsdeterminanten von G. (Natürlich ist einfach D1 D g11 .) Dann gilt: M. Satz (Determinanten-Kriterium). Ist Q eine quadratische Form mit der symmetrischen Koeffizientenmatrix G, so gelten folgende Schlüsse: (i)
Q > 0 () alle Dk > 0;
(ii)
Q $ 0 H) alle Dk $ 0;
99
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
(iii) Q < 0 () alle .%1/k Dk > 0; (iv)
Q 0 0 H) alle .%1/k Dk $ 0;
(v)
Q indefinit (H es gibt k; ` mit Dk < 0, .%1/` D` < 0.
Insbesondere: Gilt Dk < 0 für einen geraden Index k, so ist Q indefinit. Die „Stammaussage“ ist der Teil (i). Man findet seinen Beweis etwa bei Gantmacher[1958], Kap. X, §4 oder in Walter[1996], Abschnitt 5.2, Satz H. Das Vorzeichen im Fall (iii) kommt von der generellen Äquivalenz: Q < 0 () %Q > 0 und dem Verhalten der Unterdeterminanten bei Vorzeichenwechsel aller Einträge. Der Fall (ii) e ergibt sich durch Betrachtung der Formen Q.h/ ´ Q.h/ C " hh; hi für " > 0, und Grenzübergang " # 0. Bei (iv) hilft wieder die Äquivalenz Q 0 0 () %Q $ 0. Schließlich entsteht (v) mittels Verneinungstechnik aus (ii) und (iv); denn „indefinit“ ist exakt die Negation von „semidefinit“. Warnung: Man beachte, dass nicht alle Schlüsse Äquivalenzen sind. Denn bei den „einseitigen“ Pfeilen gilt nicht die Umkehrung, wie in dem folgenden Gegenbeispiel O zu sehen ist. Somit bietet das Determinanten-Kriterium nicht die volle Information wie das Lagrange-Kriterium K. N. Beispiele. (i)
Sei Q wie in Beispiel L(i). Die Koeffizientenmatrix lautet 1 1 %1 %2 4 5 A G D @ %1 %2 5 11 0
Vorsicht: Die gemischten Koeffizienten halbieren sich gegenüber der Darstellung der quadratischen Form! Vgl. Bemerkung B.
Die drei Abschnittsdeterminanten berechnet man als ˇ ˇ 1 %1 D1 D det.1/ D 1 > 0; D2 D ˇˇ %1 4 ˇ ˇ ˇ 1 %1 %2 ˇ ˇ ˇ 4 5 ˇˇ D 12 > 0: D3 D ˇˇ %1 ˇ %2 5 11 ˇ
ˇ ˇ ˇ D 3 > 0; ˇ
Somit ist G > 0 in Übereinklang mit Beispiel L(i). (ii) Sei Q wie in Beispiel L(ii). Die Koeffizientenmatrix lautet 0
1 1 %1 %2 1 5 A: G D @ %1 %2 5 4
100
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
Die drei Abschnittsdeterminanten sind
ˇ ˇ ˇ 1 %1 ˇ ˇ D 0; D1 D det.1/ D 1; D2 D ˇˇ %1 1 ˇ ˇ ˇ ˇ 1 %1 %2 ˇ ˇ ˇ 1 5 ˇˇ D %9: D3 D ˇˇ %1 ˇ %2 5 4 ˇ
Es ist D3 < 0 und .%1/1 D1 < 0, die Matrix also indefinit in Übereinklang mit Beispiel L(ii). O. Beispiel. Sei wieder n D 3 und G die Hauptdiagonalmatrix 1 0 0 A: GD@ 1 %1 Hier ist D1 D D2 D D3 D 0. Die Matrix ist aber indefinit; denn die quadratische Form hat auf e2 den Wert 1 und auf e3 den Wert %1. Somit kann keiner der drei einseitigen Pfeile im Determinanten-Kriterium M umkehrbar sein. Schließlich gibt es noch ein Kriterium mittels Eigenwerten: Man berechnet die Eigenwerte der Koeffizientenmatrix G, d.h. die Lösungen der charakteristischen Gleichung: ˇ ˇ ˇg11 % + g12 ''' g1n ˇˇ ˇ ˇ g21 g22 % + ' ' ' g2n ˇˇ ˇ -.+/ ´ det.G % +E/ D ˇ : ˇ D 0: : :: :: ˇ ˇ :: : ˇ ˇ ˇ gn1 gn2 ' ' ' gnn % +ˇ (E die Einheitsmatrix.) Bei einer symmetrischen reellen Matrix G hat die charakteristische Gleichung reelle Lösungen +1 ; : : : ; +n (jede entsprechend ihrer Vielfachheit aufgeführt). P. Satz (Eigenwert-Kriterium). Ist Q W Rn ! R eine quadratische Form mit der symmetrischen Koeffizientenmatrix G und deren Eigenwerten +1 ; : : : ; +n , so gelten folgende Äquivalenzen (genau wie beim Lagrange-Kriterium K): (i)
Q > 0 () alle +i > 0;
(ii)
Q $ 0 () alle +i $ 0;
(iii) Q < 0 () alle +i < 0; (iv)
Q 0 0 () alle +i 0 0;
(v)
Q indefinit () ein +i > 0, ein anderes +j < 0.
101
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
In der Tat kann der Beweis auf die Aussage beim Lagrange-Verfahren zurückgeführt werden. Denn die so genannte Hauptachsentransformation der linearen Algebra besagt, dass die Form Q nach einem orthogonalen Wechsel zu neuen Koordinaten ki dargestellt wird durch +1 k12 C ' ' ' C +n kn2 : Vgl. z.B. Greub[1976], Kap. 7, §2 oder Walter[1993], Abschnitt 2.2. Das Problem hierbei ist allerdings die Berechnung der Eigenwerte. Das ist i. Allg. nur numerisch, jedoch nicht exakt möglich, da es keine Lösungsformeln für algebraische Gleichungen des Grades $ 5 gibt. Q. Beispiele. (i)
Sei Q wie in Beispiel L(i) und N(i). Das charakteristische Polynom ist ˇ ˇ ˇ1 % + ˇ %1 %2 ˇ ˇ ˇ 4%+ 5 ˇˇ D %+3 C 16+2 % 29+ C 12: -.+/ D ˇ %1 ˇ %2 5 11 % +ˇ Das Lemma von Gauß O[3.1] zeigt, dass keine rationalen Nullstellen existieren. Eine numerische Nullstellenberechnung von - liefert (auf sechs Stellen genau) +1 1 0;613472;
+2 1 1;39838;
+3 1 13;9881:
Somit ergibt sich auch hier Q > 0. (ii) Sei Q wie in L(ii) und N(ii). Das charakteristische Polynom ist ˇ ˇ ˇ1 % + %1 %2 ˇˇ ˇ 1%+ 5 ˇˇ D +3 % 6+2 % 21+ C 9: -.+/ D ˇˇ %1 ˇ %2 5 4 % +ˇ Auch hier existieren keine rationalen Nullstellen. Numerisch ergibt sich +1 1 %2;76655;
+2 1 0;388284;
+3 1 8;37827:
Die Form ist auch hiernach indefinit. Die drei Verfahren zur Definitheitsbestimmung sind in der obigen Reihenfolge monoton wachsend bzgl. der Komplexität: Das Lagrange-Kriterium ist ganz elementar und universell. Die Determinanten- und Eigenwert-Kriterien sind aufwendiger (vor allem bei großen n) wegen der Determinantenberechnungen, und beim EigenwertKriterium ist i. Allg. zusätzlich Numerik erforderlich. Das Determinanten-Kriterium ist wegen der genannten Misslichkeiten beim semidefiniten Fall weniger zu empfehlen. Die Gleichartigkeit des Lagrange- und des Eigenwert-Verfahrens beruht letzten Endes darauf, dass eine Diagonalisierung der quadratischen Form vorgenommen
102
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
wird, beim Lagrange-Verfahren mittels eines linearen Koordinatenwechsels, beim Eigenwert-Verfahren mittels eines orthogonalen Koordinatenwechsels. Ein solcher ist aber tatsächlich mit übertriebenem Aufwand verbunden, wenn es nur darum geht, die Definitheit abzuklären. R. Beispiele. Es folgen zwei Beispiele, die zeigen, dass aus einer semidefiniten Hesse-Form nichts über das Extremalverhalten geschlossen werden kann. In beiden Fällen ist n D 2. (i)
Funktion und Stelle seien f W R2 ! R;
f .x; y/ ´ x 2 C y 3 ;
a ´ .0; 0/;
f .a/ D 0:
Gradient und Hesse-Matrix lauten .grad f /.x;y/ D .2x; 3y 2 / .Hf /.x;y/
/ 1 2 0 D 0 6y
.0; 0/
in a:
/ 1 2 0 $ 0: 0 0
Obwohl die Hesse-Form positiv semidefinit ist, zeigt die Funktion ein sattelartiges Verhalten in jeder Umgebung von a. Tatsächlich ist ja f .x; y/ > 0, wenn p p 3 3 y > % x 2 , und f .x; y/ < 0, wenn y < % x 2 , und beides ist für beliebig kleine jxj; jyj möglich. (ii) Funktion und Stelle seien f W R2 ! R;
f .x; y/ ´ x 2 C y 4 ;
a ´ .0; 0/;
f .a/ D 0:
Gradient und Hesse-Matrix lauten .grad f /.x;y/ D .2x; 4y 3 / /
.Hf /.x;y/
2 D 0
0 12y 2
1
in a:
.0; 0/ / 1 2 0 $ 0: 0 0
Sie haben in a genau die gleichen Werte wie bei (i). Das Verhalten von f ist aber jetzt ganz anders; denn es gilt f .x; y/ > 0 für alle .x; y/ 2 R2 außer für .x; y/ D .0; 0/: Der Punkt a ist eine absolute strikte Minimalstelle.
103
Abschnitt 10.8 Extrema bei mehreren Veränderlichen
Sattelpunkt bzw. striktes Minimum bei gleicher semidefiniter Hesse-Form
Aufgaben und Anmerkungen 1. Man bestimme alle lokalen Extrema der folgenden Funktionen a) f W R2 ! R mit f .x; y/ ´ .4x 2 C y 2 /e &x 3
3
2
2 &4y 2
.
3
b) f W R ! R mit f .x; y; z/ ´ 2x % 3x C 2y C 3y 2 C .x % z/2 . 2. Sei f W R2 ! R gegeben durch f .x; y/ ´ y 2 % .2x C 1/.x % 1/2 . Man zeige: a) f hat genau ein striktes lokales Minimum. b) f ist unbeschränkt nach unten. c) f hat kein lokales Maximum. Man studiere das qualitative Verhalten der Funktion (z.B. so): Man skizziere die Höhenlinien f.x; y/ 2 R2 j f .x; y/ D cg; c 2 R; insbesondere soll der entstehende „See“ eingezeichnet werden. Zusatzfrage: Gibt es eine stetige Funktion f W R ! R mit den obigen Eigenschaften a) - c)? 3. Es sei f W R ! R eine differenzierbare Funktion, deren Ableitung genau in a eine Nullstelle habe. Man zeige: Ist a lokale Minimalstelle von f , so ist a sogar absolute Minimalstelle von f . Durch Betrachtung von f .x; y/ ´ 2x 3 C 3e 2y % 6xe y verifiziere man, dass dies i. Allg. nicht für differenzierbare Funktionen f W Rn ! R gilt, wenn n > 1. 4. Sei A - Rn offen, a 2 A; r 2 N ungerade. Man zeige: Ist f W A ! R r-mal stetig differenzierbar und ist die erste nichtverschwindende partielle Ableitung von f in a von r-ter Ordnung, so ist a keine lokale Extremalstelle von f .
104
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
5. # Sei A eine konvexe Teilmenge von Rn und f W A ! R eine reelle Funktion. Man beweise: a) Ist f konvex, so ist f ist stetig. b) Ist f konvex, so kann kein a 2 A absolute Maximalstelle von f sein, es sei denn, f ist konstant. 6. # Ein komplettes (d.h. notwendiges und hinreichendes) Determinantenkriterium für die Semidefinitheit einer quadratischen Form Q ist möglich, wenn man neben den Abschnittsdeterminanten die so genannten Hauptminoren der symmetrischen Koeffizientenmatrix G betrachtet. Diese entstehen, indem man für jedes k 2 f1; 2; : : : ; ng und jede Indexfolge i1 < i2 < ' ' ' < ik in f1; 2; : : : ; ng die Zeilen und Spalten von G streicht, deren Nummern von den i` verschieden sind und jeweils die Determinante des verbleibenden quadratischen Schemas bildet: ˇ ˇ ˇ gi1 i1 : : : gi1 i ˇ kˇ ˇ ˇ :: ˇ : Di1 ;i2 ;:::;ik ´ ˇ ::: : ˇˇ ˇ ˇgi i : : : gi i ˇ k 1
k k
Die Abschnittsdeterminanten sind die Spezialfälle der Hauptminoren für i1 D 1, i2 D 2,. . . , ik D k. Dann gilt: a) Q ist positiv semidefinit genau dann, wenn stets Di1 ;i2 ;:::;ik $ 0 gilt. b) Q ist negativ semidefinit genau dann, wenn stets .%1/k Di1 ;i2 ;:::;ik $ 0 gilt. In jedem der beiden Fälle sind das jeweils 2n % 1 skalare Bedingungen an die Einträge gij von G (im Gegensatz zu den n Bedingungen von Satz M). Für einen Beweis mittels einer „Stetigkeitsmethode“ vgl. Gantmacher[1958], Kap. X, §4. Dabei ist wichtig, dass Di1 ;i2 ;:::;ik die Gramsche Determinante der Restriktion von Q auf den Spann der Standardbasisvektoren ei1 ; ei2 ; : : : ; eik ist. Als rein logische Konsequenz von a) und b) ergibt sich noch: c) Q ist indefinit genau dann, wenn einmal Di1 ;i2 ;:::;ik .%1/` Dj1 ;j2 ;:::;j` < 0 ist.
r zu A gehört. In den anderen drei Fällen ˛ D %1 oder ! D 1 schließt man mit leichten Abänderungen ebenfalls auf 2˛; !Œ - A. Für A selbst bleibt dann nur noch die Möglichkeit, gleich 2˛; !Œ oder Œ˛; !Œ oder 2˛; !2 oder Œ˛; !2 zu sein, wobei im Falle ˛ D %1 die zweite und vierte Möglichkeit entfallen und im Falle ! D 1 die dritte und vierte. " Genauso erkennt man, dass auch die konvexen Teilmengen von R genau die Intervalle sind. Folgende Invarianzeigenschaften sind generell leicht einzusehen:
110
Kapitel 10 Differentialrechnung mehrerer Veränderlicher
H. Satz. Sei F W X ! Y eine stetige Abbildung zwischen metrischen Räumen. Dann gilt: (i)
Ist X zusammenhängend, so ist auch F .X/ zusammenhängend.
(ii) Ist X wegzusammenhängend, so ist auch F .X/ wegzusammenhängend. Beweis. O.B.d.A. kann F als surjektiv angenommen werden (da für das Bild die Relativtopologie genommen werden muss). Zu (i): Ist B - Y zugleich offen und abgeschlossen und ¤ ¿, so trifft dasselbe für das Urbild F &1 .B/ - X zu (G[6.2]). Dann ist F &1 .B/ D X, also B D Y . Zu (ii): Sind P; Q 2 Y gegeben, so seien dazu Urbildpunkte p; q 2 X gewählt: F .p/ D P , F .q/ D Q, und es sei 1 ein Weg in X von p nach q. Dann ist F ı 1 ein Weg in Y von P nach Q. " Wichtige invariante Begriffe, die man sich einprägen sollte, sind damit: die Kompaktheit, der Zusammenhang und der Wegzusammenhang, jeweils unter stetigen Abbildungen. Aus diesen allgemeinen Resultaten folgt jetzt z.B. direkt, dass das Bild eines Intervalls unter einer stetigen R-wertigen Abbildung wiederum ein Intervall ist, also der Zwischenwertsatz. Tatsächlich gilt im Gefolge der Sätze G und H: I. Folgerung (allgemeiner Zwischenwertsatz). Sei X ein zusammenhängender metrischer Raum und f W X ! R eine stetige Funktion. Dann ist das Bild f .X/ ein Intervall. Also gibt es zu je zwei Punkten p; q 2 X mit f .p/ ¤ f .q/ und jeder reellen Zahl w zwischen f .p/ und f .q/ stets eine Punkt z 2 X mit f .z/ D w. " Aufgaben und Anmerkungen 1. Sei X ein metrischer Raum, f W X ! R eine stetige Funktion und 1 W Œa; b2 ! X ein Weg in X. Zeige: Ist f .1.a// ¤ f .1.b//, so gibt es zu jeder reellen Zahl w zwischen f .1.a// und f .1.b// eine Stelle * 2 2a; bŒ mit f .1.* // D w. 2. Seien X und Y (nichtleere) metrische Räume. Beweise: a) Das kartesische Produkt X ( Y ist dann und nur dann wegzusammenhängend, wenn X und Y beide wegzusammenhängend sind. b) Das kartesische Produkt X ( Y ist dann und nur dann zusammenhängend, wenn X und Y beide zusammenhängend sind. 3. # Seien A und B zusammenhängende Teilmengen des metrischen Raums X mit A \ B ¤ ¿. Zeige, dass A [ B zusammenhängend ist.
11 Integralrechnung mehrerer Veränderlicher Wir kommen nun zum zweiten Schwerpunkt der mehrdimensionalen Analysis, der Integralrechnung. Das bisherige Integral bezog sich auf stetige reelle Funktionen, die auf einem kompakten Intervall definiert sind. Für viele Fragen reicht dieser Integralbegriff aus, z.B. für die Beziehung zur Differentialrechnung in Form des Hauptsatzes der Differential- und Integralrechnung oder, im Gefolge davon, zur Darstellung des Restglieds in der Taylor-Formel. Weitergehende Probleme in der Mathematik und den Anwendungen verlangen jedoch eine deutliche Erweiterung des Integralbegriffs. Zum einen sollte man sich von der doch recht engen Klasse der stetigen Funktionen lösen. Zum anderen können die Integrationsmengen mehrdimensional viel allgemeiner sein als die Intervalle in R. Schon Teilmengen in R2 oder R3 legen einen großen Formenreichtum an den Tag (krummlinig begrenzte Bälle, Kegel, Tori usw.). Schließlich hat man auch vektorwertige Funktionen zu integrieren, z.B. bei der Schwerpunktberechnung von Körpern. All dies unter einen Hut zu bringen, ist das Ziel dieses Kapitels. Nach Möglichkeit sollte dabei, wie in der Differentialrechnung, eine basisfreie Behandlung angestrebt werden, zumindest was die grundlegenden Dinge angeht. Wir entwickeln hier den Integralbegriff im Lebesgueschen Sinne, ausgehend von den auf einem Intervall definierten stetigen, vektorwertigen Funktionen. Das Integral einer solchen Funktion ist durch einfache Eigenschaften festgelegt, genau wie im reellwertigen Fall in Abschnitt 5.1. Daran schließen sich einige Erweiterungsschritte einfacher Natur, nämlich die Ausdehnung auf mehrdimensionale „Intervalle“, die so genannten Quader, sowie auf den gesamten Rn als Definitionsmenge für stetige Funktionen, die „weit draußen“ auf null abklingen, die stetigen Funktionen mit kompaktem Träger. Der wirklich entscheidende Schritt ist dann die Approximation allgemeinerer Funktionen durch stetige Funktionen mit kompaktem Träger. Wählt man diese Approximation in der „richtigen“ Art und Weise, so gelangt man mit einem Schlag zum LebesgueIntegral (oder, in der vektorwertigen Variante, zum so genannten Lebesgue/BochnerIntegral). Darin enthalten sind speziell die Fragen der Volumenbestimmung von Teilmengen des Rn , die so genannte Maßtheorie, ohne dass es eines eigenen Aufwands dafür bedarf. Im ganzen Kapitel bezeichnet W einen Banach-Raum mit der Norm k k. Wir betrachten Funktionen F W M ! W , wobei M eine Teilmenge von Rn ist. Die skalare Theorie ist hierin als Sonderfall für W D R mit dem Betrag j j als Norm enthalten. Wer will, kann sich unter W zunächst R vorstellen. Der folgende Aufbau wird aber durch die allgemeinere Zielmenge W nicht schwieriger. Tatsächlich befreit man sich durch den Übergang zu W -wertigen Funktionen von speziellen Eigenschaften von R, die für die Grundlegung unwesentlich sind.
112
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Allgemeine Bezeichnungen: Für eine Abbildung F W X %! W , wobei X irgendeine Menge sein darf, sei die Normabbildung definiert durch kF k W X %! R; sowie die Größe
x 7%! kF .x/k
ˇ ˚ , kF k1 ´ sup kF .x/k ˇ x 2 X :
kF k ist eine R-wertige Abbildung, nicht eine Norm, kF k1 ist entweder eine nichtnegative reelle Zahl oder (bei unbeschränkter Funktion F ) 1.
11.1
Stetige Abbildungen kompakter Intervalle
Genau wie in Abschnitt 5.1 betrachten wir kompakte Intervalle J D Œ˛; ˇ2 ) R mit ˛ 0 ˇ und darauf stetige Abbildungen F W J ! W . Das einzig Neue ist, dass der dortige Zielraum R durch W ersetzt ist. Das Vorgehen selbst ist identisch mit dem früheren. Wir betrachten nämlich wieder eine Zuordnung .J; F / 7! Int.J; F / 2 W und fordern folgende Eigenschaften; (J.1) Zerlegungsregel: Ist ˛ 0 1 0 ˇ, so gilt: Int.Œ˛; ˇ2; F / D Int.Œ˛; 1 2; F / C Int.Œ1; ˇ2; F /. (J.2) Abschätzungsregel: kInt.J; F /k 0 Int.J; kF k/. (J.3) Linearität: Bei festem J und W ist die Zuordnung F 7! Int.J; F / linear. (J.4) Normierung: Für konstantes c 2 W gilt: Int.Œ˛; ˇ2; c/ D .ˇ % ˛/ ' c. A. Bemerkung (zur Koinzidenz). Im Falle W D R sind die Regeln (J.1) bis (J.4) äquivalent mit den Regeln (I.1) bis (I.4) aus Abschnitt 5.1, wie schon in B(ii)[5.1] erkannt wurde. B. Satz (Eindeutigkeit und Existenz). Es gibt genau eine Zuordnung mit den Eigenschaften (J.1) bis (J.4). Beweis. Dieser verläuft völlig analog zu 5.1: Man hat lediglich den Betrag durch die Norm zu ersetzen. Mit anderen Worten: Wir haben den damaligen Beweis bereits so gestaltet, dass diese Übertragung jetzt reibungslos funktioniert. Es reicht daher, den Beweisgang zu skizzieren: Zur Eindeutigkeit: Bei W D R kommt man auf die alte Kennzeichnung zurück (vgl. Bemerkung A), also gilt: Z (1)
für stetiges f W Œ˛; ˇ2 %! R ist zwangsläufig Int.Œ˛; ˇ2; f / D
˛
ˇ
f .t/ dt:
113
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
In der allgemeinen Situation folgt daraus mittels (J.2): Z ˇ (2) kF .t/k dt 0 kF k1 ' .ˇ % ˛/: kInt.J; F /k 0 Int.J; kF k/ D ˛
Zur Funktion F W Œ˛; ˇ2 ! W definieren wir nun eine Abbildung ˆ W Œ˛; ˇ2 ! W als ˆ.t/ ´ Int.Œ˛; t2; F /. Dann folgt durch Berechnung des Differenzenquotienten von ˆ genau wie in C[5.1]: ˆ0 .t/ D F .t/ für alle t 2 Œ˛; ˇ2. Man braucht an Ungleichungen dazu lediglich Anfang und Ende von (2). Dann ist ˆ nach E[10.3] eindeutig bestimmt, da ˆ.˛/ D 0. Zur Existenz: Auch der Existenzbeweis aus Abschnitt 5.1 kann ohne nennenswerte Änderung übernommen werden. Wie dort betrachtet man stückweise konstante FunktionenF W Œ˛; ˇ2 ! W , die so genannten Treppenfunktionen (natürlich jetzt mit Werten in W statt in R). Ist F eine solche Treppenfunktion und Z D ft0 ; t1 ; : : : ; tk g mit ˛ D t0 < t1 < ' ' ' < tn D ˇ eine zugehörige Zerlegung des Intervalls Œ˛; ˇ2, sodass F auf dem Teilintervall 2tk&1 ; tk Œ den konstanten Wert ck 2 W annimmt, so wird das Integral von F definiert als die endliche Summe: Z ˇ n X ck ' .tk % tk&1 /: F ´ ˛
kD1
Diese Festlegung ist in Wirklichkeit unabhängig von der Wahl einer solchen Zerlegung. Bei festem Intervall bilden die Treppenfunktionen F W Œ˛; ˇ2 ! W einen reellen Vektorraum, und als Funktion des Paars .Œ˛; ˇ2; F / besitzt diese Definition bereits die Eigenschaften (J.1) bis (J.4). Um nun eine stetige Funktionen F W Œ˛; ˇ2 ! W zu erfassen, überlegt man genau wie bei I[5.1], dass F beliebig genau und gleichmäßig durch Treppenfunktionen angenähert werden kann, d.h. zu jedem " > 0 existiert eine Treppenfunktion G W Œ˛; ˇ2 ! W derart, dass für alle t 2 Œ˛; ˇ2 gilt: kF .t/ % G.t/k 0 ": Dann kann man eine beliebige Nullfolge ."k / in RC wählen, zu jedem k eine Treppenfunktion Fk bestimmen mit kF .t/ % Fk .t/k < "k
für alle t 2 Œ˛; ˇ2
und Int.Œ˛; ˇ2; F / festsetzen durch Z (3)
Int.Œ˛; ˇ2; F / ´ lim
k!1 ˛
ˇ
Fk :
Dieser Grenzwert existiert als Element von W , wobei es gerade an dieser Stelle wich-
114
Kapitel 11 Integralrechnung mehrerer Veränderlicher
tig ist, dass sich der frühere Beweis auf die Vollständigkeit von .R; j j/ gestützt hat. So kann man das direkt hier übernehmen. Dasselbe gilt auch für die Tatsache, dass die Festlegung (3) unabhängig von den getroffenen Wahlen ist und dass die obigen Regeln (J.1) bis (J.4) für Treppenfunktionen nunmehr per Grenzübergang auch für stetige Abbildungen gültig bleiben. Wie gesagt, all dies läuft genau wie im skalaren Fall (A[5.1] bis L[5.1]).
"
Wiederum sei betont, dass die weitere Entwicklung der Integralrechnung alleine auf den Regeln (J.1) bis (J.4) beruht. Von den Einzelheiten des Existenzbeweises (der auch auf andere Weise hätte geführt werden können) wird kein Gebrauch gemacht. C. Definition und Satz. Das nach Satz B zu jeder stetigen Funktion F W Œ˛; ˇ2 ! W eindeutig bestimmte Element Int.Œ˛; ˇ2; F / 2 W heißt das Integral von F über Œ˛; ˇ2, geschrieben: Z ˇ (4) F .t/ dt ´ Int.Œ˛; ˇ2; F /: ˛
Hierfür gelten folgende Regeln: (i) (ii)
Koinzidenz mit dem bisherigen Integral für W D R, entsprechend (1); Z ˇ Z . Z ˇ Zerlegungsregel: F .t/ dt D F .t/ dt C F .t/ dt für ˛ 0 1 0 ˇ; ˛
˛
.
- Z -Z - ˇ ˇ F .t/ dt - 0 (iii) Abschätzungsregel: kF .t/k dt 0 kF k1 ' .ˇ % ˛/; - ˛ ˛ Z ˇ Z ˇ Z ˇ G.t/ dt für reelle (iv) Linearität: .rF .t / C sG.t// dt D r F .t/ dt C s ˛
(v) (vi)
Konstanten r; s; Z Normierung:
˛
˛
ˇ
˛
c dt D .ˇ % ˛/ ' c für konstantes c 2 W ;
Hauptsatz der Differential- und Integralrechnung (HDI): /Z t 1 d F .*/ d * D F .t/ dt ˛ für ˛ 0 t 0 ˇ (einschließlich der weiteren Varianten analog zu F[5.2] und H[5.2]);
(vii) Transformationsformel: Z Z '.ˇ1 / F .t/ dt D '.˛1 /
ˇ1 ˛1
F .'.*// ' ' 0 .* / d *;
wobei ' W Œ˛1 ; ˇ1 2 ! Œ˛; ˇ2 von der Klasse C 1 ist mit '.˛1 / 0 '.ˇ1 /.
115
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
Beweis. (i) und (vi) wurden oben begründet. (ii) bis (v) sind lediglich Umschreibungen der Grundregeln mit der neuen Bezeichnung. (vii) folgt aus dem HDI (vi) genau wie in D[5.3]. " Soweit sinnvoll werden auch hier für das Integralsymbol in (4) weitere Schreibweisen und Namengebungen wie nach L[5.1] gebraucht, z.B. die argumentfreie Version Rˇ ˛ F. D. Bemerkungen. (i)
Sind c1 ; : : : ; cp 2 W fest gegeben und ist F W Œ˛; ˇ2 ! W von der Form F .t/ D f1 .t/ ' c1 C ' ' ' C fp .t/ ' cp
mit stetigen Funktionen fi W Œ˛; ˇ2 ! R, so ist F selbst stetig (Konsequenz aus der Stetigkeit der Operationen in W laut M[10.1] oder leichte Abschätzung von kF .t/ % F .t0 /k), und es gilt 0Z ! 0Z ! Z ˇ
˛
F .t/ dt D
ˇ
˛
f1 .t/ dt
' c1 C ' ' ' C
ˇ
˛
fp .t/ dt
' cp :
Tatsächlich gilt für alle t 2 Œ˛; ˇ2 1 1 /Z t /Z t Z t fp .*/ d * ' cp : f1 .*/ d * ' c1 C ' ' ' C F .*/ d * D ˛
˛
˛
Denn beide Seiten dieser Gleichung haben die gleiche Ableitung nach t (laut HDI und I[10.3]) und stimmen für t D ˛ überein, nämlich mit dem Wert 0. Also herrscht nach E[10.3] Gleichheit, speziell für t D ˇ. Dies ist insbesondere anwendbar, wenn der Zielraum W die endliche Dimension p besitzt und c1 ; : : : ; cp als Basis von W gewählt wird. In dieser Situation kann man also komponentenweise integrieren. Des weiteren ist hier die Stetigkeit von F äquivalent mit der Stetigkeit aller fi . Dies folgt aus der Stetigkeit der Projektionen auf die eindimensionalen Untervektorräume: Pi W W ! Rci , die sich aus D[10.4] ergibt. Außerdem erkennt man hieran die Koinzidenz mit der Integraldefinition in A[9.1]. (ii) Je zwei äquivalente Normen auf dem Zielraum W führen zur gleichen Klasse von stetigen Funktionen F W J ! W und zum gleichen Integral für diese. Das ergibt sich wiederum aus dem HDI (der für beide Integralbegriffe gilt). So wie hier hat der Hauptsatz der Differential- und Integralrechnung neben seiner grundsätzlichen Bedeutung die Rolle eines nützlichen Beweismittels, z.B. bei den folgenden zwei Sätzen.
116
Kapitel 11 Integralrechnung mehrerer Veränderlicher
E. Satz (Produktintegration). Seien W; T; Z Banach-Räume und B W W ( T ! Z ein stetiges vektorielles Produkt (B also bilinear und stetig). Dann gilt für je zwei stetig differenzierbare Funktionen F W Œ˛; ˇ2 ! W und G W Œ˛; ˇ2 ! T Z ˛
ˇ
ˇˇ Z ˇ B.F .t/; G .t// dt D B.F .t/; G.t//ˇˇ %
ˇ
0
˛
˛
B.F 0 .t/; G.t// dt:
Beweis. Wie in A[5.3] folgt dies aus der entsprechenden Differentiationsregel in I[10.3] durch Integration (in den dortigen Bezeichnungen): Z H.ˇ/ % H.˛/ D
ˇ ˛
H 0 .t/ dt D
Z
ˇ ˛
B.F 0 .t/; G.t// dt C
Z ˛
ˇ
B.F .t/; G 0 .t// dt:
Die erste Gleichung ergibt sich aus dem HDI. Umstellung liefert die Behauptung. " F. Satz. Sei L W W ! Z eine stetige lineare Abbildung zwischen Banach-Räumen W , Z. Dann gilt für jede stetige Funktion F W Œ˛; ˇ2 ! W 3Z L
ˇ ˛
. Z F .t/ dt D
ˇ
˛
L.F .t// dt:
Beweis. Mit F ist auch L ı F W Œ˛; ˇ2 ! Z stetig. Wieder mit dem HDI folgt für alle t 2 Œ˛; ˇ2 . Z t 3Z t L.F .t// dt: F .t/ dt D L ˛
˛
Denn die Ableitung der linken Seite nach t liefert genau dasselbe wie die der rechten Seite, nämlich L.F .t//. Da die beiden Seiten für t D ˛ null ergeben, folgt ihre Gleichheit, speziell für t D ˇ. " Der Hauptsatz der Differential- und Integralrechnung leistet in der Variante Z F .ˇ/ % F .˛/ D
˛
ˇ
F 0 .t/ dt
einen Aufbau der Differenz von Funktionswerten aus den Ableitungen „dazwischen“. Das ist ein Beispiel dafür, wie aus infinitesimalen Informationen globale Information gewonnen werden kann. Einen anschaulichen Hintergrund dafür hatten wir schon in Abschnitt 5.2 geschildert. Kombiniert man den HDI mit der Abschätzungsregel, so ergibt sich wie in E[9.1], aber nun allgemeiner:
117
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
G. Satz (vom endlichen Zuwachs oder Schrankensatz). Sei V normierter Vektorraum, A offen in V und G W A ! W stetig differenzierbar. Weiter seien a 2 A und v 2 V so gegeben, dass die Strecke von a nach a C v in A enthalten ist, d.h. a C tv 2 A für t 2 Œ0; 12. Dann gilt: (5) kG.a C v/ % G.a/k 0 max -G 0 .a C tv/- ' kvk t2Œ0;1-
(6)
-G.a C v/ % G.a/ % G 0 .a/v - 0 max -G 0 .a C tv/ % G 0 .a/- ' kvk : t2Œ0;1-
Beweis. Zu (5): Wir betrachten wieder die Einschränkung von G auf die Punkte der Strecke, d.h. die Hilfsfunktion F W Œ0; 12 ! W , definiert durch F .t/ ´ G.a C tv/. Ihre Ableitung ist nach C(i)[10.3]: F 0 .t/ D G 0 .a C tv/v, insbesondere ist diese stetig. Hieraus folgt (5) mittels HDI und Abschätzungsregel: -Z 1 0 F .t/ dt kG.a C v/ % G.a/k D kF .1/ % F .0/k D 0
Z 0
1
- 0 -F .t/- dt
1
- 0 -G .a C tv/v - dt
0
Z D
0
0 max -G 0 .a C tv/v - ' 1 t2Œ0;1-
0 max -G 0 .a C tv/- ' kvk : t2Œ0;1-
Zu (6): Dies ergibt sich durch Anwendung von (5) auf H W A ! W , definiert durch H.x/ ´ G.x/ % G 0 .a/x. Hierfür ist H 0 .x/ ´ G 0 .x/ % G 0 .a/. Es folgt der Reihe nach: kH.a C v/ % H.a/k 0 max -H 0 .a C tv/- ' kvk t 2Œ0;1-
-G.a C v/ % G 0 .a/.a C v/ % G.a/ C G 0 .a/a- 0 max -G 0 .a C t v/ % G 0 .a/- ' kvk : t 2Œ0;1-
Da sich in der Norm links G 0 .a/a heraushebt, verbleibt die Behauptung.
"
Der Name „Satz vom endlichen Zuwachs“ drückt genau das per Abschätzung aus, was zuvor als Übergang vom Infinitesimalen zum Globalen beschrieben wurde. Die Ungleichung (5) ist bei vektorwertigen Abbildungen ein Ersatz für den Mittelwertsatz der elementaren Differentialrechnung, der bei vektoriellen Werten nicht mehr anwendbar
118
Kapitel 11 Integralrechnung mehrerer Veränderlicher
ist: Bei der Schraubenlinie z.B. ist kein Tangentenvektor parallel zum Verbindungsvektor zweier in Achsrichtung übereinander liegender Punkte; vgl. B(ii)[9.1]. H . Bemerkung. Der Begriff des orientierten Integrals für eine stetige Funktion F W Œ˛; ˇ2 ! W besteht auch hier analog zu C[5.3]: Z ˇ
˛
Z F .t/ dt ´ %
˛
ˇ
F .t/ dt;
und die Regeln übertragen sich sinngemäß. Insbesondere bleibt die Transformationsformel aus C(vii) in der gleichen Formulierung erhalten, wenn die Voraussetzung '.˛1 / 0 '.ˇ1 / fallen gelassen wird. Das sieht man genau wie bei Satz D[5.3]. # Eine Anwendung auf die Injektivität Der Schritt von (5) zu (6) kann auch etwas flexibler gestaltet werden: Wählt man z.B. die Hilfsabbildung H des Beweises allgemeiner als H.x/ ´ G.x/ % Lx, wobei L W V ! W irgendeine stetige lineare Abbildung ist, so ergibt sich unter den gleichen Voraussetzungen an G W A ! W und A wie in Satz G die Abschätzung (7) kG.a C v/ % G.a/ % Lvk 0 max -G 0 .a C tv/ % L- ' kvk : t 2Œ0;1-
Ist T W W ! W eine toplineare Abbildung, so kann dies zusätzlich auf T &1 ı G oder auf G ı T &1 anstelle von G angewendet werden. Speziell im Fall V ´ W und L D I D Identität von W ergibt sich so: - &1 -T .G.a C v/ % G.a// % v - 0 max -T &1 G 0 .a C tv/ % I - ' kvk (8) t 2Œ0;1-
(9)
-.G.a C v/ % G.a//T &1 % v - 0 max -G 0 .a C tv/T &1 % I - ' kvk : t 2Œ0;1-
Diese Abschätzungen sind nützlich, um die Injektivität von G zu sichern. Man erhält so z.B. I. Satz. Sei A eine offene und konvexe Teilmenge von W und G W A ! W stetig differenzierbar. Gilt für eine toplineare Abbildung T W W ! W - &1 0 -T G .x/ % I - < 1 für alle x 2 A oder -G 0 .x/T &1 % I - < 1 für alle x 2 A; so ist G injektiv. Die vorausgesetzten Ungleichungen besagen, dass die Ableitungen G 0 .x/ nicht all zu sehr von einer fest gewählten toplinearen Abbildung T abweichen.
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
119
Beweis von I. Angenommen, es gäbe a; a C v 2 A mit v ¤ 0 und G.a C v/ D G.a/, so liegt die Verbindungsstrecke von a und a C v wegen der Konvexität ganz in A, und aus (8) und (9) folgte: 1 0 max -T &1 G 0 .a C tv/ % I - und 1 0 max -G 0 .a C tv/T &1 % I - : t2Œ0;1-
t 2Œ0;1-
Das ist in beiden Fällen ein Widerspruch zur Voraussetzung, da das Maximum hierin an einer Stelle aus Œ0; 12 angenommen wird. " Hinweis: Mit zusätzlichen Hilfsmitteln kann man zeigen, dass unter diesen Voraussetzungen weit mehr gilt, z.B. die Offenheit der Bildmenge F .A/. Vgl. Abschnitt 12.1 im endlich-dimensionalen Fall und Analysis 3 für allgemeine Banach-Räume. Aufgaben und Anmerkungen 1. Man überlege: Im Fall W D R (oder allgemeiner dim W < 1) ist der Integralbegriff unabhängig von der in W verwendeten Norm. 2. Für einen stetig differenzierbaren Weg 1 W Œa; b2 ! W besagt der Schrankensatz wie in E[9.1]: k1.b/ % 1.a/k 0 max -1 0 .t/- ' .b % a/: t2Œa;b-
a) Daraus folgere man für festes c 2 W : k1.b/ % 1.a/ % .b % a/ck 0 max -1 0 .t/ % c - ' .b % a/ t 2Œa;b-
-. k1.b/ % 1.a/k $ kck % max -1 0 .t/ % c - ' .b % a/ 3
t2Œa;b-
b) Im Spezialfall c ´ 1 0 .t0 / (t0 fest in Œa; b2) geht dies über in: -1.b/ % 1.a/ % .b % a/1 0 .t0 /- 0 max -1 0 .t/ % 1 0 .t0 /- ' .b % a/ t 2Œa;b-
3-. k1.b/ % 1.a/k $ -1 0 .t0 /- % max -1 0 .t/ % 1 0 .t0 /- ' .b % a/ t 2Œa;b-
c) Aus a) deduziere man das folgende hinreichende Kriterium für die Injektivität von 1 W Œa; b2 ! W : Existiert ein c 2 W mit: kck > k1 0 .t/ % ck für alle t 2 Œa; b2, so ist 1 injektiv. Hinweis: Für eine Verbesserung dieses Kriteriums vgl. M[12.1].
120
Kapitel 11 Integralrechnung mehrerer Veränderlicher
3. Sei W ein Hilbert-Raum mit Skalarprodukt h ; i und Norm j j. Die Gleichheitsdiskussion in der Abschätzungsregel ˇZ ˇ Z ˇ ˇ ˇ ˇ ˇ ˇ (10) F .t/ dt ˇ 0 jF .t/j dt ˇ ˇ ˛ ˇ ˛ für eine stetige Abbildung F W Œ˛; ˇ2 ! W verläuft genauso wie im Fall endlicher Dimension. Vgl. den Zusatz zu D[9.1]: In (10) steht genau dann das Gleichheitszeichen, wenn F W Œ˛; ˇ2 ! W von der Form ist F D p ' c mit einer nichtnegativen stetigen Funktion p W Œ˛; ˇ2 ! RC 0 und einem konstanten Element c 2 W . Beim Beweis werden Eigenschaften des Skalarprodukts ausgenutzt, z.B. die Stetigkeit der Abbildung u 7! hu0 ; ui bei festem u0 und die Cauchy/Schwarz-Ungleichung j hu; vi j 0 juj ' jvj. 4. Bei Banach-Räumen, deren Norm nicht von einem Skalarprodukt herrührt, braucht die obige Gleichheitsdiskussion nicht zu gelten, selbst wenn die Dimension endlich ist. Sei dazu R2 mit der Betragssummennorm versehen: k.x; y/k ´ jxj C jyj, und sei F W Œ0; 12 ! R2 definiert durch F .t/ ´ .1; f .t// mit stetiger nichtnegativer und nichtkonstanter Funktion f W Œ0; 12 ! RC 0 . Man berechne -Z -
0
1
- Z F .t/ dt -D
1 0
Z kF .t/k dt D 1 C
0
1
f .t/ dt
und zeige, dass F trotzdem nicht von der Form F D p'c mit stetigem p W Œa; b2 ! RC 0 und festem c 2 R2 ist. 5. Man verallgemeinere den Begriff der Bogenlänge auf Wege in einem Banach-Raum W . Das Vorgehen ist dabei völlig analog zum Euklidischen Fall in Abschnitt 9.1: Sei 1 ein Weg mit kompaktem Definitionsintervall, also 1 W Œ˛; ˇ2 ! W stetig. Für eine Zerlegung von Œ˛; ˇ2, Z D ft0 ; t1 ; : : : ; tk g mit ˛ D t0 < t1 < ' ' ' < tk D ˇ definiert man die zugehörige Länge des einbeschriebenen Polygonzugs als k X -1.tj / % 1.tj &1 /P .Z/ ´ j D1
und nennt 1 rektifizierbar, wenn die Größen P .Z/, genommen über alle Z, nach oben beschränkt sind. In diesem Fall ist die Bogenlänge von 1 ˇ ˚ , Lˇ˛ .1/ ´ sup P .1; Z/ ˇ Z Zerlegung von Œ˛; ˇ2 : Man beweise:
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
121
a) Falls 1 stetig differenzierbar ist, besteht analog zu H[9.1] die Integraldarstellung: Lˇ˛ .1/
Z D
ˇ ˛
- 0 -1 .t/- dt:
b) Die Rektifizierbarkeit bleibt beim Übergang zu einer äquivalenten Norm in W erhalten. Für die Bogenlänge selbst trifft dies nicht zu. (Man belege dies durch entsprechende Beispiele.) c) # Es gilt die Additivität der Bogenlänge analog zu M[9.1]. 6. Der Schrankensatz G kann mit der gleichen Idee auf „krummlinige“ Verbindungswege ausgedehnt werden: Sei wie dort G W A ! W mit A - V von der Klasse C 1 sowie zwei Punkte a; b 2 A gegeben, die sich in A durch einen C 1 -Weg verbinden lassen, d.h. 1 W Œ˛; ˇ2 ! V sei stetig differenzierbar und 1.˛/ D a, 1.ˇ/ D b sowie C ´ Bild 1 D 1.Œ˛; ˇ2/ - A. Dann gilt kG.b/ % G.a/k 0 max -G 0 .p/- ' Lˇ˛ .1 / p2C
-G.b/ % G.a/ % G 0 .a/.b % a/- 0 max -G 0 .p/ % G 0 .a/- ' Lˇ .1/: ˛ p2C
7. Die Taylor-Formel besteht für eine Funktion F W J ! W (J Intervall in R) der Klasse C sC1 mit s 2 N0 genau wie in der skalaren Fassung G[8.3], einschließlich Beweis: Für a 2 J und a C h 2 J gilt die Identität F .a C h/ D F .a/ C
F 0 .a/ F 00 .a/ 2 F .s/ .a/ r hC h C ''' C h C Rs .h/; 1Š 2Š rŠ
mit dem Integral-Restglied 1 Rs .h/ D sŠ
Z
aCh
a
.a C h % * /s F .sC1/ .* / d *:
Nach der Substitution * D a C th nimmt das Restglied die Form an: hsC1 Rs .h/ D sŠ
Z 0
1
.1 % t/s F .sC1/ .a C th/ dt:
8. Im Fall einer Funktion F W J ! W (J Intervall in R) lässt sich die Taylor-Formel abwandeln und evtl. verbessern, indem zur Berechnung von F .a C h/ % F .a/ statt weiterer Taylor-Glieder Funktionswerte von F 0 an zusätzlichen Stellen herangezogen werden. Bekannte Versionen für ein solches Vorgehen sind folgende. Dabei ist immer a; a C h 2 J und h $ 0:
122
Kapitel 11 Integralrechnung mehrerer Veränderlicher
a) Sehnenregel oder Trapezregel: Ist F von der Klasse C 3 , so gilt F .a C h/ D F .a/ C wobei h3 RS .h/ ´ % 2
Z 0
1
) h( 0 F .a/ C F 0 .a C h/ C RS .h/; 2
K.t/F 000 .a C th/ dt
mit K.t/ ´ t.1 % t/:
Hieraus folgt die Abschätzung kRS .h/k 0
h3 ' max -F 000 .a C th/- : 12 t 2Œ0;1-
Schreibt man dies um auf G ´ F 0 und h ´ b % a, so ergibt sich Z b .b % a/3 G.a/ C G.b/ -G 00 - ; C rS mit krS k 0 G.t/ dt D .b % a/ ' 1 2 12 a gültig für G W Œa; b2 ! W von der Klasse C 2 . Der Name rührt her vom skalaren Spezialfall W D R, in dem bei positivem G der Ausdruck .b % a/ ' .G.a/ C G.b//=2 der Flächeninhalt unter der Sehne zwischen den Punkten .a; F .a// und .b; F .b// ist. b) Tangentenregel: Ist F von der Klasse C 3 , so gilt 3 h. C RT .h/; F .a C h/ D F .a/ C hF 0 a C 2 wobei h3 RT .h/ ´ 2
Z 0
1
( K.t /F 000 .a C th/ dt; mit K.t/ ´
t 2; 0 0 t 0 1=2 2 .1 % t/ ; 1=2 0 t 0 1:
Hieraus folgt die Abschätzung kRT .h/k 0
h3 ' max -F 000 .a C th/- : 24 t 2Œ0;1-
Schreibt man dies um auf G ´ F 0 und h ´ b % a, so ergibt sich Z b 3a C b . .b % a/3 -G 00 - ; G.t/ dt D .b % a/ ' G C rT mit krT k 0 1 2 24 a
Abschnitt 11.1 Stetige Abbildungen kompakter Intervalle
123
gültig für G W Œa; b2 ! W von der Klasse C 2 . Der Name rührt wieder her vom skalaren Spezialfall W D R, in dem bei positivem G der Ausdruck .b % a/ ' G..a C b/=2/ der Flächeninhalt unter der Tangente an den Graphen von F im Mittelpunkt .a C b/=2 ist. c) Simpson-Regel oder Keplersche Fassregel: Ist F von der Klasse C 5 , so gilt F .a C h/ D F .a/ C wobei
3 . h. h3 0 F .a/ C 4F 0 a C C F 0 .a C h/ C RK .h/; 6 2
h5 RK .h/ ´ % 72 ( mit K.t/ ´
Z
1 0
K.t/F .5/ .a C th/ dt;
t 3 .2 % 3t /; 0 0 t 0 1=2 3 .1 % t/ .3t % 1/; 1=2 0 t 0 1:
Hieraus folgt die Abschätzung kRK .h/k 0
h5 ' max -F .5/ .a C th/-: 2880 t2Œ0;1-
Schreibt man dies um auf G ´ F 0 und h ´ b % a, so ergibt sich Z
b a
mit
G.t/ dt D krK k 0
3a C b . . b % a3 G.a/ C 4G C G.b/ C rK 6 2 .b % a/5 -G .4/ - ; 1 2880
gültig für G W Œa; b2 ! W von der Klasse C 4 . Der Name rührt her vom skalaren Spezialfall W D R, in dem Kepler eine analoge Näherungsformel für die Volumenbestimmung von Fässern aus den Weiten am Boden, am Deckel und in der Mitte erfunden hat. Lösungshinweis: Die erstgenannten Formeln in a) bis c) ergeben sich alle nach dem gleichen Muster: Man entwickelt neben F .a C h/ auch die vorkommenden Terme F 0 .a C h/; F 0 .a C h=2/ entsprechend Taylor mit Integral-Restgliedern und fasst diese, ggf. nach Transformation auf das Intervall Œ0; 12, in einem Integral zusammen. Das liefert die drei Ausdrücke für RS , RT , RK . Die Abschätzungen ergeben sich dann, weil die Funktionen K in allen Fällen einheitliches Vorzeichen $ 0 haben. Im skalaren Fall W D R können die Restglieder auch durch geeignete Zwischenstellen c
124
Kapitel 11 Integralrechnung mehrerer Veränderlicher
dargestellt werden, nämlich .b % a/3 ' G 00 .c/ 12 .b % a/3 h3 ' F 000 .c/; rT D ' G 00 .c/ RT .h/ D 24 24 h5 .b % a/5 RK .h/ D % ' F .5/ .c/; rK .h/ D % ' G .4/ .c/: 2880 2880 Rb Hinweis: In der numerischen Mathematik werden die Formeln für a G.t/ dt zur näherungsweisen Auswertung von bestimmten Integralen verwendet, insbesondere im skalaren Fall W D R. Der exakte Integralwert wird dabei ersetzt durch die jeweilige rechte Seite ohne Restglied (Quadraturformeln). Der entstehende Fehler wird durch die genannten Restglieder abschätzbar. Teilweise ergeben sich hierdurch sehr genaue Resultate, z.B. im Fall der Simpson-Regel sogar der exakte Wert, wenn die vierte Ableitung null ist, d.h. bei Polynomen vom Grad 0 3. Zusätzliche Verbesserungen der Genauigkeit erreicht man durch Unterteilung des Integrationsintervalls und Anwendung der obigen Regeln auf die Teilintervalle. RS .h/ D %
h3 ' F 000 .c/; 12
rS D %
9. Im Schrankensatz G kann man auf die stetige Differenzierbarkeit verzichten, wenn man ihn auf die Variante in Aufgabe 5[10.3] stützt. Tatsächlich braucht dann der Zielraum nicht einmal vollständig zu sein. Man zeige nämlich: Seien V; W normierte Vektorräume, A offen in V und G W A ! W differenzierbar. Weiter seien a 2 A und v 2 V so gegeben, dass die Strecke von a nach a C v in A enthalten ist, d.h. a C tv 2 A für t 2 Œ0; 12. Dann gilt: kG.a C v/ % G.a/k 0 sup -G 0 .a C tv/- ' kvk t2-0;1Œ
-G.a C v/ % G.a/ % G 0 .a/v - 0 sup -G 0 .a C tv/ % G 0 .a/- ' kvk : t2-0;1Œ
Lösungshinweis: Man wende die genannte Aufgabe auf die Funktion F .t/ ´ G.a C t v/ an.
11.2
Stetige Abbildungen kompakter Quader
Während die obige Verallgemeinerung des Integrals auf vektorwertige Funktionen kaum zu „spüren“ ist, stellt sich der Übergang zu mehrdimensionalen Definitionsmengen als nichttrivial heraus. Wir gehen jetzt einen ersten Schritt in dieser Richtung: Die Integrationsmengen werden jetzt echt mehrdimensional, sind aber fürs erste noch recht einfach, nämlich kompakte achsenparallele Quader im Rn . Achsenparallele Quader sind die Verallgemeinerungen beschränkter Intervalle, nämlich kartesische Produkte solcher:
125
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
A. Definition. Ein (achsenparalleler) Quader Q ) Rn ist ein kartesisches Produkt Q D J1 ( ' ' ' ( Jn ; wobei die Jk beschränkte Intervalle sind. Die Längen der Intervalle Jk heißen die Seiten- oder Kantenlängen von Q. Das Volumen von Q ist definiert als Produkt der Seitenlängen und wird durch vol.Q/ bezeichnet. Vgl. (1). Sind alle Seitenlängen gleich, so spricht man von einem (achsenparallelen) Würfel e heißen volumfremd, falls sie keine inneren Punkte gemeinsam Zwei Quader Q, Q e ı D ¿ gilt. haben, d.h. wenn Qı \ Q Manchmal ist es wichtig, beim Volumen die Dimension zu spezifizieren. Man sagt dann statt „Volumen“ genauer n-dimensionales Volumen. Weitere Symbole für das Quadervolumen sind vol.Q/ DW voln .Q/ µ ,.Q/ µ ,n .Q/: Auch die leere Menge ¿ gilt als Quader mit voln .¿/ ´ 0. Da wir bis auf weiteres nur achsenparallele Quader betrachten, lassen wir das Adjektiv „achsenparallel“ der Einfachheit halber weg.
Ein Quader in R1 D R ist dasselbe wie ein beschränktes Intervall. Ein Quader in R2 wird natürlich besser als Rechteck bezeichnet, ebenso ein Würfel in R2 besser als Quadrat. Die folgenden Bilder zeigen Quader in den niedrigen Dimensionen 2 und 3.
β2
Q
x2
x
α2
β2
Q
α2 α1
x1 β1 2 Quader im R = Rechteck
α1
β1
Würfel im R2 = Quadrat
126
Kapitel 11 Integralrechnung mehrerer Veränderlicher
β3 α3 Q Quader im R3
α2
α1
β2
x2
β1 x1
Ab jetzt werden in diesem Abschnitt außer der leeren Menge nur noch kompakte Quader betrachtet. Diese sind kartesische Produkte von kompakten Intervallen: Q D Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ˛n ; ˇn 2 D f.x1 ; : : : ; xn / 2 Rn j ˛i 0 xi 0 ˇi ; i D 1; : : : ; ng;
(1)
,n .Q/ D voln .Q/ D .ˇ1 % ˛1 / ' ' ' .ˇn % ˛n /: Die gleiche Volumformel gilt für Quader, bei denen in (1) die Intervalle Œ˛i ; ˇi 2 durch entsprechende offene oder halboffene Intervalle ersetzt sind (vgl. Definition A).
Q
Q
Q
R
R
Volumfremde Quader
R
Nichtvolumfremde Quader
B. Definition. Ist Q ein Quader wie in (1) und F W Q ! W eine stetige Abbildung, so ist das Integral von F über Q definiert durch Z
Z (2)
Q
F D
ˇn ˛n
0 '''
0Z
ˇ2
˛2
0Z
ˇ1
˛1
! F .x1 ; x2 ; : : : ; xn / dx1
! dx2 ' ' '
! dxn :
Diese Definition gilt auch, wenn die Definitionsmenge von R F eine Obermenge von Q und die Restriktion von F auf Q stetig ist. Außerdem sei ¿ F ´ 0.
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
127
Die rechte Seite von (2) wird als iteriertes Integral bezeichnet. Sie enthält nur eindimensionale Integrale und wird von innen nach außen abgearbeitet: Zuerst integriert man F .x1 ; : : : ; xn / nach x1 bei beliebigen, jedoch festen Werten x2 ; : : : ; xn . Das Resultat dieser Integration hängt von x2 ; : : : ; xn ab. Dieses Resultat wird nach x2 integriert bei beliebigen jedoch festen Werten x3 ; : : : ; xn , usw. Ist eines der Intervalle einpunktig, so ist das Resultat ebenfalls 0. Zur Rechtfertigung ist natürlich zu zeigen, dass bei jedem Schritt etwas Stetiges herauskommt. Das beruht auf dem folgenden Lemma über Parameterintegrale, das gleich allgemeiner formuliert ist, als es im Augenblick benötigt wird. (Für einen Spezialfall vgl. H[9.2].) C . Lemma (über stetige Parameterintegrale). Sei P ein metrischer Raum und ' W Œ˛; ˇ2 ( P ! W eine stetige Abbildung. Dann definiert das Parameterintegral Z ˆ.p/ ´
˛
ˇ
'.t; p/ dt
eine stetige Funktion ˆ W P ! W . Beweis. Zunächst ist ˆ.p/ wohldefiniert: Bei festem p ist t 7! '.t; p/ stetig; denn es handelt sich um die Vorschaltung einer kanonischen Injektion (E[6.4]). Wir beweisen nun, dass ˆ in jedem p0 2 P stetig ist, und zwar mittels der Folgencharakterisierung der Stetigkeit (T[6.3]). Es ist also zu zeigen: (3)
pk %! p0
H)
ˆ.pk / %! ˆ.p0 /:
Voraus-Abschätzung:
-Z Z ˇ - ˇ '.t; p0 / dt '.t; pk / dt % kˆ.pk / % ˆ.p0 /k D - ˛ ˛ Z ˇ 0 k'.t; pk / % '.t; p0 /k dt: ˛
Somit reicht es nach E[5.5], zu zeigen: k'.t; pk / % '.t; p0 /k %! 0
glm. auf Œ˛; ˇ2 für k ! 1:
Dazu betrachten wir die Menge A ´ fpk j k 2 Ng [ fp0 g und schließen folgendermaßen: A ist kompakt nach N(ii)[6.3]. Daraus ergibt sich, dass auch Œ˛; ˇ2 ( A kompakt ist nach dem kleinen Satz von Tychonoff H(i)[6.4]. Nach
128
Kapitel 11 Integralrechnung mehrerer Veränderlicher
F[6.5] ist dann die Einschränkung 'j.Œ˛; ˇ2 ( A/ gleichmäßig stetig. Somit existiert t; e p / aus Œ˛; ˇ2 ( A gilt: zu gegebenem " > 0 ein ı > 0 derart, dass für .t; p/; .e d..t; p/; .e t; e p // < ı
t; e p /k < ": k'.t; p/ % '.e
H)
Hierin ist d..t; p/; .e t; e p // D max fjt % e t j; d.p; e p /g. Wegen pk ! p0 gibt es ein t D t; p D pk ; e pD N 2 N, so daß k > N impliziert d.pk ; p0 / < ı. Setzt man nun e p0 , so folgt: k > N; t 2 Œ˛; ˇ2
H)
k'.t; pk / % '.t; p0 /k < ":
Darin ist die erforderliche gleichmäßige Konvergenz enthalten.
"
Wir wollen weiter zeigen, dass die Integrationsreihenfolge beim iterierten Integral in Definition B keine Rolle spielt. Dazu braucht man ein analoges Lemma zur differenzierbaren Abhängigkeit von Parameterintegralen, das für reellwertige Funktionen schon in H[9.2] behandelt wurde. Tatsächlich kann man das ohne wesentliche Änderung übernehmen: D. Lemma (über differenzierbare Parameterintegrale). Sei P - R ein Intervall, und ' W Œ˛; ˇ2 ( P ! W erfülle die Voraussetzungen: (i)
Für jedes feste p 2 P ist t 7! '.t; p/ stetig auf Œ˛; ˇ2.
(ii) ' ist nach p stetig partiell differenzierbar, d.h. es existiert die partielle Ableitung 'p W Œ˛; ˇ2 ( P ! W , und 'p ist stetig. Dann definiert das Parameterintegral Z ˆ.p/ ´
ˇ
'.t; p/ dt
˛
eine stetig differenzierbare Funktion ˆ W P ! W , und es gilt die so genannte LeibnizRegel Z ˇ 'p .t; p/ dt: ˆ0 .p/ D ˛
Kurz: „Man darf unter dem Integralzeichen differenzieren“. Beweis. Zunächst sei P als kompaktes Intervall angenommen. Für zwei Argumente p0 und p0 C h in P gilt Z ˆ.p0 C h/ % ˆ.p0 / % h '
ˇ
˛
Z 'p .t; p0 / dt D
ˇ(
˛
) '.t; p0 C h/ % '.t; p0 / % h ' 'p .t; p0 / dt:
129
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
Zur Abschätzung des Integranden ist der Satz vom endlichen Zuwachs G[11.1] ein gutes Hilfsmittel. Er liefert: -'.t; p0 C h/ % '.t; p0 / % h ' 'p .t; p0 /- 0 max -'p .t; p0 C 4h/ % 'p .t; p0 /- ' jhj 12Œ0;1-
0 !'p .jhj/ ' jhj: Darin bezeichnet ! den Stetigkeitsmodul, der wegen der gleichmäßigen Stetigkeit von 'p auf der kompakten Menge Œ˛; ˇ2 ( P existiert. Zusammen mit der voranstehenden Gleichung folgt hieraus für h ¤ 0 die Vorausabschätzung - ˆ.p C h/ % ˆ.p / Z ˇ 0 0 'p .t; p0 / dt - 0 !'p .jhj/ ' .ˇ % ˛/: % h ˛ Diese zeigt, dass die Ableitung ˆ0 in p0 existiert und den behaupteten Wert hat. Hierbei wird verwendet, dass der Stetigkeitsmodul zusammen mit seinem Argument gegen null konvergiert; vgl. G(ii)[6.5]. Lemma C lehrt dann zusätzlich, dass ˆ0 stetig ist. Ist nun P ein beliebiges Intervall, so trifft die Behauptung auf jedes kompakte Teilintervall zu. Mittels Ausschöpfung folgen dann leicht die gleichen Eigenschaften für das ganze Intervall P . " E. Satz. Das iterierte Integral in Definition B hängt nicht von der Reihenfolge der Integrationen ab. Beweis. Jede Permutation ist aus Nachbarvertauschungen zusammensetzbar, also reicht der Fall n D 2, d.h. es ist zu zeigen: Ist F W Œ˛; ˇ2 ( Œ1; ı2 ! W stetig, so gilt ! ! Z 0Z Z 0Z ˇ
ı
.
F .x; y/ dx dy D
˛
ı
ˇ
˛
.
F .x; y/ dy dx:
Wir tun dies wieder auf dem Wege über die Differentialrechnung und definieren dazu ! Z x 0Z ı F ..; y/ dy d . G.x/ ´ ˛
Z /.x/ ´
ı
.
/Z
.
x ˛
1 F ..; y/ d . dy;
d.h. wir lösen die Grenzen (teilweise) von ihren festen Werten und beobachten die Veränderung, die die Ausdrücke dadurch erfahren. Die Ableitungen berechnen sich als Z ı (4) F .x; y/ dy (existent nach C und HDI) G 0 .x/ D .
(5)
/ 0 .x/ D
Z .
ı
F .x; y/ dy
(existent nach C, D und HDI):
130
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Somit ist G 0 .x/ D / 0 .x/ auf Œ˛; ˇ2. Da G.˛/ D /.˛/ D 0 folgt nach E[10.3]: " G.x/ D /.x/ auf Œ˛; ˇ2, insbesondere für x D ˇ. Weitere Symbole für das Integral: Z
Z Q
(6)
F µ
Q
Z F .x1 ; : : : ; xn / dx1 ' ' ' dxn µ Z
Z µ
Q
F d, µ
Q
Q
F .x/ dx
F .x/ d,.x/:
In den Symbolen, in denen x D .x1 ; : : : ; xn / vorkommt, ist x wie in der eindimensionalen Symbolik eine „stumme“ Variable (wie ein Summationsindex), deren Name konfliktfrei abgeändert werden darf. Klassischerweise schreibt man statt des einen Integralzeichens auch n Integralzeichen und spricht von n-fachen Integralen. F. Beispiele. (i)
Z
Berechne
J ´
Q
.1 C x cos xy/ dx dy;
Q ´ Œ0; 12 ( Œ0; '2.
Lösung: Nach welcher Variablen soll zuerst integriert werden? Dies richtet sich im vorliegenden Quaderfall allein danach, welches Integral leichter mit elementaren Stammfunktionen ausdrückbar ist. Hier ist die Integration nach y einfacher als nach x, also bevorzugt man diese: Z J D
1 0
Z D
/Z 0
1 0
%
1 .1 C x cos xy/ dy dx D
Z
1 0
/h
y C sin xy
i% yD0
1 dx
2 '1 1 1 1 .' C sin 'x/ dx D 'x % ' cos 'x D ' % ' .%1/ % 0 C ' 1 ' ' ' xD0
D'C
2 : '
Bei dieser Rechnung wurde an Klammern nicht gespart; manche davon kann man bei einiger Übung weglassen (jedoch gilt: lieber mehr Klammern als zu wenige!). Im nächsten Beispiel wird etwas „kompakter“ gerechnet. Z ez (ii) Berechne: J ´ dx dy dz; Q ´ Œ1; 22 ( Œ0; 12 ( Œ%1; 12. Q xCy Lösung: Hier empfiehlt es sich, zuerst nach z zu integrieren, danach ist die Reihenfolge egal (wegen der Symmetrie in x; y):
131
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
Z
Z
Z
ez dz dx dy 0 1 &1 x C y Z 1 Z 1Z 2 Z 1Z 2 1 h z i1 1 z e dz dx dy D e D dx dy zD&1 0 1 xCy 0 1 x C y &1 Z Z Z 1Z 2 3 ) 1. 1 2 1 1 ( e % e &1 dx dy D e % dx dy D e 0 1 xCy 0 1 xCy Z Z 3 3 &2 1. 1 1 . 1* .ln.2 C y/ % ln.1 C y// dy D e% ln.x C y/ xD1 dy D e % e 0 e 0
J D
1
2
1
3 &1 1 .* D e% .2 C y/ ln.2 C y/ % .2 C y/ % .1 C y/ ln.1 C y/ C .1 C y/ 0 e 3 3 1. 1. D e% .3 ln 3 % 2 ln 2 % 2 ln 2/ D e % .3 ln 3 % 4 ln 2/: e e G. Satz. Das Integral aus Definition B hat folgende Eigenschaften: (i) Zerlegungsregel: Ist ein Quader Q in kompakte paarweise volumfremde Quader zerlegt: Q D Q1 [ ' ' ' [ QN , so gilt Z Z Z F C ''' C F: F D Q
(ii)
Q1
QN
- Z -Z -0 F Abschätzungsregel: kF k. Q
Q
Z
(iii) Linearität: Bei festem Q und W ist die Zuordnung F 7! Z (iv)
Normierung: Für konstantes c 2 W gilt:
Q
Q
F linear.
c D ,.Q/ ' c.
Beweis. Die Regeln (ii) bis (iv) ergeben sich unmittelbar aus der iterierten Vorschrift in Definition B: bei der Abarbeitung zieht sich alles von innen nach außen durch. Bei (i) gestaltet sich der Nachweis etwas komplizierter als im Eindimensionalen, da Quaderzerlegungen wie rechts aussehen können (n D 2). Solche allgemeinen volumfremden Zerlegungen kann man in folgenden Schritten aus einfacheren Zerlegungen aufbauen, bei denen jedesmal die Behauptung aus der iterierten Integraldefinition folgt.
132
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Grundlegend dabei ist die (rein mengentheoretische) Tatsache, dass das kartesische Produkt in Bezug auf die Vereinigung wirklich ein Produkt ist, d.h. es gilt das Distributivgesetz: .A [ B/ ( C D .A ( C / [ .B ( C / und entsprechend bei endlich vielen kartesischen Faktoren hinsichtlich jedes dieser Faktoren. & Sei N D 2 und Q D Q1 [ Q2 (volumfremd) so, dass von der Zerlegung nur eine Koordinate betroffen ist, etwa βi die i -te: Q D Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ˛i ; ˇi 2 ( ' ' ' ( Œ˛n ; ˇn 2 Œ˛i ; ˇi 2 D Œ˛i ; 1i 2 [ Œ1i ; ˇi 2 Q1 D Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ˛i ; 1i 2 ( ' ' ' ( Œ˛n ; ˇn 2 Q2 D Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ1i ; ˇi 2 ( ' ' ' ( Œ˛n ; ˇn 2: Dann tritt im iterierten Integral in B beim i-ten Schritt eine entsprechende Aufspaltung in zwei Summanden ein, und diese Aufspaltung zieht sich beim Abarbeiten weiter nach außen durch. & Analog geht dies bei N $ 2, wenn nur eine Koordinate xi betroffen ist. & Falls dies für eine zweite Koordinate xk auch noch der Fall ist, so zerlegt sich jeder Summand der vorangehenden Situation entsprechend auch bzgl. xk . & Durch Hinzunahme weiterer Koordinaten erhält man die Behauptung für den Fall, dass die Zerlegung Q D Q1 [ ' ' ' [ QN durch Zerlegung aller kartesischen Faktoren von Q bewirkt ist (so genannte Produktzerlegung).
γi αi
βi
αi xi
xk
& Es verbleibt eine allgemeine Zerlegung. Diese reduziert man auf eine Produktzerlegung, indem man alle Endpunkte der kartesischen Faktoren der Qj betrachtet und mit diesen alle Qj weiter zerlegt (Maximalisierung). " Das folgende Bild veranschaulicht diesen letzten Schritt anhand der zuvor gezeigten Zerlegung für ein Q ) R2 .
Maximalisierung
133
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
H. Bemerkungen. Wir ziehen einige weitere Folgerungen, insbesondere für den skalaren Fall f W Q ! R (stetig): R R (i) Aus: f .x/ 0 g.x/ für alle x 2 Q folgt Q f 0 Q g. In dieser Behauptung steht das echte Kleinerzeichen, falls Qı ¤ ¿ und wenigstens einmal f .x0 / < g.x0 / gilt. Denn bei beiden Varianten zieht sich die Ungleichung durch die Iterationen in Definition B durch; vgl. A(iv)[5.1] und B[5.2]. (ii) Als Kombination hiervon mit Satz G(ii) folgt im Fall F W Q ! W die so genannte Standard-Abschätzung -Z - F - 0 kF k1 ' ,.Q/: Q
(iii) Unterdeckung: Gilt für Quader Q / Q1 [ ' ' ' [ QN mit paarweise volumfremden Qj , so ist im Fall f W Q ! RC 0: Z Q
f $
N Z X j D1 Qj
f:
Dies erkennt man so: Man maximalisiert Q und Q1 [ ' ' ' [ QN durch Hinzunahme aller möglichen Koordinaten und füllt die Vereinigung durch weitere Quader zu Q auf. Die hinzukommenden Integrale sind alle nichtnegativ. (iv) Überdeckung: Gilt für Quader Q - Q1 [' ' '[QN und ist f W Q1 [' ' '[QN ! RC 0 stetig, so folgt Z N Z X f: f 0 Q
j D1 Qj
Es gilt nämlich Q D .Q1 \ Q/ [ ' ' ' [ .QN \ Q/, und die Rj ´ .Qj \ Q/ sind Quader. Dann hat man mit der angegebenen Begründung Z Q
f 0
0
N Z X j D1 Rj N Z X j D1 Qj
f
(Maximalisierung der Rj , mehrfache Überdeckung!)
f
((iii) für jeden Summanden).
(v) Besonders einfach wird die Definition B des iterierten Integrals, wenn der Integrand ein Produkt von Funktionen ist, die jeweils nur von einer Veränderlichen abhängen: Seien fi W Œ˛i ; ˇi 2 ! R stetig, i D 1; : : : ; n. Dann gilt: 1 Z n /Z ˇi Y fi .xi / dxi : f1 .x1 / ' ' ' fn .xn / dx1 ' ' ' dxn D Q
i D1
˛i
134
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Denn bei der Abarbeitung können jeweils die Faktoren, die nicht von der aktuellen Integrationsvariablen abhängen, vor das Integral gezogen werden. Jetzt wollen wir zu dem einheitlichen Definitionsbereich Rn übergehen. Das ist ein harmloser Schritt, wenn die Beiträge einer Funktion nur aus einer kompakten Menge herstammen. Zur Präzisierung sei Folgendes definiert (wieder etwas allgemeiner als im Augenblick benötigt): I. Definition. Für eine Funktion F W X ! V (X metrischer Raum, V Vektorraum) definiert man den Träger als den Abschluss der Nichtnullstellen von F Tr.F / ´ fp 2 X j F .p/ ¤ 0g: J. Lemma. Für zwei Abbildungen F; G W X ! V dieses Typs gilt Tr.F C G/ Tr.F / [ Tr.G/. Beweis. Aus F .p/ C G.p/ ¤ 0 folgt: F .p/ ¤ 0 oder G.p/ ¤ 0. Für die jeweiligen Mengen der Nichtnullstellen gilt also AF CG - AF [ AF . Für den Abschluss von Teilmengen A; B - X besteht generell die Regel A [ B D A [ B: Ist nämlich p 2 A [ B, so muss p in A oder in B liegen. Andernfalls gibt es ein "1 > 0 mit A \ U $ .p; "1 / D ¿ und ein "2 > 0 mit B \ U $ .p; "2 / D ¿. Daraus folgt für " ´ min f"1 ; "2 g: .A [ B/ \ U $ .p; "/ D ¿, Widerspruch. Ist umgekehrt p 2 A[B gegeben, so gilt für jedes " > 0: A\U $ .p; "/ ¤ ¿ und B \U $ .p; "/ ¤ ¿, also auch .A [ B/ \ U $ .p; "/ ¤ ¿ aufgrund der Distributivgesetze der Mengenlehre. Zusammen folgt daraus für unsere Träger Tr.F C G/ D AF CG - AF [ AG D AF [ AG D Tr.F / [ Tr.G/; wie behauptet.
"
K. Definition und Satz. Ist X metrischer Raum und V normierter Vektorraum, so sei C 0 .X; V / die Menge der stetigen Abbildungen F W X %! V ; K 0 .X; V / die Menge der stetigen Abbildungen F W X %! V mit kompaktem Träger. Dafür gilt: (i)
C 0 .X; V / ist ein reeller Vektorraum (mit den argumentweisen Operationen für Funktionen).
(ii)
K 0 .X; V / ist ein Untervektorraum von C 0 .X; V /.
(iii) Ist X kompakt, so gilt K 0 .X; V / D C 0 .X; V /.
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
135
Beweis. Zu (i): Dies ist klar, da die Summe zweier stetiger Funktionen F; G W X ! V und das skalare Vielfache ˛F W X ! V (mit ˛ 2 R) wiederum stetig sind. Dies entnimmt man den einfachen Abschätzungen kF .p/ C G.p/ % .F .p0 / C G.p0 //k 0 kF .p/ % F .p0 /k C kG.p/ % G.p0 /k k˛F .p/ % ˛F .p0 /k D ˛ kF .p/ % F .p0 /k : Zu (ii): Für die Träger gilt nach Lemma J: Tr.F C G/ - Tr.F / [ Tr.G/ sowie Tr.˛F / D Tr.F /, wenn ˛ ¤ 0 und Tr.0F / D Tr.0/ D ¿. Sind also die Träger von F; G kompakt, so auch die von F C G und ˛F . Denn die Vereinigung zweier kompakter Teilmengen ist wiederum kompakt (leichte Konsequenz aus M[6.3]), und abgeschlossene Teilmengen kompakter Mengen sind stets kompakt (P(i)[6.3]). Zu (iii): Wenn X kompakt ist, so ist jede abgeschlossene Teilmenge von X kompakt, insbesondere ist jeder Träger kompakt. Die Forderung des kompakten Trägers verlangt hier nichts Zusätzliches. " Ist X nicht kompakt, so stellen die stetigen Funktionen mit kompaktem Träger, gewissermaßen „begrenzte Impulse“ dar: ihr „Wirkungsbereich“ (da wo sie ungleich 0 sind), hat kompakten Abschluss. Man kann dann versuchen, allgemeine Abbildungen F W X %! V aus solchen begrenzten Impulsen aufzubauen. Das ist ein wichtiger Gesichtspunkt bei manchen modernen Entwicklungen (z.B. in der Wavelet-Theorie). Für uns sind die Funktionen mit kompaktem Träger die Bausteine zur Errichtung des allgemeinen Integrals, die in Definition A[11.4] erfolgen wird. Damit wir in Zukunft mit einem einheitlichen Integrationsbereich arbeiten können, fassen wir jetzt das Integral solcher Funktionen auf folgende Weise: L. Definition. Für eine stetige Funktion F W Rn ! W mit kompaktem Träger definieren wir das Integral über Rn durch Z Z F; F ´ Rn
Q
wobei Q ein Quader mit Q / Tr.F / ist. Die Symbole aus (6) werden auch hier gebraucht (mit Rn anstelle von Q). M. Bemerkung (Rechtfertigung dieser Definition). (i) Ein solcher Quader Q existiert stets: Da der Träger beschränkt ist, liegt er in einem Ball der Maximumsnorm, also in einem Würfel.
136
Kapitel 11 Integralrechnung mehrerer Veränderlicher
(ii) Unabhängigkeit von der Wahl von Q: e / Tr.F /, so Gilt neben Q / Tr.F / auch Q e ist R ´ Q \ Q ebenfalls ein Quader mit R / Tr.F /, und man kann ihn zu Q bzw. e mit weiteren Quadern auffüllen (paarweise Q volumfremd):
Q Tr(F) R
Q D R [ Q1 [ ' ' ' [ QN Q
e DR[ Q e1 [ ' ' ' [ Q eL : Q Damit folgt nach Satz G(i):
Z Q
Z F D
R
FC
N Z X j D1 Qj
Z F D
R
Z F;
Z e Q
F D
R
FC
L Z X j D1
Z e Qj
F D
R
F;
da die Integranden der beiden Summen alle 0 sind. Wenn in einem Kontext mehrere Funktionen mit kompaktem Träger (in endlicher Anzahl) vorkommen, so werden ihre Träger i. Allg. verschieden sein. Man kann aber nach der Überlegung bei K(ii) immer einen Quader wählen, der alle diese Träger umfasst, und die Integrale über diesen Quader berechnen. Auf diese Weise erhält man unmittelbar: N. Satz. Die Linearität und die Abschätzungsregel von Satz G übertragen sich auf das Integral gemäß Definition L. " Der Raum der stetigen Abbildungen mit kompakten Trägern wird das entscheidende Fundament für alles Weitere sein. Wir normieren ihn jetzt mit Hilfe von Integralen: O. Satz und Definition. Durch kF k1 ´
Z Rn
kF .x/k dx
wird eine Norm auf K 0 .Rn ; W / definiert, die so genannte 1-Norm. Es bezeichne K10 .Rn ; W / diesen Vektorraum zusammen mit dieser 1-Norm. Beweis. Es sind die Normeigenschaften zu überprüfen: Zu (N.1): Aus F ¤ 0 (F nicht die Nullfunktion) folgt kF .x/k > 0 für mindestens ein x 2 Tr.F / - Q, wobei Q wie in Definition L gewählt ist. Daraus folgt nach H(i): Z Z kF .x/k dx > 0: kF .x/k dx D Rn
Q
137
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
Zu (N.2): Klar durch Integration von k% ' F .x/k D j%j ' kF .x/k über Rn . Zu (N.3): Klar aus kF .x/ C G.x/k 0 kF .x/k C kG.x/k durch Integration über Rn . " Zur Symbolik: Im Falle W D R schreiben wir einfacher K10 .Rn ; R/ µ K10 .Rn /: Dies ist also der Vektorraum aller stetigen Funktionen f W Rn ! R mit kompaktem Träger, zusammen mit der 1-Norm Z jf .x/j dx: kf k1 ´ Rn
Für n D 1 ist speziell K10 .R/ der Vektorraum der stetigen R Funktionen f W R ! R mit kompaktem Träger, versehen mit der 1-Norm kf k1 ´ R jf .x/j dx. P. Bemerkung. Sind wie in D(i)[11.1] c1 ; : : : ; cp 2 W fest gegeben und ist F W Œ˛; ˇ2 ! W von der Form F .x/ D f1 .x/ ' c1 C ' ' ' C fp .x/ ' cp mit fi 2 K10 .Rn /, so folgt aus F .x/ ¤ 0, dass mindestens ein fi .x/ ¤ 0 ist. Daraus folgt wie bei Lemma J: Tr.F / - Tr.f1 / [ ' ' ' [ Tr.fp /. Somit gehört F zu K10 .Rn ; W /. Wählt man einen Quader Q, der diese Vereinigung umfasst, und wendet darauf D(i)[11.1] ] an, so ergibt sich für das Integral 1 1 /Z /Z Z fp .x/ dx ' cp : f1 .x/ dx ' c1 C ' ' ' C F .x/ dx D Rn
Rn
Rn
Insbesondere kann man bei endlicher Dimension von W wiederum komponentenweise integrieren. Q . Beispiel. Der Raum K10 .R/ ist nicht vollständig: Für k 2 N sei fk W R ! Œ0; 12 eine stetige Funktion mit fk .t / D 1 für jtj 0 1 % k1 und fk .t/ D 0 für jt j $ 1 (konkret kann fk stückweise affin gewählt werden). Dann gilt: (i)
.fk / ist K10 .R/;
eine
Cauchy-Folge
(ii) es gibt kein f 2 K10 .R/ mit kf % fk k1 ! 0.
in
1
-1
1 -1 + 1/k
1 - 1/k
138
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Lösung: Zu (i): Für k > l unterscheiden sich fk und fl höchstens für die t 2 R mit 1 % jtj 0 1 % k1 . Diese t bilden zwei Intervalle der Länge 1l % k1 . Damit gilt Z kfk % fl k1 D
1
jfk .t/ % fl .t/j dt 0 2 '
&1
31 l
1 l
0
31 1 . 1. ' max jfk % fl j 0 2 ' ; % k Œ&1;1l k
%
woraus man die Cauchy-Eigenschaft der Folge .fk / ablesen kann. Zu (ii): Angenommen, es gibt eine Funktion f 2 K10 .R/ mit kf % fk k1 ! 0. Dann ist f auf Œ1; 1Œ identisch 0 und ebenso auf 2%1; 12. Sei nämlich Œ%C; C 2 / Tr.f / mit C > 1 und Œ%Ck ; Ck 2 / Tr.f % fk / mit Ck > C . Nun gilt Z Ck jf .t / % fk .t/j dt kf % fk k1 D &Ck
Z $
&1
&Ck
Z D
&Ck
Z $
&1
&1
&C
Z jf .t/ % fk .t/j dt C Z jf .t/j dt C
Ck 1
Z jf .t/j dt C
C
1
Ck
1
jf .t/ % fk .t/j dt
jf .t/j dt;
(da fk .t/ D 0 für jtj $ 1)
jf .t/j dt:
Der Grenzübergang k ! 1 bei Anfang und Ende der Kette liefert Z C Z &1 jf .t/j dt: 0D jf .t/j dt C 1
&C
Also ist f .t/ D 0 für 1 0 jt j 0 C und damit für alle jtj $ 1. Analog schließt man, dass f auf Œ%1; 12 identisch 1 ist. Es gilt nämlich Z Ck jf .t/ % fk .t/j dt kf % fk k1 D Z $
&Ck
1 C.1& k / 1 &.1& k /
Z jf .t/ % fk .t/j dt D
1 C.1& k /
1 &.1& k /
jf .t/ % 1j dt;
und der Grenzübergang k ! 1 bei Anfang und Ende der Kette liefert hier Z 1 jf .t/ % 1j dt; 0D &1
also f .t/ D 1 für alle jtj 0 1.
139
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
Die so bestimmten Werte von f widersprechen der Stetigkeit von f . Deutung des Quaderintegrals mit Riemann-Summen Ist der Quader Q als Vereinigung Q D Q1 [ ' ' ' [ QN von paarweise volumfremden Quadern dargestellt, so lautet eine Zerlegungssumme oder Riemann-Summe für die stetige Funktion F W Q ! W : N X
F .4j / ' ,.Qj /;
j D1
wobei die 4j 2 Qj irgendwie gewählt sind. Dann folgt allein mit den Regeln (i) bis (iv) aus Satz G: -Z N 3 X -. -F .x/ % F .4j /- ' ,.Q/; (7) - F % F .4j / ' ,.Qj /0 max max - 1#j #N x2Qj - Q j D1 Man spaltet dazu das Integral gemäß G(i) auf und verrechnet die einzelnen Summanden miteinander genau wie im eindimensionalen Fall P[5.1]. Wegen der gleichmäßigen Stetigkeit der Funktion F auf dem kompakten Quader Q kann der Koeffizient vor ,.Q/ auf der rechten Seite beliebig klein gemacht werden, wenn nur die Zerlegung so gewählt wird, dass die Distanz zwischen je zwei Punkten in jedem Qj genügend klein wird. Dies bedeutet, dass das Feinheitsmaß der Zerlegung von Q, d.h. die Größe 3 . ı ´ max max kx % yk ; 1#j #N x;y2Qj
hinreichend klein gewählt wird. Bei einer skalaren Funktion f W Q ! R ist der Summand f .4j / ' vol.Qj / einer Zerlegungssumme anschaulich das Volumen einer Säule in RnC1 mit der „Grundfläche“ Qj und der „Höhe“ f .4j /, wobei diese Höhe auch negativ sein kann.
z
y
x
140
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Das Integral ist also näherungsweise eine Summe solcher Säulenvolumina und exakt der Limes davon, wenn das Feinheitsmaß der Zerlegung gegen 0 strebt. Wie im Eindimensionalen erscheint das Integral als eine „kontinuierliche“ oder „verschmierte“ Summe. Vgl. P[5.1]. Ist F von der Klasse C 1 , so kann man mit dem Schrankensatz (5)[11.1] weiter abschätzen: -Z N X - 0- F% -F - ' ı ' ,.Q/: F .4j / ' ,.Qj /- 0 max Q - Q j D1 In diesem Fall verfügt man also über eine leicht zugängliche Schranke für den Unterschied zwischen Integral und Zerlegungssumme. Wie geht es weiter? Das wichtigste Ziel ist, von der Stetigkeit der Integranden loszukommen. Dazu sollen unstetige Integranden durch stetige angenähert werden. Das führte aber nicht weiter, wenn die gleichmäßige Approximation zugrunde gelegt würde, weil der gleichmäßige Limes von stetigen Funktionen wiederum stetig ist (K[6.5]). Man darf also nicht zu stark von der punktweisen Konvergenz abgehen. Bloße punktweise Konvergenz wäre indessen zu schwach. Besser ist es, die punktweise Konvergenz bis auf „kleine“ Ausnahmemengen zu verlangen. Diese Ausnahmemengen werden die so genannten Nullmengen sein. Ein weiterer Aspekt ist, dass der Funktionenraum K10 .Rn ; W / nicht vollständig ist. Die Suche nach den integrierbaren Funktionen bekommt nun eine klare Marschrichtung dadurch, dass man den Raum K10 .Rn ; W / vervollständigen möchte, allerdings nicht abstrakt, sondern durch Objekte, die selbst wieder Funktionen sind. Wir werden also die genannte Approximation durch Cauchy-Folgen in K10 .Rn ; W / vornehmen, die außerhalb von Nullmengen punktweise konvergieren. Die so erreichbaren Grenzfunktionen werden dann die integrierbaren Funktionen sein. Die Durchführung dieses Programms erfolgt in Abschnitt 11.4. Zuvor werden im nächsten Abschnitt die Nullmengen behandelt. # Axiomatische Kennzeichnung des Quaderintegrals Das Integral für stetige Funktionen F W Q ! W auf kompakten Quadern mit Werten in Banach-Räumen kann ebenso axiomatisch begründet werden wie im eindimensionalen Fall, für den dies in den Abschnitten 5.1 bzw. 11.1 so gemacht wurde. Man startet dazu mit einer Zuordnung .Q; F / 7! Int.Q; F / 2 W und verlangt folgende Grundeigenschaften, die den Regeln in Satz G entsprechen: (JJ.1) Zerlegungsregel: Ist ein Quader Q in paarweise volumfremde Quader zerlegt, Q D Q1 [' ' '[QN , so gilt: Int.Q; F / D Int.Q1 ; F /C' ' 'CInt.QN ; F /.
141
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
(JJ.2) Abschätzungsregel: kInt.Q; F /k 0 Int.Q; kF k/. (JJ.3) Linearität: Bei festem Q und W ist die Zuordnung F 7! Int.Q; F / linear. (JJ.4) Normierung: Für konstantes c 2 W gilt: Int.Q; c/ D vol.Q/ ' c: Das iterierte Integral aus Definition B erfüllt diese Regeln. Tatsächlich ist es in diesem Rahmen der einzige Integralbegriff, der dies tut. Wir skizzieren den Nachweis für diese Eindeutigkeit: Eine besonders einfache Zerlegung eines Quaders Q βi entsteht, wenn nur ein Intervall (das i -te) des kartesischen Produkts unterteilt wird; vgl. den ersten t Schritt oben im Beweis von Satz G. Dieser eine Zerlegungspunkt wird nun wieder von seinem festen Wert gelöst, also als Variable t 2 Œ˛i ; ˇi 2 betrachtet (Aufpumpen eines Quaders). α Der erste Bestandteil der Zerlegung von Q ist ein Quader
P(t)
i
αk
βk
P .t/ ´ Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ˛i ; t 2 ( ' ' ' ( Œ˛n ; ˇn 2; dessen Volumen vom Wert 0 bei t D ˛i bis zum Wert ,.Q/ bei t D ˇi anwächst. Nun kann man analog zu C[5.1] für die Größe Int.P .t/; F / den Differenzenquotienten bilden und durch Grenzübergang zur Ableitung übergehen. Auf diese Weise erhält man: (8)
i ^ d Int.P .t/; F / D Int.Qi ; F .: : : ; t ; : : ://: dt
Dabei ist die Menge rechts nur .n % 1/-dimensional, nämlich der Quader Qi ´ Œ˛1 ; ˇ1 2 ( ' ' ' ( Œ˛i ; ˇi 2 ( ' ' ' ( Œ˛n ; ˇn 2; „ ƒ‚ … weglassen!
und der Integrand ist die Funktion F , bei der die i -te Variable konstant gleich t ist. Um Int.Q; F / zu erhalten, braucht man also lediglich die rechte Seite von (8) als Funktion von t von ˛i bis ˇi zu integrieren (HDI in C(vi)[11.1]). Die sukzessive Anwendung auf alle Variablen mit den Nummern n, n % 1, . . . , 1 ergibt schließlich Z ˇn 3 3Z ˇ2 3Z ˇ1 . . . F .x1 ; x2 ; : : : ; xn / dx1 dx2 ' ' ' dxn ; ''' Int.Q; F / D ˛n
˛2
˛1
also muss Int.Q; F / mit dem iterierten Integral übereinstimmen.
142
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Aufgaben und Anmerkungen 1. Man berechne folgende Integrale über die angegebenen Quader Q im R2 bzw. R3 : Z a) .x C y/ ' e xCy dx dy; Q ´ Œ%1; 22 ( Œ%2; 12 Q
Z b)
Q
Z c)
Q
Z d)
Q
.x C y/ ' jx % yj dx dy;
Q ´ Œ0; 122 D Œ0; 12 ( Œ0; 12
cos.x C y C z/ dx dy dz;
h ' 'i ( Œ0; '2 ( Œ%'; 02 Q´ % ; 2 2
xCz dx dy dz; yCz
Q ´ Œ%1; 12 ( Œ1; 22 ( Œ0; 12:
2. Gegeben sei die Funktion f W Q ! R mit Q ´ Œ˛; ˇ2 ( Œ0; 12 ( Œ0; 12, ˛ > 0, und f .x; y; z/ ´ .yz/x . a) Man zeige, dass f stetig ist. Z b) Man berechne .yz/x dx dy dz. Q
3. Eine Variante der Abschätzung (7) lautet -Z N X - F% F .4j / ' ,.Qj /- 0 !F .ı/ ' ,.Q/; - Q j D1 worin !F den Stetigkeitsmodul von F bezeichnet. 4. Sei L W W ! Z eine stetige lineare Abbildung in einen weiteren Banach-Raum Z. Zeige: Ist F W Q ! W stetig, so auch L ı F W Q ! Z, und es gilt . Z 3Z L ı F: F D L Q
Q
Lösungshinweis: Verwende die entsprechende Aussage für einfache Integrale (F[11.1]) und Definition B. 5. Sei W ein Hilbert-Raum mit Skalarprodukt h ; i. Zeige für festes C 2 W und stetige Funktionen F W Œ˛; ˇ2 ! W , G W Œa; b2 ! W : + Z * Z a)
*Z b)
ˇ
C;
˛
˛ ˇ
F .t/ dt D Z
F .t/ dt;
a
b
ˇ
˛
hC; F .t/i dt; +
G.s/ ds D
Z Œ˛;ˇ -(Œa;b-
hF .t/; G.s/i dt ds:
143
Abschnitt 11.2 Stetige Abbildungen kompakter Quader
Lösungshinweis zu a): w 7! hC; wi definiert eine stetige Linearform W ! R, sodass Aufgabe 4 anwendbar ist. Lösungshinweis zu b): Doppelte Anwendung von Teil a). 6. Sei W ein Hilbert-Raum mit Skalarprodukt h ; i und Norm j j. Ein neuer Weg zur Gleichheitsdiskussion in der Abschätzungsregel ˇZ ˇ Z ˇ ˇ ˇ ˇ ˇ ˇ (9) F .t/ dt ˇ 0 jF .t/j dt ˇ ˇ ˛ ˇ ˛ für eine stetige Abbildung F W Œ˛; ˇ2 ! W (vgl. Aufgabe 3[11.1]) ist der folgende: a) Wie bereits bei endlichen Summen (Aufgabe 2 b)[8.6]) empfiehlt es sich, die Differenz der beiden Seiten von (9) zu untersuchen. Für diese beweise man hier eine Darstellung mittels eines Doppelintegrals: Z ( ) ˇ ˇ jF .t/j ' jF .s/j % hF .t/; F .s/i dt ds Z ˇ ˇZ ˇ ˇ ˇ ˇ Q ˇZ ˇ F .t/ dt ˇ D ; jF .t/j dt % ˇ Z ˇ ˇ ˇ ˇ ˇ ˇ ˛ ˛ ˇ ˇ F .t/ dt ˇ jF .t/j dt C ˇ ˇ ˛ ˇ ˛ mit Q ´ Œ˛; ˇ2 ( Œ˛; ˇ2 (falls F nicht die Nullabbildung ist). b) Hieraus erschließe man die beiden Schranken: Z ( ) jF .t/j ' jF .s/j % hF .t/; F .s/i dt ds Z Q 0 00 Z ˇ 2
Z 00
˛
ˇ
˛
˛
jF .t/j dt
ˇ ˇZ ˇ ˇ ˇ ˇ ˇ F .t/ dt ˇ 0 jF .t/j dt % ˇ ˇ ˇ ˛
ˇ ˇZ ˇ ˇ ˇ ˇ ˇ F .t/ dt ˇ jF .t/j dt % ˇ ˇ ˇ ˛
ˇ
Z Q
( ) jF .t/j ' jF .s/j % hF .t/; F .s/i dt ds Z ˛
ˇ
: jF .t/j dt
c) Aus diesen beiden Abschätzungen folgere man mit Hilfe der Cauchy/SchwarzUngleichung, dass in der Abschätzungsregel (9) genau dann das Gleichheitszeichen steht, wenn F W Œ˛; ˇ2 ! W von der Form ist: F D p ' c mit einer nichtnegativen stetigen Funktion p W Œ˛; ˇ2 ! RC 0 und einem konstanten Element c 2W. Lösungshinweis zu a): Man forme den Ausdruck ˇ2 !2 ˇZ 0Z ˇ ˇ ˇ ˇ ˇ ˇ F .t/ dt ˇ jF .t/j dt % ˇ ˇ ˇ ˛ ˛ um durch Anwendung der Formel in Bemerkung H(v) (rückwärts gelesen).
144
Kapitel 11 Integralrechnung mehrerer Veränderlicher
7. # Im Euklidischen Raum Rn betrachte man einen regulären Weg 1 W Œ˛; ˇ2 ! Rn der Klasse C 2 . Es sei + D Lˇ˛ .1 / die Bogenlänge und k ´ max 5 das Maximum der Krümmung von 1 auf Œ˛; ˇ2. Für die Differenz zwischen der Bogenlänge und der Distanz der Endpunkte beweise man die Abschätzung 0 0 + % j1.ˇ/ % 1.˛/j 0
1 3 2 + k : 12
Lösungshinweis: Ein guter Startpunkt ist die erste Ungleichung in Aufgabe 6 b), angewandt auf F ´ 1 0 : Z ˇ ˇ ˇ ˇ ˝ ˛ ˇZ ˇ .ˇ1 0 .t/ˇ ' ˇ1 0 .s/ˇ % 1 0 .t/; 1 0 .s/ / dt ds Z ˇ ˇ ˇ ˇ ˇ 0ˇ ˇ ˇ Q ˇ1 ˇ % ˇ 00 1 0ˇ 0 Z ˇ ˇ ˛ ˇ ˇ 0ˇ ˛ ˇ1 ˇ ˛
mit Q ´ Œ˛; ˇ2 ( Œ˛; ˇ2. Da alle eingehenden Größen invariant gegenüber Umparametrisierung sind, kann o.B.d.A. 1 als normal (j1 0 j D 1) und Œ˛; ˇ2 als Œ0; +2 angenommen werden. Dann folgt hieraus der Reihe nach Z ˝ ˛ 1 0 0 + % j1.+/ % 1.0/j 0 .1 % 1 0 .t/; 1 0 .s/ / dt ds + Q Z ˇ 0 ˇ 1 ˇ1 .t/ % 1 0 .s/ˇ2 dt ds D 2+ Q ˇ2 Z ˇZ t ˇ ˇ 1 00 ˇ 1 .*/ d * ˇˇ dt ds D ˇ 2+ Q s 12 Z /Z t 1 0 ~.*/ d * dt ds 2+ Q s Z 1 2 0 .t % s/2 dt ds: k 2+ Q Da sich das Integral von .t % s/2 über Q zu +4 =6 auswertet, folgt die Behauptung. 8. # Ist unter den Voraussetzungen von Aufgabe 7 1.˛/ D 1.ˇ/, so folgt speziell p p +k $ 12 D 2 3 D 3;46 : : : Hinweis: Das ist also für geschlossene Wege eine untere Schranke für das Produkt aus Bogenlänge und Maximum der Krümmung. Grob: Ist eine der beiden Größen „klein“, so muss die andere „groß“ sein. Mit Hilfsmitteln der Differentialgeometrie (Satz von Fenchel) erzielt man in dieser Situation die Abschätzung Z ˇ ˇ ˇ ~.t/ ˇ1 0 .t/ˇ dt $ ' D 3;14 : : : ˛
145
Abschnitt 11.3 Nullmengen
Dieses Integral wird als die Gesamtkrümmung oder Totalkrümmung von 1 bezeichnet. Vgl. p für weitere damit verwandte Probleme Selimovic[2005,2007]. Die untere Schranke 12 D 3;46 : : : für +k lässt sich für konvexe C 2 -geschlossene Wege in R2 durch den besseren Wert 2' D 6;28 : : : ersetzen. Das wird in der Differentialgeometrie als Konsequenz des Rollsatzes von Blaschke gezeigt. Vgl. Blaschke[1916].
11.3 Nullmengen Nullmengen in Rn sind gewissermaßen die Teilmengen, die „nicht ins Gewicht fallen“, also später zum Integral oder auch zur Volummessung nichts beitragen. Beispiele solcher „leichter“ Mengen sind niederdimensionale Gebilde im Rn , die durch C 1 Abbildungen aus einem Raum Rp mit p < n entstehen, also etwa Hyperebenen oder Teile davon in Rn . Die Definition der Nullmengen erfolgt anhand „beliebig kleiner“, jedoch abzählbarer Überdeckungen durch Quader: A. Definition. (i) (1)
Eine abzählbare Quadervereinigung im Rn ist eine Menge der Form 1 [
Qj ;
Qj Quader im Rn :
j D1
(ii) Eine Menge A - Rn heißt "-dünn (" > 0), wenn eine abzählbare Quadervereinigung (1) existiert mit (2)
1 [ j D1
Qj / A;
1 X
,.Qj / < ":
j D1
(iii) Eine Menge A - Rn heißt Nullmenge, wenn sie "-dünn ist für alle " > 0. Dies bedeutet also: Zu jedem " > 0 existiert eine abzählbare Quadervereinigung mit (2). Der Laufbereich für j in Formeln wie (1) und (2) bedeutet wie schon bei den Reihen, dass j die Menge der natürlichen Zahlen durchläuft. Natürlich können auch andere abzählbare Indexmengen verwendet werden. Unter abzählbare Vereinigungen fallen speziell auch Vereinigungen von endlich vielen Mengen. In diesem Fall verwenden wir trotzdem für die Indizes den Laufbereich bis 1: es sind dann alle Mengen ab einem endlichen Index als leer zu betrachten. Bei (iii) wird die abzählbare Quadervereinigung i. Allg. von " abhängen. Das , in Definition A bezeichnet das für Quader definierte Volumen (Produkt der Seitenlängen), entsprechend Definition A[11.2]. Eine Nullmenge ist also, grob gesprochen, eine Teilmenge von Rn , die durch eine abzählbare Vereinigung von achensparallelen Quadern beliebig kleinen Gesamtvolumens überdeckt werden kann.
146
Kapitel 11 Integralrechnung mehrerer Veränderlicher
B. Bemerkung. Unmittelbar klar aus der Definition sind die Schlüsse: A "-dünn, B - A H) B "-dünn A Nullmenge, B - A H) B Nullmenge: C. Satz. Es sei A Vereinigung von abzählbar vielen Teilmengen Ai - Rn : AD
1 [
Ai ;
iD1
wobei Ai jeweils "i -dünn ist (i D 1; 2; : : : ). Gilt (3)
"´
1 X
"i < 1;
iD1
so ist A "-dünn. P Für eine Reihe mit nichtnegativen Gliedern bedeutet die Schreibweise 1 i D1 ci < 1, P1 dass sie in R konvergiert, und die Schreibweise i D1 ci < C (bzw. 0 C ) für ein C 2 RC 0 , dass ihr Wert außerdem < C (bzw. 0 C ) ist. Beweis von C. Nach Voraussetzung hat man mit geeigneten Quadern Qij : Ai -
1 [
Qij ;
e "i ´
1 X
,.Qij / < "i ;
A´
Ai -
i D1
j D1
j D1
1 [
1 [ 1 [
Qij :
i D1 j D1
Wir wählen eine Bijektion ' W N ! N ( N (Diagonalverfahren). Dann gilt A-
1 [
Q'.`/ ;
1 X
und zu zeigen ist:
`D1
,.Q'.`/ / < ":
`D1
Sei gesetzt '.`/ D .'1 .`/; '2 .`//. Für L 2 N kann man „sortieren“ und abschätzen: L X
,.Q'.`/ / D
`D1
X
,.Q'.`/ / C ' ' ' C
X
,.Q'.`/ /; E ´ max '1 .`/ 1#`#L
1#`#L '1 .`/DE
1#`#L '1 .`/D1
0e "1 C ' ' ' C e "E 0
1 X
e "i :
iD1
Grenzübergang L ! 1 bei Anfang und Ende der Kette liefert: 1 X `D1
wie behauptet.
,.Q'.`/ / 0
1 X iD1
e "i
0 gegeben. Dann ist Ai z.B. ."=2 S1/-dünn. Weiter ist (geometrische Reihe). Also folgt nach Satz C: iD1 Ai ist "-dünn.
P1
iD1 ."=2
i
/D" "
E. Beispiele. (i) Eine einelementige Menge fag im Rn ist stets Nullmenge. Es gilt nämlich, wenn a die Koordinaten aj hat: fag D Œa1 ; a1 2 ( ' ' ' ( Œan ; an 2, und das ist ein Quader vom Volumen 0. (ii) Jede abzählbare Teilmenge von Rn ist Nullmenge. Dies ist klar aus (i) und Folgerung D. Insbesondere ist die Menge der rationalen Zahlen Q Nullmenge in R (obwohl Q dicht in R ist!). (iii) Jede Koordinatenhyperebene im Rn , z.B. H ´ fx 2 Rn j xn D 0g ist Nullmenge. Denn es gilt H D
1 [
Œ%i; i2 ( ' ' ' ( Œ%i; i2 ( Œ0; 02;
iD1
und die zur Vereinigung gelangenden Mengen sind Quader vom Volumen 0. Oft ist es nützlich, spezielle Quader zu verwenden, z.B. solche die ganzzahlige, halbzahlige, viertelzahlige . . . Koordinaten haben. F. Definition. Ein Baustein der Generation g 2 N0 ist ein Würfel der Gestalt: 2 2 2 2 kn kn C 1 k1 k1 C 1 ; ( ''' ( g ; mit k1 ; : : : ; kn 2 Z: 2g 2g 2 2g Der Abschluss eines solchen Bausteins: ' 2 ' 2 kn kn C 1 k1 k1 C 1 ; ( ''' ( g ; 2g 2g 2 2g
mit k1 ; : : : ; kn 2 Z
wird als ein abgeschlossener Baustein bezeichnet. G. Bemerkung. Man beachte den „guten Anschluss“ der Bausteine (wegen der Klammerstellung Œ' ' ' Œ ) sowie die „hierarchische Struktur“, die sich in folgenden Tatsachen ausdrückt: & Die Bausteine der festen Generation g bilden eine Klasseneinteilung von Rn . & Jeder Baustein der Generation g ist disjunkte Vereinigung von 2n Bausteinen der Generation g C 1.
148
Kapitel 11 Integralrechnung mehrerer Veränderlicher g=1
g=0
g=2
4 3 2 1 0 0
1
2
3
4 Bausteine im R2
H. Satz. Jede beschränkte offene Menge U ) Rn ist als abzählbare disjunkte Vereinigung von Bausteinen darstellbar. Genauer: Sei Eg die endliche Vereinigung aller Bausteine der Generation g, die in U enthalten sind. Dann gilt: (4)
E0 - E1 - E2 - ' ' ' ;
U D
1 [
Eg ;
gD0
aber auch die Darstellung als „Teleskopvereinigung“ (5)
$ $ $ .E1 n E0 / [ .E2 n E1 / [ ''' ; U D E0 [
wobei E0 , E1 n E0 , E2 n E1 , : : : selbst endliche disjunkte Vereinigungen von Bausteinen sind. Beweis. Bei festem g existieren nur endlich viele Bausteine, die ganz in U enthalten sind, da U beschränkt ist. S Zu (4): Klar sind die Inklusionen und auch 1 gD0 Eg - U . S1 Zu U gD0 Eg : Zu a 2 U wählen wir einen Ball der Maximumsnorm mit B.a; r/ - U . Sei a D .a1 ; : : : ; an /. Wir wählen weiter ein g 2 N0 so groß, dass 1 < r; 2g
(6)
und setzen ki ´ Œ2g ai 2. Dann ist ki 0 2g ai < ki C 1, also ki ki C 1 0 ai < : g 2 2g
(7)
Aus den Ungleichungen in (6), (7) folgt ai % r < ai %
ki 1 < g; g 2 2
ki C 1 ki < g C r 0 ai C r; g 2 2
149
Abschnitt 11.3 Nullmengen
also
2
2 ki ki C 1 - 2ai % r; ai C rŒ : ; 2g 2g
Somit ist der Baustein zu den ki enthalten in B.a; r/ - U , und er enthält a nach (7). Gleichung (5) ist eine rein mengentheoretische Konsequenz von Gleichung (4). Weiter ist EgC1 nEg die disjunkte Vereinigung der Bausteine der Generation gC1 von EgC1 , die nicht in Eg enthalten sind. "
g=0
g=1
g=2
Teleskopvereinigung
Die obigen Bilder zeigen, die Mengen Eg für eine offene Euklidische Kreisscheibe U in R2 vom Radius 2 bei einigen niedrigen Generationsindizes g. Die Menge U wird durch die Mengen Eg immer besser „von innen“ angenähert. Das letzte Bild veranschaulicht die zugehörigen Differenzmengen Eg n Eg&1 der Teleskopvereinigung. I. Bemerkungen. (i) Ist U offen jedoch unbeschränkt, so gilt die Behauptung von Satz H ebenfalls, wobei aber „endlich“ durch „abzählbar“ zu ersetzen ist. Der Beweis ist der gleiche.
150
Kapitel 11 Integralrechnung mehrerer Veränderlicher
(ii) Genauso sieht man: Jede offene Menge U - Rn ist als abzählbare Vereinigung von kompakten, paarweise volumfremden Würfeln darstellbar: Man macht die analoge Konstruktion mit abgeschlossenen Bausteinen. (iii) In der Definition A(ii) von „"-dünn“ dürfen die Qj auch als offene Quader angenommen werden. Der Grund ist folgender: Sei mit irgendwelchen Quadern Qj 1 [
1 X
Qj / A;
j D1
,.Qj / < ":
j D1
Wir nutzen den Spielraum zwischen dem Reihenwert und " zu einer „milden“ Vergrößerung der Quader. Dazu sei 1 . X 13 Q 'j Qj ,.Qj / "% 3´ 2 j D1
gesetzt. Dann gibt es zu jedem einzelnen Qj einen offenen Quader Qj0 / Qj , jedoch so, dass 3 : 2j
,.Qj0 / % ,.Qj /
0 vorgegeben. Dann ist Aj "j -dünn mit "j ´ ,# .Aj / C 2"j (man denke an die Definition des Infimums). Nach C[11.3] folgt ,#
/[ 1 j D1
1 Aj
0
1 X j D1
"j D
1 3 X j D1
". X # , .Aj / C ": ,# .Aj / C j D 2 1
j D1
Der Grenzübergang " # 0 bei Beginn und Ende der Kette liefert die Behauptung.
"
D. Lemma (Tschebyscheff-Ungleichung in K10 .Rn /). Gegeben sei f 2 K10 .Rn / mit f .x/ $ 0 für alle x 2 Rn sowie eine Konstante c > 0. Dann gilt: ˇ (˚ ,) kf k1 : ,# x 2 Rn ˇ f .x/ > c 0 c Die Tschebyscheff-Ungleichung hat große praktische Bedeutung in der Statistik. Wir werden sie noch verschiedentlich verallgemeinern. Beim Aufbau der Integralrechnung stellt sie ein wichtiges Hilfsmittel dar, um von Integralwerten auf Funktionswerte zu schließen. Anschaulich kann man sagen: „Sehr große“RFunktionswerte werden nur auf „sehr kleinen“ Mengen angenommen, wenn kf k1 D Rn f .x/ festgehalten wird; dies läuft grob gesprochen „umgekehrt proportional“.
160
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Beweis von D. Wir setzen U ´ fx 2 Rn j f .x/ > cg: U ist offen, da Urbild von 2c; 1Œ unter der stetigen Funktion f .
U Qj
U ist beschränkt, da U ) Tr.f /, und da der Träger von f kompakt ist. Wir wählen einen kompakten Quader Q / Tr.f /. Dann haben wir die Schachtelung
Tr(f) Q
U ) Tr.f / - Q: Nun stellen wir gemäß I(ii)[11.3] dar: U D
1 [
Qj ;
Qj paarweise volumfremde, kompakte Würfel:
j D1
Dann folgt für m 2 N unter Verwendung von H(iii)[11.2]: Z
Z Rn
f D
Q
f $
m Z X j D1 Qj
f $
m X j D1
c,.Qj / D c
m X
,.Qj /:
j D1
Grenzübergang m ! 1 am Anfang und Ende dieser Kette und anschließendes Umstellen liefert: 1 X kf k1 : ,.Qj / 0 c j D1
Somit gilt: Die Menge U ist kf k1 . c
3
kf k1 c
. C " -dünn für jedes " > 0. Also ist ,# .U / 0 "
Die Definition des Integrals basiert auf den Cauchy-Folgen im Raum K10 .Rn ; W /. Wir müssen also Näheres über diese Cauchy-Folgen herausfinden, insbesondere die Relation zur punktweisen Konvergenz. Das geschieht in den nächsten beiden Hilfssätzen, die für alles Weitere grundlegend sind. Wenn eine Folge in K10 .Rn ; W / die Cauchy-Eigenschaft besitzt, so bedeutet dies noch lange nicht, dass sie in diesem Raum oder gar punktweise konvergiert. Trotzdem folgt aus der Cauchy-Eigenschaft noch ein „Rest“ an punktweiser und sogar gleichmäßiger Konvergenz. Das ist der Inhalt des ersten Lemmas:
161
Abschnitt 11.4 Das Lebesgue-Integral
E. Lemma. Sei .Fk / eine Cauchy-Folge in K10 .Rn ; W /. Dann existiert eine Teilfolge von .Fk /, die fast überall punktweise konvergiert und außerdem folgende Eigenschaft besitzt: Zu jedem " > 0 gibt es eine "-dünne Menge Z ) Rn derart, dass die Teilfolge in Rn n Z sogar gleichmäßig konvergiert. Beweis. Die „richtige“ Idee zur Auswahl der Teilfolge ist, für eine besonders starke „Verdichtung“ der Folgenglieder untereinander zu sorgen. Das kann so geschehen: Wir wählen zu jedem k 2 N ein Nk 2 N mit: -Fp % Fq - < 1 1 4k
für alle p; q $ Nk :
Es ist sogar induktiv zu erreichen, dass N1 < N2 < ' ' ' gilt, die Indizes Nk also monoton wachsen. Dies geht wegen der vorausgesetzten Cauchy-Eigenschaft. Die gesuchte Teilfolge definieren wir nun durch Gk ´ FNk . Dann gilt (2)
-Gp % Gq - < 1 1 4q
für alle p $ q:
Zwischenbehauptung: Die Reihe (3)
G1 .x/ C
1 X
.GkC1 .x/ % Gk .x//
kD1
hat die verlangten Eigenschaften. Ihre Teilsummen sind Teleskopsummen: G1 .x/ C .G2 .x/ % G1 .x// C ' ' ' C .GN C1 .x/ % GN .x// D GN C1 .x/; somit gilt dasselbe für die Folge .GN .x//, und das ist eine Teilfolge von .Fk .x//. Also ist dann alles bewiesen. Zwischenbeweis: Sei für N 2 N + YN ´ x 2 R n
ˇ % ˇ ˇ kGN C1 .x/ % GN .x/k > 1 : ˇ 2N
Mit der Tschebyscheff-Ungleichung D und (2) ergibt sich: 1=4N 1 1 kGN C1 % GN k1 ,# .YN / 0 < D N < N &1 : 1=2N 1=2N 2 2 Wir definieren jetzt eine „Restvereinigung“ ZN der YN und erhalten für ihr äußeres Maß nach Satz C(v) unter Verwendung der geometrischen Reihe: ZN ´ YN [ YN C1 [ ' ' ' ;
,# .ZN /
0, so gilt Z ˇ ,) 1 (˚ # ˇ (15) , x 2 A kF .x/k $ c 0 kF k : c A
206
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Der skalare Fall W D R wird in der Wahrscheinlichkeitstheorie in folgender Weise verwendet: Die Funktion f W A ! R sei integrierbar und ebenso die Menge A, und es gelte ,.A/ > 0. Dann ist der Mittelwert von f definiert durch Z 1 M ´ f: ,.A/ A Ist außerdem f 2 über A integrierbar, so beweise man die folgende Variante der Tschebyscheff-Ungleichung /Z Z .2 1 ˇ (˚ ,) 1 3 1 (16) ,# x 2 A ˇ jf .x/ % M j $ c 0 2 f2% f : c ,.A/ A A Lösungshinweis: Man wende die ursprüngliche Version (15) anstelle von F bzw. c auf die Funktion g ´ .f % M /2 bzw. c 2 an und rechne um. Hinweis: In den Tschebyscheff-Ungleichungen (15) und (16) ist die links stehende Menge sogar integrierbar, sodass statt ,# auch , geschrieben werden kann (Begründung in K[13.3]). R 10. Ist A - Rn eine Nullmenge, so ist A F D 0 für jede Abbildung F W A ! W . Tatsächlich gilt eine entsprechende Stetigkeitseigenschaft, die besagt, dass das Integral gegen null konvergiert, wenn die Integrationsmenge „größenmäßig“ gegen null strebt. Die „Größe“ der Integrationsmenge kann dabei durch das äußere Maß erfasst werden. Präzise ausgedrückt, besteht für jede integrierbare Abbildung F W M ! W die so genannte absolute Stetigkeit des Integrals in Abhängigkeit von der Integrationsmenge. Diese besagt: (i) Zu jedem " > 0 existiert ein ı > 0, sodass -für alle Teilmengen A - M mit -R # , .A/ < ı, über die F integrierbar ist, gilt: - A F - < ". Man folgere dies aus nachstehender Version:
(ii) Ist A1 ; A2 ; : : : eine Folge vonR Teilmengen von M mit ,# .Ak / < 2&k , über die F integrierbar ist, so gilt limk!1 Ak F D 0. Sodann beweise man (ii) nach folgendem Lösungshinweis: Sei c F k W Rn ! W die c Nullfortsetzung von F jAk . Für die Folge F k sind die Voraussetzungen der majorisierten Konvergenz H[11.5] erfüllt: Einerseits gilt für alle k und x: k c F k .x/k 0 kF .x/k. Andererseits ist limk!1 c F k .x/ D 0, fall ein j existiert, sodass x für alle ` $ j in Rn n A` liegt. D.h. die Folge c F k konvergiert gegen 0 in der Menge . . 3 \ 1 3[ 1 [1 \1 n n A : .R n A / D R n ` `Dj ` j D1 `Dj j D1 Der zuletzt auftretende Durchschnitt ist aber eine Nullmenge; denn er ist für jedes j enthalten in der Menge [1 A `Dj `
Abschnitt 11.6 Lebesgue-Maß und Integration über Teilmengen
und deren äußeres Maß ist kleiner als X1 `Dj
207
1 1 D j &1 : ` 2 2
11. Aus Aufgabe 10 deduziere man als Spezialfall die absolute Stetigkeit des eindimensionalen Integrals als Funktion der oberen Grenze: IstR f W J ! R (J Inx tervall) integrierbar und ' W J ! R definiert als '.x/ ´ a f .t/ dt mit festem a 2 J , so gilt: Zu jedem " > 0 existiert ein ı > 0, sodass für endlich viele disP junkte Teilintervalle 2a1 ; b1 Œ ; : : : ; 2aN ; bN Œ von J mit N kD1 .bk % ak / < ı stets PN kD1 j'.bk / % '.ak /j < " wird. 12. In Ergänzung zu den Übersetzungsregeln (4) zeige man für die symmetrische Differenz zweier Mengen A; B - Rn (vgl. Aufgabe 9[6.1]): -A4B D j-A % -A j: a) Mit A; B - Rn ist also auch A4B integrierbar und daher die Größe d.A; B/ ´ ,.A4B/ 2 R wohldefiniert. Man beweise, dass d für integrierbare Argumente die Metrikaxiome aus A[6.1] bis auf (D.2) erfüllt. Anstelle von (D.2) gilt stets d.A; B/ $ 0. Deshalb wird d eine Pseudometrik genannt. b) Wie muss der Gleichheitsbegriff für integrierbare Mengen A ) Rn abgeändert werden, damit d zu einer Metrik wird? 13. Sei A eine (nichtleere) kompakte Teilmenge des Raums Rn , versehen mit einer Norm k k, und sei dA W Rn ! R die Distanzfunktion von A: dA .x/ ´ infa2A kx % ak. Weiter existiert zu jedem Punkt x 2 Rn ein Proximum x # 2 A, charakterisiert durch kx % x # k D dA .x/. Vgl. K[6.2] und Aufgabe 9[6.5]. Man zeige: Ist A außerdem konvex und die Norm in Rn die Euklidische StandardNorm j j, so gilt: a) Zu jedem x ist das Proximum x # eindeutig bestimmt.
b) Die metrische Projektion PA W Rn ! A auf A, definiert durch PA .x/ ´ x # erfüllt jPA .x/ % PA .y/j 0 jx % yj ; ist also Lipschitz-stetig mit der Lipschitz-Konstanten 1. Lösungshinweis zu b): Aus der Minimaleigenschaft von dA deduziere man zunächst hx % P .x/; P .x/ % P .y/i $ 0: Dann schreibe man x % y D .x % P .x// C .P .x/ % P .y// C .P .y/ % y/, quadriere und schätze die entstehenden Skalarprodukte nach unten ab.
208
Kapitel 11 Integralrechnung mehrerer Veränderlicher
14. Diese Aufgabe verallgemeinert die Konstruktion von Satz T vom Fall der Intervalle auf den Fall der Quader. Sei Q ) Rn ein kompakter Quader. Für jedes k 2 N sei fk W Rn ! R definiert wie in M(iv)[11.4] („Inkapyramide“). Ist F W Q ! W stetig, so sei eine Folge von Abbildungen Fk W Rn ! W definiert durch Fk .x/ ´ fk .x/ ' F .PQ .x//; wobei PQ W Rn ! Q die metrische Projektion auf den Quader Q ist (Aufgabe 13). Man zeige: F. a) Die Folge .Fk / ist approximierend für die Nullfortsetzung c Z Z b) lim Fk D F. k!1 Rn
Q
Aus a) und b) folgt die Koinzidenz des Integrals von F über Q im Sinne von Definition H bzw. B[11.2]. Ein anderer Beweis für diese Koinzidenz wird sich mit dem Satz von Fubini aus der eindimensionalen Koinzidenz des obigen Satzes T ergeben (C[11.8]). 15. Sei A integrierbare Teilmenge von Rn und .Fk / eine Folge von integrierbaren Funktionen Fk W A ! W mit gleichmäßiger Konvergenz: Fk .x/ ! F .x/ in A. Dann ist auch F W A ! W integrierbar, und es gilt: Z Z lim Fk D F: k!1 A
A
a) Man beweise dies als Konsequenz aus dem Satz über die majorisierte Konvergenz. b) Man zeige durch Angabe eines Beispiels, dass die Voraussetzung, A sei integrierbar, nicht weggelassen werden kann. 16. Sei A integrierbare Teilmenge von Rn und .fk / eine Folge von stetigen und beschränkten Funktionen fk W A ! R mit gleichmäßiger Konvergenz: fk .x/ ! f .x/ in A. Man beweise: Dann ist auch f W A ! R stetig und beschränkt, und es gilt: Z Z f: lim fk D k!1 A
A
17. Der Ausschöpfungssatz J und seine obigen Folgerungen sind die Basis für weitere mengentheoretische Operationen bei integrierbaren Mengen, soweit sie von abzählbarem Charakter sind. Man beweise z.B. als Konsequenz dieser Sätze: a) Ist A1 / A2 / ' ' ' eine absteigende3 Folge integrierbarer Mengen, so ist auch . T1 T1 A A integrierbar, und es gilt: , D lim k k k!1 ,.Ak /. kD1 kD1 T b) Ist .Ak /k2N eine beliebige auch 1 kD1 Ak Sist P1 Folge integrierbarer Mengen, so integrierbar und, falls kD1 ,.Ak / in R konvergiert, auch 1 kD1 Ak .
Abschnitt 11.6 Lebesgue-Maß und Integration über Teilmengen
209
c) Man versuche die entsprechenden Verallgemeinerungen auf Funktionen, die auf der Vereinigung der Ak definiert sind, im Stil der Sätze J und P. Lösungshinweis: Zu a): Man konstruiere eine aufsteigende Folge mittels A0k ´ A1 n Ak und spiele den Durchschnitt auf die Vereinigung zurück. Zu b): Man betrachte die aufsteigenden bzw. absteigenden Mengenfolgen A00k ´ A1 [ A2 [ ' ' ' [ Ak ;
bzw.
A000 k ´ A1 \ A2 \ ' ' ' \ Ak :
18. # Satz X gilt auch für differenzierbare Parameterintegrale mit vektorwertigen Integranden, wozu man jedoch den entsprechenden Schrankensatz aus Aufgabe 5[10.3] heranziehen muss. Man zeige damit analog zum obigen Beweis: Sei P ein Intervall und A - Rn . Die Abbildung F W A ( P ! W habe folgende Eigenschaften: (i)
Für alle p 2 P ist die Abbildung x 7! F .x; p/ integrierbar über A.
(ii)
Für fast alle x 2 A ist die Abbildung p 7! F .x; p/ differenzierbar mit der Ableitung p 7! Fp .x; p/.
(iii) Es gibt eine Funktion g 2 Leb1 .A/ mit -Fp .x; p/- 0 g.x/ für alle .x; p/ 2 A ( P : Dann ist die Funktion ˆ W P ! W mit ˆ.p/ ´
Z A
F .x; p/ dx
in P differenzierbar, und es gilt die Leibniz-Regel: Für alle p 2 P ist die Funktion x 7! Fp .x; p/ integrierbar und Z 0 Fp .x; p/ dx: ˆ .p/ D A
19. # Schließlich kann man sich bei den differenzierbaren Parameterintegralen auch vom „eindimensionalen“ Parameter befreien und folgende Version erzielen: Sei P eine offene Teilmenge des normierten Vektorraums V und A - Rn . Die Abbildung G W A ( P ! W habe folgende Eigenschaften: (i)
Für alle p 2 P ist die Abbildung x 7! G.x; p/ integrierbar über A.
(ii)
Für fast alle x 2 A ist die Abbildung p 7! G.x; p/ überall in P differenzierbar, jeweils mit der Ableitung Gp .x; p/ 2 L.V; W / an der Stelle p.
(iii) Es gibt eine Funktion g 2 Leb1 .A/ mit -Gp .x; p/- 0 g.x/ für alle .x; p/ 2 A ( P :
210
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Dann ist die Funktion ˆ W P ! W mit Z ˆ.p/ ´
A
G.x; p/ dx
in P differenzierbar, und es gilt die Leibniz-Regel: Für alle p 2 P und v 2 V ist die Funktion x 7! Gp .x; p/v integrierbar und ˆ0 .p/v D
Z A
Gp .x; p/v dx:
Lösungshinweis: Zunächst zeigt die vorherige Version R (Aufgabe 19), angewandt auf die Funktion F .t/ ´ G.p C tv/, dass das Integral A GpR .x; p/v dx für jedes v 2 V existiert. Dann erkennt man, dass die Abbildung v 7! A Gp .x; p/v dx linear und wegen (iii) auch stetig ist. Schließlich gilt für hinreichend kleine kvk ¤ 0: Z ˆ.p C v/ % ˆ.p/ % kvk
A
Gp .x; p/v dx
Z D
A
G.x; p C v/ % G.x; p/ % Gp .x; p/v dx: kvk
Lässt man hierin v eine beliebige Nullfolge vk ! 0 in V n f0g durchlaufen, so konvergiert der Integrand rechts fast überall gegen 0, und seine Norm wird nach Aufgabe 9[11.1] und Voraussetzung (iii) durch 2g.x/ maxk kvk k nach oben beschränkt. Hieraus folgt mittels majorisierter Konvergenz Z lim
k!1
ˆ.p C vk / % ˆ.p/ % kvk k
A
Gp .x; p/vk dx
D 0:
11.7 Uneigentliche Integrale In der klassischen Auffassung entsteht ein uneigentliches Integral als Kombination aus einem bestimmten Integral und einem Grenzübergang bei der Integrationsmenge, wenn diese sich einer „Singularität“ nähert. Im Rahmen der Lebesgue-Theorie ist der Ausschöpfungssatz J[11.6] der richtige Anknüpfungspunkt für dieses Vorgehen. Wir betrachten hier generell Funktionen, die auf einer Teilmenge M - Rn definiert sind mit Werten in einem Banach-Raum W , wobei die Fälle n D 1 und W D R besondere Beachtung verdienen.
211
Abschnitt 11.7 Uneigentliche Integrale
A. Definition. Gegeben sei eine Ausschöpfung einer Menge M - Rn [1 (1) A W M1 - M2 - M3 - ' ' ' ; M D M : kD1 k Ist die Abbildung F W M ! W über alle Mk integrierbar, so nennt man Z AZ F F ´ lim M
k!1 Mk
ein uneigentliches Integral. Es wird konvergent genannt, wenn der Grenzwert in W existiert, sonst divergent. Trifft die Konvergenz für kF k anstelle F zu, so spricht man von absoluter Konvergenz. Im Allgemeinen hängt ein uneigentliches Integral stark von der gewählten Ausschöpfung A ab, was in der obigen Symbolik zum Ausdruck gebracht ist. B. Beispiel. Sei M ´ Œ%1; 12 n f0g und f W M ! R definiert durch f .x/ ´ x1 : Für zwei Zahlen a; b 2 20; 1Œ berechnet man das Integral über Œ%1; %a2 [ Œb; 12 als Z Œ&1;&a-[Œb;1-
dx D x
Z&a &1
dx C x
Z1 b
h i&a h i1 dx a D ln jxj C ln jxj D ln a % ln b D ln : &1 b x b
Nun betrachten wir drei verschiedene Ausschöpfungen von M und notieren die hieraus folgenden Integralwerte: ' 2 ' 2 Z dx 1 1 [ ;1 H) D ln 1 D 0 A W Mk ´ %1; % k k x ' 2 2 ' ZMk 2 dx 1 [ B W Nk ´ %1; % ;1 H) D ln 2 k k Nk x Z h i h i dx C W Pk ´ %1; %e &k [ e &2k ; 1 H) D ln e k D k: Pk x Somit ist AZ dx D 0 konvergent; M x
BZ M
dx D ln 2 konvergent; x
CZ M
dx divergent: x
Die verschiedenen Resultate sind offensichtlich dadurch begründet, dass die negativen und positiven Teile von f unterschiedlich stark zum Integral beitragen. Deshalb kann man erwarten, dass bei einheitlichem Vorzeichen des Integranden bessere Verhältnisse herrschen. Das bewahrheitet sich: Die Abhängigkeit von der Wahl der Ausschöpfung verschwindet bei absoluter Konvergenz, und das uneigentliche Integral stimmt dann mit dem Lebesgue-Integral überein:
212
Kapitel 11 Integralrechnung mehrerer Veränderlicher
C. Satz. Es gilt die Äquivalenz AZ M
F existiert absolut () F ist über M integrierbar:
Ist eine der beiden Seiten wahr, so gilt
AZ
Z
M
F D
F.
M
Beweis. Offensichtlich gilt wegen der Monotonie der Integralfolge AZ M
F existiert absolut ()
3Z Mk
3Z Mk
. kF k :
. kF k beschränkt:
Somit folgt alles aus dem Ausschöpfungssatz J[11.6].
"
Uneigentliche Integrale verhalten sich in mancher Hinsicht wie Reihen, z.B. gelten folgende hinreichende Konvergenzkriterien für absolute bzw. nicht-absolute Konvergenz: D . Satz. Sei A eine Ausschöpfung von M wie in (1), und seien die Funktionen F W M ! W sowie g W M ! RC 0 beide über alle Mk integrierbar. Dann gilt: (i)
Majorantenkriterium: Ist g über M integrierbar und kF k 0 g, so ist absolut konvergent. Ein solches g heißt eine Majorante für F .
AZ M
F
(ii) Minorantenkriterium: Ist g nicht über M integrierbar und kF k $ g, so ist AZ F nicht absolut konvergent. Ein solches g heißt eine Minorante für F . M
Beweis. Zu (i): Wegen
Mk
Z
Z
Z kF k 0
MkC1
kF k 0
MkC1
Z g0
M
g
ist dies unmittelbar klar. AZ Zu (ii): Wäre F absolut konvergent, so hätten wir mit vertauschten Rollen von kF k und g:
M
Z Mk
MkC1
Z
Z
Z g0
g0
MkC1
kF k 0
M
kF k ;
213
Abschnitt 11.7 Uneigentliche Integrale
also existierte
AZ M
g absolut, und g wäre nach Satz C über M integrierbar, im Wi-
derspruch zur Voraussetzung.
"
Uneigentliche Integrale auf R (Fall n D 1) Traditionell arbeitet man in diesem eindimensionalen Fall nach folgenden Sonderkonventionen: & Sowohl M wie auch die ausschöpfende Mengen sind Intervalle. & Der Grenzübergang erfolgt nicht über eine Folge, sondern kontinuierlich (auch bei der absoluten Konvergenz). & Beim Grenzübergang wird ein Intervallende festgehalten. Zur Realisierung dieser Prinzipien starten wir mit folgendem Unterfall: Singularität an einem Intervallende In dieser Situation spricht man von einfach uneigentlichen Integralen. Wir behandeln die verschiedenen Möglichkeiten exemplarisch für den Intervalltyp M D Œ˛; 1Œ mit ˛ 2 R, wobei das rechte Ende 1 als Singularität gilt. Dies bedeutet für die zu integrierende Funktion F W Œ˛; 1Œ ! W , dass alle Restriktionen auf die Intervalle Œ˛; T 2 mit T > ˛ integrierbar sind, jedoch über die Integrierbarkeit über das Gesamtintervall Œ˛; 1Œ nichts bekannt ist. Dann ist das uneigentliche Integral von F über Œ˛; 1Œ definiert als der Grenzwert Z T (2) lim F .t/ dt; T !1 ˛
falls dieser in W existiert. Wie bei Satz C zeigt sich auch hier, dass bei absoluter Konvergenz die Existenz des Grenzwerts gesichert und sein Wert durch das Lebesgue/ Bochner-Integral gegeben ist: E. Satz. Für ein Intervall der Gestalt Œ˛; 1Œ sind äquivalent: (i)
F W Œ˛; 1Œ ! W ist integrierbar.
(ii) F ist über alle Intervalle Œ˛; T 2 mit T > ˛ integrierbar und limT !1 existiert in R (absolute Konvergenz). Ist eine der beiden Bedingungen wahr, so gilt einschließlich der Existenz: Z (3)
˛
1
Z F D lim
T !1 ˛
T
F:
RT ˛
kF k
214
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Beweis. Aus (i) folgt (ii): Mit Satz I[11.6] folgt: kF k ist integrierbar. Aus N(iii)[11.6] folgt: F RT R1 und kF k sind beide über Œ˛; T 2 integrierbar. Nun beachtet man: ˛ kF k 0 ˛ kF k, wobei die linke Seite monoton wachsend in T ist, also in R konvergiert. Aus (ii) folgt (i) und (3): Sei .Tk / eine monoton wachsende Folge mit Tk $ ˛ und RT Tk ! 1. Dann existiert speziell limk!1 ˛ k kF k. Also folgt nach Satz C, angewandt auf die Ausschöpfung mit Mk ´ Œ˛; Tk 2 Z 1 Z Tk Z 1 Z Tk Z T F D lim F; kF k D lim kF k D lim kF k ; ˛
k!1 ˛
˛
k!1 ˛
T !1 ˛
einschließlich der Existenz der Integrale. Nach Satz N[11.6] gilt nun für T $ ˛: -Z Z T Z T Z 1 - Z 1 Z 1 - 1 - - -0 F% F- D F D % kF k kF k kF k ; - ˛ - - T ˛ T ˛ ˛ wiederum einschließlich der Existenz der Integrale. Hieraus liest man die Behauptung (3) ab. " Genau im Fall absoluter Konvergenz ist die Funktion F über das gesamte Intervall Œ˛; 1Œ integrierbar, das rechte Ende also hinsichtlich des Integrals gar nicht wirklich singulär. Trotzdem mag F bei Annäherung an 1 singulär sein bzgl. anderer Eigenschaften, z.B. gegenüber dem Grenzwertverhalten von F selbst. Motiviert durch diese Übereinstimmung wird das uneigentliche Integral (2) mit dem üblichen Symbol bezeichnet: Z 1 Z T F ´ lim F; ˛
T !1 ˛
auch dann, wenn es nicht absolut konvergiert. Wie gesagt, der Grenzwert ist dabei im kontinuierlichen Sinne gemeint. Will man die beiden Bedeutungen dieses Integralsymbols auseinander halten, so muss man ggf. verbal hinzufügen „im Sinne des Lebesgue-Integrals“ bzw. „als uneigentliches Integral“. Analoge Sachverhalte bestehen bei den übrigen Intervalltypen von U[11.6]. Sei z.B. die zu integrierende Funktion von der Gestalt F W Œ˛; ˇŒ ! W mit ˛ < ˇ aus R. Dann liegt die Singularität nur bei ˇ, wenn F über alle Teilintervalle der Form Œ˛; T 2 mit T < ˇ integrierbar ist, und es wird der kontinuierliche Grenzwert für T " ˇ verwendet. Die Singularität liegt nur bei ˛, wenn F über alle Teilintervalle der Form ŒT; ˇ2 mit T > ˛ integrierbar ist, und es wird der kontinuierliche Grenzwert für T # ˛ gebraucht. Ein einfach uneigentliches Integral mit absoluter Konvergenz ist dasselbe wie das Lebesgue-Integral!
Abschnitt 11.7 Uneigentliche Integrale
215
F. Beispiele. Es soll die Konvergenz bzw. absolute Konvergenz der folgenden uneigentlichen Integrale diskutiert und ggf. ihre Wert bestimmt werden. Z 1 dt (i) Das Integral sei für festes a > 0. ta 1 Lösung: Das Integral ist einfach uneigentlich, da der Integrand auf Œ1; 1Œ stetig ist. Wenn überhaupt, dann ist das Integral absolut konvergent, da der Integrand nichtnegativ ist. Es muss mit Œ1; T 2 für T ! 1 ausgeschöpft werden, d.h. es kommt auf den Grenzwert an: Z T dt lim T !1 1 t a Sei zunächst a ¤ 1. Dann ist explizit berechenbar Z
T 1
2 1&a 'T dt T 1&a 1 t D D % : a t 1%a 1 1%a 1%a
Dieser Ausdruck konvergiert für T ! 1, falls 1 % a < 0, und zwar mit dem Grenz1 wert % 1&a , und er divergiert, falls 1 % a > 0. Bei a D 1 berechnet man
Z 1
T
dt D Œln t2T1 D ln T: t
Dieser Ausdruck divergiert für T ! 1. Somit gilt Z 1
1
8 1 ˆ absolut konvergent; für a > 1 < dt a%1 D ˆ ta : divergent; für a 0 1: Z
(ii)
Das Integral sei
0
1
dt für festes a > 0. ta
Lösung: Das Integral ist einfach uneigentlich, da der Integrand auf 20; 12 stetig ist (aber bei 0 selbst keinen Grenzwert in R besitzt). Wenn überhaupt, dann ist das Integral absolut konvergent, weil der Integrand nichtnegativ ist. Es muss mit den Teilintervallen ŒT; 12 für T # 0 ausgeschöpft werden, d.h. es kommt auf den Grenzwert an: Z 1 dt : lim T #0 T t a
216
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Sei zunächst a ¤ 1. Dann ist wieder explizit berechenbar 2 1&a '1 Z 1 1 T 1&a t dt D D % : a 1%a T 1%a 1%a T t Dieser Ausdruck konvergiert für T # 0, falls 1 % a > 0, und zwar mit dem Grenzwert 1 , und er divergiert, falls 1 % a < 0. 1&a Bei a D 1 berechnet man
Z
1 T
dt D Œln t21T D % ln T: t
Dieser Ausdruck divergiert für T # 0. Somit gilt Z 0
1
8 1 ˆ absolut konvergent; falls 0 < a < 1 < dt 1%a D ˆ ta : divergent; falls a $ 1:
Integranden des Potenztyps in (i), (ii) werden oft als Majoranten oder Minoranten verwendet. Z 1 sin t (iii) Das Integral sei dt: t 1 Lösung: Das Integral ist einfach uneigentlich, da der Integrand auf Œ1; 1Œ stetig ist. Eine explizite Berechnung ist nicht möglich, da keine Stammfunktion bekannt ist. Man kann jedoch mit Produktintegration umformen, wenn man sin t als Ableitung betrachtet. So erhält man für T > 1: Z T Z T sin t cos T cos t dt D % C cos 1 % dt: t T t2 1 1 Der herausintegrierte Teil konvergiert für T ! 1 gegen cos 1. Auch das letzte Integral konvergiert für T ! 1 (sogar absolut), da der Integrand die Majorante 1=t 2 hat; vgl. (i). Das gegebene Integral ist somit konvergent. Es ist aber nicht absolut konvergent. Zwischen zwei aufeinander folgenden Nullstellen des Sinus in Œ0; 1Œ gilt nämlich ˇ Z .kC1/% Z .kC1/% ˇ Z .kC1/% ˇ sin t ˇ j sin t j 1 ˇ ˇ dt $ j sin tj dt dt D ˇ t ˇ .k C 1/' .k C 1/' k% k% k% D
1 .k C 1/'
Z 0
%
sin t dt D
2 : .k C 1/'
217
Abschnitt 11.7 Uneigentliche Integrale
Also ist
Z 0
k%
ˇ ˇ sin ˇ ˇ t
ˇ / 1 1 1 t ˇˇ 2 1 ˇ dt $ ' 1 C 2 C ' ' ' C k ;
k 2 N;
und die letzte Klammer geht als Teilsumme der harmonischen Reihe gegen 1. R1 Das Integral 1 sint t dt ist somit konvergent, aber nicht absolut konvergent. Offensichtlich heben sich die negativen und positiven Flächenteile dieses Integranden soweit auf, dass Konvergenz vorliegt, während bei absoluter Zählung der Flächeninhalt unbeschränkt ist.
Allgemeiner Fall: Mehrfach uneigentliche Integrale Diese Situation tritt auf, wenn mehrere (jedoch endlich viele) Stellen des Integranden existieren, an denen dieser singulär ist. Wie im vorhergehenden Unterfall zählt eine uneigentliche Grenze immer auch als singulär. Entsprechend den obigen Sonderkonventionen verlangt man zur Konvergenz, dass es eine Zerlegung des Integrationsintervalls gibt, deren Teilintervalle dem obigen Unterfall angehören und die einzelnen Bestandteile konvergieren; der Wert des uneigentlichen Integrals ist dann die Summe der Werte der einzelnen uneigentlichen Teilintegrale. G. Beispiele. (i)
Das Integral sei J ´
Z 0
1
dt . p t.1 C t/
Lösung: Der Integrand ist stetig in 20; 1Œ, also integrierbar über jedes kompakte Teilintervall ŒA; B2 - 20; 1Œ. Klassischerweise verwendet man aber nicht diese Intervalle ŒA; B2 zur Ausschöpfung (sie hängen ja von zwei Parametern ab), sondern zerlegt (zunächst formal) Z 1 Z 1 dt dt J D C p p t.1 C t / t.1 C t/ 0 1 „ ƒ‚ … „ ƒ‚ … J1 J2 und verlangt, dass J1 , J2 beide konvergieren. Bei J1 wird mit den Intervallen ŒA; 12 für A # 0 ausgeschöpft, bei J2 mit Œ1; B2 für B ! 1. In diesem Beispiel existiert eine Stammfunktion, da man mittels der Substitution t D x 2 auf das Integral aus E(ix)[5.4] zurückkommt. Eine Stammfunktion des Integranden
218
Kapitel 11 Integralrechnung mehrerer Veränderlicher
p t . Damit sind explizit berechenbar /h 1 Z 1 3' p . p i1 ' dt J1 D lim D lim 2 arctan t D lim % 2 arctan A D p A 2 A#0 A A#0 2 t.1 C t/ A#0 1 /h Z B p iB dt J2 D lim D lim 2 arctan t p 1 B!1 1 t.1 C t/ B!1 . 3 p ' ' D : D lim 2 arctan B % B!1 2 2
ist einfach 2 arctan
Beide Bestandteile sind also konvergent, und somit auch laut Konvention J D J1 C J2 D
' ' C D ': 2 2
Die Wahl des Zwischenpunktes bei einer solchen Aufspaltung ist unerheblich, weil bei einem anderen Zwischenpunkt ein fester Summand zum einen Bestandteil hinzukommt, der beim anderen Bestandteil wieder abgezogen wird. Z 1 dt ; a > 0: (ii) Das Integral sei ta 0 Lösung: Das Integral ist zweifach uneigentlich, da der Integrand auf 20; 1Œ stetig ist. Es muss in zwei Teile aufgespalten werden, z.B. mit der Zwischengrenze 1: Z
1
0
dt D ta
Z
1
0
dt C ta
Z
1
1
dt : ta
Nach (i) und (ii) bei den Beispielen F gibt es kein a > 0 derart, dass beide Bestandteile konvergieren. Somit ist das Integral für jedes a > 0 divergent. Z 1 dt (iii) Das Integral sei : &1 t Lösung: Das Integral ist mehrfach uneigentlich, da der Integrand auf Œ%1; 0Œ und auf 20; 12 stetig ist. Es muss in zwei Teile aufgespalten werden mit der Zwischengrenze 0 Z
1
&1
dt D t
Z
0
&1
dt C t
Z 0
1
dt : t
Da schon der zweite Bestandteil divergiert, ist das gegebene Integral divergent. (Der erste Bestandteil divergiert ebenfalls.) Würde man zur Ausschöpfung die Mengen Œ%1; %T 2 [ ŒT; 12 mit T # 0 verwenden, so ergäbe sich wie in Beispiel B der Wert 0. Solche Werte, die auf Spezialvereinbarungen für die ausschöpfenden Mengen beruhen, werden als Cauchysche Hauptwerte bezeichnet.
Abschnitt 11.7 Uneigentliche Integrale
Z (iv)
Das Integral sei
1
&1
stehen ist.
219
dt ; wobei die dritte Wurzel entsprechend (7)[3.7] zu verp 3 t
Lösung: Wie bei (iii) ist das Integral mehrfach uneigentlich, da der Integrand auf Œ%1; 0Œ und 20; 12 stetig ist. Es muss in zwei Teile aufgespalten werden mit der Zwischengrenze 0: Z 0 Z 1 Z 1 dt dt dt D C : p p p 3 3 3 t t t &1 0 &1 Das zweite Integral rechts existiert nach Beispiel F(ii) mit dem Wert 3=2. Das erste Integral rechts erfordert die Ausschöpfung mit Œ%1; T 2 für T " 0. Hierfür gilt entsprechend der genannten Wurzeldefinition und nach Substitution u D %t : Z 0 Z 0 Z &T Z 1 dt dt %du du D D D % ; p p p p 3 3 3 3 % u u t &1 &1 % %t 1 &T was wiederum nach F(ii) gegen %3=2 strebt. Somit existiert das gegebene Integral und hat den Wert 0. Z1 sin t (v) Das Integral sei dt: t 0
Es sieht auf den ersten Blick so aus, als ob dieses Integral zweifach uneigentlich sei, nämlich bei 1 und bei 0. Tatsächlich hat aber der Integrand bei 0 eine hebbare Unstetigkeit, da er dort den Grenzwert 1 besitzt. Das Integral ist also einfach uneigentlich und existiert genau wie im Beispiel F(iii), allerdings nicht absolut. Sein Wert kann nur mit einer Spezialmethode bestimmt werden (vgl. Aufgabe 10[11.8]). In den Fällen, wo man bei einem mehrfach uneigentlichen Integral die Zwischenstellen frei wählen kann, ist die Existenz und der Wert von dieser Wahl unabhängig, was genau wie im obigen Beispiel G(i) einzusehen ist. Im Fall, dass alle Teilintegrale bei einer solchen Zerlegung absolut konvergieren, existieren die Teilintegrale auch im Sinne von Lebesgue und ebenso das Gesamtintegral nach N[11.6]. Tatsächlich kann man die Relation zwischen Einzelintegralen und Gesamtintegral auch im Fall nichtabsoluter Konvergenz beschreiben, wie jetzt zum Abschluss gezeigt werden soll. # Alternative Auffassung mehrfach uneigentlicher Integrale Obwohl man sich in der traditionellen Behandlung der Einzelgrenzwerte bedient, können diese äquivalent durch simultane mehrfache Limites ersetzt werden. Dies sei im Fall eines Intervalls mit singulären Endpunkten ˛ < ˇ (die auch ˙1 sein dürfen) präzisiert:
220
Kapitel 11 Integralrechnung mehrerer Veränderlicher
H. Satz. Für ˛ < ˇ aus der erweiterten reellen Achse R sei die Funktion F W 2˛; ˇŒ ! W über alle Intervalle ŒA; B2 mit ˛ < A < B < ˇ integrierbar. Dann sind äquivalent: Z . (i) Für 1 2 2˛; ˇŒ existieren die beiden uneigentlichen Integrale + ´ F und ˛ Z ˇ %´ F. .
Z
(ii) Es existiert der Grenzwert ( ´
lim
B
.A;B/!.˛;ˇ / A
F.
Ist eine der Bedingungen erfüllt, so gilt (4)
( D + C %:
Der Grenzwert in (ii) bezieht sich auf das kartesische Produkt R ( R, das z.B. mit der Maximumsmetrik versehen sei. Ein solcher Grenzwert, der von zwei (oder mehr) Veränderlichen abhängt wird als simultan bezeichnet. Beweis von H. Aus (i) folgt (ii) und (4): Für ˛ < A < 1 < B < ˇ gilt Z (5)
B
A
F % .+ C %/ D
3Z
.
A
. 3Z F %+ C
.
B
. F %% :
Zu gegebenem " > 0 existieren nach Voraussetzung ı1 > 0 und ı2 > 0 derart, dass gilt: -Z . - " F % +für A 2 U.˛; ı1 / -< 2 A -Z - " - B F % %- < für B 2 U.ˇ; ı2 /: - 2 - . Hieraus und aus (5) folgt mittels Dreiecksungleichung, wenn noch ı ´ min fı1 ; ı2 g gesetzt wird: -Z - " - B " F % .+ C %/- < C D " für .A; B/ 2 U..˛; ˇ/; ı/ - 2 - A 2 also die Behauptung.
221
Abschnitt 11.7 Uneigentliche Integrale
Aus (ii) folgt (i): Es reicht, + zu behandeln (bei % geht es analog). Da keine Vermutung über den Grenzwert vorliegt, verbleibt zur Existenzsicherung von + das CauchyKriterium (in W ). Sei .Ak / eine beliebige Folge in 2˛; 1Œ mit limk!1 Ak D ˛. Dann schreibt man mit noch zu wählendem B Z . Z . Z A` 3Z B . 3Z B . (6) F% F D F D F %( % F %( ; Ak
also (7)
A`
Ak
Ak
A`
-Z - - -Z - A` - -Z B - - B - - F- 0 F % (- C F % (- : - Ak - - Ak - - A` -
Zu gegebenem " > 0 existiert nach Voraussetzung ein ı > 0 mit -Z - B - " F % (- < ; wenn .Ak ; B/ 2 U..˛; ˇ/; ı/ - Ak - 2 (8) -Z - B - " wenn .A` ; B/ 2 U..˛; ˇ/; ı/: F % (- < ; - A` - 2 Nun wähle man B fest in U.ˇ; ı/. Dann gelten die Abschätzungen in (8) für dieses B und alle Ak ; A` 2 U.˛; ı/. Mittels R . (6) bis (8) folgt so die Cauchy-Eigenschaft für den Grenzübergang k ! 1 von Ak F . " # Anwendung auf die Stetigkeit von Integralen Der Zusammenhang zwischen uneigentlichen Integralen und Lebesgue-Integralen aus Satz C lässt sich benutzen, um im eindimensionalen Fall die stetige Abhängigkeit eines Integrals von der oberen Grenze zu beweisen: I. Satz. Ist F W Œa; b2 ! W integrierbar, so ist die Abbildung Z x F ˆ W Œa; b2 ! W; ˆ.x/ ´ a
stetig. Der übliche Beweis über die Standardabschätzung funktioniert nicht allgemein, da der Integrand unbeschränkt sein darf. (Bei stetigem Integranden gilt natürlich viel mehr: Nach dem Hauptsatz der Differential- und Integralrechnung C[11.1] ist ˆ sogar differenzierbar mit der Ableitung F .) Beweis von I. Wir beweisen die Stetigkeit von ˆ an einer Stelle c 2 Œa; b2 über die Folgencharakterisierung der Stetigkeit (T[6.3]), wobei wir uns zunächst einseitig und monoton der Stelle c nähern.
222
Kapitel 11 Integralrechnung mehrerer Veränderlicher
F ist über jedes Teilintervall von Œa; b2 integrierbar, und das Gleiche gilt für kF k. Sei zunächst c 2 2a; b2 und .3k / eine monoton fallende Nullfolge, sodass alle c % 3k in Œa; cŒ liegen. Dann definieren wir eine Ausschöpfung von Œa; cŒ, nämlich durch die Intervalle Ak ´ Œa; c % 3k 2. Nach Satz C gilt Z c&/k Z c lim kF k D kF k k!1 a
a
oder äquivalent Z (9)
lim
c
k!1 c&/k
kF k D 0:
Ist nun ."k / eine solche Nullfolge, jedoch ohne die Monotonie, so definieren wir 3k ´ sup f"k ; "kC1 ; : : :g. Dann gilt stets 3k $ "k , und .3k / ist eine monoton fallende Nullfolge wie zuvor, also (9) erfüllt. Wegen Z c Z c kF k 0 kF k c&"k
gilt auch
Z lim
c&/k
Z
c
k!1 c&"k
kF k D 0;
lim
c
k!1 c&"k
F D0
oder äquivalent mit dem letzten: Z lim
c&"k
k!1 a
Z F D
a
c
F:
Dies beweist die linksseitige Stetigkeit von ˆ in c. Analog erkennt man für c 2 Œa; bŒ die rechtsseitige Stetigkeit von ˆ in c, wobei jetzt die Ausschöpfung von 2c; b2 durch die Intervalle Œc C 3k ; b2 erfolgt. " Aufgaben und Anmerkungen 1. Man diskutiere die folgenden Integrale auf Konvergenz und bestätige die angegebenen Werte Z1 a)
p &1 Z1
c) &1
Z5=4
dx 1%
x2
D ',
b)
dx D 2, .1 C x 2 /3=2
p 1
Z0
d) &1
dx x2 % 1
D ln 2,
1 e 1=x D . x2 e
223
Abschnitt 11.7 Uneigentliche Integrale
2. Welche der folgenden uneigentlichen Integrale sind konvergent bzw. absolut konvergent? Falls möglich soll der Wert des Integrals angegeben werden. Z1 a) &1
Z1
dx ; 1 C x2
b) &1
Z1 sin 1 x dx; d) 1 C x2
Z1 e)
&1
&1
Z1
Z1
g) &1
1 exp 2 dx; x %1
h) 0
cos x dx; x cos x dx; x
1 sin p x dx; x
Z1 c) 0
Z1 f) &1 Z1
i) 0
cos x dx 1 C x2 ex
2 &1
dx
1 sin x C sin x dx: p x
3. Man untersuche die folgenden uneigentlichen Integrale auf Konvergenz bzw. absolute Konvergenz Z% a) 0
dx
, p sin x
Z1 b) 0
ln x dx, 1 C x2
ˇ1 Z1 / ˇ ˇ1%xˇ 2 ˇ ˇ dx. ln ˇ c) 1 C xˇ &1
4. Aus Aufgabe 5[11.6] deduziere man mit Hilfe des Gaußschen Fehlerintegrals (Beispiel I[9.2]) für alle y 2 R: Z 0
1
2
e %x cos.2xy/ dx D
p ' %y 2 : e 2
5. Durch explizite Rechnung (d.h. ohne Verwendung von Satz I) zeige man, dass das Integral Z x dt ˆ.x/ ´ p jt j &1 für x 2 Œ%1; 12 stetig von x abhängt. Ist ˆ differenzierbar? Man darf also unter gewissen Voraussetzungen „über Singularitäten hinweg integrieren“ und erhält sogar etwas stetiges, nämlich dann, wenn die Voraussetzungen von Satz I zutreffen. Ry 6. Sei F W Œa; b2 ! W integrierbar. Zeige, dass das Integral x F für x; y 2 Œa; b2 stetig vom Paar .x; y/ abhängt. 7. Rektifizierbarkeit und Bogenlänge waren an früherer Stelle für Wege mit kompaktem Definitionsintervall erklärt worden (F[9.1]). Analog zum uneigentlichen Integral können diese Begriffe jetzt auch für allgemeine Wege eingeführt werden. Sei 1 W J ! Rn ein Weg, wobei J ein Intervall mit Endpunkten ˛ < ˇ in R ist und Rn mit der Euklidischen Standard-Metrik versehen sei. Man nennt 1 rektifizierbar,
224
Kapitel 11 Integralrechnung mehrerer Veränderlicher
wenn alle Restriktionen von 1 auf kompakte Teilintervalle ŒA; B2 - J rektifizierbar sind und nach Wahl eines Punktes * im Inneren von J die beiden Grenzwerte % ´ lim LB ' .1 /
+ ´ lim LA' .1 /; A#˛
B"ˇ
in R existieren. Ist dies der Fall, so heißt L.1 / ´ + C % die Bogenlänge von 1 . Man zeige ähnlich wie oben bei den uneigentlichen Integralen: a) Ist J selbst kompakt, so stimmen die neuen Begriffe mit den früheren überein. b) 1 W J ! Rn ist dann und nur dann rektifizierbar, wenn der simultane Grenzwert (´
lim
.A;B/!.˛;ˇ /
LAB .1/
in R existiert, und dann ist L.1/ D ( , insbesondere L.1/ unabhängig von der Wahl von *. 8. Sei wie in Aufgabe 7 ein Weg 1 W J ! Rn mit beliebigem Definitionsintervall betrachtet, jetzt aber angenommen, dass 1 von der Klasse C 1 ist. Zeige: 1 ist dann und nur dann rektifizierbar, wenn das uneigentliche Integral von j1 0 j über J existiert, und in diesem Fall gilt Z L.1 / D
J
j1 0 .t/j dt:
9. Man diskutiere die Rektifizierbarkeit der Spiralen aus Aufgabe 13[9.1] und berechne ggf. die Bogenlänge für das angegebene Intervall mit Endpunkten ˛, ˇ (Bedeutung von r.'/ wie dort). a) Archimedische Spiralen: r.'/ D k' (k D const. > 0), ˛ D 0, ˇ 2 RC . k ' b) Hyperbolische Spiralen: r.'/ D (k D const. > 0), ˛ D , ˇ D 1. ' 2 c) Logarithmische Spiralen: r.'/ D r0 e k' (r0 D const. > 0, k D const. < 0), ˛ D 0, ˇ D 1.
11.8 Berechnungstechniken für mehrfache Integrale Die wichtigsten Werkzeuge zur expliziten Berechnung von mehrfachen Integralen sind der Satz von Fubini und die Transformationsformel. Der Satz von Fubini erlaubt eine Erniedrigung der Dimension, sodass bei seiner vollständigen Ausnutzung sogar eine Zurückführung auf eindimensionale Integrale möglich ist. Die Transformationsformel spielt eine ähnliche Rolle wie die Substitutionsregel in der elementaren Integralrechnung. Sie kann insbesondere dazu dienen, komplizierte Integrationsbereiche auf einfachere zu reduzieren.
225
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
In diesem Abschnitt beschreiben wir die „Benutzeroberfläche“ dieser Sätze, d.h. wir formulieren ihren präzisen Wortlaut und erklären, wie man damit umgeht. Die Beweise selbst erfolgen dann im nächsten Abschnitt. Zum Satz von Fubini Die Erniedrigung in der Dimension des Integrationsbereichs ist eigentlich schon in der Definition des Quaderintegrals B[11.2] angelegt. Dort war ja, fußend auf der kartesischen Produktstruktur eines Quaders, gleich eine Reduktion auf Intervalle als Integrationsmengen, durchgeführt worden. Der Satz von Fubini leistet etwas analoges, wobei wir – dem Aufbau des Integrals entsprechend – zunächst den gesamten Rn als Definitionsbereich wählen und die Dimensionserniedrigung schrittweise vornehmen. Ausgangspunkt ist eine kartesische Zerlegung des Rn entsprechend dem Schema n
p
z2R
n
q
R DR (R ;
R
p; q 2 N fest mit p C q D n
q z
y
z D .z1 ; : : : ; zp ; zpC1 ; : : : ; zn /; „ ƒ‚ … „ ƒ‚ … x y
z D .x; y/:
R
p
x
n
Die Elemente z 2 R werden so als Paare von Elementen .x; y/ mit x 2 Rp , y 2 Rq aufgefasst. A. Satz (von Fubini). Sei F W Rn D Rp ( Rq %! W integrierbar. Dann gilt: Für fast alle y 2 Rq ist die partielle Abbildung x 7! F .x; y/ integrierbar über Rp . R Die Abbildung y 7! Rp F .x; y/ dx ist integrierbar über Rq ( 0, wo nicht definiert).
(i) (ii)
Z (iii) Es gilt
/Z
Z Rn
F .z/ dz D
Rq
Rp
1 F .x; y/ dx dy:
Wie gesagt, dieser Satz wird im nächsten Abschnitt bewiesen. Die nachstehenden Folgerungen werden aber hier schon begründet. B. Bemerkung. Dies ist mehrfach anwendbar, z.B. gilt für F 2 Leb1 .Rn ; W /: Z Rn
1 1 1 Z / /Z /Z F .x1 ; x2 ; : : : ; xn / dx1 dx2 ' ' ' dxn ; ''' F .z/ dz D R
R
R
226
Kapitel 11 Integralrechnung mehrerer Veränderlicher
einschließlich der Existenz aller Zwischenresultate. Ist W D R und F zusätzlich ein Produkt von Funktionen einer Veränderlichen, so erscheint das Ergebnis selbst in Produktform, da man jeweils alles vor das Integralzeichen ziehen kann, was nicht von der aktuellen Variablen abhängt: /Z
Z Rn
f1 .x1 / ' ' ' fn .xn / dx1 ' ' ' dxn D
R
1
/Z
f1 .x1 / dx1 ' ' '
R
1 fn .xn / dxn :
C. Folgerung (zur Koinzidenz). Ist Q ) Rn ein kompakter Quader und F W Q ! W stetig, so liefern die Definitionen H[11.6] und B[11.2] den gleichen Integralbegriff. Beweis. Dies ist klar aus dem ersten Teil von Bemerkung B und der eindimensionalen Koinzidenz T[11.6]. " Noch wichtiger für das konkrete Rechnen sind Integrale über Teilmengen. Der Fubini dafür ist eine simple Konsequenz aus Satz A mittels Nullfortsetzung Die Situation ist folgendermaßen zu beschreiben: Rq
Für eine Menge M - Rn und ein y 2 Rq sei
M
My0 ´ fx 2 Rp j .x; y/ 2 M g die so genannte Schnittprojektion von M in der Höhe y sowie
M"
(x,y)
y
M 00 ´ fy 2 Rq j 9 x 2 Rp W .x; y/ 2 M g;
x
die zweite Projektion von M .
M 'y
Außerdem bezeichnen wir die Lebesgue-Maße in:
Rn ;
mit: , D ,n ; äußeren Maße in:
Rn ;
mit: ,# D ,# n;
Rp ; Rq ,p ;
,q
Rp ; Rq ,p# ; ,# q:
Rp
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
227
Bei Rollentausch von x; y sind natürlich entsprechend die Schnittprojektion Mx00 und die erste Projektion M 0 definiert. D. Satz (von Fubini für Teilmengen). Sei F W M ! W integrierbar. Dann gilt: (i) (ii)
Für fast alle y 2 M 00 ist die partielle Abbildung x 7! F .x; y/ integrierbar über My0 . R Die Abbildung y 7! My0 F .x; y/ dx ist integrierbar über M 00 ( 0, wo nicht definiert). Z
(iii) Es gilt
M
/Z
Z F .z/ dz D
M 00
My0
1 F .x; y/ dx dy:
Beweis. Man wendet einfach Satz A auf die Nullfortsetzung c F an und beachtet, dass c F .x; y/ für alle .x; y/ mit y außerhalb M 00 und für .x; y/ mit y 2 M 00 aber x außerhalb My0 verschwindet. " Die „Handlungsanweisung“ für (iii) besagt: Integriere zuerst nach x (wobei die Integrationsmenge von y abhängen kann!), dann nach y. Natürlich stellt sich die Situation oft komplizierter dar, als es die obige Prinzipfigur nahe legt. Insbesondere kann es passieren, dass die Schnittprojektionen nicht mehr zusammenhängend sind, selbst wenn M zusammenhängend ist. Man erhält eine gute anschauliche Vorstellung dieses Satzes, indem man wie bei einer Computer-Tomographie den p-dimensionalen affinen Unterraum in der Höhe y parallel zum Rp durch die Menge M hindurchfährt. Dabei wird für jedes y, für das wirklich ein Schnitt stattfindet, das p-dimensionale Integral der „Schicht“ von M in der Höhe y gebildet, und zum Schluss werden diese „Schichtintegrale“ q-dimensional aufintegriert. Beim skalaren Integranden 1 erhält man so das Gesamtvolumen aufgebaut aus der q-dimensionalen Aufintegration der p-dimensionalen Schichtvolumina, wie im Folgenden formuliert. Rollentausch von x und y ist natürlich immer möglich und unter entsprechenden Voraussetzungen erlaubt. E. Folgerung (Prinzip von Cavalieri). Sei die Menge A - Rn integrierbar. Dann gilt: (i)
Für fast alle y 2 A00 ist die Menge Ay0 integrierbar in Rp .
(ii)
Die Abbildung y 7! ,p .Ay0 / ist integrierbar über die Menge A00 - Rq ( 0, wo nicht definiert). Z
(iii) Es gilt
,.A/ D
A00
,p .Ay0 / dy:
228
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Beweis. Spezialfall von Satz D für die konstante Funktion F D 1 W A ! R.
"
Insbesondere haben zwei solche Mengen, die in gleicher Höhe y gleichgroße Querschnitte haben, gleiches Volumen. (In dieser Formulierung hat man das Maß in Rp per Identifikation x $ .x; y/ auf Rp ( fyg zu übertragen.) Vgl. das folgende Bild. Rq
R
xn
y
r2-y2 r
R
n-1
x1,...,xn-1
Rp Prinzip von Cavalieri
Zum Ballvolumen
Ganz am Anfang bei einer Veränderlichen war das Integral durch die „Fläche unter dem Graphen“ motiviert worden. Diese Idee erhält jetzt eine präzise Rechtfertigung, indem das Integral als Maß der „Ordinatenmenge“ aufgefasst werden kann. n Ist f W M ! RC 0 (M - R ) eine nichtnegative Funktion, so ist die Ordinatenmenge von f die folgende Teilmenge von Rn ( R:
Of ´ f.x; y/ 2 Rn ( R j x 2 M; 0 0 y 0 f .x/g: Dabei wird wieder RnC1 mit Rn ( R identifiziert. Wird die Ordinatenmenge als integrierbar vorausgesetzt, so ist der Zusammenhang mit dem Integral sehr einfach zu klären: F. Satz. Besitzt die Funktion f W M ! RC 0 eine integrierbare Ordinatenmenge Of , so ist f integrierbar, und es gilt: Z f .x/ dx: (1) ,nC1 .Of / D M
Beweis. Das Prinzip von Cavalieri E kann auf die Ordinatenmenge A ´ Of angewendet werden (mit vertauschten Rollen von x; y). Dabei gilt A0 D M;
A00x D Œ0; f .x/2 Intervall in R;
Somit ist f integrierbar, und es gilt (1).
,1 .A00x / D f .x/: "
Es folgen nun etliche Beispiele über wichtige und immer wieder auftretende Punktmengen. Die Integrierbarkeit der Mengen ergibt sich dabei aus deren Kompaktheit und die Integrierbarkeit der vorkommenden Funktionen aus deren Stetigkeit, ohne dass dies im Einzelnen nochmals gesagt wird. Vgl. die Sätze L[11.6] und R[11.6].
229
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
G. Beispiele. (i)
Ballvolumen im Rn : Wir betrachten den Euklidischen Ball mit Radius r: Bn .r/ ´ f.x1 ; : : : ; xn / 2 Rn j x12 C ' ' ' C xn2 < r 2 g:
Durch vollständige Induktion nach n zeigen wir mit dem Prinzip von Cavalieri E voln .Bn .r// D cn ' r n mit gewissen Konstanten cn 2 RC , die im Laufe der Rechnung bestimmt werden. Induktionsanfang für n D 1: B1 .r/ D 2%r; rŒ H) ,1 .B1 .r// D 2r H) c1 D 2. Induktionsschluss von n % 1 auf n für n $ 2: Wir zerlegen kartesisch, um Folgerung E anzuwenden (vgl. das obige Bild): Rn D Rn&1 ( R;
also p D n % 1, q D 1:
Der zweite kartesische Faktor entspricht der xn -Achse. Für A ´ Bn .r/ sind hier die Projektionen A00 D 2%r; rŒ ˇ , ˚ 2 C y2 < r 2 Ay0 D .x1 ; : : : ; xn&1 / 2 Rn&1 ˇ x12 C ' ' ' C xn&1 ˇ ˚ , 2 < r 2 % y2 D .x1 ; : : : ; xn&1 / 2 Rn&1 ˇ x12 C ' ' ' C xn&1 p D Bn&1 . r 2 % y 2 /
für y 2 A00 :
Somit folgt nach dem Prinzip von Cavalieri: Z r p ,n&1 .Bn&1 . r 2 % y 2 // dy ,n .Bn .r// D &r
Z D
r
&r
p n&1 cn&1 r 2 % y 2 dy
D 2cn&1
Z 0
Z D 2cn&1
r
p n&1 r 2 % y2 dy
0
%=2
D 2cn&1 ' r n
(Induktionsvoraussetzung)
r n&1 sinn&1 ' ' .%r sin '/ d'
Z „0
%=2
sinn ' d' ; ƒ‚ … µ ˇn
(Substitution y D r cos ')
230
Kapitel 11 Integralrechnung mehrerer Veränderlicher
also
cn D 2cn&1 ' ˇn :
Die Zahlwerte der ˇn erhält man durch elementare Produktintegration; vgl. H(i)[5.3]. Damit ergibt sich aus der obigen Rekursionsformel nach etwas „Kosmetik“ vol2m .B2m .r// D vol2mC1 .B2mC1 .r// D (ii)
' m 2m 'r ; mŠ
m2N
' m ' 2mC1 ' r 2mC1 ; m 2 N0 : 1 ' 3 ' ' ' .2m C 1/
n D 2, W D R, E ) R2 die Ellipsenscheibe: ˇ 2 % ˇx y2 ˇ E ´ .x; y/ ˇ 2 C 2 0 1 ; a > 0; b > 0: a b +
b
Berechne
Z
J ´
E
.x 2 % y/ dx dy:
E
Lösung: Wir integrieren zuerst nach y, dann nach x. Hier ist p D q D 1, und die Projektionen lauten: 0
Ex00
E D Œ%a; a2;
x
a
ˇ 2 % ˇx y2 ˇ D y ˇ 2 C 2 0 1 für x 2 Œ%a; a2: a b +
Anschaulich ist Ex00 ein Intervall. Analytisch ergibt sich das aus der äquivalenten Umrechnung: r 1 / y2 x2 x2 x2 2 2 C 0 1 () y 0 b () jyj 0 b : 1 % 1 % a2 b2 a2 a2 Somit gilt
h p i p Ex00 D %b 1 % x 2 =a2 ; b 1 % x 2 =a2 :
Nach Fubini (D) ergibt sich Za J D &a
0 p B B @
b
&b
p
2 2 1&x Z =a
1&x 2 =a2
1 C .x 2 % y/dy C Adx D
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
231
1 0 p 'b 1&x 2 =a2 Za 2 1 A dx D @ x2y % y2 p 2 yD&b 1&x 2 =a2 &a
r r 1 1! / / Za 0 x2 1 2 x2 x2 x2 1 2 2 2 dx D x b 1% 2 % b 1% 2 Cx b 1% 2 C b 1% 2 a 2 a a 2 a &a
r
Za D 2b &a
x
2
4b x2 1 % 2 dx D a a
Za 0
p 4b a4 ' ' 3 D a b: x 2 a2 % x 2 dx D a 16 4
Das zuletzt verbleibende einfache Integral kann elementar ausgewertet werden, z.B. durch die Substitution x D a cos t. (iii) Wird bei (ii) der Integrand 1 gewählt, so ergibt sich der Flächeninhalt der Ellipsenscheibe: Z ,2 .E/ D
Za
E
1 dx dy D &a
Za h ib p1&x 2 =a2 p y D 2 yD&b
&a
Za D &a
D 4b
0 p B B @
&b
1&x =a2
r
b
p
2 2 1&x Z =a
C dy C A dx
1&x 2 =a2
dx
x2 2b 1 % 2 dx D 4b a Z%=2q
1
Za r x2 1 % 2 dx a 0
Z%=2 cos2 ' d' D 'ab: 1 % sin ' a cos ' d' D 4ab
0
2
0
Dabei wurde beim Übergang von der zweiten zur dritten Zeile die Substitution x D a sin ' vorgenommen und das letzte Integral mit dem bekannten Wert '=4 eingebracht. Eine viel einfachere Möglichkeit zur Berechnung des Ellipsoidvolumens aus dem Ballvolumen wird sich mit der Transformationsformel ergeben. Vgl. Beispiel K(iv). (iv) Ist F W B3 .1/ ! W integrierbar und die Integrationsmenge der dreidimensionale Euklidische Einheitsball ˇ , ˚ B3 .1/ ´ .x; y; z/ 2 R3 ˇ x 2 C y 2 C z 2 < 1 ;
232
Kapitel 11 Integralrechnung mehrerer Veränderlicher
so liefert die zweimalige Anwendung von Fubini: 1 1 0 p 0 p 2 2 1&y Z Z1 Z &z Z1&z 2 C C B B C dy C dz: B F .x; y; z/ dx dy dz D B F .x; y; z/dx A A @ @ B3 .1/ p p &1 2 & 1&z
&
1&y 2 &z 2
Im ersten Schritt wird R3 als R2 (R aufgefasst wird, wobei die Variable in R2 das Paar .x; y/ und die Variable in R das z ist. Die Schnittprojektion in der Höhe z 2 Œ%1; 12 ist dann f.x; y/ 2 R2 j x 2 C y 2 0 1 % z 2 g (für z ¤ ˙1 eine Kreisscheibe). Die zugehörige Projektion ist Œ%1; 12. Im zweiten Schritt wird R2 aufgefasst als R ( R mit den Variablen x im ersten Faktor und y im zweiten Faktor. Die Schnittprojektion (der vorangehenden Schnittpro2 2 2 jektion) in der Höhe p p y ist dann fx 2 R j x 0 1 % z % y g, also das Intervall 2 2 2 2 Œ% 1 % y % zp; 1 % yp % z 2, und ihre Projektion ist fy 2 R j y 2 0 1 % z 2 g, also das Intervall Œ% 1 % z 2 ; 1 % z 2 2. Zum Transformationssatz Der Transformationssatz ist die höherdimensionale Verallgemeinerung der Integration durch Substitution aus D[5.3]. Der Integrand darf aber jetzt sehr viel allgemeiner sein als dort, nämlich integrierbar statt nur stetig. Andererseits ist die transformierende Abbildung nun stärker eingeschränkt, nämlich ein so genannter Diffeomorphismus. H. Definition. Sind U und V offene Teilmengen von Rn und ist die Abbildung ˆ W U ! V bijektiv sowie beide Abbildungen ˆ und ˆ&1 von der Klasse C k mit einem k $ 1, so heißt ˆ ein Diffeomorphismus der Klasse C k oder ein C k -Diffeomorphismus. I. Satz (Transformationssatz). Sei ˆ W U ! V ein Diffeomorphismus der Klasse C 1 zwischen offenen Mengen U , V in Rn . Ist die Abbildung F W V ! W integrierbar, so ist auch die Abbildung .F ı ˆ/ ' j det ˆ0 j W U ! W integrierbar, und es gilt die Transformationsformel: Z ˆ.U /
Z F .y/ dy D
U
F .ˆ.x// ' j det ˆ0 .x/j dx:
Der Beweis wird im folgenden Abschnitt erbracht.Die Folgerungen, die wir hier aus diesem Satz ziehen, werden aber hier schon begründet. Das Symbol ˆ0 .x/ bezeichnet die Funktionalmatrix (3)[10.6] und det ˆ0 .x/ ihre Determinante, die so genannte Funktionaldeterminante oder Jacobi-Determinante.
233
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
Warnung: Die „Laufrichtungen“ der beteiligten Abbildungen müssen in dieser Art und Weise zueinander passen! Vgl. das folgende Bild.
Φ
U
V = Φ(U)
F Koordinaten x
Koordinaten y
FoΦ W
Bei Anwendung dieses Satzes gibt es oft „Ausnahmepunkte“, an denen die Bijektivität oder die Diffeomorphie gestört sind. Trotzdem kann auch in solchen Fällen transformiert werden, wenn die Ausnahmepunkte eine Nullmenge bilden. Es gilt folgende „anwendungsorientierte“ Variante: J. Folgerung. Sei U offen in Rn und die Abbildung ˆ W U ! Rn von der Klasse C 1 . Sei A eine Teilmenge von U , deren Rand @A eine Nullmenge von Rn ist. Ferner sei ˆ.Aı / offen und ˆjAı W Aı ! ˆ.Aı / ein Diffeomorphismus der Klasse C 1 . Ist die Abbildung F W ˆ.A/ ! W integrierbar, so ist auch die Abbildung .F ı ˆ/ ' j det ˆ0 j W A ! W integrierbar und es gilt: Z
Z ˆ.A/
F .y/ dy D
A
F .ˆ.x// ' j det ˆ0 .x/j dx:
Beweis. Wir setzen U0 ´ Aı . Dann unterscheiden sich A und U0 nur um Punkte von @A, also um eine Nullmenge. Ebenso unterscheiden sich die Bildmengen ˆ.A/ und ˆ.U0 / µ V0 nur um Punkte von ˆ.@A/, also um eine Nullmenge laut N([11.3]). Somit ist Satz I auf U0 ; V0 anwendbar und liefert die Behauptung.
"
Hinweis: In E[12.1] wird eine Bedingung dafür angegeben, wann eine injektive C k Abbildung ˆ ein Diffeomorphismus ist, ohne dass man ˆ&1 zu kennen braucht: es reicht dass det ˆ0 .x/ nirgends verschwindet. Es folgen nun wieder Beispiele zur Anwendung der Transformationsformel, wobei die Integrierbarkeitseigenschaften entweder als Voraussetzungen angegeben sind oder sich wie oben aus der Kompaktheit der betreffenden Mengen und der Stetigkeit der beteiligten Funktionen ergeben. Meistens ist es sinnvoll, die gegebene Menge als Bild unter einem Diffeomorphismus aus einer einfacheren Menge herzustellen. Dann kann die Transformationsformel von links nach rechts gelesen werden und liefert in Gestalt der rechten Seite das Resultat.
234
Kapitel 11 Integralrechnung mehrerer Veränderlicher
K. Beispiele. (i) Sei n D 2 und D die Dreieckscheibe mit den Ecken 0 D .0; 0/, a D .˛; ˇ/, b D .1; ı/. R Für F 2 Leb1 .D; W / soll D F .x; y/ dx dy auf einfache Integrale zurückgeführt werden. Lösung: Man kombiniert die Transformationsformel mit dem Satz von Fubini. O.B.d.A. kann man a; b als linear unabhängig annehmen, da sonst D eine Nullmenge ist. Hier gewinnt man das gegebene Dreieck D aus einem einfacheren Dreieck C mittels einer linearen Abbildung ˆ: y
v
(0,1)
b
Φ
v
D C
0
1-v
a
x
u (1,0)
0
C habe die Ecken 0 D .0; 0/, .1; 0/, .0; 1/. ˆ sollte als lineare Abbildung so gewählt werden, dass a; b als Bilder der Standardbasisvektoren herauskommen. Dies leistet ˆ mit den Abbildungsgleichungen ( ˆW
x D ˛u C 1 v y D ˇu C ıv
;
0
also ˆ D
/
˛ ˇ
1 ı
1 ;
det ˆ0 D ˛ı % ˇ1:
Tatsächlich gilt dann ˆ.0; 0/ D .0; 0/;
ˆ.1; 0/ D .˛; ˇ/ D a;
ˆ.0; 1/ D .1; ı/ D b;
und auch die von diesen Punkten erzeugten Dreiecke gehen ineinander über, da sie die konvexen Hüllen der Eckpunkte sind und konvexe Hüllen bei linearen Abbildungen erhalten bleiben: ˆ.C / D D. (Solche einfachen Zusammenhänge sollten aus der analytischen Geometrie bekannt sein. Man kann die Gleichung ˆ.C / D D aber auch direkt bestätigen, indem man verwendet, dass eine Dreieckscheibe in R2 mit den Eckpunkten a0 ; a1 ; a2 definiert ist als die Menge der Punkte t0 a0 C t1 a1 C t2 a2 mit Koeffizienten ti $ 0 und t0 C t1 C t2 D 1.)
235
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale
Wir nennen C die Standard-Dreieckscheibe oder das Standard-Simplex in R2 . Nun formt man um: Z Z F .x; y/ dx dy D F .x; y/ dx dy D
Z D Z D
ˆ.C /
C
C
F .ˆ.u; v// j det ˆ0 .u; v/j du dv F .˛u C 1 v; ˇu C ıv/ j˛ı % ˇ1j du dv
D j˛ı % ˇ1j
Z 0
1
/Z
1&v
0
1 F .˛u C 1 v; ˇu C ıv/ du dv:
Dabei wurde beim Übergang von der ersten Zeile zur zweiten die Transformationsformel und beim Übergang von der dritten zur vierten Zeile der Satz von Fubini angewendet. (ii)
Man berechne Z ˇ 2 2 ˚ , e %x % y dx dy; B2 .%/ ´ .x; y/ 2 R2 ˇ x 2 C y 2 < %2 ; J ´
% > 0:
B2 .%/ Lösung: Wir transformieren mittels Polarkoordinaten ( / x D r ' cos ' cos ' 0 ˆW ; ˆ D sin ' y D r ' sin '
%r sin ' r cos '
1 ;
det ˆ0 D r $ 0:
Wiederum ist es günstig, die Kreisscheibe B2 .%/ als Bild zu erzeugen. ϕ
y
π Aρ
r
ρ
−π
Φ
B2(ρ)
x
ρ
236
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Mittels ˆ entsteht B2 .%/ aus dem Rechteck A% ´ f.r; '/ j 0 < r < %; %' < ' < 'g; allerdings ohne den Mittelpunkt und ohne den Teil auf der negativen x-Achse, d.h. ˆ.A% / ist die geschlitzte Kreisscheibe (der Durchschnitt von B2 .%/ mit der geschlitzten Ebene). Tatsächlich ist die Restriktion ˆjA% ein C 1 -Diffeomorphismus auf die geschlitzte Kreisscheibe; denn die Umkehrabbildung hat nach R[4.4] die Abbildungsleichungen p r D x2 C y2 ' D Arg.x; y/: Weiter ist @A% Nullmenge in R2 . Somit liefert die Anwendung von Folgerung J (U ist hier der ganze R2 ): Z Z 2 2 2 J D e %x % y dx dy D e %r j det ˆ0 .r; '/j dr d' ˆ.A% / A% Z D also:
A%
2
e %r r dr d' D Z B2 .%/
Z % 0
2
e %r r dr '
' 2 2 % 1 ' 2'; d' D % e %r 2 %' 0
Z '
3 2 2 2. e %x % y dx dy D 1 % e %% ' ': 2
Dies gilt genauso, für den Abschluss B .%/ anstelle von B2 .%/, da die beiden Mengen sich nur um eine Kreislinie unterscheiden, die ja nach P(iv)[11.3] eine Nullmenge in R2 ist. (iii) Damit wird erneut das Gaußsche Fehlerintegral Z 1 2 e %x dx; &1
berechenbar, obwohl keine elementare Stammfunktion vorhanden ist! Ein ganz anderer Weg dafür war in I[9.2] eingeschlagen worden. Man betrachtet hierzu
Z a
2
e %x dx
für a > 0: %a Quadrieren und Rückwärtsanwenden von Fubini liefert: Z a Z a Z a Z a 2 2 2 2 e %y dy D e %x dx ' e %x dx D e %x dx ' I.a/2 D %a %a %a %a Z 2 2 D e %x % y dx dy; Qa ´ Œ%a; a2 ( Œ%a; a2: Qa I.a/ ´
237
Abschnitt 11.8 Berechnungstechniken für mehrfache Integrale y
B 2 (a
Der Vergleich mit den Kreisscheiben, die dem Quadrat Qa ein- bzw. umbeschrieben sind, ergibt nun unter Verwendung von (ii):
2 ) Qa x B2(a)
Z 2
B .a/ also
2 2 e %x % y dx dy
0, so stellen wir dar Qı D
1 [
Qk ;
Qk kompakte, paarweise volumfremde Würfel;
kD1
sodass für ˇ ˇ Mk ´ max ˇdet ' 0 ˇ ;
ˇ ˇ mk ´ min ˇdet ' 0 ˇ
gilt:
Qk
Qk
Mk % mk < ":
Dies ist möglich wegen der gleichmäßigen Stetigkeit von jdet ' 0 j auf Q. Dann gilt, wenn man Lemma L bei den folgenden Summen gliedweise anwendet: 1 X
mk ,.Qk / 0 ,.'.Q// D
kD1
1 X
,.'.Qk // 0
kD1
1 X
Mk ,.Qk /;
kD1
wobei die Gleichheit in der Mitte aus Q[11.6] folgt. Andererseits gilt, wenn man Folgerung M und die Standard-Abschätzung M[11.6] bei den Summen gliedweise anwendet: 1 X kD1
Z mk ,.Qk / 0
Q
1 Z ˇ X ˇ ˇdet ' 0 ˇ D kD1
Qk
1 ˇ ˇ X ˇdet ' 0 ˇ 0 Mk ,.Qk /;
wobei die Gleichheit in der Mitte aus P[11.6] folgt.
kD1
260
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Subtraktion liefert: 1 X
%",.Q/ 0
Z .mk % Mk /,.Qk / 0 ,.'.Q// %
kD1 1 X
0
j det ' 0 j
Q
.Mk % mk /,.Qk / 0 ",.Q/:
kD1
Somit ist der mittlere Term betragsmäßig beliebig klein, also gleich 0.
"
N. Lemma. Sei F 2 K10 .Rn ; W / und Q ) U kompakter Quader. Dann gilt Z Z F .y/ dy D F .'.x// ' j det ' 0 .x/j dx '.Q/
Q
einschließlich der Integrierbarkeit auf beiden Seiten. Beweis. Die Integrale existieren, da die Integranden stetig und die Integrationsmengen kompakt sind.
U
Man beachte, wie die Abbildungen situiert sind.
Q
V
Die Grundidee ist wie folgt: Für konstantes F auf Q ist die Behauptung nach Folgerung M bekannt Wir nähern deshalb das gegebene F durch eine Funktion an, die auf integrierbaren Teilen der Definitionsmenge '.Q/ konstant ist.
ϕ
N [
Qj ;
F
Foϕ W
Gegeben " > 0, stellen wir wieder dar: QD
ϕ(Q)
Qj kompakte, paarweise volumfremde Quader;
j D1
wobei für jedes j (wegen der gleichmäßigen Stetigkeit von F ı ') erreichbar ist: x //k < " kF .'.x// % F .'.e
8 x; e x 2 Qj :
Wir wählen 4j 2 Qj fest, setzen cj ´ F .'.4j // und betrachten die Abbildung: (12)
G´
N X j D1
cj -'.Qj / :
261
Abschnitt 11.9 Satz von Fubini und Transformationsformel
Jeder Summand ist integrierbar, also auch G selbst. G ist in jedem Inneren '.Qj /ı D '.Qjı / konstant gleich cj und erfüllt damit (13)
kF .'.x// % G.'.x//k < "
f.ü. in Q;
also (14)
kF .y/ % G.y/k < "
f.ü. in '.Q/:
Für die Abbildung G gilt die Behauptung schon: Z Z GD .G ı '/ ' j det ' 0 j: '.Q/
Q
Dazu hat man lediglich die Gleichung (12) auf beiden Seiten über '.Q/ zu integrieren, und danach Folgerung M auf Qj anzuwenden. Dabei kann dann cj durch Gj'.Qj /ı ersetzt werden. Mit (13) und (14) ergibt sich weiter: -Z Z ˇˇ ˇ ˇ - .F ı '/ ' ˇdet ' 0 ˇ % .G ı '/ ' ˇdet ' 0 ˇ- 0 ",.'.Q//; Q
Q
-Z -
Z
'.Q/
F%
'.Q/
G- 0 ",.'.Q//:
Daraus erhält man mit der Dreiecksungleichung in W -Z Z ˇˇ ˇdet ' 0 ˇ- 0 2",.'.Q//; .F ı '/ ' F % Q
'.Q/
und " # 0 gibt die Behauptung.
"
Für den nächsten Approximationsschritt benötigt man den folgenden Hilfssatz, der gleich in einem allgemeineren Rahmen behandelt wird, da er dort nicht schwieriger zu beweisen ist: O. Lemma. Zu zwei disjunkten abgeschlossenen Teilmengen C0 ¤ ¿ und C1 ¤ ¿ eines metrischen Raumes X existiert stets eine Urysohn-Funktion, d.h. eine stetige Funktion u W X ! Œ0; 12 mit ujC0 D 0 und ujC1 D 1. Beweis. Der Beweis ist sehr anschaulich und gut zu verstehen: Man kann u aus den Distanzfunktionen der beiden Mengen aufbauen; vgl. K(i)[6.2]. x δ0(x)
C
0
δ (x) 1
C1
262
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Es sei ı0 die Distanzfunktion von C0 und ı1 die Distanzfunktion von C0 . Die Funktion u´
ı0 ı0 C ı1
leistet das Verlangte: Sie ist stetig, da der Nenner wegen C0 \ C1 D ¿ keine Nullstellen besitzt, und ihre Werte liegen in Œ0; 12. Für x 2 C0 ist ı0 .x/ D 0, also u.x/ D 0, und für x 2 C1 ist ı1 .x/ D 0, also u.x/ D ı0 .x/=.ı0 .x/ C 0/ D 1. " P. Lemma. Sei F 2 Leb1 .Rn ; W / und V0 offen in Rn mit Tr.F / - V0 . Dann existiert eine approximierende Folge .Fk / für F mit Tr.Fk / - V0 . Beweis. Sei o.B.d.A. V0 ¤ Rn , sei Gk irgendeine approximierende Folge für F , und sei h W Rn ! Œ0; 12 eine Urysohn-Funktion für die Mengen C0 ´ Rn n V0 und C1 ´ Tr.F /, somit hjTr.F / D 1; hj.Rn n V0 / D 0: Dann leistet die Folge Fk ´ h ' Gk das Verlangte: Es gilt Fk 2 K10 .Rn ; W /: Klar, die Abbildung ist stetig und Tr.Fk / - Tr.h/ \ Tr.Gk / - V0 :. Hiernach ist Tr.Fk / als abgeschlossene Menge der kompakten Menge Tr.Gk / selbst kompakt. Weiter gilt fast überall die Konvergenz Fk .x/ D h.x/ ' Gk .x/ ! h.x/ ' F .x/, also fast überall in Tr.Fk /: Fk .x/ ! F .x/ und fast überall in Rn n V0 : Fk .x/ ! 0 D F .x/. Schließlich ist .Fk / Cauchy-Folge in K10 .Rn ; W / aufgrund der Abschätzung Z kh.x/Gk .x/ % h.x/G` .x/k dx kFk % F` k1 D Rn Z 0 kGk .x/ % G` .x/k dx D kGk % G` k1 : Rn
Damit sind alle erforderlichen Eigenschaften bestätigt.
"
Q. Satz (Transformationsformel für Quader). Sei F 2 Leb1 .Rn ; W / und Q ) U kompakter Quader. Dann ist F über '.Q/ integrierbar, ebenso .F ı '/ ' j det ' 0 j über Q, und es gilt: Z Z ˇ ˇ F .'.x// ' ˇdet ' 0 .x/ˇ dx: F .y/ dy D '.Q/
Q
Beweis. Dies ist exakt die Verallgemeinerung von Lemma N auf integrierbares F . Wir wählen einen kompakten Quader R mit Q ) Rı ) R ) U;
263
Abschnitt 11.9 Satz von Fubini und Transformationsformel
z.B. möglich als „Parallelquader“ in kleinem Abstand: Sei nämlich Rj der Quader, der aus Q durch Verdickung um 1=j nach allen Seiten entsteht (j 2 N). Angenommen es gibt zu jedem j ein pj 2 Rj \ .Rn n U /, also mit dR .pj / ! 0. Dann existiert eine Teilfolge, o.B.d.A. pj selbst, die konvergiert: pj ! p0 . Dann ist p0 2 Q und auch p0 2 .Rn n U /, da diese Mengen abgeschlossen sind. Diese Mengen sind aber punktfremd.
V
U
ϕ
Q
ϕ(Q) ϕ(R)
R
Dann gilt auch für die Bilder: '.Q/ ) '.Rı / ) '.R/ ) V: „ƒ‚… „ƒ‚… „ƒ‚… kompakt offen kompakt Die Integrierbarkeit von F über '.Q/ ist klar, da '.Q/ kompakt ist. e ´ .F j'.Q//b , o.B.d.A. Tr.Fk / - '.R/ laut Sei nun .Fk / approximierend für F Lemma P. Dann besteht die Konvergenz Z (15)
R
ˇ ˇ .Fk ı '/ ' ˇdet ' 0 ˇ D
Z
Z
Z '.R/
Fk D
Rn
Fk %!
Rn
eD F
Z '.Q/
F;
worin beim ersten Gleichheitszeichen Lemma N eingebracht wurde. Nun sei definiert: ( Gk .x/ ´
Fk .'.x// ' jdet ' 0 .x/j ; 0;
x2U x 2 Rn n Tr.Fk ı '/:
Der Gesamtbeweis ist nach (15) erbracht, wenn gezeigt werden kann: Zwischenbehauptung: .Gk / ist approximierend für ...F ı '/ ' jdet ' 0 j/jQ/b. R linke Seite von (15) gleich Rn Gk , und dies konvergiert gegen RDenn dann ist die 0 Q .F ı '/ jdet ' j.
264
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Zwischenbeweis: 1) Gk ist wohldefiniert und aus K10 .Rn ; W /: Dies ist klar, da beide Definitionen von Gk auf Rn nTr.Fk ı'/ null liefern und beide Definitionsmengen offen sind. Außerdem gilt: Tr.Gk / - Tr.Fk ı '/ - ' &1 .Tr.Fk // - R: 2) Gk konvergiert fast überall gegen ...F ı '/ ' jdet ' 0 j/jQ/b: Es gelten nämlich die Konvergenzen ˇ ˇ Gk .x/ %! F .'.x// ' ˇdet ' 0 .x/ˇ f.ü. in Q f.ü. in Rn n Q;
Gk .x/ %! 0 e ist. das zweite, weil Fk approximierend für F
3) .Gk / ist Cauchy-Folge: Dies beruht auf der Umformung Z Z (da Tr.Gk / - R) kGk % G` k1 D kGk % G` k D kGk % G` k D Rn R Z ˇ ˇ D (da R ) U ) kFk ı ' % F` ı 'k ' ˇdet ' 0 ˇ R Z Z D kFk % F` k D kFk % F` k D kFk % F` k1 ; Rn
'.R/
worin beim Übergang zur letzten Zeile erneut Lemma N verwendet wurde.
"
Nach all diesen Schritten folgt nun schließlich die Hauptsache: R. Satz (Transformationssatz). Seien U , V offen in Rn und ' W U ! V ein C 1 Diffeomorphismus. Ist F 2 Leb1 .V; W /, so ist .F ı '/ ' j det ' 0 j 2 Leb1 .U; W /, und es gilt die Transformationsformel Z Z ˇ ˇ F .y/ dy D F .'.x// ' ˇdet ' 0 .x/ˇ dx: '.U /
U
Beweis. Wir stellen wieder dar: U D
1 [
Qk ; Qk kompakte, paarweise volumfremde Quader, also V D
kD1
Nach Satz Q gilt:
1 [ kD1
Z
Z '.Qk /
F D
Qk
ˇ ˇ .F ı '/ ' ˇdet ' 0 ˇ :
'.Qk /:
265
Abschnitt 11.9 Satz von Fubini und Transformationsformel
Aufsummieren für k 2 N gibt die Behauptung und ist erlaubt, da der Zerlegungssatz P[11.6] wegen Z 1 Z X kF k D kF k ; kD1
1 Z X kD1
Qk
'.Qk /
V
1 Z ˇ- X ˇ -.F ı '/ ' ˇdet ' 0 ˇ - D kD1
D
Qk
ˇ ˇ kF ı 'k ' ˇdet ' 0 ˇ
1 Z X
kD1
'.Qk /
Z kF k D
V
kF k
anwendbar ist.
"
S. Satz. Seien U; V offen in Rn und ' W U ! V ein C 1 -Diffeomorphismus. Dann besteht die Äquivalenz: F 2 Leb1 .V; W / () .F ı '/ ' j det ' 0 j 2 Leb1 .U; W /: Beweis. Zur Implikation H) : Diese ist klar aus Satz R. Zur Implikation (H : Man wendet die ursprüngliche Fassung auf ' &1 anstelle von ' e ´ .F ı '/ ' jdet ' 0 j: an. Dann folgt für F ˇ ˇ ˇ ˇ ˇ ˇ e ı ' &1 / ' ˇdet.' &1 /0 ˇ D .F ı ' ı ' &1 / ' ˇdet.' 0 ı ' &1 /ˇ ' ˇdet.' &1 /0 ˇ; .F „ ƒ‚ … „ ƒ‚ … F 1 das zweite aus F[10.2], da .' &1 /0 D ' 0&1 ı ' &1 .
"
Beweis des Hilfssatzes G aus der linearen Algebra Aus den Grundeigenschaften (i) und (ii) der Funktion % deduziert man zunächst weitere Regeln: 1) Setzt man in der positiven Homogenität (i): + D 0, so folgt %.v1 ; : : : ; vn / D 0, sobald ein vi D 0 ist. 2) Dann kann man die Scherungsinvarianz (ii) erweitern zu %.v1 ; : : : ; vi C +vk ; : : : ; vn / D %.v1 ; : : : ; vn /;
i ¤k
für beliebiges + 2 K. Für + D 0 ist dies trivial richtig. Bei + ¤ 0 führt man an der i -ten und k-ten Stelle der Argumentliste folgende Veränderungen durch, während alle anderen Stellen unverändert bleiben: (i) (ii) (i) vi ; vk %%%! +vi ; vk %%%! +vi ; vk C +vi %%%! vi ; vk C +vi :
266
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Beim ersten Schritt geht der Funktionswert in das j+j-Fache über, beim zweiten ändert er sich nicht, beim dritten geht er in das j1=+j-Fache über, bleibt also insgesamt erhalten. 3) Diesen Schritt kann man dann mehrfach tun mit dem Effekt, dass zum Argument vi an der i -ten Stelle eine beliebige Linearkombination der anderen Argumente hinzuaddiert werden darf, ohne dass sich der Funktionswert von % ändert. 4) Daraus folgt schließlich, dass % immer dann den Wert 0 annimmt, wenn die Vektoren der Argumentliste linear abhängig sind. Denn in diesem Fall kann man einen der Vektoren, etwa vi , als Linearkombination der anderen darstellen und dann diese Linearkombination an der i -ten Stelle von vi abziehen, worauf dann 1) anwendbar wird. Nun ergibt sich die endgültige Behauptung durch vollständige Induktion nach n D dim V . Dabei sei die Basis b1 ; : : : ; bn von V fest gegeben. Induktionsanfang: Für n D 1 ist die Behauptung klar aus der positiven Homogenität selbst. (Scherungsinvarianz gibt es in der Dimension 1 gar nicht.) Induktionsschluss von n % 1 auf n für n $ 2: Zunächst sei angenommen, dass die Vektoren b1 ; : : : ; bn&1 ; vn linear unabhängig sind. Dann gelten Darstellungen der Art ( v 0 C +i vn ; i 0 n % 1 vi D i0 mit vi0 2 span.b1 ; : : : ; bn&1 / für alle i: vn C +bn ; i D n Hieraus folgt %.v1 ; : : : ; vn&1 ; vn / (A)
0 D %.v10 ; : : : ; vn&1 ; vn / wegen 2) ˇ ˇ 0 0 D ˇdet .v1 ; : : : ; vn&1 /ˇ ' %.b1 ; : : : ; bn&1 ; vn / nach IV ˇ ˇ 0 D ˇdet .v10 ; : : : ; vn&1 /ˇ ' j+j ' %.b1 ; : : : ; bn&1 ; bn / wegen 2) und (i):
0 Darin bezeichnet det .v10 ; : : : ; vn&1 / die Determinante der linearen Abbildung, die 0 0 b1 ; : : : ; bn&1 in v1 ; : : : ; vn&1 abbildet, und die Abkürzung IV weist auf die Induktionsvoraussetzung hin. Eine analoge Rechnung liefert aufgrund bekannter Determinantenregeln 0 det .v1 ; : : : ; vn&1 ; vn / D det .v10 ; : : : ; vn&1 ; vn /
(B)
0 D det .v10 ; : : : ; vn&1 / ' det .b1 ; : : : ; bn&1 ; vn / 0 D det .v10 ; : : : ; vn&1 / ' + ' 1:
Durch Kombination von (A) und (B) folgt die Behauptung %.v1 ; : : : ; vn / D jdet .v1 ; : : : ; vn /j ' %.b1 ; : : : ; bn /
Abschnitt 11.9 Satz von Fubini und Transformationsformel
267
in diesem Fall. Analog ergibt sich die gleiche Behauptung, wenn die Rolle von vn von einem anderen vk übernommen wird, d.h. im Fall der linearen Unabhängigkeit des Systems b1 ; : : : ; bn&1 ; vk . Sind schließlich alle diese Systeme linear abhängig, so liegen die Argumentvektoren v1 ; : : : ; vn in der Hyperebene span.b1 ; : : : ; bn&1 /, sind also linear abhängig, und beide Seiten der Behauptung haben nach 1) den Wert 0. " Nachdem jetzt der Satz von Fubini und die Transformationsformel bewiesen sind, stehen auch die in Abschnitt 11.8 gezogenen Folgerungen auf sicherem Boden und können weiteren Überlegungen zugrunde gelegt werden. # Anwendung des Satzes von Fubini auf die Reihenlehre Wie man Summen und Reihen als Integrale auffassen kann, war schon in Y[11.6] geschildert worden. Mit dieser Interpretation ergeben sich aus dem Satz von Fubini auf einfache Weise entsprechende Aussagen der Reihenlehre. T. Satz (großer Umordnungssatz). Gegeben sei eine unendliche Matrix .cij /.i;j /2N0 (N0 von Elementen von W , d.h. eine Abbildung N0 ( N0 ! W , .i; j / 7! cij . Es gebe ein K 2 R derart, dass für alle endlichen Teilmengen S ) N0 ( N0 gilt: X - -cij - 0 K: .i;j /2S
Die unendliche Matrix heißt dann absolut summierbar. Unter dieser Voraussetzung besteht die Gleichung (16)
U ´
1 1 3X X
1 1 3X . . X cij cij D j D0 i D0
i D0 j D0
einschließlich der absoluten Konvergenz der vorkommenden Reihen. Dieser gemeinsame Wert entsteht auch, indem die Elemente der Matrix irgendwie hintereinander aufgeschrieben und darüber die Reihe gebildet wird, die dann ebenfalls absolut konvergiert. Genauer: Ist ' W N0 ! N0 ( N0 eine Durchnummerierung von N0 ( N0 , so gilt auch: (17)
U D
1 X
c'.`/ ;
`D0
einschließlich der absoluten Konvergenz dieser Reihe. Beweis. Um zu einer Integral-Interpretation zu gelangen, ordnen wir hier der Matrix .cij / eine „stückweise konstante“ Funktion F zu (diesmal abhängig von zwei Veränderlichen), indem wir setzen C F W RC 0 ( R0 ! W;
F .x; y/ ´ cŒx-Œy- :
268
Kapitel 11 Integralrechnung mehrerer Veränderlicher
F .x; y/ hat also in dem „halboffenen“ Quadrat Œi; i C 1Œ ( Œj; j C 1Œ den konstanten Wert cij . (Die Korrespondenz zwischen den „Gitterpunkten“ .i; j / und diesen Quadraten sollte man für die ganze Argumentation im Auge behalten.) C Wir verwenden nun zur Ausschöpfung von RC 0 ( R0 die folgenden Quadrate Qk mit den zugehörigen Gitterpunktmengen Sk :
Qk ´ Œ0; k C 122 ;
Sk ´ f0; : : : ; kg2 ;
Über Qk sind F und kF k integrierbar und Z Z X cij ; F D kF k D Qk
Qk
.i;j /2Sk
k D 0; 1; : : : : X - -cij - 0 K:
.i;j /2Sk
C Daraus folgt nach dem Ausschöpfungssatz J[11.6]: F 2 Leb1 .RC 0 ( R0 ; W /, und der Satz von Fubini D[11.8] ergibt weiter:
Z
Z
C RC 0 (R0
F D
1 3Z 1 0
0
Z
.
F .x; y/ dx dy D
1 1 3X
0
1 3X 1 . . X ciŒy- dy D cij ;
i D0
j D0 i D0
wobei für den eindimensionalen Fall (13)[11.6] verwendet wurde. Bei Vertauschung der Rollen von x; y ergibt sich analog: Z C RC 0 (R0
F D
1 3X 1 X
. cij :
i D0 j D0
Entsprechend verfährt man mit kF k anstelle von F . Das beweist den ersten Teil des Satzes. C Für den Rest verwenden wir eine abgeänderte Ausschöpfung von RC 0 ( R0 , nämlich durch die Mengen
Ak ´
k [
R`
mit R` ´ Œ'1 .`/; '1 .`/ C 1Œ ( Œ'2 .`/; '2 .`/ C 1Œ ;
`D0
wobei '1 , '2 die Komponentenfunktionen von ' sind. Dann gilt Z Ak
F D
k X
Z c'.`/ ;
`D0
Ak
kF k D
k X -c'.`/ - 0 K: `D0
Somit folgt durch Grenzübergang k ! 1 genau wie im ersten Teil Z C RC 0 (R0
F D
1 X `D0
c'.`/ ;
Abschnitt 11.9 Satz von Fubini und Transformationsformel
269
einschließlich der Variante für die Norm, also die absolute Konvergenz. Der gemeinsame Wert U der Behauptung ist in dieser Integral-Interpretation gegeben durch Z C RC 0 (R0
F:
Die absolute Konvergenz ergibt sich automatisch, indem man das Bisherige einfach - " auf die Matrix .-cij -/.i;j /2N0 (N0 anstelle .cij /.i;j /2N0 (N0 anwendet. Aus dem großen Umordnungssatz ziehen wir eine Reihe von Folgerungen, die in der Analysis immer wieder zur Umformung von Reihen verwendet werden: U. Folgerung (Doppelreihensatz). Sei .cij /.i;j /2N0 (N0 wie in Satz T eine unendliche Matrix von Elementen von W . Konvergiert die Reihe 1 X
c0.`/
`D0
für irgendeine feste Durchnummerierung 6 W N0 ! N0 (N0 absolut, so ist die Matrix .cij /.i;j /2N0 (N0 absolut summierbar. Somit bestehen dann beide Behauptungen (16), (17) des Satzes T; insbesondere gilt für jede Durchnummerierung ' W N0 ! N0 ( N0 1 X
c'.`/ D
1 X
c0.`/ ;
`D0
`D0
immer einschließlich der absoluten Konvergenz. Beweis von U. Ein mögliches K für die Anwendung von Satz T ist einfach gegeben durch 1 X -c0.`/ - : K´ `D0
Ist nämlich irgendeine endliche Teilmenge S ) N0 ( N0 vorgegeben, so hat man lediglich ein k 2 N0 so groß zu wählen, dass alle Paare .i; j / 2 S unter den Paaren 6.0/; : : : ; 6.k/ vorkommen. Dann gilt k 1 X - - X - X -cij - 0 -c0.`/ - 0 -c0.`/ - D K; .i;j /2S
`D0
`D0
womit die absolute Summierbarkeit der Matrix .cij /.i;j /2N0 (N0 gezeigt ist. Was sonst noch in der Folgerung behauptet wird, ergibt sich dann unmittelbar aus Satz T. "
270
Kapitel 11 Integralrechnung mehrerer Veränderlicher
P Ein Symbol 1 i;j D1 cij , gebildet mit den cij einer unendlichen Matrix, wird eine Doppelreihe genannt. (EsPenthält die gleiche Information wie die Matrix selbst.) Eine daraus geformte Reihe 1 `D0 c0.`/ , wobei 6 eine Durchnummerierung der obigen Art ist, heißt eine Durchnummerierung P der Doppelreihe in der Anordnung 6. Konvergieren bei einer Doppelreihe 1 i;j D0 cij alle Durchnummerierungen gegen den gleichen Wert in W , so heißt die Doppelreihe selbst konvergent, und das Symbol P1 c bezeichnet dann auch diesen gemeinsamen Wert. Folgerung U besagt demi;j D1 ij nach: Die absolute Konvergenz einer Doppelreihe in einer festen Durchnummerierung impliziert ihre absolute Konvergenz in einer beliebigen Durchnummerierung und damit die Konvergenz der Doppelreihe selbst. P V. Folgerung (kleiner Umordnungssatz). Ist die Reihe 1 kD0 ak mit Gliedern ak 2 W absolut konvergent und ( W N0 ! N0 einePbijektive Abbildung (eine so genannte Permutation von N0 ), so ist auch die Reihe 1 kD0 a&.k/ absolut konvergent, und es gilt 1 1 X X a&.k/ : ak D kD0
kD0
Beweis. Auch dieser kleine Umordnungssatz ist ein Spezialfall des großen Umordnungssatzes. Um dies einzusehen, betrachten wir die unendliche Matrix .cij /.i;j /2N0 (N0 mit cij ´ a& .i / für j D ( .i /
und
cij ´ 0 für j ¤ (.i/:
Ist S eine endliche Teilmenge von N0 ( N0 , so existiert ein k 2 N0 mit S - f0; : : : ; kg2 . Dann gilt k X k k X k X - - X - - X - -cij - 0 -cij - D -cij i D0 j D0
.i;j /2S
0
j D0 i D0
1 k k X 1 X - - - X - - X -aj - µ K: -aj - 0 -cij - D j D0
j D0
j D0 i D0
Somit ist der große Umordnungssatz T anwendbar und liefert 1 1 X X
cij D
iD0
i D0 j D0 1 X 1 X j D0 i D0
1 X
cij D
1 X j D0
ci&.i/ D
1 X
a&.i/
i D0
c& #1 .j /j D
1 X
aj
j D0
sowie die analogen Normvarianten. Damit ist alles gezeigt. (Eine Veranschaulichung dieses Vorgehens findet man in P[8.8].) "
271
Abschnitt 11.9 Satz von Fubini und Transformationsformel
W. Folgerung (Produktsatz). Sind die Reihen mit reellen oder komplexen Gliedern 1 X
A´
aj ;
B´
j D0
1 X
bk
kD0
absolut konvergent, so gilt AB D
/X 1
aj
1 1 /X 1 bk D '
j D0
X
aj bk ;
.j;k/2N0 (N0
kD0
einschließlich der absoluten Konvergenz der rechten Seite. Dabei werden rechts alle Paare in irgendeiner Anordnung durchlaufen (worauf es aber nicht ankommt). Tut man dieses nach dem Diagonalverfahren in der Reihenfolge der „45ı -Schrägzeilen“ und klammert in natürlicher Weise, so entsteht als Spezialfall das CauchyProdukt (H[8.8]): /X 1
aj
1 /X 1 X 1 1 ' cp bk D
j D0
mit
cp ´
pD0
kD0
X
aj bk :
j CkDp
Beweis. Auch der Produktsatz erweist sich als ein Spezialfall des großen Umordnungssatzes, und zwar auf folgende Weise: Wir betrachten die unendliche Matrix .cj k /.j;k/2N0 (N0 mit cj k ´ aj bk . Für diese ist die Voraussetzung von Satz T erfüllt. Ist nämlich S eine endliche Teilmenge von N0 ( N0 und N1 ´ max fj j .j; k/ 2 Sg; so wird
N2 ´ max fk j .j; k/ 2 Sg;
1 /X 1 /X N2 N1 X ˇ ˇ ˇ ˇ ˇaj ˇ ' ˇaj bk ˇ 0 jbk j 0 A ' B: j D0
.j;k/2S
kD0
Somit gilt für jede Bijektion ' W N0 ! N0 ( N0 : (18)
1 1 /X X
1 aj bk
kD0 j D0
D
1 X
c'.`/
`D0
einschließlich der absoluten Konvergenz der rechten Seite. Die linke Seite von (18) rechnet sich nach den gewöhnlichen Regeln für Reihen um zu 1 1 /X X kD0 j D0
1X 1 /X 1 1 bk D AB; aj aj bk D j D0
kD0
während die rechte Seite von (18) gerade die im Satz genannte Bedeutung hat.
"
272
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Allgemeines über komplexe Integranden Der Fall eines komplexen Banach-Raums Z anstelle des bisherigen reellen Zielraums W ordnet sich ohne weiteres in die ganze hier entwickelte Integrationstheorie ein. Der einfache Grund ist, dass ein komplexer Banach-Raum Z als reeller Banach-Raum aufgefasst werden kann mit der zusätzlichen R-linearen und normtreuen (also stetigen) Abbildung Z ! Z, z 7! iz (die außerdem eine ebensolche Inverse w 7! 1i w D %iw besitzt). Vgl. P[10.1]. Eine Abbildung F W Rn ! Z heißt integrierbar, wenn sie es bzgl. dieser reellen Auffassung von Z ist. Die Linearität des Integrals gilt dann aber auch im komplexen Sinne, und zwar als Konsequenz des allgemeinen Vertauschbarkeitssatzes R[11.4]. Das trifft insbesondere zu, wenn der Zielraum der Integranden C selbst ist. Ausblicke auf zusätzliche Entwicklungen zu Maß und Integral Zum weiteren Arsenal der Integrationstheorie gehören folgende Begriffe: Eine Teilmenge M - Rn heißt messbar, wenn für jede integrierbare Menge A - Rn der Durchschnitt M \ A wiederum integrierbar ist. Jede integrierbare Menge ist messbar (C[11.6]), aber nicht immer umgekehrt: Rn ist messbar, aber nicht integrierbar. Messbarkeit von Mengen ist sozusagen „lokale Integrierbarkeit“. Eine Abbildung F W Rn ! W heißt messbar, wenn für jede offene Teilmenge B - W das Urbild F &1 .B/ messbar in Rn ist. Diese Messbarkeitsbegriffe sind somit Folgebegriffe der Integrierbarkeit. Die Eigenschaft „messbar“ darf nicht zu der Annahme verführen, die betreffende Menge bzw. Funktion habe ein endliches Maß bzw. Integral! Beim hier erfolgten Aufbau der Integralrechnung sind diese Begriffe bisher nicht gebraucht worden. Wir kommen auf sie in den ergänzenden Abschnitten 13.2 und 13.3 zurück. Nützlich sind sie z.B. für die Integralrechnung auf differenzierbaren Mannigfaltigkeiten, die in Analysis 3 erfolgt. Dort ordnen sie sich gut ein, weil die Messbarkeit gegenüber Diffeomorphismen invariant ist, was für Maß und Integrabilität nicht zutrifft. Die Maß- und Integrationstheorie kann ebenso wie die allgemeine Topologie auf einer völlig axiomatischen Ebene behandelt werden. Klassische Darstellungen in dieser Richtung sind Kelley[1975] für die Topologie und Halmos[1974] für die Maßtheorie. Im Rahmen dieser axiomatischen Zugänge werden viele der Begriffe, die hier konkret eingeführt wurden, strukturell weiter verfeinert und ausgebaut. Aufgaben und Anmerkungen 1. Dass die partiellen Abbildungen im Satz von Fubini D(i) nicht alle integrierbar zu sein brauchen, zeigt z.B. die Funktion f W R2 ! R mit f .x; y/ ´ Man beweise nämlich:
1 : 1 C jxj.y exp.jxj//2
Abschnitt 11.9 Satz von Fubini und Transformationsformel
273
a) f ist über R2 integrierbar. b) f0 W R ! R mit f0 .y/ ´ f .0; y/ ist nicht aus Leb1 .R/. 2. In RnC1 D Rn ( R sei A eine kompakte Teilmenge von Rn und h 2 RC fest. Dabei sind die Identifikationen .x; 0/ $ x für x 2 Rn und .0; y/ $ y für y 2 R vorgenommen (vgl. L[11.8]). Der Kegel K mit der Basis A und der Spitze h ist definiert als Vereinigung aller Verbindungsstrecken von h mit den Punkten von A, also K ´ f+x C .1 % +/h j + 2 Œ0; 12; x 2 Ag: Man zeige: Auch K ist kompakt, und es gilt ,nC1 .K/ D
1 ' ,n .A/ ' h: nC1
3. In der .x; z/-Ebene des R3 sei eine kompakte Menge A gegeben mit: .x; 0; z/ 2 A H) x $ 0: Es sei R.A/ der von A erzeugte Rotationskörper, d.h. R.A/ ´ f.x cos ˛; x sin ˛; z/ j .x; 0; z/ 2 A; 0 0 ˛ < 2'g: Man zeige, dass auch R.A/ kompakt ist und dass folgende Formel zur Volumberechnung besteht ,3 .R.A// D 2'S1 ' ,2 .A/
(erste Guldinsche Regel):
Dabei ist S der Schwerpunkt von A (als zweidimensionale Menge, vgl. Aufgabe 5[11.8]), also S1 seine erste Koordinate. Kurz: ,3 .R.A// D Rotationsweg des Schwerpunktes von A mal Flächeninhalt von A: Im Falle ,2 .A/ D 0 ist S nicht definiert; die Behauptung besagt dann: ,3 .R.A// D 0. Hinweis: Die zweite Guldinsche Regel bezieht sich auf die Oberflächenberechnung von Rotationskörpern; sie wird in Analysis 3 behandelt. 4. Seien r; R zwei Zahlen mit 0 0 r < R oder R D 1. Man betrachte im Euklidischen Raum Rn mit Norm j j die Kugelschale S.r; R/ ´ Bn .R/ n Bn .r/. Sei F W S.r; R/ ! W eine rotationssymmetrische Abbildung, d.h. es gibt eine Abbildung G W 2r; RŒ ! W mit F .x/ D G.jxj/
8 x 2 S.r; R/:
Dabei ist Bn .%/ für % 2 RC der offene Euklidische Ball mit Zentrum 0 und Radius % bzw. Bn .0/ ´ ¿ und Bn .1/ ´ Rn . Man zeige:
274
Kapitel 11 Integralrechnung mehrerer Veränderlicher
a) F 2 Leb1 .S.r; R/; W / () .t 7! t n&1 G.t// 2 Leb1 .2r; RŒ ; W /, und gilt eine der beiden Seiten der Äquivalenz, so folgt Z
n
S.r;R/
Z
F .x/ dx D n ' ,.B .1// '
R
r
t n&1 G.t/ dt:
b) Sei r > 0 und ˛ 2 R. Man prüfe abhängig von der Dimension n, wann x 7! jxj˛ über Bn .r/ n f0g bzw. über Rn n Bn .r/ integrierbar ist. 5. Sei A ) Rn integrierbar und beschränkt mit ,n .A/ > 0. Dann ist der Schwerpunkt S.A/ von A definiert wie in Aufgabe 5[11.8]. Sei nun ˛ W Rn ! Rn eine Affinität, d.h. eine bijektive affine Abbildung (somit ˛.z/ D T z C c mit festem c 2 Rn und T W Rn ! Rn linear und bijektiv). Man beweise für den Schwerpunkt der Bildmenge ˛.A/: S.˛.A// D ˛.S.A//: Insbesondere folgt aus ˛.A/ D A auch ˛.S.A// D S.A/. D.h. der Schwerpunkt ist unter allen Affinitäten invariant, unter denen A invariant ist. Dies gilt speziell für die Bewegungen des Rn (für diese ist T eine lineare Isometrie von Rn ). 6. Die Integrierbarkeit von Mengen ist nicht diffeomorph-invariant: Man sieht dies bereits am einfachen Beispiel der Funktion ' W 20; 1Œ ! 21; 1Œ mit '.x/ D 1=x. Diese ist ein C 1 -Diffeomorphismus, und 20; 1Œ ist integrierbar, nicht aber 21; 1Œ. Entsprechend gilt dies auch für Funktionen: Die charakteristische Funktion --0;1Œ ist in Leb1 .R/, nicht aber --1;1Œ D --0;1Œ ı ' &1 . Das ist kein Widerspruch zum Transformationssatz R, da dort (rechts) noch mit demˇ Betrag der ˇ Funktionaldeterminante multipliziert wird. Tatsächlich ist hier --1;1Œ ' ˇdet .' &1 /0 ˇ über 21; 1Œ integrierbar, und das Integral davon hat den Wert Z 1
1
ˇ ˇ 2 ' ˇ 1ˇ 1 T ˇ ˇ 1 ' ˇ% 2 ˇ dx D lim % D 1; T !1 x x 1
wie es nach dem Transformationssatz sein muss. 7. Hier werden die Volumina einfacher Punktmengen des Euklidischen Raums Rn mit Skalarprodukt h ; i und Norm j j berechnet. a) Ein Parallelotop P ) Rn ist eine Punktmenge der Gestalt ˇ o n Xn ˇ +j bj ˇ 0 0 +j 0 1 für j D 1; : : : ; n ; P ´ cC j D1
275
Abschnitt 11.9 Satz von Fubini und Transformationsformel
wobei c fest in Rn und die Kantenvektoren b1 ; : : : ; bn eine Basis von Rn bilden. Man zeige: P ist integrierbar und vˇ ˇ uˇ uˇhb1 ; b1 i : : : hb1 ; bn iˇˇ uˇ : :: ˇ: ,n .P / D jdet .b1 ; : : : ; bn /j D u tˇˇ :: : ˇˇ ˇhbn ; b1 i : : : hbn ; bn iˇ Lösungshinweis: Die erste Gleichung folgt mit dem Transformationssatz aus dem Volumen achsenparalleler Quader. Das zweite Gleichheitszeichen ist eine rein algebraische Umformung (mittels des Produktsatzes für Determinanten). Mit dieser Volumformel ist die Koinzidenz des in der linearen Algebra üblichen Volumbegriffs für Parallelotope mit dem Lebesgue-Maß hergestellt. Das gilt entsprechend auch für die folgenden Teile b) und c). Vgl. auch Aufgabe 10. b) Ein Parallelotop, bei dem die Kantenvektoren b1 ; : : : ; bn eine Orthogonalbasis von Rn bilden, wird als allgemeiner Quader bezeichnet. In diesem Fall geht die Volumformel aus a) über in Yn ˇ ˇ ˇbj ˇ : ,n .P / D j D1
D.h. auch das Volumen eines allgemeinen Quaders ist gleich dem Produkt seiner ˇ ˇ Kantenlängen ˇbj ˇ. Sind diese alle gleich, so spricht man von einem allgemeinen Würfel der Kantenlänge jb1 j D ' ' ' D jbn j. c) Ein Simplex S ) Rn ist eine Punktmenge der Gestalt ˇ n Xn Xn ˇ +j bj ˇ 0 0 +j für j D 1; : : : ; n und S ´ cC
j D1
j D1
n
o +j 0 1 ;
n
wobei c fest in R und b1 ; : : : ; bn eine Basis von R ist. Man zeige: S ist integrierbar und 1 ,n .S / D ' jdet .b1 ; : : : ; bn /j : nŠ Lösungshinweis: Aufgabe 6[11.8] und Transformationssatz. d) Im Fall n D 2 ist ein Simplex S D fc C +1 b1 C +2 b2 j 0 0 +1 ; 0 0 +2 ; +1 C +2 0 1g dasselbe wie eine Dreieckscheibe in R2 . Man drücke in diesem Fall den Flächeninhalt durch die Seitenlängen ˛ ´ jb1 j, ˇ ´ jb1 j, 1 ´ jb1 % b2 j aus: p ,2 .S/ D s.s % ˛/.s % ˇ/.s % 1/ (Heronsche Formel): Hierin bezeichnet s den halben Umfang: s´
1 .˛ C ˇ C 1/: 2
276
Kapitel 11 Integralrechnung mehrerer Veränderlicher
Lösungshinweis: Zunächst gilt nach Teil a) ,2 .S/2 D jb1 j2 ' jb2 j2 % hb1 ; b2 i2 D ˛ 2 ˇ 2 % hb1 ; b2 i2 : Hierin drücke man das Skalarprodukt mit Hilfe von 1 2 D jb1 % b2 j2 D ˛ 2 % 2 hb1 ; b2 i C ˇ 2 aus und zerlege dann den Gesamtausdruck für ,2 .S /2 , der ja nur noch ˛, ˇ, 1 enthält, in ein Produkt. 8. Man zeige: Ein Simplex S wie in Aufgabe 7 c) kann mit Hilfe der Eckpunkte a0 ´ c;
a1 ´ c C b1 ;
a2 ´ c C b2 ;
:::
an ´ c C bn
auch in der Gestalt geschrieben werden: ˇ nXn Xn ˇ SD tj aj ˇ 0 0 tj für j D 1; : : : ; n und j D0
j D0
o tj D 1 ;
9. Man beweise für das äußere Maß das folgende Analogon zu J: Ist ˛ W Rn ! Rn (9) eine affine Abbildung, so gilt für jede Teilmenge A - Rn : ,# .˛.A// D jdet T j ' ,# .A/ mit der Sondervereinbarung 0 ' 1 ´ 0. Als Spezialfall ergibt sich, dass auch das äußere Maß gegenüber Bewegungen des Rn invariant ist. 10. Wird anstelle von Rn ein beliebiger reeller Vektorraum V der Dimension n betrachtet, so wird die Integrierbarkeit einer Abbildung F W V ! W so definiert: Für einen linearen Isomorphismus ˆ W Rn ! V ist die Komposition F ı ˆ W Rn ! W integrierbar. Mit dem Transformationssatz beweise man, dass dies dann für jeden linearenRIsomorphismus ‰ W Rn ! V ebenfalls zutrifft. Das Integral selbst, definiert R durch V F ´ Rn F ı ˆ, hängt allerdings von der Wahl des Isomorphismus ab. Ist nämlich ‰ W Rn ! V ein weiterer linearer Isomorphismus, so gilt Z Z ˇ ˇ &1 ˇ ˇ F ı ˆ: F ı ‰ D det .‰ ı ˆ/ Rn
Rn
Ist V mit einer Determinantenform D ausgestattet (V heißt dann unimodular), so wird die Integraldefinition fixierbar, indem man nur Isomorphismen ˆ W Rn ! V betrachtet, für die jD.ˆ.e1 /; : : : ; ˆ.en //j D 1 ist (e1 ; : : : ; en die Standard-Basis von Rn ). Das trifft insbesondere zu, wenn V ein Euklidischer Vektorraum ist; in diesem Fall werden zur Fixierung des Integrals nur die Isometrien ˆ W Rn ! V zugelassen.
Abschnitt 11.9 Satz von Fubini und Transformationsformel
277
11. # Es gibt beschränkte Mengen, die nicht integrierbar sind. Allerdings ist keine explizite Konstruktion einer solchen Menge bekannt. Mit den Mitteln der allgemeinen Mengenlehre verläuft der Existenzbeweis wie folgt. Eine Vitalische Menge V in R entsteht so: Man definiert auf R eine Äquivalenzrelation % durch s % t W () s % t 2 Q. Jede Äquivalenzklasse hat einen Repräsentanten in Œ0; 12. Nun definiert man V - Œ0; 12 als eine Menge, die aus jeder Äquivalenzklasse genau einen Repräsentanten in Œ0; 12 enthält (hierzu benötigt man das so genannte Auswahlaxiom). Man zeige: V ist nicht integrierbar. Lösungshinweis: Die Translationsinvarianz besagt hier: Ist A - R integrierbar und c 2 R, dann ist auch das Translat A C c integrierbar, und es gilt ,.A C c/ D ,.A/. Indem man V um geeignete rationale Zahlen verschiebt, sodass die zueinander disjunkten Translate noch in Œ0; 22 liegen, erhält man unter Benutzung der Translationsinvarianz, Additivität und Monotonie (1)[11.6] von , im Falle ,.V / > 0 einen Widerspruch. Im Falle ,.V / D 0 erhält man bei Betrachtung aller Translate um rationale Zahlen einen Widerspruch dazu, dass R keine Nullmenge ist.
12 Umkehrung differenzierbarer Abbildungen Das Lösen von Gleichungen gehört zu den Grundproblemen der Mathematik. Es handelt sich dabei um die Frage, ob irgendwelche Forderungen an die Variablen (oft „Unbekannte“ genannt) tatsächlich erfüllbar sind und gegebenenfalls wie und auf wie viele Arten und Weisen. Man muss sich aber von der Vorstellung befreien, das Lösen könne immer durch Manipulationen an Gleichungen („Isolieren von Unbekannten“, etc.) vorgenommen werden. Tatsächlich ist dies nur bei sehr speziellen Gelegenheiten möglich, z.B. bei linearen Gleichungssystemen. Etwas abstrakter formuliert, handelt es sich beim Lösen um die Auffindung von Urbildern unter einer gegebenen Abbildung. Dabei ist die Hauptfrage: Gibt es überhaupt ein Urbild, d.h. die Existenz einer Lösung muss gesichert werden. Ist die Antwort „ja“, so folgt die ebenso wichtige Frage: Gibt es mehr als ein Urbild, d.h. die Eindeutigkeit muss untersucht werden. Schließlich verbleibt die tatsächliche Auffindung oder Konstruktion der Lösung oder der Lösungen. Konkret geht es hier um ein (i. Allg.) nichtlineares Gleichungssystem der Bauart: f1 .x1 ; : : : ; xn / D b1 :: : fp .x1 ; : : : ; xn / D bp mit gegebenen skalaren Funktionen fj einer bestimmten Differentiationsklasse $ 1 und gegebenen Zahlen bj , wobei die xk (die „Unbekannten“) derart bestimmt werden sollen, dass für sie die Gleichungen erfüllt sind. Anders ausgedrückt: Bei einer gegebenen Abbildung F aus dem Rn in den Rp (mit Komponentenfunktionen fj ) sollen zu einem gegebenen p-Tupel (mit Komponenten bj ) die möglichen n-Tupel (mit Komponenten xk ) als Urbilder gefunden werden. Bei p D n hat man genau so viele Unbekannte wie Gleichungen. Unter günstigen Umständen gibt es (lokal) genau eine Lösung. Man spricht vom bestimmten Fall. Zuständig ist hierfür der Umkehrsatz, mit dem wir uns als Erstes befassen werden. Bei p < n hat man mehr Unbekannte als Gleichungen. Unter günstigen Umständen gibt es (lokal) mehrere Lösungen, die von n % p „Parametern“ abhängen. Man kann, grob gesprochen, n%p Unbekannte vorgeben und nach den restlichen p Unbekannten auflösen. Man spricht vom unterbestimmten Fall. Zuständig ist hierfür der Satz über implizite Funktionen. Bei p > n hat man mehr Gleichungen als Unbekannte. Im Allgemeinen gibt es keine Lösungen („man verlangt zu viel“). Das ist der so genannte überbestimmte Fall.
Abschnitt 12.1 Der Umkehrsatz
279
Wenn man möchte, kann man in dem gegebenen Gleichungssystem die Konstanten bj auf die linke Seite schaffen, also o.B.d.A. bj D 0 annehmen. M.a.W. man kann alles auf das vektorielle Nullstellenproblem reduzieren. Wie bei linearen Gleichungssystemen hängt das genaue Verhalten der Lösungen von gewissen Rangzahlen ab, wobei an die Stelle der Koeffizientenmatrix jetzt die JacobiMatrix tritt. Von Interesse ist, dass das vektorielle Nullstellenproblem in einer gewissen Beziehung steht zum Extremalproblem für skalare Funktionen. In manchen Fällen kann das eine Problem hilfreich für das andere sein: & Was kann die Nullstellensuche für die Extrema tun? – Wir wissen laut D(i)[10.8]: Ist g W A ! R (A offen in Rn ) differenzierbar und hat g in einem Punkt a 2 A eine lokale Extremalstelle, so ist g 0 .a/ D 0. Kann man also das Nullstellenproblem g 0 .x/ D 0 lösen, so kennt man die (möglichen) Extremalstellen. & Was können Extrema für die Nullstellensuche tun? – Wir betrachten die Situation einer Abbildung G W A ! Rp (A - Rn ). Wann ist G.a/ D 0 für ein a 2 A, oder wie findet man die Nullstellen von F ? Die Idee ist: Bilde g ´ jGj2 und minimiere g: Wenn es eine Nullstelle von G gibt, so ist sie eine Minimalstelle von g. Kann man also dieses Minimumproblem für g lösen, so kennt man die (möglichen) Nullstellen von G. Extremalprinzipien spielen in der Analysis eine wichtige Rolle für Existenzfragen. Z.B. wurde in Analysis 1 der Satz von Rolle mit Extremalargumenten begründet. Im Folgenden wird wie bei Blatter[1974/1980], Teil 2 ein Minimalprinzip für den Beweis des Umkehrsatzes nutzbar gemacht. Beim Minimumproblem ist es günstig, im Zielraum Rp das Euklidische Standard-Skalarprodukt h ; i und die daraus entspringende Euklidische Standard-Norm j j zu verwenden. Ansonsten kann man auch mit anderen Normen in Rp oder Rn arbeiten, Wie wir wissen, ist es für rein topologische Fragen gleichgültig, welche Norm zugrunde gelegt wird.
12.1 Der Umkehrsatz Anknüpfend an die letzte Situation können wir Folgendes feststellen: A. Lemma. Für eine Abbildung G W A ! Rp mit offener Definitionsmenge A - Rn und einen festen Punkt a 2 A gelte:
280 (i)
Kapitel 12 Umkehrung differenzierbarer Abbildungen
G ist in a 2 A differenzierbar und Rang G 0 .a/ D p.
(ii) g ´ jGj2 hat in a ein lokales Minimum. Dann folgt G.a/ D 0. Beweis. Man schließt der Reihe nach so: g.x/ D hG.x/; G.x/i ˝ ˛ g 0 .a/v D 2 G.a/; G 0 .a/v ˝ ˛ 0 D G.a/; G 0 .a/v
8 v 2 Rn
D(i)[10.8]
0 D hG.a/; wi
8 w 2 Rn
G 0 .a/ surjektiv
0 D G.a/
G[10.2]
setze w D G.a/:
Am Ende resultiert die Behauptung.
"
B. Beispiel. Ohne die Rangbedingung in (i) ist dies falsch! Sei z.B. n D p D 1 und G W R ! R definiert durch G.x/ ´ 1 C x 2 ;
also G 0 .x/ D 2x:
Für a D 0 gilt G 0 .0/ D 0, also Rang G 0 .0/ D 0 < 1. Weiter hat G.x/2 D .1 C x 2 /2 in 0 ein absolutes Minimum. Aber es gilt G.0/ D 1.
1 + x2
Der Beweis in Lemma A könnte mit einer allgemeinen Norm nicht geführt werden, da wesentlich das Skalarprodukt verwendet wird. Im Folgenden wollen wir eine beliebige Norm k k in Rn zugrunde legen. Die zugehörige Operator-Norm in L.Rn ; Rn / sei dann ebenfalls mit Doppelstrichen bezeichnet.
281
Abschnitt 12.1 Der Umkehrsatz
C. Satz (Umkehrsatz). Gegeben sei eine C 1 -Abbildung F W A ! Rn , definiert auf einer offenen und konvexen Menge A - Rn . An einem festen Punkt a 2 A sei die Ableitung F 0 .a/ regulär. h h 1 sei: Es sei m ´ -F 0 .a/&1 -, und mit einer Konstanten c 2 0; m - 0 -F .x/ % F 0 .a/- 0 c
für alle x 2 A:
Dann gilt: (i)
Für alle x 2 A ist F 0 .x/ regulär;
(ii)
F W A ! F .A/ ist bijektiv;
(iii) F &1 W F .A/ ! A ist Lipschitz-stetig mit der Lipschitz-Konstanten
m ; 1&cm
(iv)
F .A/ ist offen;
(v)
F &1 W F .A/ ! A ist von der Klasse C 1 , und für alle y 2 F .A/ gilt .F &1 /0 .y/ D .F 0 .F &1 .y///&1 :
(1) Beweis.
Wir setzen L ´ F 0 .a/ und finden zunächst eine - für Lv, indem wir - Schranke - untere in der für alle w 2 Rn gültigen Ungleichung -L&1 w - 0 -L&1 - ' kwk D m ' kwk substituieren w D Lv: kLvk $
1 ' kvk m
für alle v 2 Rn :
Nun leiten wir eine untere Schranke für kF .x/ % F .e x /k mit beliebigen x; e x 2 A her: Neben F sei auch die Abbildung H.x/ ´ F .x/ % Lx betrachtet und auf sie der Schrankensatz G[11.1] angewendet. Wegen H 0 .x/ D F 0 .x/ % L, folgt xk x /k 0 max -H 0 .z/- ' kx % e kH.x/ % H.e z2A x k 0 c ' kx % e xk : D max -F 0 .z/ % L- ' kx % e z2A
Damit wird F .x/ % F .e x / D L.x % e x / C H.x/ % H.e x /, also x /k $ kL.x % e x /k % kH.x/ % H.e x /k kF .x/ % F .e (2)
$
1 1 % cm ' kx % e x k % c ' kx % e xk D ' kx % e xk : m m
Zu (i): Dies ergibt sich aus Satz N[10.4]; denn alle Ableitungen F 0 .x/ liegen nach 1 Voraussetzung im offenen Ball um L mit Radius m D L1#1 . k k
282
Kapitel 12 Umkehrung differenzierbarer Abbildungen
Zu (ii) und (iii): Das folgt unmittelbar aus der Abschätzung (2). Zu (iv): Sei a0 2 A gegeben und b0 ´ F .a0 /. Es muss gezeigt werden, dass eine offene Umgebung von b0 existiert, die ganz zu F .A/ gehört. Da sich dieser Nachweis auf Lemma A stützen wird, müssen wir bei diesem Punkt von der beliebigen Norm auf die Euklidische Norm umschwenken. Aus der Stetigkeit von F 0 folgt, dass die Voraussetzungen des Satzes bestehen bleiben, wenn A durch eine (eventuell kleinere) Umgebung A0 von a0 ersetzt wird, sowie die Norm k k durch die Euklidische Norm j j und m und c durch geeignete neue Konstante m0 und c0 mit analogen Eigenschaften. Die bisherigen Folgerungen bleiben mit diesen Ersetzungen erhalten. Sei r > 0 so klein, dass B.a0 ; r/ ganz in A0 liegt, und sei B.b0 ; "/ eine Umgebung von b0 , wobei wir den Radius " in der Form " D ˛ 'r ansetzen und den Faktor ˛ später noch bestimmen werden. (Euklidische Bälle seien immer durch Doppelstrichbuchstaben bezeichnet.) Gegeben y0 2 B.b0 ; "/, wollen wir zeigen: y0 2 F .B.a0 ; r//: Wir betrachten f .x/ ´ jF .x/ % y0 j für x 2 B.a0 ; r/. Die Idee ist: Wenn f ein Minimum in B.a0 ; r/, besitzt und dieses gleich 0 ist, so ist man fertig. Um dies hin zu bekommen, überlegen wir folgendermaßen: Auf der kompakten Menge B.a0 ; r/ ist die Funktion f stetig, nimmt also ihr Minimum an (allgemeines Extremalprinzip D[6.5]). Auf der Randsphäre S.a0 ; r/ gilt: jx % a0 j D r, also f .x/ D jF .x/ % y0 j $ jF .x/ % b0 j % jb0 % y0 j / 1 1 % c0 m0 1 % c0 m0 > ' jx % a0 j % ˛r D % ˛ r: m0 m0 Dabei wurde nach der modifizierten Dreiecksungleichung das Analogon der Abschätzung (2) verwendet. Andererseits ist f .a0 / D jb0 % y0 j < ˛r. Wenn nun ˛ so gewählt wird, dass 1 % c0 m0 % ˛ D ˛; m0 so wird f .x/ > ˛r auf S.a; r/, also nimmt die Funktion f ihr Minimum auf B.a0 ; r/ in einem inneren Punkt x0 2 B.a0 ; r/ an. Dort ist jF .x/ % y0 j2 minimal und F 0 .x0 / regulär, also gilt nach Lemma A: F .x0 / % y0 D 0, somit F .x0 / D y0 . Zu (v): Die Differenzierbarkeit von F &1 und die Gültigkeit von (1) folgen unmittelbar aus dem Bisherigen, indem man Satz F[10.2] heranzieht. Die Regel (1) zeigt dann, dass .F &1 /0 als Komposition stetiger Abbildungen wiederum stetig ist. Dabei beachtet man, dass die Inversenbildung bei Matrizen – die „äußere“ Inversenbildung in (1) – nach der Cramerschen Regel gebildet werden kann, also von der Klasse C 1 ist. " C. Zusatz. Ist F von der Klasse C r mit r $ 1, so ist auch F &1 von der Klasse C r .
283
Abschnitt 12.1 Der Umkehrsatz
Beweis. Für r D 1 wurde dies soeben gezeigt. Für r > 1 folgt die Behauptung induktiv, da beim Weiterdifferenzieren von (1), ausgedrückt mit partiellen Ableitungen, auf der rechten Seite jeweils Ableitungen von F &1 einer um 1 niedrigeren Ordnung erscheinen. " Verzichtet man in Satz C auf die Konvexität der Definitionsmenge und auch auf die Voraussetzung, in die die Konstante c eingeht, so bleiben die Behauptungen in lokalisierter Form bestehen. Denn zu einem festen Punkt a 2 A gibt es gewiss eine Ballumgebung U von a in A, in der mit einer hinreichend kleinen Konstanten c > 0 gilt kF 0 .x/ % F 0 .a/k 0 c < 1=m. Das folgt allein aus der Stetigkeit von F 0 . Damit können wir feststellen: D. Satz (lokaler Umkehrsatz). Gegeben sei eine C r -Abbildung F W A ! Rn , definiert auf einer offenen Menge A - Rn mit r $ 1. An einem festen Punkt a 2 A sei die Ableitung F 0 .a/ regulär. Dann existiert eine Umgebung U von a in A mit folgenden Eigenschaften: (i)
F .U / ist offen, und die Restriktion F jU W U ! F .U / ist bijektiv.
(ii) Die Inverse .F jU /&1 W F .U / ! U ist von der Klasse C r .
"
Hat F die Komponentenfunktionen F1 ; : : : ; Fn , so ist die geforderte Regularität von F 0 .a/ äquivalent mit dem Nichtverschwinden der Funktionaldeterminante in a: ˇ ˇ @F1 ˇ .a/ ' ' ' ˇ @x1 ˇ : ˇ : ˇ : ˇ @F ˇ n .a/ ' ' ' ˇ @x1
ˇ @F1 ˇ .a/ˇ @xn ˇˇ :: ˇ ¤ 0: : ˇ @Fn ˇˇ .a/ˇ @xn
E. Folgerung. Die Abbildung F W A ! Rn , definiert auf einer offenen Menge A Rn , sei von der Klasse C r mit einem r $ 1. Ist det F 0 .x/ ¤ 0 für alle x 2 A, so ist die Bildmenge F .A/ offen in Rn . Ist außerdem F injektiv, so ist die Umkehrung F &1 W F .A/ ! A ebenfalls von der Klasse C r , also F ein C r -Diffeomorphismus von A auf F .A/, und es gilt: (3)
.F &1 /0 D .F 0 ı F &1 /&1 :
Beweis. Dies ist eine direkte Konsequenz von Satz D: Unter der Regularitätsvoraussetzung an alle Ableitungen F 0 .x/ ist F .A/ Vereinigung von offenen Mengen, also selbst offen. Im injektiven Fall stimmt F &1 W F .A/ ! A in
284
Kapitel 12 Umkehrung differenzierbarer Abbildungen
einer Umgebung jedes y 2 F .A/ mit einer C r -Abbildung überein, ist also selbst von " der Klasse C r . Die Formel (3) ist lediglich die argumentfreie Fassung von (1). Die Behauptung von Satz D beinhaltet, dass F lokal umkehrbar ist: In geeignet „kleinen“ Umgebungen U kann es nicht passieren, dass zwei verschiedene Punkte das gleiche Bild haben. Global, d.h. ohne die gemachte Einschränkung auf U , ist dies i. allg. nicht richtig: „Weit entfernte“ Teile der Definitionsmenge können auf die gleichen Mengen abgebildet werden. Musterbeispiel dafür liefern die Polarkoordinaten; vgl. die folgende Bemerkung F(i). Ein sehr anschauliches Beispiel ist die Herstellung einer Brezel aus einem Teigstreifen:
F
Gewisse Teile kommen nach der Brezelformung auf die gleichen Stellen zu liegen. F. Bemerkungen. (i) Wie gesagt, aus der Forderung det F 0 .x/ ¤ 0 für alle x folgt nur die lokale Injektivität von F , nicht die von F selbst, also nicht die globale Injektivität. Eine Ausnahme ist der eindimensionale Fall einer C 1 Funktion f W J ! R, definiert auf einem Intervall J . Hier folgt in der Tat aus f 0 .x/ ¤ 0, dass f streng monoton und damit injektiv ist. Ab Dimension 2 ändert sich das: Ein markantes Beispiel bieten die Polarkoordinaten in der Ebene. Wir betrachten die damit verbundene Abbildung: ˆ W RC ( R %! R2 n f.0; 0/g .r; '/ 7%! .r cos '; r sin '/: ˆ ist von der Klasse C 1 und det ˆ0 D r > 0. Jedoch ist ˆ.r; ' C 2'/ D ˆ.r; '/, also ˆ 2'-periodisch im zweiten Argument und damit nicht injektiv. Bei Einschränkung auf geeignete Teilmengen von RC ( R wird ˆ nach Satz D injektiv. Solche Teilmengen wird man natürlich möglichst groß wählen, z.B. hier als RC ( 2%'; 'Œ wie in K(ii)[11.8]. Allgemeiner ist die Einschränkung von ˆ auf jeden Streifen der Gestalt RC ( 2˛; ˛ C 2'Œ injektiv.
285
Abschnitt 12.1 Der Umkehrsatz
(ii) Polarkoordinaten im Raum: Ein Punkt .x; y; z/ 2 R3 wird aufgebaut aus dem Abstand r vom Ursprung und zwei Winkelgrößen +, ˇ in folgender Weise: x D r cos + cos ˇ (4)
z
y D r sin + cos ˇ z D r sin ˇ:
r
Hierbei gilt vereinbarungsgemäß: %' < + 0 ';
%
x
λ
β y
' ' 0ˇ0 : 2 2
Die anschauliche Bedeutung ist folgende: r ist die Euklidische Entfernung vom Ursprung .0; 0; 0/, und +; ˇ entsprechen den geographischen Koordinaten auf der Erdkugel: + ist die geographische Länge und ˇ die geographische Breite (vgl. das Bild). Die Projektion von .x; y; z/ auf die .x; y/-Ebene hat die Euklidische Länge r cos ˇ und somit die .x; y/-Koordinaten x D r cos ˇ ' cos + und y D r cos ˇ ' sin +. Die Projektion von .x; y; z/ auf die z-Achse ist z D r sin ˇ. Unabhängig von der Anschauung ist die mit (4) verbundene Abbildung definiert durch 0 1 cos + cos ˇ B C 3 ˆ W RC ˆ.r; +; ˇ/ ´ r ' @ sin + cos ˇ A : 0 (R(R!R ; sin ˇ ˆ ist ersichtlich von der Klasse C 1 und hat die Funktionaldeterminante ˇ ˇ ˇcos + cos ˇ %r sin + cos ˇ %r cos + sin ˇ ˇ ˇ ˇ det ˆ0 D ˇˇ sin + cos ˇ r cos + cos ˇ %r sin + sin ˇ ˇˇ D r 2 cos2 + cos3 ˇ: ˇ sin ˇ 0 r cos ˇ ˇ Wegen der Periodizität der Winkelfunktionen ist ˆ sicher nicht injektiv. Die Einschränkung von ˆ auf
i ' 'h A ´ RC ( 2%'; 'Œ ( % ; 2 2
p wird aber injektiv. Denn aus .x; y; z/ ergibt sich r eindeutig als r D x 2 C y 2 C z 2 , und aus z D r sin ˇ folgt dann eindeutig ˇ, und aus x D cos + cos ˇ, y D r sin + cos ˇ folgen eindeutig x; y. Das Bild ˆ.A/ ist allerdings nicht ganz R3 ; es fehlt die Halbebene H ´ f.x; y; z/ j y D 0; x 0 0g: Aufgrund von Folgerung E ist dann ˆjA W A ! R3 n H ein C 1 -Diffeomorphismus.
286
Kapitel 12 Umkehrung differenzierbarer Abbildungen
(iii) Wendet man den Umkehrsatz an auf ein lineares Gleichungssystem: f1 .x1 ; : : : ; xn / D 0 :: :
fj .x1 ; : : : ; xn / ´ aj1 x1 C ' ' ' C aj n xn % bj ; j D 1; : : : ; n;
fn .x1 ; : : : ; xn / D 0 so stimmt die Funktionalmatrix (an jeder Stelle) mit der Koeffizientenmatrix überein: 0
a11
:::
a1n
an1
:::
ann
B : F 0 .a/ D B @ ::
1
:: C C : A;
d.h. die Lösbarkeitsbedingung von Satz D ist genau die gleiche wie die aus der linearen Algebra für die eindeutige Lösbarkeit. In diesem linearen Fall kann man die globale Lösbarkeit garantieren, und man kann darüber hinaus die Lösung explizit darstellen (mittels der Cramerschen Regel) oder sie verfahrensmäßig bestimmen (mittels des Gauß-Algorithmus). (iv) Im nichtlinearen Fall kann man i. Allg. keine expliziten Lösungen und keine endlichen Lösungsalgorithmen erwarten. Es geht in den obigen Aussagen vielmehr um die Existenz der Lösungen und ihre analytischen Eigenschaften. In der numerischen Mathematik werden approximative Lösungsverfahren auch für nichtlineare Gleichungssysteme entwickelt. Ferner gibt es einen Fall von nichtlinearen Gleichungssystemen, bei denen eine algebraische Reduktion auf den eindimensionalen Fall möglich ist, nämlich polynomiale Gleichungen mit ganzzahligen Koeffizienten. Diese kann man mit so genannten Gröbner-Basen behandeln. # Hinreichende Bedingungen zur Injektivität In der ganzen Diskussion ist die wichtigste Frage die nach der globalen Injektivität. Denn die Voraussetzungen über das Nichtverschwinden der Funktionaldeterminante sichern immer nur die lokale Injektivität. Wir diskutieren jetzt eine Reihe von hinreichenden Bedingungen, die über diese lokale Antwort hinausgehen. Ein erstes Ergebnis in dieser Richtung ist der Satz I[11.1]. Die Forderung dort war, dass die Ableitung F 0 .x/ für alle x „nahe“ bei einer festen regulären linearen Abbildung T W -Rn ! Rn liegt,-und zwar in dem Sinne, dass stets -T &1 F 0 .x/ % I - < 1 oder stets -F 0 .x/T &1 % I - < 1 gilt (und außerdem die Definitionsmenge konvex ist). Diese Ungleichungen implizieren von alleine, dass F 0 .x/ stets regulär ist (N[10.4]). Somit ergibt sich aus E als Spezialfall:
287
Abschnitt 12.1 Der Umkehrsatz
G. Folgerung. Die Abbildung F W A ! Rn , definiert auf einer offenen und konvexen Menge A - Rn , sei von der Klasse C r mit einem r $ 1. Gilt für eine reguläre lineare Abbildung T W Rn ! Rn - &1 0 -T G .x/ % I - < 1 für alle x 2 A - 0 -G .x/T &1 % I - < 1 für alle x 2 A; oder so ist die Bildmenge F .A/ offen in Rn , und F W A ! F .A/ ist ein C r -Diffeomorphismus. " Eine weitere Möglichkeit, die Injektivität zu sichern, ergibt sich aus den Abschätzungen von Satz C, wenn man die dortige Differenz F 0 .x/ % F 0 .a/ mittels der Ableitung von F 0 , d.h. mit der zweiten Ableitung F 00 , kontrolliert. Ähnlich wie bei den Potenzreihen erfasst man den größtmöglichen Ball um a, in dem Injektivität herrscht, durch den folgenden Begriff: H. Definition. Sei F W A ! Rn eine stetige Abbildung, definiert auf einer offenen Menge A - Rp , und a 2 A ein fester Punkt. Der Injektivitätsradius R von F um a ist das Supremum aller r > 0 mit der Eigenschaft, dass der Ball B.a; r/ in A enthalten und F auf ihm injektiv ist: ˇ , ˚ R ´ sup r > 0 ˇ B.a; r/ - A und F jB.a; r/ injektiv : Gibt es keinen solchen Ball, so wird R ´ 0 gesetzt. B.a; R/ ist also der größte Ball um a auf dem F definiert und injektiv ist. Das Supremumsbildung ist in R gemeint, d.h. R D 1 ist zugelassen. Das ist sogar ein besonders günstiger Fall, da dann F auf ganz Rp injektiv ist. Im Fall R D 0 ist B.a; R/ als ¿, im Fall R D 1 als Rp zu lesen. Von Interesse ist der Injektivitätsradius nur für p 0 n. Ist nämlich p > n so besagt ein Satz der Topologie, dass F niemals injektiv sein kann (vgl. Dold[1972], Cor. 7.5). Im Fall p D n, den wir jetzt wieder aufgreifen, ist der Injektivitätsradius unter den Voraussetzungen des Umkehrsatzes D jedenfalls positiv. Beschränkt man sich auf einen Ball B.a; %/ ) A, so kann die in Satz C relevante Differenz F 0 .x/ % F 0 .a/ für x 2 B.a; %/ nach dem Schrankensatz G[11.1] abgeschätzt werden: - 0 -F .x/ % F 0 .a/- 0 max -F 00 .z/- ' kx % ak ; (5) z2B.a;%/
vorausgesetzt F 00 ist auf A existent und stetig. Eine obere Schranke der rechten Seite läuft also auf eine Ballbedingung für x hinaus, und diese garantiert dann die gleiche
288
Kapitel 12 Umkehrung differenzierbarer Abbildungen
Schranke für die linke Seite, wie sie für Satz C erforderlich ist. Das führt dann zu dem folgenden Satz. Zuvor sei aber die Rolle der zweiten Ableitung F 00 beleuchtet: Ist F in A differenzierbar, so ist die Ableitung vom Typ F 0 W A ! L.Rn /. Da L.Rn / D L.Rn / selbst wieder ein normierter Vektorraum ist (H[10.1]), kann man von dieser Abbildung erneut die Ableitung .F 0 /0 µ F 00 bilden (wenn sie überall differenzierbar ist). Unter dieser Voraussetzung wird F 00 eine Abbildung vom Typ F 00 W A ! L.Rn ; L.Rn // D L.Rn ; L.Rn //. Man nennt dann F 00 die zweite Fréchet-Ableitung (und F 0 genauer die erste Fréchet-Ableitung) von F . I. Folgerung. Die Abbildung F W A ! Rn sei definiert auf einer offenen Menge A - Rn und habe dort eine stetige zweite Ableitung F 00 . Für einen festen Punkt a 2 A sei der Ball B.a; %/ ganz in A enthalten, und es sei F 0 .a/ regulär; m ´ -F 0 .a/&1 - ; M2 ´ max -F 00 .z/- : z2B.a;%/
Dann gilt für den Injektivitätsradius R von F um a die Abschätzung % + 1 : R $ R2 ´ min %; mM2 Außerdem ist F 0 .x/ auf dem Ball B.a; R2 / regulär. Beweis. Ist c 2 Œ0; 1=mŒ und %c ´ min f%; c=M2 g, so ist F nach Satz C und (5) auf dem Ball B.a; %c / injektiv und F 0 .x/ dort regulär. Da c beliebig nahe an 1=m gewählt werden kann, trifft dies auch auf den Ball B.a; .1=m/=M2 / zu. " J. Bemerkung. Konkret zugänglich wird die zweite Fréchet-Ableitung, indem man sie mit den partiellen Ableitungen der Ordnung 2, also den Funktionen @i @j F , ausdrückt. Diese seien als existent und stetig in A vorausgesetzt, d.h. F sei von der Klasse C 2 . Dann ist F auch von der Klasse C 1 . Für x 2 A gilt bei Anwendung auf die Standardbasisvektoren ej von Rn F 0 .x/ej D .@j F /.x/: Alle Indizes laufen hier von 1 bis n. Weiter ist auch F 0 von der Klasse C 1 und für x2A F 00 .x/ei D .@i F 0 /.x/: Diese Schlüsse erfordern die in G[10.6] ausgesprochene Äquivalenz. Man beachte, dass F 00 .x/ei eine lineare Abbildung von Rn in sich ist. Wird diese auf ej angewendet, so folgt mit den voranstehenden Gleichungen: .F 00 .x/ei /ej D ..@i F 0 /.x//ej D .@i .F 0 ej /.x/ D .@i @j F /.x/:
289
Abschnitt 12.1 Der Umkehrsatz
Hierin bezeichnet F 0 ej die Abbildung x 7! F 0 .x/ej , und der Übergang beim zweiten Gleichheitszeichen ist erlaubt wegen der Bilinearität der Auswertungsabbildung .L; h/ 7! L.h/ für L 2 L.Rn / und h 2 Rn aufgrund der Produktregel. Da der Ausdruck .F 00 .x/h/k bei festem x linear in h; k 2 Rn ist, ergibt sich aus dem Beginn und Ende der letzten Gleichungskette schließlich X (6) .F 00 .x/h/k D .@i @j F /.x/hi kj i;j
für alle x 2 A sowie h D .h1 ; : : : ; hn / 2 Rn und k D .k1 ; : : : ; kn / 2 Rn . Wegen der Symmetrie von @i @j F in i; j ist der Ausdruck .F 00 .x/h/k symmetrisch in h; k, definiert also eine symmetrische bilineare Abbildung, deren Auswertung auch so bezeichnet wird: .F 00 .x/h/k D .F 00 .x/k/h D F 00 .xI h; k/: Wie gesagt, dies und die Formel (6) sind unter der Voraussetzung abgeleitet, dass F von der Klasse C 2 ist. Durch analoge Argumente ergibt sich aber auch die Umkehrung, d.h. aus der Existenz und Stetigkeit von F 00 folgt rückwärts, dass F von der Klasse C 2 ist. Gleichung (6) zeigt auch die Koinzidenz der zweiten Ableitung mit der totalen Ableitung der Ordnung 2, wie in (3)[10.7] für den skalaren Fall eingeführt. Mit der expliziten Darstellung (6) kann nun bei gegebener Norm in Rn die Größe M2 weiter nach oben (und damit der Injektivitätsradius weiter nach unten) abgeschätzt werden. Wird z.B. in Rn die Maximumsnorm und in den Räumen L.Rn / und L.Rn ; L.Rn // die daraus resultierende Operator-Norm verwendet (alle mit dem Index 1 bezeichnet), so folgt X ˇ ˇ - 00 ˇ.@i @j F` /.x/ˇ ; -F .x/- 0 max 1 `
i;j
wobei die F` die Komponentenfunktionen von F sind. Hiermit wird % + X ˇ ˇˇ ˇ.@i @j F` /.x/ˇ ˇˇ kx % ak 0 % µ M2;1 : M2 0 max max 1 `
i;j
Mit der so definierten Größe M2;1 gilt also für den Injektivitätsradius R % + 1 : R $ min %; mM2;1 Die Injektivität kann direkt und global abgesichert werden, indem man die Variante des vektoriellen Mittelwertsatzes aus F[10.7] heranzieht. Das geht sogar für Abbildungen vom Typ Rp ! Rn mit p 0 n. K. Satz (von E. Schmidt). Die Abbildung F W A ! Rn sei auf der offenen und konvexen Menge A - Rp mit p 0 n differenzierbar, und es seien F1 ; : : : ; Fp die Komponentenfunktionen von F . Besteht für alle Punkte c1 ; : : : ; cn von A die (7)
lineare Unabhängigkeit von .grad F1 /c1 ; : : : ; .grad Fn /cn ;
so ist F injektiv (und speziell ist F 0 .x/ für alle x 2 A vom maximalen Rang p).
290
Kapitel 12 Umkehrung differenzierbarer Abbildungen
Beweis. Der zitierte Mittelwertsatz besagt in der augenblicklichen Situation: Zu zwei Punkten a; b 2 A mit h ´ b % a existieren Punkte c1 ; : : : ; cn (auf der Verbindungsstrecke von a; b), sodass 1 0 1 0 h1 .@1 F1 /.c1 / : : : .@p F1 /.c1 / C B B : :C : :: :: F .b/ % F .a/ D @ A ' @ :: A : .@1 Fn /.cn / : : : .@p Fn /.cn /
hp
Hier sind die Zeilen der rechts stehenden Matrix gerade die Gradientenvektoren aus (7). Diese Matrix hat also den Rang p. Daraus folgt, dass für a; b 2 A die Werte F .a/ und F .b/ nur dann gleich sein können, wenn h ´ b % a null ist. Speziell für c1 D ' ' ' D cn D x geht die Matrix in die Funktionalmatrix F 0 .x/ über. " Diese ist also ebenfalls vom Rang p. Im Fall p D n kann die Bedingung (7) auch so ausgedrückt werden, dass für alle Stellen c1 ; : : : ; cn von A gilt: ˇ ˇ ˇ .@1 F1 /.c1 / : : : .@n F1 /.c1 / ˇ ˇ ˇ ˇ ˇ :: :: ˇ ˇ ¤ 0: : : ˇ ˇ ˇ.@1 Fn /.cn / : : : .@n Fn /.cn /ˇ Anstelle der Gradienten der Komponentenfunktionen lassen sich die Richtungsableitungen so einschränken, dass die Abbildung gezwungen ist, injektiv zu sein. Das kann nach Selimovic[2007] folgendermaßen angegangen werden, wobei der Startpunkt eine andere Version des Satzes von Rolle ist: L. Lemma (von Rolle, erweitert). Die Funktion f W Œ˛; ˇ2 ! R sei stetig und im offenen Intervall 2˛; ˇŒ differenzierbar. Gilt f .˛/ D f .ˇ/, so ist entweder f konstant oder aber es existieren Stellen tC ; t0 ; t& in 2˛; ˇŒ mit f 0 .tC / > 0;
f 0 .t0 / D 0;
f 0 .t& / < 0:
Beweis. Sei f nicht konstant. Wäre f 0 im ganzen Intervall 2˛; ˇŒ nichtnegativ, so wäre f monoton wachsend, also wegen f .˛/ D f .ˇ/ konstant. Analog führt die Annahme, f 0 sei stets nichtpositiv zum Widerspruch. Somit nimmt f 0 in 2˛; ˇŒ Werte beiderlei Vorzeichen an. Nach dem gewöhnlichen Satz von Rolle existiert ohnehin eine Nullstelle von f 0 in 2˛; ˇŒ. " M. Lemma. Ist der Weg 1 W Œ˛; ˇ2 ! Rn in 2˛; ˇŒ differenzierbar und geschlossen, d.h. 1.˛/ D 1.ˇ/, so verlassen die Ableitungsvektoren 1 0 .t/ jeden offenen Halbraum von Rn der Gestalt H D fz 2 Rn j hv; zi > 0g mit festem v ¤ 0 aus Rn .
291
Abschnitt 12.1 Der Umkehrsatz
Zwei leicht zu bestätigende Grundeigenschaften eines solchen Halbraums H sind: H ist konvex; mit z gehört auch %z zu H , falls % > 0. Wenn hier von einem Halbraum die Rede ist, so ist damit immer ein offener Halbraum in Rn dieser Art gemeint. Beweis von M. Ist H gegeben, so betrachte man die Funktion f W Œ˛; ˇ2 ! R, definiert durch f .t/ ´ hv; 1.t/i. Diese Funktion ist in Œ˛; ˇ2 stetig, in 2˛; ˇŒ differenzierbar und erfüllt wegen der Geschlossenheit f .˛/ D f .ˇ/. Es gilt f 0 .t/ D hv; 1 0 .t/i. Somit ist nach Lemma L entweder f D const., also hv; 1 0 i D 0, oder aber hv; 1 0 i nimmt Werte beiderlei Vorzeichen an. In beiden Fällen liegt das Bild 1 0 .2˛; ˇŒ/ nicht ganz in H . " N. Satz (Selimovic[2007]). Die Abbildung F W A ! Rn sei auf der offenen und konvexen Menge A - Rp mit p 0 n differenzierbar und besitze folgende Eigenschaft: Zu jeder „Vorzeichenkombination“ "1 ; : : : ; "p mit "j 2 f1; %1g existiert ein offener Halbraum H ) Rn mit p [ "j Fxj .A/ - H: j D1
Dann ist F injektiv. Fxj ist die j -te partielle Ableitung Fxj W A ! Rn , dargestellt durch die j -te Spalte der Jacobi-Matrix: 1 0 @j F1 @F C B D @ ::: A : Fxj D @xj @j Fn Weiter bezeichnet Fxj .A/ das Bild von A unter Fxj im Vektorraum Rn und "j Fxj .A/ die Menge der Vektoren "j w mit w 2 Fxj .A/. Beweis von N. Angenommen, es gibt zwei Punkte a ¤ b in A mit F .a/ D F .b/. Dann sei g W Œ0; 12 ! A - Rm die Verbindungsstrecke von a nach b: g.t/ ´ a C t.b % a/: Der Bildweg 1 ´ F ı g W Œ0; 12 ! Rn ist dann differenzierbar und geschlossen: 1.0/ D 1.1/, sodass die Ableitungen 1 0 .t/ jeden Halbraum H verlassen. Es gilt 1 0 .t/ D
p X
Fxj .g.t//.bj % aj /;
j D1
wobei die aj (bzw. bj ) die Komponenten von a (bzw. b) sind. Für j D 1; : : : ; p sei gesetzt ,j ´ bj % aj .
292
Kapitel 12 Umkehrung differenzierbarer Abbildungen
Unter der gemachten Annahme existiert also ein p-Tupel , ´ .,1 ; : : : ; ,p / ¤ 0 derart, dass für jeden Halbraum H ein Punkt c 2 A existiert mit p X
Fxj .c/,j … H:
j D1
Anders gewendet: .#/ Gibt es für alle p-Tupel , ´ .,1 ; : : : ; ,p / ¤ 0 einen Halbraum H , sodass für alle c 2 A gilt: p X Fxj .c/,j 2 H; j D1
so ist F injektiv. Hinreichend für die Prämisse von .#/ ist: .##/ Für alle p-Tupel ."1 ; : : : ; "p / von "j 2 f1; %1g gibt es einen Halbraum H , sodass für alle c 2 A gilt: Fxj .c/"j 2 H
für alle j 2 f1; : : : ; pg:
Ist nämlich , ´ .,1 ; : : : ; ,p / ¤ 0 gegeben, so setze man ( sign.,j /; falls ,j ¤ 0 "j ´ 1; falls ,j D 0: Dann existiert nach .##/ ein Halbraum H , so dass für alle c 2 A gilt: Fxj .c/"j 2 H
für alle j 2 f1; : : : ; pg:
Aus dieser letzten Zeile folgt wegen der genannten Grundeigenschaften von H : p X
ˇ ˇ Fxj .c/"j ˇ,j ˇ 2 H;
j D1
also
p X
Fxj .c/,j 2 H:
j D1
Somit folgt aus .##/ ebenfalls, dass F injektiv ist. Offensichtlich kann diese Implikation auch so formuliert werden, wie im Satz angegeben. " Ohne Beweise seien folgende Ergebnisse mitgeteilt:
293
Abschnitt 12.1 Der Umkehrsatz
O. Satz. Sei F W V ! W eine stetig differenzierbare Abbildung zwischen BanachRäumen V , W . Die Ableitung F 0 .x/ sei für jedes x 2 V toplinear, und es gebe eine Konstante K > 0 mit - 0 -.F .x//&1 - 0 K für alle x 2 V : Dann ist F bijektiv, und die Umkehrabbildung F &1 W W ! V ist ebenfalls stetig differenzierbar. Insbesondere bildet F den Raum V homöomorph auf den Raum W ab. Beweis. Vgl. Schwartz[1969], Theorem 1.22.
"
P . Satz. Ist L W V ! W eine stetige und bijektive lineare Abbildung zwischen Banach-Räumen, so ist L&1 W V ! W von alleine stetig (also L toplinear). Beweis. Im endlich-dimensionalen Fall ist dies klar, da jede lineare Abbildung (speziell L&1 ) stetig ist. Im allgemeinen Fall handelt es sich um eine Folgerung aus einem wichtigen Prinzip der Funktionalanalysis („open mapping theorem“). Vgl. z.B. Heuser[2006], Abschnitt 39. " Die Folgerung E über die offene Bildmenge ist in gewisser Weise auf stetige Abbildungen verallgemeinerungsfähig. Es gilt nämlich: Q. Satz (über die Gebietsinvarianz). (i)
Ist A - Rn offen und F W A ! Rn stetig und injektiv, so ist auch F .U / offen.
(ii) Ist A - Rp offen und nicht leer und G W A ! Rn stetig und injektiv, so gilt p 0 n. Beweis. Vgl. Dold[1972], Abschnitte 7.4 und 7.5. Aufgaben und Anmerkungen 1. Gegeben sei die Abbildung F mit 0
y%z 1 x B C B C Bz % x C 1C F .x; y; z/ ´ B C B C y @ A x%y z in klassischer Notation.
"
294
Kapitel 12 Umkehrung differenzierbarer Abbildungen
a) Man bestimme die maximal sinnvolle, offene Definitionsmenge A - R3 , sodass also F W A ! R3 von der Klasse C 1 wird. b) Man berechne die Jacobi-Matrix von F . c) In der Umgebung welcher Stellen von A ist F von der Klasse C 1 invertierbar? d) Es gilt F .1; 1; 1/ D .0; 1; 0/. Sei G die lokale C 1 -Umkehrung von F mit G.0; 1; 0/ D .1; 1; 1/. Wie lautet die Jacobi-Matrix .J G/.0; 1; 0/? 2. Man zeige, dass die Funktion f W R ! R mit f .t/ ´ t C t 2 sin
1 t
für t ¤ 0
f .0/ ´ 0
auf ganz R differenzierbar ist mit f 0 .0/ D 1. Man zeige weiter, dass f auf keiner Umgebung U.0; ı/ injektiv ist. Wieso kann man dem Umkehrsatz weiterhin trauen? 3. Gegeben sei die Abbildung F W R2 ! R2 , definiert in klassischer Notation durch / 1 x cos y % y sin y F .x; y/ ´ e x ' : x sin y C y cos y a) Man berechne die Jacobi-Matrix von F . b) In der Umgebung welcher Stellen ist F von der Klasse C 1 invertierbar? c) Durch F wird der Nullpunkt in den Nullpunkt abgebildet: F .0/ D 0. Man berechne die Ableitung der lokalen C 1 -Umkehrfunktion G mit G.0/ D 0 an der Stelle 0. Hinweis: Die Abbildung F ist die reelle Auffassung der holomorphen Funktion f W C ! C mit f .z/ D ze z . Die Auflösung der Gleichung ze z D w bei gegebenem w 2 C nach z ist weder formelmäßig möglich noch eindeutig. Die möglichen holomorphen Auflösungen („Zweige“) z D L.w/ werden als Lambertsche W-Funktionen bezeichnet. Bei Teil c) handelt es sich um den Zweig, der nahe 0 holomorph ist. Mit den Mitteln der Funktionentheorie kann dieser von einer Nullpunktsumgebung aus weiter analytisch fortgesetzt werden, und es können auch die anderen holomorphen Zweige bestimmt werden. 4. Ein C 2 -Weg sei durch die Parameterdarstellung 1 W J ! R2 (J Intervall in R) gegeben, und es seien u W J ! R, v W J ! R die beiden Komponentenfunktionen von 1 (also u ´ 11 , v ´ 12 in der Bezeichnungsweise von A[9.1]). Hat u0 keine Nullstelle in J , so liefert die Auflösung der Gleichung u.t/ D x nach t eine Umkehrfunktion der Klasse C 2 : t D '.x/. Das ist hier sogar global möglich aufgrund des Umkehrsatzes E[3.6] (d.h. ' hat als Definitionsmenge ein Intervall K - R, und es gilt u.K/ D J .) Einsetzen von t D '.x/ in die zweite Komponentenfunktion v liefert die Komposition g.x/ ´ v.'.x// für x 2 K. Dann ist x 7! .x; g.x//> , x 2 K eine Umparametrisierung des Weges 1 in Graphengestalt wie in I(i)[9.1]. Man drücke g 0 .x/ und g 00 .x/ durch die Ableitungen von u, v an der Stelle '.x/ aus.
295
Abschnitt 12.1 Der Umkehrsatz
5. Bei den Polarkoordinaten (Bemerkung F(i)) kann der dort genannte Streifen noch viel allgemeiner gestaltet werden, ohne die Injektivität zu stören: Das '-Intervall der Länge 2' darf von r abhängen. Genauer: Ist f W RC ! R irgendeine Funktion, so ist die Einschränkung von ˆ auf den „krummlinigen Streifen“ f.r; '/ j r > 0; f .r/ 0 ' < f .r/ C 2'g immer noch injektiv. 6. Die C 1 -Abbildung F W A ! Rn besitze an jeder Stelle x der offenen Definitionsmenge A - Rn eine reguläre Ableitung F 0 .x/. Zeige: a) kF k hat in A keine lokale Maximalstelle. b) Ist F .x/ ¤ 0 für alle x 2 A, so hat kF k in A keine lokale Minimalstelle. c) Ist A beschränkt und F auf A stetig fortsetzbar, so existiert ein Maximum der fortgesetzten Funktion kF k auf A, und dieses wird auf dem Rand @A angenommen. Lemma A ist eine infinitesimale Version des Teils b)! Lösungshinweis zu a) und b): Angenommen, a sei doch eine lokale Extremalstelle von kF k. O.B.d.A. kann angenommen werden, dass F ein C 1 -Diffeomorphismus von A auf F .A/ ist. Dann betrachte man F &1 längs der Geraden t 7! tF .a/ für t nahe 1. 7. Umkehrung holomorpher Funktionen: Sei f W B ! C (B Gebiet in C) eine holomorphe Funktion und b 2 B eine Stelle mit f 0 .b/ ¤ 0. Aus dem lokalen Umkehrsatz D folgere man: Es gibt Umgebungen U von b und V von c ´ f .b/ derart, dass f jU W U ! V eine stetige Umkehrung g W V ! U mit g.c/ D b besitzt, und g ist holomorph. Lösungshinweis: Man beachte, dass f , reell aufgefasst, in einer Umgebung von a eine reguläre Ableitung besitzt (N[10.6]). Zum Nachweis der Holomorphie von g sei 1 W J ! V ein C 1 -Weg. Durch komplexes Ableiten von f .g.1.s/// D s erhält man .g ı 1/0 .s/ D
1 ' 1 0 .s/ .f ı g/.s/ 0
und verifiziert so das Erfülltsein von Definition J[7.3]. Alternativ kann man auch mittels (1) bestätigen, dass g die Cauchy/Riemannschen Differentialgleichungen erfüllt. Das liegt letzten Endes daran, dass die Inverse einer regulären Matrix der Gestalt 1 / ˛ %ˇ ˇ ˛ wiederum diese Gestalt besitzt.
296
Kapitel 12 Umkehrung differenzierbarer Abbildungen
8. # Sei f W B ! C eine holomorphe Funktion, definiert auf dem Gebiet B - C. Man beweise: Liegt das Bild f .B/ ganz im Bild eines C 1 -Wegs 1 W J ! B: f .B/ 1.J /, so ist f konstant. Hiervon gibt es einige wichtige Spezialfälle: Nimmt f nur reelle Werte an, so ist f konstant. Analog, wenn f nur rein imaginäre Werte annimmt. Oder: Gilt jf j D const., so ist f selbst konstant. Vgl. auch Aufgabe 12[10.6]. 9. Koeffizientenvektor versus Nullstellenmenge: Es sei W ) Rn die Menge aller n-Tupel x D .x1 ; : : : ; xn / mit x1 < x2 < ' ' ' < xn . Weiter sei A ) Rn die Menge aller .a1 ; : : : ; an / 2 Rn derart, dass das normierte Polynom (8)
P .t/ ´ an C an&1 t C an&2 t 2 C ' ' ' C a1 t n&1 C t n
n paarweise verschiedene reelle Nullstellen besitzt. Man beweise: a) A ist offen in Rn . b) Die Abbildung N W A ! W , die jedem Koeffizientenvektor a des Polynoms (8) dessen Nullstellen in der Anordnung x1 < x2 < ' ' ' < xn zuordnet, ist ein C 1 -Diffeomorphismus von A auf die (offene) Menge W . Etwas salopp gesprochen, heißt dies: Hat man ein normiertes Polynom vom Grad n gegeben, das nur einfache reelle Nullstellen der Anzahl n besitzt, so kann man an den Koeffizienten etwas wackeln, ohne diese Eigenschaft zu zerstören. Die Nullstellen hängen in der Menge dieser Polynome C 1 -differenzierbar von den Koeffizienten ab. Lösungshinweis: Es ist rechnerisch etwas bequemer, anstelle von W die Menge V WD %W zu betrachten und anstelle von N die Abbildung M W A ! V mit M ´ %N . Beide Abbildungen N , M sind bijektiv. Man startet mit der invers gerichteten Zuordnung F W V ! A, die n Punkten in der Anordnung x1 > x2 > ' ' ' > xn das Polynom (8) mit den Nullstellen %x1 < %x2 < ' ' ' < %xn zuweist. Auch F ist bijektiv, und es gilt M.F .x// D x für alle x 2 V also N.y/ D %M.y/ D %F &1 .y/ für alle y 2 A. Es reicht also nach Folgerung E der Nachweis, dass F von der Klasse C 1 ist und überall in V eine reguläre Ableitung besitzt. Das geht so: F ist formelmäßig beschreibbar; denn aufgrund der Identität (9)
an C an&1 t C an&2 t 2 C ' ' ' C a1 t n&1 C t n D .t C x1 /.t C x2 / ' ' ' .t C xn /
297
Abschnitt 12.1 Der Umkehrsatz
ergeben sich für F die Abbildungsgleichungen a1 D x1 C x2 C ' ' ' xn µ S1 .x/ a2 D x1 x2 C ' ' ' C xn&1 xn µ S2 .x/ :: : ak D
X
xi1 xi2 ' ' ' xik µ Sk .x/
1#i1 ist offensichtlich von der Klasse C 1 . Entscheidend ist nun eine Umformung der Funktionaldeterminante, nämlich: ˇ ˇ ˇ 1 1 ::: 1 ˇˇ ˇ ˇ x1 x2 ::: xn ˇˇ ˇ 2 2 ˇ @.S1 ; : : : ; Sn / Œn=2- ˇ x 2 : : : x x n ˇ 2 D .%1/ 'ˇ 1 det.JF / D ˇ :: @.x1 ; : : : ; xn / :: :: ˇ ˇ : : : ˇˇ ˇ ˇx n&1 x n&1 : : : x n&1 ˇ n 1 2 Y D .%1/Œn=2- ' .xk % xj /: 1#j 0 und eine C 1 -Funktion w W U ! 2t0 % "; t0 C "Œ mit folgenden Eigenschaften: Für jedes .n C 1/ Tupel .b0 ; : : : ; bn / 2 U ist w.b0 ; : : : ; bn / die einzige Nullstelle des reellen Polynoms Q W R ! R, Q.t/ ´ b0 C b1 t C ' ' ' C bn t n ; in 2t0 % "; t0 C "Œ, und diese ist eine einfache Nullstelle von Q. b) Für die „Wurzelfunktion“ w aus Teil a) gilt .grad w/.a0 ;:::;an / D %
1 P 0 .t0 /
' .1; t0 ; t02 ; : : : ; t0n /:
c) Man finde ein Gegenbeispiel für a) im Falle einer mehrfachen Nullstelle.
12.3 Extrema mit Nebenbedingungen Eine typische Fragestellung ist folgende: Sei T W R3 ! R eine Temperaturverteilung im Raum (mit klassischer Koordinatenbezeichnung x; y; z). Bei einem gewöhnlichen Extremalproblem würde man sich für alle Stellen interessieren, an denen die Temperatur, verglichen mit anderen Stellen im Raum, extremal ist. Sucht man die Extrema
308
Kapitel 12 Umkehrung differenzierbarer Abbildungen
nur auf der „Erdoberfläche“, also etwa auf der Sphäre x 2 C y 2 C z 2 D 1, und verlangt Maximum oder Minimum nur im Vergleich mit anderen Werten auf der Sphäre, so handelt es sich um ein Extremalproblem mit einer Nebenbedingung. Aber auch mehrere solche Restriktionen sind möglich. A. Definition. Gegeben sei eine skalare Funktion f W A ! R (A - Rn ) sowie weitere Funktionen in endlicher Anzahl: gj W A ! R, j D 1; : : : ; q. Diese sind vektoriell zusammenfassbar: g ´ .g1 ; : : : ; gq /> W A ! Rq : Gesucht sind die Extrema von f .x1 ; : : : ; xn / D f .x/ unter den Nebenbedingungen gj .x1 ; : : : ; xn / D 0;
j D 1; : : : ; q;
d.h. die Extrema der Restriktion von f auf die Nullstellenmenge Zg ´ fx 2 A j g.x/ D 0g: Zum Größenvergleich für f werden also nur die Werte von f auf Zg herangezogen. Man nennt f die Zielfunktion, und Zg heißt auch Nebenbedingungsmenge. Ansonsten werden die üblichen Begriffe für Extrema („relativ“,„absolut“ etc.) sinngemäß beibehalten. B. Beispiel. Wie oben sei T W R3 ! R eine Temperaturverteilung im Raum, und gesucht sind die Maxima der eingeschränkten Temperaturverteilung auf der Sphäre mit der Gleichung x 2 Cy 2 Cz 2 D 1. „Wo auf der Erdoberfläche ist es am wärmsten?“ Hier ist die Zielfunktion f ´ T und g1 .x; y; z/ D 0 mit g1 .x; y; z/ ´ x 2 C y 2 C z 2 % 1 eine Nebenbedingung (q D 1). Eine Aufgabe mit zwei Nebenbedingungen wäre: Wo auf dem 30. Breitengrad ist es am wärmsten? Hier besteht die zusätzliche Nebenbedingung: z D sin .'=6/ D 1=2, also g2 .x; y; z/ D 0 mit g2 .x; y; z/ ´ z % 1=2. Es handelt sich um zwei Nebenbedingungen (q D 2). Falls die Nebenbedingungen nach gewissen Variablen formelmäßig auflösbar sind, so setzt man diese Auflösungen in f ein und erhält dann ein gewöhnliches Extremalproblem. Sonst geht man –bei differenzierbaren Gegebenheiten – nach folgenden Sätzen vor. Diese beruhen ebenfalls auf dem Auflösungsgedanken. C. Satz (notwendiges Kriterium für Extrema mit Nebenbedingungen). Sei a 2 Aı lokale Extremalstelle von f unter den Nebenbedingungen g D 0, und seien f; g in einer Umgebung von a von der Klasse C 1 . Dann sind die Gradienten .grad f /a ; .grad g1 /a ; : : : ; .grad gq /a
linear abhängig:
309
Abschnitt 12.3 Extrema mit Nebenbedingungen
Beweis. Angenommen, diese Vektoren sind linear unabhängig, insbesondere q C 1 0 n. Wir betrachten dann das Gleichungssystem für .n C 1/ Variable .x1 ; : : : ; xn ; y/ D .x; y/ f .x1 ; : : : ; xn / D y g1 .x1 ; : : : ; xn / D 0 :: : gq .x1 ; : : : ; xn / D 0 nahe .a; f .a//. Seine Jacobi-Matrix nach x D .x1 ; : : : ; xn / hat laut Annahme in x D a den Zeilenrang q C 1, also auch den Spaltenrang q C 1. Es kann somit nahe .a; f .a// 2 RnC1 nach geeigneten q C 1 der Variablen x1 ; : : : ; xn aufgelöst werden (A[12.2]). Daraus folgt, dass in jeder Umgebung von a sowohl y > f .a/ wie auch y < f .a/ möglich ist (unter Wahrung der Nebenbedingungen). Widerspruch! " C. Zusatz. Falls außerdem die Gradienten .grad g1 /a ; : : : ; .grad gq /a linear unabhängig sind, so lautet die notwendige Bedingung: Der Gradient .grad f /a der Zielfunktion ist eine Linearkombination dieser Gradienten. Oder also: Es gibt Zahlen +1 ; : : : ; +q 2 R derart, dass .grad f /a D +1 .grad g1 /a C ' ' ' C +q .grad gq /a ; Die eindeutig bestimmten Koeffizienten +1 ; : : : ; +q heißen dann Lagrangesche Multiplikatoren. " D. Bemerkung (Merkregel für den Zusatz). Man bilde mit freien Parametern +j ˆ ´ f % +1 g1 % ' ' ' % +q gq ; also eine Funktion von nCq Veränderlichen x1 ; : : : ; xn und +1 ; : : : ; +q . Dann schreibe man die notwendige Bedingung für innere Extrema von ˆ auf, d.h. @ˆ @f @g1 @gq D % +1 % ' ' ' % +q D 0; @xi @xi @xi @xi
i D 1; : : : ; n
@ˆ D %gj D 0; @+j
j D 1; : : : ; q:
Das gibt gerade die Bedingung des Zusatzes und erneut die Nebenbedingungen (wobei natürlich bei den Funktionen von x die Auswertungen bei a gemeint sind).
310
Kapitel 12 Umkehrung differenzierbarer Abbildungen
Extrema bei nicht-offenen Definitionsmengen Diese Kriterien können nun auch dazu dienen, Extrema im gewöhnlichen Sinne z.B. auf abgeschlossenen Mengen zu finden. Für die Extremalstellen von f W A ! R im Inneren Aı sind ja bereits die Methoden in Abschnitt 10.8 bereitgestellt. Ist nun der Rand @A durch Nebenbedingungen beschreibbar, so kann man auf diesen die obigen Sätze anwenden. So erhält man zunächst Punkte auf @A, die im Vergleich mit anderen Punkten auf @A extremal sein können. Unter diesen kommen speziell die Punkte vor, an denen f im Vergleich mit allen Stellen extremal ist. So erhält man zumindest alle Kandidaten für Extremalstellen von f insgesamt. Das trifft selbst dann zu, wenn der Rand @A sich aus mehreren Teilen zusammensetzt, von denen jeder durch eigene Nebenbedingungen beschrieben wird, wie das z.B. bei einem Simplex der Fall ist. Natürlich müssen in die Kandidatenliste auch Stellen einbezogen werden, bei denen die Voraussetzungen der genannten Sätze nicht erfüllt sind. Wie man bei vorhandenen Nebenbedingungen entscheiden kann, ob es sich wirklich bei einem Kandidaten um ein lokales Extremum handelt, wird in Analysis 3 diskutiert. E. Beispiel. Eine Temperaturverteilung auf dem abgeschlossenen Euklidischen Einheitsball B.1/ ´ f.x; y; z/ 2 R3 j x 2 C y 2 C z 2 0 1g sei gegeben durch T .x; y; z/ ´ 20 C 18xyz: Wo auf dem Ball ist es am wärmsten, wo am kühlsten? Wie groß sind die extremalen Temperaturen? Lösung: Gesucht sind also die absoluten Extrema von T auf B.1/. 1) Extrema im Inneren B.1/: Gradient und Hesse-Matrix der Zielfunktion T lauten 1 0 0 z y grad T D 18.yz; xz; xy/; H T D 18 @ z 0 x A : y x 0 Bei solchen praktischen Rechnungen wird oft von den strengen Argumentschreibweisen abgewichen. Hier müsste es eigentlich auf den linken Seiten heißen: .grad T /.x;y;z/ bzw. .H T /.x;y;z/ . Irritationen sind aber wohl bei gutem „Mitdenken“ nicht zu befürchten, wenn man sich diese kleinen Freiheiten nimmt. Der Gradient ist genau dann gleich .0; 0; 0/, wenn mindestens zwei der Koordinaten gleich 0 sind. Gilt z.B. x D y D 0, aber z ¤ 0, so lautet die Hesse-Matrix 0 1 0 z 0 18 @z 0 0A : 0 0 0
311
Abschnitt 12.3 Extrema mit Nebenbedingungen
Diese Matrix ist indefinit, somit kein relatives Extremum dafür vorhanden. Analog sieht man, dass auch in den zwei anderen Fällen Indefinitheit vorliegt, wenn genau eine Koordinate ¤ 0 ist. Dann verbleibt im Inneren nur noch .0; 0; 0/ als eventueller Kandidat. Dafür ist die Hesse-Matrix null, sie liefert also keine Entscheidung. Jedoch nimmt xyz nahe .0; 0; 0/ Werte beliebigen Vorzeichens an, so dass der Funktionswert T .0; 0; 0/ D 20 in jeder Umgebung von .0; 0; 0/ sowohl unter- wie überschritten wird: Der Nullpunkt ist keine relative Extremalstelle. Somit gibt es im Inneren B.1/ überhaupt keine Extremalstellen, weder relative noch absolute! Andererseits müssen doch auf B.1/ Extrema vorhanden sein, weil T stetig und B.1/ kompakt ist (allgemeines Extremalprinzip D[6.5]). 2) Extrema auf dem Rand @B.1/ µ S2 : Notwendige Bedingungen erhält man so: Ist a 2 S2 Extremalstelle von T , so auch von T jS2 . Nun ist S2 definiert durch die Gleichung x 2 C y 2 C z 2 D 1. Also können die Extrema von T jS2 mit Satz C gefunden werden, wobei eine Nebenbedingungsfunktion vorhanden ist; g.x; y; z/ ´ x 2 C y 2 C z 2 % 1; Da grad g auf S2 immer ¤ grad T D + grad g, d.h.
grad g D .2x; 2y; 2z/:
0 ist, erhält man als notwendige Bedingung 18yz D + ' 2x 18xz D + ' 2y 18xy D + ' 2z:
Sei zunächst + ¤ 0 angenommen. Dann kann keine der drei Koordinaten gleich 0 sein. Wäre z.B. x D 0, so nach der ersten Gleichung auch y oder z, und aus Gleichung 2 oder 3 folgte dann, dass auch die dritte Koordinaten 0 ist, was auf S2 nicht möglich ist. Wenn aber alle drei Koordinaten ¤ 0 sind, so ergibt sich aus den drei Gleichungen durch wechselseitiges Einsetzen leicht, dass x 2 D y 2 D z 2 sein muss. Also kommen p wegen x 2 C y 2 C z 2 D 1 nur die Punkte in Frage, für die jxj D jyj D jzj D 1= 3 µ w ist. Somit ergeben sich als Kandidaten die Stellen (1)
.w; w; w/;
.w; %w; %w/;
(2)
.%w; %w; %w/;
.%w; w; %w/;
.%w; w; w/;
.w; %w; w/;
.%w; %w; w/ .w; w; %w/:
3 Das sind insgesamt acht Punkte (in p den acht Oktanten des R ). In den Punkten von3(1) 3 ist T gleich p 20C18w D 20C2 3, in den Punkten von (2) ist T gleich 20%18w D 20 % 2 3.
Im Fall + D 0 müssten wieder zwei der Koordinaten gleich 0 sein (und die verbleibende zwangsläufig gleich ˙1). Hierfür ist dann T gleich 20, also liegt sicher keine
312
Kapitel 12 Umkehrung differenzierbarer Abbildungen
p p absolute Extremalstelle vor, da ja 20 % 2 3 < 20 < 20 C 2 3. (Eine feinere Überlegung würde zeigen, dass diese „Pole“ auch keine relativen Extremalstellen sind, was aber für die Aufgabenstellung nicht erforderlich ist). Resultat: Es gibt p genau vier absolute Maximalstellen (1) mit der maximalen Tem1 23;46 und genau vier Minimalstellen (2) mit der minimalen peratur 20 C 2 3 p Temperatur 20 % 2 3 1 16;54. Maxima und Minima wechseln sich ab, wenn man von einem Oktanten zu einem „benachbarten“ übergeht, dessen Vorzeichen nur bei einer Koordinate anders ist. Das folgende Bild zeigt die Temperaturverteilung auf der Kugeloberfläche S2 durch unterschiedliche Tönung und durch einige Linien gleicher Temperatur (so genannte Isothermen). Zu den Isothermen gehören auch die Großkreise auf S2 in den drei Koordinatenebenen, d.h. die Schnitte der Ebenen f.x; y; z/ j x D 0g;
f.x; y; z/ j y D 0g;
f.x; y; z/ j z D 0g
mit S2 (nicht eingezeichnet).
Aufgaben und Anmerkungen 1. In R3 wird durch
ˇ 2 % ˇx y2 z2 ˇ E ´ .x; y; z/ 2 R ˇ C C D1 9 16 36 +
3
ein Ellipsoid beschrieben. Man bestimme unter allen dem Ellipsoid E einbeschriebenen achsenparallelen Quadern denjenigen mit größtem Volumen.
Abschnitt 12.3 Extrema mit Nebenbedingungen
2. Man zeige, dass die Menge + M ´ .x; y; z/ 2 R3
313
ˇ % ˇ 2 ˇ x C 2y 2 D 11 und 4x D 3z ˇ 2
kompakt ist, und berechne das Maximum und Minimum der Funktion f .x; y; z/ ´ x C y % z auf M . 3. Man betrachte als Zielfunktion eine quadratische Form Q W Rn ! R mit symmetrischer Koeffizientenmatrix A: 1 0 a11 : : : a1n n X B :: C aij xi xj ; A ´ @ ::: (3) Q.x/ ´ : A i;j D1 an1 : : : ann und untersuche die Extrema von Q auf der Euklidischen Einheitssphäre Sn&1 . Das ist also ein Extremalproblem mit einer Nebenbedingung: g.x/ D 0;
g.x/ ´ hx; xi % 1:
Da der Gradient von g auf Sn&1 niemals verschwindet, ist der Zusatz zu C zuständig. Man zeige, dass die dortige notwendige Bedingung äquivalent ist mit Ax D +x; also mit der Eigenwertbedingung für die Matrix A. Kandidaten für die Extremalstellen sind somit die Eigenvektoren von A mit Euklidischer Norm 1. Die Formel in (3) zeigt, dass ein solcher Eigenwert + gerade der Funktionswert von Q auf dem betreffenden Eigenvektor ist. Da Q stetig und Sn&1 kompakt ist, müssen unter den Eigenwerten von A das absolute Minimum und das absolute Maximum der Restriktion QjSn&1 vorkommen. Die anderen Eigenwerte brauchen jedoch keine lokalen Extremalstellen dieser Restriktion zu sein. Wie das zur vollständigen Beschreibung der Situation ausgebaut werden kann, wird in der linearen Algebra gezeigt. Das Resultat ist dann der Satz über die Hauptachsentransformation, oft auch als Spektralsatz bezeichnet. Vgl. z.B. Greub[1976], Kap. 7, §2 oder Walter[1993], Abschnitt 2.2.
13
#Ergänzungen zur Analysis
In diesem Kapitel werden einige Ergänzungen zur Analysis gebracht. Die ersten drei Abschnitte beschäftigen sich mit gewissen Erweiterungen der Integralrechnung. Dann folgen Abschnitte über die Gammafunktion und die Einzigkeit der reellen Zahlen. In den Abschnitten zur Integralrechnung sind die allgemeinen Voraussetzungen und Bezeichnungen wie zu Beginn von Kapitel 11: Wir betrachten wieder Abbildungen F W M ! W von einer Teilmenge M - Rn in einen Banach-Raum W , dessen Norm i. Allg. mit k k bezeichnet sei. In Rn kann eine beliebige Norm zugrunde gelegt werden, wobei deren offene Bälle als Umgebungen verwendet werden. Gelegentlich ist es nützlich, zu speziellen Normen überzugehen, was dann an Ort und Stelle vereinbart wird. Die skalare Theorie ist als Spezialfall für W D R enthalten, und man könnte sich vorerst auf sie beschränken. Die allgemeine Zielmenge W macht aber die grundlegenden Dinge nicht schwieriger, sondern eher einfacher, da man von speziellen Eigenschaften von R (z.B. der Anordnung) unabhängig wird.
13.1
Lokale Integrierbarkeit und die Lp -Räume
Zunächst geht es um eine lokale Variante der Integrierbarkeit, in der jedoch schon wesentliche Eigenschaften der Integrierbarkeit enthalten sind. Tatsächlich besteht der Schritt von der lokalen Integrierbarkeit zur Integrierbarkeit lediglich darin, dass die zugehörige Normfunktion integrierbar ist; vgl. C(iv). Wird diese Zusatzbedingung analog auf die p-te Potenz der Normfunktion angewandt (p $ 1), so gelangt man zu den so genannten Lp -Räumen. Diese können mit einer neuen, aus dieser Potenzbildung entspringenden Norm versehen werden, die sie zu vollständigen seminormierten Vektorräumen macht. Die Lp -Räume spielen in der Analysis eine wichtige Rolle, insbesondere im Fall p D 2, wobei es sich dann sogar um Hilbert-Räume handeln wird. Anwendungen haben diese Räume z.B. in der Fourier-Theorie und bei partiellen Differentialgleichungen. A. Satz und Definition. Für eine Abbildung F W Rn ! W sind folgende Eigenschaften untereinander äquivalent: (i) Zu jedem Punkt a 2 Rn existiert eine Umgebung U von a, sodass F über den Abschluss U integrierbar ist. (ii) Zu jedem Punkt a 2 Rn existiert eine Umgebung V von a, über die F integrierbar ist.
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
315
(iii) F ist über jede kompakte Menge C ) Rn integrierbar. (iv) F ist über jeden abgeschlossenen Ball in Rn integrierbar. Ist einer dieser Punkte erfüllt, so heißt F lokal integrierbar oder kompakt integrierbar. Beweis. Es erfolgt ein Ringschluss, dessen Teile alle auf gewissen Aussagen von Kapitel 11 beruhen. Aus (i) folgt (ii): Zu a 2 Rn sei U gemäß (i) bestimmt und V ´ U gesetzt; V ist beschränkt und offen, also integrierbar (L[11.6]). Nach N(iii)[11.6] ist dann F über V integrierbar. Aus (ii) folgt (iii): Zu C existieren endlich S viele Umgebungen V Sj , über die F integrierbar ist und die C überdecken: C ) j Vj . Dann gilt C D j .C \ Vj /, und F ist wie eben über alle Durchschnitte C \ Vj integrierbar. Nach O[11.6] ist F über C integrierbar. Aus (iii) folgt (iv): Dies ist trivial in Ordnung, da jeder abgeschlossene Ball in Rn kompakt ist. Aus (iv) folgt (i): Auch dieser Schluss ist trivial gültig.
"
B. Beispiele. (i)
Die Funktion f W R ! R mit 1 für x ¤ 0; f .x/ ´ p jxj
f .0/ ´ 0
ist lokal integrierbar, aber nicht integrierbar. Das liegt letzten Endes daran, dass das uneigentliche Integral von f über Œ%1; 12 absolut existiert, nicht aber das über ganz R. – Im einzelnen: Zu a 2 R n f0g sei r 2 RC so bestimmt, dass 0 … Œa % r; a C r2. Dann ist f über das Intervall Œa%r; aCr2 integrierbar, da dieses kompakt und f darauf stetig ist (R[11.6]). Zu a D 0 sei r 2 RC beliebig. Dann existiert als uneigentliches Integral Z r Z r Z r Z 0 dx dx dx dx C D p p p D2 p %x x x jxj 0 0 &r &r Z r p p ˇˇr dx D 2 ' lim p D 2 ' lim 2 x ˇ D 4 r: " "#0 " "#0 x Wegen der absoluten Konvergenz (der Integrand ist stets $ 0) existiert dieses Integral auch im Lebesgue-Sinne (C[11.7]).
316
Kapitel 13
# Ergänzungen zur Analysis
Damit ist die lokale Integrierbarkeit von f klar. Wegen Z r dx D1 lim p r!1 &r jxj ist f jedoch nicht über R integrierbar. (ii)
Die Funktion f W R ! R mit f .x/ ´
1 für x ¤ 0; jxj
f .0/ ´ 0
ist nicht lokal integrierbar, da für r 2 RC das Integral Z r 1 &r jxj nicht existiert (weder uneigentlich noch als Lebesgue-Integral). (iii) Jede integrierbare Funktion F W Rn ! W ist auch lokal integrierbar. Dies ergibt sich z.B. aus Satz A(iii): Für kompaktes C ) Rn ist ja C integrierbar, also F über C integrierbar (L[11.6] und N(iii)[11.6]). Beispiel (i) zeigt, dass die Umkehrung nicht zutrifft. Die Integrierbarkeit verlangt also echt mehr als die lokale Integrierbarkeit. Wie viel mehr, wird sich im folgenden Satz herausstellen. (iv) Jede stetige Funktion f W Rn ! R ist lokal integrierbar, da sie laut R[11.6]) über jede kompakte Menge C ) Rn integrierbar ist. C. Definition und Satz. Es sei n n Lloc 1 .R ; W / die Menge der lokal integrierbaren Abbildungen F W R ! W ,
speziell im Falle W D R: n loc n Lloc 1 .R ; R/ µ L1 .R /:
Weiter sei nun der Einheitlichkeit halber statt Leb1 auch L1 geschrieben, also z.B. Leb1 .Rn ; W / µ L1 .Rn ; W /;
Leb1 .Rn / µ L1 .Rn /;
Dann gilt: (i)
n Lloc 1 .R ; W / ist ein reeller Vektorraum, und es gilt n loc n F 2 Lloc 1 .R ; W / H) kF k 2 L1 .R /:
etc.
317
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
(ii)
n L1 .Rn ; W / ist ein Untervektorraum von Lloc 1 .R ; W /.
(iii) Genau dann ist F W Rn ! W integrierbar, wenn F lokal integrierbar ist und es eine integrierbare Funktion g W Rn ! R gibt kF k 0 g. (iv)
Genau dann ist F W Rn ! W integrierbar, wenn F lokal integrierbar und kF k integrierbar ist.
Die Vektorraumoperationen sind argumentweise zu verstehen und Gleichheit von Abbildungen, wie immer in der Integrationstheorie, argumentweise fast überall. Analog bedeutet die Aussage kF k 0 g in (iii): kF .x/k 0 g.x/ fast überall in Rn . Es handelt sich hierbei (wie so oft in solchen Situationen) um eine Majorantenbedingung mit g als Majorante. Beweis von C. n n Zu (i): Sei ˛ 2 R, F; G 2 Lloc 1 .R ; W / sowie C kompakt in R . Mit F; G sind auch ˛F , F C G und kF k über C integrierbar (I[11.6]).
Zu (ii): Dies ist klar aus Beispiel B(iii). n Zu (iii), erste Richtung: Sei F 2 L1 .Rn ; W / vorausgesetzt. Dann ist F 2 Lloc 1 .R ; W / nach (ii) und die Majorantenbedingung ist mit g ´ kF k erfüllt (wegen I[11.4]). n n Zu (iii), zweite Richtung: Sei vorausgesetzt F 2 Lloc 1 .R ; W / und g 2 L1 .R / mit kF k 0 g. Um die Integrierbarkeit von F zu belegen, kann man den Ausschöpfungssatz J[11.6] heranziehen: Sei
Rn D
C1 ) C2 ) ' ' ' ;
[ k
Ck
eine Ausschöpfung von Rn mit Kompakta. Dann ist F über alle Ck integrierbar und Z Ck
Z kF k 0
Ck
Z g0
Rn
g;
also F 2 L1 .Rn ; W /. Zu (iv): Konsequenz aus (iii) und I[11.4].
"
Über die Komposition integrierbarer Abbildungen gibt es nur spärliche Aussagen. Generell brauchen solche Kompositionen nicht wieder integrierbar zu sein. Das folgende Lemma ist in dieser Hinsicht äußerst nützlich. Es bezieht sich auf den Fall, dass die Komposition reelle Werte hat, ist aber gleich auf den Fall mehrerer vektorieller Veränderlicher zugeschnitten.
318
Kapitel 13
# Ergänzungen zur Analysis
D. Lemma. Für Banach-Räume W1 ; : : : ; Wr , eine Abbildung ˆ W W1 ( ' ' ' ( Wr ! R und eine Menge M - Rn seien folgende Voraussetzungen erfüllt: (i)
ˆ ist stetig und ˆ.0; : : : ; 0/ D 0.
(ii)
Die Abbildungen F1 W M ! W1 , . . . , Fr W M ! Wr sind integrierbar.
(iii) Zur Abbildung ' W M ! R mit '.x/ ´ ˆ.F1 .x/; : : : ; Fr .x// existiert eine integrierbare Majorante, d.h. ein g 2 L1 .M / mit j'j 0 g. Dann ist ' 2 L1 .M /. Beweis. Zur Vereinfachung der Schreibweise sei r D 2 gewählt Bei beliebigem r 2 N geht es völlig analog. Außerdem kann o.B.d.A. M D Rn angenommen werden (sonst betrachte man die Nullfortsetzungen). Die gemäß (ii) gegebenen Abbildungen seien unter diesen Annahmen als F W Rn ! W und G W Rn ! Z bezeichnet. Wegen der Voraussetzung (ii) existieren für F , G approximierende Folgen .Fk / in K10 .Rn ; W / und .Gk / in K10 .Rn ; Z/. Es gilt dann lim Fk .x/ D F .x/;
k!1
lim Gk .x/ D G.x/;
k!1
f.ü. in Rn :
Da ˆ stetig ist, folgt daraus lim ˆ.Fk .x/; Gk .x// D ˆ.F .x/; G.x//
k!1
Sei
'k .x/ ´ ˆ.Fk .x/; Gk .x//;
f.ü. in Rn :
'.x/ ´ ˆ.F .x/; G.x//:
Die Funktionen 'k W Rn ! R liegen nun in K10 .Rn /. Ihre Stetigkeit ist klar aufgrund der Stetigkeit von ˆ und der Fk und Gk . Zum Träger von 'k überlegt man mittels (i) folgenden Schlüsse: 'k .x/ ¤ 0 H) Fk .x/ ¤ 0 oder Gk .x/ ¤ 0 H) x 2 Tr.Fk / [ Tr.gk /: Somit gilt
Tr.'k / D fx j 'k .x/ ¤ 0g - Tr.Fk / [ Tr.gk /:
Da die letztgenannte Menge kompakt ist, trifft dies auch für Tr.'k / zu. Die Folge der 'k besteht also aus integrierbaren Funktionen, die fast überall gegen ' konvergieren. Aufgrund der Schrankenbedingung in (iii), j'.x/j 0 g.x/ fast überall, folgt mittels I[11.5] die Integrierbarkeit von '. " E. Beispiele. (i) Sei r ´ 2, W1 ´ W2 ´ W und ˆ.w1 ; w2 / ´ kw1 k ' kw2 k. Dann ist in Lemma D die Eigenschaft (i) erfüllt. Somit gilt für M - Rn der Schluss: F; G 2 L1 .M; W /; kF k ' kGk 0 g 2 L1 .M / H) kF k ' kGk 2 L1 .M /:
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
319
(ii) Sei r ´ 1, W1 ´ R, M ´ A integrierbar. Dann gilt für f W A ! RC 0 und 0 < p < q der Schluss: f q 2 L1 .A/ H) f p 2 L1 .A/: Man wähle nämlich ˆ.t/ ´ jtjp=q . Dann ist in Lemma D die Eigenschaft (i) erfüllt, und es gilt '.x/ ´ ˆ.f .x/q / D f .x/p . Nun ist t p 0 max f1; t q g für t $ 0 (gemäß Fallunterscheidung t < 1 bzw. t $ 1), also f .x/p 0 max f1; f .x/q g µ g.x/: Da g über A integrierbar ist, folgt die Behauptung aus Lemma D. (iii) Ist F 2 L1 .M; W / und F beschränkt sowie p $ 1, so ist kF kp 2 L1 .M /. Man wähle nämlich in Lemma D: r ´ 1, W1 ´ W und ˆ.w/ ´ kwkp . Dann ist der dortige Punkt (i) erfüllt und '.x/ D kF .x/kp . Nach Voraussetzung existiert ein K 2 RC mit: kF .x/k 0 K für x 2 M . Dann gilt '.x/ D kF .x/kp D kF .x/kp&1 ' kF .x/k 0 K p&1 ' kF .x/k µ g.x/; wobei g 2 L1 .M /. Also ist ' 2 L1 .M /, d.h. kF kp 2 L1 .M /. F. Definition. Für jedes p $ 1 ist der Lp -Raum erklärt durch Lp .Rn ; W / ´ fF W Rn ! W j F lokal integrierbar und kF kp integrierbarg; und für jedes F aus diesem Raum ist die p-Norm definiert durch /Z 11=p p : kF k kF kp ´ Rn
Für W ´ R schreibt man Lp .Rn ; R/ µ Lp .Rn /: Es ist an dieser Stelle noch nicht klar, dass die Größe kF kp wirklich Normeigenschaften besitzt. Das wird gleich in Satz I mit herauskommen. G. Bemerkungen. (i)
Ist F 2 Lp .Rn ; W /, so ist kF k 2 Lp .Rn /. Dies ist klar aufgrund von C(i).
(ii) Für p D 1 herrscht Koinzidenz mit der Integrierbarkeit aufgrund von C(iv). Das Symbol L1 .Rn ; W / bzw. kF k1 ist also nicht doppelt belegt. Wie bei endlichen Summen spielt auch hier die Konjugiertheit zweier reeller Zahlen eine wichtige Rolle; vgl. F(iii)[8.6]: Zwei reelle Zahlen p > 1 und q > 1 sind konjugiert, wenn gilt: 1 1 C D 1: p q
320
Kapitel 13
# Ergänzungen zur Analysis
H. Lemma. Für a > 0, b > 0 und p > 1 gilt 3 a C b .p
(1)
2
0
ap C b p : 2
Ist außerdem q > 1 zu p konjugiert, so gilt a1=p ' b 1=q 0
(2)
b a C : p q
Beweis. (1) ergibt sich aus der Konvexität der Potenzfunktion t 7! t p auf RC . Die Ungleichung (2) war in (5)[8.6] aufgestellt worden. " I. Satz. Für konjugierte reelle Zahlen p > 1 und q > 1 gilt: (i)
Lp .Rn ; W / ist ein reeller Vektorraum.
(ii) Für F 2 Lp .Rn ; W / und G 2 Lq .Rn ; W / ist kF k ' kGk 2 L1 .Rn /, und es besteht die Hölder-Ungleichung Z Rn
kF k ' kGk 0 kF kp ' kGkq :
(iii) Die p-Norm ist eine Seminorm auf Lp .Rn ; W / mit der Eigenschaft (3)
kF kp D 0 () F .x/ D 0 f.ü. in Rn :
Insbesondere gilt für F; G 2 Lp .Rn ; W / die Dreiecksungleichung kF C Gkp 0 kF kp C kGkp ; die hier auch als Minkowski-Ungleichung bezeichnet wird. Für Summen anstelle von Integralen waren entsprechende Eigenschaften in F(iii)[8.6] und M(ii)[10.4] aufgestellt worden. Für p D 1 sind uns die Aussagen (i) und (iii) bereits bekannt (unabhängig von einem möglichen q). Für p D 1 und q D 1, die als Grenzfälle der Konjugiertheit angesehen werden können, gilt ebenfalls eine Art „Hölder-Ungleichung“; vgl. Satz W[13.3].
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
321
Beweis von I. Vorbemerkung: Zunächst ist klar, was bei Vielfachen passiert: Ist ˛ 2 R und F 2 Lp .Rn ; W /, so ist auch ˛F 2 Lp .Rn ; W / und k˛F kp D j˛j ' kF kp : Auch die Äquivalenz (3) ist unmittelbar klar aus der Definition von kF kp zusammen mit Q[11.4]. Zu (i): Es geht nur noch um die Summe von F; G 2 Lp .Rn ; W /: Jedenfalls ist F C G nach C(i) lokal integrierbar. Zu zeigen bleibt die Integrierbarkeit von kF C Gkp . Dazu wenden wir Lemma D an für r D 2 und ˆ W W ( W ! R mit ˆ.w1 ; w2 / ´ kw1 C w2 kp . Eine Majorante für ' ´ kF C Gkp ergibt sich aus der Ungleichung (1); danach gilt 3 .p 3 . kF .x/ C G.x/kp 0 kF .x/k C kG.x/k 0 2p&1 kF .x/kp C kG.x/kp µ g.x/: Die rechts stehende Funktion ist als integrierbare Majorante brauchbar. Somit ist kF C Gkp integrierbar. Zu (ii): Nach (3) können wir o.B.d.A. annehmen, dass kF kp > 0 und kGkp > 0, ja sogar kF kp D 1 und kGkp D 1 gilt, da beide Seiten der behaupteten Ungleichung beim Multiplizieren von F; G mit Faktoren ¤ 0 den gleichen positiven Faktor abspalten. Um die Integrierbarkeit von kF k ' kGk zu prüfen, wenden wir Lemma D an für r D 2 und ˆ.w1 ; w2 / ´ kw1 k ' kw2 k. Eine Majorante für ' ´ kF k ' kGk ergibt sich diesmal aus der Ungleichung (2). Wir setzen dort a ´ kF .x/kp , b ´ kG.x/kq und erhalten kG.x/kq kF .x/kp C µ g.x/: kF .x/k ' kG.x/k 0 p q Somit ist die rechte Seite eine integrierbare Majorante und also kF k'kGk integrierbar. Integration dieser Ungleichung liefert sofort Z 1 1 kF k ' kGk 0 C D 1: p q Rn Zu (iii): Es geht nur noch um die Dreiecksungleichung für F; G 2 Lp .Rn ; W /. Aufgrund der Vorbemerkung können wir hier o.B.d.A. kF C Gkp D 1 annehmen. Wir starten mit der Abschätzung (4)
kF C Gkp 0 kF k ' kF C Gkp&1 C kGk ' kF C Gkp&1 :
Dann ist kF C Gkp&1 2 Lq .Rn /. Denn kF C Gkp&1 ist nach Beispiel E(ii) über jedes Kompaktum C ) Rn integrierbar (da 0 < p % 1 < p), und ferner ist .kF C Gkp&1 /q D kF C Gkp integrierbar nach (i).
322
Kapitel 13
# Ergänzungen zur Analysis
Somit folgt aus (4) durch Integration mittels der Hölder-Ungleichung 1 0 kF kp C kGkp ; und das ist unter der gemachten Annahme nichts anderes als die Dreiecksungleichung. " Vollständigkeit der Lp -Räume Obwohl wir noch nicht wissen, dass der Raum Lp .Rn ; W / vollständig ist, lässt sich für ihn das Majorantenkriterium beweisen. Dieses wird dann den Schlüssel zur Vollständigkeit enthalten. (Der Weg ist also hier umgekehrt wie früher in L(ii)[10.4], wo aus der Vollständigkeit das Majorantenkriterium gefolgert wurde.) P n J. Lemma. Eine Reihe 1 kD1 Gk im Raum Lp .R ; W / ist sicher dann konvergent, wenn sie absolut konvergiert, d.h. wenn s´
X1 kD1
kGk kp < 1:
Beweis. Der Beweis läuft fast genauso wie im skalaren Fall bei Heuser[2003/2004], Teil 2, Hilfssatz 130.4. Neben den zwei genannten Reihen betrachten wir auch die Funktionenreihe X1 kGk k : kD1
Wir werden dass diese fast überall konvergiert. Daraus wird dann folgen, dass Psehen, 1 die Reihe kD1 Gk fast überall absolut gegen eine AbbildungPS W Rn ! W konvergiert. Dieses S wird dann zugleich der Grenzwert der Reihe 1 kD1 Gk im Lp -Sinne sein. Zur Durchführung dieses Plans seien zunächst folgende Teilsummen eingeführt: hk ´ kG1 k C ' ' ' C kGk k 2 Lp .Rn /;
Hk ´ G1 C ' ' ' C Gk 2 Lp .Rn ; W /:
Es gilt unter Verwendung der Minkowski-Ungleichung Z )p )p ( ( hpk D khk kp 0 kG1 kp C ' ' ' C kGk kp 0 s p : Rn
Da die Funktionen hpk bzgl. k monoton wachsen, ist der Satz von Beppo Levi D[11.5] auf sie anwendbar. Es gibt also eine Funktion u 2 Leb1 .Rn / mit der Konvergenz hpk ! u, und zwar sowohl im L1 -Sinne wie auch fast überall. Aus der letzten Formelzeile folgt Z Rn
u 0 sp :
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
323
Hieraus ergibt sich (5a)
hk %! u1=p µ v
f.ü., monoton wachsend bzgl. k:
Die so definierte Funktion v W Rn ! R liegt im Raum Lp .Rn /. Denn v ist nach Beispiel E(ii) über jedes Kompaktum C integrierbar, da 0 < 1=p < 1 und v p D u 2 L1 .Rn /. Wegen v p D u lässt sich auch die p-Norm von v abschätzen. So folgt: v 2 Lp .Rn /;
(5b)
kvkp 0 s:
P Nach (5a) ist die Reihe 1 kD1 Gk fast überall absolut konvergent mit Werten im Raum W , und da W vollständig ist, hat sie eine Grenzfunktion S, die fast überall in Rn definiert ist: X1 (6) Gk .x/ µ S.x/; kS.x/k 0 v.x/ f.ü. in Rn : kD1
Dies folgt aus dem Majorantenkriterium L[10.4]. Die fast überall punktweise konstruierte Abbildung S W Rn ! W erfüllt nun auch die Forderungen bzgl. der Lp -Konvergenz: S ist lokal integrierbar; denn auf jedem Kompaktum C ) Rn ist S Grenzwert der über C integrierbaren Abbildungen Hk jC , für die auf C gilt: kHk .x/k 0 hk .x/ 0 v.x/, sodass die majorisierte Konvergenz I[11.6] anwendbar ist. Aus der Schranke in (6) folgt kSkp 0 v p D u fast überall, somit kSkp 2 L1 .Rn /. Man setze nämlich in Lemma D r ´ 1, W1 ´ R, ˆ.t/ ´ t p . Also gilt S 2 Lp .Rn ; W /. Nach (6) findet fast überall die Konvergenz Hk .x/ % S.x/ ! 0 statt. Es verbleibt aber noch die Bestätigung, dass diese Konvergenz auch im Lp -Sinne erfolgt. Das gelingt nun wiederum mittels majorisierter Konvergenz: Es ist kHk % Skp 2 L1 .Rn / und fast überall kHk % Sk 0 kHk k C kSk 0 hk C kSk 0 2v, also kHk % Skp 0 2p v p D 2p u. Somit gilt Z Rn
also kHk % Skp ! 0 für k ! 1.
kHk % Skp ! 0;
"
K. Satz (von Riesz/Fischer). Der Raum Lp .Rn ; W /, versehen mit der p-Norm, ist vollständig, also ein Banach-Raum. Obwohl die p-Norm nur eine Halbnorm ist, verwendet man die Sprechweisen der normierten Vektorräume. Wie gesagt, es handelt sich um die gleiche Situation wie im Falle des Raums Leb1 .Rn ; W /: Man betrachtet also zwei Elemente des Raums Lp .Rn ; W / als gleich, wenn sie fast überall übereinstimmen.
324
Kapitel 13
# Ergänzungen zur Analysis
Beweis von K. Sei .Fk /k2N eine Cauchy-Folge in Lp .Rn ; W /. Wie beim Beweis von Lemma E[11.4] hilft eine Art „Verdichtung“ der Cauchy-Eigenschaft weiter. Es gibt nämlich eine Teilfolge, die nicht neu bezeichnet sei, sodass für alle k 2 N gilt: (7)
kFkC1 % Fk kp 0
1 : 2k
Nun betrachtet man die Reihe F1 C .F2 % F1 / C .F3 % F2 / C ' ' ' : Ihre k-te Teilsumme ist gerade Fk , also ihre Konvergenz äquivalent mit der der Folge .Fk /. Wegen (7) folgt aus Lemma J, dass die Folge .Fk / im Raum Lp .Rn ; W / konvergiert. Dasselbe gilt dann auch für die ursprüngliche Folge. Vgl. das Lemma G[2.6], das sich zwar auf skalare Folgen bezieht, aber völlig analog in einem normierten Vektorraum beweisbar ist. " Auch die Konsequenzen für punktweise und gleichmäßige Konvergenz, die in E[11.4] aus der Verdichtungsüberlegung gezogen wurden, bleiben hier bestehen: L. Satz. Konvergiert die Folge .Fk / im Raum Lp .Rn ; W / gegen ein Element F dieses Raums, so existiert eine Teilfolge, die fast überall punktweise gegen F konvergiert und die außerdem folgende Eigenschaft besitzt: Zu jedem " > 0 gibt es eine Menge Z 2 Rn mit: ,# .Z/ < "
und
Fk .x/ %! F .x/ gleichmäßig auf Rn n Z:
Beweis. Man braucht nur den früheren Beweis von Lemma E[11.4] ein wenig abzuändern. Dabei kann man o.B.d.A. F D 0 annehmen (ansonsten betrachte man die Folge der Differenzen Fk % F ). Nach Voraussetzung gilt also kFk kp ! 0. Übergang zu einer Teilfolge, die nicht neu bezeichnet sei, liefert die Bedingung kFk kp < Nun betrachtet man die Mengen + Yk ´ x 2 R n
1 4k=p
:
ˇ % ˇ ˇ kFk .x/kp > 1 : ˇ 2k
Mit der Tschebyscheff-Ungleichung D[11.4] ergibt sich: Z kFk .x/kp dx .kFk kp /p 1=4k 1 n ,# .Yk / 0 R D < D k: 1=2k 1=2k 1=2k 2
Abschnitt 13.1 Lokale Integrierbarkeit und die Lp -Räume
Für die Vereinigung hat man
325
Zk ´ Yk [ YkC1 [ ' ' '
1 1 1 C kC1 C ' ' ' D k&1 : k 2 2 2 Für x … Zk und ` $ k gilt nach Definition der Yk : kF` .x/kp 0 1=2` , also kF` .x/k 0 1=2`=p . Damit gilt ,# .Zk /
0, so gilt für jedes k < jjjF jjj1 : ˇ ,) (˚ ,# x 2 A ˇ kF .x/k $ k > 0: b) Ist M ´ jjjF jjj1 > 0, so gibt es zu jedem " > 0 eine Abbildung G * F , sodass mit ˇ (˚ ,) ı."/ ´ ,# x 2 A ˇ kG.x/k $ M % " > 0 für alle p $ 1 gilt / .M % "/
ı."/ ,.A/
11=p
/ 0
1 ,.A/
Z A
kGkp
11=p
0 M C ":
Das Integral rechts existiert nach Beispiel E(iii). c) Hieraus folgere man für das essentielle Supremum: jjjF jjj1 D lim kF kp : p!1
Lösungshinweis zu b): Tschebyscheff-Ungleichung für kGkp (Aufgabe 9[11.6]). 10. Man beweise den Satz von Shapiro[1973]: Erfüllt eine Funktion f W R ! R die Cauchysche Funktionalgleichung f .x C y/ D f .x/ C f .y/ und ist f lokal integrierbar, so ist f linear, d.h. von der Form f .x/ D c ' x mit festem c 2 R. Lösungshinweis: Man integriere die Funktionalgleichung bei festem x nach y und schließe daraus yf .x/ D xf .y/. Hinweis: Die Voraussetzung über die lokale Integrierbarkeit ist insbesondere erfüllt, wenn f stetig ist. Unter dieser stärkeren Voraussetzung kann die Behauptung viel elementarer bewiesen werden. Man tue dies! Vgl. auch die Methoden von Abschnitt 13.6 und dort insbesondere Aufgabe 4[13.6]. 11. Sei B W V ( W ! Z ein stetiges vektorielles Produkt zwischen Banach-Räumen V , W , Z wie in (4)[10.2]. Für Abbildungen F W Rn ! V und G W Rn ! W sei P W Rn ! Z definiert durch P .x/ ´ B.F .x/; G.x//, kurz: P ´ B.F; G/. Man beweise das folgende vektorielle Analogon zur Hölder-Ungleichung I(ii): Ist F 2 Lp .Rn ; V / und G 2 Lq .Rn ; W / mit konjugierten p; q 2 21; 1Œ, so ist kP k 2 L1 .Rn ; Z/ und Z kB.F; G/k1 D kB.F .x/; G.x//k dx 0 kBk ' kF kp ' kGkq : Rn
332
Kapitel 13
# Ergänzungen zur Analysis
(Die Normgröße kBk war in Aufgabe 12[10.1] eingeführt worden.) Lösungshinweis: Wende Lemma D für ˆ.v; w/ ´ kB.v; w/k an. Hinweis: Für p D 1 und q D 1 (Grenzfälle der Konjugiertheit) gilt für solche F und G ebenfalls eine Art „Hölder-Ungleichung“; vgl. Satz W[13.3]. 12. # Die Funktion f W Rn ! R sei lokal integrierbar und für jede Ausschöpfung von Rn mit kompakten Mengen [1 A W A1 - A2 - ' ' ' ; Rn D A `D1 ` existiere das uneigentliche Integral AZ Rn
f 2 R:
Man beweise, dass f integrierbar ist (sodass insbesondere alle dies uneigentlichen Integrale den gleichen Wert haben).
13.2 Messbare Mengen Dieser und der folgende Abschnitt sind unabhängig vom Abschnitt 13.1. Die Messbarkeit kann sowohl für Mengen wie auch für Abbildungen eingeführt werden. Sie ist eng verwandt mit der Integrierbarkeit und wird in vielen Darstellungen zusammen mit dieser entwickelt. Im vorliegenden Aufbau der Integralrechnung erweist sich die Messbarkeit als ein Folgebegriff der Integrierbarkeit, sodass man das Integral (und auch das Maß) allein auf die integrierbaren Funktionen gründen kann. Trotzdem ist es gut, nach erfolgtem Aufbau der Integralrechnung die Verbindung zur Messbarkeit herzustellen, einerseits um klassische Texte besser zu verstehen und andererseits die größere Flexibilität dieses Begriffs zu nutzen. Zu dieser Flexibilität gehört z.B. die Abgeschlossenheit des Systems der messbaren Mengen gegenüber abzählbaren Mengenoperationen und die Tatsache, dass die Messbarkeit gegenüber Diffeomorphismen invariant ist, was beides für die Integrierbarkeit nicht zutrifft. Als Erstes sei die Messbarkeit von Mengen auf verschiedene Weisen eingeführt. Diese sind alle nützlich und sinnvoll: A. Satz und Definition. Gegeben sei eine Menge C - Rn sowie eine Ausschöpfung [ A D Rn A1 - A2 - A3 - ' ' ' ; k k mit integrierbaren Mengen Ak . Dann sind äquivalent:
333
Abschnitt 13.2 Messbare Mengen
(i)
Für jeden Banach-Raum W und jede integrierbare Abbildung F W Rn ! W ist F über C integrierbar.
(ii)
Für jede integrierbare Funktion f W Rn ! R ist f über C integrierbar.
(iii) Für jede integrierbare Menge A ) Rn ist C \ A integrierbar. (iv)
Alle Durchschnitte C \ Ak sind integrierbar.
Ist eine dieser Eigenschaften erfüllt, so heißt C messbar. Beweis. Die folgenden Implikationen sind trivial: (i) H) (ii) H) (iii) H) (iv). Man braucht ja nur zu spezialisieren. Zur Implikation (iv) H) (i): Die Durchschnitte C \ Ak bilden eine Ausschöpfung von C . Die Abbildung F ist über alle C \ Ak integrierbar (N(iii)[11.6]) und Z Z kF k 0 kF k : C \Ak
Rn
Somit ist F über C integrierbar (Ausschöpfungssatz J[11.6]).
"
B. Beispiele. Jede integrierbare Menge in Rn ist messbar; vgl. A(iii) und C[11.6]. Alle offenen und alle abgeschlossenen Mengen in Rn sind messbar; vgl. L[11.6]. Speziell ist Rn messbar (aber nicht integrierbar!). C. Bemerkung. Diese Bemerkung ist nur für Leser gedacht, die Abschnitt 13.1 durchgearbeitet haben; sie wird im Folgenden nicht gebraucht: Wählt man in der Aussage A speziell eine Ausschöpfung von Rn durch Kompakta, so sieht man, dass C - Rn dann und nur dann messbar ist, wenn A \ C für jede kompakte Teilmenge A ) Rn integrierbar ist. Wegen -A\C D -A ' -C bedeutet dies. dass -C lokal integrierbar ist. Diese Eigenschaft wird sinnvollerweise die lokale Integrierbarkeit von C genannt. Eine Menge C - Rn ist also dann und nur dann messbar, wenn sie lokal integrierbar ist. D. Satz. Die Menge der messbaren Teilmengen von Rn enthält die leere Menge ¿ und den ganzen Raum Rn , und sie ist abgeschlossen gegenüber der Bildung der Differenz und abzählbarer Vereinigungen und Durchschnitte. Beweis. Zur Differenz und abzählbaren Vereinigung: Dies erkennt man mittels A(iii) aus C[11.6] und K[11.6]. Zum abzählbaren Durchschnitt: Dies ergibt sich aus dem Voranstehenden, indem man (S ) T die De Morgansche Regel beachtet: k Ck D Rn n .Rn n Ck / . " k Für das Integral kann man nun die Beziehung aus N(iii)[11.6] allgemeiner fassen:
334
Kapitel 13
# Ergänzungen zur Analysis
E . Satz. Ist die Abbildung F W A ! W (A - Rn ) integrierbar und die Menge C - Rn messbar, so ist F über A \ C integrierbar. Nach N(i)[11.6] ist dann F auch über A n C integrierbar und Z Z Z FC F D F: A\C
AnC
A
Beweis. Dies folgt aus der Gleichung .F jA \ C /b D ..F jA/bjC /b; die man wieder durch Fallunterscheidung bestätigt. Dann ergibt sich die Integrierbarkeit von F über A \ C aus der rechten Seite dieser Gleichung mit Hilfe der Charak" terisierung der Messbarkeit aus A(i). Genau wie bei O[11.6] ergibt sich hieraus durch vollständige Induktion: F. Folgerung. Gegeben seien endlich viele Teilmengen A1 ; : : : ; AN von Rn und eine Abbildung F W A1 [ ' ' ' [ AN ! W . Sind alle Mengen Aj messbar und alle Restriktionen F jAj integrierbar, so ist auch F integrierbar. " G. Satz (Diffeomorphie-Invarianz messbarer Mengen). Sei ' W U ! V ein C 1 -Diffeomorphismus zwischen offenen Mengen U; V - Rn und C eine messbare Teilmenge von U . Dann ist '.C / eine messbare Teilmenge von V . Beweis. Für eine Teilmenge B von V folgt zunächst aus dem Transformationssatz die Äquivalenz: ˇ ˇ (1) B - V integrierbar () ˇdet ' 0 ˇ integrierbar über ' &1 .B/: Dazu hat man lediglich den Satz S[11.9] auf den Fall W ´ R und F D -B zu spezialisieren. Zu zeigen ist hier: Ist B integrierbare Teilmenge von V , so auch B \ '.C /. Das folgt der Reihe nach mit den rechtsstehenden Begründungen: B integrierbar jdet ' 0 j integrierbar über ' &1 .B/ jdet ' 0 j integrierbar über C \ ' &1 .B/ '.C \ ' &1 .B// integrierbar Wegen '.C \ ' &1 .B// D '.C / \ B folgt die Behauptung.
(1) A.i i/ (1): "
335
Abschnitt 13.2 Messbare Mengen
H. Beispiel. Im Gegensatz hierzu ist die Integrierbarkeit von Mengen nicht diffeomorph-invariant: Man sieht dies bereits am einfachen Beispiel der Funktion f W 20; 1Œ ! 21; 1Œ mit f .x/ D 1=x. Diese ist ein C 1 -Diffeomorphismus, und 20; 1Œ ist integrierbar, nicht aber 21; 1Œ ! Die Messbarkeit ist eine allgemeinere Eigenschaft als die Integrierbarkeit. Jede integrierbare Menge ist auch messbar, aber nicht umgekehrt, wie wir am Beispiel von Rn selbst gesehen haben. Eine einfache Relation zwischen den beiden Mengensystemen ist die folgende: I. Lemma. Eine Teilmenge C von Rn ist dann und nur dann messbar, wenn sie als abzählbare Vereinigung von integrierbaren Teilmengen Ck von Rn dargestellt werden kann: [ (2) C D C ; alle Ck integrierbar: k k Beweis. Ist C so dargestellt, so sind alle Ck erst recht messbar, und die Messbarkeit von C folgt aus Satz D. Umgekehrt, ist C als messbare Menge gegeben, so sei eine Ausschöpfung von Rn mit integrierbaren Mengen Ak wie in A gewählt. Dann sind die Durchschnitte Ck ´ C \ Ak integrierbar, und C ist ihre Vereinigung. " Will man erreichen, dass in (2) die Ck zusätzlich paarweise disjunkt sind, so kann man die vor P[11.6] genannten Umwandlungen vornehmen. Die Mengenoperationen von Satz D kann man noch durch das kartesische Produkt ergänzen. J. Folgerung. Ist M eine messbare Teilmenge von Rp und N eine messbare Teilmenge von Rq , so ist M ( N eine messbare Teilmenge von Rp ( Rq . Beweis. Mittels Lemma I seien dargestellt [ M ; alle Mk integrierbar in Rp M D k k N D Dann gilt M (N D
[ `
3[
N` ;
alle N` integrierbar in Rq :
. 3[ . [ M N ( D .Mk ( N` /: k ` k ` k;`
Die rechtsstehende Vereinigung ist abzählbar und erstreckt sich nach O[11.8] über integrierbare Teilmengen von Rp ( Rq . Somit ist M ( N messbar. " Schließlich kann man genau sagen, was zur Messbarkeit hinzukommen muss, um Integrierbarkeit zu erhalten, nämlich eine Schrankenbedingung:
336
Kapitel 13
# Ergänzungen zur Analysis
K . Satz. Eine Teilmenge A - Rn ist dann und nur dann integrierbar, wenn sie messbar ist und ,# .A/ < 1 gilt. Beweis. Wir kennen schon aus den Beispielen B die eine Richtung: Ist A integrierbar, so ist A auch messbar, und nach K(iii)[11.6] gilt dann ,# .A/ D ,.A/ < 1. Sei umgekehrt A als messbar mit endlichem äußeren Maß ,# .A/ < 1 vorausgesetzt. Wir wählen eine Ausschöpfung C1 - C2 - ' ' ' von Rn (z.B. mit konzentrischen Bällen). Dann ist A \ C1 - A \ C2 - ' ' ' eine Ausschöpfung von A mit integrierbaren Mengen, also die konstante Funktion 1 über alle diese Durchschnitte integrierbar. Somit kann der Ausschöpfungssatz J[11.6] herangezogen werden. Die dortige Bedingung (i) ist erfüllt; denn es gilt ,.A \ Ck / D ,# .A \ Ck / 0 ,# .A/. Daher ist die 1 über A integrierbar. " Aufgaben und Anmerkungen 1. Ist die Menge der irrationalen Zahlen in R messbar? Ist sie integrierbar? 2. Ist folgende Aussage richtig: Eine Teilmenge A - Rn ist genau dann messbar, wenn für alle kompakten Quader Q ) Rn die Differenz A n Q messbar ist? 3. Ist folgende Aussage richtig: Eine Teilmenge A - Rn ist genau dann messbar, wenn für alle kompakten Quader Q ) Rn die Differenz Q n A messbar ist? 4. Man beweise die Existenz einer nicht messbaren Teilmenge von R, die a) beschränkt, b) unbeschränkt ist. Lösungshinweis: Aufgabe 11[11.9].
13.3
Messbare Abbildungen
Ein weiterer Begriff der klassischen Integrationstheorie ist die Messbarkeit von Funktionen. Bei der folgenden Begriffsbildung lassen wir gleich Abbildungen in einen Banach-Raum W zu. Allerdings sind manche Eigenschaften an den Zielraum R (oder einen endlich-dimensionalen Vektorraum) gebunden. Generell ist die Messbarkeit von Abbildungen eine gemeinsame Verallgemeinerung von Stetigkeit und Integrierbarkeit. A. Definition. Eine Abbildung F W Rn ! W heißt messbar, wenn für jede offene Menge % - W das Urbild F &1 .%/ messbar in Rn ist. Zwei Abbildungen F W Rn ! W und G W Rn ! W , die fast überall übereinstimmen, sind entweder beide messbar oder aber beide nicht messbar. Denn die Urbilder einer offenen Menge in W unter F und G unterscheiden sich höchstens um eine Nullmenge. Die Messbarkeit respektiert also die in der gesamten Integralrechnung herrschende Äquivalenzrelation der Gleichheit fast überall.
337
Abschnitt 13.3 Messbare Abbildungen
B. Beispiele. (i) Ist F W Rn ! W stetig, so ist F messbar. Denn für offenes % - W ist F &1 .%/ offen in Rn , also auch messbar (B[13.2]). (ii) Ist F W Rn ! W messbar und G W W ! Z (Z Banach-Raum) stetig, so ist auch G ı F messbar. Dies folgt direkt aus der Gleichung .G ı F /&1 .%/ D F &1 .G &1 .%//. C. Satz. Ist F W Rn ! W integrierbar, so ist F messbar. Beweis. Es ist zu zeigen: Ist % - W offen und A ) Rn integrierbar, so ist A\F &1 .%/ integrierbar in Rn . Ohne Einschränkung sei % ¤ ¿. Zunächst sei zusätzlich angenommen, dass 0 … %. 1) Sei ı W W ! R die innere Distanzfunktion der Menge W , d.h. ˇ , ˚ ı.w/ ´ inf kw % uk ˇ u 2 W n % :
Ω w
Klar ist ı.w/ > 0;
falls w 2 %
ı.w/ D 0;
falls w 2 W n %:
δ(w) W\Ω
Außerdem ist ı dehnungsbeschränkt mit Lipschitz-Konstante 1; vgl. K(i)[6.2]. Wir wollen zeigen: ı ı F 2 Leb1 .Rn /: Sei dazu .Fk / eine approximierende Folge für F im Sinne der Lebesgue-Theorie (A[11.4]). Dann gilt: & ı ı Fk ist stetig. & ı ı Fk hat kompakten Träger (also ı ı Fk 2 K10 .Rn /): Es gilt nämlich ı ı Fk .x/ ¤ 0 H) Fk .x/ ¤ 0. Somit ist Tr.ı ı Fk / - Tr.Fk /. & ı ı Fk .x/ ! ı ı F .x/ überall wo Fk .x/ ! F .x/, also fast überall. & jı ıF .x/j D jı ıF .x/%ı.0/j 0 kF .x/ % 0k D kF .x/k, und kF k ist integrierbar. Nach I[11.5] folgt hieraus ı ı F 2 Leb1 .Rn /. Beim zweiten und vierten Punkt geht die Voraussetzung 0 … % ein. 2) Wir müssen nun die charakteristische Funktion von A \ F &1 .%/ als integrierbar nachweisen. Dazu betrachten wir die folgenden Funktionen gk und behaupten: gk ´ min fk ' -A ' .ı ı F /; 1g 2 Leb1 .Rn /:
338
Kapitel 13
# Ergänzungen zur Analysis
Tatsächlich ist k ' -A ' .ı ı F / 2 Leb1 .Rn / nach dem Produktsatz L[11.5] und dann gk 2 Leb1 .Rn / nach M[11.5]. Für k ! 1 gilt gk .x/ %!
+
1 0
falls F .x/ 2 %; x 2 A sonst
% D -A\F #1 .2/ .x/:
ˇ ˇ Weiter ist ˇ-A\F #1 .2/ ˇ 0 -A , also -A\F #1 .2/ 2 Leb1 .Rn / nach I[11.5]. Das ist (unter der gemachten Zusatzvoraussetzung) die Behauptung. Für offenes % - W mit 0 2 % ist %nf0g ebenfalls offen in W , also A\F &1 .%nf0g/ integrierbar, also A \ F &1 .0/ D A n .A \ F &1 .W n f0g// integrierbar. Damit ist dann auch A \ F &1 .%/ D .A \ F &1 .% n f0g// [ .A \ F &1 .0// integrierbar nach C[11.6]. " D. Definition und Satz. Eine Abbildung F W A ! W (A - Rn ) wird messbar genannt, wenn eine der folgenden äquivalenten Bedingungen erfüllt ist: Für jede offene Menge % - W ist das Urbild F &1 .%/ messbar in Rn . (ii) A ist messbar und die Nullfortsetzung c F W Rn ! W ist messbar.
(i)
Beweis. Die Urbilder von F und c F lassen sich ineinander umrechnen: ( &1 &1 F &1 .%/; falls 0 … % c F &1 .%/ D c F .%/ \ A; F .%/ D &1 n F .%/ [ .R n A/; falls 0 2 %: Die Bedingung (i) impliziert, dass A messbar ist (setze % D W ). Hieraus folgt unmittelbar die Äquivalenz von (i) und (ii).
"
Eine messbare Abbildung F W A ! W hat also notwendig eine messbare Definitionsmenge A. E. Folgerung. (i)
Ist F W Rn ! W messbar und A - Rn messbar, so ist auch die Restriktion F jA messbar.
(ii) Ist F W A ! W integrierbar und A - Rn messbar, so ist F auch messbar. Beweis. Zu (i): Für offenes % - W bestätigt man leicht: .F jA/&1 .%/ D .F /&1 .%/ \ A, woraus die Behauptung folgt. Zu (ii): Ist F W A ! W integrierbar, so ist die Nullfortsetzung c F W Rn ! W c integrierbar, also nach Satz C messbar. Nach (i) ist dann F jA D F messbar. "
Abschnitt 13.3 Messbare Abbildungen
339
F. Bemerkungen. Diese Bemerkungen betreffen die Relation zwischen lokal integrierbaren und messbaren Abbildungen. Sie sind nur für Leser gedacht, die Abschnitt 13.1 durchgearbeitet haben, und werden im Folgenden nicht gebraucht. (i) Eine messbare Funktion braucht nicht lokal integrierbar zu sein. Dies sieht man z.B. an der Funktion f W R ! R mit f .x/ D 1=x für x ¤ 0 und f .0/ ´ 0. Diese ist messbar, aber nicht lokal integrierbar; z.B. ist f nicht über Œ0; 12 integrierbar. (ii) Dagegen gilt: Ist die Abbildung F W Rn ! W lokal integrierbar, so ist sie auch messbar. Sei nämlich C1 - C2 - C3 - ' ' ' eine Ausschöpfung von Rn durch Kompakta. Dann sind alle Restriktionen F jCk integrierbar, also nach E(ii) messbar. Nun gilt für offenes % - W [1 .F jCk /&1 .%/; F &1 .%/ D kD1 woraus man die Messbarkeit von F &1 .%/ abliest. G. Satz (Diffeomorphie-Invarianz messbarer Abbildungen). Sei ' W U ! V ein C 1 -Diffeomorphismus zwischen offenen Mengen U; V - Rn und F W B ! W (B V ) eine messbare Abbildung. Dann ist die Abbildung F ı 'j' &1 .B/ W ' &1 .B/ ! W messbar. Beweis. Dies beruht auf der Gleichung ( )&1 F ı 'j' &1 .B/ .%/ D ' &1 .F &1 .%//; die man leicht bestätigt. Zusammen mit Satz G[13.2] ergibt sich hieraus die Behauptung. " Auch bei Abbildungen ist die Messbarkeit allgemeiner als die Integrierbarkeit. Zwar ist jede integrierbare Abbildung auch eine messbare Abbildung, aber eben nicht umgekehrt. Wegen dieses Sachverhalts, den wir ja schon bei den Teilmengen von Rn angetroffen haben, ist das Wort „messbar“ eigentlich nicht angebracht. Es wird trotzdem in dem Sinne gebraucht, wie er hier definiert ist, weil eine Änderung der Terminologie nach so langer Einbürgerung nicht mehr praktikabel ist. Wir behandeln jetzt den skalarwertigen Fall weiter und werden bei ihm ebenfalls sehen, was zur Messbarkeit einer Funktion hinzukommen muss, damit sie integrierbar wird: Es ist wieder eine Schrankenbedingung. Messbare reelle Funktionen Wir betrachten hier Funktionen des Typs f W Rn ! R. Den Übergang zu Funktionen der Art f W A ! R mit A ) Rn erfolgt wie immer nach dem Prinzip der Nullfortsetzung. Die Messbarkeit solcher Funktionen kann auf verschiedene andere Weisen charakterisiert werden. Eine davon ist die folgende:
340
# Ergänzungen zur Analysis
Kapitel 13
H. Satz. Die Messbarkeit einer Funktion f W Rn ! R ist äquivalent zu jeder der folgenden Bedingungen: (i)
Für alle ˛ 2 R ist f &1 . 2˛; 1Œ / messbar.
(ii)
Für alle ˛ 2 R ist f &1 . Œ˛; 1Œ / messbar.
(iii) Für alle ˛ 2 R ist f &1 . 2%1; ˛Œ / messbar. (iv)
Für alle ˛ 2 R ist f &1 . 2%1; ˛2 / messbar.
Beweis. Zunächst sind die vier Bedingungen untereinander äquivalent: Das liegt daran, dass jede Halbgerade einer der vier Typen durch die Operationen „Differenz“, „abzählbare Vereinigung“, „abzählbarer Durchschnitt“ aus Halbgeraden einer der anderen Sorten aufgebaut werden kann. Z.B. gilt 01 ' 2 2! 1 2 [ \ 1 1 2˛; 1Œ D ˛ C ; 1 D R n 2%1; ˛2 D R n %1; ˛ C : k k kD1
kD1
Natürlich muss man auch einbringen, dass diese Operationen unter der Urbildkonstruktion invariant sind, und dass die Gesamtheit der messbaren Mengen gegenüber diesen Operationen abgeschlossen ist (D[13.2]). Weiter ist die Messbarkeit von f mit (i) äquivalent. Das liegt daran, dass jede offene Menge % - R als abzählbare Vereinigung von beschränkten offenen Intervallen darstellbar ist (z.B. derjenigen mit rationalem Mittelpunkt und rationaler Länge, die in ihr enthalten sind) und dass jedes solche Intervall durch die genannten Operationen aus Halbgeraden des Typs 2˛; 1Œ aufgebaut werden kann: 2˛; ˇŒ D 2˛; 1Œ \ 2%1; ˇŒ D 2˛; 1Œ \ .R n Œˇ; 1Œ / 0 01 ' 2!! \ 1 ˇ % ;1 D 2˛; 1Œ \ R n : k kD1
Die Bestätigung solcher Formeln ist dabei ganz elementar.
"
Aufgrund dieses Satzes reduziert sich der Nachweis der Messbarkeit in vielen Fällen auf die Diskussion von Ungleichungen. Wir werden dies sogleich anwenden. Die in Satz H auftretenden Mengen seien zweckmäßig so bezeichnet: M1 .f; ˛/ ´ f &1 . 2˛; 1Œ /
D fx 2 Rn j f .x/ > ˛g
M2 .f; ˛/ ´ f &1 . Œ˛; 1Œ /
D fx 2 Rn j f .x/ $ ˛g
M3 .f; ˛/ ´ f &1 . 2%1; ˛Œ / D fx 2 Rn j f .x/ < ˛g M4 .f; ˛/ ´ f &1 . 2%1; ˛2 / D fx 2 Rn j f .x/ 0 ˛g: Mengen der Gestalt M1 .f; ˛/, M2 .f; ˛/ werden generell als Superniveaumengen, solche der Gestalt M3 .f; ˛/, M4 .f; ˛/ als Subniveaumengen bezeichnet.
Abschnitt 13.3 Messbare Abbildungen
341
I. Beispiel. Eine Menge M - Rn ist dann und nur dann messbar, wenn ihre charakteristische Funktion -M messbar ist: Dies ergibt sich aus der Formel 8 ˆ für ˛ > 1 rg :
r2Q
Da Q abzählbar ist, folgt die Messbarkeit der linken Seite aus D[13.2]. Zu (iii): Dies folgt aus der Gleichung fx 2 Rn j f .x/ C g.x/ < ˛g D fx 2 Rn j f .x/ < ˛ % g.x/g mittels (i) und (ii). Zu (iv): Mit f ist auch f 2 messbar. Dies folgt wieder direkt mittels Umformung von Ungleichungen oder aus Beispiel B(ii), da die Quadratfunktion . 7! . 2 stetig ist. Die Messbarkeit von fg ergibt sich dann aus der Umformung 4fg D .f C g/2 % .f % g/2 :
342
Kapitel 13
# Ergänzungen zur Analysis
Zu (v): Wieder kann Beispiel B(ii) zum Zuge kommen, da jf j D zelfunktion stetig ist.
p
f 2 und die Wur"
Zahlreiche weitere messbare Funktionen können durch Kombination dieser Eigenschaften erzeugt werden. So sind mit f und g auch min ff; gg und max ff; gg messbar; vgl. (12)[1.3]. In (i) und (iii) ist enthalten, dass die Gesamtheit der messbaren Funktionen f W Rn ! R ein reeller Vektorraum ist. K. Bemerkung (zur Tschebyscheff-Ungleichung). Die Kennzeichnung der Messbarkeit durch Sub- bzw. Superniveaumengen (Satz H) zeigt, dass in den TschebyscheffUngleichungen von O[11.4] und P[11.4] statt des äußeren Maßes ,# ebensogut das Maß , geschrieben werden kann. Die Menge auf der linken Seite ist nämlich messbar und wegen der Endlichkeit ihres äußeren Maßes sogar integrierbar (K[13.2]). Bei der Anwendung auf Abbildungen F , die nur über eine Teilmenge A - Rn integrierbar sind, muss diese messbar sein, damit durch E(ii) auf die Messbarkeit von kF k geschlossen werden kann. Insgesamt schreibt sich also die Tschebyscheff-Ungleichung als ˇ (˚ ,) kF k1 ; , x 2 A ˇ kF .x/k $ c 0 c falls A - Rn messbar und F W A ! W integrierbar sowie c > 0 ist. Die folgende Bemerkung beschreibt eine Grundkonstruktion, die in verschiedenen Abwandlungen in der klassischen Lebesgue-Theorie immer wieder auftaucht und auf das Integral ein interessantes Licht wirft. L. Bemerkung (Approximation messbarer Funktionen). Sei f W Rn ! R messbar. Man zerlegt die Zielmenge in „kleine“ Teilintervalle und betrachtet die Funktion auf den Urbildern dieser Intervalle. Dadurch ist automatisch eine Approximation nahegelegt, nämlich durch eine Hilfsfunktion, die auf den Urbildern jeweils konstante Werte hat. Die Einteilung der Zielmenge R kann z.B. durch sukzessive Halbierung der ganzzahligen Intervalle erfolgen. Präzise läuft dies so: Für jedes k 2 N seien Mengen .Aik /i 2Z definiert durch /2 21 i i C1 &1 Aik ´ f ; 2k 2k sowie eine Funktion fk W Rn ! R durch (1)
fk jAik D
i 2k
8 i 2 Z:
Die Aik sind messbar und bilden bei festem k eine abzählbare Zerlegung von Rn . Die Funktion fk ist auf jedem Aik konstant (gleich dem dortigen kleinstmöglichen
343
Abschnitt 13.3 Messbare Abbildungen
Funktionswert von f ). Für x 2 Aik gilt i=2k 0 f .x/ < .i C 1/=2k , allerdings braucht i=2k nicht angenommen zu werden. Die Funktionenfolge .fk /k2N ist monoton wachsend (bzgl. k), und es gilt (2)
0 0 f .x/ % fk .x/ 0
1 2k
8 x 2 Rn ;
also (3)
lim fk .x/ D f .x/ gleichmäßig auf Rn :
k!1
Jede Funktion fk ist auf den abzählbar vielen Teilmengen : : : A&2;k ; A&1;k ; A0;k ; A1;k ; A2;k ; : : : konstant, also eine Art Treppenfunktion. Die „Konstanzmengen“ einer solchen Treppenfunktion sind aber i. Allg. keine Quader, sondern messbare Mengen, die von der gegebenen Funktion abhängen. Da es mannigfache Arten von Treppenfunktionen gibt (insbesondere solche mit endlich vielen Konstanzmengen) seien die jetzigen fk als Treppenfunktionen des Typs (1) bezeichnet. (Die weiteren Varianten spielen hier keine Rolle.) Jede messbare Funktion f W Rn ! R ist also darstellbar als „gleichmäßig-monotoner“ Limes von Treppenfunktionen der Art (1). Eine analoge Konstruktion hatten wir in R[11.6] bei der Behandlung stetiger Funktionen angewandt. Ist die Funktion f W Rn ! R nicht nur messbar, sondern auch integrierbar, so liefert dieses Vorgehen eine Approximation des Integrals über jede integrierbare Menge: M . Satz. Die Funktion f W Rn ! R sei messbar und besitze eine integrierbare Majorante g, d.h. es gilt g 2 Leb1 .Rn / und jf .x/j 0 g.x/ für alle x 2 Rn . Dann folgt f 2 Leb1 .Rn /. Ist .fk / die Folge der Treppenfunktionen der Art (1) und B ) Rn integrierbar, so sind f und alle fk über B integrierbar, und es gilt neben der gleichmäßigen Konvergenz (3): Z Z X i f D lim fk D lim ,.B \ Aik /: k!1 B k!1 2k B i 2Z Beweis. Zunächst sei die zweite Behauptung bewiesen. Jede Restriktion fk jB ist integrierbar: Die Durchschnitte B \ Aik sind integrierbar und bilden eine disjunkte Zerlegung von B. Weiter sind die Restriktionen fk j.B\Aik / konstant, also integrierbar. Auf diese Zerlegung von B kann nun der Zerlegungssatz P[11.6] angewandt werden. Es gilt nämlich wegen der Ungleichungen 2jikj 0 jf .x/j C 1 0 g.x/ C 21k , die für x 2 Aik bestehen: 2k Z XZ XZ 1 X 1 gC k g C k ,.B/: jfk j 0 ,.B \ Aik / D 2 i 2Z 2 B i 2Z B\Aik i 2Z B\Ai k
344
Kapitel 13
Somit ist fk jB integrierbar und Z XZ fk D B
i 2Z
B\Aik
fk D
# Ergänzungen zur Analysis
X i ,.B \ Aik /: 2k i2Z
Nun ist auch die Restriktion f jB integrierbar: Sie ist nämlich punktweiser (sogar gleichmäßiger) Grenzwert der Restriktionen fk jB, und es gilt jf j 0 g mit integrierbarem g (I[11.5]). Aus (2) folgt dann durch Integration über B die Integralabschätzung Z Z 1 00 f % fk 0 k ,.B/; 2 B B insbesondere die Konvergenz der Integrale, wie behauptet. Lässt man schließlich B eine Ausschöpfung von Rn mit integrierbaren Mengen durchlaufen, so kann man den Ausschöpfungssatz J[11.6] anwenden, um die Integrierbarkeit von f zu sichern, da die Integrale von jf j über jedes B durch das Integral von g über Rn beschränkt sind. " Diese Konstruktion ist ein Gegenstück zur Darstellung des elementaren Integrals mittels Riemann-Summen (P[5.1]). Während dort die Definitionsmenge in „kleine“ Intervalle eingeteilt wurde, macht man hier das Gleiche mit der Zielmenge! Das war übrigens der ursprüngliche Ansatz für das Lebesgue-Integral. Der Gegensatz zwischen diesen Integralbegriffen lässt sich gut an den beiden Grenzwertdarstellungen festmachen, wenn der Einfachheit halber die Dimension n D 1 und die Integrationsmenge als Intervall B D Œa; b2 gewählt wird: / 1 Z X 1 i ' (elementares Integral) f D lim f k k!1 2 2k B k i=2 2B Z X i ' ,.B \ Aik / (Lebesgue-Integral): f D lim k!1 2k B i 2Z In diesen Formeln entsprechen sich übereinanderstehende Objekte. Beim elementaren Integral werden Rechtecksummen gebildet, bezogen auf feste Basislängen 1=2k und variable Höhen f .i=2k /. Dabei sei f als stetig angenommen (und die angeschriebene Summe unterscheidet sich von einer Riemann-Summe höchstens um Beiträge der Größe 2 ' .1=2k / ' max jf j, da a und b evtl. nicht von der Form i=2k sind). Beim Lebesgue-Integral werden „Zylindersummen“ gebildet, bezogen auf variable Basismengen B \ Aik und variable Höhen i=2k . (Dabei ist der „Generationsindex“ k bei der Bildung der Summen festgehalten.) N. Folgerung (Integrabilitätskriterium). Eine Funktion f W Rn ! R ist dann und nur dann integrierbar, wenn sie messbar ist und eine integrierbare Funktion g W Rn ! R existiert mit jf j 0 g.
345
Abschnitt 13.3 Messbare Abbildungen
Beweis. Die eine Richtung ist in Satz M ausgesprochen. Wird umgekehrt vorausgesetzt, dass f integrierbar ist, so ist f nach Satz C auch messbar, und jf j ist eine integrierbare Majorante von f . " Speziell für g ´ jf j ergibt sich hieraus: O. Folgerung. Ist f W Rn ! R messbar und jf j integrierbar, so ist f selbst integrierbar. " P. Bemerkung. Ist A - Rn integrierbar und f W A ! R beschränkt, so besteht die Äquivalenz: f integrierbar () f messbar: Die Richtung von links nach rechts ergibt sich aus Satz C zusammen mit D. Die Richtung von rechts nach links ist eine Konsequenz von Satz M zusammen mit D. Ist nämlich c eine Schranke für jf j, so ist c ' -A eine integrierbare Schranke für c f . Für beschränkte Funktionen auf integrierbaren Teilmengen des Rn sind also die Begriffe „integrierbar“ und „messbar“ vollständig äquivalent. Das ist der tiefere Grund, warum in der klassischen Lebesgue-Theorie das Maß von Teilmengen des Rn und die Messbarkeit von Funktionen als Ausgangspunkte fungieren. Bei dem hier eingeschlagenen Weg zum Lebesgue-Integral kommt man ohne diese Einschränkungen aus, und man braucht auch nur einen Grundbegriff, nämlich den der Integrierbarkeit von Funktionen. Das Maß erweist sich dann als ein Spezialfall des Integrals, wie in Abschnitt 11.6 dargelegt.
Umkehrung des Satzes von Fubini Der Satz von Fubini bezieht sich auf eine Abbildung, die auf einem kartesischen Produkt Rp ( Rq definiert ist. Er setzt voraus, dass diese Abbildung integrierbar ist und folgert daraus die Übereinstimmung mit dem iterierten Integral über die kartesischen Faktoren. Vgl. Satz D[11.9]. Aber manchmal weiß man nur etwas über die Einzelintegrale der Iteration und möchte daraus umgekehrt die Existenz des Gesamtintegrals erschließen. Eine hinreichenden Bedingung in dieser Richtung liefert der Satz von Tonelli, der hier für den skalaren Fall bewiesen wird. Die Grundsituation ist die gleiche wie zu Beginn von Abschnitt 11.8: Es wird Rn mit Rp ( Rq identifiziert, wobei p; q feste natürliche Zahlen mit p C q D n sind, und es wird eine Funktion f W Rn D R p ( R q ;
.x; y/ 7! f .x; y/; x 2 Rp ; y 2 Rq
betrachtet. Bei Bedarf sei z D .x; y/ geschrieben.
346
Kapitel 13
# Ergänzungen zur Analysis
Q. Satz (von Tonelli). Die messbare Funktion f W Rp ( Rq ! R erfülle folgende Voraussetzungen: Für fast alle y 2 Rq ist die partielle Abbildung x 7! jf .x; y/j integrierbar über Rp . R (ii) Die Abbildung y 7! Rp jf .x; y/j dx ist integrierbar über Rq ( 0, wo nicht definiert). (i)
Dann ist f W Rp ( Rq ! R integrierbar, und es gelten für f die Eigenschaften des Satzes von Fubini D[11.9], insbesondere 1 1 Z /Z Z Z /Z f .x; y/ dx dy D f .z/ dz D f .x; y/ dy dx: Rn
Rq
Rp
Rp
Rq
Beweis. Es reicht, die Integrierbarkeit der Betragsfunktion jf j über Rn nachzuweisen. Dann ist f nach Folgerung O integrierbar, und es greift für f der Satz von Fubini. Wäre die Funktion jf j auf einer integrierbaren Menge beschränkt, so wäre sie dort nach Bemerkung P integrierbar. Diese Situation kann man wie bei früheren Gelegenheiten durch „Abschneiden“ erzwingen und dann einen Grenzübergang anschließen. Das geht folgendermaßen: Sei A1 - A2 - A3 - ' ' ' eine Ausschöpfung von Rn durch integrierbare Mengen. Für jedes k 2 N definiere man die Funktion gk ´ min fjf j ; k-Ak g: Diese ist außerhalb Ak gleich null und in Ak durch die Konstante k nach oben beschränkt. Sie entsteht aus jf j gewissermaßen durch „doppeltes Abschneiden“, nämlich im Argument- und im Zielbereich, wobei aber mit wachsendem k immer mehr von jf j erfasst wird. Man sieht mühelos, dass die Folge der nichtnegativen Funktionen gk punktweise monoton wachsend gegen jf j konvergiert: (4)
lim gk .x; y/ D jf .x; y/j ;
monoton wachsend bzgl. k:
k!1
Um die Integrierbarkeit von jf j zu sichern, genügt es nach Beppo Levi D[11.5], die Beschränktheit der Integrale Z gk (5) Rn
nachzuweisen. Das gelingt so:
347
Abschnitt 13.3 Messbare Abbildungen
Da jedes gk nach J messbar ist und außerhalb Ak verschwindet, ist gk integrierbar, zunächst über Ak und dann auch über Rn ; vgl. Bemerkung P. Nach dem Satz von Fubini, angewandt auf gk , gilt also 1 Z Z /Z (6) gk .z/ dz D gk .x; y/ dx dy: Rn
Rq
Rp
(4) gilt speziell für jedes feste y, und somit hat man für die inneren Integrale in (6) die Konvergenz Z Z gk .x; y/ dx D (7) lim jf .x; y/j dx für fast alle y 2 Rq ; k!1 Rp
Rp
wie sich erneut aus dem Satz von Beppo Levi D[11.5] ergibt. Auch diese Konvergenz erfolgt monoton wachsend bzgl. k. Aus (6) und (7) folgt 1 1 Z Z /Z Z /Z gk .z/ dz D gk .x; y/ dx dy 0 jf .x; y/j dx dy: Rn
Rq
Rp
Rq
Rp
Dies zeigt die Beschränktheit der Integrale (5).
"
Für Integrale über Teilmengen existiert die folgende anwendungsorientierte Variante: R. Satz (von Tonelli für Teilmengen). Die messbare Funktion f W M ! R (M - Rp ( Rq ) erfülle folgende Voraussetzungen: Für fast alle y 2 M 00 ist die partielle Abbildung x 7! jf .x; y/j integrierbar über My0 . R (ii) Die Abbildung y 7! My0 jf .x; y/j dx ist integrierbar über M 00 ( 0, wo nicht definiert). (i)
Dann ist f W M ! R integrierbar, und es gelten für f die Eigenschaften des Satzes von Fubini D[11.8], insbesondere 1 1 Z /Z Z /Z Z f .z/ dz D f .x; y/ dx dy D f .x; y/ dy dx: M
M 00
My0
M0
Mx00
Beweis. Wie beim Satz von Fubini (D[11.8]) erhält man diese Fassung einfach, indem man Satz Q auf die Nullfortsetzung c f anwendet. " Es sei daran erinnert, dass die vier auftretenden Projektionen folgende Bedeutung haben: M 0 ´ fx 2 Rp j 9 y 2 Rq W .x; y/ 2 M g;
My0 ´ fx 2 Rp j .x; y/ 2 M g;
M 00 ´ fy 2 Rq j 9 x 2 Rp W .x; y/ 2 M g;
Mx00 ´ fy 2 Rq j .x; y/ 2 M g:
348
Kapitel 13
# Ergänzungen zur Analysis
Im Allgemeinen hängt My0 - Rp von y und Mx00 - Rq von x ab, und es ist My0 D ¿ für y … M 00 sowie Mx00 D ¿ für x … M 0 . Natürlich können in den Sätzen Q und R die Rollen von x und y auch vertauscht werden. Speziell für den Integranden 1 auf M ergibt sich hieraus für die Volumberechnung messbarer Mengen die folgende Variante des Prinzips von Cavalieri (E[11.8]): S. Folgerung. Die messbare Menge M - Rp ( Rq erfülle folgende Voraussetzungen: (i)
Für fast alle y 2 M 00 ist die Menge My0 integrierbar in Rp .
(ii) Die Funktion y 7! ,p .My0 / ist integrierbar über die Menge M 00 - Rq ( 0, wo nicht definiert). Dann ist M integrierbar und Z ,.M / D
M 00
,p .My0 / dy:
Beweis. Wie gesagt, man hat Satz R lediglich auf den Spezialfall der konstanten Funktion 1 auf M anzuwenden. " Ordinatenmengen Wir hatten früher schon gesehen, dass das Integral als Maß der Ordinatenmenge aufgefasst werden kann, wenn die Ordinatenmenge integrierbar ist; vgl. F[11.8]. Dies bleibt nun auch richtig, wenn umgekehrt die Integrierbarkeit der Funktion vorausgesetzt wird. n Ist f W A ! RC 0 (A - R ) eine nichtnegative Funktion, so war die Ordinatenmenge von f
(8)
Of ´ f.x; y/ 2 Rn ( R j x 2 A; 0 0 y 0 f .x/g:
Dabei wird wieder RnC1 mit Rn ( R identifiziert. – Zunächst sei A D Rn : T. Satz. Ist die Funktion f W Rn ! RC 0 integrierbar, so ist ihre Ordinatenmenge Of eine integrierbare Teilmenge von RnC1 und Z f .x/ dx: (9) ,nC1 .Of / D Rn
349
Abschnitt 13.3 Messbare Abbildungen
Beweis. Es genügt, die Messbarkeit von Of nachzuweisen. Dann kann nämlich die Folgerung S auf M ´ Of angewendet werden (mit vertauschten Rollen von x; y). Ihre Voraussetzungen sind erfüllt: M 0 D Rn ;
Mx00 D Œ0; f .x/2 integrierbar in R;
,1 .Mx00 / D f .x/:
Somit ist M integrierbar, und es gilt die Gleichung (9) nach F[11.8]. Die Ordinatenmenge wird durch die beiden Ungleichungen f .x/ % y $ 0 und y $ 0 beschrieben. Wir betrachten daher die zwei Funktionen f1 ; f2 W RnC1 ! R mit f1 .x; y/ ´ f .x/ % y und f2 .x; y/ ´ y. Es gilt Of D M2 .f1 ; 0/ \ M2 .f2 ; 0/, sodass es reicht, die Messbarkeit von f1 ; f2 zu zeigen. Wegen der Stetigkeit von f2 und wegen Satz J genügt sogar die Messbarkeit von e W RnC1 ! R; f
e.x; y/ ´ f .x/: f
Nun ist e.x; y/ $ ˛ () f .x/ $ ˛ und y 2 R () .x; y/ 2 M2 .f; ˛/ ( R: f e; ˛/. Damit Nach J[13.2] ist das letzte kartesische Produkt messbar, also auch M2 . f e ist die Messbarkeit von f ; f1 ; f2 klar und ebenso die von Of . " n Für eine Funktion f W A ! RC 0 , die nur auf einer Teilmenge A ) R definiert ist, n kann dieser Satz, wie immer, auf die Nullfortsetzung c f W R ! RC 0 angewandt werden. Die Ordinatenmengen stehen dann in der Beziehung
n ..Rn n A/ ( f0g/: Of D O b f Da das letzte kartesische Produkt eine Nullmenge von RnC1 ist, folgt aus der Messbardie von Of . So überträgt sich der obige Satz entsprechend: keit von O b f n U. Folgerung. Eine Funktion f W A ! RC 0 (A - R ) ist dann und nur dann integrierbar, wenn ihre Ordinatenmenge
Of ´ f.x; y/ 2 Rn ( R j x 2 A; 0 0 y 0 f .x/g integrierbar ist. Ist eine der Bedingungen erfüllt, so gilt Z ,nC1 .Of / D
A
f .x/ dx:
350
Kapitel 13
# Ergänzungen zur Analysis
Beweis. Die eine Richtung der Äquivalenz wurde schon vorab begründet. Die andere " folgt aus Satz F[11.8]. Allgemeiner Produktsatz Zur Vorbereitung dient ein Hilfssatz, mit dem man Ungleichungen für eine Grenzfunktion auf die Folgenglieder übertragen kann: V. Lemma. Für eine Abbildung F W Rn ! W und eine messbare Funktion f W Rn ! R gelte: kF k 0 f
und
kF .x/k D f .x/ H) F .x/ D 0:
Weiter sei .Fk / eine Folge in Leb1 .Rn ; W /, die fast überall gegen F konvergiert. Dann existieren messbare Mengen Mk - Rn derart, dass die nach A[13.2] integrierbaren Abschneidungen ˆk von Fk bzgl. Mk ebenfalls fast überall gegen F konvergieren und außerdem erfüllen: kˆk k 0 f
für alle k:
Ist f integrierbar, so auch F , und es gilt lim kˆk % F k1 D 0, insbesondere Z lim
k!1 Rn
Beweis. Wir definieren ˆk .x/ ´
(
k!1
ˆk D
Z Rn
F:
Fk .x/;
falls kFk .x/k < f .x/
0;
falls kFk .x/k $ f .x/:
Dann ist jedenfalls kˆk .x/k 0 f .x/ für alle k und alle x 2 Rn . Weiter ist die Menge ˇ ˚ , Mk ´ x 2 Rn ˇ kFk .x/k < f .x/ nach den Sätzen C, H und J messbar, also ˆk integrierbar. Zum Nachweis der Konvergenz treffen wir für die x mit Konvergenz Fk .x/ ! F .x/ folgende Fallunterscheidung: (˛) kF .x/k < f .x/ bzw. (ˇ) kF .x/k $ f .x/. Im Fall (˛) gilt kFk .x/k ! kF .x/k < f .x/. Nach dem Meidungsprinzip existiert ein Index N mit kFk .x/k < f .x/ für k > N . Für diese k ist ˆk .x/ D Fk .x/, also limk!1 ˆk .x/ D F .x/. Im Fall (ˇ) gilt kF .x/k D f .x/, also nach Voraussetzung F .x/ D 0 und damit auch f .x/ D 0, also: x … Mk für alle k. Hiernach ist stets ˆk .x/ D 0, also limk!1 ˆk .x/ D F .x/.
351
Abschnitt 13.3 Messbare Abbildungen
Ist f nicht nur messbar, sondern sogar integrierbar, so folgt der Rest der Behauptung " aus dem Satz H[11.5] über die majorisierten Konvergenz. Jetzt betrachten wir ein stetiges vektorielles Produkt B W V (W ! Z wie in (4)[10.2], wobei V , W , Z normierte Vektorräume sind. B ist also eine stetige bilineare Abbildung. Wie im stetigen linearen Fall (H[10.1]) ist B eine Norm kBk 2 RC 0 zugeordnet vermöge ˇ , ˚ (10) kBk ´ sup kB.v; w/k ˇ kvk 0 1; kwk 0 1 : Es gilt dann für alle v 2 V und w 2 W : kB.v; w/k 0 kBk ' kvk ' kwk ; und kBk ist der kleinste Koeffizient auf der rechten Seite, für den eine solche Abschätzung für alle v 2 V und w 2 W möglich ist. Sind zwei Abbildungen F W Rn ! V und G W Rn ! W gegeben, so kann man ihr Produkt H W Rn ! Z bilden, definiert durch H.x/ ´ B.F .x/; G.x//. Wir schreiben kurz H µ B.F; G/. W. Satz (allgemeiner Produktsatz). Sei B W V ( W ! Z ein stetiges vektorielles Produkt zwischen Banach-Räumen V , W , Z. Ist F 2 Leb1 .Rn ; V / mit kF k1 < 1 und G 2 Leb1 .Rn ; W /, so ist B.F; G/ 2 Leb1 .Rn ; Z/ und Z (11) kB.F; G/k 0 kBk ' kF k1 ' kGk1 : kB.F; G/k1 D Rn
Beweis. Sei " > 0 gegeben und c ´ kF k1 2 RC 0. Gestartet werde mit einer approximierenden Folge .Fk / für F und einer approximierenden Folge .Gk / für G. Dann ist B.Fk ; Gk / jeweils stetig mit kompaktem Träger, also integrierbar und B.Fk .x/; Gk .x// ! B.F .x/; G.x//
f.ü.
aufgrund der Stetigkeit von B. Zu F , f ´ c C " und .Fk / werde nach Lemma V eine Folge von Mengen Mk - Rn und zugehörige Abschneidungen ˆk gewählt. Die dortigen Voraussetzung bzgl. F und f sind erfüllt, da es gar kein x 2 Rn mit kF .x/k D f .x/ gibt. Ebenso werde zu G, g ´ .1 C "/ kGk und .Gk / eine Folge von Mengen Nk - Rn und zugehörige Abschneidungen ‰k gewählt. Die Voraussetzungen von Lemma V sind wiederum erfüllt.
352
Kapitel 13
# Ergänzungen zur Analysis
Dann ist B.ˆk ; ‰k / die Abschneidung von B.Fk ; Gk / bzgl. Mk \ Nk , also integrierbar. Außerdem gilt für die x mit ˆk .x/ ! F .x/ und ‰k .x/ ! G.x/, also fast überall B.ˆk .x/; ‰k .x// ! B.F .x/; G.x//: Schließlich besteht für alle k und x die Abschätzung kB.ˆk .x/; ‰k .x//k 0 kBk ' kˆk .x/k ' k‰k .x/k 0 kBk ' .c C "/ ' .1 C "/ kG.x/k : Somit ist B.F; G/ nach dem Satz zur majorisierten Konvergenz integrierbar, und es folgt durch Integration Z Z kB.ˆk ; ‰k /k 0 kBk ' .c C "/ ' .1 C "/ kGk ; Rn
Rn
also durch Grenzübergang k ! 1, da erneut die majorisierte Konvergenz anwendbar ist: Z Z kB.F; G/k 0 kBk ' .c C "/ ' .1 C "/ kGk : Rn
Rn
Indem man jetzt noch " gegen 0 laufen lässt, ergibt sich die Behauptung (11).
"
Aufgaben und Anmerkungen 1. Für eine Konstante c > 0 betrachte man die Funktion fc W Rn n f0g ! R;
fc .x/ ´
1 ; kxkc
wobei k k eine fest gewählte Norm auf Rn ist. ˇ , ˚ a) Für welche c ist fc über x 2 Rn ˇ 0 < kxk 0 1 integrierbar? ˇ , ˚ b) Für welche c ist fc über x 2 Rn ˇ kxk $ 1 integrierbar? Lösungshinweis: Bzgl. der Euklidischen Norm vgl. Aufgabe 4 b)[11.9]. 2. Für eine Funktion f W Rn ! R und festes i 2 f1; 2; 3; 4g zeige man: Ist Mi .f; ˛/ messbar für fast alle ˛ 2 R, so ist f messbar. 3. Zeige in Verallgemeinerung von Aufgabe 3[11.3]: Ist M - Rn und f W M ! R messbar, so ist der Graph von f eine Nullmenge in RnC1 . 4. Die Abbildung F W Rn ! W sei integrierbar, dim W < 1, und die Menge C - W sei abgeschlossen. Man beweise: Gilt für alle integrierbaren Mengen A ) Rn mit ,.A/ > 0 Z 1 F 2 C; ,.A/ A
353
Abschnitt 13.3 Messbare Abbildungen
so folgt F .x/ 2 C für fast alle x 2 Rn . Lösungshinweis: Ohne Einschränkung sei C ¤ Rn . Da W n C als Vereinigung abzählbar vieler offener Bälle dargestellt werden kann, reicht es zu zeigen: Ist ein Ball B.r; z/ in W n C enthalten, so ist A ´ F &1 .B.r; z// eine Nullmenge. Angenommen, S A ist nicht Nullmenge. Da A messbar ist, kann A als abzählbare Vereinigung A D Ak von integrierbaren Mengen dargestellt werden (Lemma I[13.2]). Mindestens ein Ak ist dann nicht Nullmenge, und es besteht die Abschätzung - Z Z Z - - 1 - 1 1 F .x/ dx % z - D F .x/ dx % z dx - ,.A / ,.Ak / Ak ,.Ak / Ak k Ak Z 1 0 kF .x/ % zk dx < r: ,.Ak / Ak Hierin ist ein Widerspruch enthalten, da liegt.
R
1 ).Ak / Ak
F .x/ dx nach Voraussetzung in C
5. Aus Aufgabe 4 folgere man (im Spezialfall C D f0g): Ist F W Rn ! W integrierbar, dim W < 1, und gilt für jeden (achsenparallelen) kompakten Quader Q Z Q
F D 0;
so ist fast überall F .x/ D 0. R Lösungshinweis: Zu zeigen ist A F D 0 für alle integrierbaren Mengen A ) Rn . Aus Rder Voraussetzung folgt zunächst, dass für jede Treppenfunktion g W Rn ! R gilt: Rn gF D 0. Nun konstruiere man zur charakteristischen Funktion -A eine Folge .gk / von Treppenfunktionen mit jgk j 0 2, die fast überall gegen -A konvergiert. Dann konvergiert die Folge der integrierbaren Abbildungen gk F fast überall gegen -A F , und es gilt kgk F k 0 2 kF k. Mittels majorisierter Konvergenz folgt Z
Z A
F D
Z Rn
-A F D lim
k!1 Rn
gk F D 0:
6. Aus Aufgabe 5 folgere man (im Spezialfall n D 1): Ist F W Œa; b2 ! W integrierbar und dim W < 1, so gilt der Schluss: Z a
x
F .t/ dt D 0 für alle x 2 Œa; b2 H) F .t/ D 0 f.ü. in Œa; b2:
354
13.4
Kapitel 13
# Ergänzungen zur Analysis
Die Mittelwertsätze der Integralrechnung, Produktsatz
Die Themen dieses Abschnitts sind dem gleichen Problemkreis gewidmet, verlangen jedoch unterschiedliche Hilfsmittel. Die Standardversion des ersten Mittelwertsatzes (Satz A) stützt sich auf gängige Aussagen des Kapitels 11; die vektorielle Version (Satz C) setzt einiges über messbare Abbildungen voraus (Abschnitt 13.3). Beim zweiten Mittelwertsatz benötigt man in allen Versionen (Sätze E und F) nur die Integralrechnung des Kapitels 11. Der folgende Beweis des allgemeinen Produktsatzes erfordert zwar messbare Mengen (Abschnitt 13.2); im Gegensatz zu dem Vorgehen bei W[13.3] sind aber keine messbaren Abbildungen erforderlich. So könnte Satz A auch im Anschluss an Abschnitt 11.6 behandelt werden und die Sätze E und F nach Abschnitt 11.7. Der erste Mittelwertsatz ist für skalare Funktionen eine leichte Verallgemeinerung der Standardabschätzung für Integrale: A. Satz (erster Mittelwertsatz der Integralrechnung, Standardversion). Sei f W A ! R (A - Rn ) integrierbar und beschränkt, g W A ! RC 0 integrierbar und m ´ infA f; M ´ supA f . Dann gibt es ein c 2 Œm; M 2 mit Z Z gf D c g: (1) A
A
Beweis. Das Integral links in (1) existiert aufgrund des Produktsatzes I[11.6]. Verschwindet das Integral rechts in (1), so ist die Behauptung trivial erfüllt (mit jedem c 2 R). Sei also dieses Integral jetzt positiv vorausgesetzt. Aus der Ungleichung m 0 f .x/ 0 M folgt durch Multiplikation mit g.x/ $ 0 für alle x 2 A: mg.x/ 0 g.x/f .x/ 0 Mg.x/. Integration hiervon liefert Z Z Z g: gf 0 M m g0 Somit liegt der Quotient c ´
R
A
A
gf
ıR
A
A
A
g im Intervall Œm; M 2.
"
Der geometrische Hintergrund dieser Mittelwertsätze ist die Schwerpunktbildung. Richtig deutlich wird das vor allem bei vektorwertigen Abbildungen. Dabei spielen die konvexen Mengen des Zielraums W eine wichtige Rolle, da sie mit endlichen vielen Punkten jeweils auch deren Schwerpunkt (bei „positiven Gewichten“) enthalten. Das wird durch folgendes Lemma ausgedrückt.
Abschnitt 13.4 Die Mittelwertsätze der Integralrechnung, Produktsatz
355
Es sei W wie in Kapitel 11 ein Banach-Raum, und wir betrachten Abbildungen F W Rn ! W mit den dort vereinbarten allgemeinen Bezeichnungen. B . Lemma. Sei C eine konvexe Teilmenge des reellen Vektorraums W . Für endlich viele Punkte A1 ; : : : ; AN von C und reelle nichtnegative Zahlen t1 ; : : : ; tN mit t1 C ' ' ' C tN D 1 gilt dann stets t1 A1 C ' ' ' C tN AN 2 C . Beweis. Für N D 1 gilt dieser Schluss trivial und für N D 2 aufgrund der Definition der Konvexität (J[10.1]): Mit je zwei Punkten A1 ; A2 enthält C ja die Punkte der Verbindungsstrecke .1 % t/A1 C tA2 , 0 0 t 0 1, die eben auch in der Gestalt t1 A1 C t2 A2 mit t1 ; t2 2 RC 0 und t1 C t2 D 1 geschrieben werden können. Nun schließt man im Wege einer vollständigen Induktion von der Behauptung für N $ 2 auf die Behauptung für N C 1, ähnlich wie schon in E[8.6]: Ist t1 C ' ' ' C tN C1 D 1 vorausgesetzt, so sei o.B.d.A. angenommen s ´ t1 C ' ' ' C tN > 0. (Für s D 0 wird t1 D 0, . . . , tN D 0, also tN C1 D 1, und die Behauptung ist trivial.) Nun gilt 1 / tN t1 A1 C ' ' ' C AN C tN C1 AN C1 2 C; t1 A1 C ' ' ' C tN C1 AN C1 D s s s da nach Induktionsvoraussetzung der Ausdruck in der großen Klammer in C liegt und da s C tN C1 D 1. Das ist bereits die Behauptung für N C 1. " Lässt man die Summenbedingung an die tj fallen, so kann der Schluss in Lemma B äquivalent auch so ausgedrückt werden: Für alle endlichen Folgen .Aj /1#j #N in C und alle endlichen Folgen .tj /1#j #N in RC 0 existiert ein c 2 C mit (2)
XN j D1
tj Aj D c
XN j D1
tj :
Tatsächlich ist (2) trivial, falls die Summe der tj null ist, und im Fall einer positiven Summe kann man (2) durch diese Summe dividieren, um auf die obige Situation zurückzukommen. Hiervon gilt nun die folgende Integralvariante, wobei wir uns auf endlich-dimensionale Zielräume beschränken wollen: C. Satz (erster Mittelwertsatz der Integralrechnung). Sei dim W < 1, A messbare Teilmenge von Rn , und sei F W A ! W integrierbar und beschränkt sowie g W A ! RC 0 integrierbar. Liegen alle Bildpunkte F .x/ der x 2 A in einer konvexen, abgeschlossenen Menge C - W , so existiert ein c 2 C mit Z Z gF D c g: (3) A
A
356
Kapitel 13
# Ergänzungen zur Analysis
Beweis. Auch hier existiert das Integral links in (3), da die Komponenten von F (bzgl. irgendeiner Basis von W ) beschränkt sind. Das Integral rechts kann als positiv vorausgesetzt werden, da andernfalls beide Integrale verschwinden. Sei kF k1 µ K gesetzt. Zu gegebenem " > 0 werde auf folgende Weise eine Approximation P" an gF konstruiert. Dann kann man einen Grenzübergang anschließen. Bei der Konstruktion von P" sei in den Zwischenschritten die bestehende Abhängigkeit von " der Einfachheit halber nicht hervorgehoben (wohl aber im Resultat). Wegen der Beschränktheit der Bildmenge F .A/ ist ihr Abschluss kompakt, also existieren endlich viele Bälle B1 ; : : : ; BN in W vom Radius "=2, die F .A/ überdecken. Aus diesen Bällen definiere man neue Mengen in W durch (4)
M1 ´ B1 ;
Mj ´ Bj n .B1 [ ' ' ' [ Bj &1 /;
j D 2; : : : ; N;
und betrachte die Urbildmengen Aj ´ F &1 .Mj / - A. Diese sind nach E(ii)[13.3] und D(i)[13.3] messbar, da als Differenz der Urbilder von offenen Mengen darstellbar. Somit ist F über alle Aj integrierbar und ebenso g (A[13.2]). Weiter gilt $ $ A D A1 [ ' [ AN :
Da man eventuell leere Aj einfach weglassen kann, darf man annehmen, dass dies schon geschehen ist, also alle Aj ¤ ¿ sind. Wähle nun in jedem Aj einen Punkt zj und definiere eine Abbildung P" W A ! W durch XN F .zj /gAj ; (5) P" ´ j D1
gAj die Abschneidung von g bzgl. Aj . Es gilt XN j D1
gAj D g:
Damit impliziert (5) die folgenden Ungleichungen für P" : kgF % P" k 0 " ' jgj; Der Grund für die zweite Abschätzung ist, dass für x 2 Aj gilt -F .x/ % F .zj /- < ", da ja beide Werte in Bj liegen.
(6)
kP" k 0 K ' jgj;
Durch Integration von (5) ergibt sich Z XN P" D A
j D1
Z F .zj /
A
gAj :
Nun kommt die Konvexität von C ins Spiel: Wegen F .zj / 2 C existiert nach (2) ein c" 2 C mit Z Z XN Z gAj D c" g: P" D c " (7) A
j D1 A
A
Abschnitt 13.4 Die Mittelwertsätze der Integralrechnung, Produktsatz
357
Für die Approximation P" von gF gilt also bereits, was für gF behauptet wird. Nun lasse man " eine positive Nullfolge durchlaufen, etwa 1=k. Dann wird aus (7) Z Z (8) P1=k D c1=k g: A
A
Die R Integrale links streben für k ! 1 nach majorisierter Konvergenz I[11.6] gegen Abbildungen P1=k A gF . Denn die Relationen (6) garantieren, dass die-integrierbaren punktweise gegen gF konvergieren und die Werte -P1=k .x/- für alle k und x durch K ' jg.x/j beschränkt sind. Dann konvergieren die c1=k ebenfalls, da sie durch die Gleichung (8) eindeutig bestimmt sind, und ihr Grenzwert c liegt in C , weil C abgeschlossen ist. So folgt insgesamt aus (8) die Behauptung (3). " Der zweite Mittelwertsatz handelt von Abbildungen einer Veränderlichen. In ihn gehen neben einer vektorwertigen Funktion F eine monoton fallende reellwertige Funktion g ein. Für diese wird unter gewissen Normierungsbedingungen die folgende monotone Approximation durch Treppenfunktionen benötigt: D . Lemma. Sei g W Œa; b2 ! R monoton fallend mit den (natürlich einseitigen) Grenzwerten gC .a/ ´ lim t !a g.t/ D 1, g& .b/ ´ lim t !b g.t/ D 0. Dann existiert zu jedem " > 0 eine monoton fallende Treppenfunktion 1 W Œa; b2 ! R mit zugehöriger Zerlegung Z D fx0 ; x1 ; : : : ; xN &1 ; xN g;
a D x0 < x1 < ' ' ' < xN &1 < xN D b;
sodass jg.t/ % 1.t/j 0 " für alle t 2 Œa; b2 n Z und 1 j 2a; x1 Œ D 1, 1j 2xN &1 ; bŒD 0 gilt. Beweis. Sei J ´ Œa; b2 gesetzt. Der Grund für eine solche Approximation ist die Tatsache, dass g an jeder Stelle t 2 J ı einen linksseitigen Grenzwert g& .t/ und einen rechtsseitigen Grenzwert gC .t/ besitzt, die natürlich verschieden sein können, aber g& .t/ $ gC .t/ erfüllen (H[3.6]). Man kann dann von links- bzw. rechts her „konstant approximieren“, muss aber natürlich schauen, dass diese Annäherungen sauber aneinanderschließen. Das geht so: Zu jedem . 2 J existiert eine Umgebung U..; ı/, sodass für s; t < . in J \U.x; ı/ die Funktionswerte g.s/; g.t/ um weniger als "=2 von g& ../ abweichen und für s; t > . in J \ U..; ı/ um weniger als "=2 von gC ../. Wegen der Kompaktheit von J gibt es endlich viele solche Umgebungen U..1 ; ı1 /, . . . , U..n ; ın /, die J überdecken. Das linke Teilintervall von U..k ; ık / n f.k g heiße jeweils Lk , das rechte Rk .
358
Kapitel 13
# Ergänzungen zur Analysis
Nun ordnet man die Randpunkte aller Intervalle Lk , Rk , soweit sie in J liegen, monoton wachsend an und erhält so eine Zerlegung Z D fx0 ; x1 ; : : : ; xN &1 ; xN g;
a D x0 < x1 < ' ' ' < xN &1 < xN D b;
für & die man * die gesuchte Treppenfunktion konstruieren kann. Jedes Teilintervall x ; x j &1 j & * von Z enthält keinen Randpunkt der Intervalle Lk , Rk . Daraus folgt, dass x ; x j &1 j & * in einem geeigneten Lk oder Rk enthalten ist. Liegt nämlich& ein x 2* xj &1 ; xj in einem bestimmten Lk bzw. Rk , so ist das ganze Intervall xj &1 ; xj Teil von Lk bzw. Rk . Für je zwei Punkte s; t aus dem gleichen Lk bzw. Rk gilt also jg.s/ % g.t/j < ". Nun definiert man 1 durch & * 1 j 2a; x1 Œ ´ 1; 1j xj &1 ; xj ´ g.zj /; 1j 2xN &1 ; bŒ ´ 0 & * für j D 2; : : : ; N % 1, wobei zj irgendeine Stelle in xj &1 ; xj ist. In den „mittleren“ Intervallen gilt dann jg.t/ % 1.t/j < " und in den beiden „Randintervallen“ jg.t/ % 1.t/j D jg.t/ % 1j 0 " bzw. jg.t/ % 1.t/j D jg.t/ % 0j 0 ", da dort je zwei Funktionswerte von g eine Distanz < " haben, also die Abweichung der Funktionswerte vom Grenzwert bei 1 bzw. 0 höchstens " ist. Wegen 1 $ g.z2 / $ g.z3 / $ ' ' ' $ g.zN &1 / $ 0 kann man noch die Werte von 1 in den Punkten xj so festlegen, dass insgesamt eine Funktion 1 mit den gewünschten Eigenschaften entsteht. " E. Satz (zweiter Mittelwertsatz der Integralrechnung). Sei F W Œa; b2 ! W integrierbar und g W Œa; b2 ! R monoton fallend mit g.a/ D 1, g.b/ D 0 sowie C eine konvexe, abgeschlossene Teilmenge von W . Z b Z x gF 2 C . F 2 C für alle x 2 Œa; b2 auch Dann folgt aus a
a
Beweis. g ist als monotone Funktion integrierbar (S(iii)[11.6]), und damit existieren alle Integrale nach dem Produktsatz (L[11.5]). Zunächst sei anstelle von g.a/ D 1, g.b/ D 0 vorausgesetzt: gC .a/ D 1, g& .b/ D 0. Zu gegebenem " > 0&sei gemäß * Lemma D zu g eine Treppenfunktion 1 konstruiert. Setzt man cj ´ 1 j xj &1 ; xj , so kann man zunächst für 1F folgende Rechnung anstellen: Z b Z xj N N Z xj X X F 1F D 1F D cj a
j D1 xj #1
D
N X j D1
cj
3Z a
j D1 xj
Z F%
a
xj #1
xj #1
Z N . X F D .cj &1 % cj / j D2
a
xj #1
F:
Abschnitt 13.4 Die Mittelwertsätze der Integralrechnung, Produktsatz
359
Dabei wurde bei der Umsortierung der Summe (so genannte Abelsche partielle Summation) cN D 0 eingebracht. Im letzten Ausdruck sind die skalaren Koeffizienten $ 0, und ihre Summe ist N X .cj &1 % cj / D 1; j D2
da sich in dieser Teleskopsumme alles bis auf c1 D 1 heraushebt. Somit gilt, da die Rb zuletzt erschienenen Integrale in C liegen: a 1F 2 C . Nun durchlaufe " wieder die Nullfolge .1=k/. Dann gilt für die zugehörigen Funktionen 1k Z (9)
b
a
1k F 2 C:
Hierin konvergieren die Funktionen 1k fast überall gegen g, also 1k F gegen gF , und es gilt die Beschränkung k1k F k 0 kF k. Mittels majorisierter Konvergenz folgt damit aus (9) durch Grenzübergang k ! 1 Z
b
a
gF 2 C;
wobei natürlich die Abgeschlossenheit von C eingeht. Um die Behauptung unter den Voraussetzungen des Satzes zu beweisen, sei zu g und ` 2 N mit 2=` < b % a eine Hilfsfunktion h` W Œa; b2 ! R definiert durch 8 ˆ für a 0 t < a C 3` 0 können wir wieder eine Approximation P" an B.F; G/ konstruieren und dann einen Grenzübergang anschließen. Eine Dimensionsbeschränkung ist nicht verlangt und auch nicht erforderlich, da die Bildmenge von F von alleine kompakt ist. Bezeichnet nämlich T ¤ ¿ den kompakten Träger von F , so gilt F .Rn / D F .T /, und F .T / ist kompakt in V . Somit kann F .Rn / durch endlich viele Bälle B1 ; : : : ; BN in V vom Radius "=2 überdeckt werden. Von hier ab geht die Konstruktion von P" analog wie oben bei Satz C: Man definiert für j D 1; : : : ; N Teilmengen Mj ) V durch (4), setzt Aj ´ F &1 .Mj / und stellt fest, dass die Aj eine endliche Zerlegung von Rn bilden und als Differenzen offener Mengen messbar sind (B[13.2] und (D[13.2]). Weiter sind F , G, kF k, kGk über die Aj integrierbar (A[13.2]). Nach Wahl willkürlicher Punkte zj 2 Aj definiert man P" W Rn ! Z durch XN P" ´ B.F .zj /; GAj /; j D1
GAj die Abschneidung von G bzgl. Aj , und hat für x 2 Aj kP" .x/k D -B.F .zj /; G.x//- 0 kBk ' kF k1 ' kG.x/k kB.F; G/ % P" .x/k D -B.F .x/; G.x// % B.F .zj /; G.x//D -B.F .x/ % F .zj /; G.x//0 kBk ' -F .x/ % F .zj /- ' kG.x/k 0 kBk ' " ' kG.x/k ; das letzte deswegen, weil beide Werte von F in Bj liegen. Zusammengefasst gilt also (12)
kP" k 0 kBk ' kF k1 ' kGk ;
kB.F; G/ % P" k 0 kBk ' " ' kGk :
Nun lässt man wieder " eine positive Nullfolge durchlaufen, etwa 1=k. Dann garantieren die Abschätzungen (12), dass die nach Satz R[11.4] integrierbaren Abbildungen P1=k punktweise gegen B.F; G/ konvergieren und die Werte -P1=k .x/- für alle k und x durchkBk ' kF k1 ' kG.x/k nach oben beschränkt sind. Somit ist B.F; G/ integrierbar (majorisierte Konvergenz I[11.6]). Integration der ersten Ungleichung in (12) und anschließender Grenzübergang k ! 1 liefert schließlich (11). "
362
Kapitel 13
# Ergänzungen zur Analysis
Um von den F 2 K10 .Rn ; V / zu integrierbaren, beschränkten Abbildungen F überzugehen, hilft die folgende Abschneidungsprozedur für die Werte: H. Lemma. Zu einer stetigen Abbildung F W Rn ! W und einer Konstanten K > 0 sei die Abbildung ˆ W Rn ! W definiert durch 8 0 (homogene Massenbelegung) nennt man S den geometrischen Schwerpunkt von A, vorausgesetzt das Volumen ,.A/ ist positiv. Der geometrische Schwerpunkt ist also (da sich die Konstante g herauskürzt): Z 1 iA : S´ ,.A/ A Aus Satz C bzw. Aufgabe 2 folgt, dass der Schwerpunkt in jedem Fall in der abgeschlossenen konvexen Hülle von A liegt. Hinweis: In den Standardkoordinaten von Rn hat iA die Darstellung .x1 ; : : : ; xn /> . a) Man berechne den geometrischen Schwerpunkt der Ordinatenmenge der Funktion f W Œ0; 12 ! R, f .x/ ´ x 2 . Lösungshinweis: Hier ist in klassischen Koordinaten x; y von R2 : A D f.x; y/ j 0 0 x 0 1; 0 0 y 0 x 2 g; und S ist gegeben durch 0Z SD
B A 1 BZ vol2 .A/ @ A
1
x dx dy C C: A y dx dy
b) Man berechne den geometrischen Schwerpunkt des Achtelballs in R3 A ´ f.x; y; z/ j x 2 C y 2 C z 2 0 1; x $ 0; y $ 0; z $ 0g:
Abschnitt 13.5 Die Gammafunktion – Einführung und Bericht
365
13.5 Die Gammafunktion – Einführung und Bericht Dieser Abschnitt ist unabhängig von den Abschnitten 13.1 bis 13.4. Die Gammafunktion ist eine Perle der klassischen Analysis mit vielen Beziehungen und Anwendungen auch moderner Art. Es handelt sich um eine ganz konkrete Funktion, die die Fakultätenfunktion n 7! nŠ interpoliert, d.h. auf stetige (und sinnvolle) Weise von N auf RC und sogar C fortsetzt. Bei ihrer Einführung kommen wichtige Prinzipien der analytischen Theorie zum Einsatz. Detaillierte Eigenschaften erfordern kunstvolle Umformungen, die ein eigenes Gebiet darstellen, über das hier nur berichtet werden soll. Euler hat bemerkt, dass das folgende Parameterintegral den Wert nŠ hat, sodass es nahe liegt, für den Parameter dann auch nicht ganzzahlige Werte zuzulassen. A. Lemma. Für jede natürliche Zahl n konvergiert das folgende Integral absolut und hat den angegebenen Wert: Z 1
0
t n e &t dt D nŠ:
Beweis. Die absolute Konvergenz ergibt sich aus dem Majorantenkriterium D(i)[11.7] zusammen mit dem Wachstumsvergleich der e-Funktion und der Potenzen. Die Funktion t 7! e &t geht für t ! 1 ungleich „schneller“ gegen null als die Potenzfunktion t 7! t n anwachsen kann. Tatsächlich gibt es nach J(iii)[3.7] eine Konstante C derart, n t=2 dass für alle t 2 RC 0 C . Hieraus folgt 0 gilt: t =e 0 0 t n e &t 0 C e &t=2
8 t $ 0:
Somit definiert g.t/ ´ C e &t=2 eine über RC 0 integrierbare Majorante des Integranden. Dieser besitzt außerdem eine explizite Stammfunktion, nämlich / 1 t t2 tn &t F .t/ ´ %nŠe 1C C C ''' C : 1Š 2Š nŠ Man verifiziert in der Tat: F 0 .t/ D t n e &t . Hieraus folgt Z 0
1
n &t
t e
Z dt D lim
T !1 0
T
t n e &t dt D lim .F .T / % F .0// D 0 % .%nŠ/ D nŠ: T !1
Alternativ könnte man den Integralwert durch vollständige Induktion berechnen, indem man beim Induktionsschritt Produktintegration anwendet. " Nun ersetzt man n durch eine reelle Zahl, die traditionell als x % 1 geschrieben wird, und erhält die Gammafunktion:
366
Kapitel 13
# Ergänzungen zur Analysis
B. Satz und Definition. Für x > 0 konvergiert das Parameterintegral Z 1 (1) /.x/ ´ t x&1 e &t dt 0
absolut und definiert eine stetige Funktion / W RC ! R, die Gammafunktion. Diese erfüllt: /.n/ D .n % 1/Š 8 n 2 N: Die Symbolik geht auf Legendre zurück; sie ist wegen der Verschiebung auf x % 1 etwas unglücklich, hat sich aber allgemein eingebürgert. Gauß schrieb Z 1 ….x/ ´ t x e &t dt; 0
was gefälliger wäre, aber nicht mehr üblich ist. Beweis von B. Für x $ 1 verläuft der Beweis für die absolute Konvergenz wie oben. Für 0 < x < 1 ist das Integral nicht nur bei „t D 1“, sondern auch bei t D 0 uneigentlich, aber dort wegen der Majorante t 7! t x&1 in 20; 12 ebenfalls absolut konvergent. Der Funktionswert bei t D 0 ist nicht definiert aber unwesentlich, da die Existenz des Integrals davon unberührt ist. Mit anderen Worten: Anstelle der Integrationsmenge Œ0; 1Œ kann ebenso gut die Integrationsmenge 20; 1Œ genommen werden. Zum Nachweis der Stetigkeit von / muss man etwas subtiler vorgehen. Es reicht, die Stetigkeit von / auf jedem Intervall der Form Œ"; E2 mit 0 < " < 1 und E > 1 nachzuweisen. Das kann mit dem Satz über stetige Parameterintegrale W[11.6] geschehen. Da für P ´ Œ"; E2 undA ´ 20; 1Œ die dortigen Voraussetzungen (i), (ii) erfüllt sind, bleibt die Majorantenbedingung (iii) zu verifizieren. Nun hat man aber für x 2 Œ"; E2 wie oben mit einer Konstanten C die Abschätzungen t x&1 e &t 0 t E &1 e &t 0 C e &t=2
für t $ 1
t x&1 e &t 0 t "&1
für 0 < t 0 1;
wobei C nur von E abhängt. So erhält man die nötige Schrankenfunktion g als die, welche auf den Intervallen Œ1; 1Œ bzw. 20; 12 mit diesen oberen Schranken übereinstimmt. " C. Bemerkungen. (i) Manchmal ist es nützlich, so wie eben im Beweis das Integral in B für x > 0 als Grenzwert von Integralen mit „harmlosen“ Grenzen darzustellen, d.h. zu schreiben Z 1 Z 1 Z 1 x&1 &t x&1 &t t x&1 e &t dt t e dt C t e dt D 0
0
D lim "#0
Z "
1
1
t
x&1 &t
e
Z
dt C lim
E !1 "
1
t x&1 e &t dt:
Abschnitt 13.5 Die Gammafunktion – Einführung und Bericht
367
Das ist richtig, da das Integral wegen der absoluten Konvergenz sowohl als LebesgueIntegral wie auch als uneigentliches Integral aufgefasst werden kann. Anstelle der 1 könnte genauso eine andere (feste) positive Zahl als Zwischenstelle fungieren. Die Verwandlung des ersten Bestandteils in einen Grenzwert kann unterbleiben, wenn x $ 1 ist. Für den simultanen Grenzübergang ."; E/ ! .0; 1/ in RC ( RC folgt hieraus (vgl. H[11.7]) Z E Z 1 t x&1 e &t dt: t x&1 e &t dt D lim .";E /!.0;1/ "
0
Das letzte Integral (nach dem Limes) soll hier kurz das „Näherungsintegral“ heißen. (ii) Mit der Substitution t D * 2 im Integral geht die Definition der Gammafunktion über in Z 1 2 /.x/ D 2 * 2x&1 e &' d *: 0
Speziell für x D 1=2 folgt daraus mit dem Gaußschen Fehlerintegral (I[9.2] oder K(iii)[11.8]) 31. p / D ': 2 Die rekursive Erzeugung der Fakultäten .n C 1/Š D .n C 1/ ' nŠ überträgt sich in gleicher Weise auf die Gammafunktion: D. Lemma. Für x > 0 gilt die Funktionalgleichung der Gammafunktion (2)
/.x C 1/ D x/.x/:
Beweis. Ersetzt man im Näherungsintegral x durch x C 1, so folgt mittels Produktintegration Z E Z E h iE x &t x &t t e dt D %t e t x&1 e &t dt: Cx "
"
"
Für ."; E/ ! .0; 1/ geht der herausintegrierte Teil gegen 0, und es verbleibt die Behauptung. " Wir ziehen zunächst einige Folgerungen aus der Funktionalgleichung: Unmittelbar klar zusammen mit der Stetigkeit bei 1 ist lim x/.x/ D lim /.x C 1/ D /.1/ D 1:
x#0
x#0
Hieraus folgt sofort (3)
lim /.x/ D lim
x#0
x#0
x/.x/ D 1: x
368
Kapitel 13
# Ergänzungen zur Analysis
Kennt man die Werte von /.x/ für 0 < x 0 1, so kennt man sie auch für alle x > 1. Denn aus der Funktionalgleichung ergeben sich in einem ersten Schritt die Werte für 1 < x 0 2, sodann genauso im zweiten Schritt für 2 < x 0 3 usw. per vollständiger Induktion. Insgesamt ergibt sich für x > 0 und n 2 N die Formel (4)
/.x C n/ D .x C n % 1/.x C n % 2/ ' ' ' .x C 1/x/.x/:
E. Beispiel. Setzt man in (4) x D 1=2, so folgt zusammen mit C(ii) nach leichter Umformung 3 1. 1 3 2n % 1 p / nC D ' ''' ' ': 2 2 2 2 Damit kann die Formel für das Volumen der Euklidischen Bälle aus G(i)[11.8] einheitlich für gerade und ungerade Dimension zusammengefasst werden: p 2 'n n 3n.: ,n .B .r// D n/ 2 Ein rechnerischer Vorteil ist damit nicht verbunden, da die Ausführung des im Nenner vorkommenden Gammawerts gerade wieder Formeln wie (4) erfordert. Die Funktionalgleichung ist eine grundlegende Eigenschaft der Gammafunktion. Allerdings reicht sie alleine nicht aus, um alle Eigenschaften der Gammafunktion abzuleiten. Das liegt einfach daran, dass diese Funktionalgleichung auch von anderen Funktionen erfüllt wird. Ist z.B. p W R ! R eine periodische Funktion mit der Periode 1, so erfüllt auch die Funktion g W RC ! R mit g ´ p ' / die Gleichung g.x C 1/ D p.x C 1//.x C 1/ D p.x/x/.x/ D xg.x/: Es sind aber eine Reihe von Zusatzvoraussetzungen erfunden worden, die dann zusammen mit der Funktionalgleichung die Gammafunktion wirklich kennzeichnen. Wir berichten darüber am Ende dieses Abschnitts. Die Gammafunktion kann zwar nicht durch andere elementare Funktionen explizit ausgedrückt werden, wohl aber ist ihr asymptotisches Verhalten für x ! 1 so kontrollierbar: F. Satz (Stirlingsche Formel). Für x ! 1 gilt die asymptotische Gleichheit r /.x/ Š
2' 3 x .x x e
.x %! 1/:
Abschnitt 13.5 Die Gammafunktion – Einführung und Bericht
369
Dies ist eine merkwürdige Beziehung, in der die beiden mathematische Naturkonstanten e und ' in eigenartiger Weise involviert sind. Nach der Definition der asymptotischen Gleichheit in L(ii)[3.5] bedeutet die Behauptung r 3 . x e x D 1: lim /.x/ ' x!1 2' x Wir zeigen dies nach einem neueren Beweisvorschlag direkt anhand der obigen Integraldarstellung der Gammafunktion. Beweis von F nach Patin[1989]. Vgl. auch Pukelsheim[2002]. Mittels Definition B schreibt sich der fragliche Ausdruck als r 3 . Z 1 3 .x&1 x e x 1 dt t Q.x/ ´ /.x/ ' Dp e x&t p : 2' x x x 2' 0 Nun liegt es nahe, den Grenzübergang x ! 1 „unter dem Integralzeichen“ vorzunehmen. Dies scheitert zunächst, da der Integrand zwar punktweise gegen null konvergiert, aber keine von x unabhängige und integrierbare Majorante besitzt. Der entscheidende Trick, um dies zu retten, ist die folgende Variablensubstitution: 3 * .2 t Dx 1C p 2 x
mit
dt D
p 3 * . x 1C p d *: 2 x
Damit verwandelt sich der Ausdruck Q.x/ in Z 1 3 * .2x&1 &px'&' 2 =4 1 e d* Q.x/ D p 1 C p 2 x 2' &2px (5) Z 1 1 2 f .x; */e &' =4 d * Dp 2' &1 mit
8 %1 und ` 2 N gültigen Formel, bei der zunächst 0 < " < k sei: ' 2 *C1 3 Z k 3 Z t .` t t .` k 1 ` k *C1 3 t .`&1 * dt D dt: t 1% 1% C t 1% k . C1 k . C1k " k " " Beim Grenzübergang " # 0 verschwindet der herausintegrierte Bestandteil, und es verbleibt Z k 3 Z t .` 1 ` k *C1 3 t .`&1 t* 1 % dt D dt: t 1% k . C1k 0 k 0 Wendet man dies der Reihe nach auf ..; `/ D .x % 1; k/, ..; `/ D .x; k % 1/, . . . , ..; `/ D .x % 2 C k; 1/ an, so folgt Z k 3 Z k 1 kŠ t .k dt D k t* 1 % t xCk&1 dt k k x.x C 1/ ' ' ' .x C k % 1/ 0 0 D
kŠk x : x.x C 1/ ' ' ' .x C k/
Zusammen mit Lemma H ergibt sich also I. Satz. Es besteht die Eulersche Produktdarstellung der Gammafunktion kx kŠk x .3 D lim 3 x. 3 x .; x k!1 k!1 x.x C 1/ ' ' ' .x C k/ x 1C 1C ''' 1 C 1 2 k
/.x/ D lim
gültig für alle x > 0.
"
Die Gammafunktion kann unter Wahrung der Funktionalgleichung auf negative Argumente, die nicht ganzzahlig sind, fortgesetzt werden: Soll /.x C1/ D x/.x/ zunächst für %1 < x < 0 gelten, so hat man zwangsläufig zu definieren /.x/ ´
/.x C 1/ ; x
%1 < x < 0;
und dies geht auch gut, da dann x C 1 in RC liegt. Analog kann man sukzessive weiter ins Negative vorstoßen, indem man induktiv für n D 2; 3; : : : definiert /.x/ ´
/.x C 1/ ; x
%n < x < %n C 1:
Damit ist die Gammafunktion für alle reellen x ¤ 0; %1; %2; : : : definiert und erfüllt für alle diese x die Funktionalgleichung (2). In den Intervallen 2%n; %n C 1Œ, n D 1; 2; : : :, ist / abwechselnd negativ und positiv (beginnend mit „negativ“ für n D 1), und aus (3) folgt lim /.x/ D lim /.x/ D .%1/n 1: x"nC1
x#n
Abschnitt 13.5 Die Gammafunktion – Einführung und Bericht
373
Geht man zur reziproken Funktion über, so verschwinden diese Singularitäten, und 1= / erweist sich (per Nullfortsetzung in 0; %1; %2; : : :) als überall auf R stetige Funktion. An dieser Stelle müssen wir die mit Beweisen versehene Behandlung der Gammafunktion abbrechen, weil einfach Hilfsmittel und Techniken erforderlich werden, die über den Rahmen dieses Buchs hinausgehen. Eine vorzügliche, geradezu vorbildliche Darstellung der Gammafunktion findet sich in dem Buch von Artin[1931], soweit es um reelle Eigenschaften geht. – Es folgt nun noch (ohne Beweise) ein Kurzer Bericht über weitere Eigenschaften der Gammafunktion Es besteht ein äußerst bemerkenswerter Zusammenhang der Gammafunktion mit dem Sinus, der so genannte Ergänzungssatz von Euler: /.x//.1 % x/ D
' ; sin 'x
x 2 R n Z:
Dann gibt es die Produktformel von Gauß: 3 3 1. 3 2. m % 1. /.x// x C / xC '''/ x C D .2'/.m&1/=2 m1=2&mx /.mx/; m m m gültig für m 2 N mit m $ 2 und die x 2 R, für die die vorkommenden Gammawerte definiert sind. Für m D 2 wird diese Relation nach Legendre benannt. Die Frage, was zu der Funktionalgleichung hinzukommen muss, um die Gammafunktion zu charakterisieren, wird durch folgenden Satz in sehr schöner Weise beantwortet: J. Satz (von H. A. Bohr und Mollerup). Die Funktion / W RC ! RC erfüllt die Funktionalgleichung /.x C 1/ D x/.x/, und die Komposition ln ı/ ist konvex (man sagt dafür: / ist auf RC logarithmisch konvex). Umgekehrt gilt: Erfüllt eine logarithmisch konvexe Funktion f W RC ! RC die Gleichungen f .x C 1/ D xf .x/; f .1/ D 1; so stimmt f auf RC mit / überein.
"
Harald August Bohr war der Bruder des bekannten Physikers Niels Bohr und erfand die „fast-periodischen“ Funktionen. Des Weiteren kann die Gammafunktion unter Wahrung der Funktionalgleichung ins Komplexe fortgesetzt werden (erneut mit Ausnahme der Stellen 0; %1; %2; : : :) und zwar so, dass 1=/ sogar eine ganze Funktion (d.h. holomorph in ganz C) wird. Diese komplexen Gesichtspunkte findet man z.B. in Kneser[1966] dargestellt.
374
Kapitel 13
# Ergänzungen zur Analysis
Aufgaben und Anmerkungen 1. In der Statistik wird folgende asymptotische Gleichheit für die mittleren Binomialkoeffizienten gebraucht: 0 ! 4n 2n .n %! 1/: Šp n 'n Man beweise diese. 2. Für n 2 N zeige man Z1
.1 % t 2 /.n&1/=2 dt D
&1
/
3n C 1.
p 3 n 2 . ': / C1 2
Lösungshinweis: Substitution t D cos x und H(i)[5.3]. 3. Für reelle a > 0 und x > %1 zeige man Z 1 3x C 1. 1 2 t x e &at dt D a&.xC1/=2 / : 2 2 0 4. Das so genannte Beta-Integral ist für positive reelle Zahlen p; q definiert durch Z 1 t p&1 .1 % t/q&1 dt: B.p; q/ ´ 0
Man beweise: a) Dieses Integral existiert immer, wenn p > 0 und q > 0. b) Das Beta-Integral lässt sich mit Hilfe der Gammafunktion berechnen: B.p; q/ D
/.p//.q/ : /.p C q/
Lösungshinweis zu b): Man substituiere im Gammaintegral für /.p/ gemäß t D x 2 und im Gammaintegral für /.q/ gemäß t D y 2 . Dann berechne man das Produkt /.p//.q/ als Doppelintegral über RC ( RC , führe in diesem Polarkoordinaten r; ' ein und stelle das Ergebnis wieder als Produkt zweier einfacher Integrale dar. 5. # Man zeige, dass die Gleichung aus Aufgabe 2 auch für nichtganzzahlige x anstelle n gilt: 3x C 1. Z 1 / p .1 % t 2 /.x&1/=2 dt D 3 x 2 . '; x $ 1: &1 / C1 2
Abschnitt 13.6 Die Einzigkeit der reellen Zahlen
375
13.6 Die Einzigkeit der reellen Zahlen Schon zu Beginn erhob sich die Frage, ob die reellen Zahlen durch die aufgestellten Axiome eindeutig bestimmt sind. Damals hatten wir diese Frage vorläufig mit „ja“ beantwortet, allerdings darauf hingewiesen, dass dies nur bzgl. „Isomorphie“ gemeint sein kann. Hier folgt nun die Präzisierung dieser Eindeutigkeitsaussage: A. Satz. Seien R und R0 zwei angeordnete vollständige Körper. Dann existiert genau eine von der Nullabbildung verschiedene Funktion f W R ! R0 , die Addition und Multiplikation erhält, d.h. die für alle a; b 2 R die Funktionalgleichungen (1)
f .a C b/ D f .a/ C f .b/
(2)
f .ab/ D f .a/f .b/
erfüllt. Diese Abbildung f W R ! R0 ist streng monoton wachsend, d.h. aus a < b folgt stets f .a/ < f .b/, und sie ist bijektiv. Die Vollständigkeit eines angeordneten Körpers ist wie zu Beginn in Q[1.1] definiert: Jede nach oben beschränkte nichtleere Teilmenge besitzt ein Supremum im Körper. Diese Eigenschaft soll genauer als Supremumsvollständigkeit bezeichnet werden. Eine solche Differenzierung des Sprachgebrauchs ist nötig, da die Vollständigkeit bei metrischen Räumen ja ganz anders gefasst ist. Beweis von A. In R wie in R0 gelten alle Folgerungen, die aus dem Hauptaxiom (Abschnitt 1.1) gezogen wurden. Die Bezeichnungen in R seien wie bisher gewählt und i. Allg. auch für R0 beibehalten, soweit keine Verwechslungen zu befürchten sind. So bezeichnen 0 und 1 Null- und Einselement von R und R0 , und das Pluszeichen C wird sowohl für die Addition in R wie auch in R0 gebraucht. Anders bei den Mengen der natürlichen, ganzen und rationalen Zahlen. Diese sind jeweils im betreffenden Körper enthalten und seien der Deutlichkeit halber in R wie bisher mit N, Z, Q, in R0 jedoch mit N0 , Z0 , Q0 bezeichnet. Die Unterscheidung zwischen N und N0 ist z.B. bei der Indizierung von Folgengliedern zu beachten. Eindeutigkeit von f Wie so oft in solchen Situationen, ziehen wir unter Voraussetzung der Existenz möglichst viele Folgerungen aus den Funktionalgleichungen (1), (2) (und der Forderung f ¤ 0), bis f eindeutig festgelegt ist. Zunächst ist f .1/ ¤ 0. Denn andernfalls folgte aus f .x/ D f .x ' 1/ D f .x/ ' f .1/, dass f .x/ stets gleich 0 wäre. Spezialisierungen in den Funktionalgleichungen führen nun zur Eindeutigkeit von f , zunächst auf N: Setzt man in (1) a D b D 0 , so folgt : f .0/ D 0. Setzt man in (2)
376
Kapitel 13
# Ergänzungen zur Analysis
a D b D 1, so folgt : f .1/ D f .1/2 , also f .1/.f .1/ % 1/ D 0, also f .1/ D 1. Durch vollständige Induktion ist dann f .n/ festgelegt für n 2 N; denn es gilt ja zwangsläufig der Induktionsschritt: f .n C 1/ D f .n/ C f .1/ D f .n/ C 1. Daraus folgt für die Bildmenge: f .N/ - N0 und, da f .N/ induktiv in R0 ist, tatsächlich f .N/ D N0 . Weiter folgt die Einzigkeit von f auf Z und dann auf Q. Dies ergibt sich aus den Spezialisierungen: f .a/ C f .%a/ D f .0/ D 0 für alle a in R (insbesondere in N) und f .1=a/ D 1=f .a/ für alle a ¤ 0 in R (insbesondere in N), zusammen mit f
3a.
D
b
f .a/ f .b/
8 a 2 R; b 2 R n f0g;
speziell für a D p 2 Z und b D q 2 N. Alle diese Gleichungen sind leichte Folgerungen aus (1) und (2). Tatsächlich gewinnt man damit aus f .N/ D N0 auch f .Z/ D Z0 und f .Q/ D Q0 . Als Nächstes sei die behauptetet Monotonie nachgewiesen: Jedenfalls ist für a ¤ 0 auch f .a/ ¤ 0. Sonst folgte ähnlich wie zu Beginn für x 2 R: f .x/ D f ..x=a/ ' a/ D f .x=a/ ' f .a/ D 0. Damit ist f auch injektiv; denn aus f .a/ D f .b/ folgt f .a % b/ D 0, also a % b D 0. Insbesondere bildet f jeweils N auf N0 , Z auf Z0 und Q auf Q0 in bijektiver Weise ab. In R besteht die Äquivalenz: a < b ()
9 c ¤ 0 W b % a D c2
und genauso in R0 . Die Kleiner-Relation lässt sich also in einem angeordneten vollständigen Körper durch Körperoperationen ausdrücken. Damit folgt aus a < b weiter f .b/ % f .a/ D .f .c//2 , also wegen f .c/ ¤ 0 in der Tat: f .a/ < f .b/. Es besteht sogar die Äquivalenz (3)
a < b () f .a/ < f .b/I
denn f .a/ < f .b/ würde zusammen mit a $ b den Widerspruch f .a/ $ f .b/ liefern. Nun können Folgen in den beiden Körpern einander zugeordnet werden: Zu einer 0 /m2N0 in R0 vermöge Folge .an /n2N in R bilde man die Folge .am 0 am ´ f .af #1 .m/ /;
m 2 N0 :
0 Ist dann an konvergent in R, so ist am konvergent in R0 und
(4)
0 a D lim an H) f .a/ D lim am : n!1
m!1
Um die letztgenannte Konvergenz zu überprüfen, reicht eine rationale Fehlerschranke, 0 d.h. es ist für jedes "0 2 Q0C ein Index N 0 2 N0 anzugeben, sodass %"0 < am %
377
Abschnitt 13.6 Die Einzigkeit der reellen Zahlen
f .a/ < "0 für alle m > N 0 wird. Sei dazu " 2 Q so gewählt, dass f ."/ D "0 . 0 Dann ist die erwünschte Bedingung %"0 < am % f .a/ < "0 äquivalent mit f .%"/ < f .af #1 .m/ % a/ < f ."/, also mit %" < af #1 .m/ % a < ". Nach Voraussetzung ist die letzte Forderung erfüllt, falls f &1 .m/ > N gilt, wobei N 2 N aus dem ."; N /-Test der Konvergenz an ! a herrührt. Da f &1 .m/ > N mit m > f .N / äquivalent ist, leistet die Wahl N 0 ´ f .N / das Verlangte. Hiervon besteht eine gewisse Umkehrung, wenn die Konvergenz als Cauchy-Eigenschaft formuliert wird: (5)
0 /m2N0 Cauchy-Folge in R0 H) .an /n2N Cauchy-Folge in R: .am
Man erkennt dies analog wie weiter oben durch äquivalente Umformung der Bedingung %" < ap % aq < " zu %f ."/ < f .ap / % f .aq / < f ."/, d.h. zu %f ."/ < ap0 0 % aq0 0 < f ."/, wenn p; q 2 N und p 0 ; q 0 2 N0 durch p D f &1 .p 0 / und q D f &1 .q 0 / gekoppelt sind. Um also %" < ap % aq < " zu erreichen, braucht man nur p 0 > N 0 und q 0 > N 0 zu wählen, wenn N 0 dem .f ."/; m/-Test der Cauchy0 entstammt. Die Forderungen p 0 > N 0 und q 0 > N 0 sind aber äquivalent Folge am mit p > f &1 .N 0 / und q > f &1 .N 0 /. Somit wird %" < ap % aq < " für alle p; q > N ´ f &1 .N 0 /. Damit überträgt sich die Einzigkeit der Funktion f von Q auf ganz R: Ein beliebiges x 2 R ist darstellbar als Grenzwert einer rationalen Folge: x D lim an ; n!1
an 2 Q:
0 Hieraus folgt für die zugehörige Folge am nach (4): 0 f .x/ D lim am ; m!1
0 am 2 Q0 :
0 D f .af #1 .m/ / rechts bereits eindeutig fixiert sind, ist es auch f .x/. (Für Da die am eine andere Funktion g anstelle von f mit den gleichen Eigenschaften würde ja ge0 nauso g.x/ D limm!1 am gelten.)
Jetzt fehlt noch die Surjektivität von f . Dazu stellt man ein gegebenes Element y 2 R0 wieder als Grenzwert einer rationalen Folge dar: y D lim bm ; m!1
mit bm 2 Q0 für alle m 2 N0 :
.bm /m2N0 ist dann Cauchy-Folge in Q0 . Man bilde die Folge .an /n2N in Q mit an ´ 0 f &1 .bf .n/ /. Dann gilt bm D am , also ist .an /n2N nach (5) Cauchy-Folge in Q, somit konvergent mit Grenzwert x 2 R und 0 f .x/ D lim am D lim bm D y: m!1
m!1
Auf diese Weise ist ein Urbild x von y konstruiert.
378
Kapitel 13
# Ergänzungen zur Analysis
Existenz von f Aus der vorangehenden Eindeutigkeit ergeben sich bereits viele Hinweise, wie eine Funktion f W R ! R0 mit den Eigenschaften (1) und (2) konstruiert werden kann (natürlich so, dass f ¤ 0). Dies geschieht schrittweise, indem f auf N, Z, Q und schließlich R angegeben wird. 1) Auf N sei f definiert durch das Rekursionsschema ( f .1/ D 1 f .n C 1/ D f .n/ C 1 für alle n 2 N: Dann folgt f .N/ D N0 mittels vollständiger Induktion sowie für alle n; m 2 N: (6)
f .nm/ D f .n/f .m/:
f .n C m/ D f .n/ C f .m/;
2) Auf Z wird f fortgesetzt durch f .0/ ´ 0 und (7)
f .q/ ´ %f .%q/
8 q 2 %N:
Dann bleiben die Funktionalgleichungen (6) auch für n; m 2 Z erhalten. Dazu hat man neben dem selbstverständlichen Fall n 2 N, m 2 N die Fälle zu betrachten, bei denen n oder m oder n C m nicht in N liegen. Ist z.B. n 2 N, m 2 %N und n C m 2 N, so gilt f .n C m/ D f .n % .%m// D f .n/ % f .%m/ D f .n/ C f .m/, wobei das zweite Gleichheitszeichen durch Umstellen aus f .n % .%m// C f .%m/ D f .n/ entsteht. Analog behandelt man die anderen möglichen Fälle und die multiplikativen Analoga. Außerdem gilt f .Z/ D Z0 , was unmittelbar aus der Definition (7) zu sehen ist. 3) Auf Q wird f fortgesetzt durch (8)
f
3p . q
´
f .p/ f .q/
8 p 2 Z; q 2 N:
Diese Definition ist unabhängig von der Darstellung des Bruchs p=q, da aus p=q D p1 =q1 folgt pq1 D qp1 , also f .p/f .q1 / D f .q/f .p1 /, also f .p/=f .q/ D f .p1 /=f .q1 /. Auch bei diesem Schritt bleiben die Funktionalgleichungen erhalten: f .r C s/ D f .r/ C f .s/;
f .rs/ D f .r/f .s/
8 r; s 2 Q:
Im multiplikativen Fall z.B. rechnet man so, wenn r D p=q und s D p1 =q1 : f .rs/ D f D
3p p . 3 pp . f .pp1 / 1 1 ' Df D q q1 qq1 f .qq1 /
f .p/f .p1 / f .p/ f .p1 / D ' D f .r/ ' f .s/: f .q/f .q1 / f .q/ f .q1 /
Analog geht es im additiven Fall.
379
Abschnitt 13.6 Die Einzigkeit der reellen Zahlen
Auch hier ist mittels der Definition (8) einfach zu bestätigen, dass f .Q/ D Q0 gilt. Ebenso leicht folgt f .r/ 2 Q0C für r 2 QC und damit das streng monotone Wachsen von f auf Q: Für r < s in Q ist ja s % r > 0 also f .s % r/ > 0, also f .s/ % f .r/ > 0. Insgesamt vermittelt f bijektive Abbildungen von N auf N0 , Z auf Z0 und Q auf Q0 . 4) Die Fortsetzung von f auf R geschieht wieder mit rationalen Folgen nach folgendem Plan: Ein beliebiges x 2 R werde als Grenzwert rationaler Zahlen an dargestellt 0 definiert: und f .x/ dann als Grenzwert der zugehörigen Folge am (9)
x D lim an ; n!1
0 am
an 2 Q
´ f .af #1 .m/ / 2 Q
0
für n 2 N; für
0 f .x/ ´ lim am ; m!1
0
m2N:
Damit dies gut geht, ist zu zeigen: a) Existenz des Grenzwerts rechts; b) Unabhängigkeit von der darstellenden Folge; c) Koinzidenz auf Q; c) Gültigkeit der Funktionalgleichungen. Zu a): Dies läuft erneut mit der Cauchy-Eigenschaft aufgrund des Schlusses: 0 /m2N0 Cauchy-Folge in Q0 : .an /n2N Cauchy-Folge in Q H) .am
Das ist eine (eingeschränkte) Umkehrung von (5). Wir sind jetzt in einer anderen Situation, da f auf R noch gar nicht definiert ist, jedoch verläuft de Nachweis nach dem gleichen Muster wie dort: Die Bedingung %"0 < ap0 % aq0 < "0 für "0 D f ."/ 2 Q0C und p; q 2 N0 rechnet sich äquivalent um zu %" < af #1 .p/ % af #1 .q/ < ", und hieran erkennt man, dass sie aufgrund der vorausgesetzten Cauchy-Eigenschaft erfüllt ist, wenn p; q hinreichend groß gewählt werden. Hieraus folgt a). Zu b): Wird x durch eine zweite rationale und konvergente Folge dargestellt x D lim bn ; n!1
so ist zu zeigen:
bn 2 Q für n 2 N;
0 0 lim am D lim bm :
m!1
m!1
0 0 0 , folgt % bm ´ am Es definiert dann cn ´ an % bn eine Nullfolge in Q, und da cm diese Behauptung aus der Implikation 0 cn Nullfolge in Q H) cm Nullfolge in Q0 :
Diese ist tatsächlich richtig, wie man sich erneut nach obigem Muster überzeugt. Zu c): Liegt das Argument x selbst in Q, so kann es als Grenzwert der konstanten Folge mit Wert x dargestellt werden, und die zugehörige Folge in Q0 ist ebenfalls konstant mit Wert f .x/, also konvergent gegen f .x/.
380
Kapitel 13
# Ergänzungen zur Analysis
Zu d): Dies ergibt sich durch Grenzübergang aus den Funktionalgleichungen, die in Q bereits bestehen: Ist das Argument x 2 R wie in (9) durch die Folge an dargestellt und ein zweites Argument y 2 R durch die Folge bn , so wird x C y durch die Folge an C bn und xy durch die Folge an bn dargestellt, und es gilt, da alle an und bn in Q liegen: (10)
f .an C bn / D f .an / C f .bn /;
f .an bn / D f .an /f .bn /:
0 0 0 0 und C bm , am , bm Die zu an , bn , an C bn und an bn gehörenden Folgen in Q0 sind am &1 0 0 am bm . Substituiert man also in (10) gemäß n D f .m/ und lässt m ! 1 laufen, so folgt aufgrund von (9)
f .x C y/ D f .x/ C f .y/;
f .xy/ D f .x/f .y/;
wie behauptet. Dass f nun auch streng monoton wächst und R bijektiv auf R0 abbildet, war bereits im Eindeutigkeitsteil gezeigt worden. " In beiden Beweisteilen ist mit herausgekommen, dass die natürlichen Zahlen, die jeweils in zwei angeordneten vollständigen Körper konstruiert werden können, nicht wesentlich verschieden sind. D.h. sie können so bijektiv aufeinander abgebildet werden, dass Addition, Multiplikation und Anordnung erhalten bleiben. Dasselbe gilt für die in solchen Körpern konstruierbaren ganzen und rationalen Zahlen. Das legt es nahe, diese „elementaren“ Zahlbereiche unabhängig von „umgebenden“ reellen Zahlen zu charakterisieren. Das kann bei den natürlichen Zahlen mit den so genannten Peano-Axiomen erfolgen, und aus den natürlichen Zahlen können dann die ganzen, rationalen und reellen Zahlen erzeugt werden. Bis auf den Start sind diese Erweiterungen alle expliziter Natur, sodass die Existenz der reellen Zahlen gesichert ist, vorausgesetzt, man akzeptiert die Existenz der (die Peano-Axiome erfüllenden) natürlichen Zahlen. Hier setzt nun die Erkenntnis ein, dass es ohnehin nicht möglich ist, die Mathematik aus dem Nichts zu erschaffen. Vernünftigerweise kann dann der erste und einzige nötige Akt der Akzeptanz (außer der Mengenlehre) bei den natürlichen Zahlen liegen. Über diesen konstruktiven Aufbau der reellen Zahlen wird im Abschnitt 14.3 gesprochen werden, insbesondere über den für die Analysis bedeutsamen Schritt von den rationalen zu den reellen Zahlen. Aufgaben und Anmerkungen 1. Sei f W R ! R0 die in Satz A beschriebene Abbildung zwischen zwei vollständigen angeordneten Körpern. Man überlege, dass alle aus dem Hauptaxiom abgeleiteten Folgebegriffe unter f invariant sind, also z.B. die nachstehenden Aussagen gelten:
381
Abschnitt 13.6 Die Einzigkeit der reellen Zahlen
a) Ist die Menge M ) R nach oben beschränkt, so gilt dies auch für das Bild f .M / ) R0 , und es besteht die Gleichung sup f .M / D f .sup M /: b) Für alle x 2 R gilt jf .x/j D f .jxj/. p p 0C c) Aus x 2 RC f .x/ D f . x/. 0 folgt f .x/ 2 R0 und d) f ı exp D exp ıf . 2. Im Fall R0 D R folgt aus Satz A, dass die einzige nicht identisch verschwindende Selbstabbildung f W R ! R, die beide Funktionalgleichungen f .a C b/ D f .a/ C f .b/;
f .ab/ D f .a/f .b/
erfüllt, die Identität ist. Man arbeite einen direkten Beweis für diese Tatsache aus. 3. Man beweise: a) Jeder Körper K, der von Q umfasst wird, ist gleich Q. Man sagt: „Q ist der kleinste in R enthaltene Körper.“ b) Jeder angeordnete vollständige Körper K, der R umfasst, ist gleich R. Man sagt: „R ist ein maximaler angeordneter vollständiger Körper.“ c) „Zwischen“ Q und R gibt es viele weitere angeordnete Körper. Beispiel eines p solchen ist die Menge der Zahlen der Form a C b 2 mit a; b 2 Q. Allgemeiner zeige man: Ist ˛ eine feste reelle Zahl, die p nicht Quadrat einer rationalen Zahl ist, so bildet die Menge der Zahlen a C b ˛ mit a; b 2 Q einen Körper Kp˛ mit Q ) Kp˛ ) R. 4. Im Anschluss an Aufgabe 2 sollen gewisse Funktionalgleichungen für eine Funktion f einzeln diskutiert werden. Man zeige: a) Ist f W R ! R stetig und gilt stets f .a C b/ D f .a/ C f .b/, so ist f linear, also von der Form f .x/ D c ' x mit festem c 2 R. b) Ist f W RC ! R stetig und gilt stets f .ab/ D f .a/f .b/, so ist f D 0 oder f ist eine Potenzfunktion, d.h. von der Form f .x/ D x c mit festem c 2 R. c) Ist f W R ! R stetig und gilt stets f .a C b/ D f .a/f .b/, so ist f D 0 oder f ist eine Exponentialfunktion, also von der Form f .x/ D c x mit festem c 2 RC . d) Ist f W RC ! R stetig und gilt stets f .ab/ D f .a/ C f .b/, so ist f D 0 oder f ist eine Logarithmusfunktion, d.h. von der Form f .x/ D logc x mit festem c 2 RC .
382
Kapitel 13
# Ergänzungen zur Analysis
Hinweis: Zu diesen Funktionalgleichungen gibt es schwächere Zusatzbedingungen, die an die Stelle der Stetigkeit treten können und trotzdem die genannten Lösungen charakterisieren. Bei der Cauchyschen Funktionalgleichung in a) reicht z.B. die Beschränktheit von f in einer Umgebung der Null oder die lokale Integrierbarkeit (vgl. Aufgabe 10[13.1]). Ganz ohne Zusatzbedingungen geht es nicht; es gibt nichtlineare Lösungen von f .a C b/ D f .a/ C f .b/ „pathologischer“ Natur, deren Existenz mit so genannten Hamel-Basen, also mittels allgemeiner Mengenlehre, beweisbar sind. Konstruieren oder „sehen“ kann man solche Lösungen aber nicht. Da die anderen drei Funktionalgleichungen mittels Exponentialfunktion und Logarithmus auf die in a) zurückgeführt werden können, gilt für sie Entsprechendes. Vgl. die ausführliche Diskussion in Aczél[1966].
14
#Ergänzungen zur Topologie
In diesem Kapitel werden einige Ergänzungen zu topologischen Themen gebracht. Zunächst geht es um eine Fortsetzung der Zusammenhangstheorie, dann um den Abbildungsgrad und Überlagerungen. Im letzten Abschnitt folgt die ausführliche Behandlung der Vervollständigung, zum einen bei den metrischen Räumen, zum anderen bei der Existenzfrage der reellen Zahlen.
14.1 Weiteres über den Zusammenhang Dieser Abschnitt schließt direkt an Abschnitt 10.9 an. Wir betrachten wie dort einen metrischen Raum .X; d / und wollen hauptsächlich erklären, was Zusammenhangskomponenten sind. Vorbereitend dafür sind die folgenden drei Aussagen. A. Satz. Ist A eine zusammenhängende Teilmenge von Raumes X, dann ist jede Menge B mit A - B - A ebenfalls zusammenhängend. Insbesondere ist A zusammenhängend. $ B2 und B1 ; B2 offen in B, d.h. von der Form B1 D B \ U1 Beweis. Sei B D B1 [ und B2 D B \ U2 mit offenen U1 ; U2 - X. Dann gilt $ $ A D A \ B D A \ .B1 [ B2 / D .A \ B1 / [ .A \ B2 / D $ $ D .A \ B \ U1 / [ .A \ B \ U2 / D .A \ U1 / [ .A \ U2 /:
Da A zusammenhängend ist, folgt hieraus A \ U1 D ¿ oder A \ U2 D ¿. Aus A \ U1 D ¿ folgt A - X n U1 , also A - X n U1 , da X n U1 abgeschlossen in X ist. Dies impliziert B - X n U1 , also B \ U1 D ¿. Genauso folgt aus A \ U2 D ¿, dass B \ U2 D ¿. In jedem Fall ergibt sich B \ U1 D ¿ oder B \ U2 D ¿. Somit ist B zusammenhängend. " B. Satz. Der metrische Raum X sei dargestellt als Vereinigung von zusammenhängenden Teilmengen mit nichtleerem Durchschnitt: \ [ A( ¤ ¿: XD A ; ( (2ƒ (2ƒ Dann ist X zusammenhängend.
384
Kapitel 14
# Ergänzungen zur Topologie
Die Indexmenge ƒ unterliegt hier keinen Beschränkungen, sie braucht z.B. nicht abzählbar zu sein. T $ Beweis von B. Sei a 2 (2ƒ A( und X D M1 [ M2 mit offenen M1 , M2 in X. Sei etwa a 2 M1 . Zu zeigen ist M2 D ¿. Angenommen, M2 ¤ ¿. Dann gibt es ein + 2 ƒ mit M2 \ A( ¤ ¿. Nun gilt $ A( D .M1 \ A( / [ .M2 \ A( /, und M1 \ A( ; M2 \ A( sind offen in A( . Also folgt, da a 2 M1 \ A( , dass M2 \ A( D ¿, Widerspruch. " C. Folgerung. Seien A1 ; : : : ; AN endlich viele zusammenhängenden Teilmengen des metrischen Raumes X mit Ai \AiC1 ¤ ¿ für 1 0 i 0 N %1. Dann ist die Vereinigung A1 [ ' ' ' [ AN zusammenhängend. Beweis. Vollständige Induktion nach N mittels Satz B.
"
D. Definition und Satz. Zu p 2 X ist die Zusammenhangskomponente Zp von p definiert als die Vereinigung aller zusammenhängenden Teilmengen von X, die p enthalten. Für alle p; q 2 X gilt: (i)
p 2 Zp , und Zp ist die größte zusammenhängende Teilmenge von X die p enthält; Zp ist abgeschlossen.
(ii) Aus Zp \ Zq ¤ ¿ folgt Zp D Zq . In (i), (ii) ist enthalten, dass die Zusammenhangskomponenten eine Klasseneinteilung von X bilden. Beweis. Zu (i): Die einelementige Menge fpg ist zusammenhängend, also fpg - Zp , also p 2 Zp . Nach Satz B ist Zp zusammenhängend. Ist A / Zp ebenfalls zusammenhängend, so gilt A - Zp , also A D Zp . Nach Satz A ist Zp zusammenhängend, also Zp D Zp . Zu (ii): Ist q1 2 Zp \ Zq , so folgt Zq1 / Zp , also nach (i) Zq1 D Zp . Ebenso folgt Zq1 D Zq . " E. Bemerkung. In der Situation B - A - X gilt: (1)
B wegzusammenhängend in A () B wegzusammenhängend in X
(2)
B zusammenhängend in A () B zusammenhängend in X:
Abschnitt 14.1 Weiteres über den Zusammenhang
385
(1) beruht einfach auf der Tatsache, dass jeder Weg mit Bild in B auch Weg mit Bild in A ist. (2) ist klar, weil der Zusammenhang eines Raumes kraft Definition nur von der Topologie dieses Raumes abhängt und da die Relativtopologie von B in A die gleiche ist wie die von B in X. F. Satz. Sei A ¤ ¿ offene Teilmenge eines normierten Vektorraums V . Dann gilt (i)
Jede Wegkomponente von A ist offen.
(ii)
Jede Zusammenhangskomponente von A ist offen.
(iii) Die Zusammenhangskomponenten von A sind genau die Wegkomponenten von A. (iv)
A ist disjunkte Vereinigung von Gebieten, nämlich den Zusammenhangskomponenten von A. Hat V endliche Dimension, so ist diese Vereinigung abzählbar.
Beweis. Zu (i): Dies war schon bei Satz E[10.9] gezeigt worden: Sei Cp - A die Wegkomponente von p in A. Zu q 2 Cp sei ein Ball B.q; r/ - A gewählt. Dann folgt B.q; r/ - Cp ; denn jedes q1 2 B.q; r/ ist in A mit q verbindbar, also auch mit p. Zu (ii): Sei Zp - A die Zusammenhangskomponente von p in A. Zu q 2 Zp sei ein Ball B.q; r/ - A gewählt. Dann folgt B.q; r/ - Zp . Denn B.q; r/ ist wegzusammenhängend, also zusammenhängend nach Satz D[10.9], also ist Zp [ B.q; r/ zusammenhängend nach Satz B. Daraus folgt aber B.q; r/ - Zp . Zu (iii): Wir zeigen: Für alle p 2 A ist Cp D Zp : Cp ist offen und wegzusammenhängend in A und damit auch in V , also nach Satz D[10.9] zusammenhängend, also Cp - Zp . Zp ist offen und zusammenhängend in A und damit auch in V , also nach Satz D[10.9] wegzusammenhängend also Zp - Cp . Zu (iv): Dies ergibt sich aus der Tatsache, dass A laut D die disjunkte Vereinigung seiner Zusammenhangskomponenten ist und diese nach (ii) offen sind. Ist V endlich-dimensional, so kann man zunächst V D Rn annehmen. Dann wählt man in jeder Zusammenhangskomponente einen Punkt mit rationalen Koordinaten; das geht nach Bemerkung I(vii)[6.4]. Da die Menge der ausgewählten Punkte abzählbar ist, ist es auch die Gesamtheit der Zusammenhangskomponenten. Auf einen beliebigen Vektorraum der Dimension n kann die Situation mit Hilfe einer linearen Bijektion L W Rn ! V , die ja zugleich ein Homöomorphismus ist, übertragen werden. "
386
Kapitel 14
# Ergänzungen zur Topologie
Die für offene Teilmengen eines Vektorraums bestehende Äquivalenz zwischen Zusammenhang und Wegzusammenhang kann verloren gehen, wenn die Teilmengen nicht offen sind. G. Beispiel. Wir betrachten die schon früher für Beispiele benutzte Sinusoid-Funktion (V[4.4]): 1 f W RC %! R; f .x/ ´ sin : x Es sei A 2 R2 der Graph von f und B dessen Abschluss in R2 : A ´ f.x; f .x// j x > 0g;
B ´ A:
Wir behaupten, dass B zwar zusammenhängend, aber nicht wegzusammenhängend ist. Jedenfalls ist A zusammenhängend, nämlich als Bild des Wegs c W RC ! R2 mit c.t/ ´ .t; f .t// (Satz H(i)[10.9]). Dann ist auch B zusammenhängend (Satz A). Zu B gehört sicher der Nullpunkt .0; 0/; denn dieser ist der Grenzwert der Nullstellenpunkte von f . Analog macht man sich klar, dass die Häufungspunkte von A, die nicht zu A gehören, gerade das Intervall J von %1 bis 1 auf der y-Achse ausfüllen, d.h. B n A D f0g ( Œ%1; 12 µ J . y
J
A
f(x) = sin(1/x)
x1 x2
x0
x
.
B=A∪J
Anschaulich leuchtet es ein, dass ein Punkt von J in B nicht mit einem Punkt von A verbunden werden kann. Denn eine solche Verbindung müsste zwischen den immer enger werdenden Extremalpunkten mit Werten 1 und %1 hin- und herspringen.
387
Abschnitt 14.1 Weiteres über den Zusammenhang
Dies kann folgendermaßen präzisiert werden: Angenommen 1 W Œa; b2 ! B ist ein Weg mit 1.a/ 2 J und 1.b/ 2 A. Sind P1 , P2 die beiden Projektionen von R2 auf R, so bedeutet die Stetigkeit von 1 , dass P1 ı 1 und P2 ı 1 beide stetig sind (C[6.4]). Zunächst einmal suchen wir den Punkt, wo sich 1 endgültig von J ablöst. Dazu definieren wir: ˇ ˚ , t # ´ sup T1 mit T1 ´ t 2 Œa; b2 ˇ P1 ı 1.t/ D 0 : Es gilt a 2 T1 , da 1.a/ 2 J , also P1 ı 1.a/ D 0. Weiter ist P1 ı 1.t # / D 0; denn t # ist Grenzwert einer Folge in T1 , und P1 ı 1 ist stetig. Insbesondere ist t # < b. Für t # < t 0 b gilt P1 ı 1.t/ > 0, weil sonst t # nicht obere Schranke von T1 wäre. Der restringierte Weg 1jŒt # ; b2 hat also die gleichen Eigenschaften wie 1 , erfüllt aber zusätzlich 1.t/ 2 A für t > t # . Wir dürfen daher von vornherein annehmen, dass 1 W Œa; b2 ! B ein Weg mit 1.a/ 2 J und 1.t/ 2 A für alle t 2 2a; b2 ist. Sei 3 ´ P2 ı 1.a/ 2 Œ%1; 12. Wir betrachten die Folge der Extremalstellen von f : xk ´
1 2 ; ' 2k C 1
k D 0; 1; 2; : : :
und können dann so weiter schließen: Da P2 ı1.a/ D 3, existiert wegen der Stetigkeit von P2 ı 1 in a ein * 2 2a; b2 mit ' 2 1 1 : (3) P2 ı 1.Œa; * 2/ - 3 % ; 3 C 2 2 Es gilt P1 ı 1.a/ D 0, P1 ı 1.a C */ µ . > 0. Nach dem Zwischenwertsatz ist also Œ0; .2 - P1 ı 1.Œa; a C *2/: Zu den xk mit xk < . existieren dann gewisse tk 2 Œa; a C *2 mit P1 ı 1.tk / D xk . Daraus ergibt sich 1.tk / D .P1 ı 1.tk /; P2 ı 1.tk // D .xk ; f .xk //: & * Zusammen mit (3) folgt f .xk / 2 3 % 21 ; 3 C 21 . Da diese f .xk / beide Werte 1; %1 annehmen, ist hierin ein Widerspruch enthalten; denn kein Intervall der Länge 1 kann gleichzeitig 1 und %1 enthalten. Einen Weg 1 der genannten Art kann es nicht geben: B ist nicht wegzusammenhängend. Da die Mengen A und J für sich wegzusammenhängend sind, sind sie die Wegkomponenten von B. In B ist J nicht offen (aber abgeschlossen) und A nicht abgeschlossen (aber offen). Wegkomponenten brauchen also i. Allg. weder offen noch abgeschlossen zu sein.
388
# Ergänzungen zur Topologie
Kapitel 14
Aufgaben und Anmerkungen 1. Die Menge X ) R sei definiert als o n1 ˇ ˇ X´ ˇ n 2 N [ f0g: n a) Man berechne die Wegkomponenten C1=n und C0 . b) # Man berechne die Zusammenhangskomponenten Z
1=n
und Z0 .
2. Komponenten von Q. Zeige: a) Jeder Weg in Q ist konstant. b) Die Wegkomponenten von Q sind die einpunktigen Teilmengen von Q. c) # Die Zusammenhangskomponenten von Q sind die einpunktigen Teilmengen von Q.
Hinweis: Sind alle Zusammenhangskomponenten eines metrischen Raumes X einpunktig, so heißt X total unzusammenhängend. Die Menge Q der rationalen Zahlen ist also total unzusammenhängend. 3. Die vorangehende Aufgabe 2 c) zeigt, dass die Zusammenhangskomponenten i. Allg. nicht offen sind (wohl aber nach Satz A abgeschlossen). Man beweise jedoch: Besitzt der metrische Raum X nur endlich viele Zusammenhangskomponenten, so ist jede Zusammenhangskomponente offen.
14.2
Globale Winkelfunktionen und Abbildungsgrad
In diesem Abschnitt wird die Analysis nur im Umfang des ersten Bandes gebraucht. Nützlich, wenn auch nicht unbedingt nötig, ist die Schreibweise der komplexen Kurvenintegrale (C[9.3]). Das Problem bei den Polarkoordinaten in R2 ist die Unbestimmtheit der zweiten Koordinate, des Winkelarguments. Die Beschäftigung mit dieser Mehrdeutigkeit (zunächst eine rein technische Frage) führte im Lauf der Entwicklung zu zwei grundlegenden Begriffen, nämlich zum Abbildungsgrad und zu den Riemannschen Flächen. Aus der Not wurde also, wie so oft in der Mathematik, eine Tugend. Der erste Aspekt, der Abbildungsgrad für Kreisabbildungen, soll hier diskutiert werden, wobei als Anwendung ein Fixpunktsatz herauskommen wird. Innerhalb dieser Diskussion bietet es sich auf natürliche Weise an, auf den Begriff des Überlagerungsraums einzugehen. Im Folgenden wollen wir R2 als komplexe Ebene C auffassen. Dadurch wird die rechnerische Beschreibung etwas einfacher. Wesentlich ist das aber nicht. Man kann jederzeit zur reellen Darstellung übergehen, indem man die Eulersche Relation (1)[7.2]
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
389
anwendet. Ist nämlich eine komplexe Zahl z D x C iy in Polardarstellung z D re i' gegeben, so ist diese äquivalent zur Polardarstellung x D r cos '; y D r sin ' der reellen kartesischen Koordinaten x; y. In der Darstellung z D re i' ist die erste Polarkoordinate r einfach der Betrag von z. Die zweite Polarkoordinate ' ist das so genannte Argument oder Winkelargument; es ist für z ¤ 0 nur bis auf ganze Vielfache von 2' fixiert und für z D 0 sogar völlig frei (dieser Fall wird aber hier ausgeschlossen). Gilt z D re i' , so soll ' eine Bestimmung des Arguments von z heißen. Für ein und dasselbe z gibt es also unendlich viele solche Bestimmungen (die sich im Fall z ¤ 0 jeweils um ganze Vielfache von 2' unterscheiden). Wir haben bereits früher gesehen, dass eine Bestimmung ' „zwangsweise“ eindeutig gemacht werden kann, indem man ihr die Beschränkung %' < ' 0 ' auferlegt. Dieser Hauptwert ' D Arg.z/ ist dann in der längs der negativen x-Achse geschlitzten Ebene formelmäßig berechenbar und, wie die Bauart dieser Formel in Satz E[7.2] zeigt, dort auch stetig von z abhängig. Mit anderen Worten, in dieser geschlitzten Ebene existiert eine stetige Bestimmung des Winkelarguments. In den Punkten der negativen x-Achse ist der Hauptwert zwar definiert (als ') aber unstetig. Man erkennt dies am Beispiel des Kreiswegs 1.t/ ´ e it ; 0 0 t 0 2'. Hier gilt nämlich lim Arg.e it / D '; t#%
lim Arg.e it / D %': t"%
Anstelle der negativen x-Achse kann auch ein anderer Schlitz verwendet werden: Zu z0 ¤ 0 sei der Schlitz längs %z0 und die zugehörige geschlitzte Ebene definiert durch Sz0 ´ f+ ' .%z0 / j + $ 0g D %RC 0 z0 ;
Cz0 ´ C n Sz0 :
Ist dann für z0 eine Bestimmung '0 fest gewählt, also z0 D r0 e i'0 , so gilt für alle z ¤ 0 in C die Darstellung / 1 z : (1) z D jzje iˆz0 .z/ mit ˆz0 .z/ ´ '0 C Arg z0 Dabei ist ˆz0 .z/ eindeutig bestimmt durch die Forderung '0 %' < ˆz0 .z/ 0 '0 C'. In der geschlitzten Ebene Cz0 ist dann ˆz0 wieder stetig, und speziell für z0 2 Cz0 gilt ˆz0 .z0 / D '0 . Somit existiert in jeder geschlitzten Ebene Cz0 wiederum eine stetige Bestimmung ˆz0 des Winkelarguments. Auf dem Schlitz Sz0 selbst ist aber auch dieses ˆz0 unstetig. In die Bezeichnung von ˆz0 müsste eigentlich noch das fest gewählte '0 aufgenommen werden. Darauf wollen wir jedoch verzichten, um die Symbolik nicht zu überlasten. Falls erforderlich, soll die Wahl von '0 (mit z0 D jz0 j e i'0 ) im Text spezifiziert werden. Von diesen „Sprüngen“ der Argumentbestimmung kann man sich befreien, wenn man sich längs eines Weges in C n f0g bewegt, indem man das Argument stetig mitführt.
390
# Ergänzungen zur Topologie
Kapitel 14
Das ist der eigentliche Ausgangspunkt für die Gradtheorie in der Ebene. Da der Betrag in diesen Überlegungen unwesentlich ist, betrachten wir zunächst nur Wege in der ˇ Einheitskreislinie S1 ´ fz 2 C ˇ jzj D 1g. Es sei daran erinnert, dass ein Weg immer als stetig vorausgesetzt wird (Definition A[9.1]). A. Satz. Sei 1 W J ! S1 ein Weg (J - R Intervall mit J ı ¤ ¿), t0 2 J eine feste Stelle und '0 ein fest gewähltes Winkelargument von 1.t0 /, also 1.t0 / D e i'0 . Dann existiert genau eine stetige Funktion g W J ! R mit 1.t/ D e ig.t/
(2)
für alle t 2 J
und
g.t0 / D '0 :
g.t / g W J ! R mit 1.t/ D e i e für alle t 2 J heißt eine Eine stetige Funktion e Anhebung von 1 nach R. Der Name rührt daher, dass e g .t/ im Exponenten der vorangehenden Formel erscheint; er hat aber auch eine anschauliche Bedeutung, die weiter unten erklärt wird. Die zweite Bedingung in (2) hat den Charakter einer Anfangsbedingung. Der Satz sagt also aus, dass 1 genau eine Anhebung mit vorgegebener Anfangsbedingung besitzt.
Beweis von A. Zur Eindeutigkeit: Angenommen, g1 ; g2 sind zwei Anhebungen von 1 mit g1 .t0 / D g2 .t0 /. Wegen e ig1 .t/ D e ig2 .t / gibt es zu jedem t 2 J ein k.t/ 2 Z mit g1 .t/ % g2 .t/ D k.t/ ' 2'. Offensichtlich definiert k.t/ eine stetige Abbildung von J in Z. Eine solche muss aber konstant sein (F(ii)[3.4]). Wegen k.t0 / D 0 folgt dann k.t/ D 0 für alle t 2 J . Zur Existenz: Die Idee ist, den Weg 1 in kleine Teilwege zu zerlegen, die jeweils in einer geschlitzten Ebene liegen, diese mit den zugehörigen stetigen Argumentbestimmungen anzuheben und die einzelnen Anhebungen „oben“, d.h. in R, wieder stetig zusammenzusetzen. Es sei zunächst der Fall behandelt, dass J D Œa; b2 kompakt und t0 D a ist. Wegen der gleichmäßigen Stetigkeit von 1 gibt es eine Zerlegung Z von J Z D ft0 ; t1 ; : : : ; tN g;
a D t0 < t1 < ' ' ' < tN D b;
sodass für jedes k 2 f0; : : : ; N %1g gilt: Ist t 2 Œtk ; tkC1 2, so ist j1.t/%1.tk /j < 2. Aus dieser Ungleichung folgt dann 1.t/ 2 C..tk / ; denn wäre 1.t/ 2 S..tk / , so folgt 1.t/ D %1.tk / und damit j1.t/ % 1.tk /j D j % 21.tk /j D 2. Nun fixiert man stetige Anhebungen ˆ..t0 / ; ˆ..t1 / ; : : : ; ˆ..tN #1 / durch die Anfangsbedingungen ˆ..t0 / .1.t0 // D '0 und induktiv für k D 1; : : : ; N % 1: ˆ..tk / .1.tk // D ˆ..tk#1 / .1.tk //. Man macht also beim nächsten Schritt mit dem Anfangswert weiter, den man im Vorangehenden als Endwert erreicht hat. Dann ist durch g.t/ ´ ˆ..tk / .1.t// für t 2 Œtk ; tkC1 2;
k D 0; : : : ; N % 1
391
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
eine insgesamt stetige Anhebung g W Œa; b2 ! R von 1 mit g.t0 / D '0 gegeben. Analog verfährt man im Falle J D Œa; b2 mit t0 D b (oder man wendet den vorangehenden Fall auf e 1 .t/ ´ 1.a C b % t/ an). Damit sind auch alle Fälle von kompakten Intervallen J mit t0 2 J behandelt. Ist schließlich J nicht kompakt, so kann J durch kompakte Intervalle Œa; b2, die alle t0 enthalten, ausgeschöpft werden. Die für jedes ausschöpfende Intervall definierten Anhebungen setzen sich wegen der bereits bewiesenen Eindeutigkeit zu einer Anhebung auf ganz J zusammen, wobei die Anfangsbedingung bei t0 erhalten bleibt. " Es sei noch festgehalten, was oben beim Eindeutigkeitsbeweis mit herausgekommen ist: A. Zusatz. Je zwei Anhebungen von 1 unterscheiden sich höchstens um ein ganzes Vielfaches von 2'. " Anschaulich gesprochen, wickelt die Funktion t 7! e it die reelle Gerade R auf den Einheitskreis S1 auf, wie wenn R ein Faden wäre, der auf eine Garnrolle aufgewickelt wird. Diese Funktion wird im Folgenden auch so bezeichnet: E W R %! S1 ;
(3)
E.t/ ´ e it :
Dabei kommen natürlich verschiedene Punkte von R auf die gleiche Stelle von S1 zu liegen, nämlich genau dann, wenn ihre Distanz ein natürliches Vielfaches von 2' ist. Zwischen je zwei Punkten von R mit der Distanz 2' ist aber die Abbildung injektiv und auch stetig invertierbar. Denn aus den obigen Überlegungen folgt: B. Lemma. Sei t0 2 R und z0 ´ e i t0 . Dann ist die Einschränkung Ej 2t0 % '; t0 C 'Œ ein Homöomorphismus von 2t0 % '; t0 C 'Œ auf die punktierte Kreislinie S1 n f%z0 g mit der Umkehrung ˆz0 jS1 n f%z0 g von S1 n f%z0 g auf 2t0 % '; t0 C 'Œ. Dabei gilt: ˇ S1 n f%z0 g D S1 \ Cz D fz 2 S1 ˇ jz % z0 j < 2g: 0
Somit wird jedes offene Intervall einer Länge 0 2' durch die Abbildung t 7! E.t/ D e it homöomorph auf einen offenen Teil von S1 abgebildet. " Dass g eine Anhebung von 1 ist, wird oft in dem folgenden Diagramm ausgedrückt: R (4) ✚ J
✚ ✚g ✚ 1
❃ ✚ ✚
✲
E ❄
mit E.'/ ´ e i' :
E g(t)
S1 γ(t)
392
Kapitel 14
# Ergänzungen zur Topologie
Die Gleichung 1.t/ D e ig.t/ für alle t 2 J bedeutet dann, dass 1 D g ı E gilt, das Diagramm also kommutiert. Auch hierdurch ist das Wort „Anhebung“ gerechtfertigt. Die eigentliche Motivierung liegt aber in Folgendem: Wir realisieren R als Schraubenlinie auf dem senkrechten Kreiszylinder des R3 über der Kreislinie S1 . Diese Schraubenlinie sei hier kurz auch „Spirale“ genannt. Der Abbildung E entspricht dann die Projektion der Spiralpunkte auf die Kreispunkte. Es sei nun auf der Spirale ein fester Punkt '0 über 1.t0 / ausgewählt. Dabei bedeutet „über“, dass sich '0 auf 1.t0 / projiziert. Bewegt sich nun 1.t/ von t0 aus auf dem Kreis S1 , so kann man oben auf der Spirale den Punkt g.t/ von '0 aus stetig so mitführen, dass g.t/ immer über 1.t/ liegt. Dadurch ist die Bewegung von g.t/ auf der Spirale eindeutig festgelegt. Auf die Details der Bewegung von 1.t/ auf dem Kreis S1 kommt es dabei nicht an, wenn sie nur stetig erfolgt. Z.B. darf 1.t/ mal umkehren oder den Kreis mehrfach umrunden. Allerdings muss man g.t/ erlauben, auch mehrere „Stockwerke“ der Spirale zu durchlaufen. Während die normale Winkelzählung beim mehrfachen Umrunden durcheinander kommt, erfolgt die Zählung mittels g.t/ stetig und „geordnet“. Die Zählung durch g.t/ ist nicht einfach durch die Position von 1.t/ bestimmt, sondern auch durch den Verlauf der Bewegung von 1.*/ von t0 bis t. Man kann deshalb g.t/ als „historische“ Argumentbestimmung von 1.t/ von t0 ansehen. Dem entspricht die Tatsache, dass die Anhebung wegabhängig ist. Sind 11 ; 12 W Œa; b2 ! S1 zwei Wege mit 11 .a/ D 12 .a/ und 11 .b/ D 12 .b/ und sind g1 ; g2 W Œa; b2 ! R zugehörige Anhebungen mit dem gleichen g1 .a/ D g2 .a/ D '0 , so kann es trotzdem passieren, dass g1 .b/ ¤ g2 .b/ wird! Hat man allerdings zwei Anhebungen g1 ; g2 W J ! R eines und desselben Weges 1 W J ! S1 , so liegen sie in diesem Bild genau übereinander, allenfalls in verschiedenen Stockwerken. Denn der Zusatz A besagt gerade, dass sich g1 und g2 nur um ein ganzes Vielfaches von 2' unterscheiden. Hieraus folgt für je zwei Stellen t; s 2 J : g1 .t/ % g2 .t/ D g1 .s/ % g2 .s/, also (5)
g1 .t/ % g1 .s/ D g2 .t/ % g2 .s/:
Solche Funktionsdifferenzen von Anhebungen sind also unabhängig von der Wahl dieser Anhebungen. C. Definition. Ist 1 W Œa; b2 ! S1 ein Weg, so ist die Windungszahl von 1 definiert durch wind.1/ ´
g.b/ % g.a/ ; 2'
wobei g W Œa; b2 ! R irgendeine Anhebung von 1 ist.
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
393
Ist 1 zusätzlich geschlossen, d.h. 1.a/ D 1.b/, so ist die Windungszahl eine ganze Zahl, die Umlaufzahl von 1: uml.1/ ´
g.b/ % g.a/ 2 Z: 2'
Wie gesagt, beide Definitionen sind unabhängig von der Wahl der Anhebung, hängen also nur von 1 selbst ab. Dass im geschlossenen Fall g.b/%g.a/ ein ganzes Vielfaches von 2' ist, folgt natürlich einfach aus der Gleichung e ig.a/ D e ig.b/ . Die Windungszahl gibt (auch im nichtgeschlossenen Fall) an, um welchen Bruchteil von 2' sich der Winkel verändert, wenn man – historisch vorgehend – von 1.a/ nach 1.b/ läuft. D. Satz (Additivität der Windungszahl). Ist 1 W Œa; b2 ! S1 ein Weg und Z D ft0 ; t1 ; : : : ; tN g;
a D t0 < t1 < ' ' ' < tN D b
eine Zerlegung von Œa; b2, so gilt wind.1/ D
N X
wind.1jŒtk&1 ; tk 2/:
kD1
Beweis. Dies beruht auf folgender einfacher Tatsache: Ist g W Œa; b2 ! R eine Anhebung von 1, so ist gjŒtk&1 ; tk 2 jeweils eine Anhebung von 1jŒtk&1 ; tk 2. Man braucht ja nur die Gleichung 1 D e ig auf Œtk&1 ; tk 2 einzuschränken. Nun besteht die Teleskopsumme N X .g.tk / % g.tk&1 //; g.b/ % g.a/ D kD1
und daraus folgt durch Division mit 2' die Behauptung.
"
E . Lemma (differenzierbarer Fall). Der Weg 1 W J ! S1 habe die Anhebung g W J ! R. Ist 1 an der Stelle t0 2 J differenzierbar, so ist auch g an der Stelle t0 differenzierbar und 1 1 0 .t0 / g 0 .t0 / D : i 1.t0 / Ist 1 von der Klasse C k mit einem k $ 1, so ist auch g von der Klasse C k , und es gilt für t; s 2 J : Z 1 t 1 0 .*/ g.t/ % g.s/ D d *: i s 1.* /
394
Kapitel 14
# Ergänzungen zur Topologie
Wird speziell für festes s D t0 2 J die Anfangsbedingung g.t0 / D '0 verlangt (wobei 1.t0 / D e i'0 ), so ist die eindeutig bestimmte Anhebung aus Satz A explizit berechenbar in der Form Z 1 t 1 0 .*/ (6) g.t/ D '0 C d *: i t0 1.*/ Ist der C k -Weg vom Typ 1 W Œa; b2 ! S1 (k $ 1), so gilt für die Windungszahl die Integraldarstellung (W)
1 wind.1/ D 2' i
Z
b
a
1 0 .t/ dt 1.t/
und im geschlossenen Unterfall 1.a/ D 1.b/ genauso für die Umlaufzahl (D)
uml.1 / D
1 2' i
Z a
b
1 0 .t/ dt: 1.t/
Beweis. Der Grund ist, dass die Abbildung E in großen Bereichen durch die obigen Abbildungen ˆz0 invertiert wird, wobei jedes solche ˆz0 in der zugehörigen geschlitzten Ebene von der Klasse C 1 ist (ausweislich der Formeln in (1) und E[7.2]). Tatsächlich gilt für t0 ; t 2 J , solange j1.t/ % 1.t0 /j < 2 ist, g.t/ D ˆ..t0 / .1.t//: Dabei sei ˆ..t0 / zum Anfangswert g.t0 / gebildet. Diese Formel beweist alle Behauptungen über die Differenzierbarkeit von g. Für die Ableitungen selbst folgt dann aus 1.t/ D e ig.t/ nach der Kettenregel 1 0 .t/ D e ig.t / ' ig 0 .t/ D 1.t/ ' ig 0 .t/ wann immer 1 in t differenzierbar ist. Hieraus ergibt sich durch Umstellen (7)
g 0 .t/ D
1 1 0 .t/ ' ; i 1.t/
und daraus folgen die restlichen Formeln mittels des Hauptsatzes der Differential- und Integralrechnung. " Die Integraldarstellungen, insbesondere (W) und (D), gelten auch dann, wenn der Weg 1 stückweise von der Klasse C 1 ist. Dies ergibt sich aus der Additivität der Windungszahl (Satz D). Auch bei den weiter unten folgenden Integraldarstellungen sei der Einfachheit halber der C 1 -Fall explizit angesprochen; die Darstellungen bestehen aber genauso für Wege, die nur stückweise von der Klasse C 1 sind.
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
395
F. Bemerkungen. (i) In der Schreibweise der komplexen Kurvenintegrale C[9.3] lautet das Integral in (W) und (D) Z b 0 Z dz 1 .t/ dt D : . z a 1.t/ (ii) Die durch Rechnen in C gewonnenen Gleichungen lassen sich natürlich auch in R darstellen: Ist 1.t/ D ..t/ C i3.t/ mit den reellen Komponentenfunktionen .; 3, so entsteht aus (7) (unter Weglassung des Arguments) g 0 D %i ' D %i '
. 0 C i3 0 .. 0 C i3 0 /.. % i3/ 10 D %i ' D %i ' 1 . C i3 . 2 C 32 .. 0 C 33 0 C i..3 0 % . 0 3/ . 2 C 32
also wegen . 2 C 32 D 1 und .. 0 C 33 0 D 0: g 0 D .3 0 % . 0 3: Damit wird aus (6): g.t/ D '0 C
Z
t t0
...* /3 0 .* / % . 0 .* /3.* // d *;
und die Gleichungen (W) und (D) schreiben sich rein reell als Z b 1 (Wr) wind.1/ D ..3 0 % . 0 3/ für 1 W Œa; b2 ! S1 2' a Z b 1 (Dr) ..3 0 % . 0 3/ für 1 W Œa; b2 ! S1 mit 1.a/ D 1.b/: uml.1/ D 2' a Ein geschlossener Weg 1 W Œa; b2 ! S1 mit a < b kann jederzeit periodisch auf ganz R fortgesetzt werden, und zwar mit der Periode L ´ b % a. Die Fortsetzung ist ein auf ganz R definierter Weg, der mit dem gleichen Symbol bezeichnet sei (soweit keine Verwechslungen zu befürchten sind). Die kennzeichnende Eigenschaft der Fortsetzung ist die Periodizitätsbedingung: 1.t C L/ D 1.t/ für alle t 2 R. Diese kann durch vollständige Induktion zu 1.t C kL/ D 1.t/ für alle t 2 R und alle k 2 Z verallgemeinert werden. Eine explizite Darstellung der L-periodischen Fortsetzung ist 3 ht % ai . (8) 1.t/ D 1 t % 'L : L Umgekehrt definiert ein periodischer Weg 1 W R ! S1 mit der Periode L > 0 einen geschlossenen Weg (z.B. 1jŒ0; L2), dessen periodische Fortsetzung gerade 1 selbst ist.
396
Kapitel 14
# Ergänzungen zur Topologie
G. Lemma. Sei 1 W R ! S1 ein periodischer Weg mit der Periode L > 0. Dann gilt für je zwei Restriktionen 11 ´ 1jŒa; b2 und 12 ´ 1 jŒ˛; ˇ2 mit L D b % a D ˇ % ˛ uml.11 / D uml.12 /: Beweis. Sei g W R ! S1 eine Anhebung von 1 W R ! S1 , also g.t/ D e ig.t/ für alle t 2 R. Aus 1.t C L/ D 1.t/ folgt, dass neben g auch t 7! g.t C L/ eine Anhebung von 1 ist. Für t; s 2 R gilt nach (5) g.t/ % g.s/ D g.t C L/ % g.s C L/, also g.t C L/ % g.t/ D g.s C L/ % g.s/. Setzt man t D a und s D ˛, so ergibt sich g.b/ % g.a/ D g.ˇ/ % g.˛/. " Die Abbildungen, die uns jetzt vor allem interessieren, sind die stetigen Selbstabbildungen der Kreislinie: F W S1 ! S1 . Ein solches F kann auf den vorhergehenden Typ zurückgeführt werden, indem man den geschlossenen Weg 1 W Œ0; 2'2 ! S1 mit 1.t/ ´ F .e it / konstruiert. Die 2'-periodische Fortsetzung von 1 ist dann durch die gleiche Formel gegeben und sei gleich mit betrachtet. Aus Definition C und Lemma G folgt unmittelbar, was im Folgenden behauptet wird: H. Definition und Satz. Zu jeder stetigen Abbildung F W S1 ! S1 ist der Abbildungsgrad deg.F / definiert als die Umlaufzahl von t 7! F .e it / auf Œ0; 2'2. Ist f W R ! S1 eine Anhebung von t 7! F .e it / auf R, also F .e it / D e if .t/
für alle t 2 R;
so gilt (9)
deg.F / D
f .t C 2'/ % f .t/ f .2'/ % f .0/ D 2Z 2' 2'
für alle t 2 R:
Der Abbildungsgrad ist also eine ganze Zahl, die der Abbildung F invariant zugeordnet ist (unabhängig von der Wahl einer Anhebung und der Wahl eines Intervalls der Länge 2'). " I. Beispiel. Wie oft kommen bei einer Zeigeruhr der große und der kleine Zeiger zur Deckung? Natürlich sollte man sich auf die Zeit zwischen 0 Uhr (einschließlich) und 12 Uhr (ausschließlich) beschränken, da sich ab 12 Uhr alles wiederholt. Wir werden sehen, dass dies ein Fixpunktproblem für eine Abbildung F W S1 ! S1 ist. Wenn man einen Fixpunktsatz anwendet, der weiter unten behandelt wird, so kann man voraussagen, dass diese Deckung mindestens 11 mal stattfinden wird. Wir wollen hier aber elementar vorgehen und die Zeitpunkte der Deckung gleich mitberechnen.
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
397
When shall we two meet again?
Wir definieren die Abbildung F W S1 ! S1 , die der Position des Stundenzeigers die Position des Minutenzeigers zuordnet. Die Position eines jeden Zeigers sei durch seinen Winkel im Uhrzeigersinn (ausnahmsweise!) von 0 Uhr aus gemessen. Ist dann e it die Position des Stundenzeigers, 0 0 t < 2', so ist die Position des Minutenzeigers e i'12t , also F .e it / D e i'12t . Die zuständige Anhebung gemäß H ist somit gegeben durch f .t/ D 12t, also deg.F / D 12. Tatsächlich umrundet der Minutenzeiger zwölf mal das Zifferblatt innerhalb der zwölf Stunden, die der Stundenzeiger braucht, um das Zifferblatt einmal zu umrunden. Für die Deckungswinkel von Stunden- und Minutenzeiger gilt F .e it / D e it mit 0 0 t < 2'. Es handelt sich also um ein Fixpunktproblem für F . Diese Bedingungen sind äquivalent zu e i'12t D e it ; 0 0 t < 2', also zu 12t D t Ck '2'; k 2 Z; 0 0 t < 2'. Dies bedeutet, äquivalent umgeformt: t D .2'=11/k; k 2 Z; 0 0 t < 2'. Damit diese t in Œ0; 2'Œ liegen, ist notwendig und hinreichend: k 2 f0; 1; : : : ; 10g. Die so gefundenen 11 Winkelwerte entsprechen den Zeitwerten 12 12 2' k' D k; 11 2' 11
mit k D 0; 1; : : : ; 10:
Umgerechnet in Stunden, Minuten und Sekunden sind das die folgenden 11 Zeitpunkte (wobei die Sekunden gerundet sind): 0h 00 000 ; 1h 50 2700 ; 2h 100 5500 ; 3h 160 2200 ; 4h 210 4900 ; 5h 270 1600 ; 6h 320 4400 ; 7h 380 1100 ; 8h 430 3800 ; 9h 490 500 ; 10h 540 3300 : Diese Zeitpunkte verschieben sich also konstant von 0 Uhr an jeweils um etwas mehr 1 als eine Stunde, genau um 1 11 Stunden (gerundet: um 1 Stunde, 5 Minuten und 27 Sekunden). Wie man an diesem Beispiel sieht, ist die in H verwendete Anhebung i. Allg. nicht 2'-periodisch. Tatsächlich gilt nach (9) f .t C 2'/ % f .t/ D 2' ' deg.F /:
398
Kapitel 14
# Ergänzungen zur Topologie
Die Anhebung f erleidet also beim Weiterschreiten um 2' einen Periodenzuwachs um 2' ' deg.F /, der lediglich im Sonderfall deg.F / D 0 verschwindet. Beim mehrfachen Weiterschreiten folgt hieraus mittels vollständiger Induktion (10)
f .t C k ' 2'/ % f .t/ D k ' deg.F / ' 2'
für alle t 2 R und k 2 Z. J. Satz (Eigenschaften des Abbildungsgrads). Betrachtet werden zwei stetige Selbstabbildungen F G S1 %%%%%! S1 %%%%%! S1 : Dann gilt: (i)
deg.G ı F / D deg.G/ ' deg.F /;
(ii)
deg.F / ¤ 0 H) F surjektiv;
(iii) deg.idS1 / D 1; (iv)
F homömorph H) deg.F / D deg.F &1 / 2 f1; %1g.
Beweis. Seien f; g zu F; G gehörende Anhebungen, also F .e it / D e if .t/ ;
G.e it / D e ig.t / ;
sowie n ´ deg.F / und m ´ deg.G/. Zu (i): Hieraus folgt .G ı F /.e it / D G.F .e it // D G.e if .t/ / D e ig.f .t// : Also ist g ı f eine zu G ı F gehörende Anhebung. Damit wird deg.G ı F / D
g.f .0/ C n ' 2'/ % g.f .0// g.f .2'// % g.f .0// D D n ' m; 2' 2'
wobei zum Schluss (10) verwendet wurde. Zu (ii): Nach Voraussetzung gilt jf .2'/ % f .0/j > 2'. Nach dem Zwischenwertsatz enthält das Bild f .Œ0; 2'2/ ein Intervall der Länge > 2'. Also durchläuft e if .t/ für 0 0 t < 2' ganz S1 , und dasselbe gilt dann von F .e it / D e if .t / . Zu (iii): Eine zu idS1 gehörende Anhebung ist wiederum die Identität f .t/ D t , woraus unmittelbar f .2'/ % f .0/ D 2' folgt. Zu (iv): Aus (i) und (iii) folgt, wenn G ´ F &1 gesetzt wird: 1 D deg.F / ' deg.F &1 /, also die Behauptung. "
399
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
K. Beispiel. Sei Fk die Einschränkung der komplexen Potenzfunktion z 7! z k auf S1 (k 2 Z fest), also Fk .e it / D e ikt . Dann ist fk .t/ D kt eine zu Fk gehörende Anhebung, somit deg.Fk / D k. Bei negativen Exponenten k wird also auch deg.Fk / negativ. Offensichtlich hat dies etwas mit der Umkehrung der Orientierung zu tun, worauf weiter unten eingegangen wird. Nicht jede stetige Funktion f gehört zu einer stetigen Selbstabbildung F von S1 als Anhebung. Eine notwendige Bedingung enthält die Gleichung (9). Diese ist tatsächlich auch hinreichend. Es gilt nämlich: L. Lemma. Sei a 2 R und n 2 Z gegeben sowie eine stetige Funktion f W Œa; a C 2'2 ! R mit f .aC2'/ D f .a/Cn'2'. Dann existiert genau eine stetige Abbildung F W S1 ! S1 , für die f eine zugehörige Anhebung ist (und n ist der Abbildungsgrad von F ). Beweis. Um F zu konstruieren, sei zunächst f so auf ganz R stetig fortgesetzt, dass (11)
f .t C 2'/ D f .t/ C n ' 2'
für alle t 2 R:
Das geht einfach durch die Vorschrift f .t C k ' 2'/ ´ f .t/ C k ' n ' 2';
t 2 Œa; a C 2'2;
k 2 Z:
Nun sei F W S1 ! S1 definiert durch (12)
F .e it / ´ e if .t/ ;
und zwar zunächst für t 2 Œa; a C 2'Œ. Wegen (11) gilt dies dann für alle t 2 R. Die Stetigkeit von F an einer Stelle z0 D e it0 ergibt sich so: Für z 2 S1 mit jz % z0 j < 2 sei laut Lemma B z D e it mit einem t 2 2t0 % '; t0 C 'Œ dargestellt, also t D ˆz0 .z/. Aus (12) folgt dann F .z/ D e if .ˆz0 .z//
für jz % z0 j < 2
und damit die Stetigkeit von F insbesondere in z0 . Da jede Abbildung F mit f als zugehörige Anhebung die Gleichung (12) erfüllt, ergibt sich die Eindeutigkeit von F . " Durch die Vorschrift 1.t/ ´ F .e it / haben wir oben in H jeder stetigen Selbstabbildung F von S1 einen geschlossenen Weg in S1 mit dem Definitionsintervall Œ0; 2'2 zugeordnet. Das letzte Lemma enthält im Kern die Umkehrung hiervon, wobei wir gleich von dem speziellen Definitionsintervall absehen können:
400
Kapitel 14
# Ergänzungen zur Topologie
M. Folgerung. Sei 1 W Œa; b2 ! S1 mit a < b ein geschlossener Weg in S1 . Dann existiert genau eine stetige Abbildung F W S1 ! S1 derart, dass für alle t 2 R gilt: 1 / b%a it t : F .e / D 1 a C 2' Hierin bezeichnet 1 zugleich die .b % a/-periodische Fortsetzung von 1 . Es gilt deg.F / D uml.1/: Beweis. Der Weg
/ 1 b%a e 1 .t/ ´ 1 a C t 2'
entsteht aus 1 durch eine affine Umparametrisierung, die bewirkt, dass die Periode nunmehr 2' ist statt b % a. Sei n die Umlaufzahl und f eine Anhebung von 1 : 1.t/ D e if .t / ;
f .b/ % f .a/ D n ' 2':
Dann folgt durch Substitution e 1 .t/ D e wobei
ie f .t/
mit
e.t/ ´ f f
1 / b%a aC t ; 2'
e.2'/ % f e.0/ D f .b/ % f .a/ D n ' 2': f
e ist also eine Anhebung von e f 1 . Nach Lemma L existiert genau eine Abbildung 1 1 it F W S ! S , mit F .e / D e 1 .t/, und F hat den Abbildungsgrad n. " N. Satz (Urbildsatz). Sei F W S1 ! S1 eine stetige Abbildung vom Abbildungsgrad n. Dann besitzt jedes z0 2 S1 mindestens jnj Urbilder in S1 : jF &1 .z0 /j $ j deg.F /j: Beim Abbildungsgrad n D 0 ist die Behauptung leer. Tatsächlich besitzt z.B. eine konstante Abbildung mit Wert c den Abbildungsgrad 0, jedoch für z0 ¤ c kein Urbild von z0 bzw. jeden Punkt als Urbild, falls z0 D c. Beweis von N. Sei f eine zu F gehörende Anhebung: F .e it / D e if .t/ , also f .2'/ % f .0/ D n ' 2': Es reicht, die Behauptung für z0 D 1 nachzuweisen. Denn die Gleichung F .z/ D z0 ist äquivalent zu F .z/=z0 D 1, und die Abbildung z 7! F .z/=z0 hat den gleichen Abbildungsgrad wie F .
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
401
Fall n $ 1: Für z D e it 2 S1 bedeutet die Gleichung F .z/ D 1 äquivalent e if .t / D 1, also f .t/ D k ' 2' für ein k 2 Z. Dabei kann t auf Œ0; 2'Œ eingeschränkt werden. Über das Bild f .Œ0; 2'Œ/ weiß man mit Sicherheit nur, dass es das Intervall Œf .0/ ; f .2'/Œ D Œf .0/; f .0/ C n ' 2'Œ enthält (Zwischenwertsatz). Daher beschränken wir die Urbildsuche auf die t 2 Œ0; 2'Œ mit f .t/ D k ' 2' 2 Œf .0/; f .0/ C n ' 2'Œ für ein k 2 Z. Die Bedingung für k lautet äquivalent: k 2 ŒA; A C nŒ, wobei A ´ f .0/=.2'/. Im Intervall ŒA; A C nŒ gibt es genau n ganze Zahlen (vollständige Induktion), und für jede von ihnen, k, hat die Gleichung f .t/ D k ' 2' eine Lösung in Œ0; 2'Œ. Das ist die Behauptung. Fall n < 0: Mit m ´ %n > 0 lautet die Behauptung: Die Gleichung F .z/ D 1 hat mindestens m Lösungen. Dies kann auf den ersten Fall zurück gespielt werden: Diese Gleichung ist nämlich nach der Substitution w D 1=z äquivalent zu F .1=w/ D 1, ebenfalls für w 2 S1 , da z 7! 1=z die Kreislinie S1 homöomorph auf sich selbst abbildet. Die Abbildung G W S1 2 S1 mit G.w/ ´ F .1=w/ hat als zugehörige Anhebung g.t/ ´ f .%t/, besitzt also den Abbildungsgrad deg.G/ D
f .%'/ % f .'/ g.'/ % g.%'/ D D % deg.F / D m: 2' 2'
Somit existieren für G nach dem ersten Fall mindestens m Urbilder von 1, und dasselbe trifft dann auch für F zu. Denn die beiden Urbildmengen werden durch die komplexe Reziproke z 7! 1=z bijektiv aufeinander abgebildet. " Auf den Gleichungstyp F .z/ D 1 lassen sich auch andere Bestimmungsgleichungen zurückführen. Auf diese Weise erhält man weitere Aussagen, die vom Abbildungsgrad auf die Lösungsmenge schließen lassen, z.B. die folgenden: O. Folgerung (Fixpunktsatz). Eine stetige Abbildung F W S1 ! S1 vom Abbildungsgrad n besitzt mindestens jn % 1j Fixpunkte. Generell versteht man unter einem Fixpunkt einer Selbstabbildung F W X ! X eine Stelle x # 2 X mit F .x # / D x # . Beweis von O. Die Fixpunktgleichung F .z/ D z ist äquivalent zu F .z/=z D 1. Hat F die zugehörige Anhebung f , so besitzt G W S1 ! S1 mit G.z/ ´ F .z/=z die zugehörige Anhebung g.t/ ´ %t C f .t/, also den Abbildungsgrad deg.G/ D
%2' C f .2'/ % f .0/ g.2'/ % g.0/ D D %1 C deg.F / D n % 1: 2' 2'
Nach Satz N hat die Gleichung F .z/=z D 1 mindestens jn % 1j Lösungen in S1 , und dasselbe gilt dann für die Gleichung F .z/ D z. "
402
Kapitel 14
# Ergänzungen zur Topologie
Analog beweist man: P. Folgerung (Antipodensatz). Eine stetige Abbildung F W S1 ! S1 vom Abbildungsgrad n besitzt mindestens jn % 1j Antipodenpunkte, d.h. Lösungen der Gleichung F .z/ D %z. " Besondere Abbildungen sind die, bei denen die Kreislinie „einsinnig“ durchlaufen wird. Das spiegelt sich in den zugehörigen Anhebungen wieder: Q. Definition. Ein Weg 1 W J ! S1 oder eine stetige Abbildung F W S1 ! S1 heiße (streng) monoton wachsend, wenn eine (und damit jede) zugehörige Anhebung (streng) monoton wachsend ist. Entsprechend wird der Begriff (streng) monoton fallend definiert. Statt „streng monoton wachsend“ sagt man auch orientierungstreu, statt „streng monoton fallend“ auch orientierungsumkehrend. Die Unabhängigkeit von der gewählten Anhebung folgt natürlich aus dem Zusatz A. Außerdem kommt es beim Typ F W S1 ! S1 nicht darauf an, ob die Anhebung auf Œ0; 2'2 oder auf ganz R betrachtet wird, wie man mittels (10) erkennt. Im Gegensatz zu den reellen Funktionen gibt es streng monotone Abbildungen dieser Art, die nicht injektiv sind. Diese haben aber eine „Überlagerungseigenschaft“, die im folgenden Satz präzisiert wird. Bei den folgenden Formulierungen verwenden wir Umgebungen, die etwas allgemeiner sind als die bisher verwendeten Ballumgebungen: Ist X ein metrischer Raum und p ein fester Punkt in X, so versteht man unter einer Umgebung von p jede Menge U - X, die einen Ball B.p; r/ enthält. Eine offene Umgebung von p ist dann also eine offene Menge, die p enthält. R. Satz. Die stetige Abbildung F W S1 ! S1 sei streng monoton. Dann ist n ´ deg.F / ¤ 0, und zwar ist n > 0 bzw. n < 0, je nachdem F streng monoton wachsend bzw. streng monoton fallend ist. Sei m ´ jnj gesetzt. Ist m D 1, so ist F homöomorph. Ist m > 1, so gibt es zu jedem w0 2 S1 eine offene Umgebung V von w0 in S1 sowie $ $ m offene Mengen U1 ; : : : ; Um in S1 mit F &1 .V / D U1 [ ''' [ Um derart, dass die Restriktionen F jUj W Uj ! V; j D 1; : : : ; m Homöomorphismen sind. Die letzte Eigenschaft impliziert insbesondere, dass jeder Punkt von S1 genau m Urbilder unter F hat.
403
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
Beweis von R. Sei f eine zu F gehörende Anhebung, also f .2'/ % f .0/ D n ' 2'. Hieraus folgt unmittelbar n > 0 bzw. n < 0, je nachdem f streng monoton wachsend bzw. fallend ist. Wir behandeln die Fälle positiver n weiter. Bei negativem n kann man „spiegelbilde mit F e .z/ ´ F .1=z/ übergehen; denn lich“ argumentieren oder zur Abbildung F diese ist dann monoton wachsend. Fall n D 1: Hier ist f W Œ0; 2'2 ! Œf .0/; f .2'/2 D Œf .0/; f .0/ C 2'2 stetig, streng monoton wachsend und bijektiv, und dasselbe gilt auch für die Umkehrfunktion g W Œf .0/; f .0/ C 2'2 ! Œ0; 2'2 (B[3.6]). Wir definieren einen Kandidaten für die Umkehrabbildung von F indem wir setzen: G.e i' / ´ e ig.' / für f .0/ 0 * 0 f .0/ C 2'. Nach Lemma L ist damit G als stetige Abbildung G W S1 ! S1 wohldefiniert. Weiter berechnet man F ı G.e i ' / D F .e ig.' / / D e if .g.' // D e i' ; G ı F .e it / D G.e if .t/ / D e ig.f .t // D e it : Somit ist F ıG D idS1 und GıF D idS1 , also ist F homöomorph (mit der Umkehrung G). Fall n > 1: Anschaulich gesprochen, umrundet der Bildpunkt F .z/ den Bildkreis n-fach, wenn z den Urbildkreis einmal durchläuft. Die Urbilder der einzelnen Durchläufe des Bildkreises sind „Bogenstücke“ auf dem Urbildkreis, die bis auf ihre Randpunkte homöomorph auf den punktierten Bildkreis abgebildet werden. Die Konstruktion dieser Bogenstücke geschieht indirekt über die Anhebung f und die Zerlegung ihres Bildes in Teilintervalle der Länge 2'. Es folgt die präzise Durchführung: Sei w0 D e i !0 . Man kann wieder annehmen, dass die Anhebung f auf ganz R definiert ist, also dort stetig, streng monoton wachsend und mit R als Bild. Es ist nützlich, das folgende kommutative Diagramm vor Augen zu haben
(13)
E R %%%%%! ? ? fy
S1 ? ? yF
F ı E D E ı f:
E R %%%%%%! S1 Als Erstes wählen wir ein a 2 R mit f .a/ < !0 < f .a/ C 2'. Das ist möglich wegen der o.g. Abbildungseigenschaften von f . Weiter gilt in der linken unteren Ecke des Diagramms (13) f .2a; a C 2'Œ/ D 2f .a/; f .a/ C n ' 2'Œ. Wir betrachten dort die folgenden n Teilintervalle der Länge 2': Jk ´ 2f .a/ C .k % 1/ ' 2'; f .a/ C k ' 2'Œ ;
k D 1; : : : ; n:
404
Kapitel 14
# Ergänzungen zur Topologie
Dann gilt $ $ $ 2f .a/; f .a/ C n ' 2'Œ D J1 [ ''' [ Jn [ ff .a/C1'2'; : : : ; f .a/C.n%1/'2'g:
Wir betrachten außerdem folgende Mengen und Restriktionen des Diagramms (13) (ohne diese neu zu bezeichnen): 2a; a C 2'Œ ? ? f y1
(14)
E %%%%%! 1
S1 n fe ia g
E 2f .a/; f .a/ C n ' 2'Œ %%%%%! S1 n fe if .a/ g µ V Dabei sind die mit „1“ markierten Pfeile Homöomorphismen, der verbleibende Pfeil jedoch nur eingeschränkt auf die Jk : E Jk %%%%%! S1 n fe if .a/ g; 1
(15)
k D 1; : : : ; n:
Weiter definieren wir Intervalle in der linken oberen Ecke von (13): Ik ´ f &1 .Jk / D 2tk&1 ; tk Œ ;
k D 1; : : : ; n;
wobei also gilt t0 D a < t1 < ' ' ' < tn D a C 2'
und f .tk / D f .a/ C k ' 2'; k D 0; : : : ; n:
Die punktierte Kreislinie V aus (14) ist eine offene Umgebung von w0 in S1 , da ja w0 ¤ e if .a/ . Wir wollen zeigen, dass V die Rolle des V aus der Behauptung übernehmen kann. Dazu definieren wir noch auf nahe liegende Weise die in der rechten oberen Ecke von (13) liegenden offenen Mengen Uk ´ E.Ik /;
k D 1; : : : ; n:
Es gilt dann mit zk ´ E.tk /; k D 0; : : : ; n (16)
$ $ $ fz1 ; : : : ; zn&1 g: ''' [ Un [ S1 n fe ia g D U1 [
Für die so definierten V und Uk beweisen wir nun, was behauptet wird: Zunächst ist F jUk W Uk ! V homöomorph: Das folgt aus dem Kommutieren des Diagramms (13), wenn man beide Seiten von F ı E D E ı f auf Ik einschränkt und die Homöomorphismen aus (14) und (15) beachtet. Dann folgt durch Umstellen F jUk D .EjJk / ı .f jIk / ı .EjIk /&1 W Uk ! V; Also sind diese F jUk alle homöomorph.
k D 1; : : : ; n:
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
405
Weiter gilt $ $ F &1 .V / D U1 [ ''' [ Un :
Aus F .Uk / D V folgt bereits F &1 .V / / U1 [ ' ' ' [ Un . Angenommen, die inverse Inklusion ist falsch. Dann gibt es ein z 2 S1 mit F .z/ 2 V , jedoch z … U1 [ ' ' ' [ Un . Nach (16) gilt z D zk für ein k D 0; : : : ; n % 1. Wegen z D E.tk / folgt F .z/ D F .E.tk // D E.f .tk // D E.f .a/ C k ' 2'/ D e if .a/ … V , im Widerspruch zur Voraussetzung. " Dieser Sachverhalt lässt sich auch umkehren. Dazu definieren wir allgemein, was eine „Überlagerung“ ist. S. Definition. Seien X; Y metrische Räume. Eine Abbildung F W X ! Y heißt Überlagerung von Y , falls jeder Punkt y0 2 Y eine offene Umgebung V - Y besitzt, sodass F &1 .V / eine disjunkte Vereinigung von offenen Mengen U( - X, + 2 ƒ ist, von denen jede durch F homöomorph auf V abgebildet wird. Eine solche Umgebung V von y0 wird zulässig genannt, und die U( heißen die Blätter über V . Ist die Familie der Blätter endlich mit der Anzahl m $ 1, so spricht man von einer m-blättrigen Überlagerung. Wenn F aus dem Zusammenhang klar ist, wird X als Überlagerungsraum oder kurz als Überlagerung von Y bezeichnet. Die Indexmenge ƒ unterliegt i. allg. keinen Beschränkungen, sie braucht z.B. nicht abzählbar zu sein. Die Disjunktheit der Blätter soll bedeuten, dass für je zwei Elemente + ¤ +0 der Indexmenge ƒ gilt U( \ U(0 D ¿, insbesondere U( ¤ U(0 . Aus der Definition folgt unmittelbar, dass eine Überlagerung stets surjektiv und stetig ist. Klar ist auch, dass eine zulässige Umgebung V von y0 zugleich zulässige Umgebung von allen y 2 V (mit der gleichen Blätterfamilie) ist. Außerdem gibt es „genauso viele“ Blätter über V wie Urbilder von y0 . Denn man kann eine bijektive Abbildung der Urbildmenge F &1 .y0 / auf die Menge der Blätter über V konstruieren, indem man jedem x 2 F &1 .y0 / das Blatt Ux zuordnet mit x 2 Ux . Zählt man also wie in Definition S die Blätter über V durch eine disjunkte Familie .U( /(2ƒ auf, so besteht eine bijektive Zuordnung von ƒ zur Urbildmenge F &1 .y0 / oder auch zur Urbildmenge F &1 .y/, falls y 2 V . Insbesondere sind je zwei Urbildmengen F &1 .y1 / und F &1 .y2 / von y1 ; y2 2 V hierdurch bijektiv aufeinander abbildbar. Im Falle endlich vieler Blätter über V haben also alle y 2 V die gleiche Anzahl von Urbildern unter F . Diese Anzahl ist somit lokal konstant. Global, d.h. für alle y 2 Y , kann sie noch schwanken, nicht jedoch, wenn Y zusammenhängend ist. Das wird im folgenden Lemma U gezeigt.
406
Kapitel 14
# Ergänzungen zur Topologie
T. Beispiele. (i) Die obige Abbildung E W R ! S1 , E.t/ D e it (3) ist Beispiel für eine „unendlich-blättrige“ Überlagerung. In der Tat ist für E die Definition S erfüllt: Zu z0 2 S1 sei die Umgebung V als der punktierte Kreis V ´ S1 nf%z0 g gewählt, wobei z0 D e i'0 sei. Dann besteht E &1 .V / aus der Vereinigung der Intervalle 2' C .2k % 1/'; ' C .2k C 1/'Œ für k 2 Z, von denen jedes durch E homöomorph auf V abgebildet wird (mit der Restriktion von ˆz0 auf V als Umkehrung); vgl. Lemma B. In diesem Fall gibt es also abzählbar viele Blätter, die mit dem ganzzahligen Parameter k durchnummeriert sind. In dem Bild bei (4) lässt sich die Situation gut veranschaulichen. Im Folgenden ist mit neutraler Bezeichnung eine Abwandlung dieses Bildes reproduziert: Zu einer hervorgehobenen zulässigen Umgebung V sieht man die Urbildmengen U( von V in verschiedenen „Stockwerken“, ebenfalls hervorgehoben. Die Umgebung V ist der Deutlichkeit ziemlich klein gehalten.
F x
Uλ V
y
Wie die obige Diskussion lehrt, könnte man V sehr viel größer wählen, nämlich als „Kreislinie minus einem Punkt“. (ii) Ist n ¤ 0 eine ganze Zahl, so ist die Abbildung z 7! z n , eingeschränkt auf S1 , eine jnj-blättrige Überlagerung von S1 . Das kann man ähnlich wie im vorangehenden Beispiel direkt nachprüfen. Es folgt aber auch aus Satz R; denn eine zugehörige Anhebung ist gegeben durch die streng monotone Funktion f .t/ ´ nt. (iii) Eine 1-blättrige Überlagerung F W X ! Y ist dasselbe wie ein Homöomorphismus. Nach den Homöomorphismen sind Überlagerungen die einfachsten stetigen Abbildungen mit übersichtlichem Urbildverhalten. Das ergibt sich aus der obigen Diskussion und wird durch das nachstehende Lemma U nochmals unterstrichen. Im Folgenden gebrauchen wir die in der Mengenlehre übliche Sprechweise, dass je
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
407
zwei Mengen A und B gleichmächtig genannt werden, wenn es eine bijektive Abbildung von A auf B gibt. U. Lemma. Ist F W X ! Y eine Überlagerung und ist Y zusammenhängend, so sind je zwei Urbildmengen F &1 .y1 / und F &1 .y2 / mit y1 ; y2 2 Y gleichmächtig. e aller y 2 Y deren Beweis. Sei y0 2 Y fest gewählt. Wir betrachten die Menge Y Urbildmenge F &1 .y/ gleichmächtig zu F &1 .y0 / ist. Nach den Vorüberlegungen ist e offene Teilmenge von Y . Ihr Komplement Y n Y e ist aus dem gleichen Grunde Y e D Y. ebenfalls offen in Y . Wegen des Zusammenhangs folgt Y " V. Lemma. Ist F W X ! Y Überlagerung, V eine zulässige Umgebung von y0 2 Y mit den Blättern .U( /(2ƒ , so ist jede offene Umgebung V 0 von y0 mit V 0 - V ebenfalls zulässig, und zwar mit den Blättern .U(0 /(2ƒ , wobei U(0 ´ F &1 .V 0 / \ U( . Beweis. Rein mengenmäßig sieht man, dass F &1 .V 0 / disjunkte Vereinigung der U(0 ist und dass für jedes + 2 ƒ gilt: F .U(0 / D V 0 . Da F jedes U( homöomorph auf V " abbildet, ist auch die Restriktion von F auf U(0 ein Homöomorphismus auf V 0 . Satz R sagt gerade aus, dass eine streng monotone Abbildung F W S1 ! S1 eine Überlagerung ist. Das gilt nun auch umgekehrt: W. Satz. Eine Überlagerung F W S1 ! S1 ist stets streng monoton, also entweder orientierungstreu oder aber orientierungsumkehrend (und es gelten dann alle Folgerungen aus Satz R). Für stetige Abbildungen F W S1 ! S1 sind also die Eigenschaften „Überlagerung“ und „streng monoton“ vollständig äquivalent. Beweis von W. Sei f W R ! R eine zu F gehörende Anhebung. Es ist zu zeigen, dass f injektiv ist. Dann folgt nach A[3.6] die strenge Monotonie von f . Nach O[10.3] reicht der Nachweis, dass f lokal injektiv ist. Dies ergibt sich aus den Überlagerungseigenschaften, und zwar so: Zu gegebenem t0 2 R sei w0 ´ F .e it0 / 2 S1 . Zu w0 sei V eine zulässige Umgebung in S1 bzgl. F und U0 das Blatt über V mit e it0 2 U0 . Dann ist F jU0 W U0 ! V homöomorph. Die Umgebung V kann so klein gewählt werden, dass U0 bzgl. der Überlagerung E zulässige Umgebung von e it0 ist. e 0 das Blatt über U0 bzgl. E mit t0 2 U e 0 . Dann Das geht nach Lemma V. Sei nun U e bildet F ıE die Umgebung U 0 homöomorph auf V ab, und das Gleiche gilt für E ıf . e 0 injektiv. Insbesondere ist f auf U "
408
Kapitel 14
# Ergänzungen zur Topologie
Beliebige Bezugspunkte Ist ein beliebiger fester Punkt z0 2 C gegeben, so betrachten wir einen Weg in C, der z0 nicht trifft: (17)
1 W J ! C n fz0 g
und lassen z0 die Rolle übernehmen, die bisher der Nullpunkt für die Winkelzählung eingenommen hat. Tatsächlich kann man diese Situation auf die vorangehende zurückspielen, indem man zu 1 den folgenden Weg 10 bildet: 10 .t/ ´
1.t/ % z0 : j1.t/ % z0 j
Im
γ(t)
z0
γ0(t) 0
Re
Es wird also der Ortsvektor des Wegpunkts 1.t/ bzgl. z0 gebildet und dieser auf 1 normiert; 10 .t/ ist also der zugehörige Richtungsvektor. So entsteht aus 1 W J ! C n fz0 g der Weg 10 W J ! S1 , auf den die obigen Überlegungen angewendet werden können. Mit 1 ist auch 10 , stetig bzw. differenzierbar bzw. geschlossen (im Fall J D Œa; b2) usw. X. Definition. Die Windungszahl des Wegs 1 W Œa; b2 ! C n fz0 g bzgl. z0 ist die Windungszahl von 10 wind.1I z0 / ´ wind.10 /: Ist speziell 1 geschlossen (1.a/ D 1.b/), so geht diese Windungszahl in die Umlaufzahl von 1 bzgl. z0 über: uml.1I z0 / ´ uml.10 / 2 Z:
409
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
Für eine stetige Abbildung F W S1 ! C n fz0 g wird die Umlaufzahl wieder als die des geschlossenen Wegs 1.t/ ´ F .e it /, t 2 Œ0; 2'2, definiert: uml.F I z0 / ´ uml.1I z0 /: Die anschauliche Bedeutung geht aus dem obigen Bild hervor: Es wird die Drehung des Ortsvektors des Wegpunkts 1.t/ bzgl. z0 beobachtet, und zwar anhand des mitgeführten „Einheitsvektors“ 10 .t/, der sich in gleicher Weise dreht. Die Winkelzählung erfolgt in stetiger Weise mittels einer Anhebung f0 von 10 10 .t/ D
1.t/ % z0 D e if0 .t / : j1.t/ % z0 j
Anschließend wird die Differenz dieser stetigen Winkelbestimmung an den Intervallenden gebildet (und noch durch 2' dividiert): wind.1I z0 / D
f0 .b/ % f0 .a/ : 2'
Es folgen einige Beispiele von Umlaufzahlen mit diversen Bezugspunkten. Die Umlaufzahlen sind jeweils neben diesen vermerkt: 0 -1 1
-1
1
1
-2
-1
-1
1
1 1
2
Die Windungszahl misst, wie oft der Wegpunkt den festen Punkt z0 insgesamt umrundet, d.h. wie oft der Ortsvektor 1.t/ % z0 (oder auch der Richtungsvektor 10 .t/) den vollen Winkel 2' überstreicht, wobei positive und negative Anteile miteinander verrechnet werden. Bei geschlossenen Wegen kommt dabei eine ganze Zahl heraus, eben die Umlaufzahl. Diese kann auch negativ sein. Das bedeutet anschaulich, dass die Umrundung insgesamt im mathematisch negativen Sinne erfolgt. Bei nicht geschlossenen Wegen kann die Windungszahl beliebig reell werden. In einfachen Fällen kann man die Umlaufzahl anhand der Winkel bestimmen, die der Ortsvektor beim Gesamtumlauf überstreicht. Für kompliziertere Situationen gibt es
410
Kapitel 14
# Ergänzungen zur Topologie
weitere Berechnungsmethoden. Hierzu und für Anwendungen sei auf das Buch Dombrowski[1999] verwiesen. Dieses enthält eine Fülle weiterer Aspekte insbesondere geometrischer Natur. Y. Lemma (differenzierbarer Fall). Der geschlossene Weg 1 W Œa; b2 ! C n fz0 g sei von der Klasse C 1 . Dann besteht für die Umlaufzahl die Integraldarstellung (18)
uml.1I z0 / D
1 2' i
Z a
b
1 0 .t/ dt: 1.t/ % z0
Beweis. Der zugehörige Kreisweg 10 hat die Darstellung (argumentfrei geschrieben): 10 D
1 % z0 1 D % ' .1 % z0 / mit % ´ : j1 % z0 j j1 % z0 j
Sowohl % wie auch 10 sind auf Œa; b2 von der Klasse C 1 , und es gilt 1 uml.1I z0 / D uml.10 / D 2' i
(19)
Z a
b
1 00 : 10
Der Integrand berechnet sich als 1 00 %0 10 %0 .1 % z0 / C %1 0 D C D : 10 %.1 % z0 / % 1 % z0 Da
Z a
b
h ib %0 D ln % D 0 a %
ergibt sich aus (19) die Behauptung.
"
Z. Bemerkungen. (i)
In der Schreibweise der komplexen Kurvenintegrale C[9.3] lautet (18) Z 1 dz : uml.1I z0 / D 2' i . z % z0
(ii)
Die Überführung von (18) in rein reelle Gestalt verläuft folgendermaßen: Seien 1.t/ D ..t/ C i3.t/;
z0 D x0 C iy0
die Real/Imaginärteilzerlegungen von 1.t/ und z0 . Dann wird der Integrand von (18): . 0 .. % x0 / C 3 0 .3 % y0 / C i.3 0 .. % x0 / % . 0 .3 % y0 // 1 0 .1 % z 0 / 10 D : D 2 1 % z0 .. % x0 /2 C .3 % y0 /2 j1 % z0 j
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
411
Der Realteil hiervon ist eine vollständige Ableitung, da ... % x0 /2 C .3 % y0 /2 /0 D 2.. % x0 /. 0 C 2.3 % y0 /3 0 ; also verschwindet er bei Integration über Œa; b2, und es verbleibt 1 uml.1I z0 / D 2'
Z a
b
.. % x0 /3 0 % .3 % y0 /. 0 : .. % x0 /2 C .3 % y0 /2
(iii) Die Umlaufzahl uml.1 I z0 / wird häufig auch der Index von 1 bzgl. z0 genannt und dann durch ind.1 I z0 / bezeichnet. Wegen der überaus zahlreichen Bedeutungen des Worts „Index“ in der Mathematik ist diese Terminologie hier vermieden worden.
Aufgaben und Anmerkungen 1. Ist 1 W J ! C n f0g ein C 1 -Weg, und f W J ! R eine Anhebung von 1= j1j, also 1= j1 j D e if , so heißt ! ´ f 0 die Winkelgeschwindigkeit von 1 . Man zeige, dass diese unabhängig von der gewählten Anhebung ist. 2. Ein geschlossener Weg 1 W Œa; b2 ! C, der ganz in einer geschlitzten Ebene Cz0 enthalten ist, hat bzgl. 0 die Umlaufzahl 0. Diese Aussage ist bei dem vorliegenden Aufbau fast selbstverständlich. Denn in Cz0 gilt mit der dort stetigen Funktion ˆz0 die Identität (1), aus der sofort folgt 1.t/ D e if .t / j1.t/j
mit f .t / D ˆz0 .1.t//;
sodass f W Œa; b2 ! R eine zugehörige Anhebung mit f .a/ D f .b/ ist. An dieser wie an manchen anderen Stellen zeigt sich, wie nützlich es von Anfang an war, die eindeutige (und stetige!) Winkelbestimmung gleich in einer geschlitzten Ebene vorzunehmen, statt nur in einer Halbebene. Vgl. R[4.4] und S[4.4]. 3. Die Umkehrung von Satz J(ii) ist nicht richtig: Die Abbildung F W S1 ! S1 mit F .z/ ´ z 2 für Im z $ 0 und F .z/ ´ 1=z 2 für Im z 0 0 ist stetig und surjektiv aber mit Abbildungsgrad deg.F / D 0. 4. Die Verbindungsstrecke zwischen zwei Punkten z0 ¤ z1 in C ist gegeben durch S.z0 ; z1 / D fz0 C *.z1 % z0 / j 0 0 * 0 1g: Vgl. J[10.1]. Zeige: Es gibt eine stetige Abbildung ‰ W C n S.z0 ; z1 / ! C mit z % z1 D e ‰.z/ z % z0
8 z 2 C n S.z0 ; z1 /:
412
Kapitel 14
# Ergänzungen zur Topologie
Hinweis: Zieht man den Hauptwert des komplexen Logarithmus heran (Aufgabe 9[9.3]), so folgt zusätzlich, dass ‰ gewählt werden kann als ‰.z/ D Log
z % z1 : z % z0
Somit ist ‰ nicht nur stetig sondern sogar holomorph wählbar. 5. Sei 1 W Œa; b2 ! C ein geschlossener Weg und S.z0 ; z1 / die Verbindungsstrecke zweier Punkte in C mit S.z0 ; z1 / \ 1.Œa; b2/ D ¿. Mittels Aufgabe 4 beweise man uml.1I z0 / D uml.1I z1 /: Daraus schließe man, dass die Umlaufzahl uml.1 I z/ als Funktion von z in jeder Zusammenhangskomponente von C n 1.Œa; b2/ konstant ist. 6. Für stetige Abbildungen F; G W S1 ! C n f0g beweise man die Regeln uml.F ' GI 0/ D uml.F I 0/ C uml.GI 0/ 1 / F uml I 0 D uml.F I 0/ % uml.GI 0/: G 7. Man beweise das so genannte Poincaré/Bohl-Lemma: Gilt für zwei stetige Abbildungen F; G W S1 ! Cnf0g stets G.z/ … %RC F .z/, so folgt uml.F I 0/ D uml.GI 0/. Lösungshinweis: Man beachte, dass F=G keine Werte auf dem Schlitz S1 annimmt und wende die Aufgaben 2 und 6 an. 8. Sei F W S1 ! C n f0g eine ungerade Abbildung, d.h. es gelte stets F .%z/ 2 %RC F .z/. Man zeige, dass F eine ungerade Umlaufzahl uml.F I 0/ besitzt. Diese ist also stets ¤ 0. Im Falle F .S1 / - S1 folgere man weiter, dass F notwendig surjektiv ist. 9. Die Windungszahl verhält sich bzgl. der Ganzzahligkeit unterschiedlich, je nachdem Wege in S1 oder in einer punktierten Ebene betrachtet werden: a) Sei 1 W Œa; b2 ! S1 ein Weg in der Kreislinie. Zeige: 1 ist dann und nur dann geschlossen, wenn die Windungszahl wind.1 / ganzzahlig ist. b) Sei 1 W Œa; b2 ! C n f0g ein Weg in der punktierten Ebene. Zeige durch Angabe eines Beispiels: Ist die Windungszahl wind.1 I 0/ ganzzahlig, so braucht 1 nicht geschlossen zu sein. 10. Man mache sich klar, dass im Fall eines nicht geschlossenen C 1 -Wegs 1 W Œa; b2 ! C n fz0 g die Windungszahl i. Allg. nicht durch Z b 10 1 2' i a 1 % z0 ausgedrückt werden kann.
Abschnitt 14.2 Globale Winkelfunktionen und Abbildungsgrad
413
11. Man verifiziere folgende Invarianzeigenschaften der Windungszahl (und damit der Umlaufzahl) für einen Weg 1 W Œa; b2 ! C und einen Punkt z0 2 C n 1.Œa; b2/: a) Ähnlichkeitsinvarianz: Ist T W C ! C eine Ähnlichkeit mit der Darstellung T .z/ D Az C B, A 2 C n f0g, B 2 C (D[7.4]), so gilt wind.T ı 1 I T .z0 // D wind.1I z0 /: Für A D 1 ist darin speziell die Translationsinvarianz, für B D 0, jAj D 1 die Drehinvarianz der Windungszahl enthalten. b) Die Spiegelung an der reellen Achse wird durch z 7! z beschrieben. Dafür gilt wind.1I z 0 / D %wind.1I z0 /: c) Ist ' W Œe a; e b2 ! Œa; b2 eine Neuparametrisierung von 1 , so gilt ( wind.1 ı 'I z0 / D
wind.1I z0 /; %wind.1I z0 /;
falls ' monoton wachsend falls ' monoton fallend:
Im ersten Fall spricht man von der Parameterinvarianz der Windungszahl. 12. Die auf einer offenen Kreisscheibe definierte Funktion f W B.c; r/ ! C sei holomorph, und es sei 1 W Œa; b2 ! B.c; r/ ein geschlossener C 1 -Weg. Man beweise für jeden Punkt z 2 B.c; r/ n 1.Œa; b2/: uml.1I z/ ' f .z/ D
1 2' i
Z .
f .&/ d &: &%z
Das ist die so genannte Cauchysche Integralformel für Kreisscheiben. Lösungshinweis: Man zeige mit Hilfe der komplexen Taylor-Entwicklung (G[9.3]), dass für jedes feste z 2 B.c; r/ die Funktion 8 < f .&/ % f .z/ &%z h.&/ ´ : 0 f .z/
für & ¤ z für & D z
in B.c; r/ holomorph ist, und wende sodann auf h den Cauchyschen Integralsatz für Kreisscheiben an (Aufgabe 3[9.3]). Entsprechend dem obigen allgemeinen Hinweis gilt dies alles genauso, wenn 1 nur stückweise von der Klasse C 1 ist. Mit der gleichen Überlegung folgt die Richtigkeit auch bei „unendlichem“ Radius, d.h. wenn B.c; r/ durch C ersetzt wird.
414
Kapitel 14
# Ergänzungen zur Topologie
13. Man beweise: a) Für festes n 2 N definiert die Potenzfunktion z 7! z n eine Überlagerung von C n f0g auf C n f0g mit der Blätterzahl n. b) Die Exponentialabbildung z 7! e z definiert eine unendlich-blättrige Überlagerung von C auf C n f0g. Lösungshinweis: In beiden Fällen kann man als zulässige Umgebung von z0 2 C n f0g die geschlitzte Ebene Cz0 verwenden. 14. Ist 1 W Œa; b2 ! C ein regulärer C 1 -Weg, so definieren die Tangentialvektoren längs 1 eine Abbildung 1 0 W Œa; b2 ! C n f0g. Deren Windungszahl wind.1 0 I 0/ wird die Tangentendrehzahl von 1 genannt. Ist 1 zweimal stetig differenzierbar und außerdem C 1 -geschlossen, so ist die Tangentendrehzahl gleich der Umlaufzahl 1 uml.1 I 0/ D 2' i 0
Z
b
a
1 00 : 10
Ist außerdem die Krümmung ~ von 1 nullstellenfrei, so deduziere man hieraus ˇ ˇ ˇuml.1 0 I 0/ˇ D 1 2'
Z a
b
ˇ ˇ ~ ' ˇ1 0 ˇ :
Das Integral rechts ist die Gesamtkrümmung oder Totalkrümmung von 1. Unter diesen Voraussetzungen ist die Gesamtkrümmung also ein natürliches Vielfaches von 2', insbesondere $ 2'. Hinweis: Die C 1 -Geschlossenheit bedeutet, dass außer 1.a/ D 1.b/ auch noch 1 0 .a/ D 1 0 .b/ gilt. 15. Es gilt der so genannte Umlaufsatz: Ist der stetig differenzierbare Weg 1 W Œa; b2 ! C regulär, C 1 -geschlossen und doppelpunktfrei, so ist seine Tangentendrehzahl gleich 1 oder %1: ˇ ˇ ˇuml.1 0 I 0/ˇ D 1: Da alle Größen eine reelle Bedeutung haben, kann natürlich C durch R2 ersetzt werden. Die Doppelpunktfreiheit bedeutet, dass die Einschränkung von 1 auf Œa; bŒ injektiv ist. Es gilt dann der Jordansche Kurvensatz (vgl. Aufgabe 16). Der (nicht ganz einfach zu beweisende) Umlaufsatz wird in der Differentialgeometrie behandelt. Vgl. z.B. Kühnel[2005]. 16. Der Jordansche Kurvensatz besagt: Ist 1 W Œa; b2 ! R2 ein geschlossener doppelpunktfreier Weg, so besteht das Komplement seines Bildes aus genau zwei Zusammenhangskomponenten, einer beschränkten und einer unbeschränkten, und dieses
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
415
Bild ist der Rand von jeder dieser beiden Zusammenhangskomponenten. Auch dieser Satz ist recht schwierig zu beweisen. Ein Beweis, der sich auf holomorphe Funktionen stützt (Methode von Eilenberg), findet sich bei Dieudonné[1976/1987], Teil 1, Appendix X. Höherdimensionale Verallgemeinerungen existieren unter dem Namen Satz von Jordan/Brouwer. Vgl. Alexander[1978], Theorem 1. 17. Als Zusammenhang zwischen der stetigen Winkelbestimmung ˆ1 mit '0 ´ 0 und dem Hauptwert des komplexen Logarithmus zeige man: Log z D ln jzj C iˆ1 .z/
8 z 2 C1 :
Wegen ˆ1 .z/ D Arg.z/ ist dies nichts anderes als die Gleichung in Aufgabe 9 d)[9.3].
14.3
Vervollständigung – metrische Räume, reelle Zahlen
Ist ein metrischer Raum X nicht vollständig, so gibt es in ihm Cauchy-Folgen, die keinen Grenzwert in X besitzen. Dann besteht der Wunsch, diese „Lücken“ aufzufüllen, also zu X weitere Elemente hinzuzufügen, sodass in dem vergrößerten Raum doch wieder solche Grenzwerte existieren. Das ist tatsächlich möglich durch ein eigentümliches Verfahren, bei dem man sich gewissermaßen „am eigenen Schopf aus dem Sumpf zieht“. Als die neu hinzuzufügenden Elemente nimmt man nämlich kurzerhand die Cauchy-Folgen des Ausgangsraums selbst. Damit der neue Raum nicht zu groß wird, betrachtet man zwei Cauchy-Folgen als äquivalent, wenn die Distanzen gleich indizierter Folgenglieder gegen null konvergieren. Die Elemente x 2 X kann man als Cauchy-Folgen mit konstanten Werten .x; x; : : :/ auffassen und so (nach Äquivalenzklassenbildung) X als Teilmenge der Erweiterung betrachten. Insgesamt entsteht so ein neuer metrischer Raum, der vollständig ist und den Ausgangsraum als dichten metrischen Unterraum enthält. Die präzise Durchführung dieses Plans geschieht am übersichtlichsten in zwei Etappen. Zunächst fasst man alle Cauchy-Folgen in X zu einem neuen Raum Xc zusammen. In diesem kann auf natürliche Weise ein Distanzbegriff eingeführt werden, der allerdings nur eine „Pseudometrik“ darstellt. Das heißt, dass zwei verschiedene Punkte die Distanz null haben können. Davon befreit man sich in einem zweiten Schritt, indem man zwei Elemente der Distanz null miteinander identifiziert. Das Verfahren der Identifikation ist unabhängig vom ersten Schritt und liefert für jeden pseudometrischen Raum X auf kanonischem Wege einen metrischen Raum Xm . Später wird kombiniert, d.h. aus X zuerst Xc gebildet und dann aus Xc schließlich .Xc /m µ Xcm . Wir starten mit dem Begriff des pseudometrischen Raums. Ein solcher Raum erfüllt die gleichen Anforderungen wie ein metrischer Raum, nur ist es erlaubt, dass zwei verschiedene Punkte die Distanz null haben dürfen. Mit anderen Worten:
416
Kapitel 14
# Ergänzungen zur Topologie
A. Definition. Eine Pseudometrik auf der Menge X ist eine Abbildung d W X ( X ! R, die folgenden Regeln genügt : (PD.1)
d.x; y/ D d.y; x/
(PD.2)
d.x; y/ $ 0
(PD.3)
d.x; x/ D 0
(PD.4)
d.x; z/ 0 d.x; y/ C d.y; z/
)
Symmetrie positive Semidefinitheit Dreiecksungleichung.
Das Paar .X; d / heißt dann ein pseudometrischer Raum (ebenso X selbst, wenn d aus dem Zusammenhang klar ist). Die von den metrischen Räumen her vertrauten Sprechweisen werden hier, soweit sinnvoll, beibehalten. Auch die Definitionen für die Konvergenz und die CauchyEigenschaft einer Folge lauten genauso wie im metrischen Fall. Jedoch sind Grenzwerte i. Allg. nicht eindeutig bestimmt! Tatsächlich folgt aus limn!1 xn D x und d.x; y/ D 0 auch limn!1 xn D y, wie man unmittelbar mit der Dreiecksungleichung sehen kann. Beispiele für pseudometrische Räume sind insbesondere die seminormierten Vektorräume, wenn die Metrik durch d.x; y/ ´ kx % yk definiert wird; vgl. O[10.1]. Nun folgt als erster Schritt die Erweiterung eines metrischen Raums durch Hinzunahme aller Cauchy-Folgen: B. Satz. Sei .X; d / ein metrischer Raum und Xc die Menge aller Cauchy-Folgen in X . Für zwei Cauchy-Folgen S; T 2 Xc , S D .sn /n2N und T D .tn /n2N , existiert dann der Grenzwert (1)
dc .S; T / ´ lim d.sn ; tn / 2 R; n!1
und es gilt: (i)
dc ist eine Pseudometrik auf Xc .
(ii)
Wird jeder Punkt x 2 X als die konstante Cauchy-Folge .x; x; : : :/ aufgefasst, so wird X ein metrischer Unterraum von Xc , der dicht in Xc liegt.
(iii) .Xc ; dc / ist vollständig. Beweis. Existenz des Grenzwerts in (1): Die reelle Zahlenfolge .d.sn ; tn //n2N besitzt die CauchyEigenschaft: Dies ergibt sich aus einer Vorausabschätzung, die auf der Dreiecksungleichung beruht. Zunächst gilt d.sn ; tn / % d.sm ; tm / 0 d.sn ; sm / C d.tn ; tm /:
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
417
Da dies richtig bleibt bei Vertauschung von sn mit sm und tn mit tm , gilt auch jd.sn ; tn / % d.sm ; tm /j 0 d.sn ; sm / C d.tn ; tm /: Hieraus liest man die behauptete Cauchy-Eigenschaft ab. Es folgt die Existenz des Grenzwerts in (1). Zu (i): Symmetrie und positive Semidefinitheit von dc ergeben sich direkt durch Grenzübergang aus den entsprechenden Eigenschaften von d , ebenso die Dreiecksungleichung: Ist R D .rn /n2N eine weitere Cauchy-Folge in X, so gilt zunächst d.sn ; tn / 0 d.sn ; rn / C d.rn ; tn /; also für n ! 1:
dc .S; T / 0 dc .S; R/ C dc .R; T /:
Zu (ii): Dass X in der genannten Auffassung metrischer Unterraum von Xc ist, folgt aus der Tatsache, dass für konstante Folgen S D .x; x; : : :/ und T D .y; y; : : :/ gilt: dc .S; T / D d.x; y/. Zur Dichtheit: Ist S 2 Xc sowie ein " > 0 gegeben, so ist eine konstante Folge T D .x; x; : : :/ mit x 2 X anzugeben, sodass dc .S; T / 0 ". Ein solches T gewinnt man aus der Cauchy-Eigenschaft von S; denn diese impliziert die Existenz von N 2 N mit: d.sn ; sm / < " für alle n; m > N . Setzt man also x D sN C1 , so gilt d.sn ; x/ < " für alle n > N , somit dc .S; T / D limn!1 d.sn ; x/ 0 ". Zu (iii): Ist eine Cauchy-Folge .Sk /k2N in Xc gegeben, so ist zu zeigen, dass es ein Element T 2 Xc gibt mit limk!1 dc .Sk ; T / D 0. Da X dicht in Xc ist, reicht es, dies für eine Cauchy-Folge .Sk /k2N in X zu tun. Nachweis dieser Reduktion: Ist eine Cauchy-Folge .Tk /k2N in Xc vorgelegt, so wähle man zu jedem k 2 N ein Sk 2 X mit dc .Tk ; Sk / < 1=k. Dann ist .Tk /k2N CauchyFolge in X , wie aus der Abschätzung dc .Tk ; T` / 0 dc .Tk ; Sk / C dc .Sk ; S` / C dc .S` ; T` /
N :
418
Kapitel 14
# Ergänzungen zur Topologie
Dies zeigt, dass die Folge S ´ .s1 ; s2 ; : : :/ Element von Xc ist. Das so gefundene S erweist sich nun als Grenzwert der Folge .Sk /k2N ; denn es gilt dc .Sk ; S / D liml!1 d.sk ; s` /, und aus (2) ergibt sich, indem man ` ! 1 laufen lässt, lim`!1 d.sk ; s` / 0 " für alle k > N . " Diese Konstruktion ist noch nicht ideal, da der Erweiterungsraum Xc nur pseudonormiert ist. (Zwei verschiedene Cauchy-Folgen können ja die Distanz 0 haben, z.B. wenn sie sich nur in einem Anfangsstück unterscheiden.) Daher kommt jetzt der zweite Schritt: Eine Pseudometrik kann stets auf eine Metrik zurückgeführt werden, indem man Punkte x; y 2 V mit d.x; y/ D 0 identifiziert. Formal läuft das über die Bildung von Äquivalenzklassen: C. Satz. Auf einem pseudometrischen Raum .X; d / sei eine Relation * eingeführt durch x * y () d.x; y/ D 0: Dann gilt: (i)
* ist eine Äquivalenzrelation auf X .
(ii) Sei Xm der Quotientenraum von X modulo *, und zu jedem Punkt x 2 X bezeichne Œx2 seine Äquivalenzklasse. Dann gibt es genau eine Metrik dm auf Xm derart, dass die kanonische Projektion 'm W X ! Xm , x 7! Œx2, eine Isometrie wird, d.h. für alle x; y 2 X gilt: (3)
dm .Œx2; Œy2/ D d.x; y/:
.Xm ; dm / ist also ein metrischer Raum. Beweis. Zu (i): Unmittelbar klar ist die Symmetrie und Reflexivität der Relation aus (PD.1) und (PD.3). Zur Transitivität: Aus d.x; y/ D 0 und d.y; z/ D 0 folgt wegen (PD.4) und (PD.2): d.x; z/ D 0. Zu (ii): Die Forderung der Isometrie legt dm bereits eindeutig fest als dm .Œx2; Œy2/ ´ d.x; y/: Es bleibt zu zeigen, dass diese Definition repräsentantenunabhängig ist und den Metrikaxiomen genügt. Zur Unabhängigkeit: Gilt Œx2 D Œx 0 2 und Œy2 D Œy 0 2, so bedeutet dies d.x; x 0 / D d.y; y 0 / D 0. Hieraus folgt nach (PD.4) d.x; y/ 0 d.x; x 0 / C d.x 0 ; y 0 / C d.y 0 ; y/ D d.x 0 ; y 0 /. Analog folgt d.x 0 ; y 0 / 0 d.x; y/, also d.x; y/ D d.x 0 ; y 0 /. Zur Metrikeigenschaft: Die Symmetrie von dm ist klar aus der von d , ebenso dm .Œx2; Œy2/ $ 0 und dm .Œx2; Œx2/ D 0. Umgekehrt impliziert dm .Œx2; Œy2/ D 0, dass
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
419
x * y, also Œx2 D Œy2 gilt. Schließlich folgt die Dreiecksungleichung für dm direkt " aus der für d . Die Isometrieeigenschaft (3) impliziert unmittelbar den C. Zusatz. Es bestehen die Äquivalenzen: (i)
A dicht in X () 'm .A/ dicht in Xm .
(ii) .X; d / vollständig () .Xm ; dm / vollständig.
"
Wenn wir jetzt einen metrische Raum X gegeben haben, so können wir aus X den vollständigen pseudonormierten Raum Xc der Cauchy-Folgen mit Metrik dc bilden und dann aus Xc durch Identifikation distanzloser Cauchy-Folgen den metrischen Raum Xcm ´ .Xc /m mit Metrik dcm ´ .dc /m . Beim letzten Schritt bleibt nach dem Zusatz zu C die Vollständigkeit erhalten, und das Bild 'm .Xc / ist nunmehr dicht in diesem vollständigen metrischen Raum Xcm . Die Teilmenge 'm .X / ist isometrisches Abbild von X - Xc , kann also letzten Endes mit dem ursprünglichen Raum X identifiziert werden. So ergibt sich durch Kombination der Sätze B und C: D. Folgerung (Existenz der Vervollständigung). Jeder metrische Raum .X; d / kann zu einem vollständigen metrischen Raum .Xcm ; dcm / erweitert werden, in dem X als dichter metrischer Unterraum enthalten ist. " Insgesamt besteht Xcm aus den Äquivalenzklassen von Cauchy-Folgen im ursprünglichen Raum X, wobei zwei solche Cauchy-Folgen S und T äquivalent sind, wenn die Größe (1) verschwindet, also die Distanz gleich indizierter Glieder gegen null konvergiert. Der ursprüngliche metrische Raum X ist jetzt aufzufassen als die Menge der Äquivalenzklassen der konstanten Folgen modulo dieser Relation. Da eine konstante Folge .x; x; : : :/ mit einer Cauchy-Folge S D .s1 ; s2 ; : : :/ (alle Glieder im ursprünglichen Raum X) genau dann äquivalent ist, wenn sn in X gegen x konvergiert, heißt dies: Jedes Elemente x von X (aufgefasst als metrischer Unterraum von Xcm ) ist die Gesamtheit der Folgen im ursprünglichen Raum X, die dort gegen x konvergieren. Ist der Ausgangsraum X schon vollständig gewesen, so konvergieren in ihm alle Cauchy-Folgen und je zwei sind genau dann äquivalent, wenn sie den gleichen Grenzwert haben. Die Punkte der Erweiterung Xcm sind also identifizierbar mit den Punkten des ursprünglichen Raums selbst. Mit anderen Worten: Die Erweiterung von X „ist“ X selbst. Tatsächlich ist auch im allgemeinen Fall die Erweiterung strukturell eindeutig bestimmt, wenn sie vollständig und in ihr der gegebene Raum dicht sein soll: E. Satz (Eindeutigkeit der Vervollständigung). Ist der metrische Raum .X; d / dichter metrischer Unterraum des vollständigen metrischen Raums .Y; dY / und auch des vollständigen metrischen Raums .Z; dZ /, so gibt es genau eine Isometrie F W Y ! Z mit F jX D idX , und F ist bijektiv.
420
Kapitel 14
# Ergänzungen zur Topologie
Beweis. Grenzwerte bzgl. der Metriken dY bzw. dZ seien durch entsprechende Klammerzusätze beim Limeszeichen oder beim Konvergenzpfeil unterschieden. Alle Schritte im folgenden Beweis arbeiten mit dem gleichen einfachen Argument, nämlich dem „Herüberspielen“ der Metriken dY und dZ aufgrund ihrer Gleichheit mit d auf X. Einzigkeit von F Unter Voraussetzung der Existenz ergeben sich die Werte von F zwangsläufig so: Zu gegebenem y 2 Y sei eine Folge .xn / in X mit xn ! y .Y / gewählt. Da eine Isometrie immer stetig ist, folgt hieraus F .xn / ! F .y/ .Z/, also xn ! F .y/ .Z/. Somit gilt notwendig y D lim xn .Y / H) F .y/ D lim xn .Z/; n!1
n!1
was bereits die Einzigkeit von F belegt. Ein solches F ist von alleine surjektiv: Zu gegebenem z 2 Z sei eine Folge .xn / in X mit xn ! z .Z/ gewählt. Dann ist .xn / Cauchy-Folge bzgl. dZ , also auch bzgl dY , da dY und dZ auf X mit d übereinstimmen. Wegen der Vollständigkeit von Y existiert ein y 2 Y mit xn ! y .Y /. Hieraus folgt wieder F .xn / ! F .y/ .Z/, also xn ! F .y/ .Z/. Da Grenzwerte in Z eindeutig bestimmt sind, impliziert dies z D F .y/, d.h. zu z ist das so konstruierte y ein Urbild. Existenz von F Nahe gelegt durch den Einzigkeitsnachweis sei eine Abbildung F W Y ! Z folgendermaßen definiert: Zu y 2 Y sei eine Folge .xn / in X mit xn ! y .Y / gewählt und F .y/ ´ lim xn .Z/ n!1
gesetzt. Damit dies gut geht, ist zu zeigen: a) dieser Grenzwert existiert; b) er ist unabhängig von der gewählten Folge; c) F ist Isometrie; d) F jX D idX . Zu a): .xn / ist Cauchy-Folge bzgl. Y , also auch bzgl. Z. Somit existiert der Grenzwert von .xn / in Z. Zu b): Ist .xn0 / eine weitere Folge in X mit xn0 ! y .Y /, so ist für die Grenzwerte . ´ lim xn .Z/; n!1
. 0 ´ lim xn0 .Z/ n!1
zu zeigen: . D . 0 . Dies folgt aus der Vorausabschätzung dZ .xn ; xn0 / D dY .xn ; xn0 / 0 dY .xn ; y/ C dY .xn0 ; y/: Diese liefert dZ .xn ; xn0 / ! 0, also durch Grenzübergang in Z: dZ ..; . 0 / D 0. Also ist . D . 0 . Zu c): Zu zeigen ist dZ .F .y/; F .y 0 // D dY .y; y 0 / für alle y; y 0 2 Y : Sei für y eine Folge .xn / wie zu Beginn und analog für y 0 eine Folge .xn0 / gewählt. Dann gilt
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
421
dZ .xn ; xn0 / D dY .xn ; xn0 /. Hieraus ergibt sich durch Grenzübergang n ! 1 sofort die Behauptung. Zu d): Liegt y in X, so kann die konstante Folge xn D y verwendet werden. Dann gilt trivial xn ! y .Z/, also ist F .y/ D y. " Die Vervollständigung eines metrischen Raumes X ist also stets möglich und bis auf Isometrie auch eindeutig bestimmt. Man nennt jeden vollständigen metrischen Raum, der X als dichten metrischen Unterraum enthält, eine vollständige Hülle von X. Wegen der Isometrie je zweier vollständiger Hüllen von F kann man in gewissem Sinne auch von der vollständigen Hülle sprechen. Bericht über die Konstruktion von R aus elementaren Zahlbereichen Ganz zu Beginn des ersten Bandes hatten wir der axiomatische Einführung der reellen Zahlen den Vorzug gegeben vor einem möglichen konstruktiven Aufbau. Das hatte gute Gründe. Zu allererst muss man wohl akzeptieren, dass es keine „mathematische Urzeugung“ gibt; irgendwo muss man auf einem Fundament aufbauen, das seinerseits nicht mehr hinterfragt werden kann. Man kann dieses Fundament „tiefer“ legen als bei den reellen Zahlen, hat dann aber die Aufgabe, von dieser tieferen Ebene auf rein logischem Wege zu den reellen Zahlen aufzusteigen. Hierbei erhebt sich die praktische Schwierigkeit, dass dieser Weg ausgesprochen langwierig und ermüdend ist. An seinem Ende ist man vielleicht erschöpft, ohne wesentliche Einsichten gewonnen zu haben, außer der, dass ein solches Vorgehen möglich ist. Die Beschreibung der reellen Zahlen durch Axiome hat demgegenüber den Vorteil, dass man recht zügig zu typisch analytischen Objekten gelangt, wie z.B. den mathematischen Naturkonstanten e und ' oder den elementaren (aber gar nicht so elementar begründbaren) transzendenten Funktionen exp, cos, sin, usw. Andererseits ist die Akzeptanz der Axiome für R doch etwas problematisch, vor allem was die Existenz des Supremums betrifft. Da haben die Grundregeln etwa für die natürlichen Zahlen doch eine andere Überzeugungskraft. Das ist nicht nur psychologisch von Bedeutung. Mathematisch wichtig ist, dass das Axiomensystems der reellen Zahlen keine Widersprüche enthält. Durch den genannten Aufbau der reellen Zahlen aus elementaren Zahlbereichen ist diese Widerspruchsfreiheit auf eine tiefere und einfachere Ebene verschoben, wo sie ohne Zweifel leichter akzeptiert werden kann. Aus diesen Gründen soll hier der Weg von den natürlichen Zahlen über die ganzen und rationalen Zahlen bis zu den reellen Zahlen hin beschrieben werden. Beim Teilstück bis zu den rationalen Zahlen einschließlich wollen wir uns auf eine Skizze beschränken, bei der einige einfache Bestätigungen (handwerklicher Natur) weggelassen werden. Es soll jedoch nicht verschwiegen werden, dass in diesem Zusammenhang Grundlagenfragen auftauchen, die in der mathematischen Logik diskutiert und behandelt werden. Das Teilstück von den rationalen Zahlen zu den reellen Zahlen ist weniger elementar aber für die Analysis von besonderer Bedeutung, weil ohne die dabei zu
422
Kapitel 14
# Ergänzungen zur Topologie
erzielende Vollständigkeit (in der einen oder anderen Form) keine Grenzwerttheorie möglich ist. Dementsprechend soll dieser Teil ausführlich dargestellt werden. Zur Erreichung der Vollständigkeit sind im Laufe der Zeit mehrere Verfahren ersonnen worden: Dedekindsche Schnitte, Intervallschachtelungen, Cauchy-Folgen. Es gibt dabei durchaus Unterschiede im technischen Aufwand. Das liegt zum Teil daran, dass die beiden ersten Verfahren stark auf die Anordnung Bezug nehmen. Bei Verwendung von Cauchy-Folgen ist das weniger ausgeprägt. Außerdem steht die Vervollständigung mittels Cauchy-Folgen in Analogie zur obigen Vervollständigung metrischer Räume. Wir bevorzugen daher diese dritte Art zur Erzeugung der reellen Zahlen. Allerdings kann das Vervollständigungsverfahren metrischer Räume jetzt nicht in direkter Weise, sondern nur dem Prinzip nach genutzt werden. Der Grund ist, dass man beim Start mit rationalen Zahlen die reellen Zahlen ja noch nicht kennt, diese aber in den Begriff des metrischen Raums schon eingehen. Beschreibung der natürlichen Zahlen durch Axiome Als Grundlage für die natürlichen Zahlen seien die Peano-Axiome in moderner mengentheoretischer Fassung verwendet. Danach bilden die natürlichen Zahlen eine Menge N, ausgestattet mit einem Element 1 2 N und einer Abbildung S W N ! N, sodass folgende Eigenschaften erfüllt sind: (P.1) S ist injektiv. (P.2) 1 … S.N/. (P.3) Enthält eine Teilmenge W - N das Element 1 und gilt S.W / - W , so folgt W D N. Die Abbildung S liefert zu jedem n 2 N den Nachfolger S.n/, wobei das besondere Element 1, die Eins, nach (P.2) nicht Nachfolger ist. Die Injektivität besagt, dass je zwei verschiedene natürliche Zahlen auch verschiedene Nachfolger haben. Das Axiom (P.3) ist das Induktionsprinzip. In dem jetzigen Rahmen, wo ja außer N noch keine weiteren Zahlen existieren, spielt dieses Prinzip trotzdem die gleiche Rolle wie früher in Abschnitt 1.2. Ist z.B. jedem n 2 N eine Aussage A.n/ zugeordnet, die in Abhängigkeit von n zunächst wahr oder falsch sein kann, so ist man sicher, dass sie für alle n 2 N wahr ist, wenn sie für n D 1 zutrifft und wenn für alle n 2 N die Implikation A.n/ H) A.S.n// besteht. Man kann also wiederum die Methode der vollständigen Induktion benutzen. Analog ist auch der Rekursionssatz, wie in L[1.2] formuliert, gültig. Dieser dient ja in erster Linie dazu, rekursive Definitionen zu rechtfertigen. Beide Prinzipien werden beim folgenden Aufbau intensiv genutzt. Es sei an dieser Stelle nochmals betont, dass das Wort „Vollständigkeit“ im Zusammenhang mit reellen Zahlen oder metrischen Räumen nichts mit der vollständigen Induktion zu tun hat.
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
423
Die nächste Aufgabe bei den natürlichen Zahlen ist die Konstruktion der Plus- und Malverknüpfungen und der Anordnung. Von diesen ist ja in den Peano-Axiomen gar nicht die Rede; sie müssen wirklich neu erschaffen werden. & Addition in N: Ist m 2 N gegeben, so wird die Summe mCn für n 2 N durch den Induktionsanfang m C 1 ´ S.m/ und den Induktionsschritt m C S.n/ ´ S.m C n/ definiert. & Multiplikation in N: Ist m 2 N gegeben, so wird das Produkt m ' n für n 2 N durch m ' 1 ´ m als Induktionsanfang und m ' S.n/ ´ m ' n C m als Induktionsschritt definiert. (Diese Definition des Produkts macht also schon Gebrauch von der Summe.) Natürlich schreibt man auch m ' n µ mn. & Anordnung in N: Für m; n 2 N gilt m < n genau dann, wenn es ein p 2 N gibt mit m C p D n. Auf der Grundlage dieser Definitionen sind dann die üblichen Rechenregeln in N beweisbar, wenn auch mühselig (und ohne Durchführung hier). In der folgenden Auflistung bezeichnen alle Symbole natürliche Zahlen. Namengebungen seien hier nicht immer wieder reproduziert. Regeln für die Addition: .k C m/ C n D k C .m C n/;
m C n D n C m;
m C k D n C k H) m D n:
Regeln für die Multiplikation: .k ' m/ ' n D k ' .m ' n/; Regel für beide:
m ' n D n ' m;
m ' k D n ' k H) m D n:
k ' .m C n/ D k ' m C k ' n:
Regeln für die Anordnung: Für je zwei Elemente m; n 2 N besteht genau eine der Beziehungen m < n, m D n, n < m. Weiter gilt: k < m; m < n H) k < n;
m < n H) k C m < k C n;
m < n H) m ' k < n ' k: Die eindeutig bestimmte Lösung der Gleichung m C x D n im Fall m < n wird mit n % m (Differenz) bezeichnet. Ferner bedeutet m 0 n, dass m D n oder m < n gilt. Es gilt der Wohlordnungssatz in N, genau wie in K[1.2] formuliert, und auch die Archimedische Eigenschaft in N: Zu m; n 2 N gibt es ein k 2 N mit km > n. Die Archimedische Eigenschaft wurde in Abschnitt 1.2 im Bereich der reellen Zahlen unter Verwendung der Vollständigkeit (Existenz des Supremums) bewiesen. Dass sie
424
Kapitel 14
# Ergänzungen zur Topologie
hier in N alleine aus den Peano-Axiomen folgt, kann man einsehen, indem man eine vollständige Induktion nach n durchführt: Induktionsanfang: Für n D 1 und beliebiges m 2 N gilt .1 C 1/ ' m D m C m > 1, also tut es hier k D 1 C 1 µ 2. Induktionsschluss: Aus der Gültigkeit für ein n 2 N ist die Gültigkeit für den Nachfolger S.n/ D n C 1 zu schließen. Ist m D 1, so tut es k D n C 1; denn .n C 1/ ' 1 > n. Ist m > 1, so existiert nach Induktionsvoraussetzung ein k 2 N mit km > n. Hieraus folgt aber .k C 1/m D km C m > n C m > n C 1. Erzeugung der ganzen Zahlen Hat man erst einmal die natürlichen Zahlen zur Verfügung, so kann man konstruktiv weitermachen, als nächsten Schritt also die ganzen Zahlen erzeugen. Dazu folgende Motivierung: Angenommen für den Augenblick, man habe schon die ganzen Zahlen mit den vertrauten Regeln. Dann tritt jede ganze Zahl als Differenz m % n von natürliche Zahlen m; n auf, allerdings in mannigfacher Weise, nämlich auch als m0 % n0 mit m0 ; n0 2 N und m % n D m0 % n0 . Diese Beziehung kann aber ganz in N ausgedrückt werden, nämlich als mCn0 D m0 Cn. Dadurch wird suggeriert, die ganzen Zahlen als Paare .m; n/ natürlicher Zahlen aufzufassen, wobei zwei solche Paare .m; n/ und .m0 ; n0 / als äquivalent zu betrachten sind, wenn m C n0 D m0 C n gilt. Man kann auch sagen, man ersetzt die Lösung einer Bestimmungsgleichungen der Form x C n D m durch die Daten .m; n/ der Gleichung und drückt anhand der Daten aus, wann je zwei solche Gleichungen dieselben Lösungen haben. Kurz: Statt mit den Lösungen rechnet man mit den Gleichungen selbst. Zur präzisen Durchführung dieser Idee werde im kartesischen Produkt N ( N die Äquivalenzrelation .m; n/ + .m0 ; n0 / W () m C n0 D m0 C n eingeführt und die Menge der ganzen Zahlen definiert als die Menge der zugehörigen Äquivalenzklassen, d.h. als die Quotientenmenge Z ´ .N ( N/= + : Die Äquivalenzklasse von .m; n/ heiße m + n. Man rechnet ohne Mühe nach, dass + wirklich eine Äquivalenzrelation ist, und kann dann Addition, Multiplikation und Anordnung in Z festlegen durch .m + n/ C .m0 + n0 / ´ .m C n/ + .m0 C n0 / .m + n/ ' .m0 + n0 / ´ .mm0 C nn0 / + .mn0 C m0 n/ .m + n/ < .m0 + n0 / W () m C n0 < m0 C n:
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
425
Man bestätigt, dass diese Operationen repräsentantenunabhängig sind und außerdem den analogen Regeln wie oben für die natürlichen Zahlen (Addition, Multiplikation, Anordnung) genügen, bis auf die letzte bei der Anordnung, die gleich besprochen wird. Tatsächlich ist Z aufgrund dieser Regeln eine kommutative Gruppe gegenüber der Addition mit dem Neutralelement 0 ´ 1 + 1 und dem Inversen %.m + n/ ´ n + m. Außerdem gilt m + n > 0 genau wenn m > n, und anstelle der zuletzt ausgeschiedenen Regel tritt .m + n/ < .m0 + n0 /; k + ` > 0 H) .m + n/ ' .k + `/ < .m0 + n0 / ' .k + `/: Aus dem Tatbestand, dass mit m; n stets auch mn eine natürliche Zahle ist, ergibt sich die Nullteilerfreiheit in Z: .m + n/ ' .m0 + n0 / D 0 H) m + n D 0 oder m0 + n0 D 0: Jetzt fehlt natürlich noch, dass die natürlichen Zahlen eigentlich in Z enthalten sein sollten. Das wird durch ein Einbettungsverfahren erreicht, das auch sonst in analogen Situationen angewandt wird. Man konstruiert, kurz gesagt, eine injektive Abbildung des „alten“ Bereichs in den „neuen“, die die relevanten Verknüpfungen respektiert. Dann kann man im neuen Bereich die Bilder der alten Elemente herausnehmen und die so entstandenen Lücken durch die alten Elemente selbst ausfüllen. (Beispiele für dieses Verfahren sind auch schon bei der Einführung der komplexen Zahlen in (4)[7.1] und oben bei der Vervollständigung metrischer Räume aufgetreten.) Hier betrachten wir die speziellen Elemente .n C 1/ + 1 von Z mit n 2 N. Für diese bestätigt man ..m C 1/ + 1/ C ..n C 1/ + 1/ D .m C n C 1/ + 1 ..m C 1/ + 1/ ' ..n C 1/ + 1/ D .mn C 1/ + 1 .m C 1/ + 1 < .n C 1/ + 1 () m < n; d.h. sie verhalten sich bezüglich diese Operationen wie die natürlichen Zahlen, die sie bestimmen. Diese speziellen Elemente sind genau die Elemente > 0 von Z (also genau die positiven Elemente), während die Null gleich 1 + 1 ist und die Elemente < 0 (die negativen Elemente) genau die von der Form %..n C 1/ + 1/ mit n 2 N sind. Außerdem gilt .m C 1/ + 1 D .n C 1/ + 1 () m D n; d.h. die Abbildung n 7! .n C 1/ + 1 von N in Z ist injektiv. Diese Abbildung leistet die genannte Einbettung. Man kann dann gefahrlos schreiben n ´ .n C 1/ + 1 und mit diesen speziellen Äquivalenzklassen rechnen wie mit den natürlichen Zahlen selbst. Auf diese Weise erscheinen die natürlichen Zahlen eingebettet in Z. Da beliebige Elemente von Z mit Hilfe der speziellen Elemente so dargestellt werden können: m + n D ..m C 1/ + 1/ % ..n C 1/ + 1/ D m % n;
426
Kapitel 14
# Ergänzungen zur Topologie
ergibt sich schließlich, dass Z in der vertrauten Weise bzgl. Plus, Mal und Anordnung behandelt werden kann. Insbesondere ist Z die disjunkte Vereinigung $ $ ZDN [ .%N/ [ f0g
aus den natürlichen Zahlen, ihren additiven Inversen und der Null. Die Darstellung der ganzen Zahlen als Äquivalenzklassen von Paaren natürlicher Zahlen spielt dann im Folgenden keine Rolle mehr; sie diente lediglich der Existenzsicherung von Z. Erzeugung der rationalen Zahlen So wie die ganzen Zahlen aus dem Wunsch geboren wurden, beliebige Differenzen natürlicher Zahlen zu bilden, sollen die rationalen Zahlen beliebige Quotienten ganzer Zahlen (mit Nenner ¤ 0) zur Verfügung stellen. Das erste ist eine Umkehrproblem in der additiven Struktur, das zweite in der multiplikativen Struktur. Anstelle bislang undefinierter „Brüche“ betrachten wir analog wie oben Paare ganzer Zahlen, zusammen mit einer Äquivalenzrelation, die die Gleichheit von Brüchen ersetzt. Im Hinblick auf die Anordnung ist es bequemer (und ausreichend) die zweite Komponente dieser Paare nicht nur ¤ 0, sondern > 0 anzunehmen. Im kartesischen Produkt Z ( N werde die Äquivalenzrelation .p; q/ ˛ .p 0 ; q 0 / W () pq 0 D p 0 q eingeführt und die Menge der rationalen Zahlen definiert als die Menge der zugehörigen Äquivalenzklassen, d.h. als die Quotientenmenge Q ´ .Z ( N/= ˛ : Die Äquivalenzklasse von .p; q/ heiße p ˛ q. Wieder rechnet man ohne Mühe nach, dass ˛ wirklich eine Äquivalenzrelation ist, und kann dann Addition, Multiplikation und Anordnung in Q festlegen durch .p ˛ q/ C .p 0 ˛ q 0 / ´ .pq 0 C p 0 q/ ˛ .qq 0 / .p ˛ q/ ' .p 0 ˛ q 0 / ´ .pp 0 / ˛ .qq 0 / .p ˛ q/ < .p 0 ˛ q 0 / W () pq 0 < p 0 q: Man bestätigt, dass diese Operationen repräsentantenunabhängig sind und Q zu einem angeordneten Körper machen. Dabei sind Null- bzw. Einselement gegeben durch 0˛1 bzw. 1 ˛ 1, sowie additives bzw. multiplikatives Inverses zu p ˛ q durch .%p/ ˛ q bzw. durch q ˛ p, falls p > 0 und .%q/ ˛ .%p/, falls p < 0.
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
427
Die Einbettung von Z in Q erfolgt hier durch die injektive Abbildung p 7! p ˛ 1, die die Addition, Multiplikation und Anordnung respektiert, d.h. es gilt für die speziellen Elemente p ˛ 1 mit p 2 Z .p ˛ 1/ C .p 0 ˛ 1/ D .p C p 0 / ˛ 1 .p ˛ 1/ ' .p 0 ˛ 1/ D .pp 0 / ˛ 1 p ˛ 1 < p 0 ˛ 1 () p < p 0 ; Man kann dann gefahrlos schreiben p ´p˛1 und mit diesen speziellen Äquivalenzklassen rechnen wie mit den ganzen Zahlen selbst. Auf diese Weise erscheinen die ganzen Zahlen eingebettet in Q. Da beliebige Elemente von Q mit Hilfe der speziellen Elemente so dargestellt werden können: p˛q D
p˛1 p D ; q˛1 q
ergibt sich schließlich, dass der angeordnete Körper Q in der vertrauten Weise als Menge der Quotienten p=q von in ihm enthaltenen ganzen Zahlen p, q ¤ 0 (auch für q < 0) aufgefasst werden kann. Auch in diesem Fall diente die ÄquivalenzklassenKonstruktion der Existenzsicherung von Q, wird aber im weiteren Verlauf nicht mehr benötigt. Wichtig für die jetzt anstehende Vervollständigung sind noch zwei Punkte. Der erste ist die Archimedische Eigenschaft in Q: Zu r; s 2 Q mit r > 0 existiert stets ein n 2 N mit nr > s. Stellt man r; s als Quotienten ganzer Zahlen dar, so erkennt man leicht, dass dies eine Konsequenz der obigen Archimedischen Eigenschaft in N ist. Der zweite Punkt ist, dass in Q (wie in jedem angeordneten Körper) der Betrag eingeführt werden kann, nämlich durch die gleiche Definition wie in G[1.1]: ( r; falls r $ 0 jrj ´ %r; falls r < 0, und dass dieser die gleichen Eigenschaften besitzt wie sie in H[1.1] aufgezählt sind, insbesondere jr ' sj D jrj ' jsj ; jr C sj 0 jrj C jsj :
428
Kapitel 14
# Ergänzungen zur Topologie
Erzeugung der reellen Zahlen durch Vervollständigung Bei angeordneten Körpern sind zwei Vollständigkeitsbegriffe denkbar: Einmal die Supremumsvollständigkeit („zu jeder nach oben beschränkte Teilmenge existiert eine kleinste obere Schranke“). Zum anderen die Cauchy-Vollständigkeit („jede CauchyFolge ist konvergent“). Wie wir aus Abschnitt 2.3 wissen, braucht keine dieser Eigenschaften erfüllt zu sein. Der Wunsch zur Erweiterung der rationalen Zahlen zu einem vollständigen Körper hat demgemäß zwei Zielrichtungen. Diese braucht man aber nicht getrennt anzugehen. Man kann zuerst die Cauchy-Vollständigkeit erreichen und dann zusammen mit der so genannten Archimedischen Eigenschaft daraus die Supremumsvollständigkeit ableiten. Das Verfahren, aus Q einen Cauchy-vollständigen Körper zu produzieren, ist nicht wie bei vorangehenden Schritten motiviert durch algebraische Umkehrprobleme, sondern durch das Konvergenzproblem bei Folgen. Es gibt eben sehr einfache Cauchy-Folgen in Q, die in Q keinen Grenzwert besitzen, und diesen Mangel will man durch „Auffüllung der Lücken“ beseitigen. Die Lösung besteht wieder darin „sich am eigenen Schopf aus dem Sumpf zu ziehen“, indem man die Gesamtheit der Cauchy-Folgen in Q einführt und daraus durch geeignete Konstruktionen einen Q umfassenden Körper gewinnt, in dem dann jede Cauchy-Folge konvergiert. Das Grundmuster dafür ist dasselbe wie oben bei der Vervollständigung metrischer Räume, unterscheidet sich aber in den Details, da metrische Räume bereits die reellen Zahlen voraussetzen würden. Als Erstes konstruiert man die Gesamtheit der rationalen Cauchy-Folgen in Q, genannt Qc , mit geeigneten Festsetzungen von Plus und Mal. Qc bildet dann aber keinen Körper, sondern nur einen Ring mit Einselement, d.h. die Körperaxiome sind erfüllt bis auf die Existenz des multiplikativen Inversen. Daran schließt sich wieder eine Äquivalenzklassen-Bildung, die diesen letztgenannten Mangel behebt (ohne die anderen Eigenschaften zu zerstören). Das Schema dieser zwei Schritte ist Q
rationale %%%%%%%%%%%%! Cauchy-Folgen
Qc
Äquivalenzklassen %%%%%%%%%%%%%%%%%! modulo Nullfolgen
Qc =N µ b R:
„Rationale Cauchy-Folge“ bedeutet nicht nur, dass die Folgenglieder in Q liegen, sondern auch, dass der ."; N /-Test mir rationalen " > 0 zu formulieren ist. N ist die Menge der rationalen Nullfolgen in Q. Beim zweiten Schritt werden zwei Cauchy-Folgen identifiziert, wenn sie sich nur um eine Nullfolge unterscheiden. Diese Konstruktion geht auf Cantor, den Begründer der Mengenlehre, zurück; sie war Vorbild für die (historisch spätere) Vervollständigung metrischer Räume durch Cauchy-Folgen, die eingangs beschrieben wurde.
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
429
F. Definition. Eine Folge .an /n2N in Q heißt rationale Cauchy-Folge, wenn zu jedem rationalen " > 0 ein N 2 N existiert, sodass für alle p; q > N gilt: jap % aq j < ". Da in der folgenden Konstruktion zunächst nur rationale Cauchy-Folgen vorkommen, lassen wir das Attribut „rational“ manchmal weg. Wenn der Unterschied zu gewöhnlichen Cauchy-Folgen bedeutsam wird, muss man natürlich auf die genauere Bezeichnung zurückgreifen. Eine analoge Sprachregelung besteht auch für die rationalen Nullfolgen, deren Rolle weiter unten von Bedeutung sein wird. Wenn nichts anderes vereinbart wird, soll die Indizierung einer Folge mit 1 starten. Eine Folge S D .sn /n2N wird auch durch .s1 ; s2 ; : : :/ bezeichnet. Im Allgemeinen verwenden wir für die Folgenglieder den gleichen kleinen Buchstaben wie für den Großbuchstaben der Folge selbst, schreiben also S D .sn /n2N , T D .tn /n2N usw., ohne dies jedesmal zu explizieren. Genau wie in H[2.6], Punkt 2) des dortigen Beweises sieht man zunächst: G. Lemma. Jede rationale Cauchy-Folge ist in Q beschränkt.
"
H. Satz. Werden rationale Cauchy-Folgen indexweise addiert und multipliziert, so bilden sie einen kommutativen Ring Qc mit Einselement, d.h. alle Körperaxiome bis auf die Existenz des multiplikativen Inversen sind erfüllt. Qc enthält Q in Gestalt der konstanten Elemente .r; r; : : :/ mit rationalen Gliedern. Beweis. Die indexweisen Verknüpfungen bedeuten natürlich S C T ´ .sn C tn /n2N ;
S ' T ´ ST ´ .sn ' tn /n2N :
Wichtig ist vor allem, dass diese Operationen nicht aus Qc herausführen, dass also mit S und T auch S C T und S T wieder Cauchy-Folgen sind (Abgeschlossenheit). Bei der Summe beruht dies auf der Vorausabschätzung ˇ ˇ ˇ ˇ ˇ ˇ ˇ.sp C tp / % .sq C tq /ˇ 0 ˇsp % sq ˇ C ˇtp % tq ˇ : Nach Voraussetzung gibt es zu jedem " 2 QC Indizes N1 ; N2 mit ˇ ˇ ˇsp % sq ˇ < "=2 für p; q > N1 ˇ ˇ ˇtp % tq ˇ < "=2 für p; q > N2 : Ist N der größere der beiden Indizes N1 und N2 , so folgt zusammen mit der Vorausabschätzung ˇ ˇ ˇ.sp C tp / % .sq C tq /ˇ < " für p; q > N :
430
Kapitel 14
# Ergänzungen zur Topologie
Beim Produkt beruht die Abgeschlossenheit auf der Umformung sp tp % sq tq D sp tp % sp tq C sp tq % sq tq D sp .tp % tq / C tq .sp % sq /: Ist c1 bzw c2 eine positive (nach Lemma G existierende) Schranke in Q für die jsn j bzw. die jtn j, so ergibt sich hieraus die Vorausabschätzung ˇ ˇ ˇ ˇ ˇ ˇ ˇsp tp % sq tq ˇ 0 c1 ˇtp % tq ˇ C c2 ˇsp % sq ˇ : Nach Voraussetzung gibt es zu jedem " 2 QC Indizes N1 ; N2 mit ˇ ˇ ˇsp % sq ˇ < "=.2c2 / für p; q > N1 ˇ ˇ ˇtp % tq ˇ < "=.2c1 / für p; q > N2 : Ist N wieder der größere der beiden Indizes N1 und N2 , so folgt zusammen mit der Vorausabschätzung ˇ ˇ ˇsp tp % sq tq ˇ < "=2 C "=2 D " für p; q > N : Die genannten Rechenregeln sind sehr leicht indexweise zu überprüfen (was übrigens auch möglich wäre ohne die Cauchy-Eigenschaft). Neutralelement für die Addition bzw. Multiplikation ist die konstante Folge 0 ´ .0; 0; : : :/ bzw. 1 ´ .1; 1; : : :/. Das additive Inverse zu S D .sn /n2N ist %S ´ .%sn /n2N . Ein multiplikatives Inverses kann es nicht geben; denn die von .0; 0; 0; : : :/ verschiedene Cauchy-Folge .1; 0; 0; : : :/ liefert bei Multiplikation mit einem beliebigen Element nie die Folge .1; 1; 1; : : :/. Die Abbildung r 7! .r; r; : : :/ von Q in Qc ist injektiv und respektiert Plus und Mal: .r; r; : : :/ C .s; s; : : :/ D .r C s; r C s; : : :/;
.r; r; : : :/ ' .s; s; : : :/ D .rs; rs; : : :/;
sodass Q einschließlich seiner Operationen wie in den vorangehenden Fällen auch als Teil von Qc erscheint. (Ein Ring kann natürlich sehr wohl eine Teilmenge als Körper enthalten.) " Beim nächsten (und letzten) Schritt muss man dafür sorgen, dass nichtverschwindende Elemente ein multiplikatives Inverses haben. Dazu ist es offenkundig nötig, solche Folgen wie .1; 0; 0; : : :/ daran zu hindern, ungleich null zu sein. Das geschieht durch Äquivalenzklassenbildung modulo der Nullfolgen. Die Nullfolgen sind jedenfalls schon in Qc vorhanden und erfüllen folgende Eigenschaften:
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
431
I. Definition und Satz. Eine Folge .rn /n2N in Q heißt rationale Nullfolge, wenn zu jedem rationalen " > 0 ein N 2 N existiert , sodass für alle n > N gilt: jrn j < ". Für die Menge N der rationalen Nullfolgen gilt: (i)
N ) Qc ;
(ii)
S; T 2 N H) S C T 2 N;
(iii) S 2 Qc ; T 2 N H) ST 2 N. (iv)
Enthält eine rationale Cauchy-Folge eine Teilfolge in N, so gehört sie selbst zu N.
Beweis. Zu (i): Dies besagt: Eine rationale Nullfolge .rn / ist zugleich rationale Cauchy-Folge. Nach Voraussetzung gibt es zu gegebenem rationalen " > 0 ein N 2 N mit: jrn j < "=2 für n > N . Hieraus folgt ˇ ˇ ˇ ˇ ˇ ˇ ˇrp % rq ˇ 0 ˇrp ˇ C ˇrq ˇ < "=2 C "=2 D " für alle p; q > N . Zu (ii) bis (iv): Auch hier handelt sich um sehr einfache Abschätzungsargumente, die völlig analog verlaufen wie früher bei den gewöhnlichen Folgen, und zwar bei (ii) wie in K(ii)[2.1] und bei (iii) wie in I(iii)[2.1], da die rationale Cauchy-Folge S nach Lemma G beschränkt ist. Bei (iv) argumentiert man genau wie früher in G[2.6] (mit der Spezialisierung a D 0). " J. Beispiel. Eine rationalen Nullfolge ist .1=n/n2N , gebildet aus den Reziproken der natürlichen Zahlen. Das ist eine Konsequenz der Archimedischen Eigenschaft in Q: Zu gegebenem " 2 QC gibt es ein N 2 N mit N " > 1. Dann gilt für alle natürlichen n > N erst recht n" > 1, also 1=n < ". Nun können wir die geplanten Äquivalenzklassen bilden und damit das folgende Hauptresultat erzielen: K. Definition und Satz. In der Menge Qc aller rationalen Cauchy-Folgen sei eine Relation * eingeführt durch (4)
S * T W () S % T 2 N:
Dann ist * eine Äquivalenzrelation auf Qc , wobei die Äquivalenzklasse von S 2 Qc gegeben ist durch (5)
S# ´ S C N D fS C R j R 2 Ng:
432
Kapitel 14
# Ergänzungen zur Topologie
Die Quotientenmenge Qc = * werde auch durch b R bezeichnet. In b R seien Addition, Multiplikation und Anordnung eingeführt durch (6) (7) (8)
S# C T# ´ .S C T /# S# ' T# ´ .S T /# S# < T# W () 9 k 2 QC ; N 2 N 8 n > N W tn % sn > k:
Diese Definitionen sind repräsentantenunabhängig und machen b R zu einem angeordneten vollständigen Körper. In diesen ist Q vermöge der injektiven Abbildung (9)
r 7! .r; r; : : :/#
unter Erhaltung der Objekte „Plus“, „Mal“, und „ %k=3 für n > N1 sn % sn0 > %k=3 für n > N2 : Ist N 0 die größte der drei Zahlen N , N1 , N2 , so folgt zusammengenommen tn0 % sn0 > %k=3 % k=3 C k D k=3
für n > N 0 :
3) b R erfüllt die Körperaxiome: Die reinen Rechengesetze (S.1), (S.2), (P.1), (P.2) und das Distributivgesetz (D) aus A[1.1] sind ohne begrifflichen Aufwand nachprüfbar, z.B. bei (D) so: S# .T# C T#0 / D S# .T C T 0 /# D .S.T C T 0 //# D .S T C S T 0 /# D .S T /# C .S T 0 /# D S# T# C S# T#0 : Auch (S.3) und (S.4) sind erfüllt: Neutralelement bzgl. der Addition in b R ist offensichtlich 0 ´ .0; 0; : : :/# D N; die Menge der Nullfolgen. Es ist auch das einzige Neutralelement bzgl. Plus; denn aus S C X * S folgt, dass X eine Nullfolge ist. Inverses zu S# ist offensichtlich %S# ´ .%S /# . Dies ist auch das einzige Inverse; denn aus S C X * 0 folgt X * %S. Analog überlegt man (P.3): Es existiert genau ein multiplikatives Neutralelement, nämlich 1 ´ .1; 1; : : :/# : Für alle S 2 Qc ist ja 1 ' S# D S# . Und gilt S ' X * S für alle S# ¤ 0, so speziell für S D 1, also ist zwangsläufig X * 1. Jetzt fehlt nur noch (P.4), die eindeutige Existenz eines multiplikativen Inversen zu gegebenem S# ¤ 0. Es geht also um die Lösung der Gleichung SX * .1; 1; : : :/. Diese ist äquivalent damit, dass rn ´ sn xn % 1 eine Nullfolge ist. Diese Gleichungen sollten nun eindeutig nach den xn aufgelöst werden, was natürlich nur möglich ist für die n mit sn ¤ 0. Tatsächlich gilt Folgendes:
434
Kapitel 14
# Ergänzungen zur Topologie
Es gibt ein c 2 QC und einen Index N 2 N mit: jsn j > c für n > N . Wäre dies falsch, so existierte eine Teilfolge .snj / von .sn /, die rationale Nullfolge ist. Nach I(iv) wäre dann aber .sn / selbst rationale Nullfolge. Somit können die fraglichen Gleichungen für n > N eindeutig aufgelöst werden mit dem Ergebnis rn 1 C : xn D sn sn Hierin definiert der erste Summand rechts eine Cauchy-Folge aufgrund der Abschätzung ˇ ˇ ˇ ˇ ˇsp % sq ˇ ˇ ˇ1 ˇ ˇ 1 ˇ % ˇ D ˇ ˇ ˇ ˇ 0 1 ˇsp % sq ˇ ; ˇs ˇ 2 ˇsp ˇ ' ˇsq ˇ sq c p und der zweite Summand definiert eine Nullfolge aufgrund der Abschätzung ˇ ˇ ˇ rn ˇ 1 ˇ ˇ 0 jrn j : ˇs ˇ c n Damit ergeben sich als Lösungen der Gleichung SX * .1; 1; : : :/ höchstens die Folgen der Gestalt . 3 1 1 ; ; : : : C .%n /; X D #; #; : : : ; # ; „ ƒ‚ … sN C1 sN C2 N mit beliebigen Einträgen # und mit einer Nullfolge .%n /. Der erste Bestandteil (die große Klammer) ist nach dem Gesagten eine Cauchy-Folge. Umgekehrt sieht man, dass jedes X dieser Form eine Lösung der Gleichung SX * .1; 1; : : :/ ist; man braucht ja nur rn D %n sn zu setzen. Der erste Bestandteil ist dabei keine Nullfolge, weil er, mit S multipliziert, eine Folge ergibt, die nach dem Platz mit der Nummer N die konstanten Einträge 1 aufweist. Die eindeutige Lösung von S# X# D 1 2 b R ist also 3 . 1 1 X# D 0; 0; : : : ; 0 ; ; ; : : : ¤ 0: „ ƒ‚ … sN C1 sN C2 # N Damit ist b R als Körper erkannt. 4) b R erfüllt die Anordnungsaxiome: Wir überprüfen der Reihe nach die Eigenschaften (O.1) bis (O.4) aus D[1.1]. Dabei sind (O.2) bis (O.4) recht einfach, während (O.1) feiner überlegt werden muss. Für die Transitivität (O.2) ist aus S# < T# und T# < T#0 zu deduzieren S# < T#0 : Nach Voraussetzung gibt es k1 ; k2 2 QC und N1 ; N2 2 N mit: tn % sn > k1
für n > N1 ;
tn0 % tn > k2
für n > N2 :
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
435
Ist N der größere der beiden Indizes N1 , N2 , so folgt durch Addition der Ungleichungen tn0 % sn > k1 C k2 für n > N : Für die Monotonie der Addition (O.3) ist aus S# < T# zu folgern .S C T 0 /# < .T C T 0 /# : Nach Voraussetzung gibt es k 2 QC und N 2 N mit tn % sn > k für n > N . Hieraus folgt sofort .tn C tn0 / % .sn C tn0 / > k für n > N . Man kann sagen, die Anordnung ist „translationsinvariant“. Für die Monotonie der Multiplikation (O.4) ist aus S# < T# und 0 < T#0 zu deduzieren S# T#0 < T# T#0 : Nach Voraussetzung gibt es k1 ; k2 2 QC und N1 ; N2 2 N mit: tn % sn > k1 für n > N1 ; tn0 > k2 für n > N2 : Ist N der größere der beiden Indizes N1 , N2 , so folgt für n > N durch Multiplikation der Ungleichungen .tn % sn /tn0 > k1 k2 µ k, also tn tn0 % sn tn0 > k. Bei der Trichotomie (O.1) reicht es wegen der Translationsinvarianz (O.2) zu zeigen, dass für jedes Element P# 2 b R genau eine der Beziehungen 0 < P# , P# D 0, P# < 0 zutrifft. Denn dies kann dann auf T % S µ P angewandt werden. Zunächst zeigen wir: Gilt weder 0 < P# noch P# < 0, so ist P# D 0. Ist ein " 2 QC gegeben, so folgt aus der Cauchy-Eigenschaft von P die Existenz eines N 2 N mit (10)
%"=2 < pn % pm < "=2 für alle n; m > N :
Nun schreibe man (11)
pn D .pn % pm / C pm :
Aus der Ungültigkeit von 0 < P# folgt, dass für alle k 2 QC und N 2 N ein m > N existiert mit pm 0 k. Speziell für k ´ "=2 und das zuvor konstruierte N existiert ein m > N mit pm 0 "=2. Damit folgt aus der rechten Hälfte von (10) und aus (11): pn < "=2 C "=2 D " für alle n > N : Entsprechend folgt aus der Ungültigkeit von P# < 0 und der linken Hälfte von (10) pn > %"=2 % "=2 D %" für alle n > N : Dies zeigt, dass in der Tat P eine Nullfolge ist. Somit ist von den drei genannten Beziehungen mindestens eine erfüllt. Da je zwei sich offensichtlich gegenseitig ausschließen, ist jeweils genau eine gültig. 5) Nun zur Abbildung f W Q ! b R , die durch (9) gegeben ist: f .r/ ´ .r; r; : : :/# :
436
# Ergänzungen zur Topologie
Kapitel 14
Diese Abbildung ist injektiv; denn aus .r; r; : : :/ * .s; s; : : :/ folgt, da die konstante Folge mit Wert r % s Nullfolge sein muss, r D s. Sie respektiert auch Addition, Multiplikation und Anordnung: f .r C s/ D f .r/ C f .s/;
f .rs/ D f .r/f .s/;
r < s () f .r/ < f .s/:
Das folgt unmittelbar aus der Definition der Objekte C, ' und < in b R. Somit ist das Bild c Q ´ f .Q/ ein angeordneter Teilkörper von b R. Die Identifikation von Q mit c Q wird noch ein wenig aufgeschoben, d.h. wir arbeiten b in R vorläufig mit der Kopie c Q von Q. Diese Kopie wird aber bereits die Rolle von Q übernehmen. Damit kann die Kleiner-Relation in b R so ausgedrückt werden: S# < T# ()
9 k 2 QC W .T % S /# > f .k/;
speziell für S D .0; 0; : : :/ die Positivität (12)
0 < T# ()
9 k 2 QC W T# > f .k/:
6) c Q ist dicht in b R , und zwar in folgendem Sinne: Zu jedem S# 2 b R und jedem C " 2 Q existiert ein r 2 Q mit: %f ."/ < S# % f .r/ < f ."/: Zum Nachweis wird die Cauchy-Eigenschaft von S ausgenutzt. Danach existiert zum gegebenen " ein N 2 N mit %" < sn % sm < " für n; m > N : Setzt man r ´ sN C1 , so folgt %" < sn % r < " also
für n > N ;
f .%"/ < f .sn % r/ < f ."/
für n > N :
Da f .sn % r/ D .sn % r; sn % r; : : :/# und .sn % r; sn % r; : : :/ * S % .r; r; : : :/, folgt die Behauptung. 7) Damit kann jetzt ähnlich wie oben bei den metrischen Räumen gezeigt werden: b R ist Cauchy-vollständig. Die Cauchy-Eigenschaft und die Konvergenz einer Folge ..Sk /# /k2N sind natürlich so definiert wie man es in jedem angeordneten Körper tun würde, nämlich:
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
437
..Sk /# /k2N ist Cauchy-Folge, wenn zu jedem Element E# 2 b R mit 0 < E# ein N 2 N derart existiert, dass für alle p; q > N gilt: %E# < .Sp % Sq /# < E# . ..Sk /# /k2N ist konvergent mit dem Grenzwert S# 2 b R , wenn zu jedem Element b E# 2 R mit 0 < E# ein N 2 N derart existiert, dass für alle n > N gilt: %E# < .Sn % S /# < E# . In beiden Fällen reicht es wegen (12), E# von der spezielleren Gestalt E# D f ."/ für " 2 QC anzunehmen. Zum Beweis der Vollständigkeit ist es wie oben bei den metrischen Räumen ausreichend, die gegebene Cauchy-Folge in c Q vorauszusetzen. Das liegt an der Dichtheit c b von Q in R . Nachweis dieser Reduktion: Ist eine Cauchy-Folge ..Tk /# /k2N in b R vorgelegt, so c wähle man zu jedem k 2 N ein .Sk /# 2 Q mit %f .1=k/ < .Tk % Sk /# < f .1=k/: Das ist möglich aufgrund von 6). Um die Cauchy-Eigenschaft von ..Sk /# /k2N nachzuweisen, sei " 2 QC vorgegeben. Wegen der Cauchy-Eigenschaft von ..Tk /# /k2N existiert ein N 2 N mit %f ."=3/ < .Tp % Tq /# < f ."=3/ für p; q > N : Nun schreibt man Sp % Sq D .Sp % Tp / C .Tp % Tq / C .Tq % Sq /: und gewinnt daraus die Abschätzung %f .1=p/ % f ."=3/ % f .1=q/ < .Sp % Sq /# < f .1=p/ C f ."=3/ C f .1=q/ für p; q > N : Da .1=p/p2N eine Nullfolge in QC ist, existiert ein N 0 > N mit: 0 < f .1=p/ < f ."=3/ für p > N 0 . Damit ergibt sich für p; q > N 0 %f ."/ D %f ."=3/ % f ."=3/ % f ."=3/ < .Sp % Sq /# < f ."=3/ C f ."=3/ C f ."=3/ D f ."/; also die gewünschte Cauchy-Eigenschaft von ..Sk /# /k2N . Aus der Konvergenz von ..Sk /# /k2N gegen S# folgt dann auch die Konvergenz von ..Tk /# /k2N gegen S# aufgrund von .Tk % S /# D .Tk % Sk /# C .Sk % S /# :
438
Kapitel 14
# Ergänzungen zur Topologie
Sei also jetzt eine Cauchy-Folge ..Sk /# /k2N in c Q vorgegeben. Jedes .Sk /# ist von der Form .Sk /# D f .sk /, und zu jedem " 2 QC existiert ein N 2 N mit %f ."/ < .Sp % Sq /# < f ."/ für p; q > N : Wegen .Sp % Sq /# D f .sp % sq / folgt daraus %" < sp % sq < " für p; q > N : Die Folge S ´ .s1 ; s2 ; : : :/ ist also eine Cauchy-Folge in Q und damit S# Element von b R . Das so gefundene S# erweist sich nun als Grenzwert der Folge ..Sk /# /k2N . Es besteht nämlich mit der gleichen Bestimmung von N die Abschätzung %f .2"/ < .Sk % S /# < f .2"/ für k > N ; da für k; ` > N gilt %" < sk % s` < ", also sk % s` C 2" > " und 2" % .sk % s` / > ". 8) In b R gilt die Archimedische Eigenschaft: Zu P# mit 0 < P# und S# existiert ein n 2 N mit S# < f .n/ ' P# . O.B.d.A. darf 0 < S# angenommen werden. Dann betrachte man das Element P Q# ´ # : S# Es gilt 0 < Q# . Da die Folge .1=n/n2N nach Beispiel J Nullfolge in Q ist, konvergiert die Folge .f .1=n//n2N in b R gegen 0. Somit existiert ein n 2 N mit f .1=n/ < Q# . Umstellen dieser Gleichung liefert S# < f .n/ ' P# . 9) Nun werde die Einbettung von Q in b R vermöge der Abbildung f wirklich vorgenommen, d.h. man ersetzt jedes Element f .r/ 2 c Q durch r selbst. Wegen der in Punkt 5) beschriebenen Eigenschaften ist dies gefahrlos möglich. b R erscheint dann als angeordneter Körper mit der Archimedischen Eigenschaft, in dem jede Cauchy-Folge konvergiert und der Q als angeordneten Teilkörper enthält. Als solcher kann nun b R weiter behandelt werden; ein Rückgriff auf die Natur seiner Elemente als Äquivalenzklassen von Cauchy-Folgen ist nicht mehr erforderlich. Dementsprechend seien die Elemente von b R wie gewohnt mit einfachen Buchstaben a; b; n; x; y; : : : bezeichnet. Grenzwerte konvergenter Folgen in b R sind übrigens eindeutig bestimmt. Hätte nämlich eine Folge .an /n2N in b R zwei verschiedene Grenzwerte a < b in b R , so gäbe es zu " ´ .b % a/=2 ein N 2 N derart, dass für n > N stets gilt: an % a < " und %" < an % b. Aus diesen beiden Ungleichungen folgte durch Umrechnung an < .a C b/=2 < an , ein Widerspruch. 10) Was jetzt noch fehlt, ist die Existenz der Suprema in b R . Die Konstruktion des Supremums wird vorbereitet durch den entsprechenden Sachverhalt für monotone Folgen:
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
439
Jede monoton wachsende, nach oben beschränkte Folge .an /n2N in b R besitzt einen Grenzwert a 2 b R , und es gilt: an 0 a für alle n 2 N. Das ist eine Konsequenz der Cauchy-Vollständigkeit und der Archimedischen Eigenschaft in b R . Wir schließen folgendermaßen: Nach Voraussetzung gilt mit einer Konstanten c 2 b R: (13)
a1 0 a2 0 ' ' ' 0 c:
Angenommen, .an /n2N ist nicht konvergent, also auch nicht Cauchy-Folge. Dann existiert in b R ein "0 > 0 derart, dass für alle N 2 N Indizes p; q 2 N existieren mit N < p < q und aq % ap $ "0 . Mittels vollständiger Induktion kann man damit eine (natürlich monoton wachsende) Teilfolge .a'.k/ /k2N konstruieren, bei der je zwei aufeinander folgende Glieder einen Abstand $ "0 haben. Zur Vereinfachung der Schreibweise dürfen wir annehmen, dass die Ausgangsfolge bereits diese Eigenschaft besitzt: (14)
anC1 % an $ "0 :
Aus (13) und (14) folgt dann leicht ein Widerspruch zur Archimedischen Eigenschaft. Denn diese Gleichungen implizieren per Teleskopsumme anC1 % a1 D .anC1 % an / C .an % an&1 / C ' ' ' C .a2 % a1 / $ n"0 ; also c % a1 $ anC1 % a1 $ n"0 für alle n 2 N. Wäre für ein n 2 N einmal a < an , so wäre erst recht 0 < an % a 0 am % a für alle m $ n. Setzt man " ´ an % a, so gibt es ein N 2 N mit am % a < an % a für alle m > N . Für die m, die größer als n und N sind, entstünde so ein Widerspruch. Analog gilt natürlich auch: Jede monoton fallende, nach unten beschränkte Folge .an /n2N in b R besitzt einen Grenzwert in b R , und es gilt: a 0 an für alle n 2 N. Damit können wir den Schlussstein setzen, nämlich die Supremumsvollständigkeit von b R beweisen: Ist M eine nichtleere nach oben beschränkte Teilmenge von b R , so existiert das Supremum von M in b R. Es sei c1 2 b R eine obere Schranke von M , also x 0 c1 für alle x 2 M . Der Beweis ist konstruktiv in folgender Weise: Ausgehend von c1 und einem beliebigen Element x1 2 M formen wir Paare .xn ; cn / von Punkten xn 2 M und oberen Schranken cn , die sich mit wachsendem n 2 N „aufeinander zu bewegen“. Das Verfahren gründet sich auf die folgende Beobachtung:
440
Kapitel 14
# Ergänzungen zur Topologie
Ist c obere Schranke von M und x 2 M , so existiert eine obere Schranke c 0 von M und ein x 0 2 M mit x 0 x0 0 c0 0 c
und c 0 % x 0 0
1 .c % x/: 2
Beim Nachweis kann man annehmen, dass x < c; denn für x D c (c ist dann bereits Supremum, nämlich Maximum von M ) kann man einfach c 0 ´ c und x 0 ´ x verwenden. Sei m die Mitte zwischen x und c, d.h. m´
1 .c C x/: 2
Ist m obere Schranke von M , so leisten c 0 ´ m und x 0 ´ x das Verlangte. Ist m nicht obere Schranke von M , so existiert ein y 2 M mit m < y. Dann tun es c 0 ´ c und x 0 ´ y. Nun definiere man die Paare .xn ; cn / induktiv, von .x1 ; c1 / ausgehend, durch .xnC1 ; cnC1 / ´ .xn0 ; cn0 / für n $ 1: Die Folge .cn /n2N ist monoton fallend und durch x1 nach unten beschränkt, also konvergent mit einem Grenzwert s 2 b R . Dieses s ist auch der Grenzwert der monoton wachsenden und durch c1 nach oben beschränkten Folge .xn /n2N . Das ergibt sich aus der Darstellung s % xn D .cn % xn / % .cn % s/; da beide Klammern rechts Nullfolgen darstellen. Bei der zweiten Klammer ist dies aus der Konvergenz der cn gegen s klar, und bei der ersten Klammer ergibt sich aus der Rekursion 0 0 cnC1 % xnC1 0 .cn % xn /=2 durch vollständige Induktion für n 2 N: 0 0 cnC1 % xnC1 0
c 1 % x1 ; 2n
sodass auch diese Klammer eine Nullfolge darstellt. (Man sieht, dass die Paare .xn ; cn / so etwas wie eine „Intervallschachtelung“ definieren, ohne dass von diesem Begriff hier Gebrauch gemacht wird.) Wir zeigen nun: s ist das Supremum von M . Jedenfalls ist s obere Schranke von M . Gäbe es nämlich ein x 2 M mit s < x so folgte aus der Konvergenz der cn gegen s, indem man " ´ x % s wählt, dass ein N 2 N existiert mit: 0 0 cn % s < x % s für alle n > N . Für diese n wäre dann cn < x, im Widerspruch dazu, dass cn obere Schranke von M ist. Das so konstruierte s ist auch die kleinste obere Schranke von M . Existierte nämlich ein s1 < s, das ebenfalls obere Schranke von M ist, so folgte aus der Konvergenz der xn gegen s die Existenz eines N 2 N mit: s1 < xn für n > N (man setze wieder " ´ s % s1 ). Das stünde im Widerspruch dazu, dass s1 obere Schranke von M ist. "
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
441
Mit diesem Resultat ist die Existenz eines angeordneten, supremumsvollständigen Körpers b R gesichert. Genauer gesagt, die Existenz ist auf die Existenz der natürlichen Zahlen als Erfüllungsmenge der Peano-Axiome (und die Mengenlehre) zurückgeführt. Die Menge N, die hier aufgrund der Einbettung von Q in b R automatisch in b R miteingebettet wurde, ist aufgrund der Peano-Axiome die kleinste induktive Teilmenge von b R , also mit der Menge natürlicher Zahlen identisch, die früher auf diese Weise konstruiert wurde. Dasselbe gilt dann auch für die ganzen und rationalen Zahlen. Nachdem man nämlich die Körperoperationen in b R zur Verfügung hat, sind die oben konstruierten ganzen Zahlen diejenigen von der Form m % n mit m; n 2 N und die oben konstruierten rationalen Zahlen diejenigen von der Form p=q mit ganzen Zahlen p; q, wobei q ¤ 0. (Die Bestimmung der natürlichen Zahlen als kleinste induktive Menge ginge übrigens in jedem angeordneten Körper genauso, insbesondere ohne Vollständigkeit im Cauchy- oder Supremumssinne). In Abschnitt 13.6 wurde überdies schon gezeigt, dass je zwei angeordnete supremumsvollständige Körper auf genau eine Weise unter Erhaltung der Objekte C, ', < aufeinander abgebildet werden können. Dabei kam mit heraus, dass dies auch für die jeweils enthaltenen Teilmengen der natürlichen, ganzen und rationalen Zahlen gilt (wieder ohne Verwendung der Vollständigkeit). Diese Mengen sind also letztlich auf der Basis der Peano-Axiome ebenfalls strukturell eindeutig festgelegt. Insgesamt ist damit der Aufbau der reellen Zahlen mit der Axiomatik, wie früher in Kapitel beschrieben, soweit gerechtfertigt, wie dies vernünftigerweise in diesem Rahmen möglich ist. Die Frage nach einer noch weitergehenden Begründung der Basis „Logik, Mengenlehre, Peano-Axiome“ ist durchaus erlaubt, ja ein solches Hinterfragen wird im Rahmen der mathematischen Logik ausführlich behandelt. Das ist allerdings nicht mehr Gegenstand der klassischen Analysis. Für die damit zusammenhängenden Probleme und die sich eröffnende Möglichkeit einer so genannten NichtStandard-Analysis sei auf Ebbinghaus et al.[1992] verwiesen. Aufgaben und Anmerkungen 1. Die Teilbarkeitslehre ganzer Zahlen lässt sich ebenfalls auf den Peano-Axiomen (oder auf dem Prinzip der kleinsten induktiven Menge in R) aufbauen. Die Teilbarkeit ist ein Grundbegriff der Zahlentheorie, einem Gebiet, in dem die Theorie der Primzahlen einen herausragenden Platz einnimmt. Eine b 2 Z heißt Teiler von a 2 Z, wenn ein b # 2 Z existiert mit a D bb # . Man sagt dafür auch, b teile a oder a sei durch b teilbar und schreibt b j a; ein b # dieser Art
werde als Kofaktor von b bezeichnet. Er ist in allen Fällen b ¤ 0 eindeutig bestimmt. b D 0 ist Teiler von a, nur wenn a D 0 ist, und in diesem Fall ist jede ganze Zahl Kofaktor von b. Man zeige, wenn die folgenden Symbole ganze Zahlen bedeuten:
a) Jedes a hat ˙a und ˙1 als Teiler, die so genannten trivialen Teiler. Eine natürliche Zahl p heißt Primzahl, wenn p $ 2 ist und p nur triviale Teiler besitzt. Die
442
Kapitel 14
# Ergänzungen zur Topologie
Folge der Primzahlen startet also wie folgt: 2; 3; 5; 7; 11; 13; 17; 19; : : : : b) c j b; b j a H) c j a. c) b j a; b 0 j a0 H) bb 0 j aa0 . d) cb j ca; c ¤ 0 H) b j a. e) b j a; b j a0 ; m; m0 2 Z H) b j ma C m0 a0 . f)
b j a; a j b H) b D ˙a.
2. Fortsetzung von Aufgabe 1: Wie bei den Polynomen in Abschnitt 3.1 beweise man die so genannte Division mit Rest: Zu a; b mit b ¤ 0 existiert genau ein Paar .q; r/ mit a D qb C r; und 0 0 r 0 jbj % 1: Da die Gleichung in der Form
r a DqC b b geschrieben werden kann, nennt man q den ganzen Anteil, r=b den gebrochenen Anteil und r den Rest der Division a=b. Für b > 0 gilt: hai : qD b
Man zeige weiter: b ist dann und nur dann Teiler von a, wenn der Rest r verschwindet. 3. Eine ganze Zahl n heißt gerade, wenn sie von der Form n D 2m für ein m 2 Z ist, und ungerade, wenn sie von der Form n D 2m C 1 für ein m 2 Z ist. Man zeige: a) n ist genau dann gerade (bzw. ungerade), wenn die Division n=2 den Rest 0 (bzw. 1) hat. b) Daraus schließe man, dass jede ganze Zahl genau eine der beiden Eigenschaften hat. Hinweis: Entsprechend können die ganzen Zahlen in genau q disjunkte Klassen eingeteilt werden, je nachdem sie bei Division mit q 2 N die Reste 0; 1; 2; : : : ; q % 1 lassen. 4. Der größte gemeinsame Teiler g von a; b 2 N ist das größte g 2 N, das sowohl a wie b teilt. Da jeder positive Teiler von a (bzw. b) höchstens gleich a (bzw. b) ist, existiert g eindeutig. Ist der größte gemeinsame Teiler gleich 1, so heißen a; b teilerfremd oder relativ prim. Der größte gemeinsame Teiler g von a; b 2 N könnte im konkreten Fall durch Probieren (oder Primzahlzerlegung) gefunden werden. Ein eleganterer Weg zur Berechnung
Abschnitt 14.3 Vervollständigung – metrische Räume, reelle Zahlen
443
von g ist wie bei den Polynomen (Aufgabe 10[3.1]) der Euklidische Algorithmus: Man setzt a1 ´ a; a2 ´ b und wendet sukzessive Division mit Rest (Aufgabe 2) an, bis schließlich ein Rest verschwindet: a1 D q1 a2 C a3 ; 0 < a3 < a2 a2 D q2 a3 C a4 ;
0 < a4 < a3
:: : as&1 D qs&1 as C asC1 ; 0 < asC1 < as as D qs asC1 : Alle Symbole sind ganze Zahlen, und in den ersten s % 1 Gleichungen verschwinde der Rest noch nicht, d.h. die Zahlen a3 ; : : : ; asC1 sind alle ¤ 0. Die restfreie Division der letzten Zeile muss sich nach endlich vielen Schritten ergeben, weil die Reste, wie rechts angemerkt, positiv sind und monoton fallen. a) Indem man die Gleichungen von unten nach oben verfolgt, zeige man: asC1 ist Teiler von a2 D b und von a1 D a. b) Indem man die Gleichungen von oben nach unten bis zur vorletzten Gleichung verfolgt, zeige man dass alle Reste a3 ; : : : ; asC1 durch a1 ; a2 ausgedrückt werden können, sodass sich schließlich eine Darstellung von asC1 der Gestalt asC1 D aa0 C bb 0 mit ganzen Zahlen b; b 0 ergibt. c) Aus b) deduziere man, dass jeder gemeinsame Teiler von a und b auch Teiler von asC1 ist. asC1 ist somit ein gemeinsamer Teiler von a und b maximaler Größe, also der größte gemeinsame Teiler g von a; b: g D arC1 : d) a; b sind teilerfremd, genau wenn ganze Zahlen a0 ; b 0 existieren mit 1 D aa0 C bb 0 : e) Ist p Primzahl und p j ab, so ist p j a oder p j b. Gilt das auch, wenn p 2 N nicht Primzahl ist? 5. Sei K ein angeordneter Körper. Man beweise die Äquivalenz von (i) und (ii): (i)
K ist supremumsvollständig;
444
Kapitel 14
# Ergänzungen zur Topologie
(ii) K ist Cauchy-vollständig und besitzt die Archimedische Eigenschaft. 6. Man beweise, dass der Körper C der komplexen Zahlen nicht so angeordnet werden kann, dass die Trichotomie erfüllt ist und aus z > 0 und w > 0 stets z C w > 0 und zw > 0 folgt. Lösungshinweis: Man betrachte unter Annahme einer solchen Anordnung die Größe 12 C i 2 .
Literatur (Ergänzungen) Zur linearen Algebra: F. R. Gantmacher[1958]: Matrizenrechnung. I. Allgemeine Theorie: VEB Deutscher Verlag der Wissenschaften Allgemeine Parallel-Literatur: H. Grauert/I. Lieb[1976/1978]: Differential- und Integralrechnung: Springer; I: 1976, II: 1978, III: 1977 H. v. Mangoldt/K. Knopp[1990]: Einführung in die Höhere Mathematik: Hirzel; I IV (IV von F. Lösch) W. Walter[2002/2004]: Analysis: Springer; 1: 2004, 2: 2002 Spezialliteratur und Originalarbeiten: J. Aczél[1966]: Lectures on Functional Equations and their Applications: Academic Press S. Alexander[1978]: Local and global convexity in complete Riemannian manifolds, Pac. J. Math. 76 B. Anger/H. Bauer[1976]: Mehrdimensionale Integration. Eine Einführung in die Lebesguesche Theorie: Sammlung Göschen 2121, de Gruyter E. Artin[1931]: Einführung in die Theorie der Gammafunktion: Teubner S. Bochner[1933]: Integration von Funktionen, deren Werte die Elemente eines Vektorraumes sind, Fundamenta 20, 262-276 L. de Branges[1985]: A proof of the Bieberbach conjecture, Acta Math. 154, 137-152 A. Dold[1972]: Lectures on algebraic topolgy: Springer H. Flanders[1966]: Liouville’s theorem on conformal mapping, J. Math. Mech. 15, 157-161 P. R. Halmos[1974]: Measure theory: Springer
446
Literatur
H. Heuser[2006]: Funktionalanalysis: Teubner J. G. Hocking/G.S. Young[1961]: Topology: Addison-Wesley J. L. Kelley[1975]: General topology: Springer H. Kneser[1966]: Funktionentheorie: Vandenhoeck & Ruprecht W. Kühnel[2005]: Differentialgeometrie: Vieweg J. M. Patin[1989]: A very short proof of Stirlings’s formula, Amer. Math. Monthly 96, 41-42 F. Pukelsheim[2002]: Patins Kurzbeweis von Stirlings Fakultätenformel, DMV-Mitteilungen 2002/2, 35 J. T. Schwartz[1969]: Nonlinear Functional Analysis: Gordon and Breach I. Selimovic[2005]: Foot points and total curvature. Ergebnisberichte angewandte Mathematik Nr. 281: Universität Dortmund I. Selimovic[2007]: Beiträge zu globalen Fragen in der NURBS-Technik: Dissertation Universität Dortmund H. N. Shapiro[1973]: A micronote on a functional equation, Amer. Math. Monthly 80, 1041
Wichtige Symbole Die Ordnung erfolgt nach den Seitenzahlen des ersten Auftretens.
Kapitel 10 1
uCv
Summe (Vektorraum)
1
˛ ' v, ˛v
1
0 u , u=˛ ˛
skalares Vielfaches (Vektorraum) Nullvektor
1
Division mit Skalar (Vektorraum) Norm (Vektorraum)
2
kuk
3
B.r/, B.r/, S.r/
6
L.V; W /, L.V; W /, L.V /, L.V /
Bälle und Sphäre um 0 (Vektorraum) Räume linearer Abbildungen
7
kLkV W
Operatornorm
10
V (W
10
k.v; w/kV W
kartesisches Produkt (Vektorräume) Maximumsnorm (Vektorräume)
15
L.V; W I Z/, L.V; W I Z/
Räume bilinearer Abbildungen
15
kBk
Norm in L.V; W I Z/
17
0
F .a/, .DF /.a/
25
F 0 .a/
30
.0/
F
totale Ableitung Ableitung (als Vektor)
0
00
000
,F ,F ,F ,F
.k/
höhere Ableitungen
35
d kF d k , F dt k dt k jxjm D kxk1 , dm .x; y/
37
jxjb D kxk1 , jxj D kxk2 , jxjm D kxk1
Maximumsnorm, Maximumsmetrik in Rn Normen in Rn
39
hu; vi
Skalarprodukt
39
juj
Norm aus Skalarprodukt
31
höhere Ableitungen (Varianten)
448
Wichtige Symbole
40
kf k1 , kf k2 , kf k1
Normen in C 0 Œa; b2
41
0 Œa; b2 C10 Œa; b2, C20 Œa; b2, C1
44
kxkp
Raum C 0 Œa; b2 mit diversen Normen p-Norm in Rn
46
kf kp
p-Norm in C 0 Œa; b2
46
GL.V /
lineare Gruppe
47
H.z; w/
Hermitesches Skalarprodukt
49
H0 .z; w/, H1 .z; w/ hu; vi#
Real- Imaginärteil von H.z; w/
51
0
induziertes Skalarprodukt
54
F .aI h/
Richtungsableitung
56
.@j F /.a/
partielle Ableitung
57 57
ˇ @F @F ˇˇ .a/, @h @h ˇa ˇ @F ˇˇ @F .a/, , Fxj .a/, Fj .a/ @xj @xj ˇa
Richtungsableitung (Varianten) partielle Ableitung (Varianten)
57
Dj F
partielle Ableitung (Variante)
59
.c1 ; : : : ; cn />
transponiertes n-Tupel
60
Ja .F /
Jacobi-Matrix
61
R
.p;n/
61
F 0 .a/
64
C
r
66
.grad f /a
Gradient
75
Sn&1
79
Rs .h/
Euklidische Einheitssphäre in Rn mit Zentrum 0 Restglied (Taylor-Formel)
80
Tr .h/
homogener Anteil (Taylor-Formel)
82
.f .r/ .a//.h/, f .r/ .aI h/
totale Ableitung r-ter Ordnung
83
.Hf /a .h/
Hesse-Form
83
.Hf /a
Hesse-Matrix
83
.Hf /a .h; k/
Bilinearform zu .Hf /a .h/
85
Raum der .p ( n/-Matrizen Jacobi-Matrix (Variante) Differentiationsklasse
1 X f .r/ .aI h/ rD0
rŠ
Taylor-Reihe
449
Wichtige Symbole
87
j˛j, ˛Š, h˛ , D ˛ f
Größen für Multiindizes
92
G > 0, Q > 0, . . .
98
Dk
Definitheitsbedingungen (Bilinearform, quadratische Form) Abschnittsdeterminante
104
Di1 ;i2 ;:::;ik
Hauptminor
Kapitel 11 105
Cp
Wegkomponente
112
kF k W X %! R
Normabbildung
112
Supremumsgröße
118
kF k1 Z ˇ F .t/ dt ˛ Z ˛ F .t/ dt
orientiertes Integral
120
Lˇ˛ .1 /
Bogenlänge
125
vol.Q/
elementares Quadervolumen
125
voln .Q/, ,.Q/, ,n .Q/ Z F
elementares Quadervolumen
114
126
Integral (bei Stetigkeit)
ˇ
Z 130
Q
Q
F .x1 ; : : : ; xn / dx1 ' ' ' dxn , usw.
134
Tr.F /
134
0
Quaderintegral (bei Stetigkeit) Quaderintegral (bei Stetigkeit) Träger
0
Räume stetiger Abbildungen
135
C .X; V /, K .X; V / Z F
136
kF k1
1-Norm in K10 .Rn /
136
K10 .Rn ; W /
Raum stetiger Abbildungen
Rn
Integral über Rn
mit kompaktem Träger 137
K10 .Rn /, K10 .R/
Spezialfälle von K10 .Rn ; W /
154
Sn
Euklidische Einheitssphäre in Rn
Z 157
Rn
F
Lebesgue/Bochner-Integral
450
Wichtige Symbole
158
,# .A/
äußeres Maß
166
kF k1
1-Halbnorm auf Leb1 .Rn ; W /
166
Leb1 .Rn ; W /
Raum integrierbarer Abbildungen
167
lim Fk D F , Fk %! F
k!1
.L1 /
Normkonvergenz in Leb1 .Rn ; W /
167
Leb1 .Rn /, Leb1 .R/
167
kf k1 Spezialfall von kF k1
168
-J
charakteristische Funktion
180
sup ffk g
punktweises Supremum
181
punktweises Infimum
186
inf ffk g k Z H , kH k1
186
T1 .Rn ; W /
Raum von Treppenfunktionen
188
-A .x/
charakteristische Funktion
189
,.A/
Maß
191
c F .x/
Nullfortsetzung
191
Fb Z
Nullfortsetzung (Variante)
191
k
Rn
M
F
Spezialfälle von Leb1 .Rn ; W /
Integral, Halbnorm in T1 .Rn ; W /
Integral über Teilmenge
191
GM .x/
Abschneidung
192
Leb1 .M; W /, kF k1
Analoga von Leb1 .Rn ; W /, kF k1 für Teilmengen
Z 200 207 211 226
ˇ ˛
Z F,
PA AZ M My0 00
˛
1
F, ...
Integrale auf R metrische Projektion
F
uneigentliches Integral Schnittprojektion
226
M
zweite Projektion
228
Of
Ordinatenmenge
229
n
B .r/
Euklidischer Ball
451
Wichtige Symbole
238
@.ˆ1 ; : : : ; ˆn / @.x1 ; : : : ; xn /
Funktionaldeterminante
239
f ˝g
Tensorprodukt
242
Sn
Standard-Simplex
246
My
Schnitt
Kapitel 12 297
Sk .x/
308
Zg
elementarsymmetrische Funktion Nullstellenmenge
Kapitel 13 316
loc n n Lloc 1 .R ; W /, L1 .R /
316
L1 .Rn ; W /, L1 .Rn /
319
Lp .Rn ; W /, Lp .Rn /
Räume lokal integrierbarer Funktionen Räume integrierbarer Funktionen (Varianten) Lp -Räume
319
kF kp
p-Norm
325
kF k2
Norm in L2 .Rn ; W /
325
hhF; Gii
Skalarprodukt in L2 .Rn ; W /
326
L2 .Rn /
Spezialfall von L2 .Rn ; W /
326
L2 .Rn ; C/
Spezialfall von L2 .Rn ; W /
326
hf; gi
Hermitesches Skalarprodukt in L2 .Rn ; C/
327
Lp .M; W /, Lp .M /
Analoga von Lp .Rn ; W /, Lp .Rn / für Teilmengen
327
kF kp
Norm in Lp .M; W /
328
Lk .t/
Laguerre-Polynome
328
Hk .t/
Hermite-Polynome n
329
L1 .R ; W /
Grenzfall von Lp .Rn ; W /
329
jjjF jjj1
Norm in L1 .Rn ; W /
330
L1 .A; W /, jjjF jjj1
Analoga von L1 .Rn ; W /, jjjF jjj1 für Teilmengen
340
M1 .f; ˛/, M2 .f; ˛/, M3 .f; ˛/, M4 .f; ˛/ Super- und Subniveaumengen
452 347
Wichtige Symbole
M 0 , My0 , M 00 , Mx00 c
Projektionen
363
H.X /, H .X /
konvexe Hüllen
366
/
Gammafunktion
374
B.p; q/
Beta-Integral
Kapitel 14 384
Zp
Zusammenhangskomponente
408
wind.1 I z0 /
Windungszahl
408
uml.1 I z0 /, uml.F I z0 /
Umlaufzahlen
Sachregister Symbole 1-Norm, 37, 40, 136, 166 2-Norm, 37, 40 "-dünn, 145 1-Norm, 37, 40
A Abbildung affine, 255 lineare, 5 meßbare, 272, 336, 338 quadrilineare, 15 rotationssymmetrische, 273 stetige affine, 18 trilineare, 15 ungerade, 412 Abbildungsgleichungen, 58 Abbildungsgrad, 388, 396 Abel, Niels Henrik (1802-1829), 359 Abelsche partielle Summation, 359 abgeschlossene konvexe Hülle, 363 abgeschlossener Baustein, 147 abgeschlossener Halbraum, 15 Ableitung, 17, 22 höhere, 30 partielle, 56 totale, 18, 82 Abschätzungsregel, 112, 165 Abschätzungsregel des Integrals, 114, 131, 141 Abschneidung, 191 Abschnittsdeterminante, 98 absolut summierbar, 267 absolut-gleichmäßig, 44 absolute Konvergenz, 211, 213 absolute Maximalstelle, 90 absolute Minimalstelle, 90
absolute Stetigkeit, 206, 207 absolutes Maximum, 90 absolutes Minimum, 90 abzählbare Additivität des Maßes, 198 abzählbare Quadervereinigung, 145 abzählbare Subadditivität, 159, 194 achsenparalleler Quader, 125 achsenparalleler Würfel, 125 Achtelball, 364 Addition, 423, 424, 426 Additivität des Maßes, 190 affine Abbildung, 255 Affinität Eulersche, 238 Ähnlichkeit, 50 Ähnlichkeitsinvarianz der Windungszahl, 413 Algorithmus Euklidischer, 443 allgemeiner Produktsatz, 350, 351, 360, 362 allgemeiner Quader, 275 allgemeiner Würfel, 275 allgemeines Konstanzkriterium, 28 Anfangsbedingung, 390 Anfangspunkt, 105 Anhebung, 390 Anordnung, 270, 423, 424, 426 Anstieg, 67 Anteil ganzer, 442 gebrochener, 442 homogener, 80 linearer, 17 Antipodenpunkt, 402
454 approximierend, 157 äquivalente Normen, 4 Archimedes von Syrakus (287? - 212 v. Ch.), 224, 423, 427 Archimedische Eigenschaft, 423, 427 Archimedische Spirale, 224 assoziiert, 91 Auffassung reelle, 69 auflösende Funktion, 300 Aufpumpen eines Quaders, 141 Ausschöpfung, 193 Ausschöpfungssatz, 193 äußeres Maß, 158 Auswertungsabbildung, 15
B Ballvolumen, 229 Banach, Stefan (1892-1945), 43 Banach-Raum, 43 Basis, 273 Baustein, 147 abgeschlossener, 147 bestimmter Fall, 278 Bestimmung, 389 stetige, 389 Beta-Integral, 374 Betrag, 427 Betragssummennorm, 37 Bewegung, 51, 73, 257 Bewegungsinvarianz des Maßes, 257 Bieberbach, Ludwig (1886-1982), 298 Bieberbachsche Vermutung, 298 Bildweg, 72 Bilinearform, 91 Binomialkoeffizient mittlerer, 374 Blatt, 405 blättrig, 405 Bochner, Salomon (1899-1982), 111, 158 Bogenlänge, 120, 224 Bohl, Piers (1865-1921), 412
Sachregister
Bohr, Harald August (1887-1951), 373 Bohr/Mollerup Satz von, 373 Breite geographische, 66, 72, 285 Brouwer, Luitzen (1881-1966, 415
C C k -Diffeomorphismus, 232 C 1 -Geschlossenheit, 414 Cantor, Georg (1845-1918), 155, 428 Cantorsches Diskontinuum, 155 Cauchy, Augustin Louis (1789-1857), 39, 41, 52, 69, 218, 331, 413 Cauchy-Folge rationale, 429 Cauchy-Kriterium, 43 Cauchy-Produkt, 271 Cauchy-Vollständigkeit, 428 Cauchy/Riemannsche Differentialgleichungen, 69 Cauchy/Schwarz-Ungleichung, 39, 41, 52 Cauchysche Funktionalgleichung, 331 Cauchysche Integralformel, 413 Cauchyscher Hauptwert, 218 Cavalieri Prinzip, 227, 348 Cavalieri, Bonaventura (1598-1647), 227, 348 charakteristische Funktion, 168, 188 Computer-Tomographie, 227
D de Branges Satz von, 298 Dedekind, Richard (1831-1916), 422 Dedekindscher Schnitt, 422 definit, 92 Definitheit, 2, 95 Deformation, 59 Determinante
455
Sachregister
Vandermondesche, 297 Determinanten-Kriterium, 98 Diffeomorphie-Invarianz messbarer Abbildungen, 339 Diffeomorphie-Invarianz messbarer Mengen, 334 Diffeomorphismus, 232 Differentialgleichung partielle, 86 Differentialgleichungen Cauchy/Riemannsche, 69 Differenz, 423 differenzierbar, 16, 22 total, 18 differenzierbares Parameterintegral, 202, 209 Differenzierbarkeit totale, 16 direkt konform, 75 Diskontinuum Cantorsches, 155 divergent, 211 Division mit Rest, 442 doppelpunktfrei, 414 Doppelreihe, 270 Doppelreihensatz, 269 Drehinvarianz der Windungszahl, 413 Dreieckscheibe, 234 Dreiecksungleichung, 2, 12, 416 modifizierte, 2 Durchnummerierung, 270
E E. Schmidt Satz von, 289 Ebene geschlitzte, 389 Eckpunkt, 276 Eigenschaft Archimedische, 423, 427 eigentlich konform, 75 Eigenwert-Kriterium, 100 Eilenberg, Samuel (1913-1998), 415
Einbettung stetige, 330 Einbettungsverfahren, 425 einfach uneigentliches Integral, 213 Einheitsball, 3 Einheitshyperbel, 242 Einheitssphäre, 3 Einheitsvektor, 3 Eins, 422 Einzigkeit der reellen Zahlen, 375 elementarsymmetrische Funktion, 297 Ellipsenscheibe, 230 Flächeninhalt, 231 Ellipsoidkörper, 237 Ellipsoidvolumen, 237 Endpunkt, 105 Ergänzung quadratische, 95 Ergänzungssatz, 373 Ergänzungssatz von Euler, 373 erste Fréchet-Ableitung, 288 erste Guldinsche Regel, 273 erster Mittelwertsatz der Integralrechnung, 354, 355 essentielles Supremum, 329, 330 Euklid (ca. 300 v. Chr.), 443 Euklidische Norm, 37 Euklidischer Algorithmus, 443 Euklidischer Vektorraum, 39 Euler, 373 Euler, Leonhard (1707-1783), 33, 365, 373 Eulersche Affinität, 238 Eulersche Produktdarstellung der Gammafunktion, 372 Eulersche Relation, 33 existieren, 191 Extremum, 90, 307
F f.ü., 156 Fall überbestimmter, 278
456 bestimmter, 278 unterbestimmter, 278 Faltung, 245 Fassregel Keplersche, 123 fast alle, 156 fast überall, 156 Fatou Lemma von, 188 Fatou, Pierre Joseph (1878-1929, 188 Fehlerintegral Gaußsches, 236 Feinheitsmaß, 139 Feld, 59 Fenchel Satz von, 144 Fenchel, Werner (1905-1988), 144 Fischer, Ernst (1875-1954), 323 Fixpunkt, 401 Flächeninhalt der Ellipsenscheibe, 231 Flächenstück, 66 Form quadratische, 91 Formel Heronsche, 275 Stirlingsche, 368 Fréchet, Maurice (1878-1973), 18 Fréchet-Ableitung, 18 erste, 288 zweite, 288 Fréchet-differenzierbar, 18 Fubini Satz von, 225, 246, 249 Fubini, Guido (1897-1943), 225, 246, 249 Funktion auflösende, 300 charakteristische, 168, 188 elementarsymmetrische, 297 implizite, 299, 300 konvexe, 8 skalare, 66 Funktionaldeterminante, 232
Sachregister
partielle, 304 Funktionalgleichung Cauchysche, 331 Funktionalgleichung der Gammafunktion, 367 Funktionalmatrix, 60, 64 für kleine, 17
G Gammafunktion, 365, 366 Eulersche Produktdarstellung, 372 Funktionalgleichung, 367 ganzer Anteil, 442 Gauß Produktformel, 373 Gauß, Carl Friedrich (1777-1855), 373 Gaußsches Fehlerintegral, 236 Gebiet, 28 Gebietsinvarianz, 293 gebrochener Anteil, 442 gemischt quadratisch, 95 Generation, 147 geographische Breite, 66 Länge, 66 geographische Breite, 72, 285 geographische Koordinaten, 66, 72, 285 geographische Länge, 72, 285 geometrischer Schwerpunkt, 242, 364 gerade, 442 Gesamtkrümmung, 145 Gesamtkrümmung, 414 Gesamtmasse, 364 geschlitzte Ebene, 389 gilt nahe, 17 gleich, 168 gleichmächtig, 407 globale Winkelfunktion, 388 Grad, 33, 80, 82 Gradient, 66 Graphendarstellung, 70
457
Sachregister
Graphengestalt, 294 Grenzwert simultaner, 220 Gröbner, Wolfgang (1899-1980), 286 Gröbner-Basis, 286 großer Umordnungssatz, 267 größter gemeinsamer Teiler, 442 Gruppe lineare, 46 Guldin, Paul (1577-1643), 273
H halbe Hauptachsenlänge, 238 Halbnorm, 12 Halbraum, 15 abgeschlossener, 15 offener, 15 Hamel, Georg (1877-1954), 382 Hamel-Basis, 382 Hauptachsenlänge halbe, 238 Hauptachsentransformation, 101, 313 Hauptminor, 104 Hauptsatz der Differential- und Integralrechnung, 114 Hauptwert Cauchyscher, 218 HDI, 114, 200 Hermite, Charles (1822-1901), 47, 328 Hermite-Polynom, 328 Hermitesches Skalarprodukt, 47, 326 Heron von Alexandria (ca. 130 n. Chr.), 275 Heronsche Formel, 275 Hesse, Ludwig Otto (1811-1874), 83 Hesse-Form, 83 Hesse-Matrix, 83 Hilbert, David (1862-1943), 43, 47 Hilbert-Raum, 43 komplexer, 48 Höhe, 226, 246 höhere Ableitung, 30 Hölder, Otto (1859-1937), 320
Hölder-Ungleichung, 320 holomorphe Umkehrung, 295 Holomorphie, 69 homogen positiv, 33 homogene Massenbelegung, 364 homogene polynomiale Funktion, 82 homogener Anteil, 80 Homogenität positive, 2, 12, 253 Homogenitätsgrad, 80 Homothetie, 51 Hülle abgeschlossene konvexe, 363 konvexe, 363 vollständige, 421 hyperbolische Polarkoordinaten, 243 hyperbolische Spirale, 224 Hyperebene, 15
I implizite Funktion, 299, 300 indefinit, 92 Index, 411 Induktion im Kontinuum, 26, 31 Induktionsprinzip, 422 induziert, 38, 51 Injektivität, 118, 286 Injektivitätsradius, 287 Inkapyramide, 169 Integral, 114, 126, 135, 157, 191, 272 Abschätzungsregel, 114, 131, 141 als Funktion der oberen Grenze, 221 einfach uneigentliches, 213 iteriertes, 127 Linearität, 112, 114, 131, 141 mehrfach uneigentliches, 217 Monotonie, 167 n-faches, 130 Normierung, 112, 114, 131, 141 orientiertes, 118 uneigentliches, 210, 211, 213
458 Zerlegungsregel, 114, 131, 140 Integral-Restglied, 79 Integralformel Cauchysche, 413 Integralkriterium, 205 Integralrechnung, 111 Integrand komplexer, 272 integrierbar, 157, 191, 272 kompakt, 315 lokal, 315 quadratisch, 325 integrierbare Majorante, 182 integrierbare Menge, 189 Integrierbarkeit lokale, 314, 333 Inversion an der Einheitssphäre, 75 Isometrie, 50, 257 Isotherme, 312 iteriertes Integral, 127
J Jacobi, Carl Gustav Jacob (1804-1851), 60, 64 Jacobi-Determinante, 232 Jacobi-Matrix, 60, 64 Jordan, Camille (1838-1922), 414 Jordan/Brouwer Satz von, 415 Jordanscher Kurvensatz, 414
K Kantenlänge, 125, 275 Kantenvektor, 275 Kegel, 273 Kepler, Johannes (1571-1630), 123 Keplersche Fassregel, 123 Kettenregel zweiter Ordnung, 88 Klasse, 64, 68 Klasse C 1 , 22
Sachregister
kleiner Umordnungssatz, 270 Koeffizientenmatrix, 91 Koeffizientenvektor, 296 Kofaktor, 441 kompakt integrierbar, 315 komplexer Hilbert-Raum, 48 komplexer Integrand, 272 komplexer Prä-Hilbert-Raum, 47 Komponenten, 58 konform, 75 konjugiert, 319 konjugiert komplexe Funktion, 326 konkav, 8 konstanter Term, 17 Konstanzkriterium, 26 allgemeines, 28 konvergent, 4, 211 Konvergenz absolute, 211, 213 majorisierte, 181 Konvergenz im quadratischen Mittel, 325 Konvergenzsatz, 176 konvex logarithmisch, 373 konvexe Funktion, 8 konvexe Hülle, 363 konvexe Menge, 8 Konvexität, 8 Koordinaten geographische, 66, 72, 285 Koordinatenhaken, 63 Koordinatenlinien, 59 Koordinatenraum, 77 Körper starrer, 364 Kreislinie punktierte, 391 Kreiszylinder senkrechter, 70 kritische Stelle, 93 Kugelschale, 273 Kurvensatz
459
Sachregister
Jordanscher, 414
L L1 -Norm, 166 Lp -Raum, 314, 319, 327 Lagrange, Joseph-Louis (1736-1813), 79, 96, 309 Lagrange-Restglied, 79 Lagrange-Verfahren, 96 Lagrangescher Multiplikator, 309 Laguerre, Edmond Nicolas (1834-1886), 328 Laguerre-Polynom, 328 Lambert, Johann Heinrich (1728-1777), 294 Lambertsche W-Funktion, 294 Länge, 2 eines einbeschriebenen Polygonzugs, 120 geographische, 66, 72, 285 Lebesgue Satz von, 181 Lebesgue, Henri (1875-1941), 111, 157, 158, 181 Lebesgue-Integral, 111, 157 Lebesgue-Maß, 188, 189 Lebesgue/Bochner-Integral, 111 Legendre, Adrien-Marie (1752-1833), 328, 373 Legendre-Polynom, 328 Leibniz-Regel, 73, 128, 202, 209, 210 Lemma von Fatou, 188 lineare Abbildung, 5 lineare Gruppe, 46 linearer Anteil, 17 Linearität des Integrals, 112, 114, 131, 141 Linksoben-Schema, 98 Liouville, Joseph (1809-1882), 78 logarithmisch konvex, 373 logarithmische Spirale, 224 lokal erfüllt, 31
lokal injektiv, 31 lokal integrierbar, 315 lokal monoton, 31 lokal streng monoton, 31 lokale Integrierbarkeit, 314, 333 lokale Maximalstelle, 90 lokale Minimalstelle, 89 lokales Maximum, 90 lokales Minimum, 89
M Majorante, 44, 212, 317 integrierbare, 182 Majorantenbedingung, 317 Majorantenkriterium, 44, 212 majorisierte Konvergenz, 181 Massenbelegung homogene, 364 Massendichte, 364 Matrix unendliche, 267 Matrizenkalkül, 59 Maximalisierung, 132 Maximalstelle, 90 absolute, 90 lokale, 90 relative, 90 Maximum, 90 absolutes, 90 lokales, 90 relatives, 90 Maximumsnorm, 10, 11, 35, 37, 40 Maß, 189, 272 äußeres, 158 Additivität, 190 Bewegungsinvarianz, 257 Translationsinvarianz, 256 Maßtheorie, 111 mehrfach uneigentliches Integral, 217 Menge integrierbare, 189 konvexe, 8 meßbare, 272, 332, 333
460 Vitalische, 277 messbare Abbildung, 272, 336, 338 Diffeomorphie-Invarianz, 339 messbare Menge, 272, 332, 333 Diffeomorphie-Invarianz, 334 Methode von Eilenberg, 415 metrische Projektion, 207 Minimalstelle, 90 absolute, 90 lokale, 89 relative, 89 Minimum, 90 absolutes, 90 lokales, 89 relatives, 89 Minkowski, Hermann (1864-1909), 45, 320 Minkowski-Ungleichung, 45, 320 Minorante, 212 Minorantenkriterium, 212 Mittelwert, 206 Mittelwertsatz erster (der Integralrechnung), 354, 355 zweiter (der Integralrechnung), 358, 360 Mittelwertsatz der Differentialrechnung, 117 Mittelwertsatz der Integralrechnung, 354 mittlerer Binomialkoeffizient, 374 modifizierte Dreiecksungleichung, 2 monoton fallend, 402 monoton wachsend, 402 Monotonie des Integrals, 167 Multiindex, 87 Multiplikation, 423, 424, 426 Multiplikator Lagrangescher, 309
N n-dimensionales Volumen, 125 n-faches Integral, 130 Nachfolger, 422
Sachregister
Nebenbedingung, 307, 308 Nebenbedingungsmenge, 308 negativ definit, 92 negativ semidefinit, 92 Nordpol, 77, 154 Norm, 2 Euklidische, 37 Normabbildung, 112 Normen äquivalente, 4 normerhaltend, 39 normierter Vektorraum, 1, 2 Normierung des Integrals, 112, 114, 131, 141 normtreu, 38 Nullfolge rationale, 431 Nullfortsetzung, 191 Nullmenge, 145 Nullstellenmenge, 296 Nullstellenproblem, 279 Nullvektor, 1
O offene Umgebung, 402 offener Halbraum, 15 Operator-Norm, 7 Ordinatenmenge, 228, 348 Ordnung, 81, 82 orientiertes Integral, 118 orientierungstreu, 75, 402 orientierungsumkehrend, 75, 402 Orthogonalitätsinvarianz, 51 Orthogonalitätsrelation, 73
P p-Norm, 44, 319, 327 Parallelogramm-Identität, 50 Parallelotop, 274 Parameterintegral, 127, 201 differenzierbares, 202, 209
461
Sachregister
Parameterinvarianz der Windungszahl, 413 Parametrisierung rationale, 71 transzendente, 71 partielle Ableitung, 56 partielle Differentialgleichung, 86 partielle Funktionaldeterminante, 304 partielle Summation Abelsche, 359 Peano, Guiseppe (1858-1939), 154, 422 Peano-Axiome, 422 Peano-Kurve, 154 Periodenzuwachs, 398 Permutation, 270 Poincaré, Jules-Henri (1854-1912), 412 Polarkoordinaten hyperbolische, 243 im Raum, 65, 285 in der Ebene, 65 Polynom vektorwertiges, 30 polynomiale Funktion homogene, 82 positiv definit, 92 positiv homogen, 33 positiv semidefinit, 92 positive Homogenität, 2, 12, 253 Prä-Hilbert-Raum komplexer, 47 reeller, 39 prim relativ, 442 Primzahl, 441 Prinzip von Cavalieri, 227, 348 Produkt, 351, 423 vektorielles, 21 Produktformel, 239 Produktformel von Gauß, 373 Produktintegration, 116 Produktregel, 29 Produktsatz, 184, 354 allgemeiner, 350, 351, 360, 362
Produktzerlegung, 132 Projektion metrische, 207 stereographische, 77, 154 zweite, 226 Pseudometrik, 207, 416 pseudometrischer Raum, 416 Ptolemäus Ungleichung von, 76 Ptolemäus, Claudius (ca. 85- ca. 185), 76 punktierte Kreislinie, 391
Q Quader, 124 achsenparalleler, 125 allgemeiner, 275 Quaderintegral, 139 Quadervereinigung abzählbare, 145 Quadrat, 125 quadratisch integrierbar, 325 quadratische Ergänzung, 95 quadratische Form, 91 Quadratnorm, 325 Quadraturformel, 124 quadrilineare Abbildung, 15 Quotientenraum, 13
R Rang, 74 rationale Cauchy-Folge, 429 rationale Nullfolge, 431 rationale Parametrisierung, 71 rationale Parametrisierung von Sn , 155 Raum pseudometrischer, 416 Rechteck, 125 Rechtwinkeltreue, 75 reelle Auffassung, 69 reelle Zahlen Einzigkeit, 375
462 reeller Prä-Hilbert-Raum, 39 reelles Skalarprodukt, 47, 326 Regel von Guldin, 273 Simpson, 123 regulär, 254 Reihenlehre, 203, 267 rein quadratisch, 95 rektifizierbar, 120, 223 Relation Eulersche, 33 relativ prim, 442 relative Maximalstelle, 90 relative Minimalstelle, 89 relatives Maximum, 90 relatives Minimum, 89 Rest, 442 Restglied, 17, 79 Richtungsableitung, 54 Riemann, Bernhard (1826-1866), 69 Riemann-Integrierbarkeit, 199 Riemann-Summe, 139 Riesz Satz von, 14 Riesz, Friedrich (1880-1956), 14, 323 Rolle Satz von, 290 Rotationskörper, 273 rotationssymmetrische Abbildung, 273
S Sattelpunkt, 94 Satz über die Gebietsinvarianz, 293 Satz vom endlichen Zuwachs, 117 Satz von Bohr/Mollerup, 373 de Branges, 298 E. Schmidt, 289 Fenchel, 144 Fubini, 225, 246, 249 Jordan/Brouwer, 415 Lebesgue, 181 Liouville, 78
Sachregister
Riesz, 14 Rolle, 290 Shapiro, 331 Tonelli, 346, 347 Satz von Fubini Umkehrung, 345 Scherungsinvarianz, 253 Schlitz, 389 Schmidt, Erhard (1876-1959), 289 Schnitt, 246 Dedekindscher, 422 Schnittprojektion, 226, 246 Schrankensatz, 117 Schwarz, Hermann Amandus (18431821), 39, 41, 52 Schwerpunkt, 364 geometrischer, 242, 364 Sehnenregel, 122 Seitenlänge, 125, 275 Selimovic, 291 semidefinit, 92 Semidefinitheit, 12, 416 Seminorm, 12 senkrechter Kreiszylinder, 70 Shapiro Satz von, 331 Simplex, 275 Simpson, Thomas (1710-1761), 123 Simpson-Regel, 123 simultaner Grenzwert, 220 singulär, 254 Skalar, 1 skalare Funktion, 66 skalares Vielfaches, 1 Skalarprodukt, 39 Hermitesches, 47, 326 reelles, 47, 326 Spaltenschreibweise, 58, 59 Spektralsatz, 313 sphärentreu, 78 Spiegelung an der Einheitssphäre, 75 Spirale
463
Sachregister
Archimedische, 224 hyperbolische, 224 logarithmische, 224 Spitze, 273 stetig, 200 Standard-, 37 Standard-Abschätzung, 133 Standard-Basis, 36, 56 Standard-Dreieckscheibe, 235 Standard-Simplex, 235, 242 Standard-Skalarprodukt, 40 stärker, 81 stärker als linear, 17 starrer Körper mit Massendichte, 364 stationäre Stelle, 93 Stelle kritische, 93 stationäre, 93 stereographische Projektion, 77, 154 stetig, 4 stetig differenzierbar, 22 stetige affine Abbildung, 18 stetige Bestimmung, 389 stetige Einbettung, 330 Stetigkeit absolute, 206, 207 Stirling, James (1692-1770), 368 Stirlingsche Formel, 368 streng, 90 streng monoton fallend, 402 streng monoton wachsend, 402 strikt, 90 stückweise Subadditivität abzählbare, 159, 194 Subniveaumenge, 340 Summe, 1, 423 summierbar absolut, 267 Superniveaumenge, 340 Supremum essentielles, 329, 330 Supremumsvollständigkeit, 375, 428
Symmetrie, 416
T Tangentendrehzahl, 414 Tangentenregel, 122 Taylor, Brook (1685-1731), 79 Taylor-Formel, 79, 86, 121 Taylor-Reihe, 85 teilbar, 441 Teilbarkeitslehre, 441 teilen, 441 Teiler, 441 größter gemeinsamer, 442 trivialer, 441 teilerfremd, 442 Teleskopvereinigung, 196 Tensorprodukt, 239 Term konstanter, 17 Term höherer Ordnung, 17 Tonelli Satz von, 346, 347 Tonelli, Leonida (1885-1946), 346, 347 toplinear, 6 total differenzierbar, 18 total unzusammenhängend, 388 totale Ableitung, 18, 82 totale Differenzierbarkeit, 16 Totalkrümmung, 145 Totalkrümmung, 414 Träger, 134 Transformationsformel, 114, 232, 246, 264 Transformationssatz, 251, 264 Translat, 277 Translation, 51 Translationsinvarianz der Windungszahl, 413 Translationsinvarianz des Maßes, 256 Transponieren, 59, 84 transzendente Parametrisierung, 71 Trapezregel, 122 Treppenfunktion, 113, 186, 343
464 trilineare Abbildung, 15 trivialer Teiler, 441 Tschebyscheff, Pafnuti Lwowitsch (18211894), 159, 171, 206, 342 Tschebyscheff-Ungleichung, 159, 171, 172, 206, 342
U überbestimmter Fall, 278 Überdeckung, 133 Überlagerung, 405 Überlagerungsraum, 405 Umfang, 275 Umgebung, 402 zulässige, 405 Umkehrsatz, 279, 281 Umkehrung, 278 holomorphe, 295 Umlaufsatz, 414 Umlaufzahl, 393, 408 Umordnungssatz großer, 267 kleiner, 270 uneigentliches Integral, 210, 211, 213 unendliche Matrix, 267 ungerade, 442 ungerade Abbildung, 412 Ungleichung von Ptolemäus, 76 von Tschebyscheff, 159, 171, 172, 206, 342 unimodularer Vektorraum, 276 unterbestimmter Fall, 278 Unterdeckung, 133 unzusammenhängend total, 388 Urysohn, Pawel Samuilowitsch, 18981924, 261 Urysohn-Funktion, 261
Sachregister
V Vandermonde, Alexander Theophile (1735-1796), 297 Vandermondesche Determinante, 297 Vektor, 1 vektorielles Produkt, 21 Vektorraum, 1 Euklidischer, 39 normierter, 1, 2 unimodularer, 276 vektorwertiges Polynom, 30 verbindbar, 105 verbinden, 105 Verbindungsstrecke, 8 Verfahren von Lagrange, 96 Vermutung Bieberbachsche, 298 Vervollständigung, 185, 415 Vielfaches skalares, 1 Vitali, Giuseppe (1975-1932), 277 Vitalische Menge, 277 vollständige Hülle, 421 Vollständigkeit, 176, 322 Volumen, 125, 189 n-dimensionales, 125 volumfremd, 125, 190
W W -Funktion Lambertsche, 294 Wahrscheinlichkeitstheorie, 206 Wavelet-Theorie, 135 Weg, 105 Wegkomponente, 105 wegzusammenhängend, 106 Wegzusammenhang, 104 Windungszahl, 392, 408 Ähnlichkeitsinvarianz, 413 Parameterinvarianz, 413 Translationsinvarianz, 413 Winkel, 51, 73
Sachregister
Winkelfunktion globale, 388 Winkelgeschwindigkeit, 411 Winkelinvarianz, 51 Winkeltreue, 75 Wohlordnungssatz in N, 423 Würfel, 125 achsenparalleler, 125 allgemeiner, 275
Z Zahlentheorie, 441 Zentrum, 79 Zerlegungsregel, 112 Zerlegungsregel des Integrals, 114, 131, 140 Zerlegungssatz, 197 Zerlegungssumme, 139 Zielfunktion, 90, 308 zulässige Umgebung, 405 Zusammenhang, 104, 383 zusammenhängend, 27, 106 Zusammenhangskomponente, 384 Zusammensetzung, 106 zweite Fréchet-Ableitung, 288 zweite Projektion, 226 zweiter Mittelwertsatz der Integralrechnung, 358, 360 Zylinderaufwicklung, 74
465