Springer-Lehrbuch
Dirk Werner
Einführung in die höhere Analysis Topologische Räume Funktionentheorie Gewöhnliche Differentialgleichungen Maß- und Integrationstheorie Funktionalanalysis
Mit 13 Abbildungen
123
Prof. Dr. Dirk Werner Fachbereich Mathematik und Informatik Freie Universität Berlin Arnimallee 6 14195 Berlin, Deutschland E-mail:
[email protected] Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar.
Mathematics Subject Classification (2000): 28-01, 30-01, 34-01, 46-01, 54-01
ISBN-10 3-540-34285-0 Springer Berlin Heidelberg New York ISBN-13 978-3-540-34285-4 Springer Berlin Heidelberg New York Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg 2006 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Text und Abbildungen wurden mit größter Sorgfalt erarbeitet. Verlag und Autor können jedoch für eventuell verbliebene fehlerhafte Angaben und deren Folgen weder eine juristische Verantwortung noch irgendeine Haftung übernehmen. Satz: Datenerstellung durch den Autor Herstellung: LE-TEX Jelonek, Schmidt & Vöckler GbR, Leipzig Umschlaggestaltung: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier
44/3100YL - 5 4 3 2 1 0
F¨ ur Irina, Felix und Nina
Vorwort
Das vorliegende Buch versucht einen Einblick in die Analysis jenseits der Vorlesungen der ersten beiden Semester zu geben. Es umfasst f¨ unf weitgehend voneinander unabh¨ angige Kapitel u ber topologische R¨ a ume, Funktionentheorie, ¨ gew¨ ohnliche Differentialgleichungen, Maß- und Integrationstheorie sowie Funktionalanalysis. In ihnen werden die grundlegenden Begriffe und Resultate dieser Gebiete behandelt, die f¨ ur potenziell alle Studierenden relevant sind. Ich habe allerdings nicht angestrebt, jeweils den Inhalt einer vierst¨ undigen Vorlesung zu vermitteln, sondern mich auf die Grundkenntnisse konzentriert, die hier also in kompakter Form pr¨ asentiert werden. Im einzelnen enth¨ alt Kapitel I, ausgehend von der als bekannt vorausgesetzten elementaren Theorie metrischer R¨ aume, eine Einf¨ uhrung in die Sprache der mengentheoretischen Topologie. Hier steht in der Tat das Vokabular im Vordergrung, denn tiefliegende Resultate sind in den Anfangsgr¨ unden der Topologie eher die Ausnahme als die Regel. Das zweite Kapitel besch¨ aftigt sich mit der Funktionentheorie und bringt die Grundtatsachen u ¨ ber analytische und meromorphe Funktionen bis zum Residuensatz und seinen Anwendungen; der Cauchysche Integralsatz wird in seiner Homotopieversion bewiesen. Kapitel III u ohnliche Differentialgleichungen konzentriert sich nach ¨ber gew¨ der Diskussion des Existenz- und Eindeutigkeitssatzes von Picard-Lindel¨of auf Systeme linearer Differentialgleichungen; aber es gibt auch einen Abschnitt u ¨ber die Stabilit¨ atstheorie von Gleichgewichtspunkten nichtlinearer Systeme. Im vierten Kapitel wird die Lebesguesche Integrationstheorie auf maßtheoretischer Grundlage dargestellt. Selbst wenn man haupts¨achlich an der Integration von Funktionen auf R oder Rd und ergo am Lebesguemaß interessiert ist, ist der hier gew¨ ahlte Zugang u ¨ ber abstrakte σ-additive Maße und die zugeh¨origen Integrale vom technischen Aufwand her kaum komplizierter, aber f¨ ur die Bed¨ urfnisse der Wahrscheinlichkeitstheorie unumg¨anglich.
VIII
Vorwort
Das letzte Kapitel f¨ uhrt in die Funktionalanalysis ein; dort findet man die wichtigsten Aussagen u ber Banach- und Hilbertr¨aume sowie die auf ihnen ope¨ rierenden beschr¨ ankten linearen (insbesondere kompakten) Operatoren. Manche Resultate werden separat bzw. ausschließlich im Hilbertraumkontext bewiesen, z.B. die Fredholmsche Alternative, um die Beweise u ¨ bersichtlicher zu halten. Außer dem Grundkanon, wie er oben skizziert wurde, enth¨alt jedes Kapitel noch (mindestens) einen apokryphen Abschnitt, etwa u ¨ ber Anwendungen des Baireschen Kategoriensatzes in der Analysis, den Primzahlsatz, SturmLiouvillesche Rand- und Eigenwertprobleme, den Brouwerschen Fixpunktsatz oder den Satz von Hahn-Banach und reflexive R¨aume. Diese eleganten Ergebnisse aufzunehmen konnte ich mir bei aller Konzentration aufs Wesentliche nicht entsagen! Zu jedem Kapitel gibt es am Schluss ein kurzes Literaturverzeichnis; im Text wird dabei z.B. auf das 1978 erschienene Buch von Birkhoff und Rota als Birkhoff/Rota [1978] verwiesen. Das Manuskript basiert auf Vorlesungen, die ich an der FU Berlin und an der National University of Ireland, Galway, gehalten habe. Zahlreiche Studierende und Kollegen haben mit ihrer Kritik geholfen, den Text zu verbessern. Herzlichen Dank daf¨ ur! Insbesondere m¨ ochte ich an dieser Stelle Ehrhard Behrends erw¨ ahnen, auf den im u uckgeht, dieses Buch zu schreiben. ¨brigen die Idee zur¨ Auch Ihre Kommentare, liebe Leserinnen und Leser, sind sehr willkommen; bitte lassen Sie mich alle Unstimmigkeiten, die Ihnen auffallen, wissen (gern per email an
[email protected]). Ich habe vor, notwendige Korrekturen auf meiner Internetseite www.math.fu-berlin.de/∼werner zu dokumentieren. Berlin, im Mai 2006
Dirk Werner
Inhaltsverzeichnis
I. Topologische R¨ aume . . . . . . . . . . . . . . . . . I.1 Prolog: Metrische R¨ aume . . . . . . . . . . . . I.2 Grundbegriffe . . . . . . . . . . . . . . . . . . I.3 Stetige Abbildungen . . . . . . . . . . . . . . . I.4 Konvergenz . . . . . . . . . . . . . . . . . . . I.5 Kompakte R¨ aume . . . . . . . . . . . . . . . . I.6 Zusammenh¨ angende R¨ aume . . . . . . . . . . I.7 Existenz stetiger Funktionen, normale R¨aume I.8 Der Satz von Baire . . . . . . . . . . . . . . . I.9 Aufgaben . . . . . . . . . . . . . . . . . . . . . I.10 Literaturhinweise . . . . . . . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
II. Funktionentheorie . . . . . . . . . . . . . . . . . II.1 Der Begriff der analytischen Funktion . . . . II.2 Der Cauchysche Integralsatz . . . . . . . . . II.3 Die Haupts¨ atze u ¨ber analytische Funktionen II.4 Isolierte Singularit¨ aten und Residuenkalk¨ ul . II.5 Der Primzahlsatz . . . . . . . . . . . . . . . II.6 Aufgaben . . . . . . . . . . . . . . . . . . . . II.7 Literaturhinweise . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. 55 . 57 . 64 . 77 . 93 . 106 . 120 . 128
III. Gew¨ ohnliche Differentialgleichungen . . . . . . . . . . . . III.1 Beispiele und elementare L¨ osungsmethoden . . . . . . . . . III.2 Der Existenz- und Eindeutigkeitssatz von Picard-Lindel¨of . III.3 Abh¨ angigkeit der L¨ osung von den Daten . . . . . . . . . . III.4 Lineare Systeme . . . . . . . . . . . . . . . . . . . . . . . . III.5 Systeme mit konstanten Koeffizienten . . . . . . . . . . . . III.6 Lineare Differentialgleichungen h¨ oherer Ordnung . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . . .
1 2 6 12 17 21 30 34 39 47 53
129 130 142 151 153 158 167
X
Inhaltsverzeichnis
III.7 III.8 III.9 III.10
Qualitative Theorie nichtlinearer Systeme Randwertprobleme . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . Literaturhinweise . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
177 194 198 205
IV. Maß- und Integrationstheorie . . . . . . . . . IV.1 σ-Algebren . . . . . . . . . . . . . . . . . . . IV.2 Inhalte und Maße . . . . . . . . . . . . . . . IV.3 Konstruktion von Maßen; das Lebesguemaß IV.4 Messbare Funktionen . . . . . . . . . . . . . IV.5 Integrierbare Funktionen . . . . . . . . . . . IV.6 Konvergenzs¨ atze . . . . . . . . . . . . . . . . aume . . . . . . . . . . . . . . . . IV.7 Die L p -R¨ IV.8 Produktmaße und der Satz von Fubini . . . IV.9 Einige Anwendungen . . . . . . . . . . . . . IV.10 Aufgaben . . . . . . . . . . . . . . . . . . . . IV.11 Literaturhinweise . . . . . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
207 209 214 219 228 232 240 246 253 264 281 289
V. Funktionalanalysis . . . . . . . . . . . . . . . V.1 Normierte R¨ aume . . . . . . . . . . . . . V.2 Lineare Operatoren . . . . . . . . . . . . V.3 Hilbertr¨aume . . . . . . . . . . . . . . . V.4 Orthonormalbasen und Fourierreihen . . V.5 Der Satz von Hahn-Banach; Reflexivit¨at V.6 Eigenwerttheorie kompakter Operatoren V.7 Sturm-Liouvillesche Eigenwertprobleme . V.8 Aufgaben . . . . . . . . . . . . . . . . . . V.9 Literaturhinweise . . . . . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
291 292 305 315 328 340 352 366 371 378
. . . . . . . . . .
. . . . . . . . . .
Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379 Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . 383
Kapitel I
Topologische Ra¨ume
Wenn eine Menge T mit einer Metrik d versehen wird, haben wir die intuitive Idee des Abstands mathematisch pr¨ azise gefasst. Wir k¨onnen quantitativ bestimmen, wie nahe zwei Punkte einander sind, und wir k¨onnen qualitativ feststellen, ob ein Punkt t unendlich nahe“ bei einer Menge M liegt (pr¨azise: ” ur letzteres wird die Maschinerie der offenen und abgeschlossenen ob t ∈ M ); f¨ Mengen entwickelt. Auf Rd betrachtet man zum Beispiel die Metriken (s = (s1 , . . . , sd ), t = (t1 , . . . , td )) d1 (s, t) =
d
k=1
d2 (s, t) =
|sk − tk |,
d k=1
2
|sk − tk |
1/2
,
d3 (s, t) = max |sk − tk |. k
Diese sind zwar verschieden, aber insofern qualitativ gleichwertig, als sie dieselben offenen Mengen auf Rd generieren. Anders liegen die Verh¨altnisse auf unendlichdimensionalen R¨ aumen. Sei C[0, 1] = {f : [0, 1] → R: f ist stetig}. Die Metriken d1 (f, g) =
0
und
1
|f (s) − g(s)| ds
d2 (f, g) = sup |f (s) − g(s)| s∈[0,1]
messen qualitativ unterschiedliche Abstandsbegriffe, da man leicht fn ∈ C[0, 1] mit d1 (fn , 0) ≤ 1/n, aber d2 (fn , 0) ≥ n konstruiert. (Im d1 -Sinn ist fn sehr
2
I.
Topologische R¨ aume
nahe bei 0, im d2 -Sinn sehr weit davon entfernt.) In der Tat erzeugen die beiden Metriken unterschiedliche Systeme offener Mengen. Konvergenz im Sinn der Metrik d1 ist die Konvergenz im Integralmittel; Konvergenz im Sinn der Metrik d2 ist die gleichm¨aßige Konvergenz. Ein weiterer nat¨ urlicher Konvergenzbegriff auf C[0, 1] ist die punktweise Konvergenz: fn → f punktweise ⇐⇒ fn (t) → f (t) ∀t ∈ [0, 1]. Es zeigt sich, dass es keine Metrik gibt, aus der dieser Konvergenzbegriff abgeleitet werden kann. Jedoch kann die punktweise Konvergenz mit Hilfe einer allgemeineren mathematischen Struktur als der des metrischen Raums, n¨amlich der des topologischen Raums, studiert werden. Dabei geht man von einem ausgezeichneten System von (offen genannten) Mengen aus, das gewissen Eigenschaften gen¨ ugt (siehe Definition I.2.1). Das Vorgehen ist also hier geometrisch, in der Tat lassen sich viele topologische Ph¨ anomene an zweidimensionalen Skizzen veranschaulichen. Dieses Kapitel f¨ uhrt in die Sprache der mengentheoretischen Topologie ein; ein Steilkurs u aume findet sich im ersten Abschnitt. ¨ ber metrische R¨
I.1
Prolog: Metrische R¨ aume
In diesem Abschnitt werden die wichtigsten Tatsachen u ¨ ber metrische R¨aume zusammengestellt; Beweise finden sich in fast allen Analysisb¨ uchern1 . Eine Menge T , versehen mit einer Abbildung d: T × T → R mit den Eigenschaften (s, t, u ∈ T beliebig) (a) (b) (c) (d)
d(s, t) ≥ 0, d(s, t) = d(t, s), d(s, u) ≤ d(s, t) + d(t, u), d(s, t) = 0 ⇐⇒ s = t,
wird metrischer Raum und d eine Metrik genannt. (c) heißt die Dreiecksungleichung. Gilt in (d) nur ⇐“, so spricht man von einem pseudometrischen Raum. ” In einem metrischen (oder pseudometrischen) Raum betrachte die Kugeln Uε (t) = {s ∈ T : d(s, t) < ε}. Sei M ⊂ T . Ein Punkt t ∈ M heißt innerer Punkt von M , und M heißt Umgebung von t, falls ∃ε > 0 Uε (t) ⊂ M. Eine Teilmenge O ⊂ T , f¨ ur die jedes t ∈ O innerer Punkt ist, heißt offen.
Satz I.1.1 Sei (T, d) ein metrischer Raum und τ die Menge aller offenen Teilmengen von T . 1 Vgl.
etwa O. Forster, Analysis 2, Vieweg.
I.1
Prolog: Metrische R¨ aume
(a) (b) (c)
3
∅ ∈ τ, T ∈ τ. Sind O1 ∈ τ und O2 ∈ τ , so gilt O1 ∩ O2 ∈ τ . Ist I eine beliebige Indexmenge und sind Oi ∈ τ (i ∈ I), so ist auch i∈I Oi ∈ τ .
Allgemeiner nennt man ein System von Teilmengen einer Menge T , welches die obigen Bedingungen (a)–(c) erf¨ ullt, eine Topologie auf T und spricht von T als topologischem Raum; siehe Definition I.2.1. Metrische R¨aume wurden zuerst von Fr´echet (1906) und topologische R¨ aume zuerst von Hausdorff (1914) betrachtet. Eine Teilmenge A eines metrischen Raums heißt abgeschlossen, wenn ihr Komplement T \ A offen ist. Analog zu Satz I.1.1 gelten also: (a) ∅ und T sind abgeschlossen. (b) Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c) Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Bedingung (c) impliziert, dass f¨ ur jede Teilmenge M ⊂ T eine kleinste abgeschlossene Menge existiert, die M umfasst. Diese wird mit M bezeichnet und Abschluss von M genannt: A M := A⊃M A abgeschlossen
Analog ist das Innere von M int M :=
O
O⊂M O offen
die gr¨ oßte offene Menge, die in M liegt. Offenbar besteht int M genau aus den inneren Punkten von M . Der Rand von M ist ∂M := {t ∈ T : Uε (t) ∩ M = ∅ und Uε (t) ∩ T \M = ∅ ∀ε > 0}. ∂M ist stets abgeschlossen, und es gilt M = M ∪ ∂M sowie ∂M = M \ int M . Eine Folge (tn ) in einem metrischen Raum T heißt konvergent gegen t ∈ T , falls ∀ε > 0 ∃N ∈ N ∀n ≥ N d(tn , t) ≤ ε. t heißt Limes von (tn ). Es ist leicht zu sehen, dass der Limes einer konvergenten Folge eindeutig bestimmt ist. (Das gilt nicht mehr in pseudometrischen R¨ aumen.) Man schreibt tn → t oder limn→∞ tn = t. Besitzt t nur die Eigenschaft, dass jede Umgebung von t unendlich viele Folgenglieder enth¨alt, heißt t H¨aufungspunkt von (tn ).
4
I.
Topologische R¨ aume
Satz I.1.2 Folgende Bedingungen sind in einem metrischen Raum ¨aquivalent: (i) t ∈ M . (ii) Es existiert eine Folge (tn ) in M mit tn → t. Als Korollar folgt: Korollar I.1.3 Folgende Bedingungen sind in einem metrischen Raum ¨aquivalent: (i) A ist abgeschlossen. (ii) F¨ ur jede konvergente Folge (tn ) in A ist limn tn ∈ A. Seien (T1 , d1 ) und (T2 , d2 ) metrische R¨ aume. Dann definiert d (s1 , s2 ), (t1 , t2 ) = d1 (s1 , t1 ) + d2 (s2 , t2 )
eine Metrik auf dem Produktraum T1 × T2 . Eine Folge (xn , yn ) in T1 × T2 konvergiert genau dann gegen (x, y), wenn xn → x und yn → y gelten. Sei nun f : T1 → T2 eine Abbildung zwischen metrischen R¨aumen. Dann heißt f stetig an der Stelle t0 ∈ T1 , falls ∀ε > 0 ∃δ > 0 d1 (t, t0 ) < δ ⇒ d2 f (t), f (t0 ) < ε.
Man erh¨ alt eine ¨ aquivalente Definition, wenn man ≤ “ statt < “ verwendet. ” ” Offenbar ist f genau dann stetig bei t0 , wenn f¨ ur jede Umgebung V von f (t0 ) das Urbild f −1 (V ) eine Umgebung von t0 ist. Satz I.1.4 Sei f : T1 → T2 eine Abbildung zwischen metrischen R¨aumen. Dann sind folgende Bedingungen ¨aquivalent: (i) f ist stetig bei t0 . (ii) tn → t0 ⇒ f (tn ) → f (t0 ) f¨ ur alle Folgen (tn ). Eine Abbildung f : T1 → T2 heißt schlechthin stetig, falls sie an jeder Stelle t0 ∈ T1 stetig ist. Nach Definition ist die Stetigkeit also eine lokale Eigenschaft; denn es geht an jeder Stelle t0 nur das Verhalten von f in einer Umgebung von t0 ein. Satz I.1.5 F¨ ur eine Abbildung f zwischen metrischen R¨aumen T1 und T2 sind ¨aquivalent: (i) f ist stetig. (ii) F¨ ur alle offenen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 .
I.1
Prolog: Metrische R¨ aume
5
Eine Metrik induziert nicht nur eine topologische Struktur, sondern auch eine uniforme Struktur, die sich in den Begriffen Cauchyfolge, Vollst¨andigkeit und gleichm¨ aßige Stetigkeit manifestiert; diese Begriffe haben kein Gegenst¨ uck in der Theorie der topologischen R¨ aume. Eine Cauchyfolge in einem metrischen Raum (T, d) ist durch die Forderung ∀ε > 0 ∃N ∈ N ∀n, m ≥ N
d(tn , tm ) ≤ ε
definiert. Ein metrischer Raum heißt vollst¨andig, wenn jede Cauchyfolge konvergiert. Mit T1 und T2 ist auch T1 × T2 vollst¨ andig. Es ist zu beachten, dass verschiedene Metriken auf einer Menge zwar dieselbe Topologie, aber unterschiedliche uniforme Strukturen erzeugen k¨onnen. Wird z.B. R mit der Metrik d2 (s, t) = |arctan s − arctan t| versehen, so sind die d2 offenen Mengen genau die u ¨ blichen offenen Mengen; jedoch ist die Folge (n) der nat¨ urlichen Zahlen eine nicht konvergente Cauchyfolge. Daher ist (R, d2 ) nicht vollst¨ andig. Eine Abbildung f : T1 → T2 heißt gleichm¨aßig stetig, wenn ∀ε > 0 ∃δ > 0 ∀s, t ∈ T1 d1 (s, t) < δ ⇒ d2 f (s), f (t) < ε.
Bei der Definition der Stetigkeit darf δ vom betrachteten Punkt t abh¨angen; bei der gleichm¨ aßigen Stetigkeit hat man δ unabh¨angig von t zu w¨ahlen. Im Gegensatz zur Stetigkeit handelt es sich hier also um eine globale Eigenschaft. Ein zentraler topologischer Begriff ist der der Kompaktheit. Ein metrischer ¨ Raum T heißt kompakt, wenn jede offene Uberdeckung eine endliche Teil¨ uberMengen deckung besitzt. Mit anderen Worten, wenn (Oi ) eine Familie offener n mit T = i∈I Oi ist, so existieren endlich viele Oi1 , . . . , Oin mit T = k=1 Oik . Ist (T, d) ein metrischer Raum und S ⊂ T , so kann (S, d) als eigenst¨andiger metrischer Raum angesehen werden. Ist T kompakt und S ⊂ T abgeschlossen, so ist auch S kompakt. Ist T ein beliebiger metrischer Raum und S ⊂ T kompakt, so ist S abgeschlossen. Beachte, dass die Abgeschlossenheit nur mit Bezug auf einen gr¨ oßeren Raum formuliert werden kann (S ist abgeschlossen in T ); hingegen ist die Kompaktheit ein intrinsischer Begriff. Wenn f : T1 → T2 eine stetige Abbildung zwischen metrischen R¨aumen ist und T1 kompakt ist, so ist auch f (T1 ) kompakt. Ferner ist unter diesen Voraussetzungen f gleichm¨ aßig stetig. Eine reiche Quelle metrischer R¨ aume bieten die normierten R¨aume, das sind Vektorr¨ aume X u ¨ ber R oder C, die mit einer Norm, also einer Abbildung x → x mit (x, y ∈ X, λ ∈ R oder C beliebig) (a) x = 0 ⇐⇒ x = 0, (b) λx = |λ| x, (c) x + y ≤ x + y, versehen sind. Wieder nennt man (c) die Dreiecksungleichung. Eine Norm induziert verm¨ oge d(x, y) = x − y
6
I.
Topologische R¨ aume
eine Metrik auf X. Es ist begrifflich zu beachten, dass ein normierter Raum immer ein Vektorraum ist, w¨ ahrend ein metrischer Raum im allgemeinen keine algebraische Struktur tr¨ agt. Beispiele f¨ ur normierte R¨aume sind Rn oder Cn mit der euklidischen Norm (x = (t1 , . . . , tn )) x =
n k=1
|tk |2
1/2
oder der Raum ℓ∞ (T ) aller beschr¨ ankten Funktionen auf einer Menge T mit der Supremumsnorm f ∞ = sup |f (t)|. t∈T
Ein normierter Raum, der in der obigen Metrik vollst¨andig ist, heißt nach dem polnischen Mathematiker Stefan Banach (1892–1945) Banachraum; die beiden obigen Beispiele sind jeweils Banachr¨ aume. Kapitel V besch¨aftigt sich ausf¨ uhrlich mit normierten und Banachr¨ aumen.
I.2
Grundbegriffe
Wir f¨ uhren nun nach und nach das Vokabular der topologischen R¨aume ein. Definition I.2.1 Sei T eine Menge. Eine Topologie auf T ist ein System τ von Teilmengen von T mit folgenden Eigenschaften: (a) ∅ ∈ τ , T ∈ τ . (b) Sind O1 , O2 ∈ τ , so ist auch O1 ∩ O2 ∈ τ . (c) Ist I eine Indexmenge und sind Oi ∈ τ f¨ ur alle i ∈ I, so ist auch O ∈ τ . i i∈I Man nennt (T, τ ) (oder auch T selbst, wenn die explizite Angabe von τ nicht notwendig erscheint) einen topologischen Raum; die in τ versammelten Mengen werden auch offen (genauer τ -offen) genannt. Durch Induktion folgt aus (b), dass der Schnitt endlich vieler offener Mengen wieder offen ist. Beispiele. (a) Sei d eine Metrik auf einer Menge T . Wir verwenden die Bezeichnungen Uε (t) = {s ∈ T : d(s, t) < ε},
Bε (t) = {s ∈ T : d(s, t) ≤ ε}.
Bekanntlich heißt eine Teilmenge O des metrischen Raums (T, d) offen, wenn ∀t ∈ O ∃ε > 0 Uε (t) ⊂ O.
(I.1)
I.2
Grundbegriffe
7
Es ist einfach zu sehen, dass die offenen Mengen eines metrischen Raums eine Topologie bilden (selbst die leere Menge erf¨ ullt (I.1), da es u ¨ berhaupt kein t ∈ ∅ gibt). Wir werden sehen, dass viele Begriffe aus der Theorie der metrischen R¨aume ein direktes Analogon in der Theorie der topologischen R¨aume haben (z.B. die Begriffe abgeschlossen, stetig, kompakt, konvergent, . . . ). Andererseits gibt es viele nat¨ urliche Beispiele topologischer R¨aume, die nicht auf die soeben beschriebene Weise von einer Metrik abgeleitet werden k¨onnen; siehe Aufgabe I.9.20. Topologien, die gem¨ aß Beispiel (a) entstehen, heißen metrisierbar. Metrisierbare Topologien sind in vieler Hinsicht einfacher als andere; vergleiche etwa Satz I.5.4 mit den Gegenbeispielen auf Seite 29 oder siehe Aufgabe I.9.9. Jedoch ist es oft einfacher, topologische Ph¨ anomene metrischer R¨aume direkt durch die offenen Mengen statt mit Hilfe einer Metrik zu untersuchen; ein Beispiel daf¨ ur ist das Beispiel (e) unten, das wir (einfach) als topologischen Raum einf¨ uhren, das man aber auch (kompliziert, siehe Aufgabe I.9.19(d)) als metrischen Raum beschreiben kann. Um sich die Vorteile metrischer R¨aume zunutze zu machen, gen¨ ugt es in der Regel zu wissen, dass es eine erzeugende Metrik gibt, ohne sie explizit zu kennen. (b) Auf einer beliebigen Menge T ist {∅, T } eine Topologie. Sie heißt indiskrete (oder chaotische) Topologie. (c) Ein weiteres einfaches Beispiel einer Topologie ist die Potenzmenge. Sie wird diskrete Topologie genannt und ist offensichtlich die feinste (= gr¨oßte) Topologie, die eine Menge tragen kann, denn bez¨ uglich der diskreten Topologie ist jede Menge offen. Formal ist dies ein Spezialfall von Beispiel (a), denn die Metrik
1 s = t d(s, t) = 0 s=t erzeugt die diskrete Topologie. (d) Ein Standardbeispiel, das weniger durch seinen praktischen Nutzen besticht, als dass es als Testfall f¨ ur den zu entwickelnden Begriffsapparat dient, ist der Sierpi´ nski-Raum {0, 1}, versehen mit der Topologie τ = {∅, {0}, {0, 1}}. Es ist klar, dass es sich in der Tat um eine Topologie handelt. Bevor wir zu weiteren Beispielen kommen, ben¨otigen wir ein paar Vokabeln. Definition I.2.2 Eine Teilmenge A eines topologischen Raums T heißt abgeschlossen, wenn ihr Komplement T \ A offen ist. Es gelten also: (a)′ T und ∅ sind abgeschlossen. (b)′ Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c)′ Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Durch Induktion wieder folgt aus (b)′ , dass die Vereinigung endlich vieler abgeschlossener Mengen abgeschlossen ist.
8
I.
Topologische R¨ aume
Achtung: Im allgemeinen gibt es Mengen, die weder offen noch abgeschlossen sind, und es kann vorkommen, dass eine Menge sowohl offen als auch abgeschlossen ist (mehr dazu im Abschnitt I.6). Definition I.2.3 Sei T ein topologischer Raum und M ⊂ T . (a) Der Abschluss von M ist M=
A.
A⊃M A abgeschlossen
(b) Das Innere von M ist int M =
O
O⊂M O offen
(c) Ein Element von int M heißt innerer Punkt von M . (d) Der Rand von M ist ∂M = M \ int M. Es ist klar, dass M als Schnitt abgeschlossener Mengen abgeschlossen ist, und offensichtlich ist M die kleinste abgeschlossene Menge, die M umfasst. Genauso ist int M die gr¨ oßte offene Menge, die in M liegt. Der Rand ∂M ist wegen ∂M = M ∩ (T \ int M ) stets abgeschlossen, denn T \ int M ist als Komplement einer offenen Menge abgeschlossen. Genau dann ist M abgeschlossen (bzw. offen), wenn M = M (bzw. M = int M ) ist. Definition I.2.4 Sei T ein topologischer Raum und t ∈ T . Eine Teilmenge U ⊂ T heißt Umgebung von t, wenn t ∈ int U ist. Eine Umgebungsbasis Ut von t ist ein System von Umgebungen von t, so dass jede Umgebung V von t ein U ∈ Ut umfasst. Die Definitionen I.2.2–I.2.4 sind w¨ ortlich wie in der Theorie der metrischen R¨ aume; in einem metrischen Raum arbeitet man nat¨ urlich mit der Umgebungsbasis der ε-Kugeln oder auch der der Kugeln mit Radius 1/n (n ∈ N). Achtung: eine Umgebung braucht nicht offen zu sein; daher kann man im metrischen Fall auch die abgeschlossenen Kugeln Bε (t) als Umgebungen nehmen. Wir wollen diese Begriffe an einem Beispiel verdeutlichen. Beispiel. (e) Eine arithmetische Progression ist eine Teilmenge von Z der Form Na,b = {a + kb: k ∈ Z},
I.2
Grundbegriffe
9
wobei a ∈ Z, b ∈ N. Wir betrachten folgende Topologie auf Z: O ⊂ Z sei offen, wenn ∀n ∈ O ∃b ∈ N Nn,b ⊂ O.
(I.2)
Es ist klar, dass (a) und (c) aus Definition I.2.1 erf¨ ullt sind. Um (b) zu zeigen, ahle b1 , b2 ∈ N mit Nn,b1 ⊂ O1 , seien O1 and O2 offen und n ∈ O1 ∩ O2 . W¨ Nn,b2 ⊂ O2 . Dann ist Nn,b1 b2 ⊂ Nn,b1 ∩ Nn,b2 ⊂ O1 ∩ O2 , was die Offenheit von O1 ∩ O2 beweist. Daher haben wir wirklich eine Topologie definiert. Nach Konstruktion ist jede arithmetische Progression Na,b offen; aber Na,b = Z \
b−1
Na+l,b
l=1
b−1 zeigt, dass Na,b auch abgeschlossen ist, denn l=1 Na+l,b ist eine endliche Vereinigung offener Mengen, also offen. Das Innere von N ist nach (I.2) leer, und da int(Z \ N) ebenfalls leer ist, folgt N = Z. Eine Umgebungsbasis von n ∈ Z wird durch Un = {Nn,b : b ∈ N} gegeben. ¨ Die bisherigen Uberlegungen gestatten einen topologischen“ Beweis, dass ” 2 es unendlich viele Primzahlen gibt . W¨ are n¨ amlich die Menge P der Primzahlen endlich, w¨ are p∈P N0,p eine endliche Vereinigung abgeschlossener Mengen, also abgeschlossen. Da jede nat¨ u rliche Zahl ≥ 2 einen Primteiler hat (Beweis durch vollst¨ andige Induktion), ist p∈P N0,p = Z \ {−1, 1}, so dass {−1, 1} offen w¨are, was wegen (I.2) nat¨ urlich falsch ist. Wir bringen jetzt simple Charakterisierungen des Abschlusses und des Randes einer Menge. Lemma I.2.5 Sei T ein topologischer Raum und M ⊂ T . Dann ist t ∈ M genau dann, wenn U ∩ M = ∅ f¨ ur jede Umgebung U von t gilt. Es reicht, das f¨ ur alle Umgebungen einer Umgebungsbasis von t zu fordern. Beweis. Sei t ∈ M und U eine Umgebung von t. Dann ist V = int U eine offene Umgebung von t. W¨ are U ∩ M = ∅, so w¨ are auch V ∩ M = ∅, d.h. T \ V w¨ are eine abgeschlossene Menge, die M umfasst. Es folgt dann M ⊂ T \ V und insbesondere t ∈ T \ V : Widerspruch! Sei umgekehrt Ut eine Umgebungsbasis von t, so dass U ∩ M = ∅ f¨ ur alle abe es eine abgeschlossene Menge A ⊃ M mit t ∈ / A; es U ∈ Ut . W¨ are t ∈ / M , g¨ folgt, dass O = T \ A offen ist, t enth¨ alt, aber O ∩ M = ∅. W¨ahle U ∈ Ut mit t ∈ U ⊂ O; dann ist also auch U ∩ M = ∅: Widerspruch! 2 2 H.
Furstenberg, On the infinitude of primes, Amer. Math. Monthly 62 (1955), 353; siehe auch S.W. Golomb, A connected topology for the integers, Amer. Math. Monthly 66 (1959), 663–665.
10
I.
Topologische R¨ aume
Lemma I.2.6 Sei T ein topologischer Raum und M ⊂ T . Dann ist t ∈ ∂M genau dann, wenn f¨ ur jede Umgebung U von t sowohl U ∩ M = ∅ als auch U ∩(T \M ) = ∅ gelten. Es reicht, das f¨ ur alle Umgebungen einer Umgebungsbasis von t zu fordern. Beweis. Sei t ∈ ∂M und U eine Umgebung von t. W¨are U ⊂ M , w¨are t ∈ int M ; also muss U ∩ (T \ M ) = ∅ gelten. Wegen t ∈ M ist nach Lemma I.2.5 auch U ∩ M = ∅. Ist umgekehrt Ut eine Umgebungsbasis von t mit U ∩M = ∅ und U ∩(T \M ) = achst t ∈ M nach Lemma I.2.5. W¨are t ∈ int M , ∅ f¨ ur alle U ∈ Ut , so gilt zun¨ g¨ abe es U ∈ Ut mit t ∈ U ⊂ M im Widerspruch zu U ∩ (T \ M ) = ∅. 2 Als n¨ achstes geben wir eine systematische Methode an, Topologien zu kon¨ struieren, die (I.1) und (I.2), welche ja große Ahnlichkeit besitzen, verallgemeinert. Satz I.2.7 Sei T eine Menge. Jedem t ∈ T sei ein nichtleeres System Ut mit folgenden Eigenschaften zugeordnet: (1) t ∈ U f¨ ur alle U ∈ Ut , (2) ∀U, V ∈ Ut ∃W ∈ Ut W ⊂ U ∩ V , (3) ∀U ∈ Ut ∀s ∈ U ∃V ∈ Us V ⊂ U . Dann ist τ = {O ⊂ T : ∀t ∈ O ∃U ∈ Ut U ⊂ O} eine Topologie, alle U ∈ Ut sind offen, und Ut ist eine Umgebungsbasis von t. Beweis. Beim Nachweis, dass τ eine Topologie ist, sind (a) und (c) aus Definition I.2.1 klar, und die obige Bedingung (2) zeigt (b) aus Definition I.2.1. Unsere Bedingung (3) bedeutet, dass alle U ∈ Ut offen sind, insbesondere sind sie Umgebungen von t. Nach Konstruktion von τ ist Ut eine Umgebungsbasis von t. 2 Mit Hilfe von Satz I.2.7 k¨ onnen wir zwei f¨ ur die Analysis besonders wichtige Topologien erkl¨ aren. Beispiele. (f) Sei S eine Menge und T = RS die Menge aller reellwertigen Funktionen auf S. Seien F ⊂ S eine endliche Menge, ε > 0 und f ∈ T . Wir setzen UF,ε (f ) = {g ∈ T : |f (s) − g(s)| < ε ∀s ∈ F } sowie Uf = {UF,ε (f ): F ⊂ S endlich, ε > 0}. ullen die Voraussetzung von Satz I.2.7: (1) ist klar, und Die Uf erf¨ UF1 ∪F2 ,min{ε1 ,ε2 } (f ) ⊂ UF1 ,ε1 (f ) ∩ UF2 ,ε2 (f )
I.2
Grundbegriffe
11
(best¨ atige dies!) zeigt (2). Seien schließlich F und ε gegeben sowie g ∈ UF,ε (f ). Setze ε′ = ε − max{|f (s) − g(s)|: s ∈ F } > 0. Dann ist UF,ε′ (g) ⊂ UF,ε (f ), also gilt auch (3). Die mit Satz I.2.7 konstruierte Topologie wird Topologie der punktweisen Konvergenz (und sp¨ ater Produkttopologie) genannt; wir werden sehen, dass sie in der Tat die punktweise Konvergenz von Funktionenfolgen beschreibt. art, wenn M ein metrischer Raum Analog wird diese Topologie auf M S erkl¨ ist. (g) Wir betrachten T = C(R), die Menge aller stetigen reellwertigen Funktionen auf3 R. Seien K ⊂ R kompakt, ε > 0 und f ∈ T . Setze UK,ε (f ) = {g ∈ T : |f (s) − g(s)| < ε ∀s ∈ K}, Uf = {UK,ε (f ): K ⊂ R kompakt, ε > 0}. Wie unter (f) sieht man, dass Satz I.2.7 Anlass zu einer Topologie gibt, so dass ur die Uf Umgebungsbasen von f werden; beachte hierf¨ g ∈ UK,ε (f ) ⇒ sup |f (s) − g(s)| < ε, s∈K
denn f und g sind stetig und K ist kompakt. Diese Topologie heißt Topologie der gleichm¨aßigen Konvergenz auf Kompakta, und wieder stellt sich heraus (siehe Aufgabe I.9.21), dass sie ihren Namen zu Recht tr¨agt. Sie l¨asst sich analog f¨ ur jeden metrischen Raum S auf dem Funktionenraum C(S) der reell- oder komplexwertigen Funktionen auf S erkl¨ aren4. Die UF,ε bzw. UK,ε in diesen Beispielen u ¨bernehmen die Rolle der Kugeln im metrischen Fall; beachte jedoch, dass die Sache durch den zweiten Parameter F bzw. K erheblich komplizierter wird. Nun zwei weitere Vokabeln. Definition I.2.8 Seien T ein topologischer Raum und D, M ⊂ T . D heißt dicht in M , falls M ⊂ D. Im Fall M = T sagt man auch einfach, D sei dicht. T heißt separabel, falls es eine abz¨ ahlbare dichte Teilmenge gibt. Auch diese Begriffe sind w¨ ortlich der metrischen Theorie entnommen. Einige Beispiele hierzu: • Wird T mit der indiskreten Topologie versehen, liegt jede nichtleere Teilmenge dicht. • Im Beispiel (e) liegt N dicht in Z, wie dort bemerkt wurde. • Wir betrachten auf RR die Topologie der punktweisen Konvergenz (Beispiel (f)) und behaupten, dass C(R) dicht liegt. Dazu ist zu zeigen, dass jede 3 Wenn im folgenden von topologischen Eigenschaften von R oder Rd ohne Spezifikation einer Topologie die Rede ist, ist stets die von der euklidischen Metrik abgeleitete Topologie (die nat¨ urliche Topologie“) gemeint. ” 4 Wer dieses Kapitel durchgearbeitet hat, wird sogar in der Lage sein, dies f¨ ur topologische R¨ aume S zu tun.
12
I.
Topologische R¨ aume
nichtleere offene Menge in RR eine stetige Funktion enth¨alt, d.h. (Bezeichnungen wie unter (f)) dass jedes UF,ε (f ) eine stetige Funktion enth¨alt. Das sieht man so: Schreibt man F = {s1 , . . . , sn }, w¨ ahle man einfach eine st¨ uckweise liur alle j; dann ist nat¨ urlich neare stetige Funktion g: R → R mit g(sj ) = f (sj ) f¨ g ∈ UF,ε (f ). Das Argument zeigt, wie schwach die Forderung an eine Funktion g ist, bez¨ uglich dieser Topologie in einer Umgebung von f zu liegen. Nun studieren wir Unterr¨ aume topologischer R¨aume. Ist T ein metrischer Raum und S ⊂ T , so wird S durch Einschr¨ ankung der Metrik auf S × S selbst ein metrischer Raum. Offensichtlich ist eine Teilmenge O ⊂ S genau dann offen in S, wenn O von der Form O′ ∩ S f¨ ur eine in T offene Teilmenge O′ ⊂ T ist. ¨ Diese Uberlegung gibt zu folgender Definition Anlass. Definition I.2.9 Sei (T, τ ) ein topologischer Raum und S ⊂ T . Dann heißt τ |S = {O′ ∩ S: O′ ∈ τ } die Relativtopologie (oder Spurtopologie) von τ auf S. Ist O ∈ τ |S , so nennt man O relativ offen in S, und S \ O heißt relativ abgeschlossen in S. Es ist klar, dass τ |S wirklich eine Topologie auf S ist. Hier noch ein Beispiel: Sei T = R mit der von der u ¨blichen Metrik induzierten Topologie versehen und S = [0, 2). Dann ist [0, 1) relativ offen in S, und [1, 2) ist relativ abgeschlossen in S. Lemma I.2.10 Sei (T, τ ) ein topologischer Raum und S ⊂ T . (a) Sei S offen in T , und sei O ⊂ S. Genau dann ist O relativ offen in S, wenn O offen in T ist. (b) Sei S abgeschlossen in T , und sei A ⊂ S. Genau dann ist A relativ abgeschlossen in S, wenn A abgeschlossen in T ist. Beweis. (a) Ist O offen, so ist O wegen O = O ∩ S auch relativ offen. Ist O relativ offen, so existiert eine offene Menge O′ mit O = O′ ∩ S. Da S offen ist, ist O auch offen. (b) wird genauso gezeigt. 2
I.3
Stetige Abbildungen
Wir versuchen als erstes, die Definition der Stetigkeit von Abbildungen zwischen metrischen R¨ aumen in eine Sprache ohne ε und δ zu u ¨ bersetzen. Seien (T1 , d1 ) und (T2 , d2 ) metrische R¨ aume und f : T1 → T2 eine Abbildung. Bekanntlich heißt f stetig bei t ∈ T1 , wenn ∀ε > 0 ∃δ > 0: d1 (s, t) < δ ⇒ d2 (f (s), f (t)) < ε.
(I.3)
I.3
Stetige Abbildungen
13
Bezeichnen wir die Kugeln in T1 bzw. T2 mit Ur (t) = {s ∈ T1 : d1 (s, t) < r}, Vr (t) = {s ∈ T2 : d2 (s, t) < r}, so heißt (I.3) ∀ε > 0 ∃δ > 0: s ∈ Uδ (t) ⇒ f (s) ∈ Vε (f (t)) bzw.
∀ε > 0 ∃δ > 0: Uδ (t) ⊂ f −1 Vε (f (t)) ,
und das heißt schließlich
• F¨ ur jede Umgebung V von f (t) ist f −1 (V ) eine Umgebung von t. Das legt folgende Definition nahe. Definition I.3.1 Seien (T1 , τ1 ) und (T2 , τ2 ) topologische R¨aume und f : T1 → ur jede Umgebung V von T2 eine Abbildung. f heißt stetig bei t ∈ T1 , wenn f¨ f (t) das Urbild f −1 (V ) eine Umgebung von t ist. f heißt stetig auf T1 , wenn f an jedem Punkt t ∈ T1 stetig ist. Offensichtlich reicht es f¨ ur die Stetigkeit von f bei t, dass f −1 (V ) eine Umgebung von t ist, wenn V eine Umgebungsbasis von t durchl¨auft. Satz I.3.2 F¨ ur eine Abbildung f zwischen topologischen R¨aumen T1 und T2 sind die folgenden Bedingungen ¨aquivalent. (i) f ist stetig. (ii) F¨ ur alle offenen Mengen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen Mengen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 . (iv) F¨ ur alle Mengen M ⊂ T1 gilt f (M ) ⊂ f (M ). Beweis. (i) ⇒ (ii): Sei t ∈ f −1 (O); dann ist f (t) ∈ O, also O eine offene Umgebung von f (t). Da f stetig ist, ist f −1 (O) eine Umgebung von t, d.h. t ist innerer Punkt von f −1 (O). Weil t beliebig war, ist f −1 (O) offen. (ii) ⇒ (iii): Klar durch Komplementbildung. (iii) ⇒ (iv): Sei A ⊂ T2 abgeschlossen mit f (M ) ⊂ A, also M ⊂ f −1 (A). Wegen (iii) gilt auch M ⊂ f −1 (A). Da A eine beliebige abgeschlossene Menge war, ist nach Definition des Abschlusses f (M ) ⊂ f (M ). (iv) ⇒ (i): Sei t ∈ T1 , und sei V eine offene Umgebung von f (t). Betrachte M = T1 \ f −1 (V ) und U = T1 \ M . Wegen (iv) folgt t ∈ U , weil f (M ) ⊂ f (M ) ⊂ T2 \ V = T2 \ V ist, denn M = {s: f (s) ∈ / V } und V ist offen. Da f (U ) ⊂ V , ist f −1 (V ) eine Umgebung von t, so dass f stetig bei t ist. Das war zu zeigen. 2 Achtung: (ii) besagt nicht, dass f offene Mengen auf offene Mengen abbildet (Abbildungen, die das leisten, heißen offen), und (iii) besagt nicht, dass f
14
I.
Topologische R¨ aume
abgeschlossene Mengen auf abgeschlossene Mengen abbildet (Abbildungen, die das leisten, heißen abgeschlossen). Zum Beispiel bildet die stetige Abbildung f : R2 → R, f (s, t) = s, die abgeschlossene Menge A = {(s, t): s ≥ 0, st ≥ 1} auf das Intervall (0, ∞) ab. Beispiele. (a) Tr¨ agt T1 die diskrete Topologie und ist T2 irgendein topologischer Raum, so ist jede Abbildung f : T1 → T2 stetig. (Das ist klar.) (b) Tr¨ agt T2 die indiskrete Topologie und ist T1 irgendein topologischer Raum, so ist ebenfalls jede Abbildung f : T1 → T2 stetig. (Das ist auch klar.) (c) Wir betrachten RR mit der Topologie der punktweisen Konvergenz. Dann ist bei festem s0 ∈ R die Abbildung ϕ: RR → R, ϕ(f ) = f (s0 ), stetig; R tr¨agt hier die u ¨ bliche Topologie. In der Tat gilt mit der Bezeichnung UF,ε (f ) = {g: R → R: |f (s) − g(s)| < ε ∀s ∈ F } (F ⊂ R endlich, ε > 0) ϕ(U{s0 },ε (f )) ⊂ {y ∈ R: |y − f (s0 )| < ε} =: Vε ,
d.h. U{s0 },ε (f ) ⊂ ϕ−1 (Vε ), so dass ϕ−1 (Vε ) eine Umgebung von f ist. Hingegen ist ψ: RR → R, ψ(f ) = lim supt→∞ arctan f (t), an jeder Stelle unstetig, denn kein UF,ε (f ) erf¨ ullt ψ(UF,ε (f )) ⊂ {y ∈ R: |y − ψ(f )| < 1}; wenn n¨amlich g an endlich vielen Stellen ε-nahe“ bei f liegt, sagt das nichts u ¨ber ” lim supt→∞ arctan g(t) aus. (d) Bisweilen ist es n¨ utzlich, verschiedene Topologien auf derselben Menge zu betrachten. Die Aussage id: (T, τ1 ) → (T, τ2 ) ist stetig heißt dann, dass jede τ2 -offene Menge auch τ1 -offen ist. Man nennt in diesem Fall τ1 feiner als τ2 und τ2 gr¨ober als τ1 . Zum Beispiel ist auf T = C(R) die Topologie der gleichm¨ aßigen Konvergenz auf Kompakta feiner als die Topologie der punktweisen Konvergenz (Beispiele I.2(f) und I.2(g)). In Satz I.3.2 kann die Implikation (i) ⇒ (ii) (bzw. (i) ⇒ (iii)) zu eleganten Beweisen der Offenheit (bzw. Abgeschlossenheit) von Mengen f¨ uhren. Betrachten wir etwa RR mit der Topologie der punktweisen Konvergenz. Mengen der Form (S ⊂ R eine beliebige Teilmenge) A = {g ∈ RR : |g(s) − f (s)| ≤ ε ∀s ∈ S}
sind aus folgendem Grund abgeschlossen: In Beispiel I.3(c) wurde die Stetigkeit der Auswertungsabbildungen ϕs : RR → R, ϕs (g) = g(s), gezeigt. Also sind Mengen der Form [f (s) − ε, f (s) + ε] As = {g ∈ RR : |g(s) − f (s)| ≤ ε} = ϕ−1 s abgeschlossen, und A = s∈S As ist es auch. Jetzt folgen einige allgemeine Bemerkungen u ¨ ber stetige Abbildungen.
I.3
Stetige Abbildungen
15
Satz I.3.3 Seien T1 , T2 und T3 topologische R¨aume. (a) Ist f : T1 → T2 stetig bei t und g: T2 → T3 stetig bei f (t), so ist die Komposition g ◦ f : T1 → T3 stetig bei t. Die Komposition stetiger Abbildungen ist also stetig. (b) Ist f : T1 → T2 stetig und wird S ⊂ T1 mit der Relativtopologie versehen, so ist die Restriktion f |S : S → T2 stetig. (c) Sei f : T1 → T2 eine Abbildung und f (T1 ) ⊂ N ⊂ T2 ; N werde mit der Relativtopologie versehen. Dann ist f : T1 → T2 genau dann stetig, wenn f˜: T1 → N stetig ist. Beweis. (a) Ist W eine Umgebung von g(f (t)), so ist V := g −1 (W ) eine Umgebung von f (t), da g stetig bei f (t) ist, und U := f −1 (V ) eine Umgebung von t, da f stetig bei t ist. Aber U = (g ◦ f )−1 (W ); daher gilt (a). (b) Sei O ⊂ T2 offen; dann ist (f |S )−1 (O) = f −1 (O) ∩ S relativ offen. (c) Schreiben wir j: N → T2 f¨ ur die identische Einbettung, so ist j nach Definition der Relativtopologie stetig. Also ist f = j ◦ f˜ nach (a) stetig, wenn f˜ es ist. Ist umgekehrt f stetig und O ⊂ N relativ offen, so schreibe O = O′ ∩ N mit einer offenen Menge O′ ⊂ T2 . Dann ist f˜−1 (O) = f −1 (O′ ) offen und daher f˜ stetig. 2 Satz I.3.4 Seien f, g: T → R stetige Funktionen auf einem topologischen Raum T ; R trage die ¨ ubliche Topologie. Dann sind auch die punktweise definierten Funktionen f + g, f − g, f · g und, falls g nie den Wert 0 annimmt, f /g stetig. Ferner ist f¨ ur λ ∈ R die Funktion λf stetig. Dieselben Aussagen gelten, wenn man R durch C ersetzt. Zum Beweis ben¨ otigen wir zuerst ein einfaches Lemma. Lemma I.3.5 Es sei T ein topologischer Raum, und es sei f : T → Rn , f (t) = (f1 (t), . . . , fn (t)), eine Abbildung. Dann ist f genau dann stetig, wenn alle Funktionen f1 , . . . , fn es sind. Dieselbe Aussage gilt f¨ ur Cn -wertige Abbildungen. Beweis. Da die pk : Rn → R, (x1 , . . . , xn ) → xk , stetig sind, folgt die Stetigkeit von fk = pk ◦ f aus der von f . Sei nun t ∈ T und V eine Umgebung von f (t). Ohne Einschr¨ ankung ist V von der Form V = {x ∈ Rn : |xk − fk (t)| < ε, k = 1, . . . , n}.
Sind die fk stetig, so ist Uk = fk−1 ({y ∈ R: |y − fk (t)| < ε}) eine Umgebung von t, daher auch U := U1 ∩ · · · ∩ Un . Aber es ist U = f −1 (V ), und das Lemma ist bewiesen. 2 Beweis von Satz I.3.4. Sind f und g stetig, so ist nach Lemma I.3.5 F : T → R2 , t → (f (t), g(t)), stetig. Da ferner die Abbildung add: R2 → R, (x, y) → x + y, stetig ist, ist auch add ◦ F = f + g stetig. Genauso argumentiert man in den u allen; bei der Division benutzt man die Stetigkeit von div: R×(R\{0}), ¨ brigen F¨ (x, y) → x/y. 2
16
I.
Topologische R¨ aume
Definition I.3.6 Eine bijektive Abbildung f zwischen topologischen R¨aumen heißt Hom¨oomorphismus, wenn f und f −1 stetig sind. Existiert ein Hom¨oomorphismus zwischen T1 und T2 , so heißen T1 und T2 hom¨oomorph. Zum Beispiel ist arctan: R → (−π/2, π/2) ein Hom¨oomorphismus. Damit ist R zum offenen Intervall (−π/2, π/2) und deshalb (sic!) zu jedem offenen Intervall (a, b) hom¨ oomorph. Ist f : T1 → T2 ein Hom¨ oomorphismus, so ist nach Definition eine Teilmenge O ⊂ T1 genau dann offen, wenn f (O) = (f −1 )−1 (O) ⊂ T2 offen ist. Vom topologischen Standpunkt sind die beiden R¨ aume dann nicht zu unterscheiden. Beispiel. (e) Hier ein weniger offensichtliches Beispiel eines Hom¨oomorphismus. Wir beschreiben zuerst die Konstruktion der Cantormenge C ⊂ [0, 1]: Aus [0, 1] entferne das offene mittlere Drittel O1 := (1/3, 2/3). Aus den beiden Restintervallen entferne wiederum die offenen mittleren Drittel O2 := (1/9, 2/9) und O3 := (7/9, 8/9). Aus den noch verbliebenen Restintervallen werden wieder die mittleren Drittel O4 , . . . , O7 entfernt etc. Was u ¨ brig bleibt, ist die Cantormenge C: ∞ Oj . C := [0, 1] \ j=1
Scharfes Hinsehen zeigt, dass C genau aus den Zahlen in [0, 1] besteht, die in der Entwicklung im Dreiersystem ohne die Ziffer 1 geschrieben werden k¨onnen, etwa 1/3 = 0.022222 . . . ; mit anderen Worten ist die Abbildung f : {0, 2}N → C,
(an ) →
∞
an 3−n
n=1
surjektiv. Sie ist auch injektiv. Es seien n¨ amlich a = (an ) und b = (bn ) zwei verschiedene Elemente von {0, 2}N, und es sei N der kleinste Index, f¨ ur den aN = bN gilt. Dann ist |f (b) − f (a)| ≥ 2 · 3−N − |bk − ak |3−k k>N
≥ 2·3
−N
−2
3−k = 3−N > 0.
(I.4)
k>N
Wir zeigen, dass f und f −1 stetig sind, wenn {0, 2}N die Topologie der punktweisen Konvergenz tr¨agt. Seien dazu zun¨ achst a ∈ {0, 2}N und ε > 0. Ist 3−m < ε und an = bn f¨ ur n = 1, . . . , m, so folgt 2 · 3−k = 3−m < ε. |f (b) − f (a)| ≤ k>m
Da diese b nach Definition der Topologie von {0, 1}N eine offene Umgebung von a bilden (n¨ amlich U{1,...,m},1 (a) in der Notation von Beispiel I.3(f)), zeigt das die
I.4 Konvergenz
17
Stetigkeit von f bei a. Schließlich sei U eine offene Umgebung von a der Form U{1,...,r},1 (a); solche Umgebungen bilden eine Umgebungsbasis von a. Erf¨ ullt x = f (b) die Absch¨ atzung |x − f (a)| < 3−r , so zeigt die gleiche Rechnung wie undet die Stetigkeit von f −1 , und damit ist in (I.4) b = f −1 (x) ∈ U . Das begr¨ N bewiesen, dass C und {0, 2} hom¨ oomorph sind.
I.4
Konvergenz
Nach den bisherigen Erfahrungen ist es leicht, den Begriff der konvergenten Folge von metrischen R¨ aumen auf topologische R¨aume auszudehnen. Definition I.4.1 Eine Folge (tn )n∈N in einem topologischen Raum T konvergiert gegen t ∈ T , wenn f¨ ur jede Umgebung U von t ein n0 ∈ N mit tn ∈ U f¨ ur alle n ≥ n0 existiert. Man schreibt tn → t. Wieder reicht es, die Umgebungen U eine Umgebungsbasis von t durchlaufen zu lassen. Im Unterschied zum metrischen Fall braucht der Limes einer konvergenten Folge in einem topologischen Raum nicht eindeutig bestimmt zu sein; tr¨agt n¨ amlich zum Beispiel T die indiskrete Topologie, so konvergiert jede Folge gegen jedes Element von T . Offenbar wird diese Pathologie durch den evidenten Mangel an offenen Mengen der indiskreten Topologie hervorgerufen. In der folgenden Definition f¨ uhren wir eine wichtige Reichhaltigkeitsbedingung ein, die derlei ausschließt. Definition I.4.2 Ein topologischer Raum heißt Hausdorffraum, falls zu verschiedenen Punkten disjunkte Umgebungen existieren. Beispiele. (a) Jeder metrische Raum (T, d) ist ein Hausdorffraum. Zu t1 = t2 betrachte n¨ amlich U = {t: d(t, t1 ) < ε} und V = {t: d(t, t2 ) < ε} f¨ ur ε = d(t1 , t2 )/2 > 0; dann ist nach der Dreiecksungleichung U ∩ V = ∅. (b) Weder ein indiskret topologisierter Raum mit mindestens zwei Elementen noch der Sierpi´ nski-Raum aus Beispiel I.2(d) sind Hausdorffr¨aume. (c) Sei S eine Menge; RS ist dann mit der Topologie der punktweisen Konvergenz ein Hausdorffraum. Seien n¨ amlich f1 = f2 Funktionen von S nach R. Dann existiert eine Stelle s mit f1 (s) = f2 (s). Setze ε = 21 |f1 (s) − f2 (s)|; dann sind U{s},ε (f1 ) und U{s},ε (f2 ) disjunkte Umgebungen von f1 und f2 . Lemma I.4.3 Ist T ein Hausdorffraum, so ist der Grenzwert einer konvergenten Folge eindeutig bestimmt. Beweis. Gelte tn → s und tn → t. W¨ are s = t, g¨abe es disjunkte Umgebungen U von s und V von t. Aber tn → s impliziert die Existenz einer nat¨ urlichen ur n ≥ n1 , und wegen tn → t folgt die Existenz einer Zahl n1 mit tn ∈ U f¨
18
I.
Topologische R¨ aume
nat¨ urlichen Zahl n2 mit tn ∈ V f¨ ur n ≥ n2 . F¨ ur n = max{n1 , n2 } ergibt sich daraus tn ∈ U ∩ V , also der Widerspruch U ∩ V = ∅. 2 In metrischen R¨ aumen gelingt es bekanntlich, Begriffe wie Abgeschlossenheit und Stetigkeit ¨ aquivalent durch Folgen auszudr¨ ucken. Zum Beispiel gilt: • Ist T ein metrischer Raum und M ⊂ T , so sind f¨ ur einen Punkt t ¨aquivalent: (i) t ∈ M . (ii) Es existiert eine Folge (tn ) in M mit tn → t. In topologischen R¨ aumen gilt zwar immer noch die Implikation (ii) ⇒ (i) (Beweis?), aber (i) ⇒ (ii) ist im allgemeinen falsch. Dazu betrachte folgendes Gegenbeispiel. Sei T = RR , versehen mit der Topologie τp der punktweisen Konvergenz. Wir u ¨ berlegen zuerst, dass eine Folge in dieser Topologie genau dann gegen f konvergiert, wenn sie punktweise konvergiert, d.h. wenn fn (t) → f (t)
∀t ∈ R.
(I.5)
Die Notwendigkeit dieser Bedingung ist klar, da f¨ ur jedes t ∈ R die Menge {g: |g(t) − f (t)| < ε} eine τp -Umgebung von f ist. Gilt umgekehrt (I.5) und ist U eine τp -Umgebung von f , die ohne Einschr¨ ankung von der Gestalt U = {g: |g(tk ) − f (tk )| < ε, k = 1, . . . , m} ur alle hinreichend großen n impliziert. (Die ist, so ist klar, dass (I.5) fn ∈ U f¨ Topologie der punktweisen Konvergenz tr¨ agt also ihren Namen zu Recht.) F¨ ur das angek¨ undigte Gegenbeispiel definiere jetzt M ⊂ RR als die Menge aller Indikatorfunktionen von h¨ ochstens abz¨ ahlbaren Teilmengen von R; mit anderen Worten geh¨ ort f zu M , falls es eine h¨ ochstens abz¨ahlbare Menge B mit
1 f¨ ur t ∈ B, f (t) = χB (t) = 0 f¨ ur t ∈ /B gibt. Die konstante Funktion 1 liegt dann im Abschluss von M , denn ist UF,ε (1) eine typische Umgebung von 1, so gilt ja χF ∈ M ∩ UF,ε (1), und Lemma I.2.5 liefert 1 ∈ M . Ist andererseits (χBn ) eine Folge in M , die punktweise gegen eine Funktion f konvergiert, so ist {t: f (t) = 0} h¨ochstens abz¨ahlbar; da R u ahlbar ist, kann keine Folge in M bzgl. τp gegen 1 konvergieren. ¨ berabz¨ Analysiert man den Beweis von (i) ⇒ (ii) im metrischen Fall, so stellt man fest, dass die konstruierte Folge (tn ) eigentlich“ nicht mit N, sondern mit ei” ner Umgebungsbasis von t indiziert ist, denn man w¨ahlt ja tn ∈ M ∩ U1/n (t). Das suggeriert, in topologischen R¨ aumen mit komplizierterer Umgebungsstruktur einen allgemeineren Konvergenzbegriff zu studieren. Die mengentheoretische
I.4
Konvergenz
19
Topologie kennt hier die Filterkonvergenz und die Netzkonvergenz. Beide Konzepte sind a ¨quivalent; da jedoch die Netzkonvergenz einfacher zu erkl¨aren ist und den Bed¨ urfnissen der Analysis angepasster erscheint, soll nur auf diese eingegangen werden. Definition I.4.4 (a) Eine gerichtete Menge ist eine mit einer Relation ≤ versehene Menge I, welche (1) i ≤ i ∀i ∈ I, (2) i ≤ j, j ≤ k ⇒ i ≤ k ∀i, j, k ∈ I, (3) ∀i1 , i2 ∈ I ∃j ∈ I i1 ≤ j, i2 ≤ j erf¨ ullt. (b) Ein Netz in einer Menge T ist eine Abbildung von einer gerichteten Menge I nach T ; man schreibt (ti )i∈I oder k¨ urzer (ti ). (c) Ein Netz (ti )i∈I in einem topologischen Raum T konvergiert gegen t ∈ T , wenn es f¨ ur jede Umgebung U von t (oder auch bloß f¨ ur jeur de Umgebung in einer Umgebungsbasis von t) ein i0 ∈ I mit ti ∈ U f¨ alle i ≥ i0 existiert. Bezeichnung: ti → t. Beispiele. (d) Da N mit der nat¨ urlichen Ordnung eine gerichtete Menge ist, ist jede Folge ein Netz. Definition I.4.4(c) verallgemeinert offensichtlich Definition I.4.1. (e) Seien T ein topologischer Raum, t ∈ T und U eine Umgebungsbasis von t. U wird durch U ≤ V ⇐⇒ U ⊃ V
eine gerichtete Menge; (3) ist erf¨ ullt, da der Schnitt zweier Umgebungen eine Umgebung ist und deshalb ein Mitglied von U umfasst. W¨ahlt man zu jedem U ∈ U ein Element tU ∈ U (das Auswahlaxiom gew¨ahrleistet dies), so hat man ein Netz (tU ) definiert. Nach Konstruktion gilt tU → t. (f) Sei I die Menge aller Paare (Z, B), wobei Z eine Zerlegung des Intervalls [a, b] mit endlich vielen Teilpunkten a = x0 < x1 < · · · < xn = b und B eine Belegung {ξ1 , . . . , ξn } mit xj−1 ≤ ξj ≤ xj ist. Setzt man (Z1 , B1 ) ≤ (Z2 , B2 ), falls Z1 ⊂ Z2 , so wird I zu einer gerichteten Menge. Sei nun f : [a, b] → R Riemann-integrierbar. Definiere J(Z,B) als die Riemann-Summe J(Z,B) =
n j=1
f (ξj )(xj − xj−1 ).
Das ist ein Netz in R. Nach einem Satz aus der Analysisvorlesung gilt J(Z,B) → b a f (x) dx.
Mit Netzen kann man (fast) genauso hantieren wie mit Folgen; es sei jedoch darauf hingewiesen, dass ein konvergentes Netz in R unbeschr¨ankt sein kann, etwa (ti ) = (1/i) mit i ∈ I = (0, ∞) und der u ¨blichen Ordnung ≤. Nun beweisen wir das Lemma I.4.3 f¨ ur Netze.
20
I.
Topologische R¨ aume
Lemma I.4.5 Ist T ein Hausdorffraum, so ist der Grenzwert eines konvergenten Netzes eindeutig bestimmt. Beweis. Der Beweis ist fast w¨ ortlich derselbe wie bei Lemma I.4.3. Gelte also ahle dann disjunkte Umgebungen U von s und ti → s und ti → t mit s = t; w¨ V von t. Wegen ti → s und ti → t gelten ∃i1 ∀i ≥ i1 ti ∈ U, ∃i2 ∀i ≥ i2 ti ∈ V.
Mit Bedingung (3) aus Definition I.4.4(a) w¨ ahle j ∈ I mit j ≥ i1 , j ≥ i2 . Es 2 folgt tj ∈ U ∩ V im Widerspruch zu U ∩ V = ∅. Mit Hilfe von Netzen kann jetzt der Abschluss einer Menge in einem topologischen Raum ad¨ aquat beschrieben werden. Satz I.4.6 Ist T ein topologischer Raum und M ⊂ T , so sind f¨ ur einen Punkt t ¨aquivalent: (i) t ∈ M . (ii) Es existiert ein Netz (ti ) in M mit ti → t. Beweis. (ii) ⇒ (i) folgt sofort aus Lemma I.2.5 und der Definition der Konvergenz. (i) ⇒ (ii): Sei U eine Umgebungsbasis von t. F¨ ur alle U ∈ U existiert ein Punkt tU ∈ U ∩M (Lemma I.2.5). Wie in Beispiel I.4(e) beobachtet, konvergiert das Netz (tU ) gegen t. 2 Satz I.4.7 Ist T ein topologischer Raum und A ⊂ T , so sind ¨aquivalent: (i) A ist abgeschlossen. (ii) Ist (ti ) ein Netz in A mit ti → t ∈ T , so gilt t ∈ A. Beweis. (i) ⇒ (ii): Nach Satz I.4.6 gilt t ∈ A = A. (ii) ⇒ (i): Wir zeigen A ⊂ A. Ist t ∈ A, so existiert nach Satz I.4.6 ein Netz (ti ) in A mit ti → t. Wegen (ii) ist t ∈ A. 2 Als n¨ achstes versuchen wir, die Stetigkeit von Abbildungen durch Konvergenzph¨ anomene zu beschreiben. Zuerst zum metrischen Fall. Ist f : T1 → T2 eine Abbildung zwischen metrischen R¨ aumen, so sind bekanntlich ¨aquivalent: (i) f ist stetig bei t0 . (ii) F¨ ur alle Folgen (tn ) gilt: tn → t0 ⇒ f (tn ) → f (t0 ).
Im Fall topologischer R¨ aume braucht die Implikation (ii) ⇒ (i) nicht mehr zu gelten. Als Gegenbeispiel betrachte wieder RR mit der Topologie der punktweisen Konvergenz und die Menge M = {χB : B h¨ochstens abz¨ahlbar} wie oben. Wir versehen S = M ∪ {1} ⊂ RR mit der Relativtopologie. Wir haben bereits
I.5 Kompakte R¨ aume
21
1 ∈ M gezeigt, d.h. M liegt dicht in S. Nun sei ϕ: S → R durch ϕ|M = 0 und ϕ(1) = 1 definiert. Wegen ϕ−1 ((0, 2)) = {1}, was keine Umgebung von 1 ist, ist ϕ nicht stetig bei 1. Ist aber (fn ) eine Folge in S mit fn → 1, so wurde oben onnen. Also ist (ii) erf¨ ullt. gezeigt, dass nur endlich viele fn ∈ M sein k¨ Wieder bekommt man einen allgemein g¨ ultigen Satz, wenn man mit Netzen arbeitet. Satz I.4.8 Ist f : T1 → T2 eine Abbildung zwischen topologischen R¨aumen, so sind ¨aquivalent: (i) f ist stetig bei t0 . (ii) F¨ ur alle Netze (ti ) gilt: ti → t0 ⇒ f (ti ) → f (t0 ). Beweis. (i) ⇒ (ii): Sei f stetig bei t0 und gelte ti → t0 . Sei V eine Umgebung von f (t0 ). Da f −1 (V ) eine Umgebung von t0 ist, existiert ein i0 mit ti ∈ f −1 (V ) f¨ ur i ≥ i0 , das heißt f (ti ) ∈ V f¨ ur i ≥ i0 . Es folgt f (ti ) → f (t0 ). (ii) ⇒ (i): Wir nehmen an, f sei unstetig bei t0 . Dann existiert eine Umgebung V von f (t0 ), so dass f −1 (V ) keine Umgebung von t0 ist. Sei U eine Umgebungsbasis von t0 . F¨ ur kein U ∈ U gilt also f (U ) ⊂ V ; zu jedem U ∈ U / V . Daher konvergiert das Netz (tU ) gegen existiert also ein tU ∈ U mit f (tU ) ∈ t0 , aber (f (tU )) konvergiert nicht gegen f (t0 ). 2
I.5
Kompakte R¨ aume
Ein f¨ ur die Analysis zentraler topologischer Begriff ist die Kompaktheit, da sich in kompakten topologischen R¨ aumen h¨ aufig elegant Existenzaussagen beweisen lassen. Definition I.5.1 Ein topologischer Raum T heißt kompakt, wenn jede offene ¨ Uberdeckung eine endliche Teil¨ uberdeckung besitzt. Ausf¨ uhrlich bedeutet das: • Sei T mit von I eine Indexmenge, und seien Oi , i ∈ I, offene Teilmengen n mit O , . . . , O O = T . Dann existieren endlich viele O in i1 k=1 ik = i∈I i T. Achtung: Manche Autoren nennen diese Eigenschaft quasikompakt und fordern zur Kompaktheit zus¨ atzlich die Hausdorffeigenschaft. Definition I.5.2 Ist T ein topologischer Raum und S ⊂ T , so heißt S kompakt, wenn S in der Relativtopologie kompakt ist. S heißt relativkompakt, wenn S kompakt ist. Den ersten Teil dieser Definition kann man ¨aquivalent so umschreiben:
22
I.
Topologische R¨ aume
• Sei I eineIndexmenge, und seien Oi , i ∈ I, offene Teilmengen von T mit n S ⊂ i∈I Oi . Dann existieren endlich viele Oi1 , . . . , Oin mit S ⊂ k=1 Oik .
¨ amlich eine offene Uberdeckung (bzgl. der RelativtoDie Oi′ = Oi ∩ S bilden n¨ pologie) von S im Sinn von Definition I.5.1. Aus der Definition I.5.2 ergibt sich, dass der Begriff der Kompaktheit eines Teilraums S ⊂ T – anders als bei der Offenheit und der Abgeschlossenheit – unabh¨ angig vom Oberraum T ist. Auch die Relativkompaktheit h¨angt vom Oberraum ab. Satz I.5.3 (a) Ist T ein kompakter topologischer Raum und S ⊂ T abgeschlossen, so ist S ebenfalls kompakt. (b) Ist T ein Hausdorffraum und S ⊂ T kompakt, so ist S abgeschlossen in T. (c) Ist T1 kompakt und f : T1 → T2 stetig, so ist f (T1 ) kompakt. (d) Sind T1 und T2 Hausdorffr¨aume, f : T1 → T2 stetig und bijektiv sowie T1 kompakt, so ist f −1 stetig. Mit anderen Worten sind T1 und T2 hom¨oomorph. Beweis. (a) Seien Oi , i ∈ I, offene Teilmengen von T und S ⊂ i∈I Oi . Dann ¨ von T , die nach bilden die Oi zusammen mit T \ S eine offene Uberdeckung n Voraussetzung eine endliche Teil¨ uberdeckung besitzt. Also gilt S ⊂ k=1 Oik mit geeigneten Oi1 , . . . , Oin . (b) Wir zeigen, dass T \ S offen ist. Sei dazu t ∈ T \ S; wir werden eine Umgebung V von t mit V ∩ S = ∅ konstruieren. Zu s ∈ S w¨ahle disjunkte offene Umgebungen U von s und V von t. Insbesondere gilt S ⊂ s s s∈S Us , also auch n n ur geeignete s1 , . . . , sn , da S kompakt ist. W¨are k=1 Vsk ∩S = ∅, S ⊂ k=1 Usk f¨ ur ein j im g¨ abe es ein s ∈ S mit s ∈ Vsk f¨ ur alle k. Andererseits w¨are s ∈ Usj f¨ unschte. Widerspruch zu Usj ∩ Vsj = ∅. Also leistet V = nk=1 Vsk das Gew¨ ¨ (c) Sei (Vi )i∈I eine offene Uberdeckung von f (T1 ). Dann ist (f −1 (Vi ))i∈I ¨ eine offene Uberdeckung von T1 , die eine endliche Teil¨ uberdeckung f −1 (Vi1 ), . . . , uberdeckung von f (T1 ), f −1 (Vin ) besitzt. Also ist Vi1 , . . . , Vin eine endliche Teil¨ und f (T1 ) ist kompakt. (d) Nach Satz I.3.2(iii) ist zu zeigen, dass f¨ ur alle abgeschlossenen Mengen A ⊂ T1 auch f (A) = (f −1 )−1 (A) in T2 abgeschlossen ist. Aber solch ein A ist nach (a) kompakt, und nach (c) ist f (A) ebenfalls kompakt. Teil (b) impliziert die Abgeschlossenheit von f (A). 2 Da nach dem Satz von Heine-Borel genau die abgeschlossenen und beschr¨ankten Teilmengen von Rd (bzw. Cd ) kompakt sind, impliziert Satz I.5.3(c) insbesondere:
I.5
Kompakte R¨ aume
23
• Ist T kompakt und f : T → R stetig, so ist f beschr¨ankt und nimmt sein Supremum und Infimum an. Außerdem kann man Satz I.5.3(b) und (c) gelegentlich benutzen, um die Abgeschlossenheit einer Menge zu zeigen; ein Beispiel findet sich im Beweis von Lemma II.3.18 auf Seite 88. Im Fall metrischer R¨ aume kann die Kompaktheit ¨aquivalent als Folgenkompaktheit beschrieben werden. Im folgenden Satz bleibt im allgemeinen keine der Implikationen (i) ⇒ (ii) bzw. (ii) ⇒ (i) f¨ ur topologische R¨aume richtig; Gegenbeispiele folgen auf Seite 29. Satz I.5.4 F¨ ur einen metrischen Raum (T, d) sind ¨aquivalent: (i) T ist kompakt. (ii) Jede Folge in T hat eine konvergente Teilfolge ( T ist folgenkompakt“). ” Beweis. (i) ⇒ (ii): Falls (tn ) eine Folge ohne konvergente Teilfolge ist, kann kein t ∈ T H¨ aufungspunkt von (tn ) sein. F¨ ur jedes t ∈T existiert also εt > 0 alt. Da T = t∈T Uεt (t) gilt, reichen derart, dass Uεt (t) nur endlich viele tn enth¨ nach (i) endlich viele der Uεt (t) aus, um T zu u ¨ berdecken. Also enthielte T nur endlich viele der tn : Widerspruch! (ii) ⇒ (i): Dies ist die schwierigere Implikation. Wir zeigen zuerst: • F¨ ur alle ε > 0 existieren endlich viele t1 , . . . , tN ∈ T mit T =
N
Uε (tk ).
(I.6)
k=1
W¨ are dies falsch, g¨ abe es ε > 0, so dass f¨ ur alle n ∈ N und alle t1 , . . . , tn ∈ T n
Uε (tk ) T
k=1
gilt. Wir werden nun induktiv eine Folge ohne konvergente Teilfolge konstruieren. Sei t1 ∈ T beliebig. Wegen Uε (t1 ) = T existiert t2 ∈ T mit d(t2 , t1 ) ≥ ε. Nun ur k = 1, 2. ist auch Uε (t1 ) ∪ Uε (t2 ) = T , also existiert t3 ∈ T mit d(t3 , tk ) ≥ ε f¨ So fortfahrend, erh¨ alt man eine Folge (tn ) in T , f¨ ur die d(tn , tk ) ≥ ε f¨ ur alle k < n gilt. Es ist klar, dass keine Teilfolge von (tn ) eine Cauchyfolge sein kann; daher enth¨ alt (tn ) erst recht keine konvergente Teilfolge. Damit ist die Hilfsbehauptung gezeigt. Nehmen wir nun an, T sei folgenkom¨ die keine endliche Teil¨ uberdeckung pakt und (Oi ) sei eine offene Uberdeckung, (1) (1) besitzt. Sei ε1 = 1, und w¨ ahle t1 , . . . , tN1 gem¨aß (I.6). Mindestens eine der
24
I.
Topologische R¨ aume (1)
(1)
Kugeln Uε1 (tk ) kann dann nicht endlich u ¨ berdeckbar sein, sagen wir Uε1 (t1 ). (2) (2) Nun sei ε2 = 12 , und es seien t1 , . . . , tN2 gem¨ aß (I.6) gew¨ahlt. Es folgt (1)
Uε1 (t1 ) =
N2 (2) (1) Uε1 (t1 ) ∩ Uε2 (tk ) ,
k=1
(1)
(2)
und eine dieser Mengen, sagen wir Uε1 (t1 ) ∩ Uε2 (t1 ), kann nicht endlich u ¨ berdeckbar sein. Nun wenden wir (I.6) mit ε3 = 41 an, und wir erhalten einen Punkt (3) t1 , so dass (3) (2) (1) Uε1 (t1 ) ∩ Uε2 (t1 ) ∩ Uε3 (t1 ) nicht endlich u ¨ berdeckbarist. Nach diesem Schema konstruieren wir mit εn = n 21−n Punkte sn , so dass k=1 Uεk (sk ) f¨ ur kein n ∈ N endlich u ¨berdeckbar ist. Insbesondere ist stets Uεn (sn ) ∩ Uεn+1 (sn+1 ) = ∅. Betrachte die so entstandene Folge (sn ). Sie ist wegen d(sn+1 , sn ) ≤ εn + εn+1 ≤ 22−n eine Cauchyfolge. Andererseits enth¨alt sie nach Voraussetzung (ii) eine konvergente Teilfolge. Deswegen muss sie selbst konvergent sein, etwa sn → ahle i0 mit s0 ∈ Oi0 . Da Oi0 offen ist, ist s0 . W¨ η := inf{d(s0 , s): s ∈ / Oi0 } > 0. W¨ ahle n so groß, dass d(sn , s0 ) < η/2 und 21−n < η/2 ausf¨allt. Dann ist Uε1 (s1 ) ∩ · · · ∩ Uεn (sn ) ⊂ Uεn (sn ) ⊂ Uη (s0 ) ⊂ Oi0 , also Uε1 (s1 ) ∩ · · · ∩ Uεn (sn ) endlich u ¨berdeckbar (n¨amlich durch ein einziges Oi ) im Widerspruch zur Konstruktion der sn . Damit ist die Implikation (ii) ⇒ (i) bewiesen. 2 Als Anwendung geben wir ein Kompaktheitskriterium f¨ ur R¨aume stetiger Funktionen. Sei S kompakt. Dann ist die Menge C(S) aller reellwertigen Funktionen auf S ein Vektorraum, auf dem f ∞ = sup |f (s)| (< ∞!) s∈S
eine Norm definiert. Wir benutzen, dass C(S) mit der davon abgeleiteten Metrik d(f, g) = f − g∞ ein vollst¨ andiger metrischer Raum ist (Aufgabe I.9.18 oder Beispiel V.1(c)). Satz I.5.5 (Satz von Arzel` a-Ascoli) Sei (S, d) ein kompakter metrischer Raum, und sei M ⊂ C(S), wobei C(S) wie oben mit der Metrik der gleichm¨aßigen Konvergenz versehen wird. Die Teilmenge M habe die Eigenschaften (a) M ist beschr¨ankt,
I.5
Kompakte R¨ aume
25
(b) M ist abgeschlossen, (c) M ist gleichgradig stetig, d.h. ∀ε > 0 ∃δ > 0 ∀f ∈ M
d(s, t) ≤ δ
⇒
|f (s) − f (t)| ≤ ε.
Dann ist M kompakt. Beweis. Zuerst wird gezeigt, dass S separabel ist. Da S kompakt ist, besitzt – ¨ bei gegebenem ε > 0 – die Uberdeckung s∈S {t ∈ S: d(s, t) < ε} eine endliche (n) (n) Teil¨ uberdeckung. Es existieren also zu n ∈ N endlich viele s1 , . . . , smn ∈ S mit mn (n) (n) S = k=1 {t ∈ S: d(sk , t) < n1 }. Es folgt, dass die abz¨ahlbare Menge {sk : 1 ≤ k ≤ mn , n ∈ N} dicht liegt. Nun zum eigentlichen Beweis, der ein Diagonalfolgenargument benutzt. Wir betrachten eine dichte abz¨ ahlbare Menge {s1 , s2 , . . . } ⊂ S und eine Folge (fn ) in M . Wir zeigen, dass es eine gleichm¨ aßig Teilfolge gibt. konvergente Da M beschr¨ ankt ist, ist die Folge fn (s1 ) in K beschr¨ankt und besitzt daher eine konvergente Teilfolge fn1 (s1 ), fn2 (s1 ), fn3 (s1 ), . . . .
ankt, und eine geeignete Teilfolge dieser Folge, Auch die Folge fni (s2 ) ist beschr¨ etwa fm1 (s2 ), fm2 (s2 ), fm3 (s2 ), . . . konvergiert. Nochmalige Ausd¨ unnung beschert uns eine konvergente Teilfolge fp1 (s3 ), fp2 (s3 ), fp3 (s3 ), . . . ,
etc. Die Diagonalfolge g1 = fn1 , g2 = fm2 , g3 = fp3 , . . . hat daher die Eigenschaft gi (sn ) i∈N konvergiert f¨ ur alle n ∈ N.
Wir werden nun die gleichgradige Stetigkeit benutzen, um die gleichm¨aßige Konvergenz von (gi )i∈N zu zeigen. Dazu beweisen wir, dass (gi ) bzgl. der Metrik der Supremumsnorm eine Cauchyfolge bildet. Sei ε > 0, und w¨ ahle δ > 0 gem¨ aß (c). Dann existieren endlich viele offene Kugeln vom Radius δ/2, etwa U1 , . . . , Up , die S u ¨ berdecken (siehe oben). Jede Kugel enth¨ alt dann eines der sn , sagen wir snk ∈ Uk . Nun w¨ahle i0 = i0 (ε) mit |gi (snk ) − gj (snk )| ≤ ε
∀i, j ≥ i0 , k = 1, . . . , p.
(I.7)
Jetzt betrachte ein beliebiges s ∈ S; s liegt dann in einer der u ¨ berdeckenden Kugeln, etwa s ∈ Uκ . Es folgt d(s, snκ ) < δ und daher nach (c) |gi (s) − gi (snκ )| ≤ ε
∀i ∈ N.
(I.8)
26
I.
Topologische R¨ aume
Also implizieren (I.7) und (I.8) f¨ ur i, j ≥ i0 |gi (s) − gj (s)| ≤ |gi (s) − gi (snκ )| + |gi (snκ ) − gj (snκ )| + |gj (snκ ) − gj (s)| ≤ 3ε. Das zeigt gi − gj ∞ ≤ 3ε f¨ ur i, j ≥ i0 , und (gi ) ist eine Cauchyfolge. Da M abgeschlossen ist, liegt ihr Limes in M , und die Kompaktheit von M ist bewiesen. 2 Derselbe Beweis liefert: • (a) & (c) ⇒ M relativkompakt. Zur¨ uck zur Kompaktheit in allgemeinen topologischen R¨aumen. Es sollen verschiedene a ¨quivalente Umformungen des Kompaktheitsbegriffs beschrieben werden. Wie bereits im Zusammenhang mit Satz I.5.4 bemerkt wurde, sind Kompaktheit und Folgenkompaktheit f¨ ur topologische R¨aume v¨ollig verschiedene Eigenschaften; Beispiele folgen auf Seite 29. Wieder muss man Netze ins Spiel bringen. Leider ist der ad¨ aquate Begriff eines Teilnetzes etwas kompliziert. Sei (ti )i∈I ein Netz, J eine weitere gerichtete Menge und ϕ: J → I eine Abbildung mit ∀i ∈ I ∃j0 ∈ J ∀j ≥ j0 ϕ(j) ≥ i. Dann heißt (tϕ(j) )j∈J ein Teilnetz von (ti )i∈I . Jedes Teilnetz eines konvergenten Netzes konvergiert gegen denselben Grenzwert. Ein Teilnetz eines Netzes alt manche der ti , diese jedoch eventuell sehr h¨aufig, was das Konzept (ti ) enth¨ des Teilnetzes von dem einer Teilfolge unterscheidet. In der Tat werden wir im Beweis von Lemma I.5.6 ein Teilnetz angeben, das jedes der ti unendlich oft enth¨ alt. F¨ ur den folgenden Satz ist noch ein Begriff wichtig. Ein Netz (ti ) liegt schließlich in einer Menge M ⊂ T , falls ein i0 ∈ I mit ti ∈ M f¨ ur alle i ≥ i0 existiert. Eine Netz heißt universell, wenn es f¨ ur alle M ⊂ T entweder schließlich in M oder schließlich in T \ M liegt. Universelle Netze sind schwer zu visualisieren, und tats¨ achlich ist es noch niemandem gelungen, ein solches (außer den schließlich konstanten Netzen) konkret anzugeben. Mit Hilfe des Zornschen Lemmas kann man aber ihre Existenz beweisen. Lemma I.5.6 Jedes Netz besitzt ein universelles Teilnetz. Beweis. Sei (ti ) ein Netz in T . Betrachte die Schw¨anze“ Si = {ti′ : i′ ≥ i} ” sowie S = {Si : i ∈ I}. Nennt man eine Familie F von Teilmengen von T eine Filterbasis, falls kein F ∈ F leer ist und zu F1 , F2 ∈ F ein F ∈ F mit F ⊂ F1 ∩ F2 existiert, so ist S eine Filterbasis. Sei X das System aller S umfassenden Filterbasen. Bez¨ uglich der Inklusion ist X induktiv geordnet, und das Zornsche Lemma liefert eine maximale Familie U ∈ X; die Maximalit¨at von U impliziert insbesondere T ∈ U.
I.5
Kompakte R¨ aume
27
Als n¨ achstes beobachten wir, dass U die bizarre Eigenschaft zukommt, f¨ ur jede Teilmenge von T entweder diese selbst oder ihr Komplement zu enthalten. Ist n¨ amlich M ⊂ T , so gilt M ∩ U = ∅ f¨ ur alle U ∈ U oder (T \ M ) ∩ U = ∅ f¨ ur alle U ∈ U, denn andernfalls existierten U, V ∈ U mit M ∩ U = ∅ und (T \ M ) ∩ V = ∅, so dass U und V disjunkt sind im Widerspruch zur Definition von X. Nehmen wir M ∩ U = ∅ f¨ ur alle U ∈ U an, so ist U ∪ {U ∩ M : U ∈ U} ∈ X, und wegen der Maximalit¨ at von U gilt M = T ∩ M ∈ U. Im verbleibenden Fall erh¨alt man analog T \ M ∈ U. Nun versehen wir Φ = {(U, i) ∈ U×I: ti ∈ U } mit der Relation (U, i) ≥ (V, j), falls U ⊂ V und i ≥ j. Φ ist eine gerichtete Menge, denn zu (U1 , i1 ), (U2 , i2 ) ∈ Φ w¨ahle V ∈ U mit V ⊂ U1 ∩ U2 und j ∈ I mit j ≥ i1 , j ≥ i2 . Da Sj ∈ U, ist Sj ∩ V = ∅; d.h. es existiert k ≥ j mit tk ∈ V . Also dominiert (V, k) ∈ Φ sowohl (U1 , i1 ) als auch (U2 , i2 ). Mittels ϕ: Φ → I, (U, i) → i, wird ein Teilnetz (tϕ(U,i) ) von (ti ) definiert, das nach Konstruktion schließlich in allen U ∈ U verl¨auft. Die im letzten Absatz gemachte Beobachtung liefert, dass es ein universelles Teilnetz ist. 2 Das im vorigen Beweis konstruierte“ Mengensystem U ist ein Beispiel eines ” Ultrafilters. Satz I.5.7 F¨ ur einen topologischen Raum T sind ¨aquivalent: (i) T ist kompakt. (ii) T hat die endliche Durchschnittseigenschaft, d.h., sind Ai (i ∈ I) ab A = ∅, so existieren endliche geschlossene Teilmengen von T mit i∈I i n viele Indizes i1 , . . . , in mit k=1 Aik = ∅.
(iii) Jedes universelle Netz in T konvergiert.
(iv) Jedes Netz in T hat ein konvergentes Teilnetz. Beweis. (i) ⇔ (ii) folgt sofort durch Komplementbildung. (i) ⇒ (iii): Wir nehmen an, es existiere ein nicht konvergentes universelles Netz (ti ). F¨ ur alle t ∈ T gibt es dann eine offene Umgebung Ut , so dass (ti ) nicht schließlich in Ut liegt; weil das Netz universell ist, muss (ti ) schließlich in T \ Ut liegen. W¨ ahlt uberdeckung Ut1 ∪ · · · ∪ Utn der man eine endliche Teil¨ ¨ U , erh¨ a lt man den Widerspruch, dass (ti ) schließlich offenen Uberdeckung t∈T t in (T \ Ut1 ) ∩ · · · ∩ (T \ Utn ) = ∅ liegt. (iii) ⇒ (iv) ist klar nach Lemma I.5.6. (iv) ⇒ (i): Nehmen wir an, (iv) gelte, aber T sei nicht kompakt. Dann ¨ uberdeckung existiert eine offene Uberdeckung i∈I Ui , die keine endliche Teil¨ zul¨ asst. Bezeichnet Φ die Menge der endlichen Teilmengen von I, so existiert also zu jedem F ∈ Φ ein tF ∈ T \ i∈F Ui . Da Φ in nat¨ urlicher Weise eine gerichtete Menge ist, haben wir so ein Netz definiert. W¨ are (tϕ(j) )j∈J ein konvergentes
28
I.
Topologische R¨ aume
Teilnetz, so existierte ein Grenzwert t und weiter ein Index i mit t ∈ Ui . Aber tϕ(j) ∈ / Ui , falls ϕ(j) ≥ {i}, im Widerspruch zur angenommenen Konvergenz. 2 Die wohl wichtigste Stabilit¨ atsaussage u ¨ ber kompakte R¨aume ist der Satz von Tikhonov. Um ihn zu formulieren, brauchen wir das Konzept der Produkttopologie. Es sei A eine Indexmenge, und Tα sei f¨ ur jedes α ∈ A ein topologischer Raum. Das mengentheoretische Produkt der Tα ist
Tα = {f : A → Tα : f (α) ∈ Tα ∀α ∈ A} . α∈A
Stimmen alle Tα u ¨ berein, sagen wir Tα = T , schreibt man auch T A ; T A besteht also aus allen Funktionen von A nach T . Das Auswahlaxiom impliziert, dass
Tα nicht leer ist. Nun beschreiben wir die Produkttopologie. Eine Teilmenge ur alle t ∈ O endlich O ⊂ Tα heißt offen (in der Produkttopologie), wenn es f¨ viele Indizes α1 , . . . , αk und in Tαj offene Mengen Oαj (j = 1, . . . , k) mit
t ∈ s ∈ Tα : s(αj ) ∈ Oαj ∀j = 1, . . . , k ⊂ O
gibt. (Mit anderen Worten haben wir so eine Umgebungsbasis von t beschrieben; siehe Satz I.2.7.) F¨ ur A = R und Tα = R f¨ ur alle α stimmt die Produkttopologie von Tα nach Konstruktion mit der Topologie der punktweisen Konvergenz auf RR u ¨berein. Die Produkttopologie hat folgende Eigenschaften.
Lemma I.5.8 Bezeichnet πβ die
kanonische Abbildung Tα → Tβ , t → t(β), so ist eine Abbildung f : S → Tα (S ein topologischer Raum) genau dann stetig, wenn es alle π ◦ f : S → T β β sind, und ein Netz (ti )i∈I konvergiert genau
dann in Tα gegen t, wenn alle πβ (ti ) i∈I in Tβ gegen πβ (t) konvergieren.
Beweis. Nach Konstruktion der Produkttopologie sind alle πβ stetig; daher gelten f¨ ur alle β nach Satz I.3.3(a) und Satz I.4.8 f stetig ⇒ πβ ◦ f stetig, ti → t ⇒ πβ (ti ) → πβ (t).
Sind alle πβ ◦ f stetig und ist V eine Umgebung von f (s), so existieren nach Definition der Produkttopologie endlich viele α1 , . . . , αr und offene Mengen Oα1 , . . . , Oαr in Tα1 , . . . , Tαr mit f (s) ∈ {t: t(αj ) ∈ Oαj , j = 1, . . . , r} ⊂ V, d.h. also
παj (f (s)) ∈ Oαj s∈
r
j=1
∀j = 1, . . . , r,
(παj ◦ f )−1 (Oαj ) =: U.
I.5
Kompakte R¨ aume
29
Nun ist die Menge U nach Annahme offen, und es gilt U ⊂ f −1 (V ). Daher ist f stetig bei s. Schließlich gelte πβ (ti ) → πβ (t) f¨ ur ein Netz (ti ) und alle β. Sei V eine Umgebung von t; wie oben existieren dann offene Mengen Oαj ⊂ Tαj , j = 1, . . . , r, mit t ∈ {t′ : t′ (αj ) ∈ Oαj , j = 1, . . . , r} ⊂ V. Wegen παj (ti ) → παj (t) existieren Indizes i1 , . . . , ir mit i ≥ ij ⇒ παj (ti ) ∈ Oαj . Nach Definition einer gerichteten Menge existiert ein Index i′ mit i′ ≥ ij f¨ ur j = 1, . . . , r und deshalb i ≥ i′ ⇒ ti ∈ V. Daher gilt ti → t.
2
Die Produkttopologie ist also stets die Topologie der punktweisen (oder koordinatenweisen) Konvergenz. Nun k¨ onnen wir den fundamentalen Satz von Tikhonov formulieren und beweisen. Theorem I.5.9
(Satz von Tikhonov) Das Produkt Tα kompakter R¨aume ist kompakt.
Beweis. Der Beweis kann schnell uhrt Sei werden.
mit Hilfe von Satz I.5.7 gef¨ (ti )i∈I ein universelles Netz in Tα . F¨ ur jedes α ∈ A ist dann πα (ti ) i∈I ein universelles Netz in Tα , also nach Satz I.5.7 konvergent. Gem¨aß Lemma I.5.8 ist (ti )i∈I selbst konvergent. Eine nochmalige Anwendung von Satz I.5.7 liefert die Behauptung des Theorems. 2 Jetzt sind wir in der Lage, die oben versprochenen Gegenbeispiele zu formulieren. • Ein folgenkompakter Raum, der nicht kompakt ist: Sei wie auf Seite 18 M ⊂ RR die Menge aller Indikatorfunktionen χB mit h¨ochstens abz¨ ahlbaren Mengen B. Wie auf Seite 18 sieht man, dass M in RR , versehen mit der Topologie der punktweisen Konvergenz, also der Produkttopologie, nicht abgeschlossen ist, denn 1 ∈ M \ M ; insbesondere ist M nicht kompakt (Satz I.5.3(b)). Ist (χBn ) eine Folge in M , so ist n Bn h¨ochstens abz¨ ahlbar, und mit Hilfe eines Diagonalfolgenarguments zeigt man die Existenz einer punktweise konvergenten Teilfolge, etwa mit Grenzwert f . Es ist klar, dass ochstens abz¨ahlbar ist, d.h. χB ∈ M . f selbst eine Indikatorfunktion χB und B h¨ Deshalb ist M folgenkompakt. • Ein kompakter Raum, der nicht folgenkompakt ist: Sei S = {(sn ): 0 ≤ sn ≤ 1 ∀n} die Menge aller Folgen in [0, 1]. Dann ist T := [0, 1]S in der Produkttopologie nach dem Satz von Tikhonov kompakt.
30
I.
Topologische R¨ aume
Betrachte nun zu k ∈ N die Funktion fk : S → [0, 1], (sn ) → sk . Dann hat die Folge (fk ) in T keine konvergente Teilfolge. W¨ are n¨amlich (fkj ) eine solche, so w¨ are f¨ ur alle s ∈ S die Folge (fkj (s)) = (skj ) konvergent (warum?). Das stimmt ur n = k2j , sn = 0 sonst, sieht. aber nicht, wie man an der Folge s mit sn = 1 f¨
I.6
Zusammenh¨ angende R¨ aume
W¨ ahrend der topologische Raum R aus einem St¨ uck“ zu bestehen scheint, ist ” [0, 1] ∪ [2, 3] unzusammenh¨ angend“. Das soll im folgenden pr¨azisiert werden. ” Definition I.6.1 Ein topologischer Raum T heißt unzusammenh¨angend, wenn es nichtleere offene disjunkte Teilmenge O1 , O2 von T mit T = O1 ∪ O2 gibt. Andernfalls heißt T zusammenh¨angend. Eine Teilmenge von T heißt zusammenh¨angend, wenn sie in der Relativtopologie einen zusammenh¨angenden topologischen Raum bildet. Ist T unzusammenh¨ angend mit T = O1 ∪ O2 wie oben, so ist O1 nicht nur offen, sondern als Komplement der offenen Menge O2 auch abgeschlossen5. Der Raum T ist also genau dann zusammenh¨ angend, wenn ∅ und T die einzigen Teilmengen sind, die gleichzeitig offen und abgeschlossen sind. Offensichtlich ist M ⊂ T genau dann unzusammenh¨angend, wenn es offene Teilmengen O1 , O2 von T mit O1 ∩M = ∅, O2 ∩M = ∅, (O1 ∩M )∩(O2 ∩M ) = ∅ und M ⊂ O1 ∪ O2 gibt. Beispiele. (a) Jeder indiskret topologisierte Raum ist zusammenh¨angend (klar), auch der Sierpi´ nski-Raum aus Beispiel I.2(d) ist zusammenh¨angend (auch klar). (b) Das zu Beginn des Abschnitts angedeutete Beispiel M = [0, 1] ∪ [2, 3] ist wirklich unzusammenh¨ angend im Sinn der obigen Definition. Auch Q ist unzusammenh¨ angend, da Q = {t ∈ Q: t2 < 2} ∪ {t ∈ Q: t2 > 2} ist und diese beiden Mengen relativ offen sind. (c) Jedes Teilintervall I von R ist zusammenh¨angend. Zum Beweis dieser Aussage nehme man das Gegenteil an; es existieren dann offene Teilmenge O1 , O2 ⊂ R mit I ⊂ O1 ∪ O2 , (O1 ∩ I) ∩ (O2 ∩ I) = ∅ und O1 ∩ I = ∅, ahle α ∈ O1 ∩ I, β ∈ O2 ∩ I, wobei ohne Einschr¨ankung α < β O2 ∩ I = ∅. W¨ sei. Da I ein Intervall ist, ist (α, β) ⊂ I. Betrachte nun γ = sup{t ∈ (α, β): (α, t] ⊂ O1 }. (Da O1 offen und α ∈ O1 ist, gibt es solche t.) Weil O1 ∩ I relativ abgeschlossen ist, gilt (α, γ] ⊂ O1 , und es ist γ < β, weil O1 ∩ I und O2 ∩ I disjunkt sind. Wiederum wegen der Offenheit von O1 existiert ein ε > 0 mit [γ − ε, γ + ε] ⊂ O1 ; also folgt (α, γ + ε] ⊂ O1 im Widerspruch zur Wahl von γ. 5 Im Englischen nennt man solche Mengen clopen; die entsprechende Wortsch¨ opfung abgeschloffen ist im Deutschen jedoch nicht gebr¨ auchlich.
I.6
Zusammenh¨ angende R¨ aume
31
Umgekehrt ist jede zusammenh¨ angende nichtleere Teilmenge M von R ein Intervall. Sei dazu a = inf M , b = sup M . Wir werden (a, b) ⊂ M zeigen, was die Behauptung impliziert: G¨ abe es ein c ∈ (a, b) \ M , w¨are ja M = {t ∈ M : t < c} ∪ {t ∈ M : t > c} eine nichttriviale Zerlegung von M in disjunkte relativ offene Teilmengen. (d) Um zu zeigen, dass Rd zusammenh¨ angend ist, ben¨otigen wir ein einfaches Lemma. Lemma I.6.2 Sei T ein topologischer Raum, und seien Ti , i ∈ I, zusammen ur i = j. Dann ist T h¨angende Teilr¨aume mit T = i∈I Ti , Ti ∩ Tj = ∅ f¨ zusammenh¨angend. Beweis. Seien O1 und O2 offene disjunkte Teilmenge von T mit T = O1 ∪ O2 . Wir zeigen, dass O1 oder O2 leer ist. Wegen Ti = (O1 ∩ Ti ) ∪ (O2 ∩ Ti ) gilt f¨ ur jedes i entweder Ti ⊂ O1 oder Ti ⊂ O2 . Aber es kann keine zwei Indizes i = j mit Ti ⊂ O1 und Tj ⊂ O2 geben, da Ti ∩ Tj = ∅. Also haben wir f¨ ur alle i ∈ I (ohne Einschr¨ ankung) Ti ⊂ O1 , d.h. T ⊂ O1 und O2 = ∅. 2 Nun wenden wir Lemma I.6.2 mit T = Rd , I = {x ∈ Rd : x = 1} und Tx = {λx: λ ∈ R} an. Jedes Tx ist hom¨ oomorph zu R (λ → λx ist der kanonische Hom¨ oomorphismus von R auf Tx ) und deshalb zusammenh¨angend (Beispiel I.6(c)); beachte noch 0 ∈ Tx ∩ Ty . Im Kontext des letzten Arguments ist folgende Bemerkung wichtig und eigentlich u allig: Alle bisher betrachteten topologischen Begriffe sind invariant ¨ berf¨ unter Hom¨ oomorphie; ist also S hom¨ oomorph zu T und ist S zusammenh¨angend bzw. kompakt bzw. ein Hausdorffraum, so ist auch T zusammenh¨angend bzw. kompakt bzw. ein Hausdorffraum. W¨ aren die topologischen Begriffe nicht hom¨ oomorphieinvariant, w¨ aren es keine sinnvollen Begriffe! Wegen Beispiel I.6(c) ist der folgende Satz eine abstrakte Version des Zwischenwertsatzes. Satz I.6.3 Ist T1 zusammenh¨angend und f : T1 → T2 stetig, so ist auch f (T1 ) zusammenh¨angend. Beweis. Seien O1 , O2 ⊂ T2 offen mit f (T1 ) ⊂ O1 ∪ O2 , O1 ∩ f (T1 ) = ∅, O2 ∩ f (T1 ) = ∅. Dann sind Ui := f −1 (Oi ) offen und nichtleer sowie T1 = U1 ∪ U2 . Da T1 zusammenh¨ angend ist, folgt U1 ∩U2 = ∅, also (O1 ∩f (T1 ))∩(O2 ∩f (T1 )) = ∅, angend. 2 und f (T1 ) ist zusammenh¨ Der folgende Begriff ist mit dem Zusammenhangsbegriff eng verwandt.
32
I.
Topologische R¨ aume
Definition I.6.4 Sei T ein topologischer Raum. (a) Ein Weg von a ∈ T nach b ∈ T ist eine stetige Abbildung f : [0, 1] → T mit f (0) = a, f (1) = b. Ist a = b, heißt der Weg geschlossen. (b) T heißt wegzusammenh¨angend, wenn es zu je zwei Punkten a, b ∈ T einen Weg von a nach b gibt. In der Definition kann das Parameterintervall [0, 1] nat¨ urlich durch jedes andere kompakte Intervall positiver L¨ ange ersetzt werden. T
R
a
-b Abb. I.1. Ein Weg von a nach b
Die obigen Begriffe sind f¨ ur die Funktionentheorie besonders wichtig. Hier beobachten wir: Satz I.6.5 Ein wegzusammenh¨angender topologischer Raum ist zusammenh¨angend. Beweis. Sei T wegzusammenh¨ angend, und schreibe T = O1 ∪ O2 mit offenen Mengen Oi = ∅. Wir werden O1 ∩ O2 = ∅ zeigen. W¨ahle dazu a ∈ O1 , b ∈ O2 und einen Weg f von a nach b. Da f ([0, 1]) nach Beispiel I.6(c) und Satz I.6.3 zusammenh¨ angend ist, existiert ein Element t ∈ (f ([0, 1]) ∩ O1 ) ∩ (f ([0, 1]) ∩ O2 ) ⊂ O1 ∩ O2 . 2 Die Umkehrung des Satzes gilt nicht; wir skizzieren das u ¨bliche Gegenbeispiel. Sei S = {(x, sin 1/x): x > 0} ⊂ R2 ,
T = S ∪ {(0, y): |y| ≤ 1}.
S ist der Graph von x → sin 1/x auf (0, ∞), d.h. das Bild des Intervalls (0, ∞) unter der stetigen Abbildung x → (x, sin 1/x); also ist S nach Satz I.6.3 zusammenh¨ angend. Ferner ist T = S (Beweis?); daraus folgt der Zusammenhang von T (Aufgabe I.9.32(a)).
I.6
Zusammenh¨ angende R¨ aume
33
1
0
0.2
0.4
0.6
0.8
1
–1
Abb. I.2. Der Graph von sin 1/x
Es gibt jedoch keinen Weg von (0, 0) nach (1/π, 0) in T . Sei n¨amlich f : t → (f1 (t), f2 (t)) solch ein Weg. Beachte, dass f1 und f2 stetige Funktionen sind (Lemma I.3.5). Setze t0 = sup{t ∈ [0, 1]: f1 (t) = 0}. Da f1 stetig ist, gilt ahle jetzt ein δ > 0 mit ( . bezeichne die euklidische Norm) auch f1 (t0 ) = 0. W¨ t0 ≤ t ≤ t0 + δ
⇒ f (t) − f (t0 ) ≤
1 . 2
(I.9)
Nun ist f1 ([t0 , t0 + δ]) zusammenh¨ angend und kompakt (letzteres wegen Satz I.5.3(c)), und es ist f1 (t) > 0 f¨ ur t > t0 . Also ist f1 ([t0 , t0 + δ]) von der Form [0, η] f¨ ur ein η > 0. Daher existieren f¨ ur alle hinreichend großen n Punkte tn ∈ [t0 , t0 + δ] mit f1 (tn ) = 1/(nπ) ≤ η; dann ist f2 (tn ) = (−1)n und deshalb f (tn ) − f (tn+1 ) ≥ 2: Widerspruch zu (I.9)! F¨ ur offene Teilmengen des Rd gilt jedoch: Satz I.6.6 Ist T ⊂ Rd offen und zusammenh¨angend, so ist T auch wegzusammenh¨angend. Beweis. Sei a ∈ T . Wir setzen S = {b ∈ T : es existiert ein Weg in T von a nach b} und zeigen, dass S offen und abgeschlossen in T ist. Wegen a ∈ S muss dann S = T sein, was zu zeigen war. Dazu eine Vorbemerkung. Ist f ein Weg von a nach b und g ein Weg von b nach c, so definiert
f (2t) f¨ ur 0 ≤ t ≤ 1/2 f ⊕ g: t → g(2t − 1) f¨ ur 1/2 < t ≤ 1 offensichtlich eine stetige Funktion, also einen Weg von a nach c. Noch eine Bezeichnung: Wir setzen f¨ ur die euklidische Norm des Rd Uε (b) = {x ∈ Rd : x − b < ε}.
34
I.
Topologische R¨ aume
Nun zum Beweis der Offenheit von S. Sei b ∈ S, und w¨ahle ε > 0 mit Uε (b) ⊂ T ; das ist m¨ oglich, da T offen in Rd ist. Ist c ∈ Uε (b), f1 ein Weg von a nach b und f2 (t) = b + t(c − b), so ist f2 ein Weg von b nach c in Uε (b), also in T . Daher ist f1 ⊕ f2 ein Weg in T von a nach c und deshalb c ∈ S. Das zeigt Uε (b) ⊂ S, und S ist offen. Zum Beweis der (relativen) Abgeschlossenheit von S sei b ∈ S ∩ T ; das ist der relative Abschluss von S in T . W¨ ahle wieder ε > 0 mit Uε (b) ⊂ T , und w¨ ahle anschließend c ∈ S ∩ Uε (b). Dann gibt es einen Weg f1 von a nach c, und f2 (t) = c + t(b − c) definiert einen Weg von c nach b in T . Daher ist f1 ⊕ f2 ein 2 Weg von a nach b in T , d.h. S ∩ T ⊂ S, und S ist abgeschlossen in T . Eine offensichtliche Beweisvariante zeigt (Aufgabe I.9.33): Korollar I.6.7 Ist T ⊂ Rd offen und zusammenh¨angend, so k¨onnen je zwei Punkte von T durch einen achsenparallelen Polygonzug in T verbunden werden.
I.7
Existenz stetiger Funktionen, normale R¨ aume
Wie das Beispiel der indiskreten Topologie zeigt, garantiert die Definition eines topologischen Raums nicht, dass es auch viele offene Mengen gibt. Die mengentheoretische Topologie kennt eine ganze Hierarchie von Trennungsaxiome genannten Reichhaltigkeitsbedingungen, die von den meisten der f¨ ur die Analysis wichtigen Topologien allesamt erf¨ ullt werden. Eine solche Bedingung ist uns in der Hausdorffeigenschaft bereits begegnet. Die Hausdorffeigenschaft impliziert aber noch nicht, dass es nichttriviale stetige reellwertige Funktionen gibt. Satz I.7.1 Es gibt einen Hausdorffraum T , auf dem jede stetige Funktion f : T → R konstant ist. unschte Beispiel zu erhalBeweis. Es sei T = {(x, y) ∈ Q2 : y ≥ 0}; um das gew¨ ten, werden wir T auf folgende Weise mit einer Topologie versehen. Betrachte zu (x, y) ∈ T √ Uε+ (x, y) = {(z, 0): z ∈ Q, |z − (x − y/ 2)| < ε}, √ Uε− (x, y) = {(z, 0): z ∈ Q, |z − (x + y/ 2)| < ε}, Uε (x, y) = {(x, y)} ∪ Uε− (x, y) ∪ Uε+ (x, y).
Die Uε erf¨ ullen (1)–(3) aus Satz I.2.7, und wir versehen T mit der in Satz I.2.7 beschriebenen Topologie, so dass die Uε (x, y) eine Umgebungsbasis von (x, y) bilden.
I.7
Existenz stetiger Funktionen, normale R¨ aume
35
. .....(x, y) .. . ... . .. .... .. .. . .. .. .. . .. .. .. . .. .. .. .. .. .. . . Abb. I.3. Die Umgebung Uε (x, y)
Es ist nun geometrisch evident, dass T ein Hausdorffraum ist, denn, da die oben skizzierten Geraden eine irrationale Steigung haben, liegt kein weiterer Punkt aus Q2 auf ihnen. Nehmen wir nun an, es g¨ abe eine nichtkonstante stetige Funktion f : T → R; ohne Einschr¨ ankung k¨ onnen wir annehmen, dass f die Werte 0 und 1 annimmt: f (t0 ) = 0, f (t1 ) = 1. Dann sind V0 = {t ∈ T : f (t) < 1/3} und V1 = {t ∈ T : f (t) > 2/3} disjunkte offene Mengen, deren Abschl¨ usse ebenfalls disjunkt sind, uhrt zu da ja (Satz I.3.2(iv)) f (V 0 ) ⊂ (−∞, 1/3] und f (V 1 ) ⊂ [2/3, ∞). Das f¨ einem Widerspruch, wenn wir folgende Behauptung zeigen k¨onnen: • F¨ ur (x, y) = (x′ , y ′ ) ∈ T und ε, ε′ > 0 ist Uε (x, y) ∩ Uε′ (x′ , y ′ ) = ∅. Beweis hierf¨ ur: Uε (x, y) hat die Gestalt eines unendlich hohen W’s (bzw. im Fall y = 0 eines unendlich hohen V’s).
(x, y)
Abb. I.4. Der Abschluss von Uε (x, y)
Da Q × Q+ bez¨ uglich der euklidischen Topologie dicht in R × R+ liegt, schneiden sich je zwei dieser W’s (bzw. je zwei dieser V’s bzw. je ein V und ein W). Damit ist die Behauptung gezeigt. 2 Der im letzten Satz konstruierte Raum wird irrational slope space genannt; die Konstruktion stammt von R. H. Bing6 . Es zeigt sich, dass folgende Variante der Hausdorffeigenschaft zu Existenzaussagen f¨ ur stetige Funktionen f¨ uhrt. 6 R.
474.
H. Bing, A connected countable Hausdorff space, Proc. Amer. Math. Soc. 4 (1953),
36
I.
Topologische R¨ aume
Definition I.7.2 Ein topologischer Raum heißt normal, wenn es zu je zwei nichtleeren abgeschlossenen disjunkten Teilmengen A, B ⊂ T offene disjunkte Teilmengen U ⊃ A und V ⊃ B gibt. Man sagt dann, A und B k¨ onnen durch offene Mengen getrennt werden. Klar, aber wichtig ist die Bemerkung, dass Normalit¨ at ein hom¨oomorphieinvarianter Begriff ist. Normalit¨ at ist nicht zwingend eine Versch¨ arfung der Hausdorffeigenschaft, da in Nicht-Hausdorffr¨ aumen einpunktige Mengen nicht abgeschlossen zu sein brauchen. Achtung: Manche Autoren setzen in der Definition eines normalen Raums die Hausdorffeigenschaft voraus; andere nennen normale Hausdorffr¨aume aume heißen auch T2 -R¨aume 7 ). T4 -R¨aume (Hausdorffr¨ Beispiele. (a) Der Sierpi´ nski-Raum ist normal, denn es gibt kein Paar abgeschlossener nichtleerer disjunkter Teilmengen. (b) Jeder metrische Raum (T, d) ist normal. Betrachte n¨amlich zu A ⊂ T die Funktion t → dist(t, A) = inf{d(t, s): s ∈ A}.
(I.10)
Die umgekehrte Dreiecksungleichung zeigt, dass diese Funktion stetig ist, und es gilt dist(t, A) = 0 genau dann, wenn t ∈ A ist. Seien nun A, B ⊂ T abgeschlossen, nicht leer und disjunkt. Dann ist die Funktion f : T → [0, 1],
f (t) =
dist(t, A) dist(t, A) + dist(t, B)
wohldefiniert und stetig, und sie erf¨ ullt f (t) = 0
∀t ∈ A,
f (t) = 1 ∀t ∈ B.
Daher sind U = {t: f (t) < 1/2} und V = {t: f (t) > 1/2} disjunkte offene Umgebungen von A und B. Eine weitere Beispielklasse liefert das folgenden Lemma. Lemma I.7.3 Ein kompakter Hausdorffraum ist normal. Beweis. Sei T kompakt, und seien A, B ⊂ T abgeschlossen, nicht leer und disjunkt. Sei zun¨ achst b ∈ B fest. Zu jedem a ∈ A w¨ahle offene Umgebungen ¨ Ua von a und Va von b, die disjunkt sind. Da die Ua eine offene Uberdeckung von A bilden und A abgeschlossen, also kompakt ist (Satz I.5.3(a)), existieren a1 , . . . , an mit A ⊂ nk=1 Uak . Der endliche Schnitt nk=1 Vak ist eine offene n Umgebung von b, die k=1 Uak nach Konstruktion nicht schneidet. Wir haben damit gezeigt: 7 Wer vermutet, dass es auch T - und T -R¨ aume gibt, liegt richtig; mehr noch: man findet 1 3 T0 -, T2 1 -, T3a -R¨ aume etc. 2
I.7
Existenz stetiger Funktionen, normale R¨ aume
37
• F¨ ur alle b ∈ B existieren eine offene Menge Ob ⊃ A und eine offene Umgebung Wb von b mit Ob ∩ Wb = ∅.
Ein m weiterer Kompaktheitsschluss mliefert endlich viele Wb1 , . . . , Wbm mit B ⊂ k=1 Wbk =: W ; W und O := k=1 Obk sind dann offen, und es ist A ⊂ O, B ⊂ W sowie O ∩ W = ∅. Das war zu zeigen. 2 Nun kommen wir zu dem relevanten Satz u ¨ ber normale R¨aume. Theorem I.7.4 (Satz von Tietze-Urysohn) F¨ ur einen topologischen Raum sind ¨aquivalent: (i) T ist normal. (ii) Sind A und B abgeschlossene disjunkte Teilmengen von T , so existiert eine stetige Funktion f : T → [0, 1] mit f |A = 0 und f |B = 1. (iii) Zu jeder abgeschlossenen Teilmenge A von T und jeder stetigen Funktion f : A → [a, b] existiert eine stetige Fortsetzung F : T → [a, b]. Hier ist (i) ⇒ (ii) das Lemma von Urysohn und (i) ⇒ (iii) der Fortsetzungssatz von Tietze. Die Implikationen (iii) ⇒ (ii) ⇒ (i) sind klar; f¨ ur erstere setze die stetige Funktion f : A ∪ B → [0, 1], f (t) = 0 f¨ ur t ∈ A, f (t) = 1 f¨ ur t ∈ B, fort, und f¨ ur letztere verwende das Argument von Beispiel I.7(b). Dort wurde (ii) auf einfache Weise f¨ ur metrische R¨ aume bewiesen. Auch (iii) kann f¨ ur metrische R¨ aume direkt gezeigt werden (siehe Seite 39), jedoch bleibt (iii) im Fall metrischer R¨ aume eine nichttriviale Angelegenheit. Beweis. (i) ⇒ (ii): Wir benutzen folgende einfache Charakterisierung der Normalit¨ at, die in Aufgabe I.9.37 zu zeigen ist. • Ein topologischer Raum T ist genau dann normal, wenn f¨ ur alle F ⊂ G ⊂ T , F abgeschlossen, G offen, eine offene Menge O mit F ⊂ O ⊂ O ⊂ G existiert.
Dieses Kriterium wird zuerst mit F = A und G = T \ B angewandt; es existiert also eine offene Menge O1/2 mit A ⊂ O1/2 ⊂ O1/2 ⊂ T \ B. Als n¨achstes wenden wir das Kriterium mit F = A, G = O1/2 bzw. F = O 1/2 , G = T \ B an; das liefert offene Mengen O1/4 bzw. O3/4 mit A ⊂ O1/4 ⊂ O1/4 ⊂ O1/2 , O 1/2 ⊂ O3/4 ⊂ O 3/4 ⊂ T \ B. So fortfahrend, ordnen wir jedem dyadischen Bruch r = m/2n in (0, 1) eine offene Menge Or zu, so dass f¨ ur dyadische Br¨ uche 0 < p < r < 1 stets A ⊂ Op ⊂ Op ⊂ Or ⊂ O r ⊂ T \ B
(I.11)
gilt. Wir erkl¨ aren jetzt eine Funktion f : T → [0, 1] durch
inf{r: t ∈ Or } falls t ∈ r Or , f (t) = 1 sonst. Offenbar ist f |A = 0 und f |B = 1, und es bleibt, die Stetigkeit von f zu zeigen. Diese folgt sofort aus folgenden Aussagen:
38
I.
Topologische R¨ aume
(a) F¨ ur alle 0 < s ≤ 1 ist {f < s} := {t: f (t) < s} offen. (b) F¨ ur alle 0 ≤ s < 1 ist {f > s} := {t: f (t) > s} offen. Zum Beweis von (a) bemerke nur, dass f¨ ur ein t ∈ T die Ungleichung f (t) < s genau dann gilt, wenn es einen dyadischen Bruch r < s mit t ∈ Or gibt; dann ist also Or ⊂ {f < s} und t ein innerer Punkt von {f < s}. Da t beliebig war, ist {f < s} offen. Zum Beweis von (b) stellt man als erstes fest, dass f¨ ur ein t ∈ T die Ungleichung f (t) > s genau dann gilt, wenn es einen dyadischen Bruch r > s mit t∈ / Or gibt. Ist p ∈ (s, r) ein weiterer dyadischer Bruch, muss wegen (I.11) auch t∈ / O p gelten; d.h. t ∈ T \ O p ⊂ {f > s}, und wie oben folgt die Offenheit von {f > s}. Damit ist der Beweis der Implikation (i) ⇒ (ii) vollst¨andig. F¨ ur den Beweis von (ii) ⇒ (iii) darf man ohne Einschr¨ankung a = −1, b = 1 annehmen. Wir dritteln das Intervall [−1, 1] und betrachten die Mengen A− = {t ∈ A: f (t) ≤ −1/3} und A+ = {t ∈ A: f (t) ≥ 1/3}; dies sind abgeschlossene disjunkte Teilmengen von A und deshalb abgeschlossene disjunkte Teilmengen von T . Nach (ii) (genauer einer offensichtlichen Folgerung daraus) existiert eine stetige Funktion F1 : T → [−1/3, 1/3] mit F1 |A− = −1/3 und ur t ∈ A hat man F1 |A+ = 1/3. F¨ |f (t) − F1 (t)| ≤
2 , 3
da |f (t)| < 1/3, wenn t weder in A− noch in A+ liegt. Nun wendet man dasselbe Argument auf die Funktion f1 = f − F1 |A : A → [−2/3, 2/3] an. Man erh¨alt eine stetige Funktion F2 : T → [−2/9, 2/9] mit |f (t) − F1 (t) − F2 (t)| = |f1 (t) − F2 (t)| ≤
4 9
∀t ∈ A.
So fortfahrend, definiert man stetige Funktionen Fn auf T mit |Fn (t)| ≤ und
1 2 n−1 3 3
n n f (t) − ≤ 2 F (t) k 3 k=1
Wegen (I.12) konvergiert die Reihe eine Funktion F : T → [−1, 1], denn |F (t)| ≤
∞
k=1
∀t ∈ A.
(I.12)
(I.13)
Fk (t) f¨ ur jedes t ∈ T und definiert so
∞ 1 2 k−1
k=1
∀t ∈ T
3 3
= 1.
I.8 Der Satz von Baire
39
Andererseits zeigt (I.13) F | A = f . Was jetzt noch fehlt, ist die Beobachtung, ∞ dass wegen (I.12) die Reihe k=1 Fk sogar gleichm¨aßig konvergiert und deshalb eine stetige Funktion darstellt; letzteres zeigt man wie in der Analysisvorlesung (Aufgabe I.9.40 oder Beispiel V.1(c)). 2 Wie angedeutet, kann der Fortsetzungssatz von Tietze f¨ ur metrische R¨aume mit einem direkten Argument bewiesen werden, wie folgt. Offensichtlich reicht es, den Fall a = 1, b = 2 zu behandeln. In diesem Fall setzt man F (t) = f (t) f¨ ur t ∈ A und inf{f (s)d(s, t): s ∈ A} F (t) = inf{d(s, t): s ∈ A} f¨ ur t ∈ / A. Es ist nicht schwer zu verifizieren, dass F wirklich stetig ist.
I.8
Der Satz von Baire
In jedem topologischen Raum liegt der Schnitt endlich vieler offener und dichter Mengen wieder dicht (Beweis?). R. Baire zeigte 1899, dass dies im Fall des Rd auch f¨ ur den Schnitt abz¨ahlbar vieler offener und dichter Mengen gilt. Dieser unscheinbar anmutende Satz hat u ¨ berraschende und wichtige Konsequenzen, wie in diesem Abschnitt erl¨ autert werden soll. Um den Satz von Baire pr¨ agnant formulieren zu k¨onnen, f¨ uhren wir eine Vokabel ein. Definition I.8.1 Ein topologischer Raum heißt Baireraum, wenn der Schnitt von abz¨ ahlbar vielen offenen und dichten Mengen wieder dicht liegt. Offenbar ist Q mit der euklidischen Topologie kein Baireraum, denn ist ahlung von Q, so ist jede der Mengen Q \ {rn } offen und {r1 , r2 , . . . } eine Aufz¨ dicht, aber ihr Schnitt ist leer. Die bedeutendsten positiven Resultate sind im folgenden Satz enthalten. Theorem I.8.2 (Satz von Baire) (a) Vollst¨andige metrische R¨aume sind Bairer¨aume. (b) Kompakte Hausdorffr¨aume sind Bairer¨aume. Beweis. (a) Seien On , n ∈ N, offene und dichte Teilmengen eines vollst¨andigen metrischen Raums (T, d), und setze D = n∈N On . Es ist zu zeigen, dass jede offene ε-Kugel in T ein Element von D enth¨ alt. Sei Uε (x0 ) = {x ∈ T : d(x, x0 ) < ε} eine solche Kugel. Da O1 offen und dicht ist, ist O1 ∩ Uε (x0 ) offen und nicht leer. Es existieren also x1 ∈ O1 , ε1 > 0 (o.E. ε1 < 21 ε) mit Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ).
40
I.
Topologische R¨ aume
Nach eventueller weiterer Verkleinerung von ε1 erh¨alt man sogar Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ). Betrachte nun O2 . Auch O2 ist offen und dicht, daher ist O2 ∩ Uε1 (x1 ) offen und nicht leer. Wie oben existieren x2 ∈ O2 , ε2 < 12 ε1 mit Uε2 (x2 ) ⊂ O2 ∩ Uε1 (x1 ) ⊂ O1 ∩ O2 ∩ Uε (x0 ). Auf diese Weise werden induktiv Folgen (εn ) und (xn ) mit folgenden Eigenschaften definiert: (1) εn < 21 εn−1 , folglich εn < 2−n ε. (2) Uεn (xn ) ⊂ On ∩ Uεn−1 (xn−1 ) ⊂ · · · ⊂ O1 ∩ · · · ∩ On ∩ Uε (x0 ). Es folgt insbesondere xn ∈ UεN (xN ) ⊂ U2−N ε (xN )
∀n > N,
(I.14)
d.h., (xn ) ist eine Cauchyfolge. Da T vollst¨ andig ist, existiert der Grenzwert x := limn→∞ xn . Eine unmittelbare Konsequenz von (I.14) ist dann x ∈ UεN (xN )
∀N ∈ N.
Mit Hilfe von (2) ergibt sich daraus x ∈ D ∩ Uε (x0 ). (b) Der Beweis im kompakten Fall ist ¨ ahnlich und verwendet statt der Vollst¨ andigkeit die endliche Durchschnittseigenschaft (Satz I.5.7). Wir werden mehrfach die Normalit¨ at kompakter Hausdorffr¨ aume T (Lemma I.7.3) benutzen. Seien On wieder offene und dichte Teilmengen und D ihr Schnitt. Sei O ⊂ T eine weitere offene Menge; es ist D ∩ O = ∅ zu zeigen. Da O1 offen und dicht ist, ist O1 ∩ O offen und = ∅; w¨ ahle gem¨ aß Aufgabe I.9.37 eine offene Menge
U1 ⊂ U1 ⊂ O1 ∩ O. Da O2 offen und dicht ist, ist O2 ∩ U1 offen U1 mit ∅ = und = ∅. Wie oben w¨ ahle eine offene Menge U2 mit ∅ =
U2 ⊂ U2 ⊂ O2 ∩ U1 ⊂ alt man eine absteigende Folge offener Mengen O2 ∩ O1 ∩ O. So fortfahrend, erh¨ ∅ = Un ⊂ On ∩ · · · ∩ O1 ∩ O mit Un+1 ⊂ U n+1 ⊂ Un . Da je endlich viele der abgeschlossenen Mengen Un einen nichtleeren Schnitt haben, impliziert die Kompaktheit, dass n Un = n U n = ∅. Jedes Element dieser Schnittmenge liegt in D ∩ O. 2 Bairesche R¨ aume haben schlechte Erblichkeitseigenschaften; obwohl die in Theorem I.8.2 genannten Raumklassen stabil gegen¨ uber Bildung abgeschlossener Teilmengen ist, ist das f¨ ur Bairer¨ aume allgemein nicht richtig (Aufgabe I.9.45). Hingegen gilt: Satz I.8.3 Offene Teilmengen von Bairer¨aumen sind selbst Bairer¨aume.
I.8
Der Satz von Baire
41
Beweis. Sei T ein Baireraum und O ⊂ T offen; beachte, dass die relativ offenen Teilmengen von O genau diejenigen offenen Mengen von T sind, die in O enthalten sind. Es seien O1 , O2 , · · · ⊂ O offen und dicht in O. Setze Un = On ∪(T \ O); dies sind offene und dichte Teilmengen von T (letzteres, da nach Aufgabe I.9.5 ∂O keine inneren Punkte hat). Also liegt nach Voraussetzung n Un dicht in T 2 und deshalb n On dicht in O.
Insbesondere folgt, dass offene Intervalle Bairer¨aume sind. Das h¨atte man auch aus Theorem I.8.2(a) schließen k¨ onnen, obwohl die euklidische Metrik auf einem Intervall der Form (a, b) nicht vollst¨ andig ist. Theorem I.8.2(a) enth¨alt jedoch einen zus¨ atzlichen Freiheitsgrad, den man im ersten Moment u ¨ bersehen k¨ onnte; man ist n¨ amlich in der Wahl der Metrik, welche die Topologie erzeugt, frei. So erzeugt etwa auf I = (−π/2, π/2) die durch d2 (s, t) = |tan s − tan t| definierte Metrik dieselbe Topologie wie die u ¨ bliche Metrik d1 (s, t) = |s − t|, im Gegensatz zur letzteren ist (I, d2 ) aber vollst¨ andig (Beweis?). Es ist trivial, dass zwei dichte Teilmengen eines topologischen Raums einen leeren Schnitt haben k¨ onnen. Nennt man einen abz¨ahlbaren Schnitt von offenen Mengen eine Gδ -Menge (wobei G an Gebiet“ und δ an Durchschnitt“ erinnern ” ” aßt sich Theorem I.8.2 so formulieren: soll)8 , so l¨ • In einem vollst¨andigen metrischen Raum oder einem kompakten Hausdorffraum ist der abz¨ahlbare Schnitt von dichten Gδ -Mengen eine dichte Gδ -Menge. Dichte Gδ -Mengen in Baireschen R¨ aumen sind also sehr“ dicht. ” H¨ aufig ist eine weitere Umformulierung von Nutzen. Dazu wird folgende Terminologie ben¨ otigt; sie stammt von Baire und ist leider etwas unanschaulich, hat sich aber in der Literatur fest eingeb¨ urgert. Definition I.8.4 (a) Eine Teilmenge M eines topologischen Raums heißt nirgends dicht, wenn M keinen inneren Punkt besitzt. (b) M heißt von 1. Kategorie, wenn es eine Folge (Mn ) nirgends dichter Mengen mit M = n∈N Mn gibt. (c) M heißt von 2. Kategorie, wenn M nicht von 1. Kategorie ist. Nirgends dichte Mengen liegen in der Tat in keiner offenen Menge ( nir” gends“) dicht. Einfaches Beispiel: Q ist von in R. 1. Kategorie Durch Komplementbildung, n¨ amlich ∁( n Mn ) = n ∁Mn ⊃ n ∁Mn , erh¨alt man aus Theorem I.8.2:
8 Das Gegenst¨ uck dazu, eine abz¨ ahlbare Vereinigung abgeschlossener Mengen, heißt Fσ Menge; F wie frz. ferm´ e und σ wie Summe.
42
I.
Topologische R¨ aume
Korollar I.8.5 (Bairescher Kategoriensatz) In einem vollst¨andigen metrischen Raum oder einem kompakten Hausdorffraum liegt das Komplement einer Menge 1. Kategorie dicht. Oft wird nur folgende schw¨ achere Form ben¨ otigt. Korollar I.8.6 Ein nicht leerer Baireraum, z.B. ein vollst¨andiger metrischer Raum oder ein kompakter Hausdorffraum, ist von 2. Kategorie in sich. Der Bairesche Kategoriensatz gestattet h¨ aufig relativ einfache (aber nichtkonstruktive) Beweise f¨ ur Existenzaussagen. Das geschieht nach folgendem Muster: Gesucht ist ein Objekt mit einer gewissen Eigenschaft (E). Zeige dann, dass die Gesamtheit der zu untersuchenden Objekte einen Baireschen Raum, z.B. einen vollst¨ andigen metrischen Raum, bildet, worin die Objekte ohne Eigenschaft (E) eine Teilmenge 1. Kategorie formen. Folglich gibt es Objekte mit Eigenschaft (E), und diese liegen sogar dicht! Wir wollen ein paar Anwendungen dieser Idee besprechen. Sind fn : T → R stetige Funktionen auf einem topologischen Raum und konvergiert die Folge punktweise, etwa gegen f (t) = lim fn (t), n→∞
so braucht f nat¨ urlich nicht stetig zu sein. (Eine Funktion, die punktweiser Grenzwert einer Folge stetiger Funktionen ist, heißt Funktion der 1. Baireschen Klasse.) Auf Bairer¨ aumen kann eine Funktion der 1. Baireschen Klasse nicht vollkommen unstetig sein: Satz I.8.7 Sei T ein Baireraum, und sei f : T → R der punktweise Limes der stetigen Funktionen fn : T → R. Dann bilden die Stetigkeitspunkte von f , also {t ∈ T : f ist stetig bei t}, eine dichte Gδ -Menge. Insbesondere besitzt f einen Stetigkeitspunkt. Beweis. Als erstes definieren wir den Stetigkeitsmodul ω: T → R von f wie folgt. Zu t ∈ T und einer offenen Umgebung U von t setze ω(t, U ) = sup{|f (s1 ) − f (s2 )|: s1 , s2 ∈ U } und dann ω(t) = inf ω(t, U ), U
wobei sich das Infimum u ¨ ber alle offenen Umgebungen von t erstreckt. Nach Konstruktion sind alle Mengen der Form Oε = {t ∈T : ω(t) < ε} offen, und die Menge der Stetigkeitspunkte von f ist ε>0 Oε = k∈N O1/k und deswegen eine Gδ -Menge. Um deren Dichtheit zu zeigen, ist also die Dichtheit jeder Menge Oε nachzuweisen.
I.8
Der Satz von Baire
43
Sei dazu O ⊂ T offen und nicht leer. Betrachte zu ε > 0 {t ∈ O: |fi (t) − fj (t)| ≤ ε/4}; En = i,j≥n
dies sind bez¨ uglich der Relativtopologie abgeschlossene Teilmengen von O, und nach Voraussetzung ist n En = O. Nach Satz I.8.3 ist O ein Baireraum und deshalb (Korollar I.8.6) von 2. Kategorie in sich; also enth¨alt eines der En einen (bzgl. O und deshalb auch bzgl. T ) inneren Punkt. Es existieren also ein N ∈ N und eine offene Menge ∅ = U ⊂ EN . Indem man zum Grenzwert j → ∞ u ¨ bergeht, sieht man, dass |fN (t) − f (t)| ≤ ε/4
∀t ∈ U.
Indem man U , falls notwendig, verkleinert, darf man wegen der Stetigkeit von fN auch |fN (s1 ) − fN (s2 )| ≤ ε/4 ∀s1 , s2 ∈ U annehmen. Also ist f¨ ur s1 , s2 ∈ U |f (s1 ) − f (s2 )| ≤ |f (s1 ) − fN (s1 )| + |fN (s1 ) − fN (s2 )| + |fN (s2 ) − f (s2 )| ε ε ε ≤ + + 4 4 4 und daher ω(t) < ε f¨ ur alle t ∈ U . Das zeigt Oε ∩ O = ∅, und Oε ist dicht in T . 2 Im n¨ achsten Satz9 geben wir eine u ¨berraschende Charakterisierung von Polynomen. Es bezeichnet f (n) die n-te Ableitung einer Funktion f . Satz I.8.8 Es sei f : R → R eine beliebig oft differenzierbare Funktion mit folgender Eigenschaft: Zu jedem t ∈ R existiert ein Index n = n(t) ∈ N0 mit f (n) (t) = 0. Dann ist f ein Polynom. Beweis. Betrachte die Vereinigung O aller offenen Intervalle, auf denen f mit einem Polynom u onnen noch jedes solche Intervall maximal ¨ bereinstimmt. Wir k¨ nach links und rechts ausdehnen und erhalten so die Familie J der maximalen offenen (paarweise disjunkten) Intervalle, auf denen f mit einem Polynom u ¨ bereinstimmt. Nach Konstruktion ist O = J∈J J, und es ist klar, dass O als Vereinigung offener Intervalle selbst offen ist. Weniger klar ist, dass O = ∅; das kann man mit Hilfe des Satzes von Baire zwar begr¨ unden (in der Tat liegt O dicht), wird aber im weiteren Fortgang a priori nicht ben¨otigt. 9 E. Corominas, F. Sunyer Balaguer, Conditions for an infinitely differentiable function to be a polynomial, Revista Mat. Hisp.-Amer. (4) 14 (1954), 26–43; R. P. Boas, Solution to Problem 4813: Necessary and sufficient condition for a polynomial, Amer. Math. Monthly 66 (1959), 599.
44
I.
Topologische R¨ aume
Es ist nun zu zeigen, dass O = R gilt, denn dann besteht J nur aus einem einzigen Intervall (R ist zusammenh¨ angend!), und f ist ein Polynom. Nehmen wir statt dessen an, A := R \ O w¨ are nicht leer. Da O offen ist, ist A abgeschlossen. Wir werden jetzt durch eine Anwendung des Satzes von Baire einen Punkt t0 ∈ A produzieren, von dem gezeigt werden wird, dass er in Wirklichkeit in O liegt. Dieser Widerspruch schließt den Beweis von Satz I.8.8 ab. Betrachten wir dazu die Mengen En = {t ∈ A: f (n) (t) = 0}. Dann sind die En inA relativ abgeschlossen, da die f (n) stetig sind, und nach Voraussetzung gilt n≥0 En = A. Da A als abgeschlossene Teilmenge von R selbst vollst¨ andig und deshalb ein Baireraum ist, enth¨alt nach Korollar I.8.6 f¨ ur ein geeignetes N ≥ 0 die Menge EN einen inneren Punkt relativ zu A; es existieren also t0 ∈ A und ein ε0 > 0 mit t ∈ A, |t − t0 | ≤ ε0 ⇒ f (N ) (t) = 0.
(I.15)
In der Tat gilt sogar t ∈ A, |t − t0 | ≤ ε0 , n ≥ N
⇒ f (n) (t) = 0.
(I.16)
Um das einzusehen, u ¨berlegen wir zuerst, dass kein Punkt von A isoliert sein kann. W¨ are n¨ amlich t ∈ A ein isolierter Punkt von A, g¨abe es Intervalle (α, t) und (t, β) in J , auf denen f eine Polynomfunktion ist. Also ist f (m1 ) = 0 auf (α, t) und f (m2 ) = 0 auf (t, β). Ist m0 das Maximum von m1 und m2 , so folgt wegen der Stetigkeit von f (m0 ) auch f (m0 ) = 0 auf (α, β), und das impliziert den Widerspruch t ∈ O. F¨ ur den Beweis von (I.16) betrachte nun zu t ∈ A mit |t − t0 | ≤ ε0 eine Folge (sk ) in A mit |sk − t0 | ≤ ε0 , die gegen t konvergiert; dass solche Folgen existieren, haben wir soeben begr¨ undet. Dann ist f (N ) (sk ) − f (N ) (t) = 0; k→∞ sk − t
f (N +1) (t) = lim
und (I.16) folgt per Induktion. Wir zeigen als n¨ achstes, dass es ein a < t0 gibt, so dass f auf (a, t0 ) mit einem Polynom u amlich (t0 −ε0 , t0 )∩A = ∅, stimmt das nach ¨ bereinstimmt. Ist n¨ Konstruktion. Andernfalls existiert t1 ∈ (t0 −ε0 , t0 )∩A. Sei J ∈ J ein in (t1 , t0 ) enthaltenes Intervall wie oben beschrieben; da f dort eine Polynomfunktion ist, ur ein m ≥ 0. Wir werden argumentieren, dass auch f (N ) |J = 0 ist f (m) |J = 0 f¨ ist. Das ist klar f¨ ur m ≤ N . Im Fall m > N schreibe J = (s1 , s2 ). Wegen der Maximalit¨ at von J sind s1 , s2 ∈ A, und dann liefert (I.16) f¨ ur s ∈ J s f (m) (σ) dσ + f (m−1) (s1 ) = 0 + 0 = 0; f (m−1) (s) = s1
I.8
Der Satz von Baire
45
so fortfahrend erh¨ alt man f (m−1) |J = · · · = f (N ) |J = 0. Daraus folgt f (N ) (t) = 0 auf (t1 , t0 ) (unterscheide dazu, ob t ∈ A oder t ∈ / A), und f ist auf (t1 , t0 ) eine Polynomfunktion. (Wenn es kein solches Intervall J gibt, ist (t1 , t0 ) ⊂ A, und (I.15) liefert direkt f (N ) |(t1 ,t0 ) = 0.) Genauso sieht man, dass f¨ ur ein geeignetes b > t0 die Einschr¨ankung von f auf (t0 , b) eine Polynomfunktion ist. Also ist t0 ein isolierter Punkt von A, was, wie oben gezeigt, unm¨ oglich ist, weil es die Folgerung t0 ∈ O impliziert. 2 Mit Hilfe des Baireschen Satzes kann man, wenn auch auf nichtkonstruktive Weise, die Existenz stetiger, nirgends differenzierbarer Funktionen beweisen. Satz I.8.9 Es gibt stetige Funktionen auf [0, 1], die an keiner Stelle differenzierbar sind. Beweis. Zu n ∈ N setze On =
f (t + h) − f (t) >n f ∈ C[0, 1]: sup h 0 0 mit f (t + h) − f (t) > n + δt . sup h 0 n + δt . ht
Da f stetig ist, gilt noch f¨ ur s ∈ Ut , einer hinreichend kleinen Umgebung von t, f (s + ht ) − f (s) > n + δt . ht
¨ Uberdecke nun das kompakte Intervall [0, 1] durch endlich viele Ut1 , . . . , Utr ; ur s ∈ Uti setze noch δ = min{δt1 , . . . , δtr }, h = min{|ht1 |, . . . , |htr |}. Es folgt f¨ f (s + hti ) − f (s) > n + δ. hti
46
I.
Topologische R¨ aume
Seien nun 0 < ε < 12 hδ und g − f ∞ < ε. Wir werden g ∈ On zeigen. Sei dazu t ∈ [0, 1], etwa t ∈ Uti . Dann ist g(t + hti ) − g(t) f (t + hti ) − f (t) ≥ − 2 f − g∞ > n + δ − 2 ε > n. hti hti |hti | h
Daher ist On offen. Es bleibt zu zeigen, dass On dicht ist. Sei dazu O = ∅ eine offene Menge. Nach dem Weierstraßschen Approximationssatz (Satz IV.9.1) existieren ein Polynom p und ε > 0 mit f − p∞ ≤ ε ⇒ f ∈ O.
Sei gm eine S¨ agezahnfunktion, die [0, 1] auf [0, ε] abbildet und deren auf- (bzw. ab-)steigende Zacken die Steigung +m bzw. −m aufweisen.
ε
1 Dann ist stets fm := p + gm ∈ O. F¨ ur m > n + p′ ∞ erh¨alt man jedoch f¨ ur alle t ∈ [0, 1], 0 < |h| ≤ 1/n fm (t + h) − fm (t) gm (t + h) − gm (t) p(t + h) − p(t) ≥ − , h h h
wo der letzte Term wegen des Mittelwertsatzes ≤ p′ ∞ ausf¨allt. Daher gilt fm (t + h) − fm (t) ≥ m − p′ ∞ > n, sup h 0 1 + 32 π. Was die Bairesche Methode aber zeigt, ist, dass solche pathologischen“ Funktionen ” die typischen Funktionen sind und stetige Funktionen mit einer Differenzierbarkeitsstelle die Ausnahme, denn sie bilden eine Menge 1. Kategorie. In Baireschen R¨ aumen sind Mengen 1. Kategorie vernachl¨assigbar“. In Ab” schnitt IV.6 werden wir mit den Nullmengen eine maßtheoretische Variante vernachl¨ assigbarer Mengen kennenlernen. Dort werden die beiden Methoden noch einmal gegen¨ ubergestellt.
I.9
Aufgaben
Aufgabe I.9.1 (a) In einem metrischen Raum (T, d) gilt f¨ ur ε > 0: Uε (t) = {s: d(s, t) < ε} ist offen, Bε (t) = {s: d(s, t) ≤ ε} ist abgeschlossen. (b) Welche der folgenden Aussagen sind in einem beliebigen metrischen Raum g¨ ultig? (1) ∂Uε (t) = {s: d(s, t) = ε} (2) ∂Bε (t) = {s: d(s, t) = ε} (3) Uε (t) = Bε (t) Aufgabe I.9.2 Sei T eine Menge. Zeige, dass τ = {O ⊂ T : T \ O ist endlich} ∪ {∅} eine Topologie auf T ist. Aufgabe I.9.3 (a) Auf R ist τ = {(t, ∞): − ∞ ≤ t ≤ ∞}
eine Topologie. √ (b) Bestimme { 2} in dieser Topologie.
Aufgabe I.9.4 Z sei mit der Topologie aus Beispiel I.2(e) versehen. Zeige, dass alle endlichen Teilmengen abgeschlossen sind. Aufgabe I.9.5 Sei M eine offene oder abgeschlossene Teilmenge eines topologischen Raums. Dann enth¨ alt ∂M keinen inneren Punkt. Aufgabe I.9.6 P(T ) bezeichne die Potenzmenge einer Menge T . (a) Ist T ein topologischer Raum, so erf¨ ullt die Abbildung K: P(T ) → P(T ), K(M ) = M , die Bedingungen (1) K(∅) = ∅, (2) M ⊂ K(M ) ∀M ∈ P(T ), (3) K(K(M )) = K(M ) ∀M ∈ P(T ), (4) K(M ∪ N ) = K(M ) ∪ K(N ) ∀M, N ∈ P(T ).
48
I.
Topologische R¨ aume
(b) Sei umgekehrt auf der Potenzmenge einer Menge T eine Abbildung K mit den Eigenschaften (1)–(4) vorgelegt (eine solche Abbildung heißt Kuratowskische H¨ ullenoperation). Zeige, dass es eine Topologie τ auf T gibt, f¨ ur die M ⊂ T genau dann abgeschlossen ist, wenn M = K(M ) ist. Aufgabe I.9.7 Sei D eine dichte Teilmenge des topologischen Raums T . ur alle offenen Mengen O ⊂ T . (a) Dann gilt D ∩ O = O f¨ (b) F¨ ur offene Mengen O ⊂ T ist D ∩ O dicht in O bez¨ uglich der Relativtopologie. (c) Gilt (b) auch, wenn O nicht als offen vorausgesetzt wird? Aufgabe I.9.8 Zeige, dass es eine Topologie auf R gibt, f¨ ur die die Mengen [t, t + ε), ε > 0, eine Umgebungsbasis von t bilden, und dieser topologische Raum ist separabel. (So topologisiert, wird R die Sorgenfrey-Gerade genannt.) Aufgabe I.9.9 ur die die Mengen [s, s+ε)×[t, t+ε), (a) Zeige, dass es eine Topologie auf R2 gibt, f¨ ε > 0, eine Umgebungsbasis von (s, t) bilden, und dieser topologische Raum ist separabel. (So topologisiert, wird R2 die Sorgenfrey-Ebene genannt.) (b) Die Relativtopologie der Sorgenfrey-Ebene auf ∆ := {(s, −s): s ∈ R} ist die diskrete Topologie. (c) Ein Unterraum eines separablen topologischen Raums braucht nicht separabel zu sein. (d) Ein Unterraum eines separablen metrischen Raums ist separabel. Aufgabe I.9.10 (Produkttopologie) (a) Seien (S, σ) und (T, τ ) topologische R¨ aume. Dann gibt es eine Topologie π auf S × T , so dass die U × V , s ∈ U ∈ σ, t ∈ V ∈ τ , eine Umgebungsbasis von (s, t) bilden. π heißt die Produkttopologie von σ und τ . (b) In der u agt Rn+m die Produkttopologie von Rn und Rm . ¨blichen Topologie tr¨ Aufgabe I.9.11 Ein topologischer Raum erf¨ ullt das 2. Abz¨ ahlbarkeitsaxiom, wenn es eine Folge O1 , O2 , . . . offener Mengen gibt, so dass jede offene Menge O Vereinigung gewisser dieser Oj ist; mit anderen Worten existiert eine Teilmenge N ⊂ N mit O = j∈N Oj . (a) R, versehen mit der euklidischen Topologie, erf¨ ullt das 2. Abz¨ ahlbarkeitsaxiom. (b) Rd , versehen mit der euklidischen Topologie, erf¨ ullt das 2. Abz¨ ahlbarkeitsaxiom. (c) Ein separabler metrischer Raum erf¨ ullt das 2. Abz¨ ahlbarkeitsaxiom. ooAufgabe I.9.12 Ist die Abbildung f : {0, 1}N → [0, 1], (an ) → n an 2−n , ein Hom¨ N morphismus, wenn {0, 1} die Produkttopologie und [0, 1] die euklidische Topologie tr¨ agt? Aufgabe I.9.13 Sei T ein topologischer Raum und A ⊂ T . Dann ist die Indikatorfunktion χA genau dann stetig, wenn A offen und abgeschlossen ist.
I.9
Aufgaben
49
Aufgabe I.9.14 Auf RR betrachte die Topologie der punktweisen Konvergenz. Setze ψ: RR → R,
ψ(f ) = sup arctan f (s). s∈R
Dann ist ψ genau dann bei f stetig, wenn f nach oben unbeschr¨ ankt ist. Aufgabe I.9.15 (a) Sei T1 ein topologischer Raum mit der gischen Raum T2 jede Abbildung f : T1 diskrete Topologie. (b) Sei T2 ein topologischer Raum mit der gischen Raum T1 jede Abbildung f : T1 indiskrete Topologie.
Eigenschaft, dass f¨ ur jeden topolo→ T2 stetig ist. Dann tr¨ agt T1 die Eigenschaft, dass f¨ ur jeden topolo→ T2 stetig ist. Dann tr¨ agt T2 die
Aufgabe I.9.16 RR sei mit der Topologie der punktweisen Konvergenz versehen und RR × RR mit der Produkttopologie (Aufgabe I.9.10). Dann ist die Abbildung add: RR × RR → RR ,
(f, g) → f + g
stetig. Aufgabe I.9.17 Seien R, S und T topologische R¨ aume, und S × T werde mit der Produkttopologie versehen (Aufgabe I.9.10). Dann sind die Projektionen p1 : S × T → S, (s, t) → s,
p2 : S × T → T, (s, t) → t
stetig, und die Produkttopologie ist die gr¨ obste Topologie auf S × T mit dieser Eigenschaft. Eine Abbildung f : R → S × T ist genau dann stetig, wenn p1 ◦ f und p2 ◦ f es sind. Aufgabe I.9.18 Sei S ein topologischer Raum. Der Vektorraum ℓ∞ (S) aller beschr¨ ankten reellwertigen Funktionen auf S werde mit der Metrik der gleichm¨ aßigen Konvergenz, also d(f, g) = sup |f (s) − g(s)| s∈S
b
versehen. Zeige, dass der Unterraum C (S) = {f ∈ ℓ∞ (S): f stetig} abgeschlossen ist andig sind. und dass die metrischen R¨ aume ℓ∞ (S) und C b (S) vollst¨ Aufgabe I.9.19 Betrachte Z mit der Topologie τ aus Beispiel I.2(e). (a) (Z, τ ) ist ein Hausdorffraum. (b) Gilt 2n → 0 bzgl. τ ? Gilt n! → 0 bzgl. τ ? (c) Sei m ∈ Z; dann ist die Abbildung fm : (Z, τ ) → (Z, τ ), fm (n) = n + m, ein Hom¨ oomorphismus. (d) (Z, τ ) ist metrisierbar. Aufgabe I.9.20 Die Topologie der punktweisen Konvergenz auf RR ist nicht metrisierbar. (Hinweis: Sonst g¨ abe es abz¨ ahlbar viele Umgebungen von 0, der Nullfunktion, mit ∞ U = {0}. F¨ u hre das zu einem Widerspruch.) n n=1
50
I.
Topologische R¨ aume
Aufgabe I.9.21 Betrachte auf C(R) die Topologie der gleichm¨ aßigen Konvergenz auf Kompakta (Beispiel I.2(g)). Zeige, dass eine Folge (fn ) genau dann gegen f konvergiert, wenn f¨ ur alle kompakten Teilmengen K ⊂ R sup |fn (t) − f (t)| → 0.
t∈K
Gilt das auch f¨ ur Netze? Aufgabe I.9.22 Ein topologischer Raum, in dem Grenzwerte konvergenter Netze eindeutig bestimmt sind, ist ein Hausdorffraum. Aufgabe I.9.23 In einem Hausdorffraum sind endliche Mengen abgeschlossen, aber die Umkehrung gilt nicht. (Tipp: Aufgabe I.9.2.) Aufgabe I.9.24 Sei T das Produkt der topologischen R¨ aume Tα , α ∈ A. Dann bilden die Projektionen pβ : T → Tβ offene Mengen auf offene Mengen ab, aber im allgemeinen nicht abgeschlossene Mengen auf abgeschlossene Mengen. Aufgabe I.9.25 In RR mit der Produkttopologie liegt {f : R → R: f (t) = 0 f¨ ur alle t bis auf endlich viele} dicht. Aufgabe I.9.26 R, versehen mit der Topologie aus Aufgabe I.9.2, ist kompakt. Aufgabe I.9.27 Sei T ⊂ [0, 1][0,1] die Menge der monoton wachsenden Funktionen, versehen mit der Topologie der punktweisen Konvergenz. Dann ist T kompakt. Aufgabe I.9.28 Beweise den Satz von Arzel` a-Ascoli mit Hilfe des Satzes von Tikhonov gem¨ aß folgender Anleitung. F¨ ur eine Funktion δ: (0, ∞) → (0, ∞) mit limε→0 δ(ε) = 0 und f¨ ur K > 0 betrachte die Menge Mδ,K derjenigen Funktionen f auf S mit
f ∞ ≤ K und sup{|f (s) − f (t)|: d(s, t) ≤ δ(ε)} ≤ ε f¨ ur alle ε > 0. Zeige, dass Mδ,K bez¨ uglich der Topologie der punktweisen Konvergenz kompakt ist und dass die identische Abbildung auf Mδ,K bez¨ uglich der Topologie der punktweisen Konvergenz und der Topologie der gleichm¨ aßigen Konvergenz stetig ist. Aufgabe I.9.29 Sind alle Tα , α ∈ A, Hausdorffr¨ aume, so ist es auch ihr Produkt
Tα . Aufgabe I.9.30 Ein topologischer Raum T ist genau dann zusammenh¨ angend, wenn jede stetige Funktion f : T → {0, 1} konstant ist. Aufgabe I.9.31 (a) R, versehen mit der Topologie aus Aufgabe I.9.2, ist zusammenh¨ angend. (b) Die Sorgenfrey-Gerade (Aufgabe I.9.8) ist nicht zusammenh¨ angend. Aufgabe I.9.32 Sei T ein topologischer Raum. (a) Ist S ⊂ T zusammenh¨ angend, dann auch S.
I.9
Aufgaben
51
(b) Sei t ∈ T . Die Zusammenhangskomponente C(t) ist definiert als Vereinigung aller zusammenh¨ angenden Teilmengen von T , die t enthalten. [Warum gibt es stets solch eine Teilmenge?] Zeige, dass C(t) zusammenh¨ angend und abgeschlossen ist. (c) Ist T ⊂ Rd offen, so ist auch C(t) offen. Aufgabe I.9.33 Beweise Korollar I.6.7. Aufgabe I.9.34 Der im Beweis von Satz I.7.1 konstruierte Raum ist zusammenh¨ angend. ur a ∈ R sei Ta = {f ∈ Aufgabe I.9.35 Betrachte RR mit der Produkttopologie. F¨ ur h¨ ochstens endlich viele t}. Dann ist T0 ∪ T1 zusammenh¨ angend, aber RR : f (t) = a f¨ nicht wegzusammenh¨ angend. Aufgabe I.9.36 (a) Zeige, dass R zu jedem offenen Teilintervall (a, b), −∞ ≤ a < b ≤ ∞, hom¨ oomorph ist. (b) Ist R zu [0, 1) hom¨ oomorph? Zu [0, 1]? ur n ≥ 2 nicht hom¨ oomorph sind. (c) Zeige, dass R und Rn f¨ ¨ ur (Tipp: R \ {t} ist stets unzusammenh¨ angend. Ubrigens sind Rm und Rn f¨ m = n nie hom¨ oomorph, der Beweis verlangt aber ganz andere und tieferliegende Hilfsmittel.) Aufgabe I.9.37 Ein topologischer Raum T ist genau dann normal, wenn f¨ ur alle F ⊂ G ⊂ T , F abgeschlossen, G offen, eine offene Menge O mit F ⊂ O ⊂ O ⊂ G existiert. Aufgabe I.9.38 Ein abgeschlossener Unterraum eines normalen Raums ist normal (in der Relativtopologie). Aufgabe I.9.39 Seien T ein normaler Raum, A ⊂ T abgeschlossen und f : A → R eine stetige Funktion. Dann existiert eine stetige Fortsetzung F : T → R. (Tipp: Man kann Aufgabe I.9.36(a) mit Gewinn benutzen.) Aufgabe I.9.40 Seien fn : T → M stetige Funktionen auf einem topologischen Raum aßig mit Werten in einem metrischen Raum (M, d); die Folge (fn ) konvergiere gleichm¨ gegen die Funktion f : T → M , d.h. sup d(fn (t), f (t)) → 0. t∈T
Dann ist f stetig. Aufgabe I.9.41 In einem normalen Hausdorffraum besitzt jeder Punkt eine Umgebungsbasis aus abgeschlossenen Mengen. Gilt die Aussage auch in beliebigen Hausdorffr¨ aumen? Aufgabe I.9.42 Eine Funktion f : T → R auf einem topologischen Raum heißt halbstetig von unten, wenn {t: f (t) > r} f¨ ur jedes r ∈ R offen ist, und sie heißt halbstetig von oben, wenn {t: f (t) < r} f¨ ur jedes r ∈ R offen ist.
52
I.
Topologische R¨ aume
(a) F¨ ur welche Teilmengen A ⊂ T ist die charakteristische Funktion χA halbstetig von unten bzw. von oben? (b) f : T → R ist genau dann halbstetig von unten, wenn f¨ ur jedes konvergente Netz (ti ) aus ti → t und f (ti ) ≤ r auch f (t) ≤ r folgt. (c) f : T → R ist genau dann halbstetig von unten, wenn f bez¨ uglich der Topologie von R aus Aufgabe I.9.3 stetig ist.
(d) Ist T kompakt und f : T → R halbstetig von unten, so ist f nach unten beschr¨ ankt und nimmt sein Infimum an. Aufgabe I.9.43 Betrachte N mit der Topologie der ko-endlichen Mengen aus Aufgabe I.9.2. Zeige, dass dies ein kompakter Raum ist, der nicht Bairesch ist. Aufgabe I.9.44 Eine Gδ -Teilmenge eines Baireraums ist selbst ein Baireraum. Aufgabe I.9.45 Seien T = R2 \ {(x, 0): x ∈ / Q} und S = Q × {0}, versehen mit der euklidischen Topologie. Dann ist T ein Baireraum, S ⊂ T ist abgeschlossen, aber S ist kein Baireraum. Aufgabe I.9.46 Gib ein Beispiel eines topologischen Raums, der von 2. Kategorie in sich, aber kein Baireraum ist. Aufgabe I.9.47 Sei O ⊂ R2 offen und dicht. Zu x ∈ R setze Ox = {y ∈ R: (x, y) ∈ O}. Dann ist {x ∈ R: Ox ist dicht in R} dicht in R. Gilt die entsprechende Aussage auch f¨ ur offene und dichte Teilmengen von Q2 ? Aufgabe I.9.48 Gibt es eine differenzierbare Funktion f : R → R, deren Ableitung an keiner Stelle stetig ist? Aufgabe I.9.49 Sei (fn ) eine punktweise beschr¨ ankte Folge stetiger Funktionen auf [0, 1]. Dann existiert ein offenes Teilintervall von [0, 1], auf dem (fn ) gleichm¨ aßig beschr¨ ankt ist. Aufgabe I.9.50 Es sei f : [0, ∞) → R eine stetige Funktion, so dass f¨ ur alle t ≥ 0 die Bedingung limn→∞ f (nt) = 0 gilt. Dann gilt auch limt→∞ f (t) = 0. Aufgabe I.9.51 (Lokalkompakte R¨ aume) Ein topologischer Raum heißt lokalkompakt, wenn jeder Punkt eine Umgebungsbasis aus kompakten Mengen besitzt. (a) Rn ist lokalkompakt. (b) Der Raum C[0, 1] mit der Metrik der gleichm¨ aßigen Konvergenz, also der Metrik der Supremumsnorm, ist nicht lokalkompakt. ¨ aßig kon(Uberlege dazu, dass fn (t) = εtn eine Folge in C[0, 1] ohne gleichm¨ vergente Teilfolge definiert.) (c) Ein kompakter Hausdorffraum ist lokalkompakt. (Verwende Aufgabe I.9.41.)
I.10 Literaturhinweise
53
(d) Sei T ein lokalkompakter Hausdorffraum; ferner bezeichne ∞ einen nicht in T liegenden Punkt. Auf αT := T ∪ {∞} wird folgende Topologie τ definiert: O ⊂ αT sei offen, falls (1) ∞ ∈ / O und O eine offene Menge im Sinn der Topologie von T ist oder falls (2) ∞ ∈ O und T \ O eine kompakte Teilmenge von T ist. Zeige, dass τ in der Tat eine Topologie ist und (αT, τ ) ein kompakter Hausdorffraum ist, f¨ ur den die Relativtopologie auf T die Ausgangstopologie von T ist. T ist offen in αT , und genau dann liegt T dicht in αT , wenn T nicht kompakt ist. αT wird Alexandrov- oder Ein-Punkt-Kompaktifizierung von T genannt. (e) Die Alexandrov-Kompaktifizierung von R ist hom¨ oomorph zur Kreislinie S 1 = 2 {x ∈ R : x = 1}, und allgemeiner ist die Alexandrov-Kompaktifizierung von Rn hom¨ oomorph zur n-Sph¨ are S n = {x ∈ Rn+1 : x = 1}. (f) Was (wenn u are in Teil (d) schiefgegangen, wenn T nicht als ¨berhaupt) w¨ Hausdorffraum, und was, wenn T nicht als lokalkompakt vorausgesetzt w¨ are? (g) Ein lokalkompakter Hausdorffraum ist ein Baireraum.
I.10
Literaturhinweise
Einf¨ uhrungen in die mengentheoretische Topologie findet man in: ◮ R. B. Ash: Real Analysis and Probability. Academic Press, 1972. ◮ G. Pedersen: Analysis Now. Springer, 1989. ◮ M. Reed, B. Simon: Functional Analysis. 2. Auflage, Academic Press, 1980.
Einige ausf¨ uhrliche Darstellungen: ◮ J. Dugundji: Topology. Allyn and Bacon, 1966. ◮ K. J¨ anich: Topologie. 4. Auflage, Springer, 1994. ◮ J. L. Kelley: General Topology. Van Nostrand, 1955; Nachdruck Springer, 1975. ◮ B. von Querenburg: Mengentheoretische Topologie. 3. Auflage, Springer, 2001. ◮ V. Runde: A Taste of Topology. Springer, 2005. ◮ A. Wilansky: Topology for Analysis. Wiley, 1970. ◮ S. Willard: General Topology. Addison-Wesley, 1970.
Eher f¨ ur Spezialisten: ◮ R. Engelking: General Topology. Heldermann, 1989. ◮ L. A. Steen, J. A. Seebach: Counterexamples in Topology. 2. Auflage, Springer, 1979.
Kapitel II
Funktionentheorie
Die Funktionentheorie befasst sich mit den differenzierbaren Funktionen, die eine offene Teilmenge von C nach C abbilden. Wenngleich die Definition der Differenzierbarkeit f¨ ur eine Funktion f : G → C w¨ortlich dieselbe wie f¨ ur reelle Funktionen auf einem Intervall ist, gibt es dramatische Unterschiede in der Theorie solcher Funktionen. Hier eine Auswahl: • Ist f : G → C differenzierbar, so ist f beliebig h¨aufig differenzierbar. • Ist f : C → C differenzierbar und beschr¨ankt, so ist f konstant. • Sind fn : G → C differenzierbar und konvergiert (fn ) auf jeder kompakten Teilmenge von G gleichm¨ aßig gegen eine Funktion f , so ist f differenzierbar. Man mache sich klar, dass die Analoga dieser Aussagen im Reellen allesamt falsch sind! In diesem Kapitel setzen wir aus der Analysisvorlesung Vertrautheit mit dem K¨orper C der komplexen Zahlen und dessen metrischen Eigenschaften voraus1; letztere ergeben sich daraus, dass C als metrischer Raum und als R-Vektorraum wir aus der kanonisch mit R2 identifiziert werden kann. Außerdem u ¨ bernehmen ∞ Analysis, dass eine Potenzreihe, also eine Reihe der Form n=0 cn (z − z0 )n , auf kompaktenTeilmengen des Kreises UR (z0 ) = {z ∈ C: |z − z0 | < R} mit R = 1/ lim sup n |cn | (dem Konvergenzradius) gleichm¨aßig konvergiert; sie stellt eine auf UR (z0 ) stetige Funktion dar. Dass eine solche Funktion sogar differenzierbar ist, wird in Satz II.1.5 noch einmal explizit bewiesen. Hier der Vollst¨ andigkeit halber noch ein paar Grundtatsachen u ¨ber komplexe Zahlen. Der K¨ orper C wird konstruiert als R2 , versehen mit der Addition (x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) 1 Vgl.
O. Forster, Analysis 1, Vieweg.
56
II.
Funktionentheorie
und der Multiplikation (x1 , y1 ) · (x2 , y2 ) = (x1 x2 − y1 y2 , y1 x2 + y2 x1 ). So wird C := R2 tats¨ achlich zu einem K¨ orper mit dem Nullelement (0, 0) und dem Einselement (1, 0). Die Abbildung x → (x, 0) von R nach R2 ist ein K¨ orperhomomorphismus. Identifiziert man x ∈ R mit (x, 0) und schreibt man i := (0, 1), so kann jedes Element z des K¨ orpers C eindeutig in der Form z = (x, y) = (x, 0) + (0, y) = x + iy mit reellen Zahlen x und y dargestellt werden. (Komplexe Zahlen werden traditionell mit dem Buchstaben z bezeichnet.) x heißt Realteil von z und y Imagin¨arteil von z; Bezeichnung x = Re z,
y = Im z
(beachte, dass Im z eine reelle Zahl ist). Der Betrag |z| von z = x + iy ist erkl¨art als |z| = (x2 + y 2 )1/2 . Dann gelten |z1 + z2 | ≤ |z1 | + |z2 |,
|z1 z2 | = |z1 | |z2 |,
Ferner ist stets |Re z| ≤ |z|,
1 1 = z |z|
f¨ ur z = 0.
|Im z| ≤ |z|.
Die Zahl z = x − iy heißt zu z = x + iy konjugiert komplex ; es gilt |z| = |z|. Die Funktionen z → Re z, z → Im z, z → |z| und z → z sind stetig. Die Reihe ∞ zn exp(z) = n! n=0 konvergiert f¨ ur alle z ∈ C; wie im Reellen gilt die Funktionalgleichung exp(z1 + z2 ) = exp(z1 ) exp(z2 ). Statt exp(z) schreibt man deshalb auch ez . F¨ ur reelles t gelten eit = cos t + i sin t,
|eit | = 1.
II.1 Der Begriff der analytischen Funktion
II.1
57
Der Begriff der analytischen Funktion
Wir beginnen mit der Definition des Differenzierbarkeit im Komplexen. Definition II.1.1 Seien G ⊂ C offen, f : G → C eine Funktion und z0 ∈ G. Dann heißt f komplex differenzierbar (oder kurz differenzierbar ) in z0 , wenn lim
z→z0
f (z) − f (z0 ) z − z0
existiert; dieser Grenzwert wird mit f ′ (z0 ) bezeichnet. Definition II.1.2 Eine komplex differenzierbare Funktion f : G → C auf einer offenen Teilmenge G ⊂ C heißt holomorph oder analytisch. In der reellen Analysis nennt man eine Funktion analytisch, wenn sie lokal als Potenzreihe dargestellt werden kann; in der komplexen Analysis wird sich das f¨ ur alle differenzierbaren Funktionen automatisch ergeben (Theorem II.3.3). Daher benutzen wir von Anfang an den Begriff analytisch“, obwohl das eigentlich erst ” sp¨ ater gerechtfertigt wird. Wie in der reellen Analysis beweist man nun die u ¨ blichen Rechenregeln u ¨ber differenzierbare Funktionen. Lemma II.1.3 Seien f, g: G → C differenzierbar in z0 ∈ G. (a) f und g sind stetig in z0 . (b) f ± g sind differenzierbar in z0 mit (f ± g)′ (z0 ) = f ′ (z0 ) ± g ′ (z0 ). (c) F¨ ur λ ∈ C ist λf differenzierbar in z0 mit (λf )′ (z0 ) = λf ′ (z0 ). (d) f · g ist differenzierbar in z0 mit (f · g)′ (z0 ) = f ′ (z0 )g(z0 ) + f (z0 )g ′ (z0 ). (e) Falls g(z0 ) = 0, ist f /g, definiert auf {z ∈ G: g(z) = 0}, differenzierbar in z0 mit f ′ g
(z0 ) =
f ′ (z0 )g(z0 ) − f (z0 )g ′ (z0 ) . (g(z0 ))2
Auch die Kettenregel u agt sich. Dazu beobachten wir zun¨achst, dass – ¨bertr¨ wie in der reellen Analysis – f genau dann bei z0 differenzierbar mit Ableitung α0 ist, wenn eine Funktion ϕ, die in einer Umgebung U von z0 definiert ist, mit den Eigenschaften f (z) = f (z0 ) + α0 (z − z0 ) + ϕ(z) ϕ(z) =0 lim z→z0 z − z0 existiert.
∀z ∈ U
(II.1)
58
II.
Funktionentheorie
Lemma II.1.4 Seien G, H ⊂ C offen, f : G → H differenzierbar bei z0 ∈ G, g: H → C differenzierbar bei w0 = f (z0 ). Dann ist g ◦ f : G → C differenzierbar bei z0 mit (g ◦ f )′ (z0 ) = g ′ (f (z0 ))f ′ (z0 ). Beweis. Schreibe gem¨ aß (II.1) f (z) = f (z0 ) + f ′ (z0 )(z − z0 ) + δ(z)(z − z0 ),
g(w) = g(w0 ) + g ′ (w0 )(w − w0 ) + ε(w)(w − w0 ), wo lim δ(z) = 0,
z→z0
lim ε(w) = 0.
w→w0
Also gilt g(f (z)) = g(f (z0 )) + g ′ (f (z0 ))(f (z) − f (z0 )) + ε(f (z))(f (z) − f (z0 )), = g(f (z0 )) + g ′ (f (z0 ))f ′ (z0 )(z − z0 ) + g ′ (f (z0 ))δ(z)(z − z0 ) + ε(f (z))(f (z) − f (z0 )).
Setzen wir χ(z) = g ′ (f (z0 ))δ(z)(z − z0 ) + ε(f (z))(f (z) − f (z0 )), so folgt wegen |χ(z)| ≤ |g ′ (f (z0 ))| |δ(z)| |z − z0 | + |ε(f (z))| |f ′ (z0 ) + δ(z)| |z − z0 | und limz→z0 ε(f (z)) = 0, da f stetig bei z0 ist, lim
z→z0
was zu zeigen war.
χ(z) = 0, z − z0
2
Beispiele. (a) Es ist klar, dass die konstante Funktion z → 1 und die identische Funktion z → z u ¨ berall differenzierbar sind. Also ist nach Lemma II.1.3 jedes Polynom auf C analytisch. Der Quotient P/Q zweier Polynome (eine sog. rationale Funktion) ist auf der (offenen) Menge {z ∈ C: Q(z) = 0} analytisch. (b) Die Funktion z → Re z ist nirgends komplex differenzierbar. Betrachtet man n¨ amlich in Re z − Re z0 ∆(z, z0 ) = z − z0 komplexe Zahlen z = z0 + h mit h ∈ R, ist ∆(z, z0 ) = 1, und f¨ ur z = z0 + ih mit h ∈ R ist ∆(z, z0 ) = 0. Also existiert limz→z0 ∆(z, z0 ) nicht. Zu diesem Beispiel vgl. auch Korollar II.1.9. (c) Die komplexe Exponentialfunktion z → exp(z) =
∞ zn n! n=0
ist auf ganz C analytisch. Dies folgt aus dem n¨ achsten Satz.
II.1
Der Begriff der analytischen Funktion
59
n Satz II.1.5 Sei ∞ n=0 cn (z − z0 ) eine Potenzreihe mit Konvergenzradius 0 < R ≤ ∞. Dann stellt die Reihe eine auf dem Kreis UR (z0 ) analytische Funktion dar. ∞ n Beweis. Schreibe f (z) = f¨ ur z ∈ UR (z0 ). Sei nun w ∈ n=0 cn (z − z0 ) UR (z0 ) fest. Wenn man Potenzreihen auch im Komplexen gliedweise differenzieren genau das werden wir nachweisen –, erh¨alt man die Reihe ∞ darf – undn−1 als Kandidaten f¨ ur die Ableitung von f bei w. Also wern=1 ncn (z − z0 ) den wir versuchen, ∆(z, w) :=
∞
f (z) − f (w) − ncn (z − z0 )n−1 z−w n=1
f¨ ur z → w abzusch¨atzen. Ohne Beschr¨ ankung der Allgemeinheit betrachten wir z0 = 0. Einsetzen der Reihe in ∆(z, w) liefert ∆(z, w) =
∞
cn
n=0
Nun ist n
n
∞
z n − wn − ncn wn−1 . z−w n=1
⎧ n−1 ⎪ ⎨
z −w z n−1−k wk f¨ ur n ≥ 1, = ⎪ z−w ⎩ k=0 0 f¨ ur n = 0,
daher
∆(z, w) =
∞
cn
n=1
n−1
z
n−1−k
k=0
k
w − nw
n−1
.
Die eckige Klammer verschwindet f¨ ur n = 1, und f¨ ur n ≥ 2 ergibt sich [. . . ] =
=
=
=
n−2
k=0 n−2
z n−1−k wk − (n − 1)wn−1
(k + 1)z n−1−k wk −
k=0 n−2
(k + 1)z n−1−k wk −
k=0 n−1 k=1
kz n−k wk−1 −
= (z − w)
n−1 k=1
n−1
n−2
k=0 n−1
kz n−1−k wk − (n − 1)wn−1 kz n−1−k wk
k=0
kz n−1−k wk
k=1
kz n−1−k wk−1 .
60
II.
Funktionentheorie
Sei nun |w| < r < R und |z| ≤ r. Dann gilt |∆(z, w)| ≤ ≤
∞
n=2 ∞
n=2
|cn | |z − w|
n−1 k=1
k|z|n−1−k |w|k−1
|cn |n2 rn−2 |z − w|;
das ist eine grobe Absch¨ atzung, aber sie ist gut genug. Weil die Poziemlich ∞ 2 n tenzreihe |c |n z ebenfalls den Konvergenzradius R hat, konvergiert n n=2 ∞ 2 n−2 . Also folgt n=2 |cn |n r lim ∆(z, w) = 0,
z→w
wie behauptet.
2
n Korollar II.1.6 Sei f durch die Potenzreihe f (z) = ∞ n=0 cn (z − z0 ) mit dem Konvergenzradius R > 0 dargestellt. Dann ist f beliebig h¨aufig differenzierbar, und die k-te Ableitung ist als Potenzreihe f (k) (z) =
∞
n=k
cn n(n − 1) · · · (n − k + 1)(z − z0 )n−k
mit demselben Konvergenzradius R darstellbar. Insbesondere ist f (k) (z0 ) = ck k!. Beweis. Das folgt durch Induktion aus Satz II.1.5, denn dort wurde f ′ (z) =
∞
n=1
cn n(z − z0 )n−1
gezeigt, und diese Reihe hat denselben Konvergenzradius wie die Ausgangsreihe. 2 Beispiel. (d) Aus der reellen Analysis sind die Potenzreihenentwicklungen der Sinus- und Kosinusfunktion bekannt2 : sin x = cos x =
∞ (−1)n 2n+1 x (2n + 1)! n=0 ∞ (−1)n 2n x (2n)! n=0
∀x ∈ R,
∀x ∈ R.
2 Je nach Vorgehensweise sind die folgenden Formeln tats¨ achlich die Definitionen der Winkelfunktionen.
II.1
Der Begriff der analytischen Funktion
61
Diese Reihen haben jeweils den Konvergenzradius R = ∞; sie konvergieren also auch f¨ ur beliebige komplexe Argumente. Dies gibt Anlass dazu, die komplexen Sinus- und Kosinusfunktionen durch entsprechende Reihen zu definieren: ∞ (−1)n 2n+1 sin z = z (2n + 1)! n=0
cos z =
∞ (−1)n 2n z (2n)! n=0
∀z ∈ C,
∀z ∈ C.
Bemerke, dass daraus die G¨ ultigkeit der Eulerschen Formel eiz = cos z + i sin z f¨ ur alle komplexen Zahlen z folgt. Nach Satz II.1.5 sind sin und cos auf ganz C analytische Funktionen. Eines der bemerkenswertesten Resultate der Funktionentheorie ist die Umkehrung von Satz II.1.5: Jede analytische Funktion ist in eine Potenzreihe entwickelbar und wegen Korollar II.1.6 folglich beliebig h¨aufig differenzierbar. Um diese Aussage in Abschnitt II.3 zu beweisen, m¨ ussen wir uns im n¨achsten Abschnitt mit komplexen Kurvenintegralen befassen. Bevor wir das tun, soll noch auf den Zusammenhang zwischen den Differenzierbarkeitsbegriffen in C und R2 eingegangen werden. Es sei f : G → C, G ⊂ C, ˜ von R2 . eine Funktion. Wir identifizieren G kanonisch mit einer Teilmenge G Schreibe u(x, y) = Re f (x + iy), v(x, y) = Im f (x + iy) ˜ Der Funktion f entspricht kanonisch die Funktion f¨ ur (x, y) ∈ G. ˜ → R2 , F: G F (x, y) = u(x, y), v(x, y) .
Satz II.1.7 Die Funktion f ist genau dann in z0 = x0 + iy0 komplex differenzierbar, wenn F in (x0 , y0 ) total differenzierbar ist und die Gleichungen ux (x0 , y0 ) = vy (x0 , y0 ) vx (x0 , y0 ) = −uy (x0 , y0 )
(II.2)
erf¨ ullt sind. Ferner gilt dann f ′ (z0 ) = ux (x0 , y0 ) + ivx (x0 , y0 ) = vy (x0 , y0 ) − iuy (x0 , y0 ).
(II.3)
Die Gleichungen in (II.2) heißen die Cauchy-Riemannschen Differentialgleichungen. Beweis. Sei f in z0 differenzierbar. Wir zeigen zuerst, dass u und v in (x0 , y0 ) partiell differenzierbar sind und (II.2) und (II.3) gelten.
62
II.
Funktionentheorie
Dazu beachte f¨ ur h ∈ R f (z0 + h) − f (z0 ) u(x0 + h, y0 ) − u(x0 , y0 ) v(x0 + h, y0 ) − v(x0 , y0 ) = +i h h h → f ′ (z0 ) mit h → 0 sowie f (z0 + ih) − f (z0 ) u(x0 , y0 + h) − u(x0 , y0 ) v(x0 , y0 + h) − v(x0 , y0 ) = +i ih ih ih → f ′ (z0 ) mit h → 0. Es folgt, dass die partiellen Ableitungen von u und v in (x0 , y0 ) existieren und ux (x0 , y0 ) = Re f ′ (z0 ) = vy (x0 , y0 ) vx (x0 , y0 ) = Im f ′ (z0 ) = −uy (x0 , y0 ) erf¨ ullen. Daher gelten (II.2) und (II.3). Es bleibt zu zeigen, dass F total differenzierbar ist; d.h. dass u und v es sind. Nach (II.1) gilt f¨ ur betragsm¨ aßig hinreichend kleine h, k ∈ R f (z0 + (h + ik)) = f (z0 ) + (h + ik)f ′ (z0 ) + ϕ(h + ik), wobei lim|h+ik|→0 ϕ(h + ik)/|h + ik| = 0. Betrachtet man den Realteil und beachtet man f ′ (z0 ) = ux (x0 , y0 ) − iuy (x0 , y0 ) nach (II.3), erh¨ alt man u(x0 + h, y0 + k) = u(x0 , y0 ) + hux (x0 , y0 ) + kuy (x0 , y0 ) + Re ϕ(h + ik). Da auch lim|h+ik|→0 Re ϕ(h + ik)/|h + ik| = 0, zeigt das die totale Differenzierbarkeit von u. Analog liefert der Imagin¨ arteil mit f ′ (z0 ) = vy (x0 , y0 )+ ivx (x0 , y0 ) die totale Differenzierbarkeit von v. Nun seien umgekehrt die totale Differenzierbarkeit von u und v und (II.2) vorausgesetzt. Wir sch¨ atzen ϕ(h + ik) := f (z0 + (h + ik)) − f (z0 ) − (h + ik)(ux (x0 , y0 ) − iuy (x0 , y0 )) ab. Es ist Re ϕ(h + ik) = u(x0 + h, y0 + k) − u(x0 , y0 ) − (hux (x0 , y0 ) + kuy (x0 , y0 )) und, da nach (II.2) ux − iuy = vy + ivx an der Stelle (x0 , y0 ), Im ϕ(h + ik) = v(x0 + h, y0 + k) − v(x0 , y0 ) − (hvx (x0 , y0 ) + kvy (x0 , y0 )).
II.1
Der Begriff der analytischen Funktion
63
Die Differenzierbarkeit von u und v liefert lim
h2 +k2 →0
Re ϕ(h + ik) Im ϕ(h + ik) = 2 lim = 0; 2 2 1/2 2 h +k →0 (h2 + k 2 )1/2 (h + k )
also ist lim
h+ik→0
ϕ(h + ik) = 0, |h + ik|
und f ist nach (II.1) bei z0 komplex differenzierbar.
2
Wir ben¨ otigen im folgenden einen Begriff. In Definition I.6.1 wurden zusammenh¨ angende topologische R¨ aume definiert. F¨ ur offene Teilmengen G von C bedeutet das, dass die einzigen offenen Teilmengen H ⊂ G, die gleichzeitig relativ abgeschlossen (also von der Form H = G ∩ A mit einer abgeschlos¨ senen Teilmenge A ⊂ C) sind, H = ∅ und H = G sind. Aquivalent dazu ist (Korollar I.6.7), dass je zwei Punkte von G durch einen (sogar achsenparallelen) Polygonzug verbunden werden k¨ onnen. Definition II.1.8 Eine offene und zusammenh¨ angende Teilmenge von C heißt Gebiet. Hier ist die erste u ur analytische Funktionen. ¨ berraschende Schlussfolgerung f¨ Korollar II.1.9 Eine reellwertige analytische Funktion auf einem Gebiet ist konstant. Beweis. Sei G ein Gebiet und f : G → R (⊂ C) analytisch; wir werden wahlweise G ⊂ C oder G ⊂ R2 auffassen. Da v = Im f = 0 ist, folgt f¨ ur u = Re f aus den Cauchy-Riemannschen Differentialgleichungen grad u = 0. Da G zusammenh¨angend ist, impliziert das f = u = const. [Beweis hierf¨ ur: Aus dem Mittelwertsatz ergibt sich sofort die Konstanz von u auf konvexen Teilgebieten, z.B. auf Kreisen. Sei nun z0 ∈ G beliebig und G0 = {z ∈ G: u(z) = u(z0 )}. Da u stetig ist, ist G0 in G relativ abgeschlossen. G0 ist aber auch offen. Ist n¨amlich z1 ∈ G0 und K ⊂ G ein Kreis um z1 , so ist nach der Vorbemerkung u|K konstant. Folglich gilt u(z) = u(z1 ) = u(z0 ) f¨ ur alle z ∈ K, d.h. K ⊂ G0 . Ferner ist z0 ∈ G0 , also G0 = ∅. Da G zusammenh¨ angend ist, muss G = G0 sein.] 2 Jetzt unternehmen wir noch einen Abstecher in die reelle Analysis. Sei f : G → C analytisch. Wir setzen voraus, dass u = Re f und v = Im f zweimal stetig differenzierbar sind (tats¨ achlich ist das automatisch erf¨ ullt; siehe Korollar II.3.4). Dann ist wegen der Cauchy-Riemannschen Differentialgleichungen uxx = vyx ,
uyy = −vxy .
Nach dem Satz von Schwarz u ¨ ber die Vertauschung der Differentiationsreihenfolge ist jedoch vxy = vyx , folglich gilt ∆u := uxx + uyy = 0
64
II.
Funktionentheorie
(∆ ist der Laplaceoperator ). Genauso sieht man ∆v = 0. Funktionen u mit der Eigenschaft ∆u = 0 heißen harmonisch; daher besteht ein enger Zusammenhang zwischen analytischen und harmonischen Funktionen.
II.2
Der Cauchysche Integralsatz
Der Cauchysche Integralsatz ist ohne Zweifel der wichtigste Satz der Funktionentheorie und einer der bedeutendsten S¨ atze der Analysis u ¨ berhaupt. Etwas vereinfacht, besagt er, dass f¨ ur eine geschlossene Kurve γ in C und eine im In” nern“ von γ analytische Funktion f das Umlaufintegral γ f (z) dz verschwindet. Bevor wir uns an die Pr¨ azisierung und den Beweis dieser Aussage machen, m¨ ussen als erstes komplexe Kurvenintegrale eingef¨ uhrt werden. Es sei zun¨achst f : [a, b] → C eine st¨ uckweise stetige Funktion3 auf einem kompakten Intervall. Wir erkl¨ aren b b b Im f (t) dt. Re f (t) dt + i f (t) dt := a
a
a
Dann gelten die u ¨ blichen Rechenregeln b (αf (t) + βg(t)) dt = α
a
c
f (t) dt +
b
f (t) dt =
f (t) dt + β a
b
b
g(t) dt a
f (t) dt
a
c
a
b
f¨ ur st¨ uckweise stetige f und g sowie α, β ∈ C, c ∈ [a, b]. Außerdem u ¨bertragen sich der Hauptsatz der Differential- und Integralrechnung, die Substitutionsregel und die Regel von der partiellen Integration. All dies folgt aus der Definition sowie der Tatsache, dass die entsprechenden Aussagen f¨ ur reellwertige Funktionen gelten. Wir ben¨ otigen ferner die Dreiecksungleichung“ ”b b f (t) dt ≤ |f (t)| dt. (II.4) a
a
b
Zum Beweis schreiben wir a f (t) dt = eiϕ r in Polarkoordinaten und setzen b b g = e−iϕ f . Dann ist a g(t) dt = e−iϕ a f (t) dt = r ≥ 0 eine reelle Zahl und b deshalb nach Definition des komplexen Integrals a Im g(t) dt = 0. Daraus folgt b b b = f (t) dt Re g(t) dt g(t) dt = a
a
a
≤
a
b
|g(t)| dt =
a
b
|f (t)| dt.
3 Das heißt, an jeder Stelle existieren die einseitigen Grenzwerte lim h→0+ f (t + h) und limh→0+ f (t − h), und bis auf endlich viele t stimmen sie mit f (t) u ¨berein.
II.2
Der Cauchysche Integralsatz
65
Sei nun G ⊂ C. Unter einer Kurve γ in G verstehen wir eine stetige, st¨ uckweise stetig differenzierbare Funktion4 γ: [a, b] → G. Beachte, dass wir unter einer Kurve eine Funktion und nicht ihr Bild Sp(γ) := {γ(t): a ≤ t ≤ b}, die Spur von γ, verstehen; vgl. die Definition I.6.4 eines Wegs. Eine Kurve heißt geschlossen, wenn γ(a) = γ(b). Manche Autoren lassen eine gr¨oßere Allgemeinheit in der Definition einer Kurve zu; aber f¨ ur unsere Zwecke ist der obige Begriff vollkommen ausreichend. Wir wollen das Kurvenintegral u ¨ber eine stetige Funktion l¨angs einer Kurve erkl¨ aren. Sei γ: [a, b] → C eine Kurve und f : Sp(γ) → C stetig. Unser Integral soll durch Grenz¨ ubergang aus den Riemannschen Summen n−1 k=0
f (γ(tk ))(γ(tk+1 ) − γ(tk ))
entstehen, wo a = t0 < t1 < · · · < tn = b eine Zerlegung von [a, b] ist. Ist γ stetig differenzierbar, so ist γ(tk+1 ) − γ(tk ) ≈ γ ′ (tk )(tk+1 − tk ), wenn tk+1 − tk klein genug ist (nach Definition der Ableitung). Daher ist n−1 k=0
f (γ(tk ))(γ(tk+1 ) − γ(tk )) ≈
n−1 k=0
f (γ(tk ))γ ′ (tk )(tk+1 − tk ),
und das ist eine Riemannsche Summe f¨ ur das Integral suggeriert, dass folgende Definition5 sinnvoll ist.
b a
f (γ(t))γ ′ (t) dt. Das
Definition II.2.1 Ist γ: [a, b] → C eine Kurve und f : Sp(γ) → C stetig, so setze b f (γ(t))γ ′ (t) dt. f (z) dz = γ
a
Dieses Integral heißt komplexes Kurvenintegral oder auch, falls γ geschlossen ist, Umlaufintegral. Ein Umlaufintegral wird gelegentlich auch mit γ f (z) dz bezeichnet. Aus der Definition ergibt sich sofort die Linearit¨at des Integrals: (αf (z) + βg(z)) dz = α f (z) dz + β g(z) dz γ
4 Es
γ
γ
gibt also eine Zerlegung a = t0 < t1 < · · · < tn = b, so dass γ |[t ,t stets stetig j j+1 ] differenzierbar ist (an den R¨ andern im einseitigen Sinn). 5 Wir versuchen gar nicht erst, die ≈-Zeichen durch pr¨ azise Grenzwerte zu ersetzen, obwohl das auch m¨ oglich w¨ are, sondern gehen ganz pragmatisch vor und definieren das, was unsere ¨ Uberlegungen als sinnvoll erscheinen lassen.
66
II.
Funktionentheorie
Sind ferner γ1 : [a, b] → C und γ2 : [b, c] → C Kurven mit γ1 (b) = γ2 (b), so definiert
γ1 (t) f¨ ur a ≤ t ≤ b γ(t) = γ2 (t) f¨ ur b < t ≤ c eine Kurve, f¨ ur die f (z) dz = γ
f (z) dz +
∀f ∈ C(Sp(γ))
f (z) dz
γ2
γ1
gilt. Man schreibt diese Formel auch als f (z) dz + f (z) dz = γ1
γ1 +γ2
f (z) dz. γ2
Wir untersuchen als n¨ achstes Parametertransformationen. Sei γ: [a, b] → C eine Kurve und ψ: [α, β] → [a, b] eine bijektive stetig differenzierbare Funktion mit ψ(α) = a, ψ(β) = b; ψ ist dann streng monoton wachsend. Dann definiert γ˜ := γ ◦ ψ: [α, β] → C ebenfalls eine Kurve, die dieselbe Spur wie γ besitzt. Nach der Substitutionsregel gilt f¨ ur f ∈ C(Sp(γ))
f (z) dz =
γ ˜
β
α β
= = =
α b
a
f (˜ γ (t))˜ γ ′ (t) dt f (γ(ψ(t)))γ ′ (ψ(t))ψ ′ (t) dt f (γ(u))γ ′ (u) du
f (z) dz.
γ
Ist hingegen ψ(α) = b und ψ(β) = a, so zeigt dieselbe Rechnung f (z) dz = − f (z) dz. γ ˜
γ
Kurven haben eine Orientierung: γ geht von p nach q und nicht umgekehrt. Ist ψ(α) = a und ψ(β) = b, nennt man ψ orientierungserhaltend, im Fall ψ(α) = b und ψ(β) = a orientierungsumkehrend. Ist ψ orientierungsumkehrend, schreibt man statt γ˜ auch symbolisch −γ, so dass f (z) dz = − f (z) dz −γ
γ
gilt. Beachte, dass das Integral l¨ angs −γ = γ ◦ ψ nach der obigen Rechnung nicht von der Wahl der orientierungsumkehrenden Transformation abh¨angt.
II.2
Der Cauchysche Integralsatz
67
Beispiele. (a) Sei f (z) = z. Wir betrachten folgende Kurven von 0 nach 1 + i: 1+i
1+i 6
γ1
γ2
0
0
Wir parametrisieren γ1 (t) = t(1 + i)
t γ2 (t) = 1 + (t − 1)i Damit ist f (z) dz =
t(1 + i)(1 + i) dt =
0
γ1
1
f (z) dz =
1
t dt +
1
0
γ2
f¨ ur 0 ≤ t ≤ 1, f¨ ur 0 ≤ t ≤ 1, f¨ ur 1 < t ≤ 2.
1 (1 + i)2 = i, 2
2
(1 + (t − 1)i)i dt =
1 +i− 2
1
2
(t − 1) dt = i.
F¨ ur den geschlossenen Weg erst γ2 , dann γ1 r¨ uckw¨arts“ (also symbolisch γ = ” γ2 − γ1 ) ist daher f (z) dz = 0. f (z) dz − f (z) dz = γ1
γ2
γ
(b) Sei f (z) = 1/z. Wir betrachten folgende Kurven von −1 nach 1: γ1
−1
? 1
−1
1 6
γ2
68
II.
Funktionentheorie
Wir w¨ ahlen als Parametrisierungen γ1 (t) = ei(π−t) γ2 (t) = eit Dann ist
f (z) dz =
π
0
γ1
f (z) dz =
f¨ ur 0 ≤ t ≤ π, f¨ ur π ≤ t ≤ 2π.
e−i(π−t) (ei(π−t) (−i)) dt = −πi,
2π
e−it (eit i) dt = πi.
π
γ2
Hier h¨ angt der Wert des Kurvenintegrals davon ab, auf welcher Kurve man von −1 nach 1 l¨ auft! Insbesondere gilt f¨ ur die geschlossene Kurve γ = γ2 − γ1 f (z) dz = 2πi = 0. f (z) dz − f (z) dz = γ1
γ2
γ
Wir werden sehen, dass das damit zu tun hat, dass in Beispiel II.2(a) f im ” Innern“ von γ analytisch ist, in diesem Beispiel wegen der Singularit¨at“ bei 0 ” jedoch nicht. Im folgenden werden wir das Analogon zu (II.4) f¨ ur Kurvenintegrale ben¨otigen. Dazu sei aus der reellen Analysis an das Kurvenintegral nach dem Bogenelement erinnert. Ist γ: [a, b] → C (= R2 ) eine Kurve und f ∈ C(Sp(γ)), so setzt man b
f ds =
f (γ(t))|γ ′ (t)| dt.
a
γ
F¨ ur die konstante Funktion f = 1 ergibt sich die Bogenl¨ange der Kurve; sie ist von der Parametrisierung unabh¨ angig. In der komplexen Analysis ist die Bezeichnung b f (γ(t))|γ ′ (t)| dt f (z) |dz| = a
γ
f¨ ur dieses Integral u ¨ blich.
Lemma II.2.2 Ist γ: [a, b] → C eine Kurve und f ∈ C(Sp(γ)), so gilt f (z) dz ≤ |f (z)| |dz|. γ
(II.5)
γ
Beweis. Nach Definition bzw. nach (II.4) gilt b ′ f (z) dz = f (γ(t))γ (t) dt a γ b |f (γ(t))| |γ ′ (t)| dt ≤ a = |f (z)| |dz|. γ
2
II.2
Der Cauchysche Integralsatz
69
Speziell folgt noch mit den Bezeichnungen L(γ) = |dz|, f ∞ = sup |f (z)| z∈Sp(γ)
γ
(L(γ) ist die Bogenl¨ ange von γ, falls γ seine Spur genau einmal durchl¨auft) f (z) dz ≤ f ∞ L(γ). (II.6) γ
Nun k¨ onnen wir die erste Version des Satzes von Cauchy formulieren und beweisen. Satz II.2.3 Es seien G ⊂ C offen, F : G → C analytisch und γ eine geschlossene Kurve in G. Die Ableitung f := F ′ sei stetig6 . Dann gilt f (z) dz = 0. γ
Beweis. Das Integral ist definiert, weil f als stetig vorausgesetzt ist. Es sei a = t0 < t1 < · · · < tn = b eine Zerlegung des Definitionsbereichs von γ, so dass γ |[tj ,tj+1 ] stets stetig differenzierbar ist (an den R¨andern im einseitigen Sinn). Dann gilt n−1 tj+1 F ′ (γ(t))γ ′ (t) dt f (z) dz = γ
tj
j=0
=
n−1 j=0
F (γ(tj+1 )) − F (γ(tj ))
= F (γ(b)) − F (γ(a))
(Hauptsatz)
(Teleskopsumme)
= 0, da γ geschlossen ist.
2
Nun zur n¨ achsten Version des Cauchyschen Integralsatzes. Es sei △ ⊂ C ein kompaktes Dreieck, also die konvexe H¨ ulle dreier Punkte p1 , p2 , p3 . Unter der Randkurve von △ verstehen wir die Kurve ⎧ 0 ≤ t ≤ 1, ⎨ p1 + t(p2 − p1 ) γ(t) = p2 + (t − 1)(p3 − p2 ) 1 < t ≤ 2, ⎩ p3 + (t − 2)(p1 − p3 ) 2 < t ≤ 3. Ein offener bzw. abgeschlossener Kreis wird im folgenden mit Ur (a) = {z: |z − a| < r},
Br (a) = {z: |z − a| ≤ r}
bezeichnet. 6 Diese Voraussetzung wird sich bald als stets erf¨ ullt erweisen; einstweilen m¨ ussen wir sie jedoch noch fordern.
70
II.
Funktionentheorie
Satz II.2.4 (Cauchyscher Integralsatz f¨ ur Dreieckswege) Es seien G ⊂ C offen, f : G → C analytisch und △ ⊂ G ein kompaktes Dreieck mit Randkurve γ. Dann gilt f (z) dz = 0. γ
Beachte, dass das volle Dreieck in G liegen soll und nicht nur sein Rand! Beweis. Wir zerlegen △ wie folgt in 4 kompakte Teildreiecke △1 , . . . , △4 ; die Pfeile geben die Orientierungen der Randkurven an: p3 K
-
K U -
p1
K K p2
Es sei γ j die Randkurve von △j . Nach Definition des Kurvenintegrals gilt dann
f (z) dz =
γ
4
f (z) dz.
(II.7)
γj
j=1
Es sei j ∈ {1, . . . , 4} so gew¨ ahlt, dass | γj f (z) dz| maximal ist; mit anderen Worten ≤ f (z) dz ∀k = 1, . . . , 4. f (z) dz k j γ
j
γ
j
Setze △1 = △ und γ1 = γ . Es folgt aus (II.7) f (z) dz ≤ 4 γ
γ1
f (z) dz .
Nun behandle △1 nach derselben Methode und finde ein kompaktes Teildreieck △2 ⊂ △1 mit Randkurve γ2 mit 2 f (z) dz ≤ 4 f (z) dz ≤ 4 f (z) dz . γ
γ1
γ2
II.2
Der Cauchysche Integralsatz
71
So fortfahrend, erh¨ alt man eine Folge von Dreiecken △n mit zugeh¨origen Randkurven γn mit folgenden Eigenschaften (diam = Durchmesser): △ ⊃ △1 ⊃ △ 2 ⊃ . . .
L(γn ) = 2−n L(γ) diam(△n ) = 2−n diam(△) f (z) dz ≤ 4n f (z) dz .
(II.8)
γn
γ
Da die △n ineinander geschachtelt sind, haben je endlich viele einen nicht leeren Durchschnitt. Weil △ kompakt ist, folgt (Satz I.5.7) n △n = ∅, und da die Durchmesser der △n eine Nullfolge bilden, besteht dieser Schnitt aus genau einem Punkt: n △n = {z0 }; beachte z0 ∈ G. Sei nun ε > 0. Wegen (II.1) existiert ein δ > 0, so dass Uδ (z0 ) ⊂ G und |f (z) − f (z0 ) − f ′ (z0 )(z − z0 )| ≤ ε|z − z0 |
∀z ∈ Uδ (z0 ).
(II.9)
W¨ ahle nun ein n0 ∈ N mit △n ⊂ Uδ (z0 ) f¨ ur n ≥ n0 ; das ist m¨oglich, da z0 ∈ △n f¨ ur alle n und diam(△n ) → 0. Es folgt f¨ ur n ≥ n0 ′ f (z) dz ≤ f (z) − f (z0 ) − f (z0 )(z − z0 ) dz γn γn + f (z0 ) + f ′ (z0 )(z − z0 ) dz . γn
Hier verschwindet das zweite Integral auf der rechten Seite nach Satz II.2.3, da der Integrand die Ableitung der stetig differenzierbaren Funktion z → f (z0 )z + 1 ′ 2 2 f (z0 )(z − z0 ) ist. Das erste Integral kann mit (II.5), (II.6) und (II.9) abgesch¨ atzt werden: ′ f (z) − f (z ) − f (z )(z − z ) dz ≤ ε|z − z0 | |dz| 0 0 0 γn
γn
≤ ε diam(△n )L(γn )
≤ ε4−n diam(△)L(γ).
Also impliziert (II.8) f (z) dz ≤ ε diam(△)L(γ). γ
Da ε > 0 beliebig war, folgt die Behauptung des Satzes.
2
Bekanntlich heißt eine Teilmenge G von C konvex, wenn mit zwei Punkten auch ihre Verbindungsstrecke in G liegt: p, q ∈ G ⇒ {tp + (1 − t)q: 0 ≤ t ≤ 1} ⊂ G. Zum Beispiel ist ein Kreis konvex.
72
II.
Funktionentheorie
Satz II.2.5 (Cauchyscher Integralsatz f¨ ur konvexe Gebiete) Es sei G ⊂ C ein konvexes Gebiet, und f : G → C sei analytisch. Dann gilt f¨ ur jede geschlossene Kurve γ in G f (z) dz = 0. γ
Beweis. Als differenzierbare Funktion ist f stetig; es reicht daher nach Satz II.2.3, f als Ableitung einer analytischen Funktion zu erkennen. Sei z0 ∈ G fest. F¨ ur zwei Punkte p, q ∈ G setze γp,q : [0, 1] → G,
t → p + t(q − p).
ur z ∈ G Weil G konvex ist, ist γp,q wohldefiniert. Nun sei f¨ F (z) = f (w) dw; γz0 ,z
wir werden F ′ = f zeigen. F¨ ur z, z ′ ∈ G ist nach Satz II.2.4, angewandt auf das Dreieck mit den Eckpunkten z0 , z und z ′ , das ja ganz in G liegt, 1 f (z + t(z ′ − z))(z ′ − z) dt. f (w) dw = F (z ′ ) − F (z) = 0
γz,z ′
z′
K
-
z0
z
Also ist F (z ′ ) − F (z) − f (z) = z′ − z
0
1
f (z + t(z ′ − z)) − f (z) dt.
Da f stetig bei z ist, existiert zu ε > 0 ein δ > 0, so dass der Betrag des Integranden ≤ ε ist, wenn nur |z ′ − z| < δ ausf¨ allt. Das zeigt F ′ (z) = lim ′
z →z
wie gew¨ unscht.
F (z ′ ) − F (z) = f (z), z′ − z
2
Beispiel II.2(b) zeigt, dass Satz II.2.5 nicht w¨ortlich auf beliebige Gebiete u ¨ bertragen werden kann; z.B. darf man nicht ohne weiteres C \ {0} nehmen.
II.2
Der Cauchysche Integralsatz
73
Das Problem bei C \ {0} ist offenbar, dass es ein Loch“ hat. Wir werden be” weisen, dass Satz II.2.5 f¨ ur Gebiete ohne L¨ ocher“ weiterhin g¨ ultig ist. Um das ” pr¨ azise formulieren zu k¨ onnen, ben¨ otigen wir die Begriffe der Homotopie und des einfachen Zusammenhangs. Diese Begriffe k¨ onnen allgemein f¨ ur zusammenh¨angende topologische R¨ aume studiert werden; wir begn¨ ugen uns hier mit offenen Teilmengen der komplexen Ebene. Definition II.2.6 Sei G ⊂ C, und seien γ0 und γ1 zwei geschlossene Kurven in G, die beide auf [0, 1] definiert sein sollen. γ0 und γ1 heißen homotop, wenn es eine stetige Funktion H: [0, 1] × [0, 1] → G mit H(s, 0) = H(s, 1) H(0, t) = γ0 (t) H(1, t) = γ1 (t)
∀s ∈ [0, 1], ∀t ∈ [0, 1], ∀t ∈ [0, 1]
gibt. Alle H(s, . ) sind also (geschlossene) Wege im Sinne von Definition I.6.4, aber f¨ ur 0 < s < 1 nicht unbedingt Kurven. Anschaulich bedeutet die Homotopie von Kurven, dass sie stetig ineinander transformiert werden k¨onnen:
s=0
s = 1/2
s=1
Definition II.2.7 Eine geschlossene Kurve in einer Menge G ⊂ C heißt nullhomotop, wenn sie zu einer konstanten Kurve t → p0 homotop ist. Eine nullhomotope Kurve l¨ asst sich in G auf einen Punkt zusammenziehen“. ” Aus Beispiel II.2(b) und Theorem II.2.10 wird folgen, dass die Kreislinie γ: 2πit t → e , 0 ≤ t ≤ 1, in C \ {0} nicht nullhomotop ist, was genau die Intuition st¨ utzt, aber gar nicht so leicht rigoros zu beweisen ist. Definition II.2.8 Ein Gebiet G ⊂ C heißt einfach zusammenh¨angend, wenn jede geschlossene Kurve in G nullhomotop ist. Intuitiv gesehen hat solch ein Gebiet keine L¨ocher“. ”
74
II.
Funktionentheorie
Beispiel. Ein Gebiet G heißt sternf¨ormig, falls ein Punkt p0 ∈ G existiert mit {tp0 + (1 − t)p: 0 ≤ t ≤ 1} ⊂ G
∀p ∈ G;
d.h., mit einem Punkt p enth¨ alt G auch die Strecke von p nach p0 . Offensichtlich sind konvexe Gebiete und die geschlitzte Ebene C \ {z: Im z = 0, Re z ≤ 0} sternf¨ ormig. Sternf¨ ormige Gebiete sind einfach zusammenh¨angend, da H(s, t) = p0 + (1 − s)(γ(t) − p0 ) eine Homotopie zwischen einer geschlossenen Kurve γ und der konstanten Kurve t → p0 vermittelt. Der folgende Satz wirkt anschaulich; jedoch ben¨otigt sein Beweis tieferliegende Methoden, weswegen er hier nicht gef¨ uhrt werden soll. Es sei an den Begriff der Zusammenhangskomponente aus Aufgabe I.9.32 erinnert. Satz II.2.9 Ein Gebiet G = C ist genau dann einfach zusammenh¨angend, wenn jede Zusammenhangskomponente von C \ G unbeschr¨ankt ist. Speziell ist ein beschr¨anktes Gebiet genau dann einfach zusammenh¨angend, wenn sein Komplement zusammenh¨angend ist. Nun kommen wir zur allgemeinen Fassung des Cauchyschen Integralsatzes. Theorem II.2.10 (Homotopieversion des Cauchyschen Integralsatzes) Sei G ⊂ C ein Gebiet und f : G → C analytisch. Sind die geschlossenen Kurven γ0 und γ1 in G homotop, so gilt f (z) dz. f (z) dz = γ1
γ0
Ist speziell γ eine geschlossene nullhomotope Kurve in G, so gilt f (z) dz = 0. γ
Insbesondere gilt das f¨ ur beliebige geschlossene Kurven in einfach zusammenh¨angenden Gebieten. Beweis. Die dritte Aussage folgt nach Definition aus der zweiten, und die zweite folgt aus der ersten, weil f¨ ur eine konstante Kurve γ1 nat¨ urlich γ1 f (z) dz = 0 ist. Zum Beweis der ersten Aussage sei H: [0, 1] × [0, 1] → G eine Abbildung wie in Definition II.2.6. Als stetiges Bild des Kompaktums [0, 1]2 ist K := H([0, 1]2 ) eine kompakte Teilmenge von G. Es existiert daher ein ε > 0 mit z ∈ K, |w − z| < ε ⇒
w ∈ G.
(II.10)
II.2
Der Cauchysche Integralsatz
75
[Beweis hierf¨ ur: Die Funktion ϕ: z → dist(z, C \ G), vgl. (I.10), ist stetig, positiv auf G und nimmt daher auf der kompakten Menge K ihr positives Infimum an; setze ε = inf ϕ(K).] Als stetige Abbildung auf einem kompakten metrischen Raum ist H gleichm¨aßig stetig. Also existiert ein m ∈ N mit |s − s′ | ≤
1 1 , |t − t′ | ≤ m m
⇒ |H(s, t) − H(s′ , t′ )| < ε.
(II.11)
k , 0), Zu k = 0, . . . , m betrachten wir den Polygonzug mit den Eckpunkten H( m k 1 k m−1 k k H( m , m ), . . . , H( m , m ), H( m , 1) = H( m , 0); es ist leicht, daf¨ ur eine Parametrisierung πk/m hinzuschreiben. Wir zeigen nun:
(1) Sp(πk/m ) ⊂ G ∀k = 0, . . . , m, (2) f (z) dz = f (z) dz, f (z) dz = (3)
f (z) dz =
πk/m
π(k+1)/m
f (z) dz,
π1
γ1
π0
γ0
f (z) dz ∀k = 0, . . . , m − 1.
Es ist klar, dass mit (1)–(3) der Beweis von Theorem II.2.10 erbracht ist.
...... ............ ........ ..... .. .... .. .... .. .. .. .. .. . . . ... . .. . . .. . .. . .... ............... ....... .........
... ..... ... . . . . . .. ..... .. ..... . . . . . .. . ... ... .. . .. .. ................ . ......... .. ...
....... ...... ........... . . . . . .... ..... ... ... .. .. .. .. . .. ... .. .. .... ...... .... ...... ........... .....
k H( m , . ) und πk/m
γ0 und π0
γ1 und π1
k l+1 k Zu (1). Wegen (II.10) und (II.11) liegt H( m , m ) im Kreis Uε (H( m , ml )), der in G liegt. Weil also jede Strecke des Polygonzugs in G liegt, verl¨auft der gesamte Polygonzug in G. Zu (2). Auch das Kurvenst¨ uck {H(0, t): l/m ≤ t ≤ (l + 1)/m} liegt wegen ur die (II.10) und (II.11) in U ε (H(0, ml )) ⊂ G. Daher impliziert Satz II.2.5 f¨ Kurve σl (siehe Skizze) σl f (z) dz = 0 und daher
0=
m−1 l=0
σl
f (z) dz =
γ0
f (z) dz −
π0
f (z) dz.
76
II.
Funktionentheorie
H(0, (l + 1)/m)
... ..... σ . . . . . l ..... ..... . . . . .. W .. .. .. H(0, l/m) ... . .. .. ................. ......... .. .. Eine Parametrisierung von σl ist σl (t) = H(0, ml + t) f¨ ur 0 ≤ t ≤ 1/m, 1 l l+1 ) + (t − )(H(0, ) − H(0, )) f¨ u r 1/m < t ≤ 1 + 1/m. σl (t) = H(0, l+1 m m m m Genauso zeigt man γ1 f (z) dz = π1 f (z) dz. Zu (3). Sei σkl die wie folgt skizzierte polygonale Kurve (durchgezogene Linie; gestrichelt sind πk/m und π(k+1)/m ): ....... ........ ........ ...... ..... ..... ... . H( k+1 , l+1 ) m m . .. . .. k+1 l -. .. ...... H( m , m ) . . . . .. . ..........................
..................... k l+1 ......... ...H( ..m , m ) .. .. .. .. W. .... k l ... .... H( m , m ) . . . . . .... ................ ........ ........
k , ml )) ⊂ G, denn die vier EckNach (II.10) und (II.11) verl¨ auft σkl in Uε (H( m punkte liegen dort. Satz II.2.5 liefert σkl f (z) dz = 0. Es folgt
0=
m−1 l=0
σkl
f (z) dz =
π(k+1)/m
f (z) dz −
f (z) dz,
πk/m
denn die horizontalen“ St¨ ucke heben sich beim Summieren auf: ” ..... ........ I . . . . . .. .. ........ . ......... - .. ~ . ... . . . .. ... . . . W. .... .. .. .... . . ...... . .. . . . . . . . . . . ...................... . .... .... .......... σkl und σk,l+1 ................... Damit ist das Theorem bewiesen.
2
II.3 Die Haupts¨ atze u ¨ ber analytische Funktionen
77
Zum Schluss machen wir wieder einen Abstecher ins Reelle, diesmal in die Theorie der reellen Kurvenintegrale. Sei G ⊂ R2 ein Gebiet und γ: [a, b] → G eine Kurve. Ist f : G → R2 ein stetiges Vektorfeld, so erkl¨art man in der reellen b Analysis das Kurvenintegral γ f, ds durch a f (γ(t)), γ ′ (t) dt. Schreibt man f = (u, v) mit seinen Koordinatenfunktionen u und v, so ist f¨ ur dieses Integral aufig. Identifiziert man R2 mit C, so auch die Bezeichnung γ (u dx + v dy) gel¨ l¨asst sich ein komplexes Kurvenintegral u ¨ ber f = u + iv wie folgt durch reelle Kurvenintegrale ausdr¨ ucken: f (z) dz = (u dx − v dy) + i (v dx + u dy) γ
γ
γ
(nachrechnen!). Nun kann man einen Spezialfall des Cauchyschen Integralsatzes aus der 2-dimensionalen Version des Satzes von Stokes (= Satz von Green) gewinnen. Dieser Satz besagt, falls γ das Kompaktum B ⊂ G glatt berandet und f stetig differenzierbar ist, (vx − uy ) dx dy. (u dx + v dy) = B
γ
Ist f analytisch und setzen wir f ′ als stetig voraus7 , so ergeben die CauchyRiemannschen Differentialgleichungen in der Tat f (z) dz = (u dx − v dy) + i (v dx + u dy) γ γ γ = (−vx − uy ) dx dy + i (ux − vy ) dx dy B
B
= 0.
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
Mit Hilfe des Cauchyschen Integralsatzes k¨ onnen wir nun weitreichende Aussagen u ¨ ber analytische Funktionen beweisen. Unser erstes Ziel ist die Umkehrung von Satz II.1.5: Jede analytische Funktion kann lokal in eine Potenzreihe entwickelt werden und ist folglich beliebig h¨aufig differenzierbar. Zum Beweis ben¨ otigen wir ein Lemma, das sp¨ ater noch wesentlich verallgemeinert wird (Satz II.3.20).
7 Wie schon erw¨ ahnt, wird sich diese Voraussetzung zwar als automatisch erf¨ ullt erweisen, aber der Beweis ben¨ otigt den Cauchyschen Integralsatz.
78
II.
Funktionentheorie
Lemma II.3.1 Sei f : UR (a) → C analytisch, und f¨ ur 0 < r < R sei γ: [0, 2π] → UR (a), γ(t) = a + reit , der positiv orientierte Kreis um a mit Radius r. Dann gilt f¨ ur |z − a| < r 1 f (w) dw. f (z) = 2πi γ w − z Beweis. F¨ ur 0 < ρ < r − |z − a| sei γρ : [0, 2π] → C, γρ (t) = z + ρeit ; beachte Sp(γρ ) ⊂ Ur (a).
γρ a
z 6 6
γ
Offensichtlich“ sind γ und γρ in G := UR (a) \ {z} homotop; eine explizite ” Homotopie ist (mit zs = z + 2s(a − z))
zs + ρ + |z − zs | eit f¨ ur 0 ≤ s ≤ 1/2, H(s, t) = a + ρ + |z − a| + (2s − 1)(r − (ρ + |z − a|)) eit f¨ ur 1/2 < s ≤ 1. Nach Theorem II.2.10 gilt, da g: w → f (w)/(w − z) in G analytisch ist, 1 1 f (w) f (w) dw = dw. 2πi γ w − z 2πi γρ w − z
Sei ε > 0. Da f bei z stetig ist, existiert ein δ > 0 mit |w − z| < δ
⇒ |f (w) − f (z)| < ε. dw Analog zu Beispiel II.2(b) berechnet man γρ w−z = 2πi; daher ist f¨ ur ρ < δ 1 f (w) f (w) − f (z) = 1 dw − f (z) dw 2πi 2π γρ w−z γρ w − z 1 ε ≤ |dw| (Lemma II.2.2) 2π γρ |w − z| 2π ε 1 it |ρe i| dt = ε. = 2π 0 ρ Da ε > 0 beliebig war, folgt die Behauptung des Lemmas.
2
Außerdem notieren wir eine unmittelbare Folgerung aus Absch¨atzung (II.6).
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
79
Lemma II.3.2 Ist γ eine Kurve und sind g1 , g2 , . . . stetige Funktionen auf Sp(γ), die gleichm¨aßig gegen die stetige Funktion g konvergieren, so gilt g(z) dz. gm (z) dz → γ
γ
Beweis. In der Tat ist nach (II.6) gm (z) dz − g(z) dz ≤ gm − g∞ L(γ) → 0. γ
2
γ
Theorem II.3.3 Seien G ⊂ C offen, f : G → C analytisch und a ∈ G. Dann kann f um a in eine Potenzreihe mit positivem Konvergenzradius entwickelt werden: ∞ cn (z − a)n . f (z) = n=0
Die Reihe konvergiert in jedem offenen Kreis um a, der in G liegt.
Beweis. Sei R = inf{|a − w|: w ∈ C \ G} bzw. R = ∞ f¨ ur G = C. Dann ist UR (a) der gr¨ oßte offene Kreis um a, der noch in G liegt. Sei nun 0 < r < R fest gew¨ ahlt. F¨ ur z ∈ Ur (a) gilt nach Lemma II.3.1 mit den dortigen Bezeichnungen f (w) 1 dw. f (z) = 2πi γ w − z Daraus werden wir eine Potenzreihenentwicklung ableiten, in dem wir 1/(w − z) als Summe einer geometrischen Reihe erkennen. Es ist ∞ 1 1 1 1 1 z − a n = = ; = w−z (w − a) − (z − a) w−a 1− z−a w − a n=0 w − a w−a
diese Reihe konvergiert wegen |(z − a)/(w − a)| = |z − a|/r =: q < 1, und zwar gleichm¨ aßig in w ∈ Sp(γ). Mit Lemma II.3.2 folgt ∞ 1 f (w) f (z) = dw (z − a)n . (II.12) n+1 2πi (w − a) γ n=0 Damit haben wir f als in Ur (a) konvergente Potenzreihe mit den Koeffizienten f (w) 1 cn = dw (II.13) 2πi γ (w − a)n+1 dargestellt. Durch γ scheinen die cn von r abzuh¨angen; aber Korollar II.1.6 liefert, dass cn = f (n) (a)/n! ist (und f beliebig h¨aufig differenzierbar ist), so dass inWirklichkeit (II.13) unabh¨ angig von r < R ist. Deshalb konvergiert die ∞ Reihe n=0 cn (z − a)n in ganz UR (a) gegen f (z). 2
80
II.
Funktionentheorie
Korollar II.3.4 Eine analytische Funktion f : G → C ist beliebig h¨aufig differenzierbar, und s¨amtliche Ableitungen sind ebenfalls analytisch. F¨ ur a ∈ G gilt f (n) (a) 1 f (w) = dw, (II.14) n! 2πi γ (w − a)n+1 wo γ(t) = a + reit , 0 ≤ t ≤ 2π, mit Br (a) ⊂ G ist. Beweis. Das folgt aus Korollar II.1.6, Theorem II.3.3 und (II.13).
2
Korollar II.3.5 (Cauchysche Integralformel f¨ ur den Kreis) Sei f : G → C analytisch, und gelte Br (a) ⊂ G. Sei γ: [0, 2π] → C, γ(t) = a + reit , der positiv orientierte Kreis um a mit Radius r. Dann gilt 1 f (w) f (n) (z) = dw ∀z ∈ Ur (a). (II.15) n! 2πi γ (w − z)n+1 Beweis. F¨ ur z = a ist das (II.14). Im allgemeinen Fall betrachte zu z ∈ Ur (a) einen Kreis Bρ (z) ⊂ Ur (a) mit positiv orientierter Randkurve γρ wie im Beweis von Lemma II.3.1. Nach der Vorbemerkung und weil γ und γρ in G\{z} homotop sind, ergibt sich 1 1 f (w) f (w) f (n) (z) = dw = dw. 2 n! 2πi γρ (w − z)n+1 2πi γ (w − z)n+1 Eine allgemeinere Version der Cauchyschen Integralformel wird in Satz II.3.21 bewiesen. Ist f analytisch in G und UR (a) der gr¨ oßte offene Kreis um a, der in G liegt, so kann es vorkommen, dass die Potenzreihe von f in einem noch gr¨oßeren Kreis konvergiert; das er¨ offnet die M¨ oglichkeit der analytischen Fortsetzung. Betrachten wir etwa G = U1 (0), f (z) = 1/(1 − z) und a = − 21 , so lautet die Potenzreihenentwicklung von f um a f (z) =
∞ 1 n 2 2 n z+ = 1 3 3 n=0 3 2 − z+ 2 2
1
(geometrische Reihe); es liegt Konvergenz in U3/2 (a) und nicht nur in U1/2 (a) ⊂ G vor. Der n¨ achste Satz liefert, dass eine analytische Funktion – wenn u ¨ berhaupt – nur auf eine Weise auf ein gr¨ oßeres Gebiet fortgesetzt werden kann. Satz II.3.6 (Identit¨ atssatz) Sei G ⊂ C ein Gebiet, und seien f, g: G → C analytisch. Dann sind folgende Aussagen ¨aquivalent:
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
81
(i) f = g. (ii) Es existiert ein a ∈ G mit f (n) (a) = g (n) (a) f¨ ur alle n ∈ N0 . (iii) {z ∈ G: f (z) = g(z)} hat einen H¨aufungspunkt in G. Beweis. Ohne Einschr¨ ankung darf man g = 0 annehmen; sonst betrachte man f − g. Die Richtungen (i) ⇒ (ii) und (i) ⇒ (iii) sind trivial. Gelte nun (ii). Wir betrachten A = {z ∈ G: f (n) (z) = 0 ∀n ∈ N0 }. Die Menge A ist (relativ) abgeschlossen in G, da A als n≥0 (f (n) )−1 ({0}) dargestellt werden kann und alle f (n) stetig sind. A ist jedoch auch offen in G: Sei dazu z0 ∈ A. Nach Theorem II.3.3 kann f in einer Umgebung Uε (z0 ) als konvergente Potenzreihe ∞ c (z − z0 )n dargestellt werden, und nach Koroln=0 n (n) lar II.1.6 gilt cn = f (z0 )/n! = 0 f¨ ur alle n ≥ 0. Das heißt f (z) = 0 in Uε (z0 ), also Uε (z0 ) ⊂ A, und A ist offen. Da G zusammenh¨angend ist, folgt A = ∅ oder A = G. Die Voraussetzung (ii) besagt jedoch a ∈ A, so dass A = ∅ ist. Daher gilt A = G, was ¨ aquivalent zu (i) ist. Nun nehmen wir an, a ∈ G sei ein H¨ aufungspunkt von Z := {z ∈ G: f (z) = 0}. Weil f stetig ist, gilt dann auch f (a) = 0. Wir zeigen, dass a die Bedingung von (ii) erf¨ ullt, so dass die Implikation (iii) ⇒ (ii) folgt. G¨abe es ein ahlen wir N minimal mit dieser Eigenschaft. Die N ∈ N mit f (N ) (a) = 0, so w¨ Potenzreihenentwicklung um a lautet dann ∞
n=N
cn (z − a)n = (z − a)N ∞
∞
n=0
cn+N (z − a)n
mit cN = 0. Setze h(z) = n=0 cn+N (z − a)n . Die Funktion h ist analytisch, also stetig, und es gilt h(a) = cN = 0. W¨ ahle eine Umgebung Uδ (a) mit h(z) = 0 f¨ ur z ∈ Uδ (a); es folgt auch f (z) = (z − a)N h(z) = 0
∀z ∈ Uδ (a) \ {a}.
Da a aber H¨ aufungspunkt von Z ist, existiert ein z ∈ Uδ (a) \ {a} mit z ∈ Z, d.h. f (z) = 0: Widerspruch! Daher gibt es kein N wie angenommen, und der Beweis ist vollst¨ andig. 2 Als Korollar erh¨ alt man sofort die oben gemachte Eindeutigkeitsaussage. Korollar II.3.7 Ist G ⊂ C ein Gebiet, ∅ =
H ⊂ G offen und sind f, g: G → C analytisch mit f |H = g |H , so gilt f = g. Also l¨asst sich eine analytische Funktion auf H auf h¨ochstens eine Weise zu einer analytischen Funktion auf G fortsetzen. ¨ Nat¨ urlich ist dieses Korollar f¨ ur reell-differenzierbare Funktionen falsch! Ubrigens gibt es zu jeder offenen Menge H eine analytische Funktion auf H, die sich
82
II.
Funktionentheorie
nicht auf eine gr¨ oßere offene Menge fortsetzen l¨asst; ein Beispiel findet sich in Aufgabe II.6.8. Wie im Reellen nennen wir F Stammfunktion von f , wenn F ′ = f gilt. Nicht jede analytische Funktion besitzt eine Stammfunktion; z.B. besitzt f (z) = 1/z, z ∈ C \ {0}, keine Stammfunktion, da andernfalls nach Satz II.2.3 ur den Kreis f¨ γ(t) = eit , 0 ≤ t ≤ 2π, im Widerspruch zu Beispiel II.2(b) γ dz/z = 0 folgte. Hingegen hat man auf einfach zusammenh¨ angenden Gebieten ein positives Resultat. Satz II.3.8 Jede analytische Funktion auf einem einfach zusammenh¨angenden Gebiet besitzt eine Stammfunktion. Beweis. Sei z0 ∈ G fest. Ist γ irgendeine Kurve von z0 nach z ∈ G (solch eine Kurve existiert nach Korollar I.6.7), setze F (z) = f (w) dw. γ
Nach Theorem II.2.10 h¨ angt der Wert des Integrals nicht von der Wahl der Kurve ab: Ist n¨ amlich γ˜ eine weitere Kurve von z0 nach z und γ − γ˜ die Kurve angs γ nach z und dann l¨ angs γ˜ zur¨ uck“, so gilt nach dem Cauchyschen von z0 l¨ ” Integralsatz f (w) dw − f (w) dw. f (w) dw = 0= γ ˜
γ
γ−˜ γ
γ˜ z ? z0
γ
Dass F ′ = f gilt, zeigt man wie in Satz II.2.5.
2
Eine auf C definierte analytische Funktion heißt ganze Funktion. Unser n¨ achstes Ziel ist der Satz von Liouville: Satz II.3.9 Eine beschr¨ankte ganze Funktion ist konstant. Der Beweis fußt auf folgendem Lemma. Lemma II.3.10 Sei f : UR (a) → C analytisch. Zu 0 < r < R setze M (r) = sup{|f (z)|: |z − a| = r}. Dann gilt |f (n) (a)| ≤
M (r) n! rn
∀n ≥ 0.
(II.16)
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
83
Beweis. Das folgt sofort aus (II.14) und (II.6): Mit γ(t) = a + reit , 0 ≤ t ≤ 2π, gilt n! M (r) n! f (w) (n) |f (a)| = dw ≤ 2πr. 2 2π γ (w − a)n+1 2π rn+1
Beweis von Satz II.3.9. Gelte |f (z)| ≤ M f¨ ur alle z ∈ C. (II.16) liefert f¨ ur n ≥ 1 |f (n) (0)| ≤
M n! → 0 mit r → ∞. rn
Mit Satz II.3.6 folgt f (z) = f (0) f¨ ur alle z ∈ C.
2
Korollar II.3.11 (Fundamentalsatz der Algebra) Jedes nichtkonstante Polynom ¨ uber C hat eine Nullstelle. Beweis. Sei P : C → C ein Polynom ohne Nullstelle. Dann ist f := 1/P eine ganze Funktion. Wir nehmen an, dass P nicht konstant ist. Dann ist lim|z|→∞ |P (z)| = ∞, also lim|z|→∞ f (z) = 0. Es existiert daher ein ρ > 0 mit |z| > ρ ⇒ |f (z)| ≤ 1. Auf {z: |z| ≤ ρ} ist f stetig und deshalb, da diese Menge kompakt ist, beschr¨ ankt. Daher ist f auf ganz C beschr¨ ankt, und der Satz von Liouville liefert, dass f und P doch konstant sind. 2 Satz II.3.12 (Maximumprinzip) Sei G ⊂ C ein Gebiet, und sei f : G → C eine analytische Funktion. Falls eine Stelle a ∈ G und ein ε > 0 mit |z − a| < ε
⇒
z ∈ G & |f (z)| ≤ |f (a)|
(II.17)
existieren, ist f konstant. n Beweis. Es sei f (z) = ∞ n=0 cn (z − a) die Potenzreihenentwicklung von f um a. Sei 0 < r < ε. Dann konvergiert die Reihe in Br (a) gleichm¨aßig. Es gilt 1 |f (a)| ≥ 2π 2
= =
1 2π 1 2π
1 = 2π
2π
|f (a + reit )|2 dt
0
0
0
0
2π
f (a + reit )f (a + reit ) dt
∞ 2π 2π
(wegen (II.17))
n=0 ∞
cn rn eint
n,m=0
∞
m=0
cm rm e−imt dt
cn cm rn+m ei(n−m)t dt
(z → z ist stetig)
84
II.
= =
∞
cn cm rn+m
n,m=0 ∞ n=0
1 2π
2π
ei(n−m)t dt
Funktionentheorie
(gleichm¨aßige Konvergenz)
0
|cn |2 r2n
= |c0 |2 + ≥ |f (a)|2
∞
n=1
|cn |2 r2n
2π wegen f (a) = c0 ; in der Rechnung wurde 0 ei(n−m)t dt = 0 f¨ ur n = m und = 2π f¨ ur n = m verwendet. Es herrscht also Gleichheit in der obigen Ungleichungskette, und es folgt f (n) (a) = n! cn = 0 f¨ ur n ≥ 1. Satz II.3.6 liefert f (z) = f (a) f¨ ur alle z ∈ G. 2 Ist also f analytisch auf einem Gebiet und nicht konstant, so nimmt |f | kein lokales Maximum an. Beachte erneut den Unterschied zur reellen Analysis! Korollar II.3.13 Ist G ein beschr¨anktes Gebiet, so gilt f¨ ur eine stetige Funktion f : G → C, die in G analytisch ist, sup |f (z)| = sup |f (z)|.
z∈G
z∈∂G
Beweis. Weil G kompakt ist, existiert ein z0 ∈ G mit z ∈ G ⇒ |f (z)| ≤ |f (z0 )|. Wegen Satz II.3.12 ist z0 ∈ G f¨ ur eine nichtkonstante Funktion ausgeschlossen; also muss dann z0 ∈ ∂G sein, und es folgt ≤“. (Ist f konstant, ist die ” Behauptung sowieso trivial.) Die Richtung ≥“ ist klar, denn supz∈G |f (z)| = ” ur stetige f . 2 supz∈G |f (z)| f¨ In Korollar II.3.13 ist die Beschr¨ ankheit des Gebiets wesentlich; f¨ ur den unendlichen Streifen G = {z ∈ C: 0 < Re z < 1} und f : G → C, f (z) = exp exp((z − 12 )πi) , ist n¨ amlich sup |f (z)| = ∞,
z∈G
sup |f (z)| = 1.
z∈∂G
Korollar II.3.14 (Minimumprinzip) Ist G ⊂ C ein Gebiet und f : G → C eine analytische Funktion ohne Nullstellen, die nicht konstant ist, so nimmt |f | kein lokales Minimum an. Beweis. Wende das Maximumprinzip auf 1/f an.
2
Als n¨ achstes wird eine Umkehrung des Cauchyschen Integralsatzes gezeigt. Zum Begriff der Randkurve eines Dreiecks siehe Seite 69.
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
85
Satz II.3.15 (Satz von Morera) Sei G ⊂ C offen und f : G → C stetig. F¨ ur alle kompakten Dreiecke △ ⊂ G mit Randkurve γ gelte f (z) dz = 0.
γ
Dann ist f analytisch. Beweis. Sei a ∈ G. Um zu zeigen, dass f bei a differenzierbar ist, gen¨ ugt es, f in einem Kreis Uε (a) zu betrachten. Wir werden nun beweisen, dass f in Uε (a) Ableitung einer Funktion F ist; nach Korollar II.3.4 zeigt das unsere Behauptung. Wie im Beweis von Satz II.2.5 setzen wir γa,z (t) = a + t(z − a), 0 ≤ t ≤ 1, sowie f (w) dw, z ∈ Uε (a). F (z) = γa,z
Das Integral ist wohldefiniert, da f als stetig vorausgesetzt ist. Genau wie im Beweis von Satz II.2.5 folgt F ′ (z) = f (z) f¨ ur alle z ∈ Uε (a), was zu zeigen war. 2 Mit dem Satz von Morera k¨ onnen wir ein u ¨ berraschendes Konvergenzkriterium beweisen, dessen Analogon f¨ ur reell-differenzierbare Funktionen wie u ¨blich falsch ist. Satz II.3.16 (Konvergenzsatz von Weierstraß) Sei G ⊂ C offen, und die analytischen Funktionen fn : G → C m¨ogen auf allen Kompakta K ⊂ G gleichm¨aßig gegen f : G → C konvergieren. Dann ist auch (k) f analytisch. Ferner konvergieren alle Ableitungen fn → f (k) gleichm¨aßig auf kompakten Teilmengen von G. Beweis. Es ist klar, dass f stetig ist. Sei △ ⊂ G ein Dreieck mit Randkurve γ. ur alle n, und Lemma II.3.2 liefert Dann gilt nach Satz II.2.4 γ fn (z) dz = 0 f¨ fn (z) dz = 0. f (z) dz = lim γ
n→∞
γ
Nach dem Satz von Morera ist f analytisch. Zum Beweis der Konvergenz der Ableitungen reicht es offenbar, den Fall k = 1 zu betrachten. Zun¨ achst eine topologische Vorbemerkung: Setzt man Gm = {z ∈ G: |z| < m, dist(z, C \ G) > 1/m} (f¨ ur G = C entf¨ allt die letzte Bedingung), so sind diese Mengen offen, und es gilt G1 ⊂ G2 ⊂ . . . sowie m Gm = G; mit anderen Worten bilden die Gm ¨ eine aufsteigende offene Uberdeckung von G. Ist also K ⊂ G kompakt, existiert bereits ein m ∈ N mit K ⊂ Gm . Um nun die gleichm¨aßige Konvergenz fn′ → f ′ auf K zu zeigen, reicht es, dies auf Gm zu tun.
86
II.
Funktionentheorie
Sei dazu ε > 0 und z ∈ Gm ; f¨ ur δ = 1/2m liegt dann der Kreis Bδ (z) in atzen, benutzen wir (II.14). Da (fn ) auf G2m ⊂ G. Um |fn′ (z) − f ′ (z)| abzusch¨ der kompakten Menge G2m gleichm¨ aßig gegen f konvergiert, existiert ein n0 mit sup |fn (w) − f (w)| ≤ εδ
w∈G2m
∀n ≥ n0 ;
beachte, dass n0 außer von ε nur von m abh¨ angt. Es folgt |fn′ (z)
1 1 fn (w) f (w) dw − dw − f (z)| = 2 2 2πi |w−z|=δ (w − z) 2πi |w−z|=δ (w − z) 2πδ 1 |fn (w) − f (w)| 1 εδ 2 = ε |dw| ≤ ≤ 2 2π |w−z|=δ |w − z| 2π δ ′
f¨ ur n ≥ n0 , was zu zeigen war.
2
Es bezeichne A (G) den Vektorraum aller analytischen Funktionen auf einer offenen Menge G. Eine Teilmenge F ⊂ A (G) wird eine normale Familie genannt, wenn sup sup |f (z)| < ∞
f ∈F z∈K
∀K ⊂ G kompakt.
Der folgende Satz liefert ein Kompaktheitskriterium f¨ ur den Raum A (G), versehen mit der Topologie der gleichm¨ aßigen Konvergenz auf Kompakta (vgl. Beispiel I.2(g))8 . Satz II.3.17 (Satz von Montel) Sei F ⊂ A (G) eine normale Familie. Dann enth¨alt jede Folge (fn ) in F eine Teilfolge (fnk ), die auf kompakten Teilmenge von G gleichm¨aßig konvergiert, und die Grenzfunktion liegt ebenfalls in A (G). Beweis. Wir definieren Gm wie im letzten Beweis. Zun¨achst halte m fest und betrachte die kompakte Teilmenge Km = Gm von G. Wir werden als erstes zeigen, dass jede Folge (fn ) in F eine auf Km gleichm¨aßig konvergente Teilfolge besitzt; dazu verwenden wir den Satz von Arzel`a-Ascoli (Satz I.5.5). Es ist also nur die gleichgradige Stetigkeit von (fn ) auf Km zu beweisen. Dazu setze c = supn supz∈K2m |fn (z)|; nach Voraussetzung ist c < ∞. Sei δ = 1/2m; ist z ∈ Km , liegt der Kreis Bδ (z) in G, in der Tat liegt er in K2m . 8 Da diese Topologie auf A (G) metrisierbar ist, wie man zeigen kann, handelt es sich wirklich um ein Kompaktheitskriterium und nicht nur um ein Folgenkompaktheitskriterium.
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
87
Nun liefert die Cauchysche Integralformel (II.15) f¨ ur z, z ′ ∈ Km , |z − z ′ | < δ/2 1 1 fn (w) fn (w) ′ |fn (z) − fn (z )| = dw − dw ′ 2πi |w−z|=δ w − z 2πi |w−z|=δ w − z 1 |fn (w)| |z − z ′ | ≤ |dw| 2π |w−z|=δ |w − z| |w − z ′ | 1 c 2c ≤ 2πδ |z − z ′ | = |z − z ′ |. 2π δ · δ/2 δ Da c und δ nur von m abh¨ angen, ist die gleichgradige Stetigkeit auf Km bewiesen. Nach dem Satz von Arzel` a-Ascoli existiert eine Teilfolge (f1,n ) von (fn ), die auf K1 gleichm¨ aßig konvergiert. Die Folge (f1,n ) hat ihrerseits eine Teilfolge aßig konvergiert, usw. Wir betrachten die Diagonalfol(f2,n ), die auf K2 gleichm¨ ge f1,1 , f2,2 , f3,3 , . . . . Nach Konstruktion konvergiert sie gleichm¨aßig auf jedem Kompaktum Km . Ist K ⊂ G eine beliebige kompakte Teilmenge, so existiert ein Index m mit K ⊂ Km ; siehe den Beweis von Satz II.3.16. Die Diagonalfolge konvergiert also auf allen Kompakta gleichm¨ aßig, und ihre Grenzfunktion ist nach Satz II.3.16 analytisch, also in A (G). 2 Wir kommen nun zu der am Beginn des Abschnitts versprochenen Verallgemeinerung von Lemma II.3.1. Zuerst jedoch ein weiteres Lemma. Lemma II.3.18 Es sei γ eine geschlossene Kurve in C und z ∈ / Sp(γ). Dann ist dw 1 n(γ; z) := 2πi γ w − z eine ganze Zahl. Die Funktion z → n(γ; z) ist auf jeder Zusammenhangskomponente9 von C \ Sp(γ) konstant.
Beweis. Wegen z ∈ / Sp(γ) ist der Integrand stetig und deshalb n(γ; z) wohldefiniert. Wir zeigen n(γ; z) ∈ Z, indem wir exp(2πin(γ; z)) = 1 beweisen (warum reicht das?). Sei γ auf [a, b] definiert; wir haben also f¨ ur t γ ′ (τ ) dτ , t ∈ [a, b], ϕ(t) := exp a γ(τ ) − z
ϕ(b) = 1 zu zeigen. Wir nehmen dazu zuerst an, dass γ stetig differenzierbar (und nicht nur st¨ uckweise stetig differenzierbar) ist. Dann folgt aus dem Hauptsatz der Differential- und Integralrechnung und der Kettenregel ϕ′ (t) = ϕ(t) 9 Siehe
Aufgabe I.9.32.
γ ′ (t) γ(t) − z
∀t ∈ [a, b],
88
also
so dass
II.
Funktionentheorie
d ϕ ϕ′ (t)(γ(t) − z) − ϕ(t)γ ′ (t) = 0, (t) = dt γ − z (γ(t) − z)2 ϕ = const. γ−z
und insbesondere ϕ(a) ϕ(b) = . γ(a) − z γ(b) − z Nun ist γ geschlossen, d.h. γ(a) = γ(b). Es folgt ϕ(b) = ϕ(a) = 1, wie gew¨ unscht. Ist γ nur st¨ uckweise stetig differenzierbar, etwa auf den Intervallen [tj , tj+1 ], a = t0 < t1 < · · · < tn = b, so zeigt das obige Argument ϕ(b) ϕ(tn−1 ) ϕ(t1 ) ϕ(a) = = ··· = = , γ(b) − z γ(tn−1 ) − z γ(t1 ) − z γ(a) − z und wieder folgt ϕ(b) = ϕ(a) = 1. Zum Beweis der zweiten Behauptung reicht es zu zeigen, dass z → n(γ; z) stetig ist, denn dann werden nach Satz I.6.3 Zusammenhangskomponenten auf zusammenh¨ angende Teilmengen von Z abgebildet; und da Z diskret topologisiert ist, sind zusammenh¨ angende Teilmengen einpunktig. Zum Beweis der Stetigkeit an einer Stelle z w¨ ahle δ > 0 mit U2δ (z) ⊂ C \ Sp(γ). (Da γ stetig ist, ist Sp(γ) kompakt und deshalb abgeschlossen.) Sei |z ′ −z| < δ; es folgt Uδ (z ′ ) ⊂ C\Sp(γ), ur alle t. Genauso ist |γ(t) − z| ≥ 2δ ≥ δ f¨ ur alle t. Das liefert d.h. |γ(t) − z ′ | ≥ δ f¨ die Absch¨ atzung (eine ¨ ahnliche Absch¨ atzung tauchte im Beweis von Satz II.3.17 auf) 1 1 1 dw − |n(γ; z ′ ) − n(γ; z)| = 2π γ w − z ′ w−z 1 |(w − z) − (w − z ′ )| ≤ |dw| 2π γ |w − z ′ | |w − z| 1 |dw| |z ′ − z|, ≤ 2πδ 2 γ und die behauptete Stetigkeit ist bewiesen.
2
Beispiel. Sei n ∈ Z, n = 0, und γ(t) = eint , 0 ≤ t ≤ 2π. Die Kurve γ durchl¨auft |n|-mal den Einheitskreis, und zwar gegen den Uhrzeigersinn, wenn n > 0, und im Uhrzeigersinn, wenn n < 0. Dann gilt
n f¨ ur |z| < 1, n(γ; z) = 0 f¨ ur |z| > 1.
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
89
Der Fall |z| > 1 ergibt sich aus dem Cauchyschen Integralsatz, da w → 1/(w−z) dann analytisch in U|z| (0) ist. Im Fall z = 0 berechnet man direkt 2π ineint 1 dt = n. n(γ; 0) = 2πi 0 eint Im Fall 0 < |z| < 1 argumentiere wie bei Lemma II.3.1: F¨ ur 0 < ρ < 1 − |z| und γρ (t) = z + ρeint , 0 ≤ t ≤ 2π, sind wieder γ und γρ in C \ {z} homotop; der Cauchysche Integralsatz (Theorem II.2.10) liefert dann n(γ; z) = n(γρ ; z), und wie oben sieht man n(γρ , z) = n. Definition II.3.19 Die in Lemma II.3.18 eingef¨ uhrte ganze Zahl dw 1 n(γ; z) := 2πi γ w − z heißt Umlaufzahl von γ um z. Dass n(γ; z) auch in allgemeineren Situationen als denen des obigen Beispiels die mit Orientierung gez¨ ahlten Uml¨ aufe von γ um z misst, suggeriert ¨ folgende Uberlegung. Nehmen wir an, wir h¨ atten γ(t) − z in Polarkoordinaten als γ(t) − z = r(t)eiα(t) mit stetig differenzierbaren Funktionen r und α auf [a, b] geschrieben. Die Anzahl der Uml¨ aufe von γ um z wird dann offenbar durch b ′ 1 ′ α (t) dt beschrieben. Nun ist γ = r′ eiα + riα′ eiα und deshalb 2π a b γ ′ (t) 1 dt n(γ; z) = 2πi a γ(t) − z b ′ (r (t) + r(t)iα′ (t))eiα(t) 1 = dt 2πi a r(t)eiα(t) b ′ b 1 1 r (t) dt + = α′ (t) dt; 2πi a r(t) 2π a beachte r(t) = 0 f¨ ur alle t, da z ∈ / Sp(γ). Aber b ′ b r (t) dt = log r(t)a = 0, a r(t)
da γ eine geschlossene Kurve ist. Also stimmt n(γ; z) mit der heuristischen b ′ 1 α (t) dt u Umlaufzahl 2π ¨ berein. a
Satz II.3.20 (Cauchysche Integralformel) Sei G ⊂ C offen und γ eine nullhomotope geschlossene Kurve. Sei f : G → C analytisch. Dann gilt 1 f (w) n(γ; z)f (z) = dw ∀z ∈ G \ Sp(γ). (II.18) 2πi γ w − z
90
II.
Funktionentheorie
Beweis. Wir betrachten die Hilfsfunktion ⎧ ⎨ f (ζ) − f (z) f¨ ur ζ = z, z ∈ G, g(ζ) = ζ −z ⎩ f¨ ur ζ = z. f ′ (z)
¨ Es ist klar, dass g stetig und auf G \ {z} analytisch ist. Die folgende Uberlegung zeigt, dass g auch in einer Umgebung von z und deshalb auf ganz G analytisch ∞ n c (ζ − z) die Potenzreihenentwicklung von f in einer ist. Sei f (ζ) = n=0 n ′ Umgebung von z; beachte c = f (z), c = f (z). Daraus ergibt sich die Darstel0 1 ∞ ur ζ = z und dann f¨ ur ζ = z. Da g in lung g(ζ) = n=1 cn (ζ − z)n−1 zuerst f¨ einer Umgebung von z als Potenzreihe darstellbar ist, ist g dort analytisch. Der Cauchysche Integralsatz (Theorem II.2.10) liefert γ g(w) dw = 0; Einsetzen der Definition von g zeigt die behauptete Integralformel. 2 Mit Hilfe von (II.18) kann man den Wert von f auf {z ∈ G: n(γ; z) = 0} aus den Werten von f auf der Spur der Kurve γ berechnen, z.B. im Innern eines Kreises aus den Werten auf dem Rand. Satz II.3.21 (Allgemeine Cauchysche Integralformel) Unter den Voraussetzungen von Satz II.3.20 gilt f¨ ur n ∈ N 1 f (w) f (n) (z) = dw ∀z ∈ G \ Sp(γ). n(γ; z) n! 2πi γ (w − z)n+1
(II.19)
Beweis. (II.19) folgt aus (II.18) wie (II.14) via Theorem II.3.3 aus Lemma II.3.1: Sei also z ∈ G \ Sp(γ). W¨ ahle ε > 0 mit U2ε (z) ∩ Sp(γ) = ∅, und sei ζ ∈ Uε (z). Dann ist |ζ − z|/|w − z| ≤ 1/2 f¨ ur w ∈ Sp(γ), und wie in Theorem II.3.3 schließt man aus (II.18) (vgl. (II.12)) f¨ ur alle ζ ∈ Uε (z) ∞ ∞ 1 f (w) n n(γ; z)f (ζ) = dw (ζ − z) =: cn (ζ − z)n . n+1 2πi (w − z) γ n=0 n=0 Da ζ und z in derselben Zusammenhangskomponente von C \ Sp(γ) liegen, gilt nach Lemma II.3.18 n(γ; z) = n(γ; ζ). Daher zeigt Korollar II.1.6 f (n) (z) f (w) 1 = cn = n(γ; z) dw. 2 n! 2πi γ (w − z)n+1 Im Rest dieses Abschnitts wollen wir uns noch kurz mit der komplexen Logarithmusfunktion besch¨ aftigen. Definition II.3.22 Es sei G ⊂ C ein Gebiet. Eine analytische Funktion g: G → C heißt Zweig des Logarithmus, wenn exp g(z) = z ∀z ∈ G
gilt.
II.3
Die Haupts¨ atze u ¨ ber analytische Funktionen
91
Es ist klar, dass mit g auch g + 2kπi, k ∈ Z, ein Zweig des Logarithmus ist. Offenbar ist 0 ∈ / G eine notwendige Voraussetzung f¨ ur die Existenz eines Zweigs des Logarithmus. Sie ist jedoch im allgemeinen nicht hinreichend. Betrachte n¨ amlich G = C \ {0}. Wir nehmen an, g sei ein Zweig des Logarithmus auf ur alle z ∈ G gilt, d.h. G. Die Kettenregel liefert, dass exp(g(z))g ′ (z) = 1 f¨ atte z → 1/z eine Stammfunktion in G, und nach Satz II.2.3 g ′ (z) = 1/z. Also h¨ w¨are f¨ ur jede geschlossene Kurve γ dz/z = 0, was bekanntlich nicht stimmt. Hingegen hat man unter der Voraussetzung des einfachen Zusammenhangs ein positives Resultat. Satz II.3.23 Ist G ein einfach zusammenh¨angendes Gebiet mit 0 ∈ / G, so existiert ein Zweig des Logarithmus auf G. Je zwei Zweige unterscheiden sich um ein Vielfaches von 2πi. Beweis. Nach Satz II.3.8 besitzt z → 1/z eine Stammfunktion g auf G. Da 1 d −g(z) ze = e−g(z) + z(−g ′ (z))e−g(z) = e−g(z) + z − e−g(z) = 0, dz z
ist z → ze−g(z) auf der zusammenh¨ angenden Menge G konstant. Seien nun z0 ∈ G fest und w0 ∈ C so, dass ew0 = z0 . Wir w¨ahlen g speziell als dw , g(z) = w0 + γ w wo γ eine Kurve von z0 nach z ist (vgl. den Beweis von Satz II.3.8). Dann ist f¨ ur alle z ∈ G ze−g(z) = z0 e−g(z0 ) = z0 e−w0 = 1, also exp g(z) = z auf G. Damit haben wir einen Zweig des Logarithmus konstruiert. Sei h ein weiterer Zweig. Dann ist 1=
eg(z) z = h(z) = eg(z)−h(z) z e
∀z ∈ G,
so dass zu jedem z ∈ G eine ganze Zahl k(z) mit g(z) − h(z) = 2πik(z) existiert, denn ew = 1 ⇔ w ∈ 2πiZ (Aufgabe II.6.4). Weil g und h stetig sind, muss es auch k sein; also ist k konstant und g(z) = h(z) + 2πik
∀z ∈ G.
2
Beispiel. Sei G = C \ {x ∈ R: x ≤ 0} die l¨ angs der negativen reellen Achse geschlitzte Ebene. Jedes z ∈ G kann eindeutig als z = |z|eiϕ ,
−π < ϕ < π,
92
II.
Funktionentheorie
geschrieben werden. Dann ist g(z) := log |z| + iϕ ein Zweig des Logarithmus, der sogenannte Hauptzweig, wobei log den u ¨blichen reellen Logarithmus bezeichnet. In der Tat ist eg(z) = elog |z|+iϕ = |z|eiϕ = z, und g ist stetig (Beweis?). Dass g analytisch ist, sieht man zum Beispiel, indem man z = x + iy und g = u + iv schreibt (also u = log x2 + y 2 und v = arctan y/x) und die Cauchy-Riemannschen Differentialgleichungen (Satz II.1.7) nachrechnet. Die Nebenzweige sind gk (z) = log |z| + i(ϕ + 2kπ); der Hauptzweig setzt die reelle Logarithmusfunktion fort. ˜ = C \ {x ∈ R: x ≥ 0}. Hier kann z ∈ G ˜ eindeutig als Sei nun G z = |z|eiϕ ,
0 < ϕ < 2π,
˜ existieren die Zweige geschrieben werden, und in G g˜k (z) = log |z| + i(ϕ + 2kπ) des Logarithmus. Man beachte g0 = g˜0 in der oberen Halbebene (wo Im z > 0) und g0 = g˜−1 in der unteren Halbebene. Die Frage Was ist log i?“ hat daher ” keine eindeutige Antwort; sie h¨ angt von der Wahl des Zweigs des Logarithmus ab. Eine Antwort ist log i“ = g0 (i) = iπ/2. ” Man kann zeigen, dass in einem Gebiet genau dann ein Zweig des Logarithmus existiert, wenn es einfach zusammenh¨ angend ist. Satz II.3.24 Seien G ein einfach zusammenh¨angendes Gebiet und f : G → C eine analytische Funktion ohne Nullstellen. Dann existiert ein Zweig von log f in G, d.h. eine analytische Funktion g: G → C mit eg = f . Je zwei Zweige von log f unterscheiden sich durch ein Vielfaches von 2πi. Beweis. Der Beweis ist ¨ ahnlich wie bei Satz II.3.23, indem man von einer Stammfunktion von f ′ /f ausgeht. 2 Mit Hilfe des Logarithmus kann man jetzt allgemeine Potenzen definieren. Sei g ein Zweig des Logarithmus in einem einfach zusammenh¨angenden Gebiet G. F¨ ur z ∈ G und α ∈ C setze α
z := e
g(z)α
∞ (g(z)α)n . = n! n=0
Als Komposition analytischer Funktionen ist z → z α analytisch; ferner folgt aus der Funktionalgleichung der Exponentialfunktion das vertraute Potenzgesetz
II.4 Isolierte Singularit¨ aten und Residuenkalk¨ ul
93
z α+β = z α z β . Beachte, dass die Definition von z α von der Wahl des Zweigs g abh¨ angt! W¨ ahlt man zum Beispiel auf G = C \ {x ∈ R: x ≤ 0} den Hauptzweig des Logarithmus, ist ii = eg0 (i)i = eiπ/2i = e−π/2 (∈ R), w¨ahlt man einen Nebenzweig, ist ii = egk (i)i = e(iπ/2+2kπi)i = e−π/2−2kπ . 2 Betrachte jetzt speziell α = 12 . Wegen z = z 1/2 z 1/2 = z 1/2 ist z → z 1/2 eine analytische Wurzelfunktion. Auf dem obigen Gebiet G gibt es nur zwei Zweige der Wurzelfunktion, da f¨ ur gerades (bzw. ungerades) k alle Werte von egk (z)/2 u bereinstimmen. Diese passen aber l¨ angs der negativen reellen Achse ¨ nicht zusammen: W¨ urde man einmal entlang des Einheitskreises von −1 nach −1 wandern, h¨ atte sich das Argument um 2π erh¨oht, und man w¨are vom einen Zweig der Wurzel auf den anderen gelangt. Nach einem weiteren Umlauf s¨aße man wieder auf dem ersten Zweig, usw. Diese Mehrdeutigkeiten der Wurzel bekommt man in den Griff, wenn man die zugeh¨origen Riemannschen Fl¨achen betrachtet.
1
0.5
0
Ŧ0.5
Ŧ1 1 1
0.5 0.5
0 0 Ŧ0.5
Ŧ0.5 Ŧ1
Ŧ1
Abb. II.1. Die Riemannsche Fl¨ ache von
√
z
Bei der Wurzel stellt man sich vor, dass z 1/2 auf zwei miteinander verklebten Kopien von C \ {0} erkl¨ art ist und nicht auf (einem Teilgebiet von) C \ {0} selbst (der Nullpunkt muss auf jeden Fall herausgenommen werden). [In der Skizze scheinen sich die beiden Bl¨ atter der Fl¨ ache zu schneiden; das sieht aber bloß in der dreidimensionalen Projektion so aus. In Wirklichkeit“ gibt es keine ” Selbstdurchdringung der Fl¨ ache.] Zu Riemannschen Fl¨achen vgl. etwa K. Lamotke, Riemannsche Fl¨achen, Springer 2004.
II.4
Isolierte Singularit¨ aten und Residuenkalku ¨l
In diesem Abschnitt studieren wir Funktionen, die in einer offenen Menge bis ” auf einzelne Stellen“ analytisch sind.
94
II.
Funktionentheorie
˜ → C hat eine isolierte SinguDefinition II.4.1 Eine analytische Funktion f : G ˜ wenn ein ε > 0 existiert mit Uε (z0 )\{z0 } ⊂ G. ˜ z0 heißt hebbare larit¨at in z0 ∈ / G, Singularit¨at, wenn eine in ganz Uε (z0 ) analytische Funktion g mit g(z) = f (z) f¨ ur z = z0 existiert; z0 heißt Pol, wenn limz→z0 |f (z)| = ∞. Ist die Singularit¨at z0 weder hebbar noch ein Pol, so heißt z0 wesentliche Singularit¨at. Mit anderen Worten ist z0 eine hebbare Singularit¨at, wenn ein c ∈ C existiert, so dass die durch
˜ f (z) f¨ ur z ∈ G, g(z) = c f¨ ur z = z0 ˜ ∪ {z0 } analytisch ist. definierte Funktion g auf der offenen Menge G Definition II.4.2 Sei G ⊂ C offen und S ⊂ G relativ abgeschlossen. Wir sagen, f sei eine analytische Funktion in G mit isolierten Singularit¨aten in S, wenn f auf G \ S definiert und analytisch ist und an jeder Stelle z0 ∈ S eine isolierte Singularit¨ at besitzt. Sind all diese Singularit¨aten hebbar oder Pole, heißt f meromorph. Es ist klar, dass in jeder kompakten Teilmenge von G nur endlich viele Singularit¨ aten liegen k¨ onnen; insbesondere ist S h¨ochstens abz¨ahlbar, und die Relativtopologie von S ist die diskrete Topologie. Beispiele. (a) Es sei f (z) = sin z/z f¨ ur z = 0. Dann ist 0 eine hebbare Singularit¨at von f . Die in ganz C konvergente Potenzreihenentwicklung der Sinusfunktion gibt n¨ amlich Anlass, f als f (z) =
∞ (−1)n 2n z , (2n + 1)! n=0
z = 0,
zu schreiben. Also l¨ asst sich f in die 0 hinein analytisch erg¨anzen; d.h. g(z) =
∞ (−1)n 2n z , (2n + 1)! n=0
z ∈ C,
gen¨ ugt den Forderungen von Definition II.4.1. (Insbesondere ist g(0) = 1.) (b) Es sei f (z) = 1/z f¨ ur z = 0. Dann ist 0 ein Pol von f . (c) Es sei f (z) = e1/z f¨ ur z = 0. Dann ist 0 eine wesentliche Singularit¨at von f . Der Grenzwert limn→∞ |f (−1/n)| = 0 zeigt n¨amlich, dass 0 kein Pol ist, und limn→∞ |f (1/n)| = ∞ zeigt, dass 0 keine hebbare Singularit¨at ist, denn in der Umgebung einer hebbaren Singularit¨ at muss f notwendig beschr¨ankt sein. Als n¨ achstes zeigen wir die Umkehrung der letzten Bemerkung.
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
95
Satz II.4.3 (Riemannscher Hebbarkeitssatz) ˜ → C analytisch. F¨ ˜ Sei f : G ur z0 ∈ C existiere ein ε > 0 mit Uε (z0 ) \ {z0 } ⊂ G, so dass f in Uε (z0 ) \ {z0 } beschr¨ankt ist. Dann ist z0 eine hebbare Singularit¨at von f . ˜ und h(z0 ) = 0. Wegen der Beweis. Betrachte h(z) = (z − z0 )2 f (z) f¨ ur z ∈ G angenommenen Beschr¨ anktheit von f ist h bei z0 differenzierbar mit h′ (z0 ) = 0. Insbesondere ist h in Uε (z0 ) analytisch und kann als Potenzreihe dargestellt werden: ∞ ∞ cn (z − z0 )n = cn (z − z0 )n , h(z) = n=0
n=2
denn c0 = h(z0 ) = 0 und c1 = h′ (z0 ) = 0. Daher definiert g(z) =
∞
n=0
cn+2 (z − z0 )n ,
z ∈ Uε (z0 ),
eine analytische Fortsetzung von f in z0 hinein, und die Singularit¨at z0 ist hebbar. 2 In der Umgebung einer wesentlichen Singularit¨at ist eine Funktion stark oszillierend, wie der folgende Satz zeigt. Satz II.4.4 (Satz von Casorati-Weierstraß) ˜ → C besitze eine wesentliche Singularit¨at bei z0 . Die analytische Funktion f : G ˜ liegt dann f Uδ (z0 ) \ {z0 } dicht in C. F¨ ur alle δ > 0 mit Uδ (z0 ) \ {z0 } ⊂ G
Beweis. Trifft die Aussage nicht zu, gibt es δ, ε > 0 und w ∈ C mit 0 < |z − z0 | ≤ δ
⇒ |f (z) − w| ≥ ε.
Nach Satz II.4.3 hat g := 1/(f − w) eine hebbare Singularit¨at; wir erg¨anzen g durch g(z0 ) = c bei z0 analytisch. Ist c = 0, so folgt 0 = lim g(z) = lim z→z0
z→z0
1 , f (z) − w
also limz→z0 |f (z)| = ∞, und z0 ist ein Pol. Ist c = 0, so wird f durch f (z0 ) = 1/c + w zu einer analytischen Funktion erg¨ anzt, und z0 ist eine hebbare Singularit¨ at von f . 2 Mit anderen Worten kommt f in jeder Umgebung einer isolierten Singularit¨ at jeder komplexen Zahl beliebig nahe. Es gilt jedoch dar¨ uber hinaus der viel st¨ arkere Große Satz von Picard : Mit h¨ ochstens einer Ausnahme nimmt f in jeder Umgebung einer wesentlichen Singularit¨ at jede komplexe Zahl unendlich oft an. Nun untersuchen wir Polstellen genauer.
96
II.
Funktionentheorie
˜ = G \ {z0 }. Die Funktion f : Satz II.4.5 Es seien G ⊂ C offen, z0 ∈ G und G ˜ → C sei analytisch und habe bei z0 einen Pol. Dann existieren eine analytische G Funktion g: G → C und eine nat¨ urliche Zahl m, so dass g(z0 ) = 0 und f (z) =
g(z) (z − z0 )m
˜ ∀z ∈ G.
Beweis. Es ist zu zeigen, dass f¨ ur ein geeignetes m ∈ N die Funktion z → (z − z0 )m f (z) an der Stelle z0 eine hebbare Singularit¨at besitzt; dazu reicht es, f in einem hinreichend kleinen punktierten Kreis um z0 zu betrachten. Wegen limz→z0 1/f (z) = 0 hat h := 1/f bei z0 nach Satz II.4.3 eine hebbare Singularit¨ at, und zwar durch h(z0 ) = 0. Betrachte die Potenzreihenentwicklung ∞ n n=0 dn (z − z0 ) von h; sei m = min{n: dn = 0}. Wegen h(z0 ) = 0 ist m ≥ 1, ˜ also m ∈ N, und es ist h(z) = (z − z0 )m h(z) mit einer auf G analytischen Funk˜ ˜ tion h mit h(z0 ) = 0. Wir erhalten die gesuchte Darstellung mit diesem m und ˜ g = 1/h. 2 Es ist klar, dass m und g in Satz II.4.5 eindeutig durch f bestimmt sind. Entwickelt man die Funktion g in ihre Potenzreihe, erh¨alt man eine Reihendarstellung der Funktion f der Form f (z) =
∞
n=−m
cn (z − z0 )n ;
(II.20)
sie konvergiert nach Konstruktion und Theorem II.3.3 im gr¨oßten punktierten ˜ liegt. Die cn sind eindeutig durch f bestimmt. Kreis UR (z0 ) \ {z0 }, der in G Definition II.4.6 Hat f bei z0 einen Pol, so heißt (II.20) die Laurentreihe von f um z0 . Die (endliche) Summe −1
n=−m
cn (z − z0 )n =
c−1 c−m + ··· + (z − z0 )m z − z0
heißt der Hauptteil der Laurentreihe; der Koeffizient c−1 wird das Residuum von f bei z0 genannt und mit res(f ; z0 ) bezeichnet. Die nat¨ urliche Zahl m aus Satz II.4.5 heißt die Ordnung des Pols, und f¨ ur m = 1 nennt man den Pol einfach. Das Residuum ist ein wichtiges Hilfsmittel zur Berechnung von Integralen, siehe Satz II.4.8. Daher ist es von Bedeutung, das Residuum einer Funktion an einer Stelle ausrechnen zu k¨ onnen. Lemma II.4.7 Die Funktion f habe bei z0 einen Pol der Ordnung m. Setzt man g(z) = (z − z0 )m f (z), so gilt res(f ; z0 ) =
g (m−1) (z0 ) . (m − 1)!
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
97
Beweis. Bemerke, dass g analytisch ist. Nach (II.20) ist res(f ; z0 ) der Koeffizient von (z − z0 )m−1 in der Potenzreihenentwicklung von g um z0 , und das ist nach Korollar II.1.6 g (m−1) (z0 )/(m − 1)!. 2 Wir wollen das Lemma an einem einfachen Beispiel illustrieren. Die durch f (z) = sin πz/(z − 1)2 definierte Funktion hat bei z0 = 1 einen Pol 2. Ordnung. Wir bilden also g(z) = (z − 1)2 f (z) = sin πz und g ′ (z) = π cos πz; es folgt res(f ; 1) =
π cos π = −π. 1!
Satz II.4.8 (Residuensatz) Sei G ⊂ C ein Gebiet und γ eine geschlossene nullhomotope Kurve in G. Es sei f eine in G meromorphe Funktion, und kein Pol von f liege auf Sp(γ). Es sei {z1 , z2 , . . . } die Menge der Polstellen von f . Dann gilt 1 f (z) dz = res(f ; zk )n(γ; zk ). (II.21) 2πi γ k
Beweis. Wir f¨ uhren den Beweis unter der vereinfachenden Annahme, dass die Menge der Polstellen endlich ist, etwa {z1 , . . . , zl }. (Im allgemeinen Fall kann man zeigen, dass {zk : n(γ; zk ) = 0} endlich ist, so dass die Summe in (II.21) auch dann eine nur formal unendliche Reihe ist.) F¨ ur jedes k = 1, . . . , l sei Hk der Hauptteil der Laurententwicklung von l f um zk . Dann hat f −Hk bei zk eine hebbare Singularit¨at. Daher besitzt f − k=1 Hk nur hebbare Singularit¨ aten, und es existiert eine analytische Funktion g: G → l ur z = z1 , . . . , zl . Nach dem Cauchyschen C mit f (z) − k=1 Hk (z) = g(z) f¨ Integralsatz (Theorem II.2.10) ist, da g in ganz G analytisch ist, γ g(z) dz = 0. Es folgt l 1 1 f (z) dz = Hk (z) dz. 2πi γ 2πi γ k=1
Daraus ergibt sich sofort (II.21), wenn der Beweis folgender Behauptung erbracht ist: • F¨ ur m ∈ N und z0 ∈ G ist n(γ; z0 ) f¨ ur m = 1, dz 1 = m 2πi γ (z − z0 ) 0 f¨ ur m > 1.
Das ist jedoch klar nach der Cauchyschen Integralformel (II.19), wenn man sie auf die konstante Funktion 1 anwendet (f¨ ur m = 1 ist das u ¨brigens die Definition der Umlaufzahl). 2 Bevor wir zu den Anwendungen des Residuensatzes kommen, sei erw¨ahnt, dass der Residuensatz auch gilt, wenn f wesentliche Singularit¨aten besitzt. Auch
98
II.
Funktionentheorie
im Fall einer wesentlichen Singularit¨ at kann man eine Laurententwicklung der Form ∞ cn (z − z0 )n f (z) = n=−∞
∞ −1 zeigen; die Konvergenz der Reihe ist als n=−∞ [. . . ] + n=0 [. . . ] zu verstehen. Die Reihe konvergiert im gr¨ oßten punktierten Kreis UR (z0 ) \ {z0 }, der im Definitionsbereich von f liegt. Das Residuum ist wieder als c−1 erkl¨art. Mit Hilfe des Residuensatzes lassen sich viele uneigentliche reelle RiemannIntegrale auswerten; dazu werden gleich drei Beispiele vorgestellt. Dabei werden wir die Residuen einiger Funktionen berechnen; nach Lemma II.4.7 ist im Fall eines einfachen Pols (m = 1) res(f ; z0 ) = lim (z − z0 )f (z).
(II.22)
z→z0
Es sei nicht verschwiegen, dass man die drei folgenden Integrale auch mit rein reellen Methoden berechnen kann; bei Beispiel II.4.9 w¨are das sogar einfacher, aber hier soll die komplexe Methode illustriert werden. ∞ dx π = Beispiel II.4.9 x −x 2 −∞ e + e Beweis. Es ist klar, dass dieses uneigentliche Integral konvergiert. Setze f (z) = 1/(ez +e−z ). Diese Funktion ist auf ganz C mit Ausnahme der Punkte πi/2+kπ, k ∈ Z, analytisch. Wir integrieren f u ¨ ber die Randkurve γR des Rechtecks mit Eckpunkten −R, R, R + πi, −R + πi, wobei wir langfristig R → ∞ streben lassen werden: −R −R+πi R+πi R f (z) dz. f (z) dz + f (z) dz + f (z) dz + f (z) dz = γR
−R
R+πi
R
−R+πi
Wegen f (z + πi) = −f (z) kann man den ersten und den dritten Summanden zu R R+πi R −R+πi R dx f (z) dz = 2 f (z) dz− f (z) dz = f (z) dz+ x −x −R e + e −R+πi −R R+πi −R zusammenfassen, und der zweite bzw. vierte Summand wird gem¨aß R+πi π π dt f (z) dz = f (R + it)i dt ≤ R it −R e−it | R 0 |e e + e 0π dt → 0 mit R → ∞ ≤ R −R 0 e −e abgesch¨ atzt. Es folgt lim
R→∞
γR
f (z) dz = 2
∞
−∞
dx . ex + e−x
(II.23)
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
99
Nun besitzt f bei πi/2 einen Pol 1. Ordnung mit Residuum 1/2i, denn die reziproke Funktion g = 1/f besitzt dort eine Nullstelle 1. Ordnung, es ist n¨amlich g ′ (πi/2) = eπi/2 − e−πi/2 = 2i sin(π/2) = 2i = 0, so dass mit einer geeigneten analytischen Funktion h 1 πi −1 z− f (z) = h(z) 2i 2
in einer Umgebung von πi/2 und h(πi/2) = 1 gilt. Das zeigt, dass f meromorph mit res(f ; πi/2) = 1/2i ist. Nach dem Residuensatz ergibt sich 1 f (z) dz = 2πi = π, 2i γR und wegen (II.23) folgt die Behauptung. ∞ dx π Beispiel II.4.10 = √ 4 2 −∞ 1 + x
2
Beweis. Es ist wieder klar, dass das Integral existiert, und daher ist ∞ R dx dx = lim . 4 R→∞ 1 + x 1 + x4 −∞ −R Wir betrachten die Funktion f (z) = 1/(1 + z 4 ) in C; sie ist meromorph mit den vier einfachen Polen z1 = eπ/4 i ,
z2 = e3π/4 i ,
z3 = e5π/4 i ,
z4 = e7π/4 i .
F¨ ur R > 1 integrieren wir f u ¨ ber die folgende Kurve γ = γ (R) : γ2 z2 ? −R
z1 γ1
R
Nach dem Residuensatz ist 1 f (z) dz = res(f ; z1 ) + res(f ; z2 ), 2πi γ denn n(γ; z1 ) = n(γ; z2 ) = 1, n(γ; z3 ) = n(γ; z4 ) = 0. (Die Kurve uml¨auft z1 und z2 einmal und z3 und z4 0-mal; daher sind die angegebenen Werte f¨ ur die
100
II.
Funktionentheorie
Umlaufzahlen anschaulich evident, nat¨ urlich k¨ onnen sie einfach formal verifiziert werden.) ur γ1 Wir berechnen nun die Integrale γ1 f (z) dz und γ2 f (z) dz einzeln. F¨ w¨ ahle die Parametrisierung γ1 (t) = t, −R ≤ t ≤ R. (Zur Erinnerung: der Wert des Integrals ist unabh¨ angig von der Parametrisierung, solange die Orientierung erhalten bleibt.) Daher ist R dx f (z) dz = . 1 + x4 −R γ1 it γ 2 werde durch γ2 (t) = Re , 0 ≤ t ≤ π, parametrisiert. Wir werden sehen, dass f (z) dz f¨ u r großes R klein wird: γ2 π 1 |Rieit | dt f (z) dz ≤ it )4 | |1 + (Re γ2 0 π R dt (da |1 + (Reit )4 | ≥ R4 − 1) ≤ 4−1 R 0 → 0 mit R → ∞.
Daraus folgt lim
R→∞
R
−R
dx = 2πi res(f ; z1 ) + res(f ; z2 ) , 4 1+x
und es bleibt, diese Residuen auszuwerten. Dazu verwenden wir (II.22). Schreibe 1 + z 4 = (z − z1 )(z − z2 )(z − z3 )(z − z4 ). Dann ist 1 . z→z1 (z1 − z2 )(z1 − z3 )(z1 − z4 ) √ √ Nun ist z1 − z2 = 2, z1 − z3 = 2eπ/4 i , z1 − z4 = 2i, also res(f ; z1 ) = lim (z − z1 )f (z) =
res(f ; z1 ) = Analog berechnet man
1 5π/4 i e . 4
1 res(f ; z2 ) = − e−5π/4 i . 4
Daraus ergibt sich
∞
−∞
wie behauptet.
1 dx 1 −5π/4 i 5π/4 i e e = 2πi − 1 + x4 4 4 = πi(i sin 5π/4) π π = π sin = √ , 4 2 2
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
Beispiel II.4.11
∞
101
sin x dx = π x
−∞
Beweis. Aus der reellen Analysis ist bekannt, dass dieses uneigentliche RiemannIntegral konvergiert (Beweis: partielle Integration mit u′ = sin x, v = 1/x); es ist jedoch nicht absolut konvergent. Der erste Trick, das gesuchte Integral mit komplexen Methoden anzugreifen, besteht darin, den Integranden f¨ ur z ∈ R als Imagin¨ arteil der in C meromorphen Funkiton f (z) = eiz /z anzusehen. Wir integrieren nun f l¨angs folgender Kurve γ = γ (r,R) , wo 0 < r < R < ∞ zun¨achst fest gew¨ ahlt sind: γ4
γ2 ? −R
γ1
−r
? r
γ3
R
Da f im einfach zusammenh¨ angenden Gebiet C \ {z: Re z = 0, Im z ≤ 0} analytisch ist, gilt γ f (z) dz = 0. Wir betrachten nun γ1 , . . . , γ4 einzeln und machen den Grenz¨ ubergang r → 0, R → ∞. Zu γ1 und γ3 : Eine Parametrisierung ist γ1 (t) = t, −R ≤ t ≤ −r, und daher
f (z) dz =
f (z) dz =
−r
−R
γ1
und analog gilt
γ3
r
R
eit dt, t eit dt. t
Nun zu γ4 : Eine Parametrisierung ist γ4 (t) = Reit , 0 ≤ t ≤ π. Also folgt
γ4
f (z) dz =
π exp(iReit ) it Rie dt it Re 0 π exp(iR(cos t + i sin t)) dt ≤ 0 π = exp(−R sin t) dt (da |eis | = 1 f¨ ur s ∈ R) 0
= 2
0
π/2
exp(−R sin t) dt
102
II.
≤ 2
Funktionentheorie
π/2
(da sin t ≥ 2t/π f¨ ur 0 ≤ t ≤ π/2)
exp(−R2t/π) dt
0
π (1 − e−R ) → 0 mit R → ∞. R
=
Und jetzt zu γ2 , parametrisiert durch γ2 (t) = rei(π−t) , 0 ≤ t ≤ π:
π
exp(irei(π−t) ) r(−i)ei(π−t) dt i(π−t) re 0 π exp(irei(π−t) ) dt = −i 0 π dt = −πi mit r → 0, → −i
f (z) dz =
γ2
0
¨ da der Integrand nach der folgenden Uberlegung gleichm¨aßig gegen 1 konvergiert; es ist n¨ amlich f¨ ur |z| = 1 und 0 < r < 1 ∞ ∞ ∞ (irz)n r rn ≤ ≤ rn = . |eirz − 1| = n! n! 1 − r n=1 n=1 n=1
Damit haben wir gezeigt: 0 = lim
r→0 R→∞
und daher
f (z) dz = lim
γ (r,R)
∞
−∞
r→0 R→∞
sin x dx = x
∞
−r
−R
Im
−∞
+
r
R
eit dt − πi t
eit dt = π. t
2
F¨ ur dieses Beispiel reichte schon der Cauchysche Integralsatz; der Residuensatz wurde nicht ben¨ otigt. Das Integral wird auf andere Weise auf Seite 260 berechnet. Zum Schluss diskutieren wir noch funktionentheoretische Anwendungen des Residuensatzes. Ist f : G → C eine nicht konstante analytische Funktion auf einem Gebiet G mit f (z0 ) = 0, so ist in der Potenzreihenentwicklung von f um z0 der Koeffizient urliche Zahl mit cm = 0, ∞ c0 = 0. Sei m ≥ 1 die kleinste nat¨ also f (z) = n=m cn (z − z0 )n . (Sind alle cn = 0, so ist nach Satz II.3.6 f = 0.) Die nat¨ urliche Zahl m heißt Ordnung der Nullstelle. Im folgenden betrachten wir ein Gebiet G, eine geschlossene Kurve γ in G und eine in G meromorphe Funktion f . Wir setzen voraus, dass n(γ; z) = 0 oder n(γ; z) = 1
∀z ∈ C \ Sp(γ).
(II.24)
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
103
Anschaulich bedeutet das, dass Gi = {z ∈ G: n(γ; z) = 1} aus denjenigen Punkten von G besteht, die im Innern“ des von γ umschlossenen ” Bereichs liegen. Wir bezeichnen mit N (f ) bzw. P (f ) die Anzahl inklusive Ordnungen der Null- bzw. Polstellen von f in Gi ; besitzt f dort z.B. eine einfache (m = 1) und eine doppelte (m = 2) Nullstelle, so ist N (f ) = 3. Mit diesen Bezeichnungen hat man den folgenden Satz. Satz II.4.12 Sei f eine im Gebiet G meromorphe Funktion, und sei γ eine geschlossene nullhomotope Kurve in G mit (II.24). Auf Sp(γ) soll weder eine Null- noch eine Polstelle von f liegen. Dann ist ′ 1 f (z) dz = N (f ) − P (f ). 2πi γ f (z) Beweis. Setze F (z) = f ′ (z)/f (z). Da sich die Nullstellen von f in G nicht h¨aufen (Satz II.3.6), ist F meromorph in G; beachte, dass das Produkt meromorpher Funktionen meromorph ist (Aufgabe II.6.22). Die Polstellen von F sind genau die Null- oder Polstellen von f (Beweis?). Nach dem Residuensatz folgt daher die Behauptung aus folgenden Aussagen: (1) Ist z0 eine m-fache Nullstelle von f , so gilt res(F ; z0 ) = m. (2) Ist z0 eine m-fache Polstelle von f , so gilt res(F ; z0 ) = −m. Zu (1): In einer Umgebung von z0 schreibe f (z) = (z − z0 )m g(z) mit einer analytischen Funktion g mit g(z0 ) = 0. Dann ist f ′ (z) = m(z − z0 )m−1 g(z) + (z − z0 )m g ′ (z), also m f ′ (z) g ′ (z) = . + f (z) z − z0 g(z) Wegen g(z0 ) = 0 ist g ′ /g in einer Umgebung von z0 analytisch, so dass res(F ; z0 ) = m, wie behauptet. Zu (2): Ersetze m durch −m in (1). 2
Satz II.4.12 wird aus folgendem Grund Argumentprinzip genannt. Das Integral in Satz II.4.12 ist nach Definition der Umlaufzahl gleich n(Γ; 0) f¨ ur die Kurve Γ = f ◦ γ. Daher gibt die rechte Seite die Anzahl der Uml¨aufe von f (z) um 0 an, wenn z die Kurve γ durchl¨ auft. Also ist (N (f ) − P (f ))2π der Zuwachs des Arguments in f (γ(t)) = r(t)eiα(t) . Satz II.4.13 (Satz von Rouch´e) Es seien f, g: G → C analytisch und γ eine geschlossene Kurve im Gebiet G mit (II.24). Auf Sp(γ) sollen keine Nullstellen von f oder g liegen. Es gelte |f (z) + g(z)| < |f (z)| + |g(z)| Dann folgt N (f ) = N (g).
∀z ∈ Sp(γ).
(II.25)
104
II.
Funktionentheorie
Beweis. Die Voraussetzung (II.25) ist a ¨quivalent zu f (z) f (z) 0 mit (vgl. das Argument f¨ ur (II.10)) f (z) ≥δ − t ∀z ∈ Sp(γ), t ≥ 0. (II.26) g(z)
F¨ ur t ≥ 0 betrachte die Hilfsfunktion ht (z) = f (z)/g(z) − t. Sie ist meromorph, und da keine Nullstelle von g auf Sp(γ) liegt, liegen wegen (II.26) auch keine Null- oder Polstellen von ht auf Sp(γ). Daher ist Satz II.4.12 auf ht anwendbar, er liefert ′ 1 1 h′0 (z) ht (z) ϕ(t) := dz = dz = N (ht ) − P (ht ). 2πi γ h0 (z) − t 2πi γ ht (z) Das erste Integral h¨ angt stetig von t ab, da h′0 (z) h′0 (z) |t − s| ′ dz ≤ h0 ∞ |dz| h0 (z) − t dz − h (z) − s |h (z) − t| |h0 (z) − s| 0 γ γ 0 γ 1 ≤ h′0 ∞ 2 |s − t|L(γ) δ wegen (II.26). Daher ist ϕ eine stetige Z-wertige Funktion auf [0, ∞). Nun ist [0, ∞) zusammenh¨ angend, folglich ϕ([0, ∞)) ebenfalls (Satz I.6.3); aber die einzigen nichtleeren zusammenh¨ angenden Teilmengen von Z sind einpunktig. Mithin ist ϕ konstant. Mit t → ∞ konvergiert h′0 /(h0 − t) auf Sp(γ) gleichm¨aßig gegen 0, so dass limt→∞ ϕ(t) = 0 und folglich ϕ = 0. Insbesondere ist ϕ(0) = 0, d.h. N (h0 ) = P (h0 ). Wegen N (h0 ) − P (h0 ) = N (f ) − N (g) ist der Satz von Rouch´e hiermit bewiesen. 2 Trotz des technischen Aufwands in diesem Beweis ist es einfach, heuristisch zu verstehen, warum der Satz von Rouch´e richtig sein muss. Die Anzahl der Nullstellen von f bzw. g ist doch nach unserer Vorbemerkung gleich der Anzahl der Uml¨ aufe von f (z) bzw. g(z) um 0, wenn z die Kurve γ durchl¨auft. Die Voraussetzung (II.25) besagt aber, dass f (z) und g(z) nie auf demselben Strahl onnen; das heißt, f kann g nicht u {reiϕ : r ≥ 0} liegen k¨ ¨ berholen und umgekehrt. Daher muss die Anzahl der Uml¨ aufe von f und g gleich sein, das heißt N (f ) = N (g) nach dem Argumentprinzip.
II.4
Isolierte Singularit¨ aten und Residuenkalk¨ ul
105
Mit Hilfe des Satzes von Rouch´e kann man einen weiteren Beweis des Fundamentalsatzes der Algebra (Korollar II.3.11) geben. Wir gehen von einem nicht konstanten Polynom aus, das ohne Einschr¨ankung die Form P (z) = z n + an−1 z n−1 + · · · + a1 z + a0 hat. Setze f (z) = P (z) und g(z) = −z n . Auf dem Rand eines Kreises mit hinreichend großem Radius gilt dann |f (z) + g(z)| < |f (z)| ≤ |f (z)| + |g(z)|. Da g im Innern des Kreises die n-fache Nullstelle 0 hat, hat auch f dort n Nullstellen. Wir wenden den Satz von Rouch´e im n¨ achsten Beweis an. Satz II.4.14 Es sei f : G → C analytisch und z0 eine k-fache w0 -Stelle von f (d.h. z0 ist eine k-fache Nullstelle von f − w0 ). Dann existieren ein δ > 0 und ein ε > 0, so dass f¨ ur alle w ∈ Uε (w0 ) \ {w0 } genau k einfache w-Stellen von f in Uδ (z0 ) existieren. Die Gleichung f (z) = w hat also genau k verschiedene L¨osungen in Uδ (z0 ). Beweis. W¨ ahle δ > 0 mit Uδ (z0 ) ⊂ G und f ′ (z) = 0
f (z) = w0
f¨ ur 0 < |z − z0 | ≤ δ,
f¨ ur 0 < |z − z0 | ≤ δ.
Das ist m¨ oglich, weil die Nullstellen von f ′ und die w0 -Stellen von f sich nach Satz II.3.6 in G nicht h¨ aufen. Setze g(z) = f (z) − w0 . Wegen |g(z)| > 0 f¨ ur |z − z0 | = δ existiert ein ε > 0 mit |g(z)| ≥ ε f¨ ur |z − z0 | = δ. Es sei γ(t) = z0 + δeit , 0 ≤ t ≤ 2π; dann erf¨ ullt γ die Voraussetzungen des Satzes von Rouch´e; es ist {z ∈ G: n(γ; z) = 1} = Uδ (z0 ),
Sp(γ) = {z: |z − z0 | = δ}.
Wir zeigen jetzt die Behauptung des Satzes f¨ ur dieses δ und dieses ε. Sei also 0 < |w − w0 | < ε. F¨ ur z ∈ Sp(γ) ist |(w − f (z)) + g(z)| = |w − w0 | < ε ≤ |g(z)| ≤ |w − f (z)| + |g(z)|. Daher impliziert der Satz von Rouch´e f¨ ur die Funktionen w − f und g N (w − f ) = N (g) = k. Folglich existieren k Stellen (inklusive Vielfachheiten gez¨ahlt) z1 , . . . , zk ∈ Uδ (z0 ) mit f (zj ) = w. W¨ are ein zj keine einfache w-Stelle von f , w¨are f ′ (zj ) = 0, aber das war ausgeschlossen. Also sind die z1 , . . . , zk paarweise verschieden. 2 Korollar II.4.15 (Satz von der Gebietstreue) Ist G ⊂ C ein Gebiet und f : G → C analytisch und nicht konstant, so ist f (G) ebenfalls ein Gebiet. Insbesondere ist f (G) offen.
106
II.
Funktionentheorie
Beweis. Nach Satz I.6.3 ist f (G) zusammenh¨ angend. Um die Offenheit zu zeigen, sei z0 ∈ G beliebig. Da f nicht konstant ist, hat die w0 = f (z0 )-Stelle z0 endliche Ordnung (Satz II.3.6). Mit δ und ε wie in Satz II.4.14 gilt dann w0 ∈ Uε (w0 ) ⊂ f (Uδ (z0 )) ⊂ f (G). Daher ist f (z0 ) ein innerer Punkt von f (G), und f (G) ist offen.
2
Ist f : G → G′ eine bijektive analytische Abbildung zwischen den Gebieten ur G und G′ , so ist die Umkehrabbildung f −1 nach Korollar II.4.15 stetig, denn f¨ eine offene Menge U ⊂ G ist (f −1 )−1 (U ) = f (U ) offen. Man kann außerdem zeigen, dass f −1 sogar analytisch ist (Aufgabe II.6.36 oder Aufgabe II.6.37); man nennt f dann biholomorph oder konform. Gebiete, zwischen denen eine (bijektive) konforme Abbildung existiert, sind f¨ ur viele Fragen der Funktionentheorie als ¨ aquivalent anzusehen; solche Gebiete werden konform ¨aquivalent genannt. In diesem Zusammenhang erw¨ ahnen wir abschließend den Riemannschen Abbildungssatz : • Ist G = C ein einfach zusammenh¨angendes Gebiet, so ist G zum Einheitskreis {z: |z| < 1} konform ¨aquivalent.
II.5
Der Primzahlsatz
Dieser Abschnitt behandelt eine Anwendung der Funktionentheorie in der analytischen Zahlentheorie. Es geht um die Verteilung der Primzahlen. In diesem Abschnitt bezeichnet p stets eine Primzahl, und zwar ist pn die n te Primzahl; Ausdr¨ ucke wie p≤x log p bedeuten also, dass nur u ¨ ber Primzahlen ≤ x zu summieren ist. Am Ende des 18. Jahrhunderts hatten Gauß und Legendre nach Analyse von Primzahltabellen die Vermutung aufgestellt, dass f¨ ur große“ x die Anzahl π(x) ” der Primzahlen ≤ x ungef¨ ahr x/log x ist. Diese Vermutung wurde erst 100 Jahre sp¨ ater bewiesen, als 1896 Hadamard und da la Vall´ee-Poussin unabh¨angig voneinander den Primzahlsatz zeigen konnten: Theorem II.5.1 (Primzahlsatz) lim
x→∞
π(x) =1 x/log x
(II.27)
Ich kann es mir nicht entsagen, den entsprechenden Passus aus dem Artikel von W. und F. Ellison in der von Dieudonn´e herausgegebenen Geschichte der Mathematik 1700–1900 zu zitieren:
II.5
Der Primzahlsatz
107
Die in den neunziger Jahren des vorigen [lies: des 19.] Jahrhunderts gemachten Entdeckungen in der komplexen Funktionentheorie bereiteten den Boden f¨ ur einen raschen Fortschritt in der Theorie der Primzahlverteilung. Der Primzahlsatz selbst wurde 1896 von Hadamard und, unabh¨ angig, von de la Vall´ee Poussin bewiesen. (Die Tatsache, daß es mehr als ein Jahrhundert dauerte, ehe ein Beweis des Primzahlsatzes gefunden wurde, hatte die Vorstellung entstehen lassen, seinen Entdeckern w¨ urde das ewige Leben zuteil. Lange Zeit schien diese Legende der Wahrheit zu entsprechen; leider wurde sie 1962 ersch¨ uttert, als de la Vall´ee Poussin mit 96 Jahren starb, und schließlich 1963 v¨ ollig zerst¨ ort durch den Tod von Hadamard im Alter von 98 Jahren!)10
Der wohl einfachste Beweis des Primzahlsatzes ist 1980 von Newman ver¨offentlicht worden11 ; wir folgen der Darstellung seines Ansatzes von Zagier12 , die weitere 100 Jahre nach dem Originalbeweis erschien. Was haben Primzahlen mit Funktionentheorie zu tun? Die Verbindung ist in erster Linie der nachfolgend definierten Zetafunktion zu verdanken. Diese Funktion war – f¨ ur reelle Argumente – bereits von Euler benutzt worden, der in diesem Kontext Satz II.5.4 (siehe unten) gezeigt hat. Es war aber erst Riemann, der in der 1859 erschienenen Note13 Ueber die Anzahl der Primzahlen unter einer gegebenen Gr¨osse die Zetafunktion im Komplexen betrachtete. Damit er¨ offnete er der Primzahltheorie vollkommen neue Methoden. In der Tat gibt Riemann eine Formel f¨ ur π(x) an, die er unter der Annahme von sechs Vermutungen und unbewiesenen Behauptungen zeigen konnte. Von diesen sind inzwischen f¨ unf bewiesen, nur die letzte, die ber¨ uhmte Riemannsche Vermutung (siehe Seite 119), ist noch offen. Kommen wir nun zu den Details. Definition II.5.2 Die Riemannsche Zetafunktion ist f¨ ur Re z > 1 durch ζ(z) =
∞ 1 nz n=1
erkl¨ art. Zur Erinnerung: F¨ ur reelle Zahlen a > 0 ist az durch elog a·z definiert; also z ist z → a eine ganze Funktion. Das folgende Argument zeigt, dass die Reihe 10 J. Dieudonn´ e (Hg.), Geschichte der Mathematik 1700–1900, VEB Deutscher Verlag der Wissenschaften, Berlin 1985, S. 286. Die Autoren haben sich u ugig verrechnet: ¨brigens geringf¨ de la Vall´ee-Poussin wurde 95 und Hadamard 97 Jahre alt. 11 D.H. Newman, Simple analytic proof of the prime number theorem, Amer. Math. Monthly 87 (1980), 693–697. 12 D. Zagier, Newman’s short proof of the prime number theorem, Amer. Math. Monthly 104 (1997), 705–708. 13 Gesammelte Werke, 2. Auflage 1892, S. 145–153.
108
II.
Funktionentheorie
∞
1/nz wirklich auf {z: Re z > 1} konvergiert, und zwar gleichm¨aßig auf den abgeschlossenen Halbebenen {z: Re z ≥ σ > 1}: n=1
∞ ∞ ∞ 1 1 1 ≤ < ∞ f¨ ur σ > 1. z = Re z σ n n n n=1 n=1 n=1
Daher ist ζ nach Satz II.3.16 auf {z: Re z > 1} analytisch. Wir wollen die Zetafunktion auf {z: Re z > 0} meromorph fortsetzen. F¨ ur Re z > 1 ist ∞ ∞ ∞ 1 1 1 dx n+1 1 − = − ζ(z) − = dx. z z − 1 n=1 nz nz xz 1 x n=1 n Die Reihe rechter Hand konvergiert aber sogar f¨ ur Re z > 0, und zwar gleichm¨ aßig f¨ ur Re z ≥ σ > 0, denn x 1 du 1 − = z z+1 nz xz u n und daher
1 |z| |z| 1 1 = Re z+1 ≤ σ+1 . z − z dx ≤ |z| sup z+1 n x | n n n≤u≤n+1 |u
n+1
n
Es existiert also eine auf {z: Re z > 0} analytische Funktion h mit ζ(z) −
1 = h(z) z−1
f¨ ur Re z > 1.
Deshalb gestattet ζ verm¨ oge z → 1/(z − 1) + h(z) eine (wegen des Identit¨atssatzes II.3.6 eindeutig bestimmte) analytische Fortsetzung auf {z: Re z > 0, z = 1}. Wir haben gezeigt: Satz II.5.3 Die Zetafunktion kann zu einer ebenfalls mit ζ bezeichneten meromorphen Funktion auf {z: Re z > 0} fortgesetzt werden. Diese hat nur bei z = 1 einen Pol, welcher einfach ist und das Residuum 1 besitzt. Wie schon Riemann gezeigt hat, kann ζ sogar zu einer meromorphen Funktion auf C fortgesetzt werden, aber f¨ ur das Folgende reicht der recht einfache Satz II.5.3. Der n¨ achste Satz beschreibt einen unmittelbaren Zusammenhang zwischen der Zetafunktion und den Primzahlen. Wir ben¨otigen den Begriff des unendlichen Produktes von komplexen Zahlen a1 , a2 , · · · = 0. Man sagt,
dass das · · · gegen a konvergiert, wenn limm→∞ m unendliche Produkt a1 · a2 · n=1 an = a ∞ und a = 0 ist; in Zeichen n=1 an = a. Die Forderung a = 0 erkl¨art sich daraus, dass man die Nullteilerfreiheit auch bei unendlichen Produkten garantieren ∞ m¨ ochte. ( n=1 1/n konvergiert also nicht.)
II.5
Der Primzahlsatz
109
Satz II.5.4 F¨ ur Re z > 1 gilt ζ(z) ·
p
1−
1 = 1. pz
(II.28)
Beweis. Zu Re z > 1 und ε > 0 w¨ ahle N ∈ N mit ∞
n=N +1
Nun ist ζ(z) = 1 +
1 nRe z
< ε.
1 1 + z + ··· , z 2 3
so dass 1 ζ(z) = 1 + 2z 1 1 1 − z 1 − z ζ(z) = 1 + 3 2
1−
1 1 1 1 + z + z + z + ··· , 3z 5 7 9 1 1 1 1 + z + z + z + ··· , 5z 7 11 13
etc. (Sieb des Eratosthenes!) Im m-ten Schritt ergibt sich 1 1 1 1 1− z · · · 1 − z ζ(z) = 1 + z + ··· ; 1− z pm pm−1 2 pm+1 folglich ∞ 1 m 1 ≤ + · · · ≤ ζ(z) − 1 1 − pzj pzm+1 n=p j=1
m+1
1 nRe z
≤
∞
1 < ε, Re z n n=m+1
falls m ≥ N . Das war zu zeigen.
2
Korollar II.5.5 ζ(z) = 0 f¨ ur Re z > 1. Korollar II.5.6 F¨ ur Re z > 1 gilt log p ζ ′ (z) =− . ζ(z) pz − 1 p
m Beweis. Setze fn (z) = 1−1/pz und Fm (z) = n=1 fn (z). Der obige Beweis zeigt, dass limm→∞ Fm (z) = 1/ζ(z), und zwar gleichm¨aßig auf {z: Re z ≥ σ > 1}. ′ Daher ist nach Satz II.3.16 limm Fm (z) = (1/ζ)′ (z) = −ζ ′ (z)/ζ(z)2 und deshalb − ′ (z) = da Fm
∞
′ limm Fm (z) F ′ (z) fk′ (z) ζ ′ (z) = = lim m = , ζ(z) limm Fm (z) m→∞ Fm (z) fk (z)
m
k=1
k=1
fk′ (z)
m
n=1,n =k
fn (z). Ausrechnen liefert die Behauptung. 2
110
II.
Funktionentheorie
Als n¨ achstes definieren wir die zahlentheoretische Hilfsfunktion ϑ(x) = log p; p≤x
f¨ ur x < 2 ist hier ϑ(x) = 0 zu verstehen (leere Summe). Lemma II.5.7 F¨ ur 0 < ε < 1 und x ≥ 1 ist π(x) log x ≥ ϑ(x) ≥ (1 − ε) log x · (π(x) − x1−ε ). Beweis. Es ist einerseits
ϑ(x) =
p≤x
log p ≤ π(x) log x
und andererseits ϑ(x) ≥
x1−ε 1/2 konvergiert, und zwar gleichm¨ aßig f¨ ur Re z ≥ σ > 1/2. F¨ ur solche z ist n¨amlich 1 1 1 |hp (z)| = 2z 1 + z + 2z + · · · |p | p p 1 1 1 ≤ 2z 1 + Re z + 2 Re z + · · · |p | p p 1 1 1 ≤ 2z 1 + Re z + 2 Re z + · · · |p | 2 2 1 1 1 1 ≤ 2z 1 + 1/2 + + 3/2 + · · · (wegen Re z > 1/2) |p | 2 2 2 1 1 1 √ 2 Re z =: C 2 Re z = p 1 − 1/ 2 p mit der Konsequenz, dass p
log p · |hp (z)| ≤ C
∞ ∞ log p log n log n ≤ C ≤ C < ∞. 2 Re z 2 Re z p n n2σ p n=1 n=1
Da nach Korollar II.5.5 ζ ′ /ζ auf die rechte Halbebene meromorph fortgesetzt werden kann mit Polen bei z = 1 und den Nullstellen der Zetafunktion (vgl. den Beweis von Satz II.4.12), folgt die Behauptung des Lemmas aus (II.31) und Satz II.3.16. 2 ¨ Uber die Nullstellen der Zetafunktion k¨ onnen wir folgende fundamentale Aussage treffen. Theorem II.5.11 ζ(z) = 0 f¨ ur Re z ≥ 1. Beweis. Wegen Korollar II.5.5 ist nur“ der Fall Re z = 1 zu behandeln. Nehmen ” wir an, dass f¨ ur ein reelles b = 0 der Wert ζ(1 + ib) = 0 ist; die Ordnung der Nullstelle sei m > 0. Setze n = 0, falls ζ(1 + 2ib) = 0; sonst sei n die Ordnung der Nullstelle 1 + 2ib. Aus (II.31) wollen wir lim εΦ(1 + ε) = 1,
ε→0
lim εΦ(1 + ε ± ib) = −m,
ε→0
lim εΦ(1 + ε ± 2ib) = −n
ε→0
(II.32)
herleiten. In einer Umgebung der einfachen Polstelle z = 1 von ζ gilt eine Darstellung (vgl. Satz II.4.12) −1 ζ ′ (z) = + H1 (z) ζ(z) z−1 mit einer analytischen funktion H1 ; f¨ ur Φ heißt das Φ(z) =
1 + H2 (z) z−1
II.5
Der Primzahlsatz
113
mit einer analytischen Funktion H2 und deshalb εΦ(1+ε) → 1. Bei der Nullstelle 1 + ib von ζ lauten die Darstellungen ζ ′ (z) m −m = + H3 (z) bzw. Φ(z) = + H4 (z) ζ(z) z − (1 + ib) z − (1 + ib) mit analytischen Funktionen H3 und H4 ; daher εΦ(1 + ε + ib) → −m. Das Verhalten bei 1 − ib ergibt sich aus ζ(z) = ζ(z), was aus nz = nz folgt (wie?). Schließlich behandelt man 1 + 2ib analog. Damit ist (II.32) gezeigt. Nun ist f¨ ur s := 1 + ε > 1 Φ(s + 2ib) + Φ(s − 2ib) + 4Φ(s + ib) + 4Φ(s − ib) + 6Φ(s) log p = (p−2ib + p2ib + 4p−ib + 4pib + 6) s p p =
log p p
ps
log p
(pib/2 + p−ib/2 )4 =
p
p1+ε
16 cos4 (log p · b/2) ≥ 0.
Deshalb folgt aus (II.32) −2n − 8m + 6 ≥ 0, was n ≥ 0 und m > 0 widerspricht.
2
Korollar II.5.12 Die in Lemma II.5.10 beschriebene Fortsetzung von Φ besitzt außer bei z0 = 1 keinen Pol in {z: Re z ≥ 1}; die Funktion z → Φ(z) − 1/(z − 1) ist in einer Umgebung der abgeschlossenen Halbebene {z: Re z ≥ 1} analytisch. Wir ben¨ otigen den Zusammenhang zwischen Φ und ϑ. Lemma II.5.13 F¨ ur Re z > 1 gilt Φ(z) = z
∞
1
ϑ(x) dx. xz+1
Beweis. Wegen Lemma II.5.9 existiert das Integral. Wir ben¨otigen die Formel von der Abelschen oder partiellen Summation: N
n=1
an (bn − bn+1 ) =
N
n=1
an b n −
= a1 b 1 +
N −1
N −1 n=1
an bn+1
n=1
n=1
= a1 b 1 +
N
an+1 bn+1 −
N −1 n=1
an bn+1 − aN bN +1
(an+1 − an )bn+1 − aN bN +1
114
II.
und daher
∞
n=1
an (bn − bn+1 ) = a1 b1 +
∞
n=1
Funktionentheorie
(an+1 − an )bn+1 ,
falls eine der Reihen konvergiert und an bn+1 → 0. Damit erh¨ alt man ∞ ∞ ϑ(x) ϑ(x) z dx = z dx (da ϑ(x) = 0 f¨ ur x < 2) z+1 z+1 x x 2 1 ∞ pn+1 ϑ(x) dx = z z+1 x n=1 pn pn+1 ∞ dx = z ϑ(pn ) (da ϑ auf [pn , pn+1 ) konstant) xz+1 pn n=1 =
∞
n=1
−z ϑ(pn )(p−z n − pn+1 )
= ϑ(2)2−z +
∞
(ϑ(pn+1 ) − ϑ(pn ))p−z n+1
n=1
(Abelsche Summation; siehe oben) ∞ = log 2 · 2−z + log pn+1 · p−z n+1 n=1
=
log p p
pz
= Φ(z),
wie behauptet.
2
Wir formulieren jetzt die entscheidende Absch¨atzung. ∞ ϑ(x) − x dx existiert. Lemma II.5.14 Das Integral x2 1 Mit der Substitution x = et geht dieses Integral in ∞ ϑ(et ) − et dt et 0
(II.33)
u ¨ ber. Die Konvergenz dieses Integrals zeigen wir mit folgendem Lemma, das sich als archimedischer Punkt des Beweises des Primzahlsatzes herausstellt. Lemma II.5.15 Sei f : [0, ∞) → C beschr¨ankt und st¨ uckweise stetig. Es sei ∞ f (t)e−zt dt f¨ ur Re z > 0. g(z) = 0
II.5
Der Primzahlsatz
115
(a) Die Funktion g, genannt die Laplace-Transformierte von f , ist wohldefiniert und analytisch in {z: Re z > 0}. (b) Falls g zu einer analytischen Funktion in einer Umgebung ∞ G von {z: Re z ≥ 0} fortgesetzt werden kann, existiert das Integral 0 f (t) dt und ist = g(0). Beweis. (a) ist nach dem Satz von Morera (Satz II.3.15) klar; alternativ mache man sich klar, dass man unter dem Integral differenzieren darf. ur T > 0 setze (b) Sei M = supt |f (t)|, und f¨ gT (z) =
T
f (t)e−zt dt;
0
wie in (a) sieht man, dass gT eine ganze Funktion ist. Es ist nun lim gT (0) = g(0)
T →∞
(II.34)
zu zeigen. Wir werden gT (0) − g(0) durch ein Kurvenintegral mit der Cauchyschen Integralformel darstellen und dieses Integral dann absch¨atzen. Sei dazu R > 0 fest. Dann existiert ein δ > 0, so dass das Rechteck {x + iy: − 2δ ≤ x ≤ 0, |y| ≤ R + 1} in G liegt (Beweis?). Die Spur der nachstehend skizzierten Kurve γ liegt dann in G, und γ ist dort nullhomotop. Ri
G
Nach der Cauchyschen Integralformel (II.18) gilt f¨ ur jede in G analytische Funktion w mit w(0) = 1 (gT (z) − g(z))w(z) 1 dz. (II.35) gT (0) − g(0) = 2πi γ z Hier erweist sich die trickreiche Wahl z2 w(z) = wT (z) = eT z 1 + 2 R
116
II.
Funktionentheorie
als erfolgreich. Dann erhalten wir als erstes die Absch¨atzung w(z) R z 1 2 |Re z| = eT Re z = eT Re z + · z z R R R2
f¨ ur |z| = R,
(II.36)
denn f¨ ur |v| = 1 ist v −1 + v = v + v = 2 Re v. + γ sei der in der Halbebene {z: Re z ≥ 0} verlaufende Teil der Kurve γ und γ − der in der Halbebene {z: Re z ≤ 0} verlaufende. F¨ ur Re z > 0 gilt die Absch¨ atzung ∞ ∞ M − Re z·T −zt e . e− Re z·t dt = |f (t)| |e | dt ≤ M |gT (z) − g(z)| ≤ Re z T T ultige Absch¨atZusammen mit (II.36) zeigt das die f¨ ur z ∈ Sp(γ + ), Re z > 0 g¨ zung w(z) 2M |gT (z) − g(z)| ≤ 2, z R die aus Stetigkeitsgr¨ unden auf ganz Sp(γ + ) zutrifft. Es folgt 1 1 2M M (gT (z) − g(z))w(z) dz . (II.37) ≤ L(γ + ) = 2πi + 2 z 2π R R γ 1 Als n¨ achstes sch¨ atzen wir 2πi γ − gT (z)w(z)/z dz ab. Der Integrand ist in C \ {0} analytisch, da gT eine ganze Funktion ist, und γ − ist dort zu dem in der linken Halbebene verlaufenden Halbkreis γ˜ − (t) = Reit , 21 π ≤ t ≤ 32 π, homotop. Nach dem Cauchyschen Integralsatz ist [. . . ] = [. . . ] γ−
γ ˜−
und weiter folgt wegen (II.36) und der f¨ ur Re z < 0 g¨ ultigen Absch¨atzung T T −zt |gT (z)| = f (t)e dt ≤ M e− Re z·t dt 0
0
M M (e− Re z·T − 1) ≤ e− Re z·T = − Re z − Re z
f¨ ur z ∈ Sp(˜ γ−)
w(z) 2M |gT (z)| ≤ 2, z R
so dass man insgesamt 1 1 2M M w(z) 1 w(z) 2πi − gT (z) z dz = 2πi − gT (z) z dz ≤ 2π R2 πR = R (II.38) γ γ ˜
erh¨ alt.
II.5
Der Primzahlsatz
117
Zum Schluss betrachten wir
1 2πi
γ−
g(z)w(z)/z dz. Der Integrand kann als
z2 1 =: eT z h(z) eT z g(z) 1 + 2 R z
geschrieben werden. Hier ist h auf der kompakten Menge Sp(γ − ) beschr¨ankt (da stetig). Ist Re z < 0, so gilt limT →∞ eT z h(z) = 0, und zwar gleichm¨aßig auf Mengen der Form {z ∈ Sp(γ − ): Re z ≤ −η < 0}. Daraus folgt leicht 1 g(z)w(z) dz = 0. lim T →∞ 2πi γ − z (Man h¨ atte auch mit dem Lebesgueschen Konvergenzsatz, Theorem IV.6.2, argumentieren k¨ onnen.) Nun sei ε > 0 gegeben. W¨ ahle R mit M/R ≤ ε/3. F¨ ur dieses R w¨ahle T0 , so dass f¨ ur T ≥ T0 1 g(z)w(z) ε dz ≤ (II.39) 2πi − z 3 γ
ist; beachte, dass w von T und γ von R abh¨ angt. Dann liefern (II.35), (II.37), (II.38) und (II.39) |gT (0) − g(0)| ≤ ε ∀T ≥ T0 ; das ist die zu zeigende Behauptung (II.34).
2
Jetzt sind es nur noch wenige Schritte bis zum Primzahlsatz. Beweis von Lemma II.5.14. F¨ ur die nach Lemma II.5.9 beschr¨ankte Funktion f : ∞ [0, ∞) → R, f (t) = (ϑ(et ) − et )/et , ist die Existenz des Integrals 0 f (t) dt zu zeigen; vgl. ∞ (II.33). Nach Lemma II.5.15(b) reicht es, die Laplace-Transformierte g(z) = 0 f (t)e−zt dt in eine Umgebung von {z: Re z ≥ 0} analytisch fortzusetzen. Aber g(z) berechnet sich f¨ ur Re z > 0 zu ∞ ϑ(et ) − et −zt t e e dt g(z) = e2t 0 ∞ ϑ(x) − x −z = x dx (x = et ) x2 1 ∞ ∞ dx ϑ(x) dx − = 2+z 1+z x x 1 1 Φ(z + 1) 1 − (Lemma II.5.13) = z+1 z 1 1 = Φ(z + 1) − − 1 , z+1 z und alles folgt aus Korollar II.5.12.
2
118
II.
Funktionentheorie
Beweis des Primzahlsatzes. Wir zeigen limx→∞ ϑ(x)/x = 1; vgl. Lemma II.5.8. Seien dazu λ > 1 und x so, dass ϑ(x)/x ≥ λ. Dann ist
λx x
ϑ(t) − t dt ≥ t2
λx
x
ϑ(x) − t dt ≥ t2
λx
x
λx − t dt = t2
λ
1
λ−s ds =: A > 0 s2
mit der Substitution s = t/x; beachte, dass A von x unabh¨angig ist. Das Cauchykriterium f¨ ur uneigentliche Integrale liefert, dass die Menge {x: ϑ(x)/x ≥ λ} beschr¨ ankt ist. Das zeigt ∀λ > 1 ∃x0 ∀x ≥ x0 :
ϑ(x) ≤ λ. x
Sei jetzt λ < 1 und x so, dass ϑ(x)/x ≤ λ. Dann ist
x
λx
ϑ(t) − t dt ≤ t2
x
λx
ϑ(x) − t dt ≤ t2
x
λx
λx − t dt = t2
(II.40)
1 λ
λ−s ds =: B < 0, s2
und wie oben folgt, dass {x: ϑ(x)/x ≤ λ} beschr¨ankt ist; mit anderen Worten ∀λ < 1 ∃x1 ∀x ≥ x1 :
ϑ(x) ≥ λ. x
(II.41)
(II.40) und (II.41) liefern sofort limx→∞ ϑ(x)/x = 1, wie gew¨ unscht.
2
Der Primzahlsatz liefert auch die Gr¨ oßenordnung der n-ten Primzahl pn . pn = 1. n→∞ n log n
Korollar II.5.16 lim
Beweis. Ersetzt man in (II.27) x durch pn , beachtet man π(pn ) = n und bildet man den Kehrwert, so folgt zun¨ achst lim
n→∞
pn = 1. n log pn
(II.42)
Logarithmieren dieser Gleichung liefert log pn − log n − log log pn → 0 bzw. log log pn log n log pn 1 − − → 0, log pn log pn
woraus wegen log pn → ∞ und log log pn /log pn → 0 log n →1 log pn folgt, was zusammen mit (II.42) die Behauptung zeigt.
2
II.5
Der Primzahlsatz
119
Zum Schluss noch ein kurzer Ausblick. In der analytischen Zahlentheorie spricht man h¨ aufig den Primzahlsatz mittels des Integrallogarithmus x dt Li(x) = log t 2 in der Form lim
x→∞
π(x) =1 Li(x)
aus; da partielle Integration Li(x)/(x/log x) → 1 liefert, ist diese Form ¨aquivalent zu Theorem II.5.1, aber die Approximation ist (beweisbar!) quantitativ ur kleine“ x illustrieren soll. genauer, was die folgende Tabelle14 f¨ ” x
π(x)
104 106 108 1010 1012
[Li(x)] − π(x)
1229 78498 5 761 455 455 052 511 37 607 912 018
16 128 754 3104 38263
π(x) Li(x) 0.987 0.998 0.999 986 0.999 993 0.999 998
π(x) x/log x 1.131 1.084 1.061 1.047 1.039
Unser Beweis liefert keinerlei Aufschluss u ¨ ber die Gr¨oßenordnung der Differenz Li(x)−π(x), man kann nur schließen, dass sie langsamer w¨achst als x/log x. Bessere Absch¨ atzungen erh¨ alt man, wenn man explizit Bereiche des kritischen Streifens {z: 0 < Re z < 1} kennt, in denen ζ nullstellenfrei ist; damit kann man dann z.B. f¨ ur geeignete Konstanten C1 , C2 > 0 die Ungleichung |Li(x) − π(x)| ≤ C1
x √ exp(C2 log x)
erzielen. Eines der gr¨ oßten offenen Probleme der Mathematik ist die Riemannsche Vermutung, wonach s¨ amtliche Nullstellen von ζ im Streifen {z: 0 < Re z < 1} den Realteil 1/2 haben. Sollte sich dies als richtig erweisen, kann man sogar eine Absch¨ atzung der Form √ |Li(x) − π(x)| ≤ C1 x log x beweisen. Bis jetzt haben alle numerischen Berechnungen die Riemannsche Vermutung gest¨ utzt, aber ein korrekter Beweis wurde noch nicht gefunden; man weiß nicht einmal, ob die Nullstellen der Zetafunktion einer Ungleichung der Form Re z ≤ σ < 1 gen¨ ugen. Auf S. 147/148 seiner Arbeit (vgl. Fußnote 13) formuliert Riemann die heute nach ihm benannte Vermutung. Riemann betrachtet hier die eng mit der Zetafunktion verwandte Funktion ξ; es ist ξ(z) = ζ( 21 + iz)H(z) mit einer nullstellenfreien analytischen Funktion H: 14 Teilweise
aus P. Ribenboim, The Book of Prime Number Records, Springer 1988, S. 179.
120
II.
Funktionentheorie
Die Anzahl der Wurzeln von ξ(t) = 0, deren reeller Theil zwischen 0 und T liegt, ist etwa T T T = log − ; 2π 2π 2π denn das Integral d log ξ(t) positiv um den Inbegriff der Werthe von t erstreckt, deren imagin¨ arer Theil zwischen 12 i und − 21 i und deren reeller Theil zwischen 0 und T liegt, ist (bis auf einen Bruchtheil von der OrdT − T )i; dieses Integral aber ist gleich nung der Gr¨ osse T1 ) gleich (T log 2π der Anzahl der in diesem Gebiet liegenden Wurzeln von ξ(t) = 0, multiplicirt mit 2πi. Man findet nun in der That etwa so viel reelle Wurzeln innerhalb dieser Grenzen, und es ist sehr wahrscheinlich, dass alle Wurzeln reell sind. Hiervon w¨ are allerdings ein strenger Beweis zu w¨ unschen; ich habe indess die Aufsuchung desselben nach einigen fl¨ uchtigen vergeblichen Versuchen vorl¨ aufig bei Seite gelassen, da er f¨ ur den n¨ achsten Zweck meiner Untersuchung entbehrlich schien.
¨ Dass das Uberpr¨ ufen von (wie vielen auch immer) Beispielen eine Sache ist und ein allgemeiner Beweis eine andere, belegt folgende Tatsache. S¨amtliche Primzahltabellen st¨ utzen die These, dass stets Li(x) > π(x) ist. Aber schon 1914 konnte Littlewood beweisen, dass das nicht stimmt, denn er zeigte, dass Li(x) − π(x) unendlich oft das Vorzeichen wechselt! Heute weiß man, dass das zum ersten Mal nach 1016 und vor 10381 geschieht.
II.6
Aufgaben
Aufgabe II.6.1 Sei w ∈ C, w = 0. Zeige, dass es genau n komplexe Zahlen z1 , . . . , zn mit zkn = w gibt. Aufgabe II.6.2 Stimmt hier was nicht? −4 = 4 · (−1) = Aufgabe II.6.3 Zeige (a) sin z =
eiz − e−iz , 2i
√ √ √ √ √ 2i 8i = −2 −8 = (−2)(−8) = 16 = 4 cos z =
eiz + e−iz , 2
(b) sin(z1 + z2 ) = sin z1 cos z2 + cos z1 sin z2 , cos(z1 + z2 ) = cos z1 cos z2 − sin z1 sin z2 .
Hinweis: Verwende die Funktionalgleichung der Exponentialfunktion. Aufgabe II.6.4 Bestimme s¨ amtliche komplexen Nullstellen der Funktionen exp, sin und cos. (Verwende Aufgabe II.6.3.)
II.6
Aufgaben
121
Aufgabe II.6.5 Identit¨ tssatz f¨ ur Potenzreihen: Gegeben seien zwei Poa ∞ Beweise den ∞ k a (z − z ) und b (z − z0 )k mit positiven Konvergenzradien tenzreihen 0 k=0 k k=0 k R1 , R2 und eine Folge (zn )n∈N mit den Eigenschaften: (1) 0 < |zn − z0 | < min{R1 , R2 } f¨ ur alle n ∈ N, (2) lim zn = z0 , n→∞ ∞ ∞ bk (zn − z0 )k f¨ ur alle n ∈ N. ak (zn − z0 )k = (3) k=0
k=0
Dann ist
∀k ∈ N0 ,
a k = bk d.h. die Potenzreihen stimmen u ¨ berein.
Aufgabe II.6.6 (Wirtinger-Ableitungen) Sei f : G → C eine Funktion auf einer offenen Menge, die wir a ¨hnlich wie in Satz II.1.7 ˜ → C identifizieren. F˜ sei differenzierbar; dann heißen mit einer Funktion F˜ : G ∂f =
1 ˜ (Fx − iF˜y ), 2
∂f =
1 ˜ (Fx + iF˜y ) 2
die Wirtinger-Ableitungen von f ; statt ∂f schreibt man auch df /dz und statt ∂f schreibt man auch df /dz. (a) Berechne die Wirtinger-Ableitungen f¨ ur z → |z|2 als Funktionen von z. ur alle f . (b) Zeige ∂f = ∂f f¨ (c) f ist genau dann analytisch, wenn ∂f = 0.
Aufgabe II.6.7 (a) γ sei die Kurve in C, deren Spur das St¨ uck des Graphen der Normalparabel auft. Im z = (Re z)2 im Bereich −1 ≤ Re z ≤ 1 von −1 + i nach 1 + i durchl¨ Berechne (z − i) dz. γ
(b) Es sei γ1 die Strecke von 0 nach 1 + i und γ2 die Kurve aus den Strecken von 0 nach 1 und von dort nach 1 + i. Berechne Re z dz. Re z dz und γ2
γ1
∞
Aufgabe II.6.8 Betrachte die Potenzreihe P (z) = k=0 z k! . (a) Zeige, dass diese Reihe den Konvergenzradius 1 besitzt. (b) Zeige, dass sich die Reihe nicht u ¨ ber die Einheitskreisscheibe D = {z ∈ C: |z| < 1} fortsetzen l¨ asst, d.h. es gibt kein Gebiet G mit D G zusammen mit einer analytischen Funktion f : G → C mit f |D = P . Hinweis: F¨ ur (b) geht man wie folgt vor: Es wird gezeigt, dass f¨ ur alle p/q ∈ Q gilt limrր1 |P (re2πip/q )| = ∞ (warum ist P dann nicht fortsetzbar?). Hierzu zeigt man ucksichtigung zun¨ a chst, dass f¨ ur z = re2πip/q und alle k ≥ q stets z k! = r k! . Unter Ber¨ n k! k! r ≥ f¨ ur alle n ≥ q + 1 kommt man dann auf von ∞ k=q+1 k=q+1 r lim |P (re2πp/qi )| ≥ (n − q) − (q + 1) = n − 2q − 1
rր1
f¨ ur alle n ≥ q + 1, womit die Behauptung bewiesen w¨ are.
122
II.
Funktionentheorie
Aufgabe II.6.9 (a) β sei die Kurve, die einen Kreis mit Radius 1 um einen Mittelpunkt a ∈ C mit |a| > 1 genau einmal gegen den Uhrzeigersinn durchl¨ auft. Zeige mit Hilfe von Satz II.2.5, dass 1 dz = 0. β z (b) γ sei die Kurve, die den Einheitskreis um den Nullpunkt genau einmal gegen den Uhrzeigersinn durchl¨ auft. F : C \ Sp(γ) → C sei die Funktion 1 F (z) = dζ. ζ(ζ − z) γ Berechne dieses Integral und stelle damit die Funktion F ohne das Integralzeichen dar! Hinweis: F¨ ur (b) mache man eine Partialbruchzerlegung. Aufgabe II.6.10 Konstruiere explizit eine Homotopie in C \ {0} zwischen der Kurve, die den Rand des Einheitskreises einmal gegen den Uhrzeigersinn durchl¨ auft, und der Kurve, die den Rand des Einheitsquadrats einmal gegen den Uhrzeigersinn durchl¨ auft. Aufgabe II.6.11 Sei G ⊂ C ein einfach zusammenh¨ angendes Gebiet und f : G → C analytisch. Ist f (G) ebenfalls einfach zusammenh¨ angend? Aufgabe II.6.12 Sei γ eine geschlossene Kurve in einem Gebiet G. Zeige, dass γ in G zu einem geschlossenen Polygonzug homotop ist. ¨ Aufgabe II.6.13 Zeige die Aquivalenz folgender Aussagen: 2πit , 0 ≤ t ≤ 1, ist in C \ {0} nicht nullhomotop. (i) γ: t → e (ii) γ: t → e2πit , 0 ≤ t ≤ 1, ist in T := {z: |z| = 1} nicht nullhomotop. (iii) Es gibt keine stetige Retraktion von D := {z: |z| ≤ 1} auf T; d.h., es gibt keine ur alle z ∈ T. stetige Abbildung r: D → T mit r(z) = z f¨ (iv) Jede stetige Funktion f : D → D besitzt einen Fixpunkt; d.h., es existiert ζ ∈ D mit f (ζ) = ζ. Da nach dem Cauchyschen Integralsatz die Aussage (i) gilt, erh¨ alt man so einen Beweis von (iv) – dies ist der Brouwersche Fixpunktsatz im R2 (∼ = C). Er gilt analog im Rn , jedoch ben¨ otigt der Beweis andere Hilfsmittel; siehe Theorem IV.9.10. Aufgabe II.6.14 (Mittelwerteigenschaft analytischer Funktionen) Ist f analytisch in einem Gebiet G, so gilt f¨ ur jeden Punkt z0 ∈ G und jedes r > 0 derandig art, dass die abgeschlossene Kreisscheibe mit Mittelpunkt z0 und Radius r vollst¨ in G liegt: 2π 1 f (z0 ) = f (z0 + reiϕ ) dϕ, 2π 0 d.h. der Funktionswert von f im Mittelpunkt des Kreises ist der Mittelwert der Funktionswerte auf dem Kreisrand.
II.6
Aufgaben
123
Aufgabe II.6.15 (a) Es sei f eine ganze Funktion. Gibt es dann ein c > 0, ein r > 0 und ein n ∈ N0 derart, dass |f (z)| ≤ c|z|n
f¨ ur alle z mit |z| > r, so ist f ein Polynom h¨ ochstens n-ten Grades. Bemerkung und Hinweis: Ein Spezialfall dieser Aussage ist der Satz von Liouville, man erh¨ alt ihn im Fall n = 0. Der Beweis obiger Aussage kann analog zum Beweis dieses Satzes mit Hilfe von Lemma II.3.10 gef¨ uhrt werden. (b) Es sei f eine ganze, nicht konstante Funktion. Zeige, dass f (C) dicht in C liegt. Bemerkung: Es gilt sogar der Satz von Picard : f nimmt jeden Wert in C mit h¨ ochstens einer Ausnahme an. Dies soll hier aber nicht gezeigt werden. Was ist z.B. der Wertebereich der Exponentialfunktion?
Aufgabe II.6.16 (a) Es seien f eine ganze Funktion und z1 , z2 zwei verschiedene komplexe Zahlen, beide mit Betrag kleiner als R > 0. Berechne nun f¨ ur γr , den Kreis um den Nullpunkt mit Radius r > R (einmal gegen den Uhrzeigersinn durchlaufen), das Integral f (z) dz. (z − z γr 1 )(z − z2 ) (b) Verwende das Ergebnis aus Teil (a), um einen anderen Beweis f¨ ur den Satz von Liouville zu finden. Aufgabe II.6.17 (a) Beweise das Schwarzsche Lemma: Es sei D = {z ∈ C: |z| < 1} und f : D → D eine analytische Funktion mit f (0) = 0. Dann gilt |f (z)| ≤ |z| ∀z ∈ D.
ur ein z0 ∈ D \ {0} genau dann, wenn f (z) = Des weiteren ist |f (z0 )| = |z0 | f¨ ur ein ϕ ∈ R, d.h. wenn f eine Drehung der Einheitskreisscheibe um z · eiϕ f¨ den Nullpunkt ist. Hinweis: Betrachte g(z) = f (z)/z und wende das Maximumprinzip an. (b) Die bijektiven analytischen Funktionen f : D → D mit f (0) = 0 sind genau die Drehungen um den Nullpunkt. Benutze hierbei im Vorgriff die Tatsache, dass auch f −1 analytisch ist (vgl. Aufgabe II.6.36).
Aufgabe II.6.18 Es sei γ die Kurve, die durch die Parametrisierung γ(t) = (2 − cos t) · ei(
3π 2
sin t)
,
0 ≤ t ≤ 2π,
gegeben wird. (a) Berechne n(γ; 0), die Umlaufzahl von γ um den Nullpunkt. ur z0 ∈ {−2, 2, 4} anschau(b) Skizziere die Kurve γ. Welchen Wert hat n(γ; z0 ) f¨ lich? Aufgabe II.6.19 Beweise Satz II.3.24.
124
II.
Funktionentheorie
Aufgabe II.6.20 Sei G ein einfach zusammenh¨ angendes Gebiet. Finde alle analytiur alle z ∈ G. schen Funktionen f, g: G → C mit f 2 (z) + g 2 (z) = 1 f¨ Tipp: Gibt es einen Zweig von log(f + ig) auf G? Aufgabe II.6.21 Man bestimme die Nullstellen und deren Ordnungen f¨ ur die Funktionen f1 (z) = (z 4 − 4)(1 − ez ), f2 (z) = cos z 3 ,
f3 (z) = sin z 3 . Aufgabe II.6.22 Die Menge aller meromorphen Funktionen in einem Gebiet bildet einen K¨ orper. Aufgabe II.6.23 F¨ ur n ∈ N betrachten wir die in C meromorphe Funktion sin(πz) πz(1 − z)(1 − z2 )(1 − z3 ) · · · (1 −
f (z) =
z . ) n
aten. Sie hat offensichtlich in den Punkten zk = k, k = 0, 1, . . . , n, isolierte Singularit¨ Zeige: Die zk sind hebbare Singularit¨ aten mit lim f (z) =
z→zk
n k
∀k = 0, 1, . . . , n.
Aufgabe II.6.24 (a) Es seien a ∈ C und f : (C \ {a}) → C die analytische Funktion f (z) =
1 . a−z
Bestimme die Potenzreihenentwicklung von f um den Punkt z0 = a. Was ist ihr Konvergenzradius? Hinweis: Es ist f (z) =
1 1 1 1 = = . a−z a − z0 − (z − z0 ) a − z0 1 − z−z0 a−z 0
F¨ ur welche z kann man dies in eine geometrische Reihe entwickeln? (b) Die Funktion g sei in einer Umgebung von z0 ∈ C analytisch mit von 0 verschiedenen Funktionswerten. Dann ist 1 k (k ∈ N fest) fk (z) = g(z) ebenfalls in einer Umgebung von z0 analytisch. Die Potenzreihenentwicklung von f1 (z) = 1/g(z) um den Entwicklungspunkt z0 sei bekannt, etwa f1 (z) = ∞ m ur m=0 am (z −z0 ) . Bestimme hieraus die Potenzreihenentwicklung von fk f¨ k ≥ 2. Hinweis: Was ist die k-te Ableitung von f1 = 1/g?
II.6
Aufgaben
125
(c) Es sei f die in C meromorphe Funktion f (z) =
1 . (1 + z 2 )2
Wo sind die Polstellen von f ? Welche Ordnung haben sie? Bestimme die ur welche z konLaurent-Entwicklung von f im Entwicklungspunkt z0 = i. F¨ vergiert diese Reihe? Hinweis: Betrachte h(z) = (z − i)2 f (z) und verwende (a) und (b). Aufgabe II.6.25 Sei f durch f (z) = 1/ sin z definiert. Zeige, dass f in C meromorph ist, und bestimme s¨ amtliche Polstellen und deren Ordnungen. at f¨ ur die analytische Funktion Aufgabe II.6.26 Sei z0 eine wesentliche Singularit¨ f : C \ {z0 } → C. Zeige, dass es einen Wert w ∈ C gibt, den die Funktion f in ur jedes ε > 0 ist {z ∈ Uε (z0 ): jeder Umgebung von z0 unendlich oft annimmt; d.h. f¨ f (z) = w} eine unendliche Menge. Tipp: Satz von Baire (Theorem I.8.1). ankt. Dann ist f konstant. Aufgabe II.6.27 Sei f : C\{z0 } → C analytisch und beschr¨ Aufgabe II.6.28 (a) Sei f (z) =
∞
n=−m
cn (z − z0 )n ,
0 < |z − z0 | < R,
die Laurentreihe einer meromorphen Funktion f . Zeige 1 f (z) cn n(γ; z0 ) = dz 2πi γ (z − z0 )n+1
(II.43)
f¨ ur jede geschlossene Kurve γ mit z0 ∈ / Sp(γ). (b) Speziell sei z0 = 0, f (z) = 1/(z 2 + z). Berechne die cn gem¨ aß (II.43), falls γ der einmal entgegen dem Uhrzeigersinn durchlaufene Kreis mit Radius 1/2 bzw. 2 ist. Warum stimmen die Ergebnisse nicht u ¨ berein? Aufgabe II.6.29 Es sei R > 0 und f eine f¨ ur |z| < R analytische Funktion. F¨ ur r < R sei γr der Kreis mit Radius r um den Nullpunkt. z1 , . . . , zn seien n paarweise ur k = 1, . . . , n. Ferner seien verschiedene Punkte mit |zk | < r < R f¨ gn (z) =
n
(z − zk ),
k=1
P (z) =
1 2πi
γr
f (ζ) gn (ζ) − gn (z) dζ. gn (ζ) ζ−z
Man zeige: P ist ein Polynom mit grad P ≤ n − 1 und P (zk ) = f (zk ) f¨ ur k = 1, . . . , n. (Diese Polynome sind in der Numerik als Lagrange-Polynome bekannt.) Hinweis: Residuensatz.
126
II.
Funktionentheorie
Aufgabe II.6.30 Berechne die Integrale ∞ cos x dx, (a) 2 2 −∞ (x + 1) ∞ x dx (b) 4 +1 x 0 mit Methoden der Funktionentheorie. Geht es auch anders? Aufgabe II.6.31 Es sei R eine auf R beschr¨ ankte rationale Funktion mit xR(x) → 0 f¨ ur |x| → ∞. Schreibt man R als R(z) = p(z)/q(z) mit teilerfremden Polynomen p und q, so hat q also keine reellen Nullstellen, und der Grad von q ist um mindestens 2 ∞ gr¨ oßer als der von p. In diesem Falle existiert das uneigentliche Integral −∞ R(x) dx. Zeige, dass ∞ n res(R; ak ), R(x) dx = 2πi −∞
k=1
wobei a1 , . . . , an die Polstellen von R mit positivem Imagin¨ arteil sind. ugend groß), die aus der Hinweis: Wende den Residuensatz an f¨ ur die Kurve γr (r gen¨ Strecke von −r nach r und weiter aus dem Halbkreis von r nach −r mit Mittelpunkt 0 in der oberen Halbebene besteht. Aufgabe II.6.32 Berechne mit Hilfe von Aufgabe II.6.31 f¨ ur a, b > 0 das Integral ∞ 1 dx. 2 2 2 2 −∞ (x + a )(x + b ) Aufgabe II.6.33 (Satz von Hurwitz) Seien fn : G → C analytische Funktionen ohne Nullstellen auf einem Gebiet G. Die aßig gegen f . Folge (fn ) konvergiere auf kompakten Teilmengen von G gleichm¨ (a) Wenn f eine Nullstelle besitzt, ist f = 0. (b) Wenn alle fn injektiv sind, ist f entweder ebenfalls injektiv oder konstant. Aufgabe II.6.34 Zeige, dass s¨ amtliche L¨ osungen der Gleichung z 4 + 6z + 3 = 0 vom Betrag < 2 sind und genau eine L¨ osung vom Betrag < 1 ist. Hinweis: Satz von Rouch´e; vergleiche mit −z 4 bzw. −6z.
Aufgabe II.6.35 Es seien f, g: C → C analytisch mit f ◦g = 0. Wenn g nicht konstant ist, ist f = 0. Aufgabe II.6.36 Sei f : G → G′ eine bijektive analytische Funktion zwischen den Gebieten G und G′ . ur alle z ∈ G. (a) Es gilt f ′ (z) = 0 f¨ (b) Die Umkehrfunktion f −1 ist differenzierbar mit (f −1 )′ (w) =
1 f ′ f −1 (w)
∀w ∈ G′ .
II.6
Aufgaben
127
Aufgabe II.6.37 Es sei f im Gebiet G injektiv und analytisch; ferner liege der abgeschlossene Kreis Br (a) in G. (a) Zeige folgende Formel f¨ ur die Umkehrfunktion: 1 ζf ′ (ζ) f −1 (w) = dζ ∀w ∈ f Ur (a) . 2πi |ζ−a|=r f (ζ) − w (b) Schließe aus (a) erneut, dass f −1 analytisch ist mit 1 ζf ′ (ζ) (f −1 )′ (w) = dζ 2πi |ζ−a|=r f (ζ) − w 2
∀w ∈ f Ur (a) .
Aufgabe II.6.38 Sei f analytisch und injektiv auf einem Gebiet G. Ist γ: [−1, 1] → G eine Kurve mit γ ′ (0) = 0, so setze e(γ) = γ ′ (0)/|γ ′ (0)|. (a) F¨ ur solch ein γ ist auch e(f ◦ γ) wohldefiniert. (b) Sind γ1 und γ2 Kurven wie oben mit γ1 (0) = γ2 (0), so gilt e(γ1 )e(γ2 ) = e(f ◦ γ1 )e(f ◦ γ2 ). (c) Interpretiere (b) so, dass f das Gebiet G winkeltreu auf das Gebiet f (G) abbildet. Aufgabe II.6.39 Die Gammafunktion ist f¨ ur Re z > 0 durch ∞ tz−1 e−t dt Γ(z) = 0
erkl¨ art. (a) Zeige, dass Γ auf {z: Re z > 0} wohldefiniert und analytisch ist. (b) Es gilt Γ(z + 1) = zΓ(z) f¨ ur Re z > 0 und Γ(n) = (n − 1)! f¨ ur n ∈ N. (c) Die Gammafunktion kann zu einer meromorphen Funktion auf C fortgesetzt werden, die nur bei 0, −1, −2, . . . Pole hat. Diese sind einfach mit Residuum res(Γ; −k) = (−1)k /k!. [Benutze (b).] Aufgabe II.6.40 Eine Reihe der Form ∞ an nz n=1
heißt Dirichlet-Reihe. (a) Eine solche Reihe konvergiert entweder f¨ ur alle z ∈ C oder f¨ ur kein z ∈ C, oder es gibt eine Zahl σ ∈ R, so dass die Reihe f¨ ur Re z > σ absolut konvergiert und f¨ ur Re z < σ nicht absolut konvergiert (eventuell auch u ¨ berhaupt nicht). (b) Finde Beispiele f¨ ur jeden der drei F¨ alle. (c) Wenn die Reihe u ¨berall konvergiert, konvergiert sie auf ganz C absolut; in diesem Fall setze σ = −∞. (d) Die Reihe stellt eine auf {z: Re z > σ} analytische Funktion dar.
128
II.7
II.
Funktionentheorie
Literaturhinweise
Die meines Erachtens beste Einf¨ uhrung in die Funktionentheorie ist Kapitel 10 in ◮ W. Rudin: Real and Complex Analysis. 3. Auflage, McGraw-Hill, 1986.
Zwei schlanke einf¨ uhrende B¨ ucher sind ◮ K. J¨ anich: Einf¨ uhrung in die Funktionentheorie. 4. Auflage, Springer, 1996. ◮ G. Schmieder: Grundkurs Funktionentheorie. Teubner, 1993.
Außerdem enthalten viele mehrb¨ andige Analysislehrb¨ ucher Abschnitte zur Funktionentheorie, so z.B. ◮ H. Amann, J. Escher: Analysis II. Birkh¨ auser, 1999. ´: Grundz¨ uge der modernen Analysis. Band 1, 3. Auflage, Vieweg, ◮ J. Dieudonne 1985. ◮ K. Endl, W. Luh: Analysis III. 6. Auflage, Aula-Verlag, 1987.
Hier noch eine Liste weiterer Lehrb¨ ucher zur Funktionentheorie: ◮ J. Bak, D. J. Newman: Complex Analysis. 2. Auflage, Springer, 1997. ◮ J. B. Conway: Functions of One Complex Variable. 2. Auflage, Springer, 1978. ◮ W. Fischer, I. Lieb: Funktionentheorie. 6. Auflage, Vieweg, 1992. ◮ E. Freitag, R. Busam: Funktionentheorie. 3. Auflage, Springer, 2000. ◮ R. E. Greene, S. G. Krantz: Function Theory of One Complex Variable. Wiley, 1997. ◮ S. Lang: Complex Analysis. 4. Auflage, Springer, 1999. ◮ T. Needham: Visual Complex Analysis. Clarendon Press, 1997. ◮ R. Remmert: Funktionentheorie I. 4. Auflage, Springer, 1994.
Zum Primzahlsatz und zur Zetafunktion siehe zum Beispiel ◮ G. J. O. Jameson: The Prime Number Theorem. Cambridge University Press, 2003. ◮ H. M. Edwards: Riemann’s Zeta Function. Academic Press, 1974.
Dieses Buch enth¨ alt auch eine detaillierte Darstellung von Riemanns Arbeit.
Kapitel III
Gewo¨hnliche Differentialgleichungen
Unter einer Differentialgleichung versteht man – grob gesagt – eine Gleichung, in der Funktionen und ihre Ableitungen vorkommen. Handelt es sich um Funktionen einer reellen Ver¨ anderlichen, spricht man von gew¨ohnlichen Differentialgleichungen; handelt es sich um Funktionen mehrerer Ver¨anderlicher und kommen partielle Ableitungen vor, so spricht man von partiellen Differentialgleichungen. Standardbeispiele sind y ′ (t) = y(t) (gew¨ ohnliche Differentialgleichung) bzw. ∂ 2 u/∂x21 + ∂ 2 u/∂x22 = 0 (partielle Differentialgleichung). Traditionell wird die gesuchte Funktion in einer gew¨ohnlichen Differentialgleichung mit y bezeichnet, die unabh¨ angige Variable mit t oder x. Da in Anwendungen diese h¨ aufig die Dimension einer Zeit hat, wird in diesem Kapitel meistens t verwendet. Außerdem unterdr¨ uckt man in der Regel die unabh¨angige Variable, wenn sie nicht explizit auftaucht, schreibt also z.B. y ′ = t2 + y 2 statt y ′ (t) = t2 + y(t)2 . Pr¨ aziser ausgedr¨ uckt handelt es sich bei einer expliziten gew¨ohnlichen Differentialgleichung n-ter Ordnung um eine Gleichung der Form y (n) = f t, y, y ′ , . . . , y (n−1) ,
(III.1)
wo f eine auf einer Teilmenge G des Rn+1 definierte Funktion ist. Nur um solche Gleichungen bzw. Systeme solcher Gleichungen werden wir uns hier k¨ ummern. Eine implizite gew¨ ohnliche Differentialgleichung hat die Form F (t, y, y ′ , . . . , y (n) ) = 0. Man beachte, dass nach dieser Nomenklatur y ′ (t) = y(y(t)) oder y ′ (t) = y(t − 1) keine gew¨ ohnlichen Differentialgleichungen sind; solche Gleichungen sind als Funktional-Differentialgleichungen bekannt. Enth¨alt (III.1) die Variable t nicht explizit (wie z.B. y ′′ = y 2 − y ′ ), so heißt die Gleichung autonom. Um (III.1) zu l¨ osen, sind ein Intervall I ⊂ R und eine n-mal differenzierbare Funktion y: I → R mit t, y(t), y ′ (t), . . . , y (n−1) (t) ∈ G
∀t ∈ I
130
und
III.
Gew¨ ohnliche Differentialgleichungen
y (n) (t) = f t, y(t), y ′ (t), . . . , y (n−1) (t)
∀t ∈ I
anzugeben. (Offenbar ist die erste Bedingung notwendig, um die zweite u ¨ berhaupt formulieren zu k¨ onnen.) In diesem Kapitel wird nach einleitenden Beispielen ein grundlegender Existenzsatz bewiesen, dann werden Systeme linearer Differentialgleichungen analysiert, und am Schluss werfen wir einen Blick auf die qualitative Theorie nichtlinearer Systeme.
III.1
Beispiele und elementare L¨ osungsmethoden
Betrachten wir zun¨ achst einige Beispiele gew¨ ohnlicher Differentialgleichungen. Beispiel III.1.1 Sei ϕ: [a, b] → R stetig. Offensichtlich bedeutet das L¨osen der Differentialgleichung y ′ = ϕ(t), eine Stammfunktion von ϕ zu finden; deswegen wird das L¨ osen einer Differentialgleichung auch ihre Integration genannt. Diese Gleichung hat also die Form (III.1) mit n = 1, G = [a, b] × R ⊂ R2 und f (t, u) = ϕ(t). Ihre allgemeine L¨ osung hat die Form y(t) =
t
ϕ(s) ds + c, a
wo c ∈ R eine beliebige Konstante ist; die L¨ osung enth¨alt also eine freie Konstante und ist nicht eindeutig bestimmt. Betrachtet man jedoch das Anfangswertproblem y ′ = ϕ(t), y(a) = y0 , wo y0 ∈ R gegeben ist, so wird die L¨ osung eindeutig, n¨amlich y(t) =
t
ϕ(s) ds + y0 . a
Im weiteren werden wir es mit Anfangswertproblemen f¨ ur Differentialgleichungen n-ter Ordnung zu tun haben. Hierbei handelt es sich um eine Differentialgleichung (III.1) zusammen mit der Anfangsbedingung y(t0 ) = y0 , y ′ (t0 ) = y1 , . . . , y (n−1) (t0 ) = yn−1 ;
(III.2)
hier ist (t0 , y0 , . . . , yn−1 ) ∈ G. Unter einer L¨ osung des Anfangswertproblems versteht man eine L¨ osung der Differentialgleichung (III.1), die auch (III.2) erf¨ ullt.
III.1
Beispiele und elementare L¨ osungsmethoden
131
Beispiel III.1.2 Ein Auto verliert mit der Zeit an Wert, und zwar ein neues schneller als ein altes. Man kann annehmen, dass der Wertverlust pro Zeiteinheit zu jedem Zeitpunkt dem aktuellen Wert proportional ist, das heißt, bezeichnet y(t) den Wert zur Zeit t, so ¨ andert sich in der Zeitspanne ∆t der Wert um k y(t) ∆t: ∆y = k y(t) ∆t. (In unserem Beispiel ist k negativ, da ein Verlust symbolisiert werden soll.) ¨ Division durch ∆t und Ubergang zum Limes ∆t → 0 suggeriert, dass die zeitliche Entwicklung durch die Differentialgleichung y ′ = ky beschrieben wird. Zusammen mit der Angabe des Neuwerts y(0) = y0 erhalten wir ein typisches Anfangswertproblem 1. Ordnung (mit G = R2 und f (t, u) = ku). Um es zu l¨ osen, verwenden wir die folgende Physikermethode“ ” und erhalten nacheinander dy dy dy = ky = k dt (?!) = k dt log |y| = kt + c y′ = dt y y mit einer beliebigen Konstanten c und daher mit c1 = ±ec y = c1 ekt . Die Forderung y(0) = y0 f¨ uhrt zu c1 = y0 und daher zur L¨osung y(t) = y0 ekt . Nun war unsere Methode durchaus fragw¨ urdig, aber eine Probe zeigt, dass die obige Exponentialfunktion wirklich unser Anfangswertproblem l¨ost. Gibt es m¨ oglicherweise eine weitere L¨ osung y˜, die auch auf ganz R definiert ist? F¨ ur die Hilfsfunktion z(t) = y˜(t)/ekt , t ∈ R, gilt dann z ′ (t) =
y˜′ (t)ekt − y˜(t)kekt =0 e2kt
sowie z(0) = y0 , woraus z(t) = y0 f¨ ur alle t ∈ R folgt. Das heißt, das obige Anfangswertproblem ist eindeutig l¨ osbar. Mit derselben Differentialgleichung k¨ onnen diverse Zerfalls- (k < 0) sowie Wachstumsprozesse (k > 0) modelliert werden. Beispiel III.1.3 W¨ ahrend sich im letzten Beispiel f¨ ur Zerfallsprozesse (also ur k > 0 k < 0) die vern¨ unftige Konsequenz limt→∞ y(t) = 0 ergibt, erh¨alt man f¨
132
III.
Gew¨ ohnliche Differentialgleichungen
und y0 > 0 unbeschr¨ anktes Wachstum limt→∞ y(t) = ∞, was wegen der Beschr¨ anktheit der Ressourcen als nicht realistisch erscheint. Schreibt man k = γ − σ mit einer Geburtsrate γ > 0 und einer Sterberate σ > 0, so lautet die Differentialgleichung aus Beispiel III.1.2 y ′ = γy − σy. 1838 schlug Verhulst vor, stattdessen das Populationswachstum durch die Differentialgleichung y ′ = γy − σy 2 zu modellieren, in der er den Geburts- und Sterbeprozess unterschiedlich wichtete und die er logistische Differentialgleichung 1 nannte. Zur L¨osung verwenden wir die Methode von oben: dy dy dy = dt = dt = t + c, = γy − σy 2 dt γy − σy 2 γy − σy 2 also erh¨ alt man nach kurzer Rechnung y(t) =
γ . σ + σce−γt
Durch Probe best¨ atigt man, dass y(t) =
γ γ σ+ − σ e−γt y0
(III.3)
in der Tat das Anfangswertproblem y ′ = γy − σy 2 ,
y(0) = y0 (> 0)
l¨ ost; beachte limt→∞ y(t) = γ/σ, so dass die Population stabil wird. Mit Satz III.1.9 werden wir uns der M¨ uhe entheben, in diesem und ¨ahnlich gelagerten Beispielen stets die Probe machen zu m¨ ussen, da wir solch zweifelhafte Operationen wie Multiplikation mit dt vorgenommen haben. Dort wird gezeigt, dass (III.3) die einzige L¨ osung des Anfangswertproblems ist. Beispiel III.1.4 Betrachte f¨ ur a > 0 und y0 ≥ 0 das Anfangswertproblem √ y ′ = −a y,
y(0) = y0 ;
√ es liegt also die Form von (III.1) mit G = R × [0, ∞) und f (t, u) = −a u vor. Dieses Anfangswertproblem modelliert das Auslaufen einer Fl¨ ussigkeit aus einem zylindrischen Gef¨ aß: 1 Der Name hat weder etwas mit Logik noch mit Logistik zu tun; der Ursprung ist in dem franz¨ osischen Wort logis zu suchen.
III.1
Beispiele und elementare L¨ osungsmethoden
133
y
6 y0
0
................... ... ... ... ... ................................. . ........................... ............................ ........................... ....... .... ........... .................................. ... ... ...
Die Abnahme des Fl¨ ussigkeitsspiegels, also y ′ , ist, da die Fl¨ ussigkeit inkompressibel ist, der Auslaufgeschwindigkeit u proportional, die sich nach dem Energieerhaltungssatz berechnen l¨ asst. Mit den Bezeichnungen p = Druck, ρ = Dichte, m = Masse, g = Erdbeschleunigung, q = Querschnitt und V = Volumen erh¨alt man f¨ ur die potentielle Energie eines Probevolumens pq∆y = yρgq∆y = yρg∆V und f¨ ur die kinetische Energie m 2 1 u = ∆V ρu2 . 2 2 √ √ ′ Daraus folgt u = 2gy und deshalb y = −a y. Wir schreiben hier −a mit einer Konstanten a > 0; das Minuszeichen deutet an, dass es sich um eine Abnahme des Fl¨ ussigkeitsspiegels handelt. Die uns bekannte L¨ osungstechnik liefert hier als L¨osungsvorschlag √ a 2 y0 − t , y˜(t) = 2
jedoch w¨ are f¨ ur große t die Ableitung y˜′ (t) positiv, w¨ahrend die Differentialgleichung stets negative Werte verlangt. Daher modifizieren wir y˜ zu √ a 2 √ ur t ≤ a2 y0 , y0 − t f¨ y(t) = 2 √ 0 f¨ ur t > a2 y0 . (Skizze!) Der Fall y0 = 0 nimmt eine Sonderstellung ein: Neben der angegebenen ist auch y = 0 eine L¨ osung des Anfangswertproblems, das also nicht eindeutig l¨ osbar ist. (Wie ist diese Nichteindeutigkeit der L¨osung physikalisch zu erkl¨ aren?) Beispiel III.1.5 Die Differentialgleichung y′ = y2
134
III.
Gew¨ ohnliche Differentialgleichungen
wird, wie scharfes Hinsehen zeigt, von den Funktionen y(t) = −1/(t − c), c ∈ R beliebig, gel¨ ost. Es ist nicht schwer zu zeigen, dass es außer y = 0 keine weiteren L¨ osungen gibt (Aufgabe III.9.2). Dieses Beispiel zeigt, dass, obwohl die rechte Seite der Differentialgleichung (also f (t, u) = u2 ) auf ganz R2 definiert ist, es keine von 0 verschiedene L¨ osung gibt, die auf ganz R existiert. Beispiel III.1.6 Die bisher betrachteten Beispiele hatten gemeinsam, dass man die auftauchenden Differentialgleichungen geschlossen l¨osen konnte. Liouville hat jedoch 1841 gezeigt, dass die Differentialgleichung y ′ = t2 + y 2 2 nicht geschlossen gel¨ ost werden kann in demselben Sinn, wie e−x dx nicht geschlossen ausgef¨ uhrt werden kann. Es stellt sich daher die Frage, ob eine gegebene Differentialgleichung u ¨ berhaupt eine L¨osung besitzt und wie man sie erh¨ alt bzw. approximiert. Einen groben Anhaltspunkt, wie eine L¨osung aussehen k¨ onnte, liefert das Richtungsfeld der Differentialgleichung. Sei etwa y ′ = f (t, y) vorgelegt. Durch die Punkte der (t, y)-Ebene legt man kurze Strecken der Steigung f (t, y). Da eine L¨ osung der Differentialgleichung, die durch einen Punkt (t0 , y0 ) geht, dort die Steigung f (t0 , y0 ) hat, erh¨alt man so Aufschluss u ¨ber den Verlauf der L¨ osungen. 3
2
1
-3
-2
-1
1
2
3
-1
-2
-3
Abb. III.1. Richtungsfeld und einige L¨ osungen der Differentialgleichung y ′ = t2 + y 2
Beispiel III.1.7 Wir kn¨ upfen an die Beispiele III.1.2 und III.1.3 u ¨ ber Populationswachstum an; diesmal soll jedoch das Wachstum von zwei Populationen y1 und y2 betrachtet werden. Zum Beispiel ist an F¨ uchse und Hasen zu denken: W¨ urden F¨ uchse und Hasen friedlich koexistieren, k¨onnte man die Anzahl der
III.1
Beispiele und elementare L¨ osungsmethoden
135
F¨ uchse y1 und der Hasen y2 nach Beispiel III.1.2 durch L¨osen der Differentialgleichungen y1′ = −α1 y1 y2′ = α2 y2
finden. Hier sind α1 , α2 > 0, und das negative Vorzeichen in der ersten Gleichung deutet an, dass die Fuchspopulation auf sich gestellt zum Aussterben verurteilt ist, w¨ ahrend das positive Vorzeichen in der zweiten Gleichung Ausdruck der Tatsache ist, dass f¨ ur die Hasen gen¨ ugend Ressourcen (Kohl) vorhanden sind, was zum unbeschr¨ ankten exponentiellen Wachstum der Hasenpopulation f¨ uhrt. Nun sind viele F¨ uchse des Hasen Tod: F¨ uchse fressen Hasen und vermeiden so ihr Aussterben. Dadurch nimmt gleichzeitig die Anzahl der Hasen ab, was das Einf¨ ugen eines Korrekturterms in die obigen Gleichungen nahelegt, der proportional zu y1 y2 , also zur Anzahl der Begegnungen zwischen beiden Spezies, ist: y1′ = −α1 y1 + β1 y1 y2 y2′ = α2 y2 − β2 y1 y2
mit αi , βi > 0. Dieses sind die so genannten Lotka-Volterra-Gleichungen oder R¨auber-Beute-Gleichungen. Im allgemeinen besteht keine Chance, sie geschlossen zu l¨ osen. Jedoch ergeben sich hier typische Fragen qualitativer Natur, zum Beispiel, ob es Gleichgewichtszust¨ ande“ gibt, in denen die Zahl der F¨ uchse und ” der Hasen konstant bleibt. In diesem Fall m¨ usste y1′ = y2′ = 0 sein, was auf das Gleichungssystem 0 = −α1 y1 + β1 y1 y2 0 = α2 y2 − β2 y1 y2 f¨ uhrt, dessen nichttriviale L¨ osung durch y1 =
α2 , β2
y2 =
α1 β1
gegeben ist. Eine weitere typische Frage ist die nach der Existenz periodischer L¨osungen, ¨ die man aufgrund biologischer Uberlegungen erwarten w¨ urde (Vermehrung der F¨ uchse Abnahme der Hasen und damit tendenzielle Zerst¨orung der Existenzgrundlage der F¨ uchse Abnahme der F¨ uchse weniger nat¨ urliche Feinde f¨ ur die Hasen und damit deren Vermehrung Zunahme der F¨ uchse und da capo); dazu mehr in Abschnitt III.7. Betrachten wir die Lotka-Volterra-Gleichungen einstweilen von einem mathematisch-systematischen Standpunkt. Es handelt sich hier um ein Differential-
136
III.
Gew¨ ohnliche Differentialgleichungen
gleichungssystem 1. Ordnung. In Anlehnung an (III.1) kann das allgemeine System 1. Ordnung y1′ = f1 (t, y1 , . . . , yn ) .. . yn′ = fn (t, y1 , . . . , yn ) in einer Vektorgleichung als y ′ = f (t, y),
(III.4)
geschrieben werden, wo f : G (⊂ R × Rn = Rn+1 ) → Rn gegeben ist2 und y: I (⊂ R) → Rn gesucht wird; die Komponenten von f sind f1 , . . . , fn , und die von urlich so beschaffen sein, y sind y1 , . . . , yn . Das Existenzintervall muss dabei nat¨ dass (t, y(t)) ∈ G f¨ ur alle t ∈ I gilt. Im Beispiel der Lotka-Volterra-Gleichungen ist n = 2 und G = R3 sowie −α1 u1 + β1 u1 u2 f (t, u1 , u2 ) = . α2 u2 − β2 u1 u2 Es wird sich herausstellen, dass Gleichungen h¨oherer Ordnung stets auf Systeme 1. Ordnung zur¨ uckgef¨ uhrt werden k¨ onnen (siehe Seite 168), weswegen es reicht, Systeme zu studieren. Bei einem Anfangswertproblem wird zus¨atzlich zu (III.4) y(t0 ) = y0 zu gegebenen t0 ∈ R, y0 ∈ Rn mit (t0 , y0 ) ∈ G gefordert. Beispiel III.1.8 Als letztes Beispiel betrachten wir eine Gleichung 2. Ordnung, die Schwingungsgleichung. Wird eine Feder aus der Gleichgewichtslage ausgelenkt, so greift nach dem Hookeschen Gesetz eine R¨ uckstellkraft an, die der Auslenkung y proportional, aber entgegengesetzt ist. Diese beschleunigt eine Probemasse m gem¨ aß dem Newtonschen Kraftgesetz Kraft = Masse × Be” schleunigung“, was auf die Differentialgleichung (k > 0 die Federkonstante)
bzw. mit ω0 =
k/m
my ′′ = −ky y ′′ + ω02 y = 0
f¨ uhrt. Man sieht sofort, dass y1 (t) = sin ω0 t und y2 (t) = cos ω0 t die Gleichung l¨ osen; allgemeiner ist bei beliebigen c1 , c2 ∈ R auch c1 y1 + c2 y2 eine L¨osung, denn die linke Seite der Schwingungsgleichung h¨angt linear von y ab. Es seien 2 F¨ ur
Funktionen, die auf einer Teilmenge von Rn+1 = R × Rn erkl¨ art sind, werden wir in der Regel f (t, u) mit u ∈ Rn statt f (t, u1 , . . . , un ) schreiben; u wird als 2. Komponente“ des ” Arguments bezeichnet.
III.1
Beispiele und elementare L¨ osungsmethoden
137
nun Anfangsbedingungen, also eine Anfangsauslenkung s0 und eine Anfangsgeschwindigkeit v0 vorgelegt. Dann sind c1 und c2 so w¨ahlbar, dass das Anfangswertproblem y ′′ + ω02 y = 0,
y(t0 ) = s0 , y ′ (t0 ) = v0
(III.5)
l¨ osbar ist; wir m¨ ussen n¨ amlich nur erreichen, dass das lineare Gleichungssystem in c1 und c2 c1 sin ω0 t0 + c2 cos ω0 t0 = s0 c1 ω0 cos ω0 t0 − c2 ω0 sin ω0 t0 = v0 l¨osbar ist. Da die Determinante der das System regierenden Matrix −ω0 = 0 ist, existiert also genau eine L¨ osung von (III.5) der Form c1 y1 + c2 y2 ; dass es auch keine anderen L¨ osungen gibt, wird die allgemeine Theorie liefern (Satz III.6.5). Bei einer ged¨ ampften Schwingung m¨ ussen Reibungskr¨afte, die zur Geschwindigkeit proportional sind, ber¨ ucksichtigt werden. Im Newtonschen Kraftgesetz taucht dann auf der rechten Seite noch die Reibungskraft −ry ′ auf: my ′′ = −ry ′ − ky. Das f¨ uhrt mit 2p = r/m > 0 und ω0 = k/m auf das Anfangswertproblem y ′′ + 2py ′ + ω02 y = 0,
y(t0 ) = s0 , y ′ (t0 ) = v0 .
(Es wird sich als g¨ unstig erweisen, die Konstante bei y ′ als 2p statt p zu schreiben.) Nach etwas Bedenkzeit k¨ onnte man auf die Idee kommen, eine L¨osung als eωt mit passendem ω anzusetzen. Einsetzen in die Gleichung liefert ω 2 eωt + 2pωeωt + ω02 eωt = 0, d.h. ω 2 + 2pω + ω02 = 0. Wenn diese Gleichung zwei reelle L¨ osungen ω1/2 = −p ± man bei beliebigen c1 , c2 c1 e ω 1 t + c2 e ω 2 t
p2 − ω02 hat, kann
als L¨ osung ansetzen, analog dem unged¨ ampften Fall c1 und c2 den Anfangsbedingungen anpassen und auch die Eindeutigkeit der L¨osung beweisen. Da in diesem Fall, dem Fall starker D¨ ampfung p2 > ω02 , die ω1/2 < 0 sind, ist die ¨ L¨ osung stabil (limt→∞ y(t) = 0), in Ubereinstimmung mit der physikalischen Intuition. Der Fall p2 = ω02 , der in der Physik aperiodischer Grenzfall genannt wird, f¨ uhrt auf eine doppelte Nullstelle der Bestimmungsgleichung von ω und nimmt
138
III.
Gew¨ ohnliche Differentialgleichungen
eine Sonderstellung ein. Bis jetzt haben wir in diesem Fall nur eine einparametrige Schar von L¨ osungen, n¨ amlich ce−pt . Man sollte vermuten, dass sich noch eine zweite L¨ osung versteckt h¨ alt; wir werden in Satz III.6.4 sehen, wie man sie findet. Es bleibt der Fall p2 < ω02 , in welchem zwei konjugiert komplexe Nullstellen existieren. Mit ω := ω02 − p2 erhalten wir L¨ osungen als Linearkombinationen von e(−p+iω)t und e(−p−iω)t ; das sind jedoch komplexwertige Funktionen. Um reellwertige L¨ osungen zu erhalten, beachte man, dass Real- und Imagin¨arteil selbst wieder L¨ osungen sind, denn die Koeffizienten der Differentialgleichung sind reell. Das f¨ uhrt auf die zweiparametrige Schar reeller L¨osungen c1 e−pt sin ωt + c2 e−pt cos ωt;
(III.6)
wieder wird die allgemeine Theorie lehren, dass es keine weiteren L¨osungen gibt. Als n¨ achstes wird ein Satz formuliert, der das Vorgehen in den Beispielen III.1.2 und III.1.3 rechtfertigt. Dazu betrachten wir eine Differentialgleichung mit getrennten Ver¨anderlichen y ′ = g(y) · h(t). Die obigen Beispiele legen folgende L¨ osungsstrategie nahe: dy dy dy = g(y) · h(t) = h(t) dt = h(t) dt + c, dt g(y) g(y) und es bleibt, die linke Seite nach y aufzul¨ osen. Im folgenden Satz wird pr¨azisiert, wann dieses Verfahren wirklich gerechtfertigt ist. Satz III.1.9 Es seien I, J ⊂ R Intervalle, und h: I → R sowie g: J → R seien stetig. Es sei t0 ∈ I, und y0 sei ein innerer Punkt von J. (a) Falls g(y0 ) = 0, existiert eine Umgebung U von t0 , so dass das Anfangswertproblem y ′ = g(y) · h(t),
y(t0 ) = y0
auf I ∩ U eine eindeutig bestimmte L¨osung besitzt. Man erh¨alt sie durch Aufl¨osen von t y du h(s) ds = t0 y0 g(u) nach y. (b) Falls g(y0 ) = 0, g(y) = 0 f¨ ur 0 < |y − y0 | ≤ η und die (uneigentlichen) y y +η Integrale y00 g(u)−1 du sowie y00−η g(u)−1 du divergieren, ist y = y0 die eindeutig bestimmte L¨osung des Anfangswertproblems auf ganz I.
III.1
Beispiele und elementare L¨ osungsmethoden
139
Beweis. (a) Wir setzen
G(y) =
y y0
du , g(u)
H(t) =
t
h(s) ds.
t0
Da g stetig und g(y0 ) = 0 ist, ist G auf einem offenen Teilintervall J˜ um y0 wohldefiniert, n¨ amlich, wo g(y) = 0 ist. Da dort G′ (y) = 1/g(y) stets positiv oder stets negativ ist, ist G streng monoton, und die Umkehrfunktion Ginv : ˜ und J˜ und daher auch I˜ sind offen. Da G(J˜) =: I˜ → R existiert. Nun ist y0 ∈ J, ˜ existiert wegen der Stetigkeit von H eine Umgebung U H(t0 ) = 0 = G(y0 ) ∈ I, von t0 mit H(t) ∈ I˜ ∀t ∈ I ∩ U.
F¨ ur diese t ist y(t) := Ginv (H(t)) erkl¨ art, und nach Definition ist y ′ (t) = (Ginv )′ (H(t)) · H ′ (t) =
1 H ′ (t) = g(y(t)) · h(t) G′ (Ginv (H(t)))
sowie y(t0 ) = Ginv (0) = y0 . Damit ist eine L¨ osung des Anfangswertproblems gefunden. Wir zeigen jetzt, dass es keine weiteren L¨ osungen gibt. Sei z ebenfalls eine L¨osung; dann ist, sofern nur g(z(t)) = 0 ist (was in einer Umgebung von t0 sicher erf¨ ullt ist), z ′ (t) = h(t), g(z(t))
daher H(t) =
t
t0
inv
z ′ (s) ds = g(z(s))
z(t)
y0
du = G(z(t)), g(u)
weshalb z = G ◦ H = y folgt. (b) Wegen g(y0 ) = 0 ist die konstante Funktion y = y0 nat¨ urlich eine L¨osung des Anfangswertproblems. Nehmen wir an, es g¨ abe eine weitere nichtkonstante L¨ osung z. Ohne Einschr¨ ankung existiert dann eine Stelle t1 > t0 mit y1 := z(t1 ) > y0 . Damit ist z L¨ osung des Anfangswertproblems y ′ = g(y) · h(t),
y(t1 ) = y1 ,
und wegen g(y1 ) = 0 folgt aus der Eindeutigkeitsaussage in (a) t z(t) du = h(s) ds g(u) t1 y1
(III.7)
f¨ ur t > t∗ := sup{τ < t1 : z(τ ) = y0 }; f¨ ur diese t ist n¨amlich g(z(t)) = 0. Macht man den Grenz¨ ubergang t → t∗ in (III.7), so erh¨alt man im Widerspruch zur Voraussetzung, dass t1 y1 du = h(s) ds t∗ y0 g(u) existiert.
2
140
III.
Gew¨ ohnliche Differentialgleichungen
In Beispiel III.1.4 war ein Beispiel eines nicht eindeutig l¨osbaren Anfangswertproblems gegeben; in den Bezeichnungen von Satz III.1.9 war dort g(y) = √ √ η −a y, h(t) = 1 und y0 = 0, und das Integral 0 du/ u ist konvergent. In Beispiel III.1.2 osbarkeit beobachtet, was wegen der Di η hatten wir eindeutige L¨ vergenz von 0 du/u ein Spezialfall des Satzes ist. Man beachte, dass die Aussagen in (a) lokaler Natur sind: Existenz und Eindeutigkeit sind nur in einer Umgebung von t0 behauptet, nicht auf ganz I. Zur Best¨ atigung betrachte noch einmal die Beispiele III.1.4 mit dem Anfangswert y(−1) = 1 und III.1.5. In Satz III.1.9 ist es u ¨ brigens wesentlich, dass y0 ein innerer Punkt des Definitionsintervalls von g ist (wo wurde das im Beweis benutzt?); vgl. Aufgabe III.9.6. Eine Reihe von Differentialgleichungen kann auf Differentialgleichungen mit getrennten Ver¨ anderlichen zur¨ uckgef¨ uhrt werden; siehe Aufgabe III.9.10. Wir betrachten abschließend einen sehr wichtigen Typ einer Differentialgleichung 1. Ordnung, n¨ amlich eine lineare Differentialgleichung y ′ = a(t)y + b(t). Hier seien a und b stetige Funktionen auf einem Intervall I. In Analogie zu linearen Gleichungssystemen nennt man diese Differentialgleichung homogen, wenn b = 0 ist, andernfalls inhomogen. In Abschnitt III.4 und III.5 werden wir Systeme linearer Gleichungen im Detail studieren; die hier diskutierten Ergebnisse sind als Einstimmung auf die allgemeinen Resultate zu verstehen. Als Spezialfall von Satz III.1.9 erh¨ alt man sofort: Satz III.1.10 Sei I ein Intervall, die Funktion a: I → R sei stetig sowie t0 ∈ I. Dann ist das Anfangswertproblem y ′ = a(t)y,
y(t0 ) = y0
f¨ ur jedes y0 ∈ R eindeutig auf ganz I l¨osbar, und zwar ist t y(t) = y0 exp a(s) ds t0
diese L¨osung. Beachte, dass im linearen Fall die L¨ osung auf ganz I existiert und nicht bloß lokal. Betrachten wir nun das inhomogene Anfangswertproblem y ′ = a(t)y + b(t),
y(t0 ) = y0 .
Man l¨ ost es mit der genialen Idee der Variation der Konstanten. Die Idee ist, in der allgemeinen L¨ osung der homogenen Gleichung t A(t) y(t) = ce a(s) ds, , mit A(t) = t0
III.1
Beispiele und elementare L¨ osungsmethoden
141
die Konstante c durch eine Funktion t → c(t) zu ersetzen, um eine L¨osung der inhomogenen Gleichung zu erhalten. Wie m¨ usste so eine Funktion aussehen? Da dann y ′ (t) = c′ (t)eA(t) + c(t)A′ (t)eA(t) gilt, m¨ usste, damit y die inhomogene Differentialgleichung l¨ost, c die Gleichung c′ (t)eA(t) + c(t)A′ (t)eA(t) = a(t)c(t)eA(t) + b(t), also wegen A′ = a
c′ (t) = b(t)e−A(t)
erf¨ ullen, woraus durch Integration c sofort gefunden werden kann. Satz III.1.11 Sei I ein Intervall, a, b: I → R seien stetig, und es sei t0 ∈ I. Dann ist das Anfangswertproblem y ′ = a(t)y + b(t),
y(t0 ) = y0
f¨ ur jedes y0 ∈ R eindeutig auf ganz I l¨osbar, und zwar durch t −A(s) y(t) = b(s)e ds + y0 eA(t) , t0
wo A(t) =
t
t0
a(s) ds.
Beweis. Dass die genannte Funktion eine L¨ osung ist, folgt durch R¨ uckw¨artsrechnen aus der Vorbemerkung. Kommen wir zur Eindeutigkeit. Sei y˜ ebenfalls eine L¨ osung. Dann l¨ ost u := y − y˜ das homogene Anfangswertproblem u′ = a(t)u,
u(t0 ) = 0,
und aus Satz III.1.10 folgt u = 0 und deswegen y˜ = y.
2
Ist man an der allgemeinen L¨ osung der Differentialgleichung statt des Anfangswertproblems interessiert, die im allgemeinen eine freie Konstante enth¨alt, kann man die S¨ atze III.1.10 und III.1.11 auch so aussprechen: • Die allgemeine L¨ osung der homogenen linearen Differentialgleichung y ′ = a(t)y ist y(t) = ceA(t) , wo A eine Stammfunktion von a ist. • Da sich zwei L¨ osungen der inhomogenen linearen Differentialgleichung y ′ = a(t)y + b(t) nur um eine L¨ osung der homogenen Gleichung unterscheiden, ist ihre allgemeine L¨ osung y(t) = yp (t) + ceA(t) ,
142
III.
Gew¨ ohnliche Differentialgleichungen
wo yp irgendeine L¨ osung der inhomogenen Gleichung ist (eine so genannte partikul¨are L¨osung). Insbesondere ist yp (t) = C(t)eA(t) eine partikul¨ are L¨ osung, wo C eine Stammfunktion von be−A ist. Als Beispiel betrachten wir das Anfangswertproblem y ′ = 2ty + t3 ,
y(0) = 1.
Hier ist a(t) = 2t, b(t) = t3 . Die allgemeine L¨ osung der homogenen Gleichung t2 ist ce ; eine partikul¨ are L¨ osung der inhomogenen Gleichung ist 2
yp (t) = C(t)et , 2
wo C ′ (t) = t3 e−t . Partielle Integration liefert schnell C(t) = −
t2 + 1 −t2 e (+ const.), 2
so dass yp (t) = − 21 (t2 + 1) eine partikul¨ are L¨ osung ist. Damit erh¨alt man als allgemeine L¨ osung der inhomogenen Gleichung y(t) = −
2 t2 + 1 + cet . 2
Um das Anfangswertproblem zu l¨ osen, ist die Konstante c so zu w¨ahlen, dass y(0) = 1 gilt, d.h. c = 3/2. Es ist m¨ oglich, manche nichtlineare Gleichung in eine lineare zu transformieren. Betrachte etwa die logistische Differentialgleichung y ′ = γy − σy 2 aus Beispiel III.1.3. Ist y: I → R eine L¨ osung ohne Nullstellen, so gilt f¨ ur z = 1/y z′ =
−y ′ −γ + σ = −γz + σ. = y2 y
Ist umgekehrt z eine L¨ osung dieser inhomogenen linearen Differentialgleichung ohne Nullstellen, so definiert y = 1/z eine L¨ osung der logistischen Differentialgleichung.
III.2
Der Existenz- und Eindeutigkeitssatz von Picard-Lindelo ¨f
In diesem Abschnitt beweisen wir einen fundamentalen Satz u ¨ ber die eindeutige L¨ osbarkeit einer Klasse von Anfangswertproblemen. Es zeigt sich, dass die
III.2
Der Existenz- und Eindeutigkeitssatz von Picard-Lindel¨ of
143
L¨ osungstheorie f¨ ur Systeme im wesentlichen dieselbe ist wie f¨ ur eine einzelne Differentialgleichung. Wir betrachten daher ein System y ′ = f (t, y); wegen dieser kompakten Notation werden wir die Begriffe Differentialgleichung und System im weiteren synonym benutzen. Mit . bezeichnen wir die euklidische Norm des Rn . Im Prinzip ist die Wahl der Norm hier unerheblich, da je zwei Normen auf einem endlichdimensionalen Raum ¨ aquivalent sind; dies wird in Satz V.1.8 bewiesen. Um Systeme von Differentialgleichungen zu behandeln, m¨ ussen wir stetige vektorwertige Funktionen auf einem Intervall integrieren. Sei also ϕ: [a, b] → b Rn stetig mit den Komponentenfunktionen ϕ1 , . . . , ϕn ; wir definieren a ϕ(s) ds b b als den Vektor mit den Komponenten a ϕ1 (s) ds, . . . , a ϕn (s) ds. Wie bei der Integration komplexwertiger Funktionen in Abschnitt II.2 stellt man auch hier sofort fest, dass das vektorwertige Integral den u ¨blichen Regeln des RiemannIntegrals gehorcht (Linearit¨ at, Hauptsatz, etc.). Um die Dreiecksungleichung
a
b
ϕ(s) ds ≤
b
a
ϕ(s) ds
auf den eindimensionalen Fall zur¨ uckzuf¨ uhren, ist aber ein kleiner Trick n¨otig. b Setze x = a ϕ(s) ds und w¨ ahle eine orthogonale Matrix O, die x auf ein positives Vielfaches des ersten Einheitsvektors abbildet. Da das Integral komponentenweise erkl¨ art ist, gilt xe1 = Ox =
b
O(ϕ(s)) ds,
a
d.h., das Integral u ¨ ber die zweite bis n-te Komponente von Oϕ ist jeweils 0. Deshalb ist b x = Ox = O(ϕ(s)), e1 ds a b ≤ |O(ϕ(s)), e1 | ds ≤ =
a b
a b a
O(ϕ(s)) ds ϕ(s) ds,
was zu zeigen war. Das n¨ achste Lemma ist grundlegend f¨ ur den Beweis des folgenden Existenzsatzes.
144
III.
Gew¨ ohnliche Differentialgleichungen
Lemma III.2.1 Sei G ⊂ Rn+1 und sei f : G → Rn stetig. Ferner seien I ein Intervall und y: I → Rn sei eine Funktion mit (t, y(t)) ∈ G f¨ ur alle t ∈ I, und es seien t0 ∈ I, y0 ∈ Rn mit (t0 , y0 ) ∈ G. Dann sind folgende Bedingungen ¨aquivalent: (i) y ist differenzierbar und l¨ost das Anfangswertproblem y ′ = f (t, y),
y(t0 ) = y0 .
(ii) y ist stetig und l¨ost die Integralgleichung t f (s, y(s)) ds y(t) = y0 + t0
∀t ∈ I.
Beweis. (i) ⇒ (ii) folgt offensichtlich durch Integration; beachte, dass mit y und f auch s → f (s, y(s)) stetig und deshalb integrierbar ist (Beweis?). (ii) ⇒ (i): Klar ist y(t0 ) = y0 . Nach dem Hauptsatz der Differential- und Integralrechnung h¨ angt die rechte Seite in (ii) differenzierbar von t ab, und ihre Ableitung ist f (t, y(t)), denn der Integrand ist stetig, wie oben beobachtet. Das bedeutet, dass (i) gilt. 2 Der Vorteil von (ii) gegen¨ uber dem urspr¨ unglichen Anfangswertproblem liegt darin, dass die L¨ osung der Integralgleichung als Fixpunkt einer Abbildung erscheint, n¨ amlich der Abbildung T , die eine Funktion ϕ auf t f (s, ϕ(s)) ds (III.8) T ϕ: t → (T ϕ)(t) = y0 + t0
abbildet. Mit dieser Abbildung kann man (ii) einfach durch y = Ty wiedergeben. ¨ Uber die Existenz von Fixpunkten von Abbildungen gibt es eine F¨ ulle von Aussagen. Wir begn¨ ugen uns hier mit einem einfachen, aber sehr kraftvollen Fixpunktsatz. Theorem III.2.2 (Banachscher Fixpunktsatz) Es seien (M, d) ein vollst¨andiger metrischer Raum, T : M → M eine Abbildung ur alle n ∈ N und ∞ n=1 αn eine konvergente Reihe positiver Zahlen, so dass f¨ d(T n ϕ, T n ψ) ≤ αn d(ϕ, ψ)
∀ϕ, ψ ∈ M
gilt. Dann existiert genau ein Fixpunkt von T , d.h. es existiert genau ein ϕfix ∈ M mit T ϕfix = ϕfix ; ϕfix kann als Limes der Iterationsfolge ϕn+1 = T ϕn , n ≥ 0, bei beliebigem Startwert ϕ0 gewonnen werden. Ferner gilt die Fehlerabsch¨atzung d(ϕfix , ϕn ) ≤
∞
r=n
αr d(ϕ1 , ϕ0 ).
III.2
Der Existenz- und Eindeutigkeitssatz von Picard-Lindel¨ of
145
Beweis. Wir zeigen als erstes die Eindeutigkeit. Sind ϕ und ψ zwei Fixpunkte von T , so folgt wegen ϕ = T ϕ = T 2 ϕ = . . . , ψ = T ψ = T 2 ψ = . . . d(ϕ, ψ) = d(T n ϕ, T n ψ) ≤ αn d(ϕ, ψ) → 0 mit n → ∞, also ϕ = ψ. Nun zur Existenz eines Fixpunkts. Betrachten wir die Folge der Iterationen ϕn+1 = T ϕn mit beliebigem Startwert ϕ0 ∈ M . Es gilt nach der Dreiecksungleichung und nach Voraussetzung u ¨ ber T d(ϕn+k , ϕn ) ≤ ≤
k−1
d(ϕn+r+1 , ϕn+r ) =
r=0
k−1
k−1
d(T n+r ϕ1 , T n+r ϕ0 )
r=0
αn+r d(ϕ1 , ϕ0 ) =
n+k−1 r=n
r=0
αr d(ϕ1 , ϕ0 ) ≤ ε
bei beliebigem k, wenn nur n groß genug ist, denn r αr < ∞. Mithin ist (ϕn ) eine Cauchyfolge, und wegen der Vollst¨andigkeit von M existiert der Grenzwert ϕfix = limn→∞ ϕn . Nun gilt d(T ϕfix , ϕn+1 ) = d(T ϕfix , T ϕn ) ≤ α1 d(ϕfix , ϕn ) → 0 mit n → ∞, so dass T ϕfix = lim ϕn+1 = lim ϕn = ϕfix , n→∞
n→∞
und ϕfix ist wirklich ein Fixpunkt von T . Die Fehlerabsch¨ atzung ergibt sich sofort durch den Grenz¨ ubergang k → ∞ in der oberen Ungleichungskette. 2 Es ist klar, dass eine Abbildung, die die Voraussetzung des obigen Satzes erf¨ ullt, stetig ist; sie ist sogar Lipschitz-stetig. Die urspr¨ ungliche Version des Banachschen Fixpunktsatzes setzt d(T ϕ, T ψ) ≤ qd(ϕ, ψ)
∀ϕ, ψ ∈ M
f¨ ur ein geeignetes q < 1 voraus; offensichtlich ist diese Version ein Spezialfall von Theorem III.2.2, n¨ amlich mit αn = q n . Der Beweis der allgemeineren Version, die auf Weissinger zur¨ uckgeht, ist aber praktisch w¨ortlich derselbe wie in der traditionellen Variante. Im Gegensatz zu anderen Fixpunkts¨ atzen liefert der Banachsche Satz nicht nur die bloße Existenz eines Fixpunkts, sondern gleichzeitig ein konstruktives Verfahren, ihn zu bestimmen, n¨ amlich als Grenzwert der Iterationsfolge.
146
III.
Gew¨ ohnliche Differentialgleichungen
Die uns interessierenden vollst¨ andigen metrischen R¨aume werden in der Regel abgeschlossene Teilmengen des Banachraums3 C(I, Rn ) der stetigen Rn wertigen Funktionen auf einem kompakten Intervall I sein, der mit der Supremumsnorm ϕ∞ = sup ϕ(t) t∈I
versehen ist. Ist n¨ amlich M ⊂ C(I, Rn ) abgeschlossen, so ist der induzierte metrische Raum M vollst¨ andig: Sei dazu (ϕm ) eine Cauchyfolge in M ; dann kann man diese Folge nat¨ urlich auch als Cauchyfolge in C(I, Rn ) auffassen. Wegen der Vollst¨andigkeit dieses Raums existiert ϕ = limm ϕm in C(I, Rn ), und da M abgeschlossen ist, folgt ϕ ∈ M . Zur¨ uck zu unserem Anfangswertproblem, das mit Lemma III.2.1 auf das Fixpunktproblem T y = y reduziert ist (T wie in (III.8)). Wenn T auf einem vollst¨ andigen metrischen Raum M von Funktionen wie in Theorem III.2.2 operiert, ist also das Anfangswertproblem l¨ osbar. Die Existenz solcher R¨aume ist mit gewissen Eigenschaften von f verkn¨ upft, die wir jetzt einf¨ uhren. Definition III.2.3 Es sei G ⊂ Rn+1 , und f : G → Rn sei eine Funktion.
(a) f erf¨ ullt eine Lipschitzbedingung bzgl. der zweiten Komponente in G, falls es ein L ≥ 0 mit f (t, u) − f (t, v) ≤ Lu − v
∀(t, u), (t, v) ∈ G
gibt. Solch ein L heißt dann Lipschitzkonstante. (b) f erf¨ ullt eine lokale Lipschitzbedingung bzgl. der zweiten Komponente, falls es zu jedem (t0 , u0 ) ∈ G eine Umgebung U gibt, so dass f in U eine Lipschitzbedingung bzgl. der zweiten Komponente erf¨ ullt. Ein wichtiges Beispiel bilden die differenzierbaren Funktionen. Sei G offen, und f sei stetig differenzierbar. Zu (t0 , u0 ) ∈ G betrachte eine abgeschlossene Kugel U mit diesem Mittelpunkt, die in G liegt. In U erf¨ ullt f dann eine Lipschitzbedingung bzgl. der zweiten Komponente mit der Lipschitzkonstanten L = sup(t,u)∈U (gradu f )(t, u); hier bezeichnet gradu den Gradienten in Bezug auf die u-Komponenten. Das folgt aus dem Mittelwertsatz; es ist L < ∞, da U kompakt ist. Also erf¨ ullen stetig differenzierbare Funktionen eine lokale Lipschitzbedingung. Damit sind alle Vorbereitungen f¨ ur den Hauptsatz u ¨ ber gew¨ohnliche Differentialgleichungen 1. Ordnung getroffen. 3 Die
Vollst¨ andigkeit dieses Raums wird genauso wie im skalarwertigen Fall gezeigt; siehe Beispiel V.1(c). Ersatzweise kann man den vektorwertigen Fall durch Betrachtung der Koordinatenfunktionen einer Rn -wertigen Funktion auf den Fall des Raums C(I) zur¨ uckf¨ uhren.
III.2
Der Existenz- und Eindeutigkeitssatz von Picard-Lindel¨ of
147
Theorem III.2.4 (Existenz- und Eindeutigkeitssatz von Picard-Lindel¨of) Es sei G ⊂ Rn+1 offen, f : G → Rn sei stetig und erf¨ ulle eine lokale Lipschitzbedingung bzgl. der zweiten Komponente. Dann existiert zu jedem (t0 , y0 ) ∈ G ein Intervall I mit t0 ∈ int I, so dass das Anfangswertproblem y ′ = f (t, y),
y(t0 ) = y0
genau eine L¨osung auf I besitzt. Beweis. Gem¨ aß Lemma III.2.1 reicht es, einen Fixpunkt der durch T ϕ(t) = y0 +
t
f (s, ϕ(s)) ds
(III.9)
t0
definierten Abbildung zu finden, und das werden wir mit dem Banachschen Fixpunktsatz in Angriff nehmen. Bis jetzt haben wir den Definitionsbereich von T noch nicht spezifiziert, und das ist auch die eigentliche Schwierigkeit. Das folgende Verfahren f¨ uhrt zum Erfolg. Zun¨ achst w¨ ahlen wir ein kompaktes Rechteck“ ” R = {(t, u): |t − t0 | ≤ a, u − y0 ≤ b} ⊂ G, auf dem mit einem geeigneten L ≥ 0 f (t, u) − f (t, v) ≤ Lu − v gilt; das ist m¨ oglich wegen der lokalen Lipschitzbedingung. Alsdann setze K = sup f (t, u); (t,u)∈R
da f stetig und R kompakt ist, ist K < ∞. Nun definiere noch ! b" . α = min a, K
(Wir d¨ urfen K > 0 voraussetzen, da andernfalls die Behauptung des Theorems evident ist.) Schließlich sei I = [t0 − α, t0 + α] sowie M = {ϕ ∈ C(I, Rn ): ϕ(t) − y0 ≤ b ∀t ∈ I}. Wir u ufen nun, dass damit die Voraussetzungen des Banachschen Fix¨ berpr¨ punktsatzes erf¨ ullt sind. Zun¨ achst ist klar, dass M eine abgeschlossene Teilmenge des Banachraums C(I, Rn ) und damit ein vollst¨andiger metrischer Raum ist.
148
III.
Gew¨ ohnliche Differentialgleichungen
Als n¨ achstes zeigen wir, dass die in (III.9) definierte Abbildung T den Raum M in sich u uhrt; wir haben f¨ ur ϕ ∈ M also ¨ berf¨
t
f (s, ϕ(s)) ds ≤ b
t0
∀t ∈ I
zu zeigen. In der Tat gilt f¨ ur t ∈ I, t ≥ t0 ,
t
t0
f (s, ϕ(s)) ds ≤
t
t0
f (s, ϕ(s)) ds ≤ |t − t0 | · K ≤ αK ≤ b;
(III.10)
t und f¨ ur t < t0 geht es genauso mit t 0 . . . ds. atzen4 . Dazu zeigen wir induktiv Es bleibt, T mϕ − T m ψ∞ abzusch¨ T mϕ(t) − T m ψ(t) ≤
Lm |t − t0 |m · ϕ − ψ∞ m!
∀t ∈ I,
was dann mit αm = Lm αm /m! T m ϕ − T m ψ∞ ≤ αm ϕ − ψ∞
impliziert, und wegen der Konvergenz der Exponentialreihe ist m αm < ∞. Um den Induktionsanfang m = 1 zu zeigen, sch¨ atzen wir dank der Lipschitzbedingung f¨ ur (ohne Einschr¨ ankung) t ≥ t0 T ϕ(t) − T ψ(t) ≤
t
t0
≤ L
f (s, ϕ(s)) − f (s, ψ(s)) ds t
t0
ϕ(s) − ψ(s) ds
≤ L · |t − t0 | · ϕ − ψ∞ ab; und f¨ ur den Induktionsschluss von m auf m + 1 erh¨alt man aus der Lipschitzbedingung wie oben und der Induktionsvoraussetzung T m+1ϕ(t) − T m+1 ψ(t) ≤ L ≤ L
t
t0 t t0
T m ϕ(s) − T m ψ(s) ds Lm |s − t0 |m ds ϕ − ψ∞ m!
Lm+1 |t − t0 |m+1 · ϕ − ψ∞ . = (m + 1)! 4 Der Index n ist bereits vergeben, da n die Dimension des Anfangswertproblems angibt. Daher benutzen wir jetzt m als Folgenindex.
III.2
Der Existenz- und Eindeutigkeitssatz von Picard-Lindel¨ of
149
Die Behauptung des Theorems folgt nun sofort aus dem Banachschen Fixpunktsatz, denn die Absch¨ atzung (III.10) zeigt, dass jede L¨osung des Anfangswertproblems, die auf I definiert ist, notwendig in M liegt. 2 Bemerkungen. (a) Es sei betont, dass der Satz von Picard-Lindel¨of nur die lokale L¨osbarkeit eines Anfangswertproblems garantiert; in der Tat braucht wie in Beispiel III.1.5 eine L¨ osung nicht auf ganz R zu existieren. Vergleiche jedoch Korollar III.2.7 zum globalen Verhalten von L¨ osungen. (b) Ohne die vorausgesetzte Lipschitzbedingung kann die Eindeutigkeit der L¨osung verletzt sein (siehe Beispiel III.1.4); man kann jedoch f¨ ur bloß stetige rechte Seiten f in der Differentialgleichung immer noch die Existenz einer L¨ osung zeigen (Existenzsatz von Peano). (c) Wie oben erkl¨ art, erf¨ ullen insbesondere stetig differenzierbare f die Voraussetzung von Theorem III.2.4. (d) Der Satz von Picard-Lindel¨ of er¨ offnet die M¨oglichkeit, die L¨osung eines Anfangswertproblems konstruktiv zu ermitteln: Man beginne mit einer beliebigen Funktion ϕ0 ∈ M (meistens der konstanten Funktion ϕ0 = y0 ) und berechne osung des Anfangswertproblems ergibt sich iterativ T ϕ0 , T 2 ϕ0 , T 3 ϕ0 etc. Die L¨ dann als gleichm¨ aßiger Limes dieser Folge; dank des Banachschen Fixpunktsatzes hat man auch eine Fehlerabsch¨ atzung in der Hand. Es ist instruktiv, dieses Verfahren mit dem eindimensionalen Anfangswertproblem y ′ = y,
y(0) = 1
durchzuf¨ uhren (Aufgabe III.9.12). Manchmal gelingt es, die globale eindeutige L¨osbarkeit zu zeigen. Satz III.2.5 Es sei G = I × Rn mit einem kompakten Intervall I, f : G → Rn sei stetig und erf¨ ulle eine Lipschitzbedingung bzgl. der zweiten Komponente in G. Dann ist f¨ ur jedes (t0 , y0 ) ∈ G das Anfangswertproblem y ′ = f (t, y),
y(t0 ) = y0
auf ganz I eindeutig l¨osbar. Beweis. Der Beweis ist eine Modifikation des Beweises von Theorem III.2.4. ¨ Diesmal kann man M = C(I, Rn ) w¨ ahlen; die Details seien zur Ubung u ¨berlassen. 2 Wir beschreiben jetzt das gr¨ oßte Intervall, auf dem die L¨osung eines Anfangswertproblems unter den Voraussetzungen des Satzes von Picard-Lindel¨of existiert.
150
III.
Gew¨ ohnliche Differentialgleichungen
Satz III.2.6 Es sei G ⊂ Rn+1 offen, und f : G → Rn sei stetig und erf¨ ulle eine lokale Lipschitzbedingung bzgl. des 2. Arguments. Es sei J die Menge aller Intervalle, auf denen das Anfangswertproblem y ′ = f (t, y), f (t0 ) = y0 eine L¨osung besitzt, sowie Imax = J∈J J. Dann ist Imax ein Intervall; setze a = inf Imax und b = sup Imax .
(a) Das obige Anfangswertproblem besitzt auf Imax genau eine L¨osung ymax , und Imax ist das gr¨oßte Intervall, auf dem eine L¨osung existiert. (b) Imax ist offen, d.h. a, b ∈ / Imax . (c) Es gilt (mindestens) eine der folgenden Aussagen (analoge Aussagen k¨onnen f¨ ur den linken Randpunkt getroffen werden): (1) b = ∞, (2) lim sup ymax (t) = ∞, t→b (3) lim inf dist (t, ymax (t)), ∂G = 0. t→b
Man nennt Imax das maximale Existenzintervall und ymax die maximale L¨osung des Anfangswertproblems. Die maximale L¨osung verl¨auft also nach links und rechts jeweils so weit, bis sie an ihre nat¨ urlichen“ Grenzen st¨oßt. ” Beweis. (a) ist eine direkte Konsequenz des Satzes von Picard-Lindel¨of; nat¨ urlich garantiert dieser Satz insbesondere, dass J = ∅ ist. are auch (b, ymax (b)) ∈ G, und das Anfangswert(b) W¨ are etwa b ∈ Imax , w¨ problem y ′ = f (t, y), y(b) = ymax (b) h¨ atte eine L¨osung auf einem Intervall I ′ um b. Da ymax und diese L¨ osung wegen der Eindeutigkeit auf I ′ ∩ Imax u ¨ berein′ stimmen, folgt Imax ∪ I ∈ J und damit der Widerspruch Imax ∪ I ′ ⊂ Imax . (c) Falls weder (1), (2) noch (3) zutreffen, liegt {(t, ymax (t)): t0 ≤ t < b} in einer kompakten Teilmenge K von G. Da nach Lemma III.2.1 ymax (t) = y0 +
t
t0
f (s, ymax (s)) ds
∀t0 ≤ t < b
und der Integrand beschr¨ ankt ist (denn die stetige Funktion f ist auf dem Kompaktum K beschr¨ ankt), existiert der Grenzwert limt→b ymax (t), und wiederum nach Lemma III.2.1 folgt b ∈ Imax im Widerspruch zu (b). 2 ulle eine lokale LipschitzKorollar III.2.7 Es sei f : Rn+1 → Rn stetig und erf¨ bedingung bzgl. des 2. Arguments. Falls ein M ≥ 0 existiert, so dass eine L¨osung des Anfangswertproblems y ′ = f (t, y), y(t0 ) = y0 auf welchem Intervall auch immer durch M beschr¨ankt ist, so ist die maximale L¨osung auf ganz R definiert. Beweis. Nach Voraussetzung scheiden (2) und (3) aus Bedingung (c) im letzten Satz aus. 2
III.3 Abh¨ angigkeit der L¨ osung von den Daten
III.3
151
Abh¨ angigkeit der Lo ¨sung von den Daten
Es seien y bzw. y˜ L¨ osungen der Anfangswertprobleme
bzw.
y ′ = f (t, y),
y(t0 ) = y0
y˜′ = f˜(t, y˜),
y˜(t0 ) = y˜0 ,
wobei f und f˜ sowie y0 und y˜0 sich wenig“ unterscheiden sollen. Von außer” ordentlicher praktischer Bedeutung ist dann das Problem, ob sich auch y und y˜ wenig“ unterscheiden (was wenig“ heißen soll, wird gleich pr¨azisiert). Man ” ” denke etwa daran, dass bei physikalischen Anwendungen f und y0 mit Messungenauigkeiten behaftet sind und daher von vornherein nur innerhalb einer Grauzone spezifiziert sind. Dass die L¨ osung tats¨ achlich stetig von den Daten abh¨angt, wird im n¨achsten Satz ausgesprochen. Dazu nehmen wir an, f sei in einem Rechteck R = {(t, u) ∈ Rn+1 : |t − t0 | ≤ a, u − y0 ≤ b} definiert und stetig und erf¨ ulle dort die Lipschitzbedingung f (t, u1 ) − f (t, u2 ) ≤ Lu1 − u2 . Setzen wir noch wie im Beweis des Satzes von Picard-Lindel¨of K = sup f (t, u),
α = min{a, b/K},
(t,u)∈R
I = [t0 − α, t0 + α],
so wissen wir bereits, dass es genau eine L¨ osung y des Anfangswertproblems y ′ = f (t, y),
y(t0 ) = y0
auf I gibt; ferner liegt diese in M = {ϕ ∈ C(I, Rn ): ϕ(t) − y0 ≤ b ∀t ∈ I}.
Des weiteren nehmen wir an, f˜: R → Rn sei stetig und y˜ sei eine L¨osung des Anfangswertproblems y˜′ = f˜(t, y˜),
y˜(t0 ) = y˜0
auf einem kompakten Intervall I˜ ⊂ I, deren Graph in R liegt. Unter diesen Voraussetzungen gilt der folgende Satz. Satz III.3.1 Wenn y0 − y˜0 ≤ δ1 und sup(t,u)∈R f (t, u) − f˜(t, u) ≤ δ2 ist, gilt die Absch¨atzung y(t) − y˜(t) ≤ ˜ f¨ ur alle t ∈ I.
δ2 L|t−t0 | (e − 1) + δ1 eL|t−t0 | L
152
III.
Gew¨ ohnliche Differentialgleichungen
Die L¨ osungen y und y˜ unterscheiden sich also auf einem kompakten Intervall beliebig wenig, wenn nur f und f˜ sowie y0 und y˜0 hinreichend benachbart sind. Beweis. Wir setzen y˜ zu einer auf I definierten stetigen Funktion ϕ0 fort, so dass ϕ0 ∈ M gilt. Definiert man mit dem auf M erkl¨arten Operator t f (s, ϕ(s)) ds (T ϕ)(t) = y0 + t0
die Folge der sukzessiven Approximationen ϕ1 = T ϕ0 , ϕ2 = T ϕ1 , . . . , so konvergiert (ϕn ) gleichm¨ aßig gegen y, wie im Beweis des Satzes von PicardLindel¨ of gezeigt wurde. Die Behauptung des Satzes III.3.1 wird sich nun durch eine Absch¨ atzung des Fehlers ergeben. Zun¨ achst gilt f¨ ur t ∈ I˜ t f˜(s, y˜(s)) ds ϕ0 (t) = y˜(t) = y˜0 + t0
(Lemma III.2.1) sowie ϕ1 (t) = (T ϕ0 )(t) = y0 +
t
f (s, y˜(s)) ds.
t0
Es folgt t ϕ1 (t) − ϕ0 (t) ≤ δ1 + f (s, y˜(s)) − f˜(s, y˜(s)) ds t0
≤ δ1 + δ2 |t − t0 |,
da (s, y˜(s)) ∈ R. Induktiv ergibt sich daraus f¨ ur alle t ∈ I˜ ϕm (t) − ϕm−1 (t) ≤
(L|t − t0 |)m−1 δ2 (L|t − t0 |)m + δ1 ; L m! (m − 1)!
f¨ ur m = 1 zeigt das die obige Rechnung, und der Induktionsschritt von m auf m + 1 geht so: t f (s, ϕm (s)) − f (s, ϕm−1 (s)) ds ϕm+1 (t) − ϕm (t) = t
t0 f (s, ϕm (s)) − f (s, ϕm−1 (s)) ds ≤ t 0t ≤ Lϕm (s) − ϕm−1 (s) ds t0
III.4 Lineare Systeme
153
Lm−1 |t − t0 |m δ2 Lm |t − t0 |m+1 + Lδ1 L (m + 1)! m! m+1 (L|t − t0 |)m δ2 (L|t − t0 |) + δ1 . = L (m + 1)! m! ∞ Deshalb konvergiert die Teleskopreihe m=1 (ϕm − ϕm−1 ) auf I gleichm¨aßig ur t ∈ I˜ ist gegen limm ϕm − ϕ0 = y − ϕ0 , d.h. f¨ ≤ L
y(t) − y˜(t) = y(t) − ϕ0 (t) ∞ = (ϕm (t) − ϕm−1 (t)) m=1
≤ ≤ =
∞
m=1
ϕm (t) − ϕm−1 (t)
∞ ∞ (L|t − t0 |)m−1 δ2 (L|t − t0 |)m + δ1 L m=1 m! (m − 1)! m=1
δ2 L|t−t0 | (e − 1) + δ1 eL|t−t0 | , L
und der Satz ist bewiesen.
III.4
2
Lineare Systeme
Es seien I ⊂ R ein Intervall und A: t → (aij (t))i,j=1,...,n eine matrixwertige stetige Funktion auf I; also ist A: I → Rn×n aufzufassen. Unter einem linearen Differentialgleichungssystem verstehen wir ein solches der Form y ′ = A(t)y + b(t)
(III.11)
mit einer stetigen Funktion b: I → Rn . Ausf¨ uhrlich heißt das y1′ = a11 (t)y1 + · · · + a1n (t)yn + b1 (t) .. . yn′ = an1 (t)y1 + · · · + ann (t)yn + bn (t). Ist b = 0, nennt man das System wieder homogen, andernfalls inhomogen. Wir ben¨ otigen den Begriff der Norm einer Matrix. Das bedeutet bekanntlich folgendes: Ist . die euklidische Norm auf Rn (oder gar irgendeine Norm) und B eine n × n-Matrix, so setzt man B = sup Bx. x ≤1
154
III.
Gew¨ ohnliche Differentialgleichungen 2
Es ist nicht schwer zu sehen, dass B → B wirklich eine Norm auf Rn ist. Man beachte, dass das Symbol . jetzt sowohl die Norm des Rn als auch die daraus abgeleitete Matrixnorm des Rn×n bezeichnet5 . Zeigen wir noch, dass diese Matrixnorm zur euklidischen Norm des n2 2 dimensionalen Raums Rn , also zu B2 = (bij )2 =
n
i,j=1
2
|bij |
1/2
,
aquivalent ist in dem Sinn, dass ¨ 1 B2 ≤ B ≤ B2 n
∀B ∈ Rn×n .
(III.12)
Zun¨ achst gilt f¨ ur x ∈ Rn 2 n n n n n 2 2 2 Bx = bij xj ≤ |xj | = x2 B22 |bij | i=1 j=1
i=1
j=1
j=1
nach der Cauchy-Schwarz-Ungleichung; also folgt
B = sup Bx ≤ B2 . x ≤1
Umgekehrt ist, wieder nach der Cauchy-Schwarz-Ungleichung, |bij | = |Bej , ei | ≤ Bej ≤ B; daher B2 ≤ nB.
Wir bemerken noch, dass Rn×n unter der Matrixnorm6 vollst¨andig ist, denn wegen (III.12) ist eine Folge von Matrizen bzgl. . konvergent (bzw. eine Cauchyfolge) genau dann, wenn sie es bzgl. . 2 ist. (Die obigen Aussagen gelten analog f¨ ur Cn .) Es folgt aus der Definition der Matrixnorm f¨ ur Matrizen B1 und B2 B1 B2 ≤ B1 B2 sowie Bx ≤ B x
∀x ∈ Rn ;
das wird im folgenden benutzt werden. ¨ Uber die L¨ osbarkeit von (III.11) k¨ onnen wir nun folgenden Satz aussprechen. 5 Dieses
Vorgehen ist in der Funktionalanalysis u ¨blich, siehe Definition V.2.3. sind je zwei Normen auf einem endlichdimensionalen Raum ¨ aquivalent, und die assoziierten metrischen R¨ aume sind vollst¨ andig (Satz V.1.8). 6 Allgemein
III.4
Lineare Systeme
155
Satz III.4.1 Seien I ⊂ R ein Intervall, A: I → Rn×n und b: I → Rn stetige Funktionen; ferner seien t0 ∈ I und u0 ∈ Rn . Dann existiert genau eine L¨osung y: I → Rn des Anfangswertproblems y ′ = A(t)y + b(t),
y(t0 ) = u0 .
Beweis. F¨ ur ein kompaktes Intervall folgt das aus Satz III.2.5, da f (t, u) := A(t)u + b(t) auf I × Rn eine Lipschitzbedingung bzgl. u erf¨ ullt. Mit L := amlich supt∈I A(t) gilt n¨ f (t, u1 ) − f (t, u2 ) = A(t)(u1 − u2 ) ≤ A(t) u1 − u2 ≤ Lu1 − u2 ;
beachte, dass L < ∞ ist, weil A stetig und I kompakt ist. Sei nun I ein beliebiges Intervall. Sind I1 und I2 kompakte Teilintervalle, die t0 enthalten, so gibt es nach dem ersten Beweisteil eindeutig bestimmte L¨osungen y1 : I1 → Rn , y2 : I2 → Rn und y12 : I1 ∩ I2 → Rn unseres Anfangswertproblems. Wegen der Eindeutigkeit ist y1 |I1 ∩I2 = y12 = y2 |I1 ∩I2 . Schreibt man I als Vereinigung m Im kompakter Intervalle mit zugeh¨origen L¨osungen ym : Im → Rn , so wird durch y(t) = ym (t) falls t ∈ Im eine Funktion auf I wohldefiniert, die dann eindeutig bestimmte L¨osung des Anfangswertproblems auf ganz I ist. 2 Als n¨ achstes wenden wir uns einem genaueren Studium homogener linearer Systeme zu. Zuvor ein einfaches Lemma u ¨ ber matrixwertige Funktionen. Lemma III.4.2 Seien A, B: I → Rn×n und y: I → Rn differenzierbar. Dann sind auch AB: I → Rn×n und Ay: I → Rn differenzierbar mit (AB)′ = A′ B + AB ′ , (Ay)′ = A′ y + Ay ′ . Beweis. In der i-ten Zeile und k-ten Spalte der Produktmatrix AB steht cik = n j=1 aij bjk , Differentiation liefert c′ik =
n
(a′ij bjk + aij b′jk ).
j=1
Daraus ergibt sich die erste Behauptung, und die zweite zeigt man genauso. 2 F¨ ur ein homogenes System y ′ = A(t)y ist klar, dass mit zwei L¨osungen auch jede Linearkombination eine L¨ osung ist. Die Gesamtheit der L¨osungen bildet also einen Vektorraum. Genauer gilt:
156
III.
Gew¨ ohnliche Differentialgleichungen
Satz III.4.3 Sei I ⊂ R ein Intervall und A: I → Rn×n stetig. Sei V = {y: I → Rn : y ′ = A(t)y}. Dann ist V ein n-dimensionaler Vektorraum, und f¨ ur jedes t0 ∈ I ist die Abbildung ℓ: V → Rn , ℓ(y) = y(t0 ) linear und bijektiv, also ein Vektorraumisomorphismus. Beweis. Offenbar ist ℓ linear. Ferner ist ℓ injektiv nach der Eindeutigkeitsaussage aus Satz III.4.1, und ℓ ist surjektiv nach der Existenzaussage dieses Satzes. 2 Nach Satz III.4.3 kennt man alle L¨ osungen von y ′ = A(t)y, wenn man n linear unabh¨ angige L¨ osungen kennt, denn je n linear unabh¨angige Elemente eines n-dimensionalen Vektorraums bilden eine Basis. Definition III.4.4 Ein System {y (1) , . . . , y (n) } von n linear unabh¨angigen L¨osungen der Gleichung y ′ = A(t)y heißt ein Fundamentalsystem. Schreibt man die n Vektorfunktionen y (1) , . . . , y (n) als Spalten in eine Matrix Y , so nennt man Y eine Fundamentalmatrix. Fundamentalsysteme und -matrizen sind nat¨ urlich nicht eindeutig bestimmt. Eine Fundamentalmatrix ist jedoch ausgezeichnet: Bezeichnet n¨amlich e1 , . . . , en die kanonische Basis des Rn und x(i) die L¨ osung des Anfangswertproblems y ′ = A(t)y,
y(t0 ) = ei ,
also x(i) = ℓ−1 (ei ) in der Bezeichnung von Satz III.4.3, so sind nach Satz III.4.3 angig; die zugeh¨ orige Fundamentalmatrix werde mit die x(i) linear unabh¨ X = (x(1) , . . . , x(n) ) bezeichnet. Mit Hilfe von Fundamentalmatrizen l¨ asst sich die L¨osung eines Anfangswertproblems y(t0 ) = u y ′ = A(t)y, besonders elegant beschreiben. Bilden n¨ amlich y (1) , . . . , y (n) die Spalten einer Fundamentalmatrix Y , so hat die L¨ osung y des Anfangswertproblems die Gestalt y=
n
ci y (i)
i=1
mit passenden ci . Schreiben wir diese in einen Spaltenvektor c, so nimmt die letzte Gleichung die Form y =Yc
III.4
Lineare Systeme
157
an. Der Vektor c muss so gew¨ ahlt werden, dass Y (t0 )c = y(t0 ) = u gilt, also c = Y (t0 )−1 u; beachte, dass Y (t0 ) nach Satz III.4.3 invertierbar ist. Arbeitet man mit der kanonischen“ Fundamentalmatrix X, so ist X(t0 ) die Einheitsmatrix. ” Zusammengefasst erh¨ alt man mit diesen Bezeichnungen: Satz III.4.5 Die L¨osung des Anfangswertproblems y ′ = A(t)y, y(t0 ) = u lautet y(t) = Y (t)Y (t0 )−1 u = X(t)u. Dieser Satz macht die Notwendigkeit eines Kriteriums deutlich, das entscheidet, ob n L¨ osungen von y ′ = A(t)y linear unabh¨angig sind. Aus der Tatsache, dass bei beliebigem t0 die Abbildung ℓ aus Satz III.4.3 ein Vektorraumisomorphismus ist, ergibt sich sofort das folgende Lemma. Lemma III.4.6 F¨ ur n L¨osungen y (1) , . . . , y (n) von y ′ = A(t)y sind ¨aquivalent: (1) (n) (i) y , . . . , y sind linear unabh¨angig. (ii) Es existiert ein t0 ∈ I, so dass y (1) (t0 ), . . . , y (n) (t0 ) linear unabh¨angig sind. (iii) F¨ ur alle t0 ∈ I sind y (1) (t0 ), . . . , y (n) (t0 ) linear unabh¨angig. Man ordnet n L¨ osungen y (1) , . . . , y (n) die Determinante W der Matrix Y = (n) (y . . . y ) zu, die so genannte Wronskideterminante. Aus Lemma III.4.6 folgt dann: (1)
Korollar III.4.7 Es ist W (t0 ) = 0 f¨ ur alle t0 ∈ I genau dann, wenn es ein t0 ∈ I mit W (t0 ) = 0 gibt. In diesem Fall ist Y eine Fundamentalmatrix. Leider gibt es keine allgemein einsetzbaren Algorithmen zur konkreten Bestimmung eines Fundamentalsystems; vgl. jedoch Aufgabe III.9.19. Betrachten wir nun das inhomogene System y ′ = A(t)y + b(t).
(III.13)
Genau wie im Fall n = 1 (vgl. Seite 141) gilt auch hier allgemeine L¨osung ” der inhomogenen Gleichung = allgemeine L¨ osung der homogenen Gleichung + partikul¨ are L¨ osung der inhomogenen Gleichung“, und eine partikul¨are L¨osung kann man sich mit der Methode der Variation der Konstanten beschaffen. Das geht so. Ist Y eine Fundamentalmatrix des homogenen Systems, so lautet die allgemeine L¨ osung von y ′ = A(t)y ja y = Y c mit c ∈ Rn . Wir werden wie im eindimensionalen Fall den Vektor c durch eine passende vektorwertige Funktion t → c(t) ersetzen, um eine L¨ osung von (III.13) zu erhalten. Damit das klappt, muss f¨ ur c die Gleichung A(t)Y (t)c + b(t) = Y ′ (t)c + Y (t)c′
158
III.
Gew¨ ohnliche Differentialgleichungen
erf¨ ullt sein (und umgekehrt), also wegen Y ′ = AY b(t) = Y (t)c′ gelten. Da Y eine Fundamentalmatrix ist, sind alle Y (t) nach Lemma III.4.6 invertierbar; man w¨ ahle also t Y (s)−1 b(s) ds. c(t) = t0
Damit ist der folgende Satz bewiesen. Satz III.4.8 Seien A: I → Rn×n und b: I → Rn stetig. Dann lautet die allgemeine L¨osung von y ′ = A(t)y + b(t) y(t) = Y (t)c + Y (t)
t
Y (s)−1 b(s) ds,
t0
wo Y eine Fundamentalmatrix des homogenen Systems, t0 ∈ I und c ∈ Rn ist. Will man den Anfangswert y(t0 ) = u erreichen, ist c = Y (t0 )−1 u zu w¨ahlen.
III.5
Systeme mit konstanten Koeffizienten
Wir behandeln jetzt den Spezialfall eines linearen Systems, in dem die Matrix A nicht zeitabh¨ angig, also konstant ist. Es wird sich zeigen, dass man jetzt sinnvollerweise auch komplexe Matrizen und Cn -wertige L¨osungen zulassen sollte. Diese Verallgemeinerung ber¨ uhrt den grundlegenden Existenzsatz III.4.1, der ja eine Folge des Satzes von Picard-Lindel¨ of ist, nicht, da letzterer genauso f¨ ur komplexwertige f zu beweisen ist. Wir notieren daher als Spezialfall von Satz III.4.1: Satz III.5.1 Ist I ein Intervall, b: I → Cn stetig, A ∈ Cn×n , t0 ∈ I und u ∈ Cn , so hat das Anfangswertproblem y ′ = Ay + b(t),
y(t0 ) = u
genau eine L¨osung y: I → Cn . Im Gegensatz zu den allgemeinen linearen Systemen aus dem letzten Abschnitt gelingt es hier jedoch, recht bequem ein Fundamentalsystem der homogenen Gleichung y ′ = Ay zu finden. Das soll jetzt beschrieben werden. In Anlehnung an den eindimensionalen Fall oder Beispiel III.1.8 machen wir den Ansatz y(t) = eλt v f¨ ur eine L¨ osung von y ′ = Ay. Das f¨ uhrt auf λeλt v = A(eλt v) = eλt Av
III.5
Systeme mit konstanten Koeffizienten
159
oder Av = λv. Der Exponentialansatz f¨ uhrt daher genau dann auf eine von 0 verschiedene L¨ osung des homogenen Systems, wenn v ein Eigenvektor der Matrix A zum Eigenwert λ ist. Besitzt Cn eine Basis aus Eigenvektoren v1 , . . . , vn von A (zu Eigenwerten λ1 , . . . , λn ), so sind nach Lemma III.4.6 (mit t0 = 0) die Funktionen t → eλ1 t v1 , . . . , eλn t vn linear unabh¨ angig, und ein Fundamentalsystem ist gefunden. (Dieser Fall tritt zum Beispiel dann auf, wenn die Matrix A normal ist.) Der Fall, wo ein k-facher Eigenwert keinen k-dimensionalen Eigenraum hat, ist komplizierter, und wir wollen ihn etwas systematischer angehen. Es sei ⎞ ⎛ λ1 ⎜ ⎟ .. A=⎝ ⎠ .
0
0
λn
eine Diagonalmatrix; also ist der j-te Einheitsvektor ej Eigenvektor zum Eigenwert λj . In diesem Fall lautet die oben gefundene Fundamentalmatrix ⎞ ⎛ λt e 1 ⎜ ⎟ .. Y (t) = ⎝ ⎠. .
0
0
eλn t
Mit etwas Phantasie l¨ asst sich Y (t) als etA denken. Die Idee ist nun, f¨ ur beliebige Matrizen A ∈ Cn×n eine Exponentialmatrix etA zu definieren, diese als Fundamentalmatrix zu erkennen und konkret zu beschreiben. Zuerst zur Definition. In Anlehnung an die Exponentialreihe f¨ ur Zahlen betrachten wir f¨ ur A ∈ Cn×n die Reihe ∞ Ak ; (III.14) k! k=0
0
hier ist A := E, die Einheitsmatrix. Es stellt sich sofort das Problem der Konvergenz dieser Reihe im mit einer Matrixnorm versehenen normierten Raum (Cn×n , . ). Zun¨achst ist klar, dass die Reihe absolut konvergiert: ∞ Ak k!
k=0
≤
∞ Ak = e A . k! k=0
Daher bilden die Partialsummen eine Cauchyfolge; f¨ ur N > M ergibt sich n¨ amlich aus der Dreiecksungleichung der Norm . N M Ak Ak − k! k! k=0
k=0
=
N
k=M+1
Ak k!
≤
N
k=M+1
Ak →0 k!
160
III.
Gew¨ ohnliche Differentialgleichungen
mit N, M → ∞. Da Cn×n in der Matrixnorm vollst¨andig ist, existiert die unendliche Reihe (III.14). Definition III.5.2 F¨ ur A ∈ Cn×n setze eA := exp(A) :=
∞ Ak k=0
k!
.
F¨ ur die n × n Nullmatrix O setze eO = E, die n × n Einheitsmatrix. Es ist im allgemeinen falsch, dass f¨ ur A = (aij ) auch eA = (eaij ) ist. Man u ur Diagonalmatrizen zutrifft (Auf¨berzeugt sich aber leicht, dass das f¨ gabe III.9.23). Die Matrix-Exponentiation hat einige Eigenschaften mit ihrem skalaren Gegenst¨ uck gemein. Lemma III.5.3 Seien A, B, C ∈ Cn×n . d (a) Es gilt etA = AetA . dt (b) Wenn A und B kommutieren, d.h. wenn AB = BA, ist eA+B = eA eB . (c) Die Matrix eA ist stets invertierbar, und (eA )−1 = e−A . (d) Ist C invertierbar, so gilt eCAC
−1
= CeA C −1 .
Dem Beweis sei ein weiteres Lemma vorausgeschickt. Lemma III.5.4 Die Abbildung (A, B) → AB von Cn×n × Cn×n nach Cn×n ist stetig. Beweis. Es gilt An Bn − AB = An Bn − ABn + ABn − AB ≤ An − A Bn + A Bn − B → 0, falls An → A und Bn → B.
2
Beweis von Lemma III.5.3. (a) Da der Satz u ¨ ber die Vertauschbarkeit von Differentiation und Summation f¨ ur Potenzreihen auch f¨ ur vektorwertige Reihen gilt, folgt d Ak k d Ak k d tA e = t = t dt dt k! dt k! ∞
∞
k=0
k=0
∞ ∞ Ak k−1 Ak k kt t = AetA . = =A k! k! k=1
k=0
III.5
Systeme mit konstanten Koeffizienten
161
(b) Es ist N N 2N N 1 k 1 l 1 1 k l A B = A B + k! l! k! l! s=0 k=0
s=N +1 k+l=s k,l≤N
k+l=s
l=0
1 1 k l A B k! l!
=: LN + RN . Der linke Summand wird umgeformt zu LN =
N s N 1 1 s! Ak B s−k = (A + B)s s! k!(s − k)! s! s=0 s=0 k=0
nach dem binomischen Satz, denn A und B kommutieren. Den rechten Summanden kann man gem¨ aß RN ≤
≤ =
2N
s=N +1 k+l=s k,l≤N 2N
s=N +1 2N
s=N +1
1 1 Ak Bl k! l!
s
s! 1 Ak Bs−k s! k!(s − k)! k=0
1 (A + B)s s!
absch¨ atzen. Es folgt RN → 0 und daher mit Lemma III.5.4 die Behauptung. (c) Aus (b) folgt eA e−A = e−A eA = eA−A = e0E = E, also (eA )−1 = e−A . (d) Mit Hilfe von Lemma III.5.4 schließt man eCAC
−1
=
∞ 1 (CAC −1 )k k!
k=0 ∞
1 (CAk C −1 ) k! k=0 ∞ 1 k A C −1 = CeA C −1 , = C k!
=
k=0
was zu zeigen war.
2
In Teil (b) ist die Voraussetzung AB = BA wesentlich, siehe Aufgabe III.9.24. Man erh¨ alt nun sofort:
162
III.
Gew¨ ohnliche Differentialgleichungen
Satz III.5.5 etA ist eine Fundamentalmatrix f¨ ur das System y ′ = Ay. Beweis. Nach Lemma III.5.3(a) sind die Spalten von etA L¨osungen von y ′ = Ay, und sie sind linear unabh¨ angig nach Lemma III.5.3(c); beachte noch Lemma III.4.6. 2 Um die Information, die dieser Satz enth¨ alt, praktisch verwertbar zu machen, sei an ein Ergebnis aus der Linearen Algebra erinnert. Es sei λ ein k-facher Eigenwert von A, also eine k-fache Nullstelle des charakteristischen Polynoms. Bekanntlich braucht der zugeh¨ orige Eigenraum ker(A − λE) im allgemeinen nicht k-dimensional zu sein; es kann zu wenige Eigenvektoren geben. Hingegen gilt stets7 dim ker(A − λE)k = k. Es folgt, dass es zu einer Matrix mit den paarweise verschiedenen Eigenwerten λ1 , . . . , λr und dem charakteristischem Polynom (λ1 − λ)k1 · · · (λr − λ)kr eine Basis v1 , . . . , vn von Cn gibt mit (A − λ1 E)k1 v1 = 0 .. . (A − λ1 E)k1 vk1 = 0
(A − λ2 E)k2 vk1 +1 = 0 .. . kr (A − λr E) vn = 0. (Die vj sind also verallgemeinerte Eigenvektoren.) Jedes w ∈ Cn kann daher eindeutig als w = w1 + · · · + wr ,
wo (A − λj E)kj wj = 0,
(III.15)
geschrieben werden. Versuchen wir nun, etA w auszuwerten. Mit den wj wie oben schreiben wir etA w =
r
etA wj .
j=1
Die Berechnung von etA wj ist nun besonders einfach; mit Hilfe von eαE = eα E und Lemma III.5.3(b) folgt n¨ amlich etA wj = etλj E+tA−tλj E wj = eλj t et(A−λj E) wj = e 7 Siehe
λj t
kj −1 ∞ 1 1 m m λj t t (A − λj E) wj = e tm (A − λj E)m wj ; m! m! m=0 m=0
etwa W. Klingenberg, P. Klein, Lineare Algebra, Band 2, B.I. 1972, § 31.
III.5
Systeme mit konstanten Koeffizienten
163
die unendliche Reihe bricht ab, da ja (A − λj E)kj wj = 0. Durchl¨auft wj den ur j = 1, . . . , r, erh¨alt man so n verallgemeinerten Eigenraum ker(A − λj E)kj f¨ linear unabh¨ angige L¨ osungen. Die allgemeine L¨osung hat dann die Gestalt r
eλj t Pj (t),
(III.16)
j=1
wo Pj ein Polynom vom Grad < kj mit Koeffizienten aus dem Raum Cn , also ein Cn -wertiges Polynom ist. F¨ ur die praktische L¨ osung eines Anfangswertproblems ist es umst¨andlich, erst die verallgemeinerten Eigenr¨ aume zu berechnen. Stattdessen sollte man versuchen, zun¨ achst in (III.16) die Koeffizienten des Polynoms durch die Differentialgleichung und die Anfangsbedingung direkt zu bestimmen. Dazu zwei Beispiele. Beispiele. (a) L¨ ose das Anfangswertproblem 3 −4 3 y, y(0) = . y ′ = Ay = 1 −1 1 Zuerst bestimmen wir die Eigenwerte von A. Das charakteristische Polynom ist det(A − λE) = λ2 − 2λ + 1; also ist λ1 = 1 ein doppelter Eigenwert, und k1 = 2. Der L¨osungsansatz (III.16) lautet daher a0 + a1 t t y(t) = e . b0 + b1 t
Setzt man den Ansatz in die Differentialgleichung ein, folgt nach kurzer Rechnung a1 a1 a0 − , b1 = . b0 = 2 4 2 Um a0 und a1 zu bestimmen, setzt man den L¨ osungsansatz in die Anfangsbedingung ein und erh¨ alt a0 = 3, a1 = 2. Damit lautet die L¨osung des Anfangswertproblems 3 + 2t y(t) = et . 1+t (b) L¨ ose das Anfangswertproblem ⎛ ⎞ −2 1 −2 y ′ = Ay = ⎝ 1 −2 2 ⎠ y, 3 −3 5
Das charakteristische Polynom von A ist
⎛ ⎞ 0 y(0) = ⎝ 1 ⎠ . 0
det(A − λE) = −λ3 + λ2 + 5λ + 3,
164
III.
Gew¨ ohnliche Differentialgleichungen
also ist λ1 = −1 ein doppelter Eigenwert (k1 = 2) und λ2 = 3 ein einfacher (k2 = 1). Der Ansatz (III.16) lautet daher ⎛
⎛ ⎞ ⎞ a0 + a1 t a y(t) = e−t ⎝ b0 + b1 t ⎠ + e3t ⎝ b ⎠ . c0 + c1 t c
Einsetzen in die Differentialgleichung liefert nach elementaren, aber etwas l¨anglichen Umformungen die allgemeine L¨ osung ⎛ ⎞ ⎛ ⎞ a0 a y(t) = e−t ⎝ a0 + 2c0 ⎠ + e3t ⎝ −a ⎠ , c0 −3a und Einsetzen der Anfangsbedingung liefert schließlich a = 1/4, a0 = −1/4, c0 = 3/4. Die L¨ osung des Anfangswertproblems ist demnach ⎛ ⎞ ⎛ ⎞ 1 1 1 −t ⎝ ⎠ 1 3t ⎝ 5 + e −1 ⎠ . y(t) = e 4 4 3 −3
¨ Ubrigens besitzt in diesem Beispiel der doppelte Eigenwert λ1 = −1 auch zwei linear unabh¨ angige Eigenvektoren, so dass die Methode von Seite 159 ebenfalls anwendbar ist. Gehen wir das Problem, etA zu bestimmen, nochmals an, diesmal von einem eher theoretischen als praktischen Standpunkt. Sei y eine L¨osung des Systems ullt z := Cy die Differeny ′ = Ay. Ist C eine beliebige invertierbare Matrix, so erf¨ tialgleichung z ′ = Bz mit B = CAC −1 . Die Idee ist nun, C so zu w¨ahlen, dass B m¨ oglichst einfache Gestalt hat und etB direkt abzulesen ist; man nimmt also eine Basistransformation vor. Ist etwa A normal, kann man B als Diagonalmatrix erhalten. Im allgemeinen, wenn es nicht gen¨ ugend Eigenvektoren gibt, zerf¨allt Cn in die verallgemeinerten Eigenr¨ aume Ej = ker(A− λj E)kj , siehe (III.15). Da die durch A dargestellte lineare Abbildung jedes Ej invariant l¨asst (Beweis?), wird sie in einer Basis aus verallgemeinerten Eigenvektoren in Blockdiagonalgestalt dargestellt: ⎞ ⎛ B1 ⎟ ⎜ .. ⎠ ⎝ .
0
0
Br
Die Lineare Algebra lehrt weiter8 , dass man in jedem Ej eine Basis w¨ahlen kann, so dass die lineare Abbildung, aufgefasst als Abbildung von Ej nach Ej , durch 8 Vgl.
Fußnote 7.
III.5
Systeme mit konstanten Koeffizienten
165
eine Matrix der Form ⎛
⎜ Block j = Bj = ⎝
0
Bj,1 ..
0
. Bj,sj
⎞ ⎟ ⎠
mit Unterbl¨ ocken der Gestalt (¨ uber der Hauptdiagonalen stehen Einsen, auf der Hauptdiagonalen λj und ansonsten nur Nullen)
Bj,k
⎛
⎞ λj 1 ⎜ ⎟ .. .. ⎜ ⎟ . . =⎜ ⎟ .. ⎝ . 1 ⎠ λj
0
(III.17)
0
dargestellt werden kann; hierbei ist die 1 × 1-Matrix (λj ) zugelassen. Insgesamt kann man A auf die Jordansche Normalform ⎞ ⎛ J1 ⎟ ⎜ .. B=⎝ ⎠ .
0
0
Jm
transformieren, wobei jeder Jordanblock“ die Gestalt (III.17) hat. ” Nun u ¨ berlegt man sich (Aufgabe III.9.23), dass dann etB durch ⎛
etJ1
⎜ etB = ⎝
..
0
0 . etJm
⎞ ⎟ ⎠
beschrieben wird, so dass es reicht, jeden Jordanblock zu exponentiieren. Schreibe dazu ⎛ ⎛ ⎞ ⎞ λj 1 0 1 ⎜ ⎜ .. .. ⎟ ⎟ .. .. ⎜ ⎜ ⎟ . . . . ⎟ J =⎜ ⎟ = λj E + N mit N = ⎜ ⎟. . . .. 1 ⎠ .. 1 ⎠ ⎝ ⎝ λj 0
0
0
0
Es ist dann
0
⎛
⎞ 0 0 1 ⎜ .. .. .. ⎟ ⎜ . . . ⎟ ⎜ 2 . .. 1 ⎟ N =⎜ ⎟ ⎜ ⎟ .. ⎝ . 0⎠ 0
0
0
166
III.
Gew¨ ohnliche Differentialgleichungen
etc.; die Einsen wandern nach rechts oben, bis N ν = 0 erreicht ist9 . Aus Lemma III.5.3(b) folgt daher ⎞ ⎛ 2 tν−1 λj t λj t λj t t λj t e e te . . . e ⎟ ⎜ 2 (ν − 1)! ⎟ ⎜ ν−2 ⎟ ⎜ t λj t ⎟ λj t λj t ⎜ e e te . . . ν−1 ⎟ ⎜ l t (ν − 2)! ⎟ ⎜ ν−3 etJ = eλj t etN = eλj t Nl = ⎜ ⎟ t λj t ⎟ λj t ⎜ l! e e . . . l=0 ⎟ ⎜ (ν − 3)! ⎟ ⎜ ⎟ ⎜ . .. .. ⎠ ⎝ . eλj t
0
alt man eine explizite Beschreibung der Setzt man diese Bl¨ ocke in etB ein, erh¨ Exponentialmatrix, falls B in Jordanscher Normalform vorliegt. Vermittelt C den Basiswechsel, so ist C −1 etB eine Fundamentalmatrix von y ′ = Ay. Es sei nicht verschwiegen, dass die praktische Berechnung der Jordanschen Normalform einer Matrix recht m¨ uhsam ist. Wir haben hier komplexe Matrizen diskutiert, um die Existenz von Eigenwerten garantieren zu k¨ onnen. Ist A eine reelle n × n-Matrix, so liefert die bisherige Theorie, wie man an n linear unabh¨ angige komplexwertige L¨osungen von aufig ist man aber, z.B. aus physikalischen Gr¨ unden, y ′ = Ay herankommt. H¨ daran interessiert, reellwertige L¨ osungen zu finden. Das geschieht so. Wir wissen bereits aus (III.16), dass jede komplexe L¨ osung von y ′ = Ay Linearkombination λt m von Funktionen des Typs e t v mit v ∈ Cn ist. Nun ist klar, dass jede komplexe L¨ osung y zwei reelle L¨ osungen, n¨ amlich Re y und Im y, induziert. Diese sind, wenn wir λ = α + iβ mit α, β ∈ R schreiben, Linearkombinationen von geeigneten eαt cos βt tm v1 , eαt sin βt tm v2 ¯ = α − iβ ein Eigenwert, und mit v1 , v2 ∈ Rn . Da A reell ist, ist mit λ auch λ ¯ m λt die komplexe L¨ osung e t v¯ f¨ uhrt zu denselben reellen L¨osungen. Damit erh¨alt man n linear unabh¨ angige reelle L¨ osungen. Zusammenfassend halten wir fest: Satz III.5.6 Sei A ∈ Cn×n . Das System y ′ = Ay besitzt ein Fundamentalsystem von L¨osungen der Form eλj t P0,j (t), . . . , eλj t Pkj −1,j (t), wo λj ein Eigenwert von A der Vielfachheit kj und Pl,j ein Polynom mit Koeffizienten in Cn vom Grad ≤ l ist. Ist A ∈ Rn×n , gibt es ein Fundamentalsystem reeller L¨osungen der Form eλj t P0,j (t), . . . , eλj t Pkj −1,j (t), 9 Man
sagt, die Matrix N ist nilpotent.
III.6 Lineare Differentialgleichungen h¨ oherer Ordnung
167
(λj ein reeller Eigenwert) bzw. eαj t cos βj t P0,j (t), eαj t sin βj t P˜0,j (t), . . . , eαj t cos βj t Pkj −1,j (t), eαj t sin βj t P˜kj −1,j (t) (λj = αj + iβj ein komplexer Eigenwert). Diesmal sind die Koeffizienten der Polynome in Rn . Besitzt A insgesamt n linear unabh¨angige Eigenvektoren v1 , . . . , vn zu nicht notwendig paarweise verschiedenen Eigenwerten λ1 , . . . , λn , so ist eλ1 t v1 , . . . , eλn t vn ein Fundamentalsystem; im reellen Fall sind davon Real- und Imagin¨arteil zu betrachten. Stets erh¨alt man eine Fundamentalmatrix durch Exponentiieren, n¨amlich etA . Diese ist leicht zu bestimmen, wenn A in Jordanscher Normalform vorliegt. Abschließend werfen wir einen Blick auf inhomogene Systeme. Als Spezialfall von Satz III.4.8 erh¨ alt man: Satz III.5.7 Die L¨osung von y ′ = Ay + b(t),
y(t0 ) = u
mit stetigem b lautet y(t) = e(t−t0 )A u +
t
e(t−s)A b(s) ds.
t0
Beweis. Es ist nur zu beachten, dass etA eine Fundamentalmatrix ist und dass man Matrizen unter ein vektorwertiges Integral ziehen darf. 2
III.6
Lineare Differentialgleichungen h¨ oherer Ordnung
Wir behandeln jetzt die allgemeine lineare Differentialgleichung n-ter Ordnung; sie hat die Form y (n) + an−1 (t)y (n−1) + · · · + a1 (t)y ′ + a0 (t)y = b(t)
(III.18)
mit stetigen Funktionen aj , b: I → R. Wieder nennen wir die Gleichung homogen, wenn b = 0 ist. F¨ ur das zugeh¨ orige Anfangswertproblem fordert man die Anfangsbedingung y(t0 ) = u1 , . . . , y (n−1) (t0 ) = un .
168
III.
Gew¨ ohnliche Differentialgleichungen
Solch eine Gleichung l¨ asst sich in ein a ¨quivalentes System 1. Ordnung transformieren; das gilt f¨ ur jede explizite gew¨ ohnliche Differentialgleichung n-ter Ordnung (III.1). Zu einer solchen Gleichung kann man n¨amlich das Differentialgleichungssystem y1′ = y2 y2′ = y3 .. . ′ yn = f (t, y1 , . . . , yn ) assoziieren, und wenn die Rn -wertige Funktion10 y mit den Komponenten y1 , . . . , yn dieses System l¨ ost, ist y1 eine L¨ osung von (III.1); man beachte y2 = y1′ , . . . , (n−1) yn = y1 . Ist umgekehrt y eine L¨ osung von (III.1), so ist die Vektorfunktion mit den Komponenten y, y ′ , . . . , y (n−1) eine L¨ osung des Systems. F¨ ur die lineare Gleichung (III.18) ist auch das assoziierte System linear, n¨amlich ⎛ ⎞ u1 ⎜ ⎟ y ′ = A(t)y + b(t), y(t0 ) = ⎝ ... ⎠ un
mit
⎛
⎜ ⎜ ⎜ A(t) = ⎜ ⎜ ⎝
0 0 .. .
1 0 .. .
0 1
... ...
0 0 .. .
0 0 0 ... 1 −a0 (t) −a1 (t) −a2 (t) . . . −an−1 (t)
⎞
⎟ ⎟ ⎟ ⎟, ⎟ ⎠
⎛
⎞ 0 ⎜ .. ⎟ ⎟ b(t) = ⎜ ⎜ . ⎟. ⎝ 0 ⎠ b(t)
Aus Satz III.4.1 ergibt sich daher folgender Existenz- und Eindeutigkeitssatz. Satz III.6.1 Seien a0 , . . . , an−1 , b: I → R stetig auf einem Intervall, u1 , . . . , un ∈ R und t0 ∈ I. Dann besitzt das Anfangswertproblem y (n) + an−1 (t)y (n−1) + · · · + a1 (t)y ′ + a0 (t)y = b(t), y(t0 ) = u1 , . . . , y (n−1) (t0 ) = un genau eine L¨osung y: I → R. Da eine Linearkombination von L¨ osungen der homogenen Gleichung selbst eine L¨ osung ist, bildet die Gesamtheit ihrer L¨ osungen einen Vektorraum. Genauer gilt: 10 In
diesem Abschnitt sollen Vektorfunktionen mit einem Pfeil gekennzeichnet werden.
III.6
Lineare Differentialgleichungen h¨ oherer Ordnung
169
Satz III.6.2 Unter den Voraussetzungen von Satz III.6.1 ist V := {y: I → R: y (n) + an−1 (t)y (n−1) + · · · + a1 (t)y ′ + a0 (t)y = 0} ein n-dimensionaler Vektorraum. F¨ ur jedes t0 ∈ I ist ⎛ y(t0 ) ⎜ .. n ℓ: V → R , ℓ(y) = ⎝ .
die Abbildung ⎞
y (n−1) (t0 )
linear und bijektiv, also ein Vektorraumisomorphismus.
⎟ ⎠
Beweis. W¨ ortlich wie bei Satz III.4.3!
2
Wie in Abschnitt III.4 nennen wir n linear unabh¨angige L¨osungen der homogenen Gleichung ein Fundamentalsystem; diese Funktionen bilden dann eine Basis von V . (Diesmal handelt es sich um n skalarwertige Funktionen.) Ist y1 , . . . , yn ein Fundamentalsystem der homogenen Gleichung, so ist y1 , . . . , yn mit ⎞ ⎛ yj ⎜ yj′ ⎟ ⎟ ⎜ yj = ⎜ .. ⎟ ⎝ . ⎠ (n−1)
yj
ein Fundamentalsystem des entsprechenden Systems y ′ = A(t)y . F¨ ur die inhomogene Gleichung gilt auch hier allgemeine L¨osung der inhomo” genen Gleichung = allgemeine L¨ osung der homogenen Gleichung + partikul¨are L¨ osung der inhomogenen Gleichung“, und eine partikul¨are L¨osung erh¨alt man – wie gehabt – mit der Methode der Variation der Konstanten. Geht man zum assoziierten inhomogenen System y ′ = A(t)y + b(t) u alt man eine partikul¨ are L¨ osung gem¨aß Satz III.4.8 in der Form ¨ ber, so erh¨ t (III.19) Y (t) Y (s)−1b(s) ds, t0
wovon die erste Komponente unsere inhomogene Differentialgleichung l¨ost. Der Term (III.19) kann jetzt weiter ausgewertet werden. Schreiben wir dazu a(t) = Y (t)−1b(t), so l¨ ost a(t) nach Konstruktion das lineare Gleichungssystem Y (t)a(t) = b(t). Daher ist nach der Cramerschen Regel die j-te Komponente aj =
Vj , W
170
III.
Gew¨ ohnliche Differentialgleichungen
wo W = det Y = det(y1 . . . yn ) die Wronskideterminante und Vj = det(y1 . . . yj−1 b yj+1 . . . yn ) ist. Das Entwickeln von Vj nach der j-ten Spalte ist wegen der speziellen Gestalt von b besonders einfach. Mit ⎞ ⎛ y1 . . . yj−1 yj+1 . . . yn .. .. .. ⎟ ⎜ . Wj = det ⎝ .. . . . ⎠, (n−2)
y1
(n−2)
. . . yj−1
(n−2)
(n−2)
. . . yn
yj+1
der Determinante der entstehenden (n − 1) × (n − 1)-Streichungsmatrix, gilt n¨amlich Wj . aj = (−1)j+n b W Daher ist (III.19) dasselbe wie
Y (t)
t
(−1)n
t0
und die erste Komponente z(t) =
n
⎛
b(s) ⎜ ⎜ ⎜ W (s) ⎝
j+n
(−1)
(−1)n Wn (s)
yj (t)
j=1
⎞
−W1 (s) +W2 (s) .. .
t t0
⎟ ⎟ ⎟ ds, ⎠
(III.20)
b(s) Wj (s) ds W (s)
ist eine partikul¨ are L¨ osung unserer inhomogenen Gleichung. Im Fall n = 2 reduziert sich diese Formel wegen W1 = y2 und W2 = y1 auf z(t) = −y1 (t)
t t0
b(s) y2 (s) ds + y2 (t) W (s)
t
b(s) y1 (s) ds. W (s)
t0
(III.21)
Insgesamt erh¨ alt man: Satz III.6.3 Die allgemeine L¨osung von y (n) + an−1 (t)y (n−1) + · · · + a1 (t)y ′ + a0 (t)y = b(t) lautet, wenn {y1 , . . . , yn } ein Fundamentalsystem der homogenen Gleichung ist, y(t) =
n j=1
cj yj (t) +
n j=1
(−1)j+n yj (t)
t
t0
b(s) Wj (s) ds. W (s)
III.6
Lineare Differentialgleichungen h¨ oherer Ordnung
171
Wie bereits bemerkt, ist es nicht einfach – oft nicht einmal m¨oglich –, zu einer Differentialgleichung ein Fundamentalsystem geschlossen anzugeben. Im Falle von Gleichungen mit konstanten Koeffizienten sieht die Sache wieder besser aus. Prinzipiell ist es m¨ oglich, ein Fundamentalsystem aus Satz III.5.6 abzulesen. Es ist jedoch auch instruktiv, das Problem direkt anzugehen. Wieder ist es praktisch, u ¨ ber C statt R zu rechnen. ur eine n-mal differenzierbare Es seien im folgenden a0 , . . . , an−1 ∈ C, und f¨ Funktion y: I → C setzen wir Ly = y (n) + an−1 y (n−1) + · · · + a0 y. Dann ist L linear. Wir suchen n linear unabh¨angige L¨osungen der Gleichung Ly = 0. Wir machen den Ansatz y(t) = eλt ; genau dann gilt dann Ly = 0, wenn P (λ) := λn + an−1 λn−1 + · · · + a0 = 0 ¨ ist. Dass man auf dieses Polynom gef¨ uhrt wird, ist keine Uberraschung: Das charakterische Polynom der zu Ly = 0 assoziierten Systemmatrix ⎞ ⎛ 0 1 ... 0 ⎜ .. ⎟ .. . . A = ⎝ ... . . ⎠ . −a0 −a1 . . . −an−1
ist n¨ amlich (−1)n P . Daher sind die Nullstellen von P genau die Eigenwerte von A. Hat P die n verschiedenen komplexen Nullstellen λ1 , . . . , λn , erh¨alt man n komplexe L¨ osungen von Ly =0, n¨ amlich eλ1 t , . . . , eλn t . Diese sind wirklich n linear unabh¨ angig: Ist n¨ amlich j=1 cj eλj t = 0 f¨ ur alle t ∈ I, so folgt durch wiederholtes Differenzieren n
cj λkj eλj t = 0
∀t ∈ I, k = 0, 1, 2, . . . .
j=1
Betrachtet man jetzt t = 0 und k = 0, . . . , n − 1, so folgt n
cj λkj = 0
j=1
bzw.
⎛ ⎜ ⎜ ⎜ ⎝
1 λ1 .. .
1 λ2 .. .
... ...
1 λn .. .
λ1n−1 λ2n−1 . . . λnn−1
⎞⎛
c1 ⎟ ⎜ c2 ⎟⎜ ⎟ ⎜ .. ⎠⎝ .
cn
⎞
⎟ ⎟ ⎟ = 0. ⎠
172
III.
Gew¨ ohnliche Differentialgleichungen
Da die Determinante dieser Matrix (die Vandermondesche Determinante) (λj − λi ) = 0 1≤i<j≤n
ist, hat das obige Gleichungssystem nur die triviale L¨osung c1 = · · · = cn = 0. ¨ Uber den Fall mehrfacher Nullstellen berichtet der folgende Satz. Wir betrachten L und P wie oben. Satz III.6.4 Ist λ eine k-fache Nullstelle von P , so sind eλt , teλt , . . . , tk−1 eλt
(III.22)
L¨osungen von Ly = 0. Auf diese Weise erh¨alt man insgesamt n linear unabh¨angige L¨osungen von Ly = 0, also ein Fundamentalsystem dieser Gleichung. Beweis. Wir zeigen zun¨ achst, dass die Funktionen in (III.22) tats¨achlich die Differentialgleichung l¨ osen. Zu zeigen ist also: Falls l < k und y(t) = tl eλt , so ist Ly = 0. Der Trick besteht nun darin, tl eλt =
∂ l λt e ∂λl
zu beobachten. Mit an = 1 ist dann n
n
∂j ∂l dj aj j l eλt y(t) = j dt ∂t ∂λ j=0 j=0 n n ∂l ∂j ∂l j λt a λ e aj l j eλt = = j ∂λ ∂t ∂λl j=0 j=0
Ly(t) =
=
aj
l r l ∂ P (λ)tl−r eλt = 0, r r ∂λ r=0
da λ eine k-fache Nullstelle von P und damit Nullstelle der r-ten Ableitung, r < k, ist. Die vorletzte Gleichheit ergibt sich aus der Leibnizschen Produktregel f¨ ur h¨ ohere Ableitungen. Wegen des Fundamentalsatzes der Algebra ist klar, dass auf diese Weise n L¨ osungen entstehen. Wir zeigen jetzt durch Induktion nach der Anzahl m der verschiedenen Nullstellen von P , dass diese linear unabh¨angig sind. Das ist klar f¨ ur m = 1. F¨ ur den Induktionsschritt von m auf m+ 1 seien jetzt λ1 , . . . , λm+1 die paarweise verschiedenen Nullstellen von P mit den Vielfachheiten k1 , . . . , km+1 . Eine Linearkombination der oben beschriebenen L¨osungen f¨ uhrt auf den Term m+1 pj (t)eλj t , j=1
III.6
Lineare Differentialgleichungen h¨ oherer Ordnung
173
wo pj ein Polynom vom Grad < kj ist. Wir m¨ ussen zeigen, dass dieser Term nur dann identisch verschwindet, wenn alle pj = 0 sind. Gelte also 0=
m+1
pj (t)eλj t =
m
pj (t)eλj t + pm+1 (t)eλm+1 t
j=1
j=1
∀t ∈ R.
Setze nun µj = λj − λm+1 f¨ ur j = 1, . . . , m; dann sind die µj = 0 und paarweise verschieden. Es folgt 0=
m
pj (t)eµj t + pm+1 (t)
j=1
∀t ∈ R.
Diese Gleichung wird nun so lange differenziert, bis pm+1 verschwunden“ ist. ” d Da dt pj (t)eµj t = (p′j (t)+µj pj (t))eµj t von der Form p˜j (t)eµj t mit einem Polynom alt man eine Gleichung der Form p˜j vom selben Grad wie pj ist (da µj = 0), erh¨ 0=
m
qj (t)eµj t
j=1
∀t ∈ R.
Nach Induktionsvoraussetzung sind alle qj = 0, und da die pj denselben Grad 2 haben, sind auch alle pj = 0. Das war zu zeigen. Sind die aj reell, so betrachte man Real- und Imagin¨arteil der in Satz III.6.4 beschriebenen L¨ osungen. Diese haben die Form (λj = αj + iβj ) tl cos βj t eαj t
bzw. tl sin βj t eαj t .
(III.23)
¯ Nullstelle des reellen Polynoms P ist, ergibt sich im reellen Da mit λ auch λ Fall: Satz III.6.5 Ist λ ∈ R eine k-fache Nullstelle von P , bilden die Funktionen der Form (III.22) aus Satz III.6.4 reellwertige L¨osungen von Ly = 0. Ist hingegen λ ∈ C \ R eine k-fache Nullstelle von P , betrachte man stattdessen die Funktionen in (III.23) f¨ ur l < k. All diese Funktionen zusammen bilden ein Fundamentalsystem aus reellwertigen L¨osungen. Beispiel. In Beispiel III.1.8 war die Gleichung des harmonischen Oszillators y ′′ + 2py ′ + ω02 y = 0 (p ≥ 0) vorgestellt worden. Im Fall p = ω0 hatten wir damals der Gleichung nur eine L¨ osung ansehen k¨ onnen; jetzt sieht man die zweite, n¨amlich te−pt (vgl. Satz III.6.4). Alles, was damals u osbarkeit des zugeh¨origen Anfangs¨ ber die L¨ wertproblems gesagt wurde, ergibt sich jetzt als Spezialfall der S¨atze dieses Abschnitts.
174
III.
Gew¨ ohnliche Differentialgleichungen
Betrachten wir nun eine erzwungene Schwingung, die von einer periodisch wirkenden a ¨ußeren Kraft K erregt wird. Statt der Differentialgleichung (vgl. Beispiel III.1.8) my ′′ + ry ′ + ky = 0 taucht nun auf der rechten Seite der Term K(t) auf. Mit ) r K k p= , ω0 = , b= 2m m m bekommt man die inhomogene Gleichung y ′′ + 2py ′ + ω02 y = b(t).
(III.24)
Der Einfachheit halber nehmen wir eine reine Kosinusschwingung mit der Erregerfreqenz ω1 an, d.h. b(t) = b0 cos ω1 t. Wir werden im folgenden den Fall schwacher D¨ampfung, d.h. 0 ≤ p < ω0 annehmen. Grunds¨ atzlich ist es m¨ oglich, die allgemeine L¨osung von (III.24) mit Satz III.6.3 zu bestimmen; die spezielle Gestalt der rechten Seite gestattet jedoch eine weitere M¨ oglichkeit. Zuerst gehen wir von (III.24) zur komplexifizierten Gleichung z ′′ + 2pz ′ + ω02 z = b0 eiω1 t
(III.25)
u ¨ ber; zur Erinnerung eiα = cos α+ i sin α. Der Realteil einer L¨osung von (III.25) ist dann eine L¨ osung von (III.24) f¨ ur unser b. Wir machen jetzt den Ansatz z(t) = Aeiω1 t , um eine partikul¨ are L¨ osung von (III.25) zu finden. Daraus erh¨alt man unmittelbar A(−ω12 + 2pω1 i + ω02 ) = b0 .
(III.26)
Falls die Klammer = 0 ist, kann man nach A aufl¨osen und erh¨alt eine L¨osung von (III.25). Wir unterscheiden jetzt die F¨ alle p = 0 und 0 < p < ω0 . Zuerst zu p = 0, d.h. zur unged¨ ampften Schwingung. Falls ω0 = ω1 ist, folgt aus (III.26) A=
b0 , ω02 − ω12
was eine reelle Zahl ist. Eine partikul¨ are L¨ osung von (III.24) ist daher Re(Aeiω1 t ) =
ω02
b0 cos ω1 t, − ω12
III.6
Lineare Differentialgleichungen h¨ oherer Ordnung
175
und die allgemeine L¨ osung lautet (vgl. Beispiel III.1.8) c1 cos ω0 t + c2 sin ω0 t +
ω02
b0 cos ω1 t. − ω12
Ein anf¨ anglich ruhender Massenpunkt (y(0) = 0, y ′ (0) = 0) vollf¨ uhrt, durch die außere Kraft angeregt, Schwingungen der Form (c1 = −b0 /(ω02 − ω12 ), c2 = 0) ¨ b0 2b0 ω0 − ω1 ω0 + ω1 t sin t (cos ω1 t − cos ω0 t) = 2 sin ω02 − ω12 ω0 − ω12 2 2 ω0 + ω1 =: A(ω1 , t) sin t, 2
y(t) =
sogenannte amplitudenmodulierte Schwingungen.
Abb. III.2. Graph von y und A(ω1 , · ) (gestrichelt)
Im Fall ω0 = ω1 , wo die Erregerfrequenz ω1 mit der Eigenfrequenz ω0 des harmonischen Oszillators u ¨ bereinstimmt, klappt der Ansatz z(t) = Aeiω1 t nicht, denn (III.26) lautet dann A · 0 = b0 . Jetzt bestimmen wir eine partikul¨are L¨ osung von (III.24) per Variation der Konstanten. Man erh¨alt aus (III.21) mit y1 (t) = cos ω0 t, y2 (t) = sin ω0 t, W (t) = 1 nach kurzer Rechnung t t b0 t sin ω0 t. b0 cos2 ω0 s ds = b0 cos ω0 s sin ω0 s ds + sin ω0 t − cos ω0 t 2ω 0 0 0 Die allgemeine L¨ osung lautet daher y(t) = c1 cos ω0 t + c2 sin ω0 t +
b0 t sin ω0 t. 2ω0
Die L¨ osung ist unbeschr¨ ankt! In der Praxis bedeutet das, dass nach endlicher Zeit die Feder, an der der Massenpunkt h¨ angt, reißen wird. Dieses Ph¨anomen wird Resonanz genannt.
176
III.
Gew¨ ohnliche Differentialgleichungen
Es taucht auch im schwach ged¨ ampften Fall auf, der Schwingungsph¨anomene realistischer beschreibt. Wir nehmen also jetzt 0 < p < ω0 an. Man kann dann (III.26) stets nach A aufl¨ osen, da der Imagin¨ arteil der Klammer = 0 ist. Das liefert die partikul¨are L¨ osung z(t) =
ω02 − ω12 − 2pω1 i b0 iω1 t e (cos ω1 t + i sin ω1 t) = b 0 ω02 − ω12 + 2pω1 i (ω02 − ω12 )2 + 4p2 ω12 (III.27)
von (III.25), deren Realteil (ω02
2pω1 b0 (ω02 − ω12 )b0 cos ω1 t + 2 sin ω1 t − ω12 )2 + 4p2 ω12 (ω0 − ω12 )2 + 4p2 ω12
(III.28)
eine partikul¨ are L¨ osung von (III.24) darstellt. Wir wollen diesen Term vereinfachen. Dazu beachte man mit a2 = a21 + a22 a a2 1 a1 cos α + a2 sin α = a cos α + sin α a a = a(sin ϕ cos α + cos ϕ sin α) = a sin(α + ϕ) f¨ ur ein ϕ, denn (a1 /a)2 + (a2 /a)2 = 1. Also wird aus (III.28) b0 1/2 sin(ω1 t + ϕ), 2 2 2 (ω0 − ω1 ) + 4p2 ω12
und die allgemeine L¨ osung von (III.24) lautet
b0 y(t) = e−pt (c1 cos ωt + c2 sin ωt) + 1/2 sin(ω1 t + ϕ) 2 2 2 (ω0 − ω1 ) + 4p2 ω12 (III.29) mit ω = ω02 − p2 ; vgl. Beispiel III.1.8. Da der erste Term mit t → ∞ verschwindet (er beschreibt den Einschwingvorgang), wird das Langzeitverhalten vom zweiten Term bestimmt. Dieser beschreibt eine phasenverschobene Sinusschwingung mit der Erregerfrequenz, was physikalisch nat¨ urlich erscheint, und der Amplitude b0 A(ω1 ) = 1/2 . (ω02 − ω12 )2 + 4p2 ω12
√ ur ω1 → ∞ / 2 f¨ Elementare Rechnungen zeigen, dass A(ω1 ) im Fall p ≥ ω0√ streng monoton gegen 0 konvergiert. Im Fall 0 < p < ω0 / 2 ergibt sich bei ωR = ω02 − 2p2 (der Resonanzfrequenz ) der Maximalwert Amax =
b 0 , 2p ω02 − p2
III.7 Qualitative Theorie nichtlinearer Systeme
177
und der kann zu groß sein; es kommt zur Resonanzkatastrophe: Die Br¨ ucke11 st¨ urzt ein, die Kreide quietscht, Oskar Matzerath l¨asst Scheiben zerspringen etc. Dasselbe Ph¨ anomen kann aber auch durchaus erw¨ unscht sein (Radio, Mikrowellenherd etc.). Wird die Schwingung durch eine reine Sinusschwingung angeregt, erh¨alt man die L¨ osung durch Betrachten des Imagin¨ arteils von (III.27); sie hat die Gestalt (III.29) mit einer anderen Phase ϕ. Eine beliebige T -periodische Erregung b zerlegt man in reine Sinus- und Kosinusschwingungen, d.h. man entwickelt b in die Fourierreihe (siehe Abschnitt V.4) ∞ 2π 2π a0 an cos n t + bn sin n t . + 2 T T n=1
Man kann zeigen, dass f¨ ur st¨ uckweise stetig differenzierbares, stetiges b die Fou¨ rierreihe gleichm¨ aßig gegen b konvergiert. Indem man die obigen Uberlegungen f¨ ur jeden Summanden einzeln durchf¨ uhrt, dann die L¨osungen addiert (und auf alle Konvergenzprobleme achtgibt!), kann man die allgemeine L¨osung von (III.24) unter diesen Voraussetzungen an b als unendliche Reihe erhalten12 .
III.7
Qualitative Theorie nichtlinearer Systeme
Wir betrachten in diesem Abschnitt autonome Systeme der Form y ′ = f (y), wo die rechte Seite also nicht explizit zeitabh¨angig ist. Genauer werden wir durchgehend die Annahme machen, dass f : Rn → Rn stetig differenzierbar ist. Aus dem Satz von Picard-Lindel¨ of folgt dann die eindeutige lokale L¨osbarkeit des Anfangswertproblems y ′ = f (y),
y(0) = u0 .
(III.30)
Um die folgenden Begriffe einzuf¨ uhren, wollen wir der Einfachheit halber jetzt auch annehmen, dass die L¨ osung y dieses Problems auf ganz R existiert, und zwar f¨ ur jeden Anfangswert u0 ∈ Rn ; sie sei mit y(t; u0 ) bezeichnet. Statt der Abh¨ angigkeit von t interessieren wir uns nun f¨ ur die Abh¨angigkeit von u0 . F¨ ur jedes t wird also eine Abbildung ϕt : Rn → Rn ,
ϕt (u0 ) = y(t; u0 )
11 Es wird gelegentlich kolportiert, preußischen Soldaten sei es wegen dieser Resonanzph¨ anomene verboten worden, im Gleichschritt u ucke zu marschieren. In seiner Kolumne ¨ber eine Br¨ Stimmt’s?“ in der ZEIT vom 1. 8. 1997 verweist Christoph Dr¨ osser diese Geschichte allerdings ” ins Reich der Legenden. 12 Sehr empfehlenswerte B¨ ucher zu Fourierreihen sind T. W. K¨ orner, Fourier Analysis, Cambridge University Press 1988, und G. B. Folland, Fourier Analysis and its Applications, Wadsworth and Brooks/Cole 1992.
178
III.
Gew¨ ohnliche Differentialgleichungen
definiert. Die einparametrige Familie von Transformationen (ϕt )t∈R hat die Gruppeneigenschaft ϕs+t = ϕs ◦ ϕt
ϕ0 = IdRn ,
∀s, t ∈ R.
Man nennt Rn den Phasenraum und (ϕt ) einen Fluss. Man veranschaulicht sich die L¨ osung von y ′ = f (y) h¨ aufig nicht durch den Graphen von y, sondern durch das Phasenportr¨at des Flusses. Dazu zeichnet man einige der Kurven t → ϕt (u0 ) im Phasenraum auf. Beispiel. Die unged¨ ampfte Schwingungsgleichung v ′′ +ω02 v = 0 ist dem (linearen) System y1′ = y2 , y2′ = −ω02 y1 aquivalent, dessen allgemeine L¨ osung in der Form ¨ cos ω0 t ω10 sin ω0 t y(t) = u −ω0 sin ω0 t cos ω0 t geschrieben werden kann. Es ist also ϕt (u) =
cos ω0 t −ω0 sin ω0 t
1 ω0
sin ω0 t cos ω0 t
u,
und die Kurven t → ϕt (u), die so genannten Orbits oder Trajektorien, sehen im Phasenraum so aus:
(Die horizontale Achse repr¨ asentiert den Ort und die vertikale den Impuls bzw. die Geschwindigkeit des schwingenden Teilchens; die Trajektorien werden im Uhrzeigersinn durchlaufen.)
III.7
Qualitative Theorie nichtlinearer Systeme
179
Betrachten wir eine schwach ged¨ ampfte Schwingung v ′′ + 2pv ′ + ω02 v = 0 mit 0 < p < ω0 . Das a ¨quivalente System ist y1′ = y2 , y2′ = −ω02 y1 − 2py2 . −pt Die allgemeine L¨ osung der Schwingungsgleichung ist nach (III.6) e (c1 cos ωt+ 2 2 c2 sin ωt) mit ω = ω0 − p . Diesen Term kann man (vgl. die Rechnung auf Seite 176) in die Form v(t) = Ae−pt sin(ωt + ϕ)
bringen. Daraus ergibt sich mit einem geeigneten Winkel α v ′ (t) = ω 2 + p2 Ae−pt cos(ωt + ϕ + α). v : Das Phasenportr¨ at sieht dann so aus; y = v′
Abschließend noch das Phasenportr¨ at f¨ ur die starke D¨ampfung p > ω0 :
Im Beispiel der Schwingungsgleichung hatte die triviale L¨osung y˜ = 0 die Eigenschaft, dass jede weitere L¨ osung y, die bei t = 0 in der N¨ahe von y˜(0)“ ”
180
III.
Gew¨ ohnliche Differentialgleichungen
liegt, f¨ ur alle Zeiten t ≥ 0 in der N¨ ahe von y˜(t)“ bleibt (Pr¨azisierung folgt); ” das ist aus den Phasenportr¨ ats unmittelbar abzulesen. Dass solch ein Ph¨ anomen nicht immer zu erwarten ist, zeigt bereits das einfache Beispiel der Differentialgleichung y ′ = y im eindimensionalen Fall. Hier ist ¨ die triviale L¨ osung y˜ = 0 instabil“: Andert man den Anfangswert geringf¨ ugig, ” entfernt sich die L¨ osung des Anfangswertproblems y ′ = y, y(0) = δ, n¨amlich y(t) = δet , beliebig weit von y˜. Im Unterschied zu den Untersuchungen in Abschnitt III.3 betrachten wir nun das Verhalten der L¨osung auf ganz R oder R+ und nicht auf einem kompakten Intervall; f¨ ur t → ∞ hat die L¨osung y ein qualitativ anderes Verhalten als y˜. Zur Pr¨ azisierung der in Anf¨ uhrungszeichen benutzten Sprechweisen f¨ uhren wir jetzt ein paar Begriffe ein. Definition III.7.1 Sei f : Rn → Rn stetig differenzierbar, und betrachte die Differentialgleichung y ′ = f (y).
(III.31)
(a) Eine L¨ osung y˜ von (III.31) auf [0, ∞) heißt stabil, wenn es zu jedem ε > 0 ein δ > 0 mit folgender Eigenschaft gibt: Jede L¨osung von (III.31) mit y(0) − y˜(0) ≤ δ existiert auf ganz [0, ∞), und es gilt y(t) − y˜(t) ≤ ε
∀t ≥ 0.
(b) Eine L¨ osung y˜ von (III.31) heißt asymptotisch stabil, wenn sie stabil ist und zus¨ atzlich f¨ ur eine L¨ osung y wie in (a) lim y(t) − y˜(t) = 0
t→∞
gilt. (c) Eine L¨ osung y˜ von (III.31) heißt instabil, wenn sie nicht stabil ist. Einige Bemerkungen hierzu: (1) Die Auswahl des Zeitpunktes t0 = 0 stellt offenbar keine Einschr¨ankung der Allgemeinheit dar. Auch die Wahl der Norm des Rn ist unerheblich. (2) Die Definition einer stabilen L¨ osung umfasst, dass y und y˜ f¨ ur alle t ≥ 0 existieren. (3) Es gibt instabile L¨ osungen, die die in (b) genannte Eigenschaft haben; siehe etwa Birkhoff/Rota [1978], S. 122. Im folgenden untersuchen wir die Stabilit¨ at von Gleichgewichtsl¨osungen, d.h. von L¨ osungen, die zeitlich konstant sind; ihr Phasenportr¨at ist ein Punkt im Phasenraum. Offensichtlich ist die konstante Funktion y˜ = u0 genau dann eine L¨ osung von (III.31), wenn u0 eine Nullstelle von f ist. Man nennt u0 einen
III.7
Qualitative Theorie nichtlinearer Systeme
181
Gleichgewichtspunkt oder auch kritischen Punkt oder station¨aren Punkt. Es ist keine Beschr¨ ankung der Allgemeinheit anzunehmen, dass 0 ein Gleichgewichtspunkt ist; sonst gehe man u ¨ ber zu g(y) = f (y + u0 ). Ein asymptotisch stabiler Gleichgewichtspunkt wird auch Attraktor genannt. Zuerst behandeln wir Gleichgewichtspunkte linearer autonomer Systeme; dazu ein Lemma. Lemma III.7.2 F¨ ur die Eigenwerte λj einer reellen oder komplexen n × nMatrix A gelte Re λj < α. Dann existiert ein c > 0 mit eAt ≤ ceαt
∀t ≥ 0.
Beweis. Es gibt nach Satz III.5.6 ein Fundamentalsystem von y ′ = Ay aus Funktionen der Form eλj t Pj (t), wo Pj : R → Cn ein Polynom vom Grad ≤ n ist. Es folgt mit γj := α − Re λj > 0 und passendem cj > 0 eλj t Pj (t) ≤ eRe λj t Pj (t) ≤ cj eRe λj t eγj t , denn ein Polynom w¨ achst langsamer als jede Exponentialfunktion. Daher gilt eλj t Pj (t) ≤ cj eαt . Diese n Funktionen bilden die Spalten einer Fundamentalmatrix Y . Es folgt dann f¨ ur ein c˜ Y (t) ≤ c˜eαt ∀t ≥ 0, da die Eintr¨ age von Y (t) einer solchen Absch¨ atzung gen¨ ugen. Die Fundamentalmatrix eAt kann als Y (t)C dargestellt werden; folglich gilt eAt ≤ Y (t) C ≤ c˜Ceαt
∀t ≥ 0;
wie schon fr¨ uher bezeichnet . hier sowohl die euklidische Norm auf dem Cn als auch die zugeh¨ orige Matrixnorm auf Cn×n . 2 Satz III.7.3 Sei A ∈ Cn×n und γ = max Re λj , wo λj die Eigenwerte von A durchl¨auft. Wir betrachten y ′ = Ay. (a) Genau dann ist γ < 0, wenn die triviale L¨osung y˜ = 0 asymptotisch stabil ist. (b) Wenn γ > 0 ist, ist die triviale L¨osung y˜ = 0 instabil. (c) Im Fall γ = 0 ist keine allgemeine Aussage m¨oglich. Beweis. Falls γ < 0 ist, folgt die asymptotische Stabilit¨at aus Lemma III.7.2, denn jede L¨ osung l¨ asst sich als y(t) = eAt y(0) darstellen. Ist n¨amlich c wie in Lemma III.7.2 und y(0) ≤ ε/c, so folgt mit α = γ/2 (> γ) y(t) ≤ eAt y(0) ≤ ceαt
ε ≤ε c
∀t ≥ 0,
182
III.
Gew¨ ohnliche Differentialgleichungen
da α < 0, und y(t) ≤ εeαt → 0.
Das zeigt die Hinl¨anglichkeit der Bedingung γ < 0 in (a). Ist λ ein Eigenwert von A mit Re λ > 0, so existiert eine L¨osung der Form eλt v mit v = δ. Daraus folgt (b). Genauso sieht man im Fall γ = 0 durch die L¨osung eiβt v, dass in diesem Fall die triviale L¨ osung nicht asymptotisch stabil ist. Damit ist auch die Notwendigkeit in (a) gezeigt. Zu (c) sei bemerkt, dass f¨ ur die Nullmatrix A = ( 00 00 ) die triviale L¨osung 0 1 stabil, f¨ ur A = ( 0 0 ) jedoch instabil ist, da im letzten Fall eine L¨osung der Form 2 δ ( 1t ) existiert. Nun wollen wir ein nichtlineares System y ′ = f (y) mit stetig differenzierbarem f und einem Gleichgewichtspunkt u0 = 0 betrachten. Mit A bezeichnen wir die Ableitung von f bei 0, also die Jacobimatrix (Df )(0). Nach Definition der Differenzierbarkeit k¨ onnen wir daher f (u) = Au + g(u) mit lim
u→0
g(u) =0 u
(III.32)
schreiben. Der n¨ achste Satz, der auf Poincar´e zur¨ uckgeht, zeigt, dass man das Stabilit¨ atsverhalten des Nullpunkts des nichtlinearen Systems y ′ = Ay + g(y)
(III.33)
aus dem des zugeh¨ origen linearen Systems y ′ = Ay weitgehend ablesen kann. Theorem III.7.4 Betrachte das System (III.33), wo g (III.32) gen¨ ugt. Wieder sei γ = max Re λj das Maximum der Realteile der Eigenwerte von A. (a) Ist γ < 0, so ist die triviale L¨osung y˜ = 0 von (III.33) asymptotisch stabil. (b) Ist γ > 0, so ist die triviale L¨osung instabil. (c) F¨ ur γ = 0 ist keine allgemeine Aussage m¨oglich. F¨ ur den Beweis ben¨ otigen wir einen wichtigen Hilfssatz, das Gr¨onwallsche Lemma. Lemma III.7.5 Es sei ϕ: I = [0, a) → R stetig, und es gebe α ∈ R, β > 0 mit t ϕ(t) ≤ α + β ϕ(s) ds ∀t ∈ I. 0
Dann gilt ϕ(t) ≤ αeβt
∀t ∈ I.
III.7
Qualitative Theorie nichtlinearer Systeme
183
Beweis. Sei ε > 0 und ψε (t) = (α + ε)eβt . Dann ist ϕ(0) ≤ α < α + ε = ψε (0). Nehmen wir an, es g¨ abe ein t0 > 0 mit ϕ(t0 ) ≥ ψε (t0 ); dann gibt es auch ein kleinstes t0 mit dieser Eigenschaft, so dass ∀0 ≤ s < t0 .
ϕ(s) < ψε (s)
Daraus folgt aber der Widerspruch t0 ϕ(s) ds < α + ε + β ϕ(t0 ) ≤ α + β
t0
ψε (s) ds = ψε (t0 );
0
0
letzteres sieht man am einfachsten mittels Lemma III.2.1 ein, wenn man beobachtet, dass ψε das Anfangswertproblem y ′ = βy, y(0) = α + ε l¨ost. ur alle t ∈ I gezeigt. Da ε > 0 beliebig war, Wir haben also ϕ(t) < ψε (t) f¨ ergibt sich die Behauptung des Gr¨ onwallschen Lemmas. 2 Nun k¨ onnen wir den Beweis von Theorem III.7.4 f¨ uhren. (a) W¨ ahle β > 0 mit Re λj < −β f¨ ur alle j, zum Beispiel β = |γ|/2. Nach Lemma III.7.2 existiert ein c > 0 mit eAt ≤ ce−βt
∀t ≥ 0;
(III.34)
notwendigerweise ist dann c ≥ 1. Ferner existiert nach (III.32) ein δ > 0 mit u < δ
⇒
g(u) ≤
β u. 2c
(III.35)
Wir werden zeigen: • Ist y eine L¨osung von (III.33) mit y(0) ≤ ε < δ/c (≤ δ), so folgt y(t) ≤ cεe−βt/2
∀t ≥ 0.
(III.36)
Daraus folgt die behauptete asymptotische Stabilit¨at. Zum Beweis von (III.36) bemerken wir, dass y als gegebene L¨osung von (III.33) die inhomogene lineare Differentialgleichung z ′ = Az + g(y(t)) l¨ ost. Daher ist nach Satz III.5.7 At
y(t) = e y(0) +
t
eA(t−s) g(y(s)) ds.
0
Daraus ergibt sich wegen (III.34) und (III.35) t β y(t) ≤ ce−βt y(0) + ce−β(t−s) y(s) ds, 2c 0 sofern y(s) < δ f¨ ur 0 ≤ s ≤ t gilt.
184
III.
Gew¨ ohnliche Differentialgleichungen
Setzt man nun ϕ(t) = eβt y(t) und beachtet man y(0) ≤ ε, so folgt, solange y(s) < δ bleibt, β ϕ(t) ≤ cε + 2
t
ϕ(s) ds;
0
aus Lemma III.7.5 schließt man nun eβt y(t) = ϕ(t) ≤ cεeβt/2 , also y(t) ≤ cεe−βt/2 .
(III.37)
Da der letzte Term stets < δ ist nach Wahl von ε, folgt die in (III.36) behauptete Ungleichung auf ganz [0, ∞), denn nach Korollar III.2.7 ergibt sich außerdem aus (III.37), dass das maximale Existenzintervall von y bis +∞ reicht. (b) Wir beweisen diesen Teil nur unter der Annahme, dass A diagonalisierbar ist. Dann existiert n¨ amlich eine invertierbare Matrix C, f¨ ur die A˜ = C −1 AC −1 Diagonalgestalt hat. Setzt man g˜(u) = C g(Cu), so ist y L¨osung von (III.33) genau dann, wenn z = C −1 y das System ˜ + g˜(z) z ′ = Az
(III.38)
l¨ ost, und die Nulll¨ osung ist f¨ ur (III.33) genau dann instabil, wenn sie f¨ ur (III.38) g(u)/u = 0. Im allgemeinen ist jedoch instabil ist; beachte noch lim u →0 ˜ A˜ eine komplexe Matrix, selbst wenn A reell ist. Statt der Diagonalisierbarkeit von A kann man also von vornherein annehmen, dass ⎛ ⎞ λ1 ⎜ ⎟ .. A=⎝ ⎠ .
0
0
λn
eine komplexe Diagonalmatrix ist. Die Eigenwerte seien nun so angeordnet, dass Re λ1 , . . . , Re λk ≥ σ > 0,
Re λk+1 , . . . , Re λn ≤ 0.
(Eventuell ist k = n.) (III.32) impliziert ∀ε > 0 ∃δ > 0: u < δ
⇒
g(u) ≤ εu.
(III.39)
W¨ are die Nulll¨ osung stabil, so folgte f¨ ur L¨ osungen von (III.33) ∀δ > 0 ∃η > 0: y(0) ≤ η
⇒
y(t) < δ ∀t ≥ 0.
(III.40)
III.7
Qualitative Theorie nichtlinearer Systeme
185
Sei nun y eine komplexe L¨ osung von (III.33) mit dem Anfangswert ⎛ ⎞ η ⎜0⎟ .⎟ y(0) = ⎜ ⎝ .. ⎠ . 0
F¨ ur die Komponenten y1 , . . . , yn von y bzw. g1 , . . . , gn von g gilt d d |yj |2 = yj yj = yj′ yj + yj yj′ dt dt = (λj yj + gj (y))yj + yj (λj yj + gj (y)) = (λj + λj )|yj |2 + (gj (y)yj + gj (y)yj ) = 2 Re λj |yj |2 + 2 Re gj (y)yj . Nun sei ϕ(t) =
k j=1
|yj (t)|2 −
n
j=k+1
|yj (t)|2 .
Dann ist ϕ′ (t) = 2
k j=1
Re λj |yj (t)|2 − 2 +2
k j=1
≥ 2σ ≥ 2σ = 2σ
k j=1
k j=1
k j=1
≥ 2σ
k j=1
n
j=k+1
Re λj |yj (t)|2
Re gj (y(t))yj (t) − 2
|yj (t)|2 − 2 |yj (t)|2 − 2
n j=1
n
Re gj (y(t))yj (t)
j=k+1
|gj (y(t))| |yj (t)|
n j=1
|gj (y(t))|2
1/2 n j=1
|yj (t)|2
1/2
|yj (t)|2 − 2 g(y(t)) y(t) |yj (t)|2 − 2ε
n j=1
|yj (t)|2
nach der Cauchy-Schwarzschen Ungleichung bzw. nach (III.39) und (III.40). Macht man diese Rechnung mit ε = σ/2 und den zugeh¨origen δ und η, erh¨alt man ϕ′ (t) ≥ σϕ(t)
186
III.
Gew¨ ohnliche Differentialgleichungen
und nach Integration −ϕ(t) ≤ −ϕ(0) + σ
t
(−ϕ(s)) ds. 0
Das Gr¨ onwallsche Lemma III.7.5 liefert dann den Widerspruch y(t)2 ≥ ϕ(t) ≥ ϕ(0)eσt = η 2 eσt → ∞ mit t → ∞. Im Fall einer nicht diagonalisierbaren Matrix A geht man stattdessen von der Jordanschen Normalform aus und versucht, ¨ ahnlich wie oben zu argumentieren. (c) Schon im linearen Fall ist hier keine Aussage m¨oglich; siehe Theorem III.7.4(c). 2 Ist der Gleichgewichtspunkt u0 statt 0, so kann man die Stabilit¨at der konstanten L¨ osung y = u0 entsprechend an den Eigenwerten von (Df )(u0 ) ablesen; das folgt durch Translation aus Theorem III.7.4. F¨ ur die Lotka-Volterraschen R¨ auber-Beute-Gleichungen aus Beispiel III.1.7 war −α1 u1 + β1 u1 u2 . f (u1 , u2 ) = α2 u2 − β2 u1 u2
Der nichttriviale Gleichgewichtspunkt ist u0 = (α2 /β2 , α1 /β1 ), und man erh¨alt leicht 0 β1 α2 /β2 Df (u0 ) = . −β2 α1 /β1 0 √ Die Eigenwerte dieser Matrix sind ± α1 α2 i, also rein imagin¨ar; daher liefert Theorem III.7.4 keine Information u ¨ ber die Stabilit¨at von u0 . Jedoch sieht man, dass der Gleichgewichtspunkt 0 instabil ist (Aufgabe III.9.36). Die in Theorem III.7.4 enthaltene Methode wird Linearisierung genannt. Als n¨ achstes beschreiben wir eine weitere Methode zur Stabilit¨atsanalyse, mit der man auch die Stabilit¨ at des Punkts u0 im obigen Beispiel entscheiden kann. Zur Motivation der Idee betrachten wir noch einmal eine ged¨ampfte Schwingung (p > 0) v ′′ + 2pv ′ + ω02 v = 0 bzw. das ¨ aquivalente System y1′ = y2 y2′ = −2py2 − ω02 y1 .
(III.41)
Es ist anschaulich klar (und folgt aus Satz III.7.3), dass 0 ein asymptotisch stabiler Gleichgewichtspunkt ist. Eine andere Art, dies physikalisch einzusehen, besteht darin, die Energie des schwingenden Teilchens zu berechnen: E = Ekin + Epot =
1 2 ω02 2 y + y 2 2 2 1
(III.42)
III.7
Qualitative Theorie nichtlinearer Systeme
187
(Ekin = kinetische Energie, Epot = potentielle Energie = Integral der Federkraft). Die Energie hat im Gleichgewichtspunkt ein absolutes Minimum und ist l¨angs jeder Trajektorie wegen der Reibung streng monoton fallend. In der Tat ist d E = ω02 y1 y1′ + y2 y2′ = ω02 y1 y2 + y2 (−2py2 − ω02 y1 ) = −2py22 ≤ 0; dt im zweiten Schritt haben wir (III.41) eingesetzt. Daher ist physikalisch zu erwarten, dass das schwingende Teilchen gegen die Ruhelage strebt. Diese Idee hat Lyapunov Ende des 19. Jahrhunderts systematisch verfolgt und gezeigt, dass auch andere Funktionen als die Energie von Nutzen sein k¨ onnen. Entscheidend sind folgende Eigenschaften: Definition III.7.6 Es sei f : Rn → Rn stetig differenzierbar, und es gelte f (u0 ) = 0. Eine in einer Umgebung U von u0 definierte stetig differenzierbare Funktion E heißt Lyapunovfunktion (f¨ ur f ), falls (a) E bei u0 ein absolutes Minimum besitzt, (b) f¨ ur die Funktion ∂E: u → (grad E)(u), f (u) ∂E(u) ≤ 0 gilt. Gilt statt (b) sogar (b′ ) ∂E(u) < 0 so heißt E strikte Lyapunovfunktion.
∀u ∈ U
∀u ∈ U, u = u0 ,
Die Bedeutung der Funktion ∂E ist die: L¨ost y die Differentialgleichung d ˙ E(y(t)), so gilt nach der Kettenregel y ′ = f (y) und setzt man E(t) = dt ˙ E(t) = (grad E)(y(t)), y ′ (t) = (grad E)(y(t)), f (y(t)) = ∂E(y(t)). Bedingung (b) besagt also, dass E l¨ angs jeder Trajektorie abnimmt. Entscheidend ist nun, dass man dieses Monotonieverhalten dank (b) direkt der Differentialgleichung (via f ) entnehmen kann, ohne die L¨osung y zu kennen. (Das hatten wir bereits bei der Diskussion von (III.41) getan.) Nun k¨ onnen wir folgenden Satz zeigen. Satz III.7.7 Sei f : Rn → Rn stetig differenzierbar, und es gelte f (u0 ) = 0. Falls es eine [strikte] Lyapunovfunktion gibt, ist u0 ein [asymptotisch] stabiler Gleichgewichtspunkt f¨ ur das System y ′ = f (y). Beweis. Sei E: U → R eine Lyapunovfunktion; ohne Einschr¨ankung d¨ urfen wir u0 = 0 und E(0) = 0 annehmen. Sei ε > 0. Da Kε := {u: u = ε} kompakt und E stetig ist, ist wegen Bedingung (a) aus Definition III.7.6 m := inf E(u) > 0; u∈Kε
188
III.
Gew¨ ohnliche Differentialgleichungen
wir nehmen nat¨ urlich ε als so klein an, dass {u: u ≤ ε} in U liegt. Wegen E(0) = 0 und erneut der Stetigkeit von E existiert ein δ > 0 mit u < δ
⇒
E(u) < m.
Sei nun y eine L¨ osung von y ′ = f (y) mit y(0) < δ. Wegen d E(y(t)) = ∂E(y(t)) ≤ 0 dt ist E(y(t)) ≤ E(y(0)) < m f¨ ur alle t ≥ 0, denn y(0) < δ. Es folgt y(t) < ε
∀t ≥ 0,
da es andernfalls ein t mit E(y(t)) ≥ m geben m¨ usste. (Dass die L¨osung auf ganz [0, ∞) erkl¨ art ist, ist eine Konsequenz von Korollar III.2.7.) Der Punkt 0 ist also ein stabiles Gleichgewicht. Nun sei E sogar eine strikte Lyapunovfunktion. Da E(y( · )) monoton fallend ist, existiert λ := lim E(y(t)) ≥ 0; t→∞
wir werden λ = 0 zeigen. Daraus folgt die behauptete asymptotische Stabilit¨at, denn w¨ are limt→∞ y(t) = 0 falsch, g¨ abe es – nach dem ersten Beweisteil ist y ja beschr¨ ankt – eine Folge tn → ∞ mit y(tn ) → u = 0. Die Stetigkeit von E impliziert dann E(u) = λ = 0 im Widerspruch zu Bedingung (a) aus Definition III.7.6. Um λ = 0 zu zeigen, f¨ uhren wir erneut einen Widerspruchsbeweis. Nehmen wir also λ > 0 an. Seien ε und δ wie oben und 0 < y(0) < δ. Dann existiert ein ρ < y(0) mit x < ρ ⇒ E(x) < λ. Sei R = {x: ρ ≤ x ≤ ε}. Dann liegt y(t) f¨ ur alle t ≥ 0 in R, denn die Trajektorie kann R nach dem ersten Beweisteil nicht nach außen verlassen und auch nicht nach innen, da ja stets E(y(t)) ≥ λ gilt. Betrachte α := supx∈R ∂E(x). Da E stetig differenzierbar ist und nun Bedingung (b′ ) aus Definition III.7.6 vorausgesetzt ist, gilt α < 0. Das liefert den Widerspruch λ ≤ E(y(t)) = E(y(0)) + mit t → ∞.
0
t
∂E(y(s)) ds ≤ E(y(0)) + tα → −∞ 2
Beispiele. (a) Als erstes Beispiel behandeln wir das unged¨ampfte mathematische Pendel.
III.7
Qualitative Theorie nichtlinearer Systeme
189
ϕ
R
.. M .. .. .. ..U... ...? ...
m = Masse des Massenpunkts l = L¨ ange der Pendelstange
mg
Da die Bogenl¨ ange s, vom Ruhepunkt R gemessen, = lϕ ist, lautet die Newtonsche Bewegungsgleichung des Massenpunkts m
d2 s = tangentiale Komponente der Schwerkraft, dt2
d.h. ml
d2 ϕ = −mg sin ϕ dt2
bzw. ϕ′′ +
g sin ϕ = 0. l
(III.43)
Diese Differentialgleichung ist nicht geschlossen l¨ osbar. F¨ ur kleine Auslenkungen ϕ geht sie in die wohlbekannte lineare Schwingungsgleichung ϕ′′ + gl ϕ = 0 u ur kleine ϕ; die letztere Differentialgleichung ist die ¨ ber, denn sin ϕ ≈ ϕ f¨ Linearisierung von (III.43). (III.43) ist dem System y ′ = f (y) mit g f : R2 → R2 , f (u1 , u2 ) = u2 , − sin u1 l aquivalent, und 0 ist ein Gleichgewichtspunkt daf¨ ur. Es ist ¨ 0 1 Df (0) = , −g/l 0
was rein imagin¨ are Eigenwerte hat; daher k¨ onnen wir die Stabilit¨at von 0 nicht mit Hilfe von Theorem III.7.4 entscheiden13 . Wir versuchen jetzt, den Stabilit¨ atsbeweis mittels einer passenden Lyapunovfunktion zu erbringen. Wie in (III.42) machen wir den Ansatz E = Energie, also u1 g 1 g 1 sin v dv = u22 + (1 − cos u1 ). E(u1 , u2 ) = u22 + 2 l 2 l 0 13 Obwohl
0 ein stabiler Gleichgewichtspunkt des linearisierten Systems y ′ = Df (0)y ist, ist das allein nicht hinreichend daf¨ ur, auf die Stabilit¨ at des nichtlinearen Systems zu schließen; vgl. Aufgabe III.9.37.
190
III.
Gew¨ ohnliche Differentialgleichungen
Offensichtlich erf¨ ullt diese Funktion Definition III.7.6(a) in einer Umgebung von 0, und auch (b) gilt, denn * g + g ∂E(u1 , u2 ) = sin u1 , u2 , u2 , − sin u1 = 0. l l Der Nullpunkt ist also stabil. Es folgt außerdem, dass alle Trajektorien auf den d E(y(t)) = ∂E(y(t)) = 0. Man Niveaulinien E(u1 , u2 ) = const. liegen, da ja dt kann daher die Trajektorien bestimmen, ohne die L¨osungen zu kennen: Mit der alt man n¨ amlich Substitution v1 = u1 /2, v2 = u2 /2 erh¨ v22 + also
g sin2 v1 = C, l
) g v2 = ± C − sin2 v1 ; l
die vorletzte Zeile dr¨ uckt die Energieerhaltung aus.
Abb. III.3. Einige Niveaulinien E = const., auf denen die Trajektorien liegen.
Man nennt u ¨brigens eine Funktion E ein erstes Integral des Systems y ′ = f (y), wenn E auf den Trajektorien der L¨ osungen konstant ist, d.h. wenn f¨ ur jede L¨ osung des Systems (E ◦ y)′ = 0 ist. Im obigen Beispiel ist also die Energie ein erstes Integral. (b) Als zweites Beispiel nehmen wir die Diskussion der R¨auber-Beute-Gleichungen von Seite 186 wieder auf. Wir versuchen, eine Lyapunovfunktion in einer Umgebung von u0 = (α2 /β2 , α1 /β1 ) als E(u1 , u2 ) = F1 (u1 ) + F2 (u2 ) anzusetzen. Man erh¨ alt dann ∂E(u1 , u2 ) = F1′ (u1 )(−α1 u1 + β1 u1 u2 ) + F2′ (u2 )(α2 u2 − β2 u1 u2 );
III.7
Qualitative Theorie nichtlinearer Systeme
191
also ist ∂E(u1 , u2 ) = 0 genau dann, wenn F1′ (u1 )
u1 u2 = −F2′ (u2 ) , α2 − β2 u1 −α1 + β1 u2
was zum Beispiel im Fall F1′ (u1 ) = β2 −
α2 , u1
F2′ (u2 ) = β1 −
α1 u2
gilt, da dann beide Seiten der obigen Gleichung = −1 sind. Mit dieser Wahl bekommt man (Integrationskonstanten werden = 0 gesetzt) F1 (u1 ) = β2 u1 − α2 log u1 , F2 (u2 ) = β1 u2 − α1 log u2 ,
E(u1 , u2 ) = β2 u1 − α2 log u1 + β1 u2 − α1 log u2 . Die Funktion hat bei u0 ein lokales Minimum, da (grad E)(u0 ) = 0 und die Hessesche Matrix bei u0 α2 /u21 0 0 α1 /u22 positiv definit ist. u0 ist nach Satz III.7.7 ein stabiler Gleichgewichtspunkt. Wieder ist die Lyapunovfunktion E ein erstes Integral. Das wird uns helfen, das Lotka-Volterra-System weiter zu analysieren. Zuerst wollen wir zeigen, dass die L¨ osungen der Gleichung E(u) = const. geschlossene Kurven im ersten Qua¨ dranten der u1 -u2 -Ebene sind. Das folgt aus den nachstehenden Uberlegungen. Setzen wir F : (0, ∞) → R, F (x) = βx − α log x, mit positiven Konstanten α und β, dann ist F ′ (x) = β − α/x; also ist F strikt monoton fallend auf (0, α/β) und strikt monoton wachsend auf (α/β, ∞). Ferner ist limx→0 F (x) = limx→∞ F (x) = ∞, und bei α/β liegt ein absolutes Minimum vor. Daraus ergibt sich der folgende qualitative Verlauf des Graphen einer solchen Funktion F :
Wir haben nun f¨ ur eine gegebenes c ∈ R die Gleichung F1 (u1 ) + F2 (u2 ) = c (qualitativ) zu l¨ osen. Die Minimalwerte von F1 bzw. F2 bezeichnen wir mit m1
192
III.
Gew¨ ohnliche Differentialgleichungen
bzw. m2 . Schreibt man c = c1 + m2 , so haben wir nun die Gleichung F1 (u1 ) + F2 (u2 ) = c1 + m2
(III.44)
f¨ ur ein gegebenes c1 ∈ R zu diskutieren. Aus der obigen Kurvendiskussion folgt sofort, dass es f¨ ur c1 < m1 keine L¨osung gibt und f¨ ur c1 = m1 genau eine, n¨ amlich den Gleichgewichtspunkt u0 . F¨ ur c1 > m1 gibt es zwei L¨ osungen der Gleichung F1 (x) = c1 , sagen wir v = v(c1 ) < w = w(c1 ), und zwar ist 0 < v < α2 /β2 < w. Ist nun u1 < v oder u1 > w, so ist F1 (u1 ) > c1 , und (III.44) hat keine L¨osung; f¨ ur u1 = v oder osung in u2 , n¨amlich α1 /β1 . F¨ ur v < u1 < w u1 = w hat (III.44) genau eine L¨ gibt es schließlich zwei L¨ osungen von (III.44) in u2 , wovon eine kleiner und eine gr¨ oßer als α1 /β1 ist; all das folgt aus dem Monotonieverhalten der Funktionen F1 und F2 . Der Satz u ¨ ber implizite Funktionen liefert, dass mit Ausnahme der Punkte ur jeden anderen Punkt u ∈ M = E −1 ({c}) eine Um(v, α1 /β1 ) und (w, α1 /β1 ) f¨ gebung existiert, eindeutig nach u2 aufgel¨ost werden kann. Daher in der (III.44) besteht M ∩ (v, w) × R aus zwei sich nicht schneidenden Funktionsgraphen. Aber in einer Umgebung von (v, α1 /β1 ) bzw. von (w, α1 /β1 ) kann man (III.44) nach u1 aufl¨ osen; daher ber¨ uhren sich diese Funktionsgraphen bei (v, α1 /β1 ) und (w, α1 /β1 ). Damit ist gezeigt, dass M eine geschlossene Kurve ist.
Abb. III.4. Die Kurven E(u) = c f¨ ur einige Werte von c.
Bis jetzt wissen wir, dass die Trajektorien des Lotka-Volterra-Systems auf den geschlossenen Kurven E(u) = c verlaufen. Damit ist zun¨achst einmal klar, dass die L¨ osungen y f¨ ur alle Zeiten existieren (vgl. Korollar III.2.7). Ist c > alt M keinen Gleichgewichtspunkt, m1 + m2 in unserer Notation von oben, enth¨ und es folgt die Existenz eines T > 0 mit y(T ) = y(0) (Beweis?); dann gibt es auch ein minimales T mit dieser Eigenschaft. Da das Differentialgleichungssystem eindeutig l¨ osbar ist, muss y(t) = y(t + T ) f¨ ur alle t sein, denn mit y ist auch t → y(t + T ) eine L¨ osung eines autonomen Systems. Wir erhalten somit folgendes wichtige qualitative Resultat:
III.7
Qualitative Theorie nichtlinearer Systeme
193
• Die L¨osungen des Lotka-Volterra-Systems sind periodisch, sie verlaufen auf den Kurven E(u) = const. Wir wollen die durchschnittliche Gr¨ oße der R¨auber- bzw. Beutepopulation w¨ahrend einer Periode berechnen. Diese ist 1 T 1 T y¯1 = y1 (t) dt bzw. y¯2 = y2 (t) dt. T 0 T 0 Der Trick ist nun, α2 −β2 y1 zu integrieren; aus der zweiten Differentialgleichung des Lotka-Volterra-Systems erh¨ alt man dann
0
T
(α2 − β2 y1 ) dt =
da y2 periodisch ist. Das liefert y¯1 =
α2 β2
T
0
T y2′ (t) dt = log y2 (t) = 0, y2 (t) 0
bzw.
y¯2 =
α1 . β1
Die durchschnittlichen Populationen sind also genauso groß wie die Gleichgewichtspopulationen. Dieses Resultat hat interessante Konsequenzen. Dazu ein historisch verb¨ urgtes Beispiel: Im Jahre 1868 wurden einige Akazienb¨aume aus Australien nach Kalifornien exportiert und dort angepflanzt. Einige Insekten der Species Icerya purchasi (Schildl¨ ause) wanderten mit aus und befielen prompt die kalifornischen Orangenb¨ aume. Schildl¨ ause saugen den Saft aus B¨aumen, und so entstand der Zitrusindustrie erheblicher Schaden. In Australien hat die Schildlaus einen nat¨ urlichen Feind, eine Marienk¨aferart namens Rodolia cardinalis. 1889 wurden 514 dieser K¨afer aus Australien nach Amerika gebracht, um die Schildlausplage einzud¨ammen. In der Tat gelang dies innerhalb von nur 18 Monaten; die Schildlauspopulation verschwand fast vollst¨ andig, und auch die K¨ afer nahmen in Ermangelung von Nahrung sehr stark ab. (Dieser Geniestreich ist einem gewissen Dr. Riley zuzuschreiben.) Kurz vor dem 2. Weltkrieg wurde das DDT erfunden, und die Orangenbauern dachten sich: Wir haben die Schildl¨ ause mit Hilfe der K¨afer fast ausrotten ” k¨ onnen; jetzt geben wir ihnen den Rest!“ Nachdem DDT in den Orangenanpflanzungen verspr¨ uht worden war, mussten die Bauern jedoch zu ihrem Missbehagen feststellen, dass sich die Schildl¨ ause sogar wieder vermehrt hatten, statt auszusterben. Mit den Lotka-Volterra-Gleichungen kann man erkl¨aren, warum. Der DDT-Einsatz kann durch Einf¨ ugen eines weiteren Terms (wo γ1 , γ2 > 0) in diese Gleichungen beschrieben werden: y1′ = −α1 y1 + β1 y1 y2 − γ1 y1 = −(α1 + γ1 )y1 + β1 y1 y2 y2′ = α2 y2 − β2 y1 y2 − γ2 y2 = (α2 − γ2 )y2 − β2 y1 y2
194
III.
Gew¨ ohnliche Differentialgleichungen
Ist γ2 < α2 , hat das neue System dieselbe Bauart wie das alte; nach dem Einsatz von DDT ist die durchschnittliche Raub- bzw. Beutepopulation also y˜1 =
α2 − γ2 < y¯1 , β2
y˜2 =
α1 + γ1 > y¯2 , β1
wie beobachtet. Das Lotka-Volterra-Modell ist das einfachste Differentialgleichungssystem der Populationsdynamik, und viele Kritiker halten es f¨ ur grob vereinfachend. Wer tiefer in diese Materie eindringen will, kann mehr u ¨ber Anwendungen in der Populationsdynamik z.B. bei J. Hofbauer, K. Sigmund, The Theory of Evolution and Dynamical Systems, Cambridge University Press 1988, nachlesen.
III.8
Randwertprobleme
Gegeben sei eine Gleichung 2. Ordnung y ′′ = f (t, y, y ′ ), deren allgemeine L¨osung i.a. zwei freie Konstanten enth¨ alt. Diese zwei Konstanten versucht man bei einem Anfangswertproblem durch Vorgabe von Funktion und Ableitung an einer Stelle t0 zu spezifizieren. Bei einem Randwertproblem macht man stattdessen Vorgaben an zwei Stellen a und b. Hier haben wir es – im Gegensatz zu einem Anfangswertproblem – mit einem globalen Problem zu tun, denn von einer L¨osung muss man ja verlangen, dass sie auf dem gesamten Intervall [a, b] existiert und nicht nur in einer osbarkeit eines solchen RandwertproUmgebung von t0 . Entsprechend ist die L¨ blems viel heikler. Als Beispiel betrachte 2
y ′′ = y 2 + y ′ ,
y ′ (0) = 1,
y(1) = 0.
Das ist zuviel verlangt, denn keine L¨ osung der Differentialgleichung, die y ′ (0) = 1 erf¨ ullt, kann auf dem ganzen Intervall [0, 1] existieren. Ist n¨amlich x > 0 im Existenzintervall, so folgt y′ (x) x ′′ x 1 1 1 du y (t) − ′ < ′ = 1, dt = = ′ dt ≤ 0<x= ′ (t)2 2 y u y (0) y (x) y (0) ′ y (0) 0 0 denn wegen y ′′ ≥ 0 ist y ′ monoton wachsend und deshalb y ′ (x) ≥ y ′ (0) > 0. Im weiteren betrachten wir nur noch lineare Randwertprobleme 2. Ordnung. Dann hat man zwar keine Probleme mit dem Existenzintervall (Satz III.6.1), ein solches Randwertproblem braucht jedoch im allgemeinen nicht l¨osbar zu sein; Beispiel: y ′′ + y = 0, y(0) = 0, y(π) = 1. Jede L¨ osung hat n¨ amlich die Form14 y(x) = c1 sin x+c2 cos x, und die Bedingung ur kein c1 ist c1 sin π = 1. y(0) = 0 liefert c2 = 0. Aber f¨ 14 Die unabh¨ angige Variable wird bei Randwertproblemen in der Regel mit x bezeichnet, da sie in Anwendungen oft eine Ortsvariable ist.
III.8
Randwertprobleme
195
Es kann auch vorkommen, dass es unendlich viele L¨osungen gibt; Beispiel: y ′′ + y = 0,
y(0) = −1,
y(π) = 1.
Die allgemeine L¨ osung der Differentialgleichung ist wieder y(x) = c1 sin x + c2 cos x, und y(0) = −1 liefert c2 = −1, und die zweite Randbedingung wird von jeder Funktion y(x) = c1 sin x − cos x erf¨ ullt. Nun zu einer systematischen Untersuchung dieses Problemkreises. Unter einem linearen regul¨aren Randwertproblem 2. Ordnung verstehen wir die Aufgabe ⎫ Sy := y ′′ + a1 (x)y ′ + a0 (x)y = b(x) ⎬ R1 y := α1 y(a) + α2 y ′ (a) = ρ1 (III.45) ⎭ R2 y := β1 y(b) + β2 y ′ (b) = ρ2 wo a1 , a2 , b: [a, b] → R stetig sind und (α1 , α2 ) = (0, 0) sowie (β1 , β2 ) = (0, 0) gelten; ρ1 , ρ2 ∈ R sind beliebig vogegeben. Manchmal ist es sinnvoll, die Differentialgleichung in die sogenannte selbst” adjungierte Form“ zu bringen. Dazu seien A eine Stammfunktion von a1 und A(x) A(x) A(x) , q(x) = a0 (x)e , g(x) = b(x)e . Nach Multiplikation der p(x) = e Differentialgleichung mit p erh¨ alt diese die Form Ly := (py ′ )′ + qy = g.
(III.46)
Hier sind dann p, q und g auf einem kompakten Intervall [a, b] erkl¨art, und p ist stetig differenzierbar und p(x) > 0 auf [a, b]. (Ein singul¨ares Randwertproblem w¨ urde man erhalten, wenn diese Funktionen auf einem beliebigen Intervall definiert sind oder p(x) > 0 nur auf dem offenen Intervall (a, b) gilt.) F¨ ur die L¨ osbarkeit von (III.45) gilt folgender fundamentaler Satz. Satz III.8.1 Betrachte das Randwertproblem (III.45) mit den dort gemachten Voraussetzungen. Ferner sei y1 , y2 ein Fundamentalsystem der homogenen Gleichung Sy = 0. Dann sind ¨aquivalent: (i) (III.45) ist eindeutig l¨osbar. R1 y1 R1 y2 (ii) det
= 0. R2 y1 R2 y2 (iii) Das homogene Randwertproblem Sy = 0,
R1 y = R2 y = 0
besitzt nur die triviale L¨osung y = 0. Beweis. Ist yp eine partikul¨ are L¨ osung der Differentialgleichung Sy = g und y(t) = c1 y1 (t) + c2 y2 (t) + yp (t)
196
III.
Gew¨ ohnliche Differentialgleichungen
ihre allgemeine L¨ osung (Satz III.6.3), so besteht das Problem nunmehr darin, die Konstanten ci den Randbedingungen anzupassen. Nun ist y L¨osung von (III.45) genau dann, wenn R1 y = c1 R1 y1 + c2 R1 y2 + R1 yp = ρ1 R2 y = c1 R2 y1 + c2 R2 y2 + R2 yp = ρ2 gelten, d.h.
R1 y1 R1 y2 R2 y1 R2 y2
c1 c2
=
ρ1 − R1 yp ρ2 − R2 yp
.
(III.47)
Daher liefert der bekannte Satz der linearen Algebra u ¨ber die L¨osbarkeit linearer ¨ Glaichungssysteme sofort die behauptete Aquivalenz. 2 Man sieht aus dem Beweis, dass die L¨ osung von (III.45) auf die L¨osung des linearen Gleichungssystems (III.47) reduziert ist. ¨ F¨ ur die weiteren Uberlegungen macht man sich als erstes klar, dass das ganze Geheimnis des Randwertproblems (III.45) in dem halbhomogenen Randwertproblem Sy = f,
R1 y = R2 y = 0
(III.48)
liegt. Dieses ist nach Satz III.8.1, unabh¨ angig von der rechten Seite f , genau dann eindeutig l¨ osbar, wenn (III.45) es ist. Um an eine L¨osung von (III.45) zu kommen, w¨ ahlen wir zuerst eine beliebige zweimal stetig differenzierbare Funktion u auf [a, b] mit R1 u = ρ1 , R2 u = ρ2 . Alsdann berechnen wir die L¨osung von (III.48) mit der rechten Seite f (x) = b(x) − Su(x); diese L¨ osung heiße z. Dann ist y := z + u eine L¨osung von (III.45). Kommen wir nun zum L¨ osungsverfahren f¨ ur (III.48). Dazu bringen wir die Differentialgleichung zuerst in ihre selbstadjungierte Form (III.46), d.h. wir interessieren uns f¨ ur das Sturm-Liouvillesche Randwertproblem Ly = (py ′ )′ + qy = g,
R1 y = R2 y = 0,
(III.49)
mit R1 , R2 wie in (III.45) und p, q, g wie in (III.46); insbesondere ist stets p(x) > 0. Wir berechnen nun eine partikul¨ are L¨osung von Ly = g, d.h. von y ′′ +
g(x) p′ (x) ′ q(x) y + y= , p(x) p(x) p(x)
(III.50)
mit der Formel (III.21). Wir nehmen die eindeutige L¨osbarkeit von (III.49) (bzw., was dasselbe ist, von (III.45)) an und w¨ahlen als erstes geschickt ein osung des Anfangswertproblems Fundamentalsystem. Sei y1 = 0 L¨ Ly = 0,
y(a) = γ11 , y ′ (a) = γ12
III.8
Randwertprobleme
197
und y2 = 0 L¨ osung des Anfangswertproblems Ly = 0,
y(b) = γ21 , y ′ (b) = γ22 ,
wobei die γij so vorgelegt sind, dass man R1 y1 = 0,
R2 y2 = 0
angig sein, da andenfalls etwa y1 erh¨alt. Dann m¨ ussen y1 und y2 linear unabh¨ ein skalares Vielfaches von y2 und damit nichttriviale L¨osung des homogenen Randwertproblems Ly = 0, R1 y = R2 y = 0 w¨are, was nach Satz III.8.1 der eindeutigen L¨ osbarkeit von (III.49), die ja vorausgesetzt ist, widerspr¨ache. Eine aß (III.21) partikul¨ are L¨ osung yp von (III.50) ist gem¨ x x g(ξ)y1 (ξ) g(ξ)y2 (ξ) dξ + y2 (x) dξ, (III.51) yp (x) = −y1 (x) p(ξ)W (ξ) p(ξ)W (ξ) a a
wo W = y1 y2′ − y2 y1′ die Wronskideterminante des Fundamentalsystems y1 , y2 ′ ist. Nach Aufgabe III.9.29 erf¨ ullt W die Differentialgleichung W ′ = − pp W , d.h. (pW )′ = pW ′ + p′ W = 0. pW ist daher konstant, und aus (III.51) wird x x y1 (x) y2 (x) yp (x) = − g(ξ)y2 (ξ) dξ + g(ξ)y1 (ξ) dξ. (III.52) p(a)W (a) a p(a)W (a) a Eine elementare, doch etwas l¨ angliche Rechnung zeigt (verwende R2 y2 = 0) b R2 (y1 ) g(ξ)y2 (ξ) dξ. (III.53) R1 yp = 0, R2 yp = − p(a)W (a) a
Die allgemeine L¨ osung von Ly = g lautet
y = y p + c1 y 1 + c2 y 2 , und wir versuchen, c1 und c2 so zu bestimmen, dass R1 y = R2 y = 0 gilt. Wegen alt man zun¨achst c2 = 0 und dann mit R1 y1 = 0, R1 yp = 0 und R1 y2 = 0 erh¨ (III.53) b R2 yp 1 c1 = − g(ξ)y2 (ξ) dξ. = R2 y1 p(a)W (a) a Daher bekommt man die L¨ osung von (III.49) in der Form y(x) = yp (x) + c1 y1 (x) x b y1 (x) y2 (x) g(ξ)y1 (ξ) dξ + g(ξ)y2 (ξ) dξ. = p(a)W (a) a p(a)W (a) x
Definiert man eine Funktion
⎧ y2 (x)y1 (ξ) ⎪ ⎪ ⎨ p(a)W (a) G(x, ξ) = ⎪ y1 (x)y2 (ξ) ⎪ ⎩ p(a)W (a)
a ≤ ξ ≤ x ≤ b, a ≤ x ≤ ξ ≤ b,
so l¨ asst sich das Ergebnis so zusammenfassen:
198
III.
Gew¨ ohnliche Differentialgleichungen
Satz III.8.2 Unter den obigen Voraussetzungen und Bezeichnungen ist die L¨osung des Sturm-Liouvilleschen Randwertproblems (III.49), wenn es eindeutig l¨osbar ist, y(x) =
b
G(x, ξ)g(ξ) dξ.
(III.54)
a
G heißt die Greensche Funktion des Randwertproblems (III.49). Man best¨atigt leicht folgende Eigenschaften von G: Satz III.8.3 F¨ ur die Greensche Funktion G: Q := [a, b] × [a, b] → R eines Sturm-Liouvilleschen Randwertproblems gilt: (a) (b) (c) (d)
G ist symmetrisch, d.h. G(x, ξ) = G(ξ, x); G ist stetig; G ist zweimal stetig differenzierbar auf Q \ {(x, ξ): x = ξ}; ¨ beim Uberschreiten der Diagonalen macht die partielle Ableitung D1 G = ∂G/∂x einen Sprung: lim D1 G(x + h, x) − lim D1 G(x − h, x) =
h→0 h>0
h→0 h>0
1 . p(x)
Die entscheidende Bedeutung von Satz III.8.2 liegt darin, dass er die L¨osung des Sturm-Liouvilleschen Randwertproblems – vorausgesetzt, sie ist eindeutig – explizit durch den Integraloperator aus (III.54) angibt. Hier kann man mit Methoden der Funktionalanalysis weitere Konsequenzen ziehen; wir kommen in Abschnitt V.7 darauf zur¨ uck.
III.9
Aufgaben
Aufgabe III.9.1 Sei f (y, y ′ , y ′′ , . . . , y (n) ) = 0 eine autonome Differentialgleichung mit L¨ osung y(t) = sin t. Zeige, dass auch cos t eine L¨ osung ist. Aufgabe III.9.2 Zeige direkt (d.h., ohne Satz III.1.9 zu benutzen), dass die Funktionen y(t) = 1/(c − t) bzw. y = 0 die einzigen L¨ osungen der Differentialgleichung y ′ = y 2 auf einem Intervall sind. Aufgabe III.9.3 L¨ ose die folgenden Differentialgleichungen und gib an, in welchem Bereich die L¨ osungen definiert sind. (a) y ′ = y · sin t (b) y ′ = ey (c) y ′ =
t2 y2
III.9
Aufgaben
199
Aufgabe III.9.4 L¨ ose das Anfangswertproblem y ′ = ey sin t,
y(0) = y0 .
F¨ ur welche Anfangswerte y0 existiert die L¨ osung auf ganz R? F¨ ur welche Anfangswerte y0 ist die L¨ osung beschr¨ ankt? Aufgabe III.9.5 Es seien fi : R2 → R gegeben, und die Differentialgleichungen yi′ = ogen im Intervall [a, b] mit den Anfangswerten y1 (a) ≤ y2 (a) l¨ osbar fi (t, yi ), i = 1, 2, m¨ sein. Außerdem soll f1 (t, u) < f2 (t, u) f¨ ur alle (t, u) ∈ R2 gelten. Zeige, dass y1 (t) ≤ y2 (t) f¨ ur alle t ∈ [a, b]. Gilt das auch, wenn nur f1 (t, u) ≤ f2 (t, u) f¨ ur alle (t, u) ∈ R2 vorausgesetzt ist? Aufgabe III.9.6 Ist in Satz III.1.9 y0 kein innerer Punkt von J, braucht Teil (a) dieses Satzes nicht zu gelten. Zeige das mit Hilfe des Anfangswertproblems y′ = √
−t , y+1
y(0) = 0.
Aufgabe III.9.7 Sei g: R → R stetig differenzierbar. Es m¨ oge eine auf ganz R definierte L¨ osung der autonomen Differentialgleichung y ′ = g(y) mit Anfangswert y(0) > 0 existieren. Zeige: F¨ ur jedes α > 1 ist g(y) lim inf α = 0. y→∞ y Zur Erinnerung: F¨ ur ϕ: R → R ist
lim inf ϕ(x) := sup inf ϕ(ξ). x→∞
x∈R ξ>x
′
Damit die Gleichung y = g(y) eine globale L¨ osung besitzt, darf g also nicht u ¨ berall“ ” st¨ arker als linear anwachsen. Aufgabe III.9.8 L¨ ose folgende Differentialgleichungen: y (a) y ′ = 2 t −1 y 2 − t2 ′ (b) y = 2yt (c) y ′ = (t − y + 3)2 Aufgabe III.9.9 Angenommen, man kennt eine L¨ osung y1 der linearen Differentialgleichung y ′′ + α(t) · y ′ + β(t) · y = 0.
Dann liefert der Ansatz y2 (t) = c(t) · y1 (t) eine mit den bekannten Methoden l¨ osbare Differentialgleichung f¨ ur eine weitere L¨ osung y2 . F¨ uhre das aus und bestimme damit noch eine L¨ osung der Differentialgleichung y ′′ + 2py ′ + ω02 y = 0, wobei y1 (t) = c · e−pt (vergleiche Beispiel III.1.8).
200
III.
Gew¨ ohnliche Differentialgleichungen
Aufgabe III.9.10 Durch eine geeignete Transformation u = u(t) k¨ onnen die Differentialgleichungen des folgenden Typs auf Gleichungen mit getrennten Ver¨ anderlichen zur¨ uckgef¨ uhrt werden: (a) y ′ = ϕ(αt + βy + γ), (b) y ′ = ϕ(y/t); diese Gleichung wird auch homogene Differentialgleichung genannt, was nicht mit den homogenen linearen Differentialgleichungen verwechselt werden darf. Finde eine solche Transformation. Aufgabe III.9.11 Finde eine geeignete Substitution, die die Bernoullische Differentialgleichung y ′ = α(t) · y + β(t) · y λ , λ ∈ R, in eine lineare Differentialgleichung transformiert. L¨ ose dann y ′ − y + ty 2 = 0. Aufgabe III.9.12 Der Satz von Picard-Lindel¨ of erlaubt es, die L¨ osung des Anfangswertproblems y ′ = f (t, y), y(t0 ) = y0 iterativ zu bestimmen. Die Folge ϕ0 , T ϕ0 , T 2 ϕ0 , . . . , wo ϕ0 die Funktion t → y0 bezeichnet und T wie in (III.9) definiert ist, konvergiert aßig gegen die L¨ osung. n¨ amlich auf jedem hinreichend kleinen Intervall um t0 gleichm¨ Man berechne diese Folge von Funktionen f¨ ur das Anfangswertproblem y ′ = y,
y(0) = 1.
Aufgabe III.9.13 Beweise Satz III.2.5. Aufgabe III.9.14 Gegeben seien ein Intervall I = [0, α], eine stetige Funktion K: I × I × R → R, die der Absch¨ atzung |K(x, t, z1 ) − K(x, t, z2 )| ≤ e−t |z1 − z2 |
∀x, t ∈ I, z1 , z2 ∈ R
gen¨ ugt, und eine stetige Funktion g: I → R. Zeige, dass es genau ein y ∈ C(I) gibt mit x y(x) = g(x) + K(x, t, y(t)) dt ∀x ∈ I. 0
Aufgabe III.9.15 Noch ein Fixpunktsatz: Es sei B ein normierter Raum, D ⊂ B abgeschlossen und T : D → B eine stetige Abbildung. Die Gleichung Tx = x
(III.55)
heißt approximativ l¨ osbar in D, wenn es zu jedem ε > 0 ein xε ∈ D mit T xε − xε < ε gibt. Zeige: Falls (III.55) approximativ l¨ osbar und T (D) kompakt ist, gibt es ein x ∈ D mit T x = x. Aufgabe III.9.16 Es sei A: R → Rn×n stetig und periodisch, es gibt also ein p ∈ R, so dass f¨ ur jedes t ∈ R die Gleichung A(t + p) = A(t) gilt. Weiter sei Y eine Fundamentalmatrix der Differentialgleichung y ′ (t) = A(t)y(t). Zeige:
III.9
Aufgaben
201
(a) F¨ ur jedes ganzzahlige k ist die Abbildung Yk : t → Y (t + kp) ebenfalls eine Fundamentalmatrix. (b) Es gibt eine Matrix B ∈ Rn×n , so dass
Yk = Y B k
f¨ ur jedes k ∈ Z. (c) Ist λ ein Eigenwert dieser Matrix B, so existiert eine L¨ osung y unserer Differentialgleichung mit y(t + p) = λy(t) f¨ ur jedes t ∈ R. Aufgabe III.9.17 Gegeben sei ein System linearer Differentialgleichungen y ′ = A(t)y.
(III.56)
z ′ = −AT (t)z
(III.57)
Das System
heißt das zu (III.56) adjungierte System (AT ist die transponierte Matrix). −1 (a) Y ist eine Fundamentalmatrix von (III.56) genau dann, wenn Y T eine Fundamentalmatrix von (III.57) ist. (b) Das System (III.56) hat eine orthogonale Fundamentalmatrix genau dann, wenn AT = −A ist. (c) Betrachte nun die inhomogenen Gleichungen y ′ = A(t)y + f (t) und z ′ = −AT (t)z − g(t) mit L¨ osungen y bzw. z auf [a, b]. Zeige, dass f¨ ur t ∈ [a, b] gilt t f (s), z(s) − y(s), g(s) ds = y(t), z(t) − y(a), z(a). a
Aufgabe III.9.18 Sei W die Wronskideterminante einer Fundamentalmatrix des homogenen linearen Systems y ′ = A(t)y. (a) W erf¨ ullt die Differentialgleichung W ′ = tr A(t) · W,
wobei tr die Spur einer Matrix bezeichnet; d.h. tr B = n j=1 bjj . (b) Folglich gilt t W (t) = W (t0 ) exp tr A(s) ds . t0
Aufgabe III.9.19 (D’Alembertsches Reduktionsverfahren) Gegeben sei ein zweidimensionales lineares Differentialgleichungssystem y ′ = A(t)y, osung verschiedene wo die A(t) also 2×2-Matrizen sind. Sei y: I → R2 eine von der Nulll¨ L¨ osung; wir nehmen an, dass die 1. Komponente y1 von y nicht den Wert 0 annimmt. Um eine zweite von y linear unabh¨ angige L¨ osung z zu finden, mache den Ansatz 0 z(t) = ϕ(t)y(t) + w2 (t)
mit reellwertigen Funktionen ϕ und w2 .
202
III.
Gew¨ ohnliche Differentialgleichungen
(a) Setze z in das System ein und finde Bedingungen an ϕ und w2 , damit z eine L¨ osung ist. Auf diese Weise erh¨ alt man t y2 (s) ds, a22 (s) − a12 (s) w2 (t) = c1 exp y1 (s) t0 t a12 (s)w2 (s) ds + c2 . ϕ(t) = y1 (s) t0 (b) Zeige, dass y und z wirklich linear unabh¨ angig sind. onnen (c) Modifiziere das Verfahren im Fall, dass y2 den Wert 0 nicht annimmt. K¨ y1 und y2 eine gemeinsame Nullstelle haben? Aufgabe III.9.20 Betrachte das Anfangswertproblem t+1 1 1 y ′ = t−1 . y, y(0) = −2 1 1 (a) Durch den Ansatz von y als Polynom bestimme eine L¨ osung der Differentialgleichung. (b) Bestimme eine zweite L¨ osung mit dem d’Alembertschen Reduktionsverfahren (Aufgabe III.9.19). (c) L¨ ose das Anfangswertproblem. Aufgabe III.9.21 L¨ ose das Anfangswertproblem t+1 1 −(t − 1)2 ′ t−1 , y+ y = 0 1 1
y(0) =
1 −2
.
(Ein Fundamentalsystem des homogenen Systems war in Aufgabe III.9.20 zu bestimmen.) Aufgabe III.9.22 L¨ ose das Anfangswertproblem 3 2 2 y, y(0) = . y′ = −5 1 2 Aufgabe III.9.23 Es sei A eine quadratische Matrix. Berechne eA in folgenden Situationen: (a) A2 = α · A f¨ ur ein α ∈ R. (b) A ist eine Diagonalmatrix oder allgemeiner eine Blockmatrix, d.h. ⎛
⎜ A=⎝
A1 ..
0
.
⎞
0⎟
Ar
wobei A1 , . . . , Ar quadratische Matrizen sind.
⎠,
III.9
Aufgaben
(c)
203
⎛
3 ⎜0 ⎜ ⎜0 A=⎜ ⎜0 ⎜ ⎝0 0
1 3 0 0 0 0
0 1 3 0 0 0
0 0 0 4 0 0
0 0 0 0 4 0
⎞ 0 0⎟ ⎟ 0⎟ ⎟ 0⎟ ⎟ 0⎠ 1
⎛
1 ⎜1 ⎜ A=⎝ 1 1
1 1 1 1
1 1 1 1
⎞ 1 1⎟ ⎟ 1⎠ 1
Aufgabe III.9.24 Finde 2 × 2-Matrizen A und B mit eA+B = eA eB . Aufgabe III.9.25 Zwei identische mathematische Pendel sind so nebeneinander aufgestellt, dass sie in derselben Ebene schwingen. Die Pendelmassen sind durch eine Feder verbunden, deren Ruhel¨ ange gleich dem Abstand der Aufh¨ angungspunkte ist. Bestimme die Bewegungsgleichung der Pendelmassen f¨ ur kleine Auslenkungen. Diskutiere verschiedene Anfangswerte. Skizziere die Auslenkung, wenn die Federkonstante klein ist. Aufgabe III.9.26 L¨ ose folgende Differentialgleichungen: (a) y1′ − 4y1 − y2 = 0 y2′ − y2 + 2y1 = −2et (b) y1′ = y1 + 6y2 + 3y3 y2′ = −2y1 − 6y2 − 2y3 y3′ = y1 + 2y2 − y3 Aufgabe III.9.27 Betrachte die Differentialgleichung an tn y (n) + an−1 tn−1 y (n−1) + · · · + a0 y = 0,
(III.58)
wo a0 , . . . , an ∈ C. (a) Zeige: Ist y eine L¨ osung dieser Differentialgleichung auf (0, ∞), so l¨ ost u: t → amlich y(et ) auf R eine Differentialgleichung mit konstanten Koeffizienten (n¨ welche?). Ist umgekehrt u eine L¨ osung letzterer Differentialgleichung, so l¨ ost y: t → u(log t) die Gleichung (III.58) auf (0, ∞). (b) L¨ ose die Differentialgleichung t4 y (4) + 3t2 y ′′ − 7ty ′ + 8y = 0 auf (0, ∞). Aufgabe III.9.28 F¨ uhre das d’Alembertsche Reduktionsverfahren (Aufgabe III.9.19) f¨ ur das der Gleichung 2. Ordnung y ′′ + a1 (t)y ′ + a0 (t)y = 0
(III.59)
entsprechende System durch, um ausgehend von einer L¨ osung von (III.59) eine zweite dazu linear unabh¨ angige L¨ osung zu finden. y das der Gleichung n-ter Ordnung (III.18) entspreAufgabe III.9.29 Sei y ′ = A(t) chende System und W die Wronskideterminante einer Fundamentalmatrix. Zeige mit Aufgabe III.9.18
204
III.
Gew¨ ohnliche Differentialgleichungen
(a) W ′ = −an−1 (t)W, t an−1 (s) ds W (t0 ). (b) W (t) = exp − t0
Aufgabe III.9.30 (a) Bestimme ein Fundamentalsystem f¨ ur die Gleichung y ′′ − cos t y ′ + sin t y = 0. [Tipp: Eine L¨ osung kann man mit dem Ansatz eϕ gewinnen, eine zweite mit dem d’Alembertschen Reduktionsverfahren aus Aufgabe III.9.28.] (b) L¨ ose anschließend das Anfangswertproblem y ′′ − cos t y ′ + sin t y = sin t,
y(0) = 0, y ′ (0) = −1.
Aufgabe III.9.31 Zwei Massen M1 und M2 , die mit einer masselosen Feder verbunden sind, bewegen sich reibungslos auf einer Geraden. Zum Zeitpunkt t0 = 0 seien die Massen in ihrer Ruhelage, die Feder sei entspannt, und die Geschwindigkeit von M1 bzw. M2 sei 0 bzw. v2 . Beschreibe die Bewegungsgleichung dieser Massen. Aufgabe III.9.32 Berechne die Sinkgeschwindigkeit eines K¨ orpers im Meer, der auf der Wasseroberfl¨ ache losgelassen wird, als Funktion der Zeit und als (implizite) Funktion des Ortes. Die Reibungskraft ist proportional zur Geschwindigkeit (R = r · v); außerdem wirkt ein konstanter Auftrieb A. (Die Differentialgleichung f¨ ur v(x) ergibt sich aus der f¨ ur v(t) mittels der Kettenregel.) Wenn der K¨ orper eine Tonne mit radioaktivem Abfall ist, interessiert die Auftreffgeschwindigkeit auf dem Meeresboden. Berechne sie f¨ ur eine 239 kg schwere 208 l-Tonne, die in eine Meerestiefe von 91 m versenkt wird. Der experimentell ermittelte Propor·s tionalit¨ atsfaktor c ist etwa 0,12 kg m2 ; 1 l Seewasser wiegt 1,025 kg. Die Tonne ist so gebaut, dass sie einen Aufprall mit 40 km ¨ bersteht. h noch ohne großen Schaden u Aufgabe III.9.33 Jeder der beiden Tanks K1 , K2 enthalte 100 l Wasser, in dem 5 kg bzw. 2 kg Salz aufgel¨ ost seien. Beginnend mit der Zeit t0 = 0 soll in K1 pro Minute 1 Liter einer Salzl¨ osung der Konzentration 0,1 kg/Liter eingeleitet werden, ferner ubergesollen 2 Liter/Minute von K1 nach K2 , 1 Liter/Minute von K2 nach K1 her¨ pumpt und 1 Liter/Minute aus K2 in einen Abfluss geleitet werden. Wie groß ist der Salzgehalt mi (t) in K1 zur Zeit t > 0? Zeige, dass die Salzkonzentration in Ki gegen die Konzentration der eingeleiteten L¨ osung strebt. Aufgabe III.9.34 Untersuche den Gleichgewichtspunkt u0 = 0 der Differentialgleichung y1′ = −2y1 + y1 y23 y2′ = −y12 y22 − y23
mit einer geeigneten Lyapunov-Funktion E. [Hinweis: Mache den Ansatz E(y) = ay12 + by22 .]
III.10 Literaturhinweise
205
Aufgabe III.9.35 Sei f : Rn → Rn stetig differenzierbar und sei f (u) = 0. Zeige: Der Gleichgewichtspunkt u ist instabil, wenn es eine auf einer Umgebung U von u definierte stetig differenzierbare Funktion E gibt mit = 0, falls u = u, grad E(u), f (u) > 0, falls u ∈ U \{u}. Aufgabe III.9.36 Zeige, dass 0 ein instabiler Gleichgewichtspunkt der Lotka-Volterra-Gleichungen ist. ur das 0 ein instabiler Aufgabe III.9.37 Finde ein nichtlineares System y ′ = f (y), f¨ Gleichgewichtspunkt ist, so dass f¨ ur das linearisierte System y ′ = Df (0)y der Punkt 0 ein stabiler Gleichgewichtspunkt ist. Aufgabe III.9.38 (Hamiltonsche Systeme) In dieser Aufgabe schreiben wir die Koordinaten eines Punkts im R2n (bzw. die Koordinatenfunktionen einer R2n -wertigen Funktion) als (p, q) = (p1 , . . . , pn , q1 , . . . , qn ). Sei H: R2n → R zweimal stetig differenzierbar; das Differentialgleichungssystem p′j = −
∂H (p, q), ∂qj
qj′ =
∂H (p, q) ∂pj
(j = 1, . . . , n)
wird ein Hamiltonsches System und H eine Hamiltonfunktion genannt. (Viele in der Mechanik auftauchende Probleme haben diese Gestalt mit der Energie als Hamiltonfunktion.) Zeige, dass die Hamiltonfunktion ein erstes Integral eines Hamiltonschen Systems ist. Aufgabe III.9.39 Untersuche die Gleichgewichtspunkte des Systems y1′ = −α1 y1 + β1 y1 y2
y2′ = α2 y2 (1 − ry24 ) − β2 y1 y2 auf Stabilit¨ at. (Die auftauchenden Parameter sollen alle positiv sein.) Aufgabe III.9.40 Bestimme die Greensche Funktion des Randwertproblems y ′′ = g, y(0) = y(π) = 0. Aufgabe III.9.41 Bestimme die Greensche Funktion des Randwertproblems (xy ′ )′ = g, y(1) = y(e) = 0.
III.10
Literaturhinweise
Einige einf¨ uhrende B¨ ucher u ohnliche Differentialgleichungen: ¨ ber gew¨ ◮ B. Aulbach: Gew¨ ohnliche Differenzialgleichungen. 2. Auflage, Spektrum-Verlag, 2004. ◮ G. Birkhoff, G.-C. Rota: Ordinary Differential Equations. 3. Auflage, Wiley, 1978.
206
III.
Gew¨ ohnliche Differentialgleichungen
◮ W. E. Boyce, R. C. DiPrima: Elementary Differential Equations and Boundary Value Problems. 7. Auflage, Wiley, 2000. ◮ H. Heuser: Gew¨ ohnliche Differentialgleichungen. Teubner, 1989. ◮ J. H. Hubbard, B. H. West: Differential Equations: A Dynamical Systems Approach. Band 1 und 2. Springer, 1991 und 1995. ◮ R. E. O’Malley: Thinking About Ordinary Differential Equations. Cambridge University Press, 1997. ◮ W. Walter: Gew¨ ohnliche Differentialgleichungen. 7. Auflage, Springer, 2000.
Die folgenden Texte betonen die geometrische Theorie nichtlinearer Differentialgleichungen und sind teils etwas anspruchsvoller: ◮ H. Amann: Gew¨ ohnliche Differentialgleichungen. de Gruyter, 1983. ◮ V. I. Arnold: Gew¨ ohnliche Differentialgleichungen. 2. Auflage, Springer, 2001. ◮ C. Chicone: Ordinary Differential Equations with Applications. Springer, 1999. ◮ E. A. Coddington, N. Levinson: Theory of Ordinary Differential Equations. McGraw-Hill, 1955. ◮ M. W. Hirsch, S. Smale: Differential Equations, Dynamical Systems, and Linear Algebra. Academic Press, 1974.
Kapitel IV
Maß- und Integrationstheorie
1 Wenn man das Riemann-Integral 0 f (t) dt f¨ ur eine beschr¨ankte Funktion f definieren will, geht man bekanntlich folgendermaßen vor. Der Urbildbereich [0, 1] wird in kleine Teilintervalle der L¨ ange < δ zerlegt und f durch eine Treppenfunktion ϕδ , die auf dem Inneren der Teilintervalle konstant ist, approximiert.
1 Anschließend definiert man auf kanonische Weise 0 ϕδ (t) dt und zeigt, dass f¨ ur eine große Klasse von Funktionen (u.a. alle stetigen Funktionen auf [0, 1]) 1 der Grenzwert limδ→0 0 ϕδ (t) dt existiert und unabh¨ angig von der approxi 1 mierenden Folge (ϕδ ) ist; diese Zahl wird dann mit 0 f (t) dt bezeichnet. (Die Einf¨ uhrung u ¨ ber Ober- und Untersummen ist nur eine technische Modifikation dieses Konzepts.) Die St¨ arken des Riemann-Integrals sind bekannt: die Einf¨ uhrung ist sehr anschaulich, und man kann mit recht geringem Aufwand wichtige Resultate, z.B. den Hauptsatz der Differential- und Integralrechnung, beweisen. In der h¨ oheren Analysis erweist sich das Riemannsche Integral jedoch als sehr schwerf¨ allig. Zum einen ist die Definition des Riemann-Integrals auf Bereichen Ω ⊂ Rd schon weitaus schwieriger zu verdauen, was als Konsequenz sehr technische Beweise f¨ ur Resultate wie etwa den Satz von Fubini (selbst im Fall stetiger Integranden) nach sich zieht. Zum anderen zeigt sich die Notwendigkeit,
208
IV.
Maß- und Integrationstheorie
Limes- und Integralbildung zu vertauschen; man braucht also Kriterien, die 1 1 lim fn (t) dt fn (t) dt = lim n→∞
0
0 n→∞
sicherstellen. (Hinreichend ist nat¨ urlich die gleichm¨aßige Konvergenz.) Das entscheidende Manko des Riemann-Integrals ist nun, dass selbst f¨ ur stetige fn die Grenzfunktion f (t) := limn→∞ fn (t) im Riemannschen Sinn nicht integrierbar zu sein braucht. H. Lebesgue hat in seiner 1902 erschienenen Dissertation gezeigt, wie ein Integralbegriff einzuf¨ uhren ist, der die Vorteile des Riemann-Integrals u ¨ bernimmt, aber seine Nachteile vermeidet. Lebesgues entscheidende Idee ist, den Bildbereich von f in kleine Teilintervalle (etwa der L¨ ange 1/n) zu zerlegen, auf diese Weise zu Treppenfunktionen ϕn zu kommen, die f approximieren, und dann das Integral wieder durch einen Grenzprozess zu gewinnen. Dabei ist ϕn durch
k+1 k k f¨ ur t ∈ Ek,n := t: ≤ f (t) < ϕn (t) = n n n erkl¨ art.
(k+1)/n k/n
Ek,n 1 Sollten die Ek,n Intervalle sein, ist klar, wie 0 ϕn (t) dt zu definieren ist, k ange des Intervalls Ek,n ist. F¨ ur n¨ amlich als k n λ(Ek,n ), wo λ(Ek,n ) die L¨ Vereinigung endlich vieler Intervalle I , . . . , Ir den Fall, dass Ek,n eine disjunkte 1 r ist, w¨ urde man λ(Ek,n ) = λ(I ) setzen. Da die Funktion f beliebig ist i i=1 (einstweilen zumindest), k¨ onnen jedoch die Mengen Ek,n ebenfalls irgendwelche Teilmengen von [0, 1] sein, und dann ist es absolut unklar, was unter λ(Ek,n ) sinnvollerweise zu verstehen ist; als relativ harmlosen Fall betrachte man etwa die Dirichletsche Sprungfunktion. Also stellt sich zun¨achst einmal das Problem, m¨ oglichst vielen Teilmengen von R auf eine solche Weise ein Maß“ zuzuordnen, ” dass die Maßbildung viele nat¨ urliche Eigenschaften wie Monotonie, Additivit¨at, Translationsinvarianz etc. besitzt.
IV.1 σ-Algebren
209
Es wird daher in diesem Kapitel zuerst u ¨ ber das Maßproblem gesprochen. Da die erforderlichen Begriffsbildungen und Aussagen im abstrakten Fall nicht schwieriger sind als im konkreten Fall eines Intervalls oder des Rd , aber insbesondere in der Wahrscheinlichkeitstheorie unumg¨anglich sind, nehmen wir von Anfang an jenen Standpunkt ein. Danach wird durch einen Linearisierungsprozess aus dem Maß ein Integral gewonnen (welches im Fall des Rd als Lebesguesches Integral bekannt ist), f¨ ur das alle wichtigen Konvergenzs¨atze ohne große M¨ uhen bewiesen werden k¨ onnen – die jedoch stecken in manchen technischen Details, die die Ausf¨ uhrungen gelegentlich etwas l¨anglich machen.
IV.1
σ-Algebren
Im folgenden bezeichnet S eine beliebige nicht leere Menge und P(S) die Potenzmenge von S, d.h. die Menge aller Teilmengen von S (beachte, dass ∅ ∈ P(S)). Definition IV.1.1 (a) R ⊂ P(S) heißt Ring, falls
(i) ∅ ∈ R, (ii) A, B ∈ R ⇒ B \ A := {s ∈ S: s ∈ B, s ∈ / A} ∈ R, n (iii) n ∈ N, A1 , . . . , An ∈ R ⇒ j=1 Aj ∈ R. (b) A ⊂ P(S) heißt σ-Algebra (pr¨ aziser: σ-Algebra auf der Menge S), falls (i) ∅ ∈ A , S ∈ A , (ii) A ∈ A ⇒ ∁A := {s ∈ S: s ∈ / A} ∈ A , ∞ (iii) A1 , A2 , · · · ∈ A ⇒ j=1 Aj ∈ A .
Durch vollst¨ andige Induktion folgt Bedingung (iii) eines Rings aus A, B ∈ R
⇒
A ∪ B ∈ R.
Das σ in σ-Algebra soll u ¨brigens daran erinnern, dass die entsprechende definierende Bedingung (iii) jetzt abz¨ ahlbar viele statt bloß endlich viele Mengen einbezieht. Wir werden daran interessiert sein, auf einer σ-Algebra definierte Men” genfunktionen“, die Mengen Zahlen zuordnen, zu betrachten. Leider ist der nat¨ urliche“ Definitionsbereich einer solchen Mengenfunktion im allgemeinen ” nur ein Ring1 , und es ist ein ausgesprochen nichttriviales Problem, diesen Definitionsbereich zu erweitern (siehe Theorem IV.3.5). 1 Wie
in der Algebra auch, ist dieser Begriff nicht der Geometrie, sondern der Soziologie entlehnt (vgl. Ringvereine, Weißer Ring, RCDS etc). Siehe auch Aufgabe IV.10.2 zur Verbindung zur Algebra.
210
IV.
Maß- und Integrationstheorie
Beispiele. (a) {∅, S} und P(S) sind stets σ-Algebren. (b) {A ⊂ S: A ist eine endliche Menge} ist ein Ring. (c) {A ⊂ S: A oder ∁A ist h¨ ochstens abz¨ ahlbar} ist eine σ-Algebra. Diese Beispiele wirken zu Recht etwas gek¨ unstelt; das folgende Beispiel ist jedoch f¨ ur den Aufbau der Lebesgueschen Integrationstheorie fundamental. (d) Sei S = R und F 1 die Menge aller endlichen Vereinigungen von (von links) halboffenen Intervallen: 1
F =
n
j=1
(aj , bj ]: n ∈ N, aj , bj ∈ R, aj ≤ bj f¨ ur j = 1, . . . , n .
Analog definiert man f¨ ur S = Rd das Mengensystem F d ; dabei ist f¨ ur a = (α1 , . . . , αd ), b = (β1 , . . . , βd ) mit αk ≤ βk f¨ ur k = 1, . . . , d das halboffene Intervall (a, b] durch (a, b] = (α1 , β1 ] × · · · × (αd , βd ] erkl¨art. F d ist ein Ring (siehe unten), der der Ring der d-dimensionalen Figuren genannt wird. Eine typische zweidimensionale Figur sieht so aus:
Diese Menge kann als Vereinigung von drei halboffenen Intervallen geschrieben werden (beachte, dass die Zerlegung einer Figur in Intervalle nicht eindeutig ist). ur offensichtlich Manche Leser m¨ ogen die Aussage, dass F d ein Ring ist, f¨ halten; wenn man jedoch das Diktum des Fieldsmedaillentr¨agers W.T. Gowers zugrundelegt, wonach eine Aussage erst dann offensichtlich ist, wenn einem sofort ein Beweis einf¨ allt2 , wird deutlich, dass die Sache nicht ganz so klar ist. Formulieren wir also ein Lemma; zur Abk¨ urzung schreiben wir I d f¨ ur das System der von links halboffenen Intervalle in Rd . 2 W.T. Gowers, Mathematics. A Very Short Introduction. Oxford University Press 2002, S. 51.
IV.1
σ-Algebren
211
Lemma IV.1.2 (a) Mit I und J liegt auch I ∩ J in I d . (b) Sind I, J ∈ I d , so kann I \ J als endliche Vereinigung disjunkter Intervalle in I d geschrieben werden. Insbesondere ist I \ J ∈ F d . (c) Jede Figur A ∈ F d kann als endliche Vereinigung disjunkter Intervalle in I d geschrieben werden. (d) F d ist ein Ring. Beweis. (a) Ist I das Produkt der Intervalle (αj , βj ] und J das Produkt der Intervalle (ˆ αj , βˆj ], so ist I ∩ J das Produkt der Intervalle (α′j , βj′ ] mit α′j = max{αj , α ˆ j } und βj′ = min{βj , βˆj }. (b) Beweis durch vollst¨ andige Induktion nach d: Der Fall d = 1 ist (wirklich) einfach. Schreibe nun I = I1 × I2 ∈ I d+1 und J = J1 × J2 ∈ I d+1 mit Intervallen I1 , J1 ∈ I d und I2 , J2 ∈ I 1 . Dann ist 0 / 0 / I \ J = (I1 \ J1 ) × I2 ∪ (I1 ∩ J1 ) × (I2 \ J2 )
eine disjunkte Vereinigung, und die Induktionsvoraussetzung liefert nun die gew¨ unschte Zerlegung. Figur ist definitionsgem¨aß eine Vereinigung A = n (c) Jede d-dimensionale d I mit I ∈ I . Wir f¨ u hren eine vollst¨ andige Induktion nach n. Der Inj j=1 j duktionsanfang ist klar. Nun schreibe eine aus n+1 Intervallen bestehende Figur nach Induktionsvoraussetzung als A=
n+1
Ij =
j=1
n
j=1
Ij ∪ In+1 =
m
k=1
Ik′ ∪ In+1 =
m
(Ik′ \ In+1 ) ∪ In+1
k=1
mit paarweise disjunkten Ik′ ∈ I d . Es reicht nun, auf Ik′ \ In+1 Teil (b) abzuwenden. (d) Nur Bedingung (ii) eines Rings ist heikel; beachte (a, a] = ∅. Aber B\A=
n
j=1
n m (((Ij \ J1 ) \ J2 ) . . . ) \ Jm , Ij \ Jk = k=1
j=1
und der Beweis ergibt sich jetzt durch vollst¨ andige Induktion nach m.
2
Eine einfache Eigenschaft von Ringen ist ihre Durchschnittsstabilit¨at. Lemma IV.1.3 (a) Seien R ein Ring und A, B ∈ R. Dann ist auch A ∩ B ∈ R. ∞ (b) Seien A eine σ-Algebra und A1 , A2 , · · · ∈ A . Dann ist auch j=1 Aj ∈ A.
212
IV.
Maß- und Integrationstheorie
Beweis. (a) folgt aus A ∩ B = A \ (A \ B) und (b) aus
∞
j=1
Aj = ∁
∞
j=1
∁Aj . 2
Eine kleine Spitzfindigkeit: (a) gilt auch f¨ ur σ-Algebren, denn A ∩ B = ¨ A ∩ B ∩ S ∩ S ∩ . . . ; dies zeigt, zusammen mit der analogen Uberlegung f¨ ur Vereinigungen, dass σ-Algebren Ringe sind. Es wurde noch kein nichttriviales Beispiel einer σ-Algebra gegeben. In der Tat ist es im Unterschied zu einer Topologie auch gar nicht einfach, eine σAlgebra durch eine Charakterisierung der sie konstituierenden Mengen anzugeben. Meistens erzeugt“ man σ-Algebren im folgenden Sinn: Ist eine Fami” lie von σ-AlgebrenAi ⊂ P(S) gegeben, wo i eine Indexmenge I durchl¨auft, so ist ihr Schnitt i Ai , also das System aller Teilmengen von S, die s¨amtlichen Ai angeh¨ oren, ebenfalls eine σ-Algebra, wie man sofort best¨atigt. Ist also E ⊂ P(S) irgendein Mengensystem, so existiert eine kleinste σ-Algebra σ(E ), die E umfasst, n¨ amlich der Schnitt aller E umfassenden σ-Algebren. (Es gibt stets garantiert mindestens eine solche σ-Algebra, n¨amlich P(S).) Definition IV.1.4 Die soeben beschriebene σ-Algebra σ(E ) heißt die von E erzeugte σ-Algebra, und umgekehrt heißt E ihr Erzeuger. Kommen wir zum wichtigsten Beispiel. Definition IV.1.5 Die vom Ring der Figuren F d erzeugte σ-Algebra heißt die Borel-σ-Algebra auf Rd , in Zeichen Bo (Rd ). Ein Element E ∈ Bo (Rd ) heißt Borelmenge oder auch Borel-messbar. Die Borel-σ-Algebra kann auch anders erzeugt werden. Satz IV.1.6 Setze E0 E1 E2 E3
= = = =
{(−∞, r]: r ∈ R}, {(−∞, r): r ∈ R}, {(−∞, r): r ∈ Q}, {(−∞, r]: r ∈ Q}.
E4 = {A ⊂ R: A offen}, E5 = {A ⊂ R: A abgeschlossen}, E6 = {A ⊂ R: A kompakt},
Dann ist σ(E0 ) = · · · = σ(E6 ) = Bo (R). Eine analoge Aussage gilt f¨ ur Bo (Rd ). Beweis. Wir werden folgende generell g¨ ultigen Schlussweisen benutzen: • Wenn E ⊂ E ′ , dann auch σ(E ) ⊂ σ(E ′ ). • Wenn E ⊂ A und A eine σ-Algebra ist, dann auch σ(E ) ⊂ A . σ(E3 ) = σ(E0 ): Hier ist ⊂“ wegen E3 ⊂ E0 klar, und f¨ ur die umgekehrte ” Inklusion reicht es, E0 ⊂ σ(E3 ) zu zeigen.Dazu w¨ahle zu r ∈ R rationale Zahlen rn > r mit rn → r. Dann ist (−∞, r] = n (−∞, rn ] ∈ σ(E3 ).
IV.1
σ-Algebren
213
σ(E2 ) = σ(E3 ): F¨ ur die Inklusion ⊃“ zeige wie oben E3 ⊂ σ(E 2 ): W¨ahle zu ” r ∈ Q rationale Zahlen rn > r mit rn → r. Dann ist (−∞, r] = n (−∞, rn ) ∈ σ(E2 ). Umgekehrt zeige E2 ⊂ σ(E3 ): Zu r ∈ Q w¨ahle rationale Zahlen rn < r mit rn → r. Dann ist (−∞, r) = n (−∞, rn ] ∈ σ(E3 ). σ(E1 ) = σ(E0 ) geht genauso. ur die umgeσ(E4 ) = σ(E0 ): Wegen E1 ⊂ E4 folgt σ(E0 ) = σ(E1 ) ⊂ σ(E4 ). F¨ kehrte Inklusion bemerken wir zun¨ achst, dassjede offene Menge A abz¨ahlbare Vereinigung offener Intervalle ist, denn A = (ri , rj ), wo (ri ) eine Aufz¨ahlung von Q ist und sich die Vereinigung u ¨ ber diejenigen Intervalle erstreckt, die in A liegen. (Das ist eine abz¨ ahlbare Vereinigung.) Nun liegt jedes offene Intervall in σ(E0 ) = σ(E1 ), denn (r, s) = (−∞, s) ∩ ∁(−∞, r]. Daher gilt E4 ⊂ σ(E0 ) und deshalb σ(E4 ) ⊂ σ(E0 ). σ(E4 ) = σ(E5 ): Da das Komplement einer offenen Menge abgeschlossen ist, gilt E4 ⊂ σ(E5 ). Daher folgt ⊂“, und die Umkehrung zeigt man analog. ” σ(E5 ) = σ(E6 ): Weil kompakte Mengen abgeschlossen sind, ist ⊃“ klar. Die ” Umkehrung folgt, weil eine abgeschlossene Menge A abz¨ahlbare Vereinigung der kompakten Mengen A ∩ [−n, n], n ∈ N, ist. σ(E5 ) = Bo (R): Die eine Inklusion gilt wegen (−∞, r] = n>|r| (−n, r] und die andere wegen (r, s] = (−∞, s] \ (−∞, r]. 2 Der Beweis f¨ ur Rd ist entsprechend zu modifizieren. Zur naheliegenden Frage, ob jede Teilmenge von Rd eine Borelmenge ist, siehe Satz IV.3.16 und die zugeh¨ origen Kommentare; die Antwort lautet jedenfalls nein. Leider ist eine explizite Beschreibung aller Borelmengen nicht m¨oglich; trotzdem kann man Aussagen u ¨ber beliebige Borelmengen auch ohne eine solche konkrete Darstellung beweisen. Hier ein Beispiel. Satz IV.1.7 Ist A0 ⊂ Rd eine Borelmenge und x0 ∈ Rd , so ist auch x0 + A0 := {x0 + a: a ∈ A0 } eine Borelmenge. Beweis. Setze A0 = {A ∈ Bo (Rd ): x0 + A ∈ Bo (Rd )}; es ist dann A0 ∈ A0 zu zeigen. Nun ist F d ⊂ A0 , denn mit A ist auch x0 + A eine Figur, und A0 ist eine σ-Algebra (der Beweis ist kanonisch). Daher ist auch Bo (Rd ) = σ(F d ) ⊂ A0 , 2 und insbesondere ist A0 ∈ A0 . Die in diesem Beweis verwandte Strategie nennt man das Prinzip der guten Mengen. Es funktioniert so: • Zu zeigen ist, dass jedes Element einer gegebenen σ-Algebra A eine gewisse Eigenschaft (X) hat. Dann betrachte A0 := {A ∈ A : A hat (X)} und zeige, dass A0 einen Erzeuger von A enth¨alt und selbst eine σ-Algebra ist. Es folgt dann A0 = A , was zu zeigen war. Dieses Prinzip werden wir noch h¨ aufig anwenden.
214
IV.
Maß- und Integrationstheorie
Bisweilen werden wir nicht Teilmengen des Rd , sondern Teilmengen einer gegebenen Menge E ⊂ Rd betrachten und dort im Sinn der folgenden Definition eine Spur-σ-Algebra“ induzieren. ” Definition IV.1.8 Seien S eine Menge, E ⊂ S und E ⊂ P(S). Man setzt E ∩ E := {A ∈ P(E): es existiert F ∈ E mit A = F ∩ E}; E ∩ E heißt Spur von E auf E. Insbesondere heißt Bo (E) = Bo (Rd ) ∩ E die Borel-σ-Algebra von E. Es ist leicht zu verifizieren, dass die Spur A ∩ E einer σ-Algebra auf einer Menge S in der Tat eine σ-Algebra auf E (freilich nicht auf S) ist. Auch das folgende Lemma ist einfach zu begr¨ unden (Aufgabe IV.10.7). Lemma IV.1.9 (a) Es gilt stets σ(E ∩ E) = σ(E ) ∩ E. (b) F¨ ur E ⊂ Rd wird Bo (E) von den relativ offenen Teilmengen von E erzeugt. (c) Ist E ⊂ Rd eine Borelmenge, so ist Bo (E) = {A ∈ Bo (Rd ): A ⊂ E}.
IV.2
Inhalte und Maße
Als n¨ achstes sollen Funktionen auf Ringen oder σ-Algebren betrachtet werden, die positive Zahlen oder +∞ als Werte annehmen. Dabei benutzen wir folgende Konventionen u ¨ ber das Rechnen mit dem Symbol ∞: a+∞=∞+a=∞+∞=∞
∀a ∈ R.
∞ Ferner schreiben wir f¨ ur eine Reihe positiver Glieder j=1 aj = ∞, falls alle aj < ∞ sind und die Reihe divergiert oder ein aj = ∞ ist. Definition IV.2.1 Sei R ein Ring und µ: R → [0, ∞] mit µ(∅) = 0. (a) µ heißt endlich additiv oder Inhalt, falls f¨ ur je endlich viele paarweise disjunkte A1 , . . . , An ∈ R n n µ(Aj ). Aj = µ j=1
j=1
IV.2
Inhalte und Maße
215
(b) µ heißt σ-additiv oder Pr¨amaß, falls f¨ ur je abz¨ahlbar viele paarweise ∞ disjunkte A1 , , A2 , · · · ∈ R mit j=1 Aj ∈ R ∞ ∞ µ(Aj ). Aj = µ j=1
j=1
(c) Ein auf einer σ-Algebra definiertes Pr¨ amaß heißt Maß. Einige Bemerkungen zu dieser Definition: (1) Die Normierung µ(∅) = 0 dient dazu, das triviale Beispiel µ(A) = ∞ ” f¨ ur alle A“ auszuschließen; sie ergibt sich automatisch f¨ ur einen Inhalt, wenn man nur die Existenz einer Menge A ∈ R mit µ(A) < ∞ voraussetzt, denn µ(A) = µ(A ∪ ∅) = µ(A) + µ(∅). ∞ (2) Im Fall einer σ-Algebra R ist die Bedingung j=1 Aj ∈ R in (b) automatisch erf¨ ullt. Ferner reicht es in (a), die Bedingung f¨ ur n = 2 zu u ufen. ¨ berpr¨ (3) H¨ aufig spricht man von einem Maß auf S statt auf einer σ-Algebra A ⊂ P(S), insbesondere, wenn es klar ist, auf welche σ-Algebra man sich bezieht; so werden wir auf Teilmengen von Rd fast ausnahmslos die Borel-σ-Algebra betrachten. (4) Ein Maß auf A ⊂ P(S) mit µ(S) = 1 wird Wahrscheinlichkeitsmaß genannt; die Interpretation ist dann, dass µ(A) die Wahrscheinlichkeit f¨ ur das Eintreffen des Ereignisses A ist. Insofern ist die Maß- und Integrationstheorie die Grundlage der modernen Stochastik. Als n¨ achstes sollen einige Beispiele und elementare Eigenschaften notiert werden. Beispiele. (a) Sei µ: P(S) → [0, ∞] durch µ(∅) = 0 und µ(A) = 1 f¨ ur A = ∅ definiert. Hat S mehr als ein Element, so ist µ kein Inhalt. (b) Hingegen definiert µ(∅) = 0 und µ(A) = ∞ f¨ ur A = ∅ ein Maß auf der Potenzmenge. (c) Sei s ∈ S und A ⊂ P(S) eine σ-Algebra. Das Dirac-Maß δs ist durch
1 falls s ∈ A δs (A) = 0 sonst f¨ ur A ∈ A definiert. Es ist wirklich ein Maß. (d) Das z¨ahlende Maß auf einer σ-Algebra A ist f¨ ur A ∈ A durch µ(A) = Anzahl der Elemente von A, falls A endlich ist, und µ(A) = ∞, falls A unendlich ist, definiert. Das ist auch wirklich ein Maß. (e) Die L¨ ange eines halboffenen Intervalls ist (nat¨ urlich) λ((a, b]) = b − a.
216
IV.
Maß- und Integrationstheorie
Ist A ∈ F 1 als disjunkte Vereinigung A = (a1 , b1 ] ∪ · · · ∪ (an , bn ] geschrieben, so ist man versucht, A die L¨ ange“ ” n λ(A) = (bj − aj ) j=1
zuzuordnen. Man muss sich nat¨ urlich davon u ¨ berzeugen, dass diese Vorschrift wohldefiniert ist und nicht von der speziellen Wahl der Darstellung von A abh¨ angt (z.B. ist (0, 1] auch als (0, 1/2] ∪ (1/2, 1] darstellbar). Das geht am einfachsten, wenn man mit Hilfe des Riemann-Integrals und der Riemann-integrierbaren Indikatorfunktion3 χA = nj=1 χ(aj ,bj ]
∞
χA (t) dt =
−∞
n j=1
(bj − aj )
schreibt; die Wohldefiniertheit ergibt sich also aus der Linearit¨at des Integrals. Dasselbe Argument zeigt, dass es sich bei λ um einen Inhalt handelt. (f) Allgemeiner wird der d-dimensionale Jordansche Inhalt eines halboffenen Intervalls (a, b] = (α1 , β1 ] × · · · × (αd , βd ] durch λd ((a, b]) = (β1 − α1 ) · · · · · (βd − αd ) erkl¨art, und einer Figur A = nj=1 (aj , bj ] ∈ F d (disjunkte Vereinigung; Lemma IV.1.2(c)) wird dann λd (A) =
n
λd ((aj , bj ])
j=1
zugeordnet. Schreibt man wie oben mit Hilfe iterierter Riemannscher Integrale ∞ ∞ d λ (A) = χA (t1 , . . . , tn ) dt1 . . . dtn , ··· −∞
−∞
so ergibt sich die Wohldefiniertheit und Additivit¨at von λd . Satz IV.2.2 Sei µ ein Inhalt auf einem Ring R. (a) Sind A, B ∈ R mit A ⊂ B, so ist µ(A) ≤ µ(B). ∞ (b) Sind A1 , A2 , · · · ∈ R paarweise disjunkt mit j=1 Aj ∈ R, so ist ∞ ∞ µ(Aj ). Aj ≥ µ j=1
3χ
A (t)
= 1, wenn t ∈ A, und χA (t) = 0 sonst.
j=1
IV.2
Inhalte und Maße
217
(c) Sind A1 , A2 , · · · ∈ R mit
∞
j=1
Aj ∈ R und ist µ sogar σ-additiv, so ist
∞ ∞ µ(Aj ). Aj ≤ µ j=1
j=1
Beweis. (a) Da B = A ∪ (B \ A) eine disjunkte Vereinigung in R ist, folgt µ(B) = µ(A) + µ(B \ A) ≥ µ(A). n (b) Sei n ∈ N beliebig; dann ist ∞ j=1 Aj ⊃ j=1 Aj , also nach (a) n n ∞ µ(Aj ). Aj = Aj ≥ µ µ j=1
j=1
j=1
Da n beliebig war, folgt die Behauptung. (c)Mit B1 = A1 , B2 = A2 \ A1 , B 3 = A3 \ (A1 ∪ A2 ) etc. kann man ∞ ∞ A := j=1 Aj als disjunkte Vereinigung j=1 Bj schreiben; beachte Bj ∈ R sowie Bj ⊂ Aj . Es folgt µ(A) =
∞ j=1
µ(Bj ) ≤
∞
µ(Aj )
j=1
nach (a)
2
Mit dem folgenden Kriterium kann h¨ aufig die σ-Additivit¨at gezeigt werden. Satz IV.2.3 Sei µ ein Inhalt auf einem Ring R. Betrachte die folgenden Eigenschaften: (i) µ ist σ-additiv. ∞ (ii) Sind A1 ⊂ A2 ⊂ · · · ∈ R mit A := j=1 Aj ∈ R, so gilt µ(A) = lim µ(Aj ). j→∞
(iii) Sind A1 ⊃ A2 ⊃ · · · ∈ R mit A :=
∞
j=1
Aj ∈ R, so gilt
µ(A) = lim µ(Aj ). j→∞
(iv) Sind A1 ⊃ A2 ⊃ · · · ∈ R mit
∞
j=1
Aj = ∅, so gilt
lim µ(Aj ) = 0.
j→∞
Dann gelten die Implikationen (i) ⇔ (ii) ⇐ (iii) ⇔ (iv). Wird in (iii) zus¨atzlich µ(A1 ) < ∞ vorausgesetzt, so gilt auch (ii) ⇒ (iii).
218
IV.
Maß- und Integrationstheorie
Beweis. (i) ⇒ (ii): Seien A1 , A2 , . . . und A wie in (ii); setze B1 = A1 , B2 = A2 \ A1 , B3 = A3 \ (A1 ∪A2 ) etc. Dies definiert n eine Folge paarweise disjunkter ∞ Mengen4 in R mit A = j=1 Bj und An = j=1 Bj . Es folgt wegen (i) µ(A) =
∞ j=1
µ(Bj ) = lim
n→∞
n
µ(Bj ) = lim µ(An ).
j=1
n→∞
∞ (ii) ⇒ (i): Sei (Bn ) eine disjunkte Folge in R mit j=1 Bj ∈ R. Auf die Folge der An = B1 ∪ · · · ∪ Bn ist dann (ii) anwendbar, und (i) folgt durch R¨ uckw¨ artslesen des ersten Beweisteils. (iii) ⇒ (iv) ist klar. (iv) ⇒ (iii): Seien A1 , A2 , . . . und A wie in (iii); auf die Folge der An \ A ist dann (iv) anwendbar, und es folgt µ(Aj ) = µ(Aj \ A) + µ(A) → µ(A).
∞ (iv) ⇒ (i): Sei (An ) eine disjunkte Folge in R mit A = j=1 Aj ∈ R; auf ∞ die Folge der Bn = j=n Aj ist dann (iv) anwendbar, so dass µ(A) = µ(A1 ∪ · · · ∪ An−1 ∪ Bn ) =
n−1 j=1
µ(Aj ) + µ(Bn ) →
∞
µ(Aj ).
j=1
Daher ist µ σ-additiv. (ii) ⇒(iii), falls µ(A1 ) < ∞ in (iii): Setze Bn = A1 \ An , so dass B1 ⊂ B2 ⊂ ∞ . . . und j=1 Bj = A1 \ A. Aus (ii) folgt dann µ(A1 \ A) = lim µ(A1 \ Aj ). j→∞
Da jetzt alle µ(Aj ) als endlich vorausgesetzt sind, muss wegen µ(A1 \ Aj ) = µ(A1 ) − µ(Aj ) und µ(A1 \ A) = µ(A1 ) − µ(A) [warum?] auch (iii) gelten. 2 Der in (ii) beschriebene Sachverhalt l¨ asst sich in leicht verst¨andlicher Symbolik auch durch An ր A ⇒ µ(An ) ր µ(A) ausdr¨ ucken. In dieser Schreibweise wird klar, dass σ-Additivit¨at eine Stetigkeitseigenschaft ist. Besonders wichtig in Satz IV.2.3 ist die Implikation (iv) ⇒ (i). Zum Abschluss dieses Abschnitts machen wir einen entscheidenden Schritt auf dem Weg zum Lebesguemaß. Satz IV.2.4 Der Jordansche Inhalt λd ist σ-additiv auf F d . 4 Dazu
werden wir kurz etwas lax eine disjunkte Folge“ sagen. ”
IV.3 Konstruktion von Maßen; das Lebesguemaß
219
Beweis. Wir zeigen Bedingung (iv) aus Satz IV.2.3. Sei also (An ) eine abstei∞ gende Folge in Fd mit n=1 An = ∅. Sei ε > 0 gegeben; es ist dann ein n0 ∈ N mit ∀n ≥ n0 λd (An ) < ε
zu produzieren. Dazu w¨ ahle f¨ ur jedes n ∈ N eine Figur Bn mit Bn ⊂ An und λd (An \ Bn ) ≤ −n 2 ε. (Das erreicht man, indem An etwas verkleinert“ wird.) Nun ist erst ” ∞ recht n=1 Bn = ∅, und die Bn sind Teilmengen des Kompaktums A1 . Wegen der endlichen Durchschnittseigenschaft (Satz I.5.7) existiert ein n0 ∈ N mit n
j=1
F¨ ur Cn =
n
j=1
Bj = ∅
∀n ≥ n0 .
Bj behaupten wir jetzt (Beweis folgt) λd (An \ Cn ) ≤ (1 − 2−n )ε.
(IV.1)
ur n ≥ n0 ist, folgt daraus dann f¨ ur diese n Da Cn = ∅ f¨ λd (An ) ≤ (1 − 2−n )ε < ε, wie gew¨ unscht. Beweisen wir nun (IV.1) durch Induktion nach n. F¨ ur n = 1 stimmt das ur ein n ∈ N; dann ergibt sich nach Konstruktion von B1 . Gelte jetzt (IV.1) f¨ λd (An+1 \ Cn+1 ) = λd (An+1 \ (Cn ∩ Bn+1 )) = λd ((An+1 \ Cn ) ∪ (An+1 \ Bn+1 ))
≤ λd (An+1 \ Cn ) + λd (An+1 \ Bn+1 ) ≤ λd (An \ Cn ) + λd (An+1 \ Bn+1 )
≤ (1 − 2−n )ε + 2−(n+1) ε = (1 − 2−(n+1) )ε;
beim ersten ≤ wurde die f¨ ur Inhalte g¨ ultige Beziehung λd (E ∪ F ) ≤ λd (E) + d 2 λ (F ) (Aufgabe IV.10.9) benutzt und beim zweiten, dass An+1 ⊂ An .
IV.3
Konstruktion von Maßen; das Lebesguemaß
In diesem Abschnitt wird eine auf Carath´eodory zur¨ uckgehende Konstruktion beschrieben, Maße auf σ-Algebren zu erzeugen. Insbesondere wird es m¨oglich sein, den Jordanschen Inhalt zu einem Maß auf Bo (Rd ), dem Lebesguemaß, auszudehnen. Grundlegend ist der folgende technische Begriff.
220
IV.
Maß- und Integrationstheorie
Definition IV.3.1 Eine Funktion α: P(S) → [0, ∞] heißt ¨außeres Maß, wenn (a) α(∅) = 0, (b) A ⊂ B ⇒ α(A) ≤ α(B), ∞ ∞ α(Aj ). Aj ≤ (c) A1 , A2 , · · · ⊂ S ⇒ α j=1
j=1
Einfache Beispiele sind α(A) = 0 f¨ ur A = ∅ und α(A) = 1 sonst bzw. α(A) = 0, falls A h¨ ochstens abz¨ ahlbar, und α(A) = 1 sonst. Die f¨ ur unsere Zwecke wichtigste Beispielklasse wird durch den folgenden Satz geliefert. Satz IV.3.2 Sei µ: R → [0, ∞] ein Inhalt auf einem Ring R ⊂ P(S). F¨ ur A ⊂ S setze ∞ µ(Ej ), µ∗ (A) = inf j=1
wobei das Infimum u ¨ber alle Folgen (Ej ) in R mit A ⊂ ist, bzw. µ∗ (A) = ∞,
∞
j=1
Ej zu erstrecken
wenn es gar keine solchen Folgen gibt. Dann ist µ∗ ein ¨ außeres Maß.
ur die (a) und Beweis. Offenbar ist µ∗ eine Abbildung von P(S) nach [0, ∞], f¨ (b) aus Definition IV.3.1 gelten. Um (c) zu zeigen, d¨ urfen wir f¨ ur die dortigen Aj stets µ∗ (Aj ) < ∞ annehmen, da andernfalls die Behauptung trivial ist. Es gibt daher zu ε > 0 Mengen Eij ∈ R mit Aj ⊂ Daher ist ∗
µ
∞
j=1
∞
j=1
Aj ⊂
Aj ≤
∞
Eij ,
i=1
∞
i,j=1
∞
i,j=1
µ∗ (Aj ) ≥
∞ i=1
µ(Eij ) − 2−j ε.
Eij und
µ(Eij ) ≤
∞
∗
(µ (Aj ) + 2
j=1
−j
ε) =
∞
µ∗ (Aj ) + ε.
j=1
Da ε > 0 beliebig war, zeigt das die Behauptung.
2
Obwohl ein ¨ außeres Maß im allgemeinen weit davon entfernt ist, additiv (geschweige denn σ-additiv) zu sein, f¨ uhren geeignete Einschr¨ankungen von ¨außeren Maßen in der Tat zu Maßen. Der folgende Begriff ist nun hilfreich. Definition IV.3.3 Sei α: P(S) → [0, ∞] ein ¨ außeres Maß. Dann heißt A ⊂ S α-messbar, wenn α(Q) = α(Q ∩ A) + α(Q ∩ ∁A)
∀Q ⊂ S.
Mα bezeichnet die Menge aller α-messbaren Teilmengen von S.
(IV.2)
IV.3
Konstruktion von Maßen; das Lebesguemaß
221
Um diese Bedingung zu verstehen, betrachten wir S = R2 und eine beschr¨ ankte Menge A ⊂ R2 , etwa A ⊂ [0, 1]2 , sowie α = (λ2 )∗ . Verlangt man (IV.2) nur f¨ ur Q = [0, 1]2 , so wird 1 = (λ2 )∗ (A) + (λ2 )∗ (Q \ A) verlangt, d.h. 2 ∗ (λ ) (A) = 1−(λ2 )∗ (Q\A). Die rechte Seite kann, wenn man dem Vorgehen der Riemannschen Integrationstheorie im Rd folgt, als inneres Maß von A interpretiert werden. Daher ist (IV.2) eine raffinierte Variante der Forderung ¨außeres ” Maß = inneres Maß“. Satz IV.3.4 F¨ ur ein ¨außeres Maß α ist Mα eine σ-Algebra, und α definiert ein Maß auf Mα . Beweis. Die ersten beiden Bedingungen aus Definition IV.1.1(b) sind f¨ ur Mα klarerweise erf¨ ullt. Der Rest ist recht knifflig. Wir bemerken zuerst, dass es in (IV.2) reicht, ≥“ zu zeigen, da die andere ” Ungleichung als Folge der Bedingungen (a) und (c) an ein ¨außeres Maß stes erf¨ ullt ist. Als erstes wird jetzt A, B ∈ Mα
⇒
A ∪ B ∈ Mα
(IV.3)
gezeigt, woraus induktiv folgt, dass Mα ein Ring ist. Zum Beweis hierf¨ ur sei Q ⊂ S. Da B ∈ Mα ist, gilt α(Q ∩ ∁A) = α(Q ∩ ∁A ∩ B) + α(Q ∩ ∁A ∩ ∁B).
(IV.4)
Ferner ist Q ∩ (A ∪ B) = (Q ∩ A) ∪ (Q ∩ ∁A ∩ B); da α ein ¨ außeres Maß ist, ergibt sich α(Q ∩ (A ∪ B)) ≤ α(Q ∩ A) + α(Q ∩ ∁A ∩ B).
(IV.5)
(IV.4) und (IV.5) zusammen zeigen α(Q ∩ (A ∪ B)) + α(Q ∩ ∁(A ∪ B)) ≤ α(Q ∩ A) + α(Q ∩ ∁A ∩ B) + α(Q ∩ ∁A ∩ ∁B) = α(Q ∩ A) + α(Q ∩ ∁A) = α(Q)
(letzteres wegen A ∈ Mα ), wie gew¨ unscht. Ersetzt man in der letzten Gleichung Q durch Q ∩ (A ∪ B) und nimmt man A und B disjunkt an, so ergibt sich α(Q ∩ (A ∪ B)) = α(Q ∩ A) + α(Q ∩ B)
222
IV.
Maß- und Integrationstheorie
und daraus induktiv f¨ ur je endlich viele paarweise disjunkte A1 , . . . , An ∈ Mα und Q ⊂ S n n α(Q ∩ Aj ). Aj = α Q∩ j=1
(IV.6)
j=1
Nun k¨ onnen wir die σ-Additivit¨ at von α auf Mα beweisen. Seien dazu ∞ A1 , A2 , · · · ∈ Mα paarweise disjunkt und A = j=1 Aj ; wir zeigen, dass A ∈ Mα ∞ n und α(A) = j=1 α(Aj ). Setze Bn = j=1 Aj ; wegen (IV.3) ist Bn ∈ Mα , also gilt f¨ ur Q ⊂ S nach (IV.6) und weil Bn ⊂ A α(Q) = α(Q ∩ Bn ) + α(Q ∩ ∁Bn ) n = α(Q ∩ Aj ) + α(Q ∩ ∁Bn ) j=1
≥
n j=1
α(Q ∩ Aj ) + α(Q ∩ ∁A)
und deshalb α(Q) ≥
∞ j=1
α(Q ∩ Aj ) + α(Q ∩ ∁A) ≥ α(Q ∩ A) + α(Q ∩ ∁A)
wegen Eigenschaft (c) eines ¨ außeren Maßes. Das zeigt A ∈ Mα nach der Vorbemerkung des Beweises. Folglich gilt in der letzten Ungleichungskette sogar ∞ Gleichheit, was f¨ ur Q = A genau α(A) = j=1 α(Aj ) besagt. Es bleibt zu zeigen, dass Mα die Bedingung (iii) einer σ-Algebra erf¨ ullt. Seien dazu B1 , B2 , · · · ∈ Mα . Setze A1 = B1 , A2 = B2 \ B1 , A3 = B3 \ (B1 ∪ B2 ) etc. Die Aj sind dann paarweise disjunkt und liegen ∞ wegen (IV.3) in Mα , und der letzte Beweisschritt hat f¨ ur solche Mengen j=1 Aj ∈ Mα gezeigt. Aber ∞ ∞ andig. 2 j=1 Aj = j=1 Bj , und der Beweis ist vollst¨ Ist ein Inhalt µ auf einem Ring R vorgelegt, so ist das gem¨aß Satz IV.3.2 urlich, ob R ⊂ zugeh¨ orige ¨ außere Maß µ∗ auf Mµ∗ σ-additiv. Es fragt sich nat¨ Mµ∗ gilt und, wenn ja, was µ∗ (A) mit µ(A) zu tun hat. Als entscheidende Bedingung stellt sich die σ-Additivit¨ at von µ heraus, was im folgenden zentralen Satz dieses Abschnitts formuliert wird.
Theorem IV.3.5 (Fortsetzungssatz von Carath´eodory) Sei R ⊂ P(S) ein Ring und µ: R → [0, ∞] ein Pr¨amaß. Dann kann µ zu einem Maß µ ¯ auf die von R erzeugte σ-Algebra fortgesetzt werden. Genauer ¯ kann also als gilt: Jedes A ∈ R ist µ∗ -messbar, und es ist µ∗ (A) = µ(A). µ Einschr¨ankung von µ∗ auf σ(R) gew¨ahlt werden; µ kann sogar zu einem Maß auf Mµ∗ fortgesetzt werden.
IV.3
Konstruktion von Maßen; das Lebesguemaß
223
Beweis. Zuerst zeigen wir, dass µ∗ (A) = µ(A) f¨ ur alle A ∈ R gilt. Hier folgt ≤“ ” ¨ sofort, da A, ∅, ∅, . . . eine zul¨ assige Uberdeckung von A ist. F¨ ur die umgekehrte ∗ Ungleichung ist im Fall µ (A) = ∞ nichtszu zeigen; also d¨ urfen wir die Existenz ∞ von Mengen A1 , A2 , · · · ∈ R mit A ⊂ j=1 Aj annehmen. Es ist dann A = ∞ j=1 (A ∩ Aj ), und Satz IV.2.2 impliziert µ(A) ≤
∞ j=1
µ(A ∩ Aj ) ≤
∞
µ(Aj ),
j=1
¨ denn µ ist σ-additiv. Durch Ubergang zum Infimum folgt µ(A) ≤ µ∗ (A). Jetzt wird R ⊂ Mµ∗ bewiesen. Sei A ∈ R und sei Q ⊂ S. Es ist zu zeigen, dass µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ ∁A); vgl. den Beweis von Satz IV.3.4. Das ist wieder klar im Fall µ∗ (Q) = ∞; daher k¨onnen wir wieder die Existenz von Mengen A1 , A2 , · · · ∈ R mit Q ⊂ ∞ j=1 Aj ∞ annehmen. Da ja Q ∩ A ⊂ ∞ (A ∩ A) sowie Q ∩ ∁A ⊂ (A ∩ ∁A) = j j j=1 j=1 ∞ ¨ j=1 (Aj \ A) Uberdeckungen mit Mengen in R sind, gilt ∞ j=1
µ(Aj ) =
∞ j=1
µ(Aj ∩ A) +
∞ j=1
µ(Aj ∩ ∁A) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ ∁A),
was die Behauptung zeigt. Um den Beweis von Theorem IV.3.5 abzuschließen, bleibt jetzt nur noch, Satz IV.3.4 anzuwenden. 2 Im Rest dieses Abschnitts soll die Frage der Eindeutigkeit der Fortsetzung µ ¯ besprochen werden. Dazu zuerst zwei Gegenbeispiele: (a) Sei S eine u ahlbare Menge, und R ⊂ P(S) sei der Ring der ¨berabz¨ endlichen Teilmengen von S sowie µ: R → [0, ∞] der triviale Inhalt µ = 0. Da die von R erzeugte σ-Algebra die σ-Algebra der abz¨ahlbaren und koabz¨ahlbaren Mengen ist (Beispiel IV.1(c)), ist f¨ ur jedes r ∈ [0, ∞]
0 falls A abz¨ ahlbar µr (A) = r falls A u ¨ berabz¨ahlbar eine Fortsetzung von µ zu einem Maß auf σ(R). Es ist instruktiv, sich zu u ¨ berlegen, welche Fortsetzung Theorem IV.3.5 liefert. (b) Betrachte Q und die σ-Algebra P(Q). Die Spur (Definition IV.1.8) von F 1 auf Q ist ein Erzeuger von P(Q), auf dem das z¨ahlende Maß µ und 2µ u ¨ bereinstimmen. Offenbar ist f¨ ur die Nichteindeutigkeit im ersten Gegenbeispiel verantwortlich, dass die Mengen in R die Menge S nicht erreichen“, im zweiten Gegen” beispiel ist es die starke Unendlichkeit“ von µ auf R. Wir betrachten jetzt ” Mengenfunktionen, die diese Defekte nicht aufweisen.
224
IV.
Maß- und Integrationstheorie
Definition IV.3.6 Eine Funktion µ: S → [0, ∞] auf einem Mengensystem S ⊂ P(S) heißt σ-endlich, wenn es eine aufsteigende Folge A1 ⊂ A2 ⊂ . . . von ∞ Mengen in S mit µ(An ) < ∞ f¨ ur alle n und n=1 An = S gibt.
Zum Beispiel ist der Jordansche Inhalt auf F d σ-endlich, desgleichen ist es das z¨ ahlende Maß auf P(Q), nicht jedoch auf dessen Erzeuger F 1 ∩ Q. Offensichtlich ist ein endliches Maß auf einer σ-Algebra σ-endlich. Unser Ziel ist es zu zeigen, dass f¨ ur σ-endliche µ die Fortsetzung µ ¯ in Theorem IV.3.5 eindeutig bestimmt ist. Zuerst ein allgemeiner Eindeutigkeitssatz; darin nennen wir ein Mengensystem E ∩-stabil, wenn mit zwei Mengen auch deren Durchschnitt zu E geh¨ ort. Satz IV.3.7 Sei E ein ∩-stabiler Erzeuger einer σ-Algebra A ⊂ P(S), und µ und ν seien endliche Maße auf A , die auf E ∪ {S} ¨ ubereinstimmen. Dann ist µ = ν. Die Beweisidee ist einfach: Nach der Philosophie des Prinzips der guten Mengen (Seite 213) betrachte D = {A ∈ A : µ(A) = ν(A)}. Nach Voraussetzung enth¨ alt D einen Erzeuger von A , und man m¨ochte D als σ-Algebra entlarven. In der Tat sieht man sofort (a) ∅ ∈ D, S ∈ D, (b) A ∈ D ⇒ ∁A ∈ D, ∞ (c) A1 , A2 , · · · ∈ D paarweise disjunkt ⇒ j=1 Aj ∈ D. Wenn man die Disjunktheit in (c) losw¨ urde, w¨ are man fertig. Das gelingt mit einer raffinierten Methode, die jetzt beschrieben werden soll. Definition IV.3.8 Ein Mengensystem mit den obigen Eigenschaften (a), (b) und (c) heißt Dynkinsystem. Offenbar ist jede σ-Algebra ein Dynkinsystem (aber nicht umgekehrt, Aufgabe IV.10.16), und es existiert zu E ⊂ P(S) ein kleinstes Dynkinsystem d(E ), das E umfasst (der Beweis ist kanonisch). Satz IV.3.9 Ist E ∩-stabil, so gilt σ(E ) = d(E ). Beweis. Wir werden nacheinander zeigen: (1) Ist D ein Dynkinsystem und sind D1 , D2 ∈ D mit D1 ⊂ D2 , so ist D2 \ D1 ∈ D. (2) Ein ∩-stabiles Dynkinsystem D ist eine σ-Algebra. (3) Mit E ist auch d(E ) ∩-stabil. Daraus folgt die Behauptung des Satzes.
IV.3
Konstruktion von Maßen; das Lebesguemaß
225
Zu (1): Es ist D2 \ D1 = D2 ∩ ∁D1 = ∁(∁D2 ∪ D1 ) = ∁(∁D2 ∪ D1 ∪ ∅ ∪ ∅ ∪ . . . ) ∈ D, denn die Vereinigung ist disjunkt. Zu (2): Seien A1 , A2 , · · · ∈ D. Wie schon mehrfach zuvor, disjunktifizieren“ ” wir die Aj durch B1 = A1 , B2 = A2 \ A1 , B3 = A3 \ (A 1 ∪ A2 ) etc.Nun beachte ∞ Bn = An ∩ ∁A1 ∩ · · · ∩ ∁An−1 ∈ D, so dass in der Tat j=1 Aj = ∞ j=1 Bj ∈ D. Zu (3): Sei D ∈ d(E ). Wir haben d(E ) ⊂ DD := {Q ∈ d(E ): Q ∩ D ∈ d(E )} zu zeigen. Zun¨ achst ist DD ein Dynkinsystem, denn (a) und (c) aus der Definition sind offensichtlich, und f¨ ur (b) verwende (1): Q ∈ DD
∁Q ∩ D = D \ Q = D \ (Q ∩ D) ∈ d(E ).
⇒
Es reicht daher, E ⊂ DD f¨ ur alle D ∈ d(E ) zu zeigen. Dem Prinzip der guten Mengen folgend setzen wir D := {D ∈ d(E ): E ⊂ DD }. Wie oben sieht man, dass D ein Dynkinsystem ist, und D umfasst E , denn E ist ∩-stabil. Es folgt d(E ) ⊂ D, wie gew¨ unscht. 2 Dieser Satz impliziert sofort Satz IV.3.7, denn das in dessen Anschluss vorgeschlagene Mengensystem D ist ein Dynkinsystem, das einen ∩-stabilen Erzeuger von A umfasst; daher ist A = σ(E ) = d(E ) ⊂ D ⊂ A , d.h. D = A . Satz IV.3.7 l¨ asst folgende wichtige Verallgemeinerung zu. Satz IV.3.10 Seien µ und ν Maße auf einer σ-Algebra A , die auf einem ∩stabilen Erzeuger E von A u ¨bereinstimmen. Ferner sei µ (und folglich ν) σendlich auf E . Dann ist µ = ν. Beweis. Nach Voraussetzung existieren Teilmengen E1 ⊂ E2 ⊂ . . . in E mit ∞ E ur alle n. Setze µn (A) = µ(A ∩ En ) n=1 n = S und µ(En ) = ν(En ) < ∞ f¨ und νn (A) = ν(A ∩ En ) f¨ ur A ∈ A ; Satz IV.3.7 impliziert µn = νn f¨ ur alle n, w¨ahrend Satz IV.2.3 µ(A) = lim µ(A ∩ En ) = lim ν(A ∩ En ) = ν(A) n→∞
f¨ ur alle A ∈ A liefert.
n→∞
2
Korollar IV.3.11 Ist unter den Voraussetzungen von Theorem IV.3.5 µ auf R σ-endlich, so ist µ∗ |σ(R) die einzige σ-additive Fortsetzung von µ auf σ(R).
226
IV.
Maß- und Integrationstheorie
Jetzt sind wir in der Lage, ein Beispiel f¨ ur ein nichttriviales Maß anzugeben; die bisherigen Resultate (Satz IV.2.4, Theorem IV.3.5 und Korollar IV.3.11) implizieren n¨ amlich folgendes Ergebnis (f¨ ur den letzten Teil beachte noch Lemma IV.1.2(c)). Satz IV.3.12 Es gibt genau ein Maß λd auf Bo (Rd ), das (halboffenen) Intervallen ihren Jordanschen Inhalt zuordnet. F¨ ur eine Borelmenge A ist λd (A) = inf
∞
λd (Ij ),
j=1
wobei das Infimum ¨ uber alle Folgen halboffener Intervalle Ij mit A ⊂ erstrecken ist.
j Ij
zu
λd heißt (d-dimensionales) Lebesguemaß, genauer Borel-Lebesgue-Maß. Ist S ∈ Bo (Rd ), so kann λd auf naheliegende Weise auch als Maß auf Bo (S) aufgefasst werden, da ja eine Teilmenge A von S genau dann in Bo (Rd ) liegt, wenn sie in Bo (S) liegt (Lemma IV.1.9(c)). Etwas ungenau spricht man dann auch vom Lebesguemaß auf S. Wir wollen begr¨ unden, dass f¨ ur jedes Intervall I (und nicht nur f¨ ur die halboffenen) λd (I) das Produkt der Kantenl¨ angen ist. Ist etwa I = [α1 , β1 ] × · · · × [αd , β (α1 − n1 , β1 ] × · · · × (αd − n1 , βd ]; es folgt d ] abgeschlossen, so setze In = d I = n In und wegen Satz IV.2.3 λ (I) = limn λd (In ) = (b1 − a1 ) · · · · · (bd − ad ). Ein ¨ ahnliches Argument funktioniert f¨ ur offene Intervalle. Es folgen einige Eigenschaften von λd . Satz IV.3.13 Das Lebesguemaß ist translationsinvariant, d.h. es gilt λd (x+ A) ur alle x ∈ Rd und alle A ∈ Bo (Rd ). = λd (A) f¨ Beweis. Wir wissen bereits aus Satz IV.1.7, dass mit A auch x + A eine Borelmenge ist. Definiert man nun µ: Bo (Rd ) → [0, ∞] durch µ(A) = λd (x + A), so ist µ ein Maß, das mit λd auf allen halboffenen Intervallen u ¨bereinstimmt. Die Eindeutigkeitsaussage in Satz IV.3.12 liefert µ = λd , was zu zeigen war. 2 Dieser Satz gestattet folgende Umkehrung. Satz IV.3.14 Ist µ ein translationsinvariantes Maß auf Bo (Rd ) mit c := µ((0, 1]d ) < ∞, so ist µ = c · λd . Beweis. Durch fortgesetztes Halbieren oder Verdoppeln folgt aus der Translationsinvarianz, dass µ und c · λd auf allen Intervallen der Form (α1 , β1 ] × · · · × (αd , βd ] u ur geeignete ganz¨ bereinstimmen, wobei αj und βj von der Form m2n f¨ zahlige m und n sind. Es sei E das System aller endlichen Vereinigungen solcher Intervalle. Dann ist E ein ∩-stabiler Erzeuger von Bo (Rd ). Satz IV.3.10 liefert nun die Behauptung. 2 Die im folgenden Satz ausgedr¨ uckte Eigenschaft des Lebesguemaßes wird seine Regularit¨at oder Straffheit genannt.
IV.3
Konstruktion von Maßen; das Lebesguemaß
227
Satz IV.3.15 F¨ ur jede Borelmenge A ⊂ Rd gilt λd (A) = inf{λd (O): A ⊂ O, O offen} = sup{λd (C): C ⊂ A, C kompakt}. Beweis. Zuerst zur ersten Gleichung, der ¨außeren Regularit¨at. Hier ist ≤“ klar. ” zeigen. Andernfalls Ist λd (A) = ∞, so ist nichts zu d existieren zu ε > 0 halboffene Intervalle I1 , I2 , . . . mit A ⊂ n In und n λ (In ) ≤ λ(A) + ε. Indem man jedes In durch ein etwas gr¨ oßeres offenes Intervall dJn ersetzt, erh¨alt man offene λ (Jn ) ≤ λ(A) + 2ε. Nun ist J und , J , . . . mit A ⊂ Intervalle J 1 2 n n n O := n Jn offen, es ist A ⊂ O sowie λd (O) ≤ n λd (Jn ) ≤ λ(A) + 2ε. Damit ist die ¨ außere Regularit¨ at gezeigt. Nun zur zweiten Gleichung, der inneren Regularit¨at ; hier ist ≥“ klar. Wir ” zeigen als erstes die innere Regularit¨ at f¨ ur beschr¨ankte Borelmengen. Ist n¨amlich A ⊂ {x: x ≤ r} =: Br , so existiert zu ε > 0 nach dem ersten Teil eine offene Menge O ⊃ Br \A mit λd (O) ≤ λd (Br \A)+ε. Dann ist C := Br \O = Br ∩∁O abgeschlossen und beschr¨ ankt, also kompakt, es ist C ⊂ A und λd (A) ≤ λd (C) + ε. Sei schließlich A ∈ Bo (Rd ) beliebig. Setze An = A ∩ Bn , und w¨ahle nach dem soeben Bewiesenen kompakte Mengen Cn ⊂ An mit λd (An \ Cn ) → 0. Es folgt λd (Cn ) → λd (A), und zwar sowohl, wenn λd (A) < ∞ ist, als auch, wenn λd (A) = ∞ ist. Damit ist auch die innere Regularit¨at gezeigt. 2 Als n¨ achstes werden wir mit Hilfe des Auswahlaxioms begr¨ unden, dass es nicht Borel-messbare Teilmengen von Rd gibt. Um die Notation einfach zu halten, beschr¨ anken wir uns auf den Fall d = 1. Satz IV.3.16 Es gibt eine nicht Borel-messbare Teilmenge von [0, 1]. ¨ Beweis. Auf [0, 1] f¨ uhre die Aquivalenzrelation x∼y
⇔
x−y ∈Q
ein. Nach dem Auswahlaxiom gibt es eine Teilmenge A ⊂ [0, 1], die aus jeder ¨ Aquivalenzklasse genau einen Vertreter enth¨ alt. Ist {r1 , r2 , . . . } eine Aufz¨ahlung von Q ∩ [−1, 1], so gilt offenbar [0, 1] ⊂
∞
(rn + A) ⊂ [−1, 2],
n=1
und die Vereinigung ist nach Wahl von A disjunkt. W¨are A Borel-messbar, so folgte aus der Translationsinvarianz ∞ ∞ ∞ 3≥λ (rn + A) = λ(rn + A) = λ(A), n=1
n=1
n=1
228
IV.
Maß- und Integrationstheorie
was λ(A) = 0 impliziert und damit den Widerspruch 1 ≤ λ ∞ n=1 (rn + A) = 0 liefert. 2 Damit ist noch keine nichtborelsche Teilmenge konstruiert ; das ist auch sehr viel schwieriger, siehe Behrends [1987], S. 236ff., insbesondere S. 249. Da in Aufgabe IV.10.15 gezeigt wird, dass das Lebesguemaß auch auf der σ-Algebra M(λd )∗ , der σ-Algebra der sogenannten Lebesgue-messbare Mengen, translationsinvariant ist, zeigt das Argument von Satz IV.3.16, dass es auch nicht Lebesgue-messbare Mengen gibt. Diese Aussage ist jedoch vom Standpunkt der Grundlagen anders zu bewerten als die u ¨ber Borelmengen, da man zur Gewinnung nichtlebesguescher Mengen auf jeden Fall gewisse Axiome der Mengenlehre ben¨ otigt, wie z.B. das Auswahlaxiom. Wir wollen das Beispielreservoir f¨ ur Maße auf Bo (R) noch ein wenig ausdehnen. Das Lebesguemaß ist dasjenige Maß, das von der u ¨blichen L¨angenmessung abgeleitet ist. Was passiert bei einer gewichteten L¨angenmessung? Es sei F : R → R eine monoton wachsende rechtsseitig stetige Funktion; es gilt also lim F (t) = F (t0 )
t→t0 t>t0
∀t0 ∈ R.
Einem halboffenen Intervall werde die gewichtete L¨ange µF ((a, b]) = F (b) − F (a) zugeordnet. Mit demselben Argument wie f¨ ur das Lebesguemaß erh¨alt man eine eindeutig bestimmte Fortsetzung zu einem Maß µF auf Bo (Rd ); solch ein Maß heißt Lebesgue-Stieltjes-Maß. F¨ ur den Beweis der σ-Additivit¨at von µF auf F 1 ben¨ otigt man u ¨ brigens die rechtsseitige Stetigkeit von F . Umgekehrt kann man zeigen, dass ein Maß auf Bo (R), das auf kompakten Mengen endlich ist, ein Lebesgue-Stieltjes-Maß ist.
IV.4
Messbare Funktionen
Wir beginnen mit einer Vokabel: Ist S eine nicht leere Menge und A ⊂ P(S) eine σ-Algebra, so heißt das Paar (S, A ) ein messbarer Raum; es ist hier noch nicht von einem Maß die Rede. Definition IV.4.1 Seien (S1 , A1 ) und (S2 , A2 ) messbare R¨aume und T : S1 → S2 eine Abbildung. Dann heißt T messbar (genauer A1 -A2 -messbar), falls T −1 (B) = {s ∈ S1 : T (s) ∈ B} ∈ A1
∀B ∈ A2 .
Besonders wichtig ist der Fall (S2 , A2 ) = (R, Bo (R)); in diesem Fall spricht man von Borel-messbaren Funktionen.
IV.4
Messbare Funktionen
229
¨ Man beachte die Ahnlichkeit zwischen dieser Definition und der Definition von stetigen Abbildungen zwischen topologischen R¨aumen. Das folgende Lemma wird es erm¨ oglichen, eine große Anzahl von Beispielen anzugeben. Lemma IV.4.2 Seien (Si , Ai ) messbare R¨aume, i = 1, 2, 3. (a) Eine Abbildung T : S1 → S2 ist genau dann messbar, wenn T −1 (B) ∈ A1 (b) (c) (d)
(e)
∀B ∈ E
f¨ ur einen Erzeuger E der σ-Algebra A2 gilt. Sind T1 : S1 → S2 und T2 : S2 → S3 messbar, so auch T2 ◦ T1 : S1 → S3 . Stetige Abbildungen T : Rm → Rd sind messbar bzgl. der Borelschen σ-Algebren. Sei πj : Rd → R die Projektion (x1 , . . . , xd ) → xj . Dann ist eine Abbildung T : S1 → Rd genau dann Borel-messbar, wenn alle πj ◦ T : S1 → R es sind. Eine Funktion f : S1 → R ist genau dann Borel-messbar, wenn {s: f (s) ≤ r} ∈ A1
∀r ∈ R.
Beweis. (a) Das geht mit dem Prinzip der guten Mengen (Seite 213). Setzt man ufen, dass es sich B = {B ∈ A2 : T −1 (B) ∈ A1 }, so ist es sehr einfach nachzupr¨ dabei um eine σ-Algebra handelt, denn T −1 l¨ asst sich durch die megentheoretischen Operationen ∩, ∪ und ∁ durchziehen. Nach Voraussetzung umfasst B einen Erzeuger von A2 , also folgt B = A2 . (b) Ist B ∈ A3 , so ist T2−1 (B) ∈ A2 und deshalb (T2 ◦ T1 )−1 (B) = T1−1 (T2−1 (B)) ∈ A1 . (c) Ist T stetig, so ist f¨ ur eine offene Menge B ⊂ Rd das Urbild T −1 (B) offen und insbesondere eine Borelmenge. Die Behauptung folgt nun aus (a), da Bo (Rd ) von den offenen Mengen erzeugt wird (Satz IV.1.6). (d) Da die πj stetig sind, ergibt sich die Hinl¨anglichkeit aus (b) und (c). Seien nun alle πj ◦ T messbar. F¨ ur ein Intervall B = (α1 , β1 ] × · · · × (αd , βd ] = d d −1 −1 π ((α , β ]) gilt dann T (B) = j=1 (πj ◦T )−1 ((αj , βj ]) ∈ A1 , und nach j j j=1 j Teil (a) ist T messbar, da ja die Intervalle Bo (Rd ) erzeugen. (e) ist nach Satz IV.1.6 ein Spezialfall von (a). 2 Im u ¨brigen erlaubt Satz IV.1.6, weitere Spezialf¨alle zu formulieren, die wir im folgenden auch stillschweigend benutzen werden. Ferner l¨asst sich bei gleichem Beweis wie in (c) zeigen, dass f¨ ur S ⊂ Rm eine stetige Abbildung T : S → Rd Borel-messbar ist. Formulieren wir einige einfache Beipiele.
230
IV.
Maß- und Integrationstheorie
(a) Konstante Abbildungen sind stets messbar. (b) Die Indikatorfunktion χA einer Menge, definiert durch
0 falls s ∈ / A, χA (s) = 1 falls s ∈ A, ist genau dann A -Borel-messbar, wenn A ∈ A ist. Offenbar ist das der einfachste Typ einer messbaren Funktion. Umgekehrt l¨ asst sich jede messbare Funktion aus ihnen zusammensetzen (vgl. Satz IV.4.6). (c) Sei x0 ∈ Rd fest und T : Rd → Rd die Translationsabbildung T (y) = y − x0 . Da offenbar T −1 (A) = x0 + A ist, erhalten wir aus der Stetigkeit von T einen neuen Beweis f¨ ur Satz IV.1.7. Im folgenden soll die wichtige Konvention getroffen werden, dass Rd – sofern nichts anderes angedeutet wird – stets mit der Borel-σ-Algebra versehen wird; der Messbarkeitsbegriff bezieht sich also immer auf (Rd , Bo (Rd )). Satz IV.4.3 Sei (S, A ) ein messbarer Raum, und f, g: S → R seien messbar. Dann sind f + g, f − g, f · g, max(f, g), min(f, g), f + := max(f, 0), f − := max(−f, 0), |f |, αf f¨ ur α ∈ R und 1/f (falls stets f (s) = 0) ebenfalls messbar. Insbesondere bilden die messbaren Funktionen einen Vektorraum. Beweis. Die Abbildung ϕ: R2 → R, ϕ(x, y) = x + y, ist stetig, und nach Satz IV.4.2(d) ist F : S → R2 , F (s) = (f (s), g(s)), messbar. Daher ist nach Satz IV.4.2(b) und (c) das Kompositum ϕ ◦ F = f + g ebenfalls messbar. Genauso funktionieren die Beweise f¨ ur Differenz, Produkt, Maximum und Minimum; bemerke dazu max{x, y} = 12 (x + y) + 21 |x − y|, was die Stetigkeit von max auf R2 zeigt. f + , f − und αf sind Spezialf¨ alle, und schließlich ist |f | = f + + f − . Der Fall ¨ 1/f bleibt zur Ubung. 2 Wegen Satz IV.4.2(e) tauchen oft Mengen der Form {s: f (s) ≤ r} bzw. {s: f (s) ∈ B} bei der Diskussion der Messbarkeit auf. F¨ ur solche Mengen werden wir in Zukunft abk¨ urzend {f ≤ r}
bzw.
{f ∈ B}
schreiben. Entsprechend ist {f = g} etc. zu verstehen. Insbesondere folgt aus Satz IV.4.3, dass f¨ ur messbare Funktionen die Mengen {f = g}, {f ≤ g} etc. messbar sind (d.h. in A liegen) (Aufgabe IV.10.23). Wenden wir uns nun Folgen messbarer Funktionen zu. Folgende Erweiterung des Begriffs der Borel-Messbarkeit erweist sich dabei als praktisch. Man l¨asst nun [−∞, ∞]-wertige Funktionen zu und versieht R := [−∞, ∞] mit der σ-Algebra aller Teilmengen der Form A ∪ E, wobei A ⊂ R borelsch sowie E ⊂ {−∞, ∞} ist. Es ist dann leicht zu sehen, dass das wirklich eine σ-Algebra ist, die zum
IV.4
Messbare Funktionen
231
Beispiel von den Intervallen [−∞, r], r ∈ R, erzeugt wird. Wir wollen sie die Borel-σ-Algebra von R nennen. Eine Funktion f : S → R ist daher genau dann messbar, wenn {−∞ ≤ f ≤ r} ∈ A ∀r ∈ R gilt (Beweis?). Der Grund f¨ ur die Einf¨ uhrung R-wertiger Funktionen liegt haupts¨achlich darin, dass dann die Funktion sup fn (s) = sup fn (s) n
n
stets definiert sind. Außer den bereits getroffenen Vereinbarungen u ¨ ber die Addition von ∞ (Seite 214) ben¨ otigen wir noch a−∞ a·∞ a·∞ 0·∞
= = = =
−∞ ∞ −∞ 0.
f¨ ur a ∈ R oder a = −∞, f¨ ur 0 < a ≤ ∞, f¨ ur − ∞ ≤ a < 0,
Der Ausdruck ∞ − ∞ bleibt verboten; daher ist f¨ ur R-wertige Funktionen f − g nicht unbedingt u ¨berall definiert. Mit diesen Vereinbarungen gilt Satz IV.4.3 entsprechend. Satz IV.4.4 Sei (fn ) eine Folge von auf einem messbaren Raum definierten messbaren Funktionen nach R. Dann sind die punktweise definierten Funktionen sup fn , inf fn , lim sup fn und lim inf fn ebenfalls messbar. Falls f := limn→∞ fn punktweise existiert, ist auch f messbar. ∞ Beweis. Wegen {−∞ ≤ sup fn ≤ r} = n=1 {−∞ ≤ fn ≤ r} ist sup fn messbar; und inf fn behandelt man analog. Daraus folgt die Behauptung u ¨ ber lim sup fn (und analog lim inf fn ), da ja lim supn fn = inf k supn≥k fn ist. Schliesslich ist, falls existent, lim fn = lim sup fn . 2 Die folgende Definition und Satz IV.4.6 sind fundamental f¨ ur den Aufbau der Integrationstheorie. Definition IV.4.5 Sei (S, A ) ein messbarer Raum. Eine Treppenfunktion (genauer A -Treppenfunktion) ist eine messbare Funktion von S nach R, die nur endlich viele Werte annimmt. n Jede Treppenfunktion f l¨ asst sich also in der Form f = j=1 αj χAj , darstellen, wobei α1 , . . . , αn die verschiedenen Werte von f sind und jeweils Aj = {f = αj } ist; wegen der Messbarkeit ist Aj ∈ A . Diese Darstellung wollen wir die
232
IV.
Maß- und Integrationstheorie
kanonische Darstellung von f nennen; sie ist bis auf die Reihenfolge der Summanden eindeutig. Nat¨ urlich gibt es (i.a. unendlich viele) weitere Darstellungen von f als Summe von Indikatorfunktionen, z.B. ist 3 1 1 χ(0,1] + χ(1,2] + χ(2,3] = χ(0,2] + χ(1,3] . 2 2 2 Man beachte auch, dass im Fall S = R die Stufen“ einer Treppenfunktion ” ur ein eher harmloses wesentlich allgemeiner als Intervalle sein d¨ urfen; χQ ist daf¨ Beispiel. Nach Satz IV.4.4 ist jeder punktweise Limes von Treppenfunktionen messbar. Interessanterweise hat umgekehrt jede messbare Funktion diese Gestalt. Satz IV.4.6 Sei (S, A ) ein messbarer Raum. (a) Sei f : S → [0, ∞] messbar. Dann existiert eine Folge von Treppenfunktionen (fn ) mit 0 ≤ f1 (s) ≤ f2 (s) ≤ · · · < ∞ und limn→∞ fn (s) = f (s) f¨ ur alle s ∈ S. (b) Jede messbare Funktion ist punktweiser Grenzwert einer Folge von Treppenfunktionen. (c) F¨ ur beschr¨ankte Funktionen kann jeweils gleichm¨aßige Konvergenz erzielt werden. Beweis. (a) Zu n ∈ N setze fn (s) =
n 4 −1
j=0
j n −n + 2 χ{f ≥2n } . χ −n 2n {j2 ≤f f (s)) bzw. fn (s) ≥ 2n , falls f (s) = ∞. (b) kann wegen f = f + − f − auf (a) zur¨ uckgef¨ uhrt werden. (c) ist in dem obigen Argument bereits enthalten. 2 Abschließend eine Warnung: F¨ ur stetiges f : Rm → Rd ist das Urbild einer Borelmenge wieder eine Borelmenge. Hingegen braucht das stetige Bild einer Borelmenge keine Borelmenge zu sein! Lebesgue hatte irrt¨ umlich angenommen, dass das so ist; aber 1917 wurde ein Gegenbeispiel von Souslin konstruiert. Dieses ist erwartungsgem¨ aß ziemlich kompliziert; siehe etwa Behrends [1987], S. 245ff. oder Cohn [1980], S. 269.
IV.5
Integrierbare Funktionen
Gegeben seien ein messbarer Raum (S, A ) und ein Maß µ auf A ; das Tripel (S, A , µ) wird dann ein Maßraum genannt. Das Integral einer messbaren Funktion f auf S wird in drei Schritten eingef¨ uhrt: zuerst f¨ ur positive Treppenfunktionen, dann f¨ ur positive messbare Funktionen und zum Schluss f¨ ur (gewisse) R-wertige messbare Funktionen.
IV.5
Integrierbare Funktionen
233
Im folgenden halten wir einen Maßraum (S, A , µ) ein f¨ ur alle Mal fest. n Definition IV.5.1 Sei g = j=1 αj χAj die kanonische Darstellung einer positiven Treppenfunktion, wobei also α1 , . . . , αn ≥ 0 den Wertebereich von g ur E ∈ A setze durchl¨ auft und Aj = {g = αj } ist. F¨
g dµ =
E
n j=1
αj µ(Aj ∩ E) ∈ [0, ∞].
(Es sei an die Konvention 0 · ∞ = 0 erinnert.) Es gibt kein Problem mit der Wohldefiniertheit hier, da sich das Integral aus einer bestimmten Darstellung von g berechnet; vgl. jedoch (IV.7). Lemma IV.5.2 Es seien g und h Treppenfunktionen auf einem Maßraum (S, A , µ). Ferner sei E ∈ A . (a) ν: E → E g dµ definiert ein Maß auf A . (g + h) dµ. h dµ = g dµ + (b) Es gilt E E E g dµ. h dµ ≥ (c) Ist h ≥ g, gilt E E (d) F¨ ur α ≥ 0 ist αg dµ = α g dµ. E
E
n Beweis. (a) Sei g = j=1 αj χAj die kanonische Darstellung von g, also sind die αj die verschiedenen Werte von g und Aj = {g = αj }. Ferner seien E1 , E2 , · · · ∈ E paarweise disjunkt. Nach Definition gilt dann ν(∅) = 0 sowie f¨ ur E = ∞ k=1 Ek ν(E) = = = =
n
j=1 n
αj
∞
j=1 k=1 ∞ n
k=1 j=1 ∞
µ(Aj ∩ Ek )
αj µ(Aj ∩ Ek )
ν(ek ),
k=1
denn µ ist ein Maß.
αj µ(Aj ∩ E)
234
IV.
Maß- und Integrationstheorie
(b) h sei analog kanonisch als h = m ur die Mengen l=1 βl χBl dargestellt. F¨ Ejl = Aj ∩ Bl ∩ E gilt dann definitionsgem¨ aß g dµ = αj µ(Ejl ),
Ejl
h dµ = βl µ(Ejl ),
Ejl
(g + h) dµ = (αj + βl )µ(Ejl ).
Ejl
Addition liefert wegen (a) und E =
(g+h) dµ =
E
E
j,l
(g+h) dµ =
Ejl
Ejl die Behauptung:
j,l
g dµ+
Ejl
j,l
Ejl
g dµ+ h dµ. h dµ = E
E
(c) f := g − h ist eine positive Treppenfunktion, also ist definitionsgem¨aß f dµ ≥ 0. Daher folgt aus (b) g dµ. g dµ ≥ f dµ + h dµ = E
E
E
E
(d) schließlich ist klar.
2
Aus Lemma IV.5.2(b) folgt noch, dass bei jeder Darstellung einer positiven n′ Treppenfunktion g = j=1 α′j χA′j mit α′j ≥ 0 und A′j ∈ A das Integral durch
E
′
g dµ =
n j=1
α′j µ(A′j ∩ E)
(IV.7)
zu berechnen ist und nicht nur bei der kanonischen. Definition IV.5.3 Sei f : S → [0, ∞] messbar. Setze f¨ ur E ∈ A
f dµ = sup g dµ: 0 ≤ g ≤ f ; g Treppenfunktion ∈ [0, ∞]. E
(IV.8)
E
F¨ ur Treppenfunktionen stimmen beide Definitionen u ¨ berein, wie aus Teil (c) des obigen Lemmas folgt, denn f tr¨ agt dann selbst zum Supremum in (IV.8) bei. Sammeln wir nun noch ein paar elementare Konsequenzen aus der Definition des Integrals einer positiven messbaren Funktion. Die Beweise ergeben sich unmittelbar aus der Definition, da die entsprechenden Aussagen trivialerweise oder nach Lemma IV.5.2 f¨ ur Treppenfunktionen gelten.
IV.5
Integrierbare Funktionen
235
Lemma IV.5.4 Seien f, g: S →[0, ∞] messbar und E, F ∈ A . g dµ. f dµ ≤ (a) Aus 0 ≤ f |E ≤ g |E folgt E E f dµ ≤ f dµ. (b) Aus E ⊂ F folgt F E f dµ = 0. (c) Aus f |E = 0 folgt E (d) Aus µ(E) = 0 folgt, selbst wenn f |E = ∞ ist, f dµ = 0. E
Der folgende Satz ist die Basis aller Konvergenzs¨atze; f¨ ur den Beweis ist die σ-Additivit¨ at von µ entscheidend. Er wird Satz von Beppo Levi oder Satz von der monotonen Konvergenz genannt. Satz IV.5.5 Seien f : S → [0, ∞] und f1 , f2 , . . . : S → [0, ∞] messbar und gelte f¨ ur alle s ∈ S f1 (s) ≤ f2 (s) ≤ . . . Dann gilt f¨ ur alle E ∈ A lim
n→∞
sowie
fn dµ =
lim fn (s) = f (s).
n→∞
f dµ.
E
E
Beweis. Die Messbarkeit von f ergibt sich aus Satz IV.4.4. Da die Folge (fn ) monoton w¨ achst, w¨ a chst nach Lemma IV.5.4(a) die Folge der Integrale ebenfalls, so dass γ := lim n E fn dµ in [0, ∞] existiert. Wegen fn ≤ f ist auch stets f dµ. f dµ, daher folgt γ ≤ f dµ ≤ n E E E Um die umgekehrte Ungleichung zu zeigen, beachte zun¨achst, dass nach Kon struktion γ := supn E fn dµ ist. Es reicht daher, f¨ ur alle Treppenfunktionen 0 ≤ g ≤ f die Ungleichung g dµ ≤ sup fn dµ = γ n
E
E
zu beweisen. Dazu sei 0 ≤ c < 1 beliebig und En = {s ∈ E: fn (s) ≥ cg(s)}. ∞ Offenbar gilt E1 ⊂ E2 ⊂ . . . , und es sind alle Ej in A . Des weiteren ist j=1 Ej = E, da stets fn (s) ր f (s). Es folgt f¨ ur beliebiges n ∈ N nach Lemma IV.5.4(b), (a) und (d) γ≥
E
fn dµ ≥
En
fn dµ ≥
g dµ.
cg dµ = c
En
En
Da c < 1 beliebig war, ist sogar γ ≥ En g dµ. Nach Lemma IV.5.2(a) ist A → A g dµ σ-additiv; das impliziert nach Satz IV.2.3 γ ≥ E g dµ, was zu zeigen war. 2 Satz IV.5.5 liefert auf elegantem Weg das folgende Lemma.
236
IV.
Maß- und Integrationstheorie
Lemma IV.5.6 Seien f : S → [0, ∞] messbar und E ∈ A . Dann ist χE f dµ. f dµ = S
E
Beweis. Die Aussage ist gem¨ aß Definition IV.5.1 richtig f¨ ur Treppenfunktionen. Nach Satz IV.4.6 kann f monoton durch eine Folge von Treppenfunktionen fn approximert werden; dann ist auch χE fn ր χE f , und Satz IV.5.5 liefert die Behauptung. 2 Freilich h¨ atte man dieses Lemma auch direkt aus Definition IV.5.3 herleiten k¨ onnen; jedoch stellt die obige Methode ein typisches Beweisverfahren der Integrationstheorie dar: Eine zu zeigende Behauptung u ¨ ber messbare Funktionen wird zuerst f¨ ur Indikatorfunktionen und dann f¨ ur Treppenfunktionen bewiesen (in der Regel sind diese Schritte trivial), dann zeigt man durch Grenz¨ ubergang den allgemeinen Fall. Eine weitere Anwendung dieser Methode folgt beim Beweis der sonst nur m¨ uhsam zu erzielenden Additivit¨ at des Integrals im n¨achsten Lemma. Lemma IV.5.7 Seien f, g: S → [0, ∞] messbar und α ≥ 0. Dann gelten g dµ, f dµ + (f + g) dµ = S S S αf dµ = α f dµ. S
S
Beweis. W¨ ahle Folgen von Treppenfunktionen mit fn ր f und gn ր g. Dann hat man auch fn + gn ր f + g, und die erste Behauptung folgt aus Satz IV.5.5 und Lemma IV.5.2(b). Die zweite Behauptung zeigt man genauso. 2 Wegen der Additivit¨ at des Integrals k¨ onnen wir den Satz von Beppo Levi jetzt auch so ausdr¨ ucken: ∞ Korollar IV.5.8 Seien g1 , g2 , . . . : S → [0, ∞] messbar und g = k=1 gk . Dann ist g messbar, und f¨ ur E ∈ A gilt ∞ g dµ = gk dµ E
k=1
E
Beweis. Betrachte fn = g1 + · · · + gn in Satz IV.5.5.
2
Kommen wir zum dritten Schritt bei der Definition des Integrals. Definition IV.5.9 Sei (S, A , µ) ein Maßraum, und f : S → [−∞, ∞] sei messbar. Dann heißt f integrierbar (genauer µ-integrierbar), wenn die positiven messbaren Funktionen f + und f − ein endliches Integral besitzen. Man setzt + f dµ = f dµ − f − dµ. S
S
S
IV.5
Integrierbare Funktionen
237
Einige Bemerkungen zu dieser Definition: (1) F¨ ur eine positive messbare Funktion f ist S f dµ stets definiert (Definition = ∞. Genau dann ist f integrierbar, IV.5.3); eventuell ist der Wert wenn S f dµ < ∞ ist. Die Symbole S f dµ aus Definition IV.5.3 und Definition IV.5.9 definieren dann dieselbe Zahl; mit anderen Worten, die Definitionen sind vertr¨ aglich. (2) Wegen Lemma IV.5.4(a) und Lemma IV.5.7 ist eine Funktion f : S → [−∞, ∞] genau dann integrierbar, wenn sie messbar und S |f | dµ < ∞ ist, denn 0 ≤ f + , f − ≤ |f | = f + + f − . wird f¨ ur E ∈ E Integrierbarkeit u ¨ber E definiert. Wieder ist (3) Analog E f dµ = S χE f dµ. (4) Weitere gel¨ aufige Symbole f¨ ur das Integral sind noch S f (s) dµ(s) oder d S f (s) µ(ds) bzw. im Fall des Lebesguemaßes im R auch S f (x) dx. Insbesondere im dreidimensionalen Fall schreibt man auch S f (x, y, z) d(x, y, z). Wir kommen nun zur Linearit¨ at des Integrals; leider ist der Beweis etwas m¨ uhsam. Satz IV.5.10 Seien f, g: S → R integrierbar und α, β ∈ R. Dann ist αf + βg integrierbar mit (αf + βg) dµ = α f dµ + β g dµ. S
S
Ferner gelten f ≥0
⇒
S
S
f dµ ≥ 0
sowie f dµ ≤ |f | dµ. S
(IV.9)
S
Anders gesagt bildet die Menge der integrierbaren reellwertigen Funktionen einen Vektorraum, auf dem f → S f dµ ein positives lineares Funktional definiert. Beweis. Nach Satz IV.4.3 ist αf + βg messbar, und nach obiger Bemerkung (2) auch integrierbar, denn die Lemmata IV.5.4(a) und IV.5.7 liefern |α| · |f | + |β| · |g| dµ |αf + βg| dµ ≤ S S = |α| · |f | dµ + |β| · |g| dµ S S = |α| |f | dµ + |β| |g| dµ < ∞.
S
S
238
IV.
Maß- und Integrationstheorie
Zeigen wir nun die Linearit¨ at der Integration. Es reicht, die F¨alle α = β = 1 und α beliebig, β = 0 zu behandeln. F¨ ur den ersten Fall beachte, dass (f + − f − ) + (g + − g − ) = f + g = (f + g)+ − (f + g)− ist und deshalb auch f + + g + + (f + g)− = f − + g − + (f + g)+ . Lemma IV.5.7 ergibt g − dµ + (f + g)+ dµ, f − dµ + g + dµ + (f + g)− dµ = f + dµ + S
S
S
S
S
S
woraus durch Subtraktion (alle Integrale sind ja endlich) g dµ = (f + g) dµ f dµ + S
S
S
folgt. Im zweiten Fall argumentieren wir in mehreren Schritten. Ist α ≥ 0 und auch f ≥ 0, so ist nur Lemma IV.5.7 zu zitieren. Ist α ≥ 0 und f eine beliebige integrierbare Funktion, so ist αf + = αf + αf − , daher nach dem bereits Bewiesenen α f + dµ = αf + dµ = αf dµ + α f − dµ, S
so dass α
S
f dµ = α
S
S
S
f + dµ − α
S
f − dµ =
S
S
αf dµ.
S
S
Nun zum Fall α = −1; hier ist nur wegen der schon gezeigten Additivit¨at f + (−f ) dµ = 0= f dµ + (−f ) dµ S
zu beachten. Schließlich ist im Fall α < 0 αf dµ = (−α)(−f ) dµ = (−α) (−f ) dµ = −(−α) f dµ = α f dµ. S
S
S
S
S
Der erste Zusatz ist schon in Lemma IV.5.4(a) bewiesen, und (IV.9) folgt daraus, denn f ≤ |f | und −f ≤ |f |. 2 Es sei noch darauf hingewiesen, dass f¨ ur integrierbares f und E1 ∩ E2 = ∅ die vertraute Formel f dµ f dµ + f dµ = E1 ∪E2
gilt, da ja χE1 ∪E2 f = χE1 f + χE2 f .
E1
E2
IV.5
Integrierbare Funktionen
239
Beispiele. (a) Betrachte das Lebesguemaß auf R. F¨ ur stetige Funktionen f : [a, b] → R stimmen dann das Riemannsche und das Lebesguesche Integral b ur positive f zu begr¨ unden. Die gleichm¨a¨ berein. Es reicht, das f¨ a f (s) ds u ßige Stetigkeit von f garantiert, dass es positive Treppenfunktionen fn gibt, die f von unten monoton approximieren, wobei die Stufen von fn sogar Intervalle sind und die Konvergenz gleichm¨ aßig ist. Nach Definition stimmen Riemannsches und Lebesguesches Integral von fn u ¨ berein, und wegen der gleichm¨aßigen Konvergenz gilt nach einem Satz der Analysisvorlesung f¨ ur das Riemannsche b b Integral a fn (s) ds → R- a f (s) ds. Nach Satz IV.5.5 konvergiert die Folge der b Integrale a fn (s) ds aber auch gegen das Lebesguesche Integral von f . Etwas anders liegen die Dinge bei uneigentlichen Integralen; hier ist eine stetige Funktion genau dann im Lebesgueschen Sinn integrierbar, ∞ wenn das uneigentliche Riemannsche Integral u ¨ ber |f | existiert. Obwohl 0 sin x/x dx als uneigentliches Riemannsches Integral existiert, existiert es also nicht als Lebesguesches Integral, und die Konvergenzs¨ atze des n¨achsten Abschnitts stehen nicht zur Verf¨ ugung. (b) (Maße mit Dichten) Es sei g ≥ 0 eine messbare Funktion. Dann definiert ur Treppenfunktionen schon in Lemν: E → E g dµ ein Maß auf A . Das war f¨ ma IV.5.2 gezeigt worden und folgt im allgemeinen Fall so: Seien E1 , E2 , · · · ∈ A paarweise disjunkt und E die Vereinigung dieser Mengen. Dann ist χE = ∞ j=1 χEj als punktweise konvergente Reihe, und Korollar IV.5.8 zeigt ν(E) =
∞ S
j=1
∞ χEj g dµ = j=1
g dµ = Ej
∞
ν(Ej ).
j=1
Eine messbare Funktion ist genau dann ν-integrierbar, wenn und dann ist f dν = f g dµ. S
S
|f |g dµ < ∞ ist, (IV.10)
S
Diese Aussage stimmt n¨ amlich, wenn f eine Indikatorfunktion ist nach Definition von ν, wenn f eine Treppenfunktion ist wegen der Linearit¨at der Integration und wenn f positiv und messbar ist wegen Satz IV.4.6 und IV.5.5. Damit ist die erste Aussage gezeigt, und (IV.10) folgt f¨ ur integrierbare f durch Zerlegung f = f + − f −. Im Satz von Radon-Nikod´ ym, der in Kapitel V vorgestellt wird (Satz V.3.15), werden Maße mit Dichten charakterisiert. (c) (Dirac-Maß) Betrachte das Dirac-Maß δs aus Beispiel IV.2(c). Mit derselben Technik wie oben (Indikatorfunktionen Treppenfunktionen positive messbare Funktionen integrierbare Funktionen) zeigt man f dδs = f (s). S
240
IV.
Maß- und Integrationstheorie
(d) (Summen als Integrale) Betrachte den Maßraum (N, P(N), µ) mit dem z¨ ahlenden Maß µ (Beispiel IV.2(d)). Eine Funktion f : N → R ist nichts anderes als eine Folge reeller Zahlen, und sie ist automatisch messbar bzgl. P(N). Offensichtlich ist N χ{k} dµ = 1, daher zeigen die oben ∞ angegebenen Schritte, dass f : n → an genau dann µ-integrierbar ist, wenn n=1 |an | < ∞ ist, und in diesem Fall ist
f dµ =
S
∞
an .
n=1
Zum Schluss sollen kurz komplexe Integranden besprochen werden. Eine Funktion f : S → C heißt (Borel-) messbar, wenn die reellen Funktionen Re f und Im f messbar sind. Identifiziert man C mit R2 , so entsprichr das dem u ¨blichen Begriff der Borelmessbarkeit f¨ ur R2 -wertige Funktionen, vgl. Lemma IV.4.2(d). Satz IV.4.3 gilt jetzt entsprechend, nur dass max und min im Komplexen sinnlos sind. Definiert man komplexwertige Treppenfunktionen, so bleiben auch (b) und (c) in Satz IV.4.6 richtig. Eine komplexwertige messbare Funktion f heißt integrierbar, wenn Re f und Im f es sind. Wie nicht anders zu erwarten, setzt man
f dµ =
S
Re f dµ + i
S
Im f dµ.
S
Satz IV.5.10 u agt sich wie auch die obigen Beispiele. Die einzige Schwie¨ bertr¨ rigkeit besteht beim Beweis von (IV.9); das zeigt man genauso wie (II.4).
IV.6
Konvergenzs¨ atze
Dieser Abschnitt enth¨ alt die S¨ atze u ¨ber die Vertauschung von Limes und Integral, wegen denen die Lebesguesche Integrationstheorie so wichtig in der h¨oheren Analysis geworden ist. Im letzten Abschnitt wurde bereits der Satz von Beppo Levi (Satz IV.5.5) bewiesen. Das folgende Lemma von Fatou kann als Verallgemeinerung davon aufgefasst werden. Weiter halten wir einen Maßraum (S, A , µ) fest. Satz IV.6.1 Es seien fn : S → [0, ∞] messbare Funktionen. Dann gilt
lim inf fn dµ ≤ lim inf
S n→∞
n→∞
S
fn dµ.
IV.6
Konvergenzs¨ atze
241
Beweis. Nach Satz IV.4.4 ist die Funktion lim inf n fn messbar. Mit Hilfe des Satzes von Beppo Levi erh¨ alt man sup inf fn dµ lim inf fn dµ = S k n≥k S n→∞ = sup inf fn dµ k S n≥k ≤ sup inf fn dµ (denn inf fn ≤ fm ∀m ≥ k) n≥k k n≥k S = lim inf fn dµ, n→∞
S
wie behauptet.
2
Damit kann man jetzt recht schnell den ersten zentralen Satz der Integrationstheorie, den Lebesgueschen Konvergenzsatz (auch Satz von der dominierten Konvergenz genannt) herleiten. ur alle s ∈ S Theorem IV.6.2 Seien fn : S → R messbare Funktionen, und f¨ existiere f (s) := limn fn (s). Falls eine integrierbare Funktion g: S → [0, ∞] mit |fn | ≤ g f¨ ur alle n existiert, so gelten: (a) Die fn und f sind integrierbar, |fn − f | dµ → 0, (b) S (c) lim fn dµ = f dµ. n→∞
S
S
Beweis. (a) Die Messbarkeit ergibt sich aus Satz IV.4.4, und die Integrierbarkeit folgt aus |fn | ≤ g bzw. |f | ≤ g, denn das impliziert S |fn | dµ ≤ S g dµ < ∞ bzw. S |f | dµ < ∞. (b) Es ist 0 ≤ |fn − f | ≤ g + |f | =: h, wobei h nach Satz IV.5.10 integrierbar ist. Das Lemma von Fatou impliziert h dµ = lim (h − |fn − f |) dµ n→∞ S S = lim inf (h − |fn − f |) dµ S n→∞ ≤ lim inf (h − |fn − f |) dµ n→∞ S h dµ − lim sup |fn − f | dµ. = S
n→∞
S
242
IV.
Durch Subtraktion von
Maß- und Integrationstheorie
h dµ (< ∞) folgt (0 ≤) lim sup |fn − f | dµ ≤ 0, S
n→∞
S
was (b) zeigt. (c) folgt jetzt aus fn dµ − f dµ ≤ |fn − f | dµ → 0. S
S
2
S
Einfache Beispiele zeigen, dass man auf die Existenz solch einer integrierbaren dominierenden Funktion g nicht verzichten kann, um die Grenzwertvertauschung in (c) zu garantieren. Ist µ(S) < ∞, so sind die Voraussetzungen des Lebesgueschen Konvergenzsatzes insbesondere erf¨ ullt, wenn eine Zahl M ≥ 0 mit |fn (s)| ≤ M
∀s ∈ S, n ∈ N
existiert; dann w¨ a hle n¨ amlich g = M χS . 1 Speziell folgt 0 fn (t) dt → 0, wenn (fn ) eine Folge stetiger Funktionen auf [0, 1] ist, die gleichm¨ aßig beschr¨ ankt ist und punktweise gegen 0 konvergiert. Dieses Resultat, der Satz von Arzel` a-Osgood, kann zwar in der Erstsemestervorlesung formuliert, aber dort mit Mitteln der Riemannschen Integration nicht ohne immensen Aufwand bewiesen werden5 . Die weiteren Untersuchungen u ¨ ber die Konvergenz von Folgen messbarer Funktionen haben mit dem Bgeriff fast u ¨berall“ zu tun. Zuerst also etwas dazu. ” Definition IV.6.3 Ist N ∈ A mit µ(N ) = 0, so nennt man jede Teilmenge von N eine Nullmenge (genauer µ-Nullmenge). Beachte, dass eine Nullmenge nicht zu A zu geh¨oren braucht. Sei nun (E) eine Eigenschaft, die ein Element s ∈ S besitzen kann. Man sagt dann, (E) bestehe fast u ¨ berall (genauer µ-fast u ¨ berall), wenn {s: s hat nicht (E)} eine Nullmenge ist. Explizit bedeutet das die Existenz einer Menge N ∈ A mit µ(N ) = 0 und s∈ / N ⇒ s hat (E). Die Feinheit, die hier zu beachten ist, ist, dass nicht {s: s hat nicht (E)} ∈ A gefordert wird, wenngleich das sehr h¨ aufig erf¨ ullt sein wird, sondern nur, dass es Teilmenge einer Menge N ∈ A vom Maße 0 ist. Einige Beispiele zu diesem Konzept. 5 Siehe
dazu W.A.J. Luxemburg, Arzel` a’s dominated convergence theorem for the Riemann integral, Amer. Math. Monthly 78 (1971), 970–979, und J.W. Lewin, A truly elementary approach to the bounded convergence theorem, Amer. Math. Monthly 93 (1986), 395–397.
IV.6
Konvergenzs¨ atze
243
(a) Offenbar ist λ-fast jede Zahl irrational, denn Q ist eine λ-Nullmenge. (b) Offensichtlich (aber trotzdem erw¨ ahnenswert) ist auch, dass der Bezug zum vorgelegten Maß entscheidend ist. F¨ ur das Dirac-Maß δ0 auf (R, Bo (R)) ist fast jede Zahl = 0, aber nat¨ urlich nicht f¨ ur das Lebesguemaß. ur schreibt (c) Auf [0, 1] konvergiert (tn ) bzgl. λ fast u ¨ berall gegen 0. Daf¨ u. (oder pr¨ aziser λ-f.¨ u.). man k¨ urzer tn → 0 f.¨ (d) Entsprechend sind f¨ ur Funktionen auf einem Maßraum Aussagen wie f ≥ g µ-f.¨ u. oder limn fn = f µ-f.¨ u. zu verstehen. Es folgt jedoch dann aus der Messbarkeit der fn nicht die von f (Beispiel?). (e) Es gibt eine u ahlbare, kompakte, nirgends dichte (siehe Definiti¨berabz¨ on I.8.4) Teilmenge von [0, 1] vom Lebesguemaß 0. Wir erinnern an die Konstruktion der Cantormenge (Seite 16): Aus [0, 1] entferne das offene mittlere Drittel O1 := (1/3, 2/3). Aus den beiden Restintervallen entferne wiederum die offenen mittleren Drittel O2 := (1/9, 2/9) und O3 := (7/9, 8/9). Aus den noch verbliebenen Restintervallen werden wieder die mittleren Drittel O4 , . . . , O7 entfernt etc. Die Cantormenge ist C := [0, 1] \
∞
Oj .
j=1
In Beispiel I.3(e) wurde gezeigt, dass die Abbildung N
f : {0, 2} → C,
(an ) →
∞
an 3−n
n=1
bijektiv (sogar ein Hom¨ omorphismus) ist. Daher ist C u ¨ berabz¨ahlbar. Die Meno∞ ge C ist kompakt, da j=1 Oj offen ist, und sie enth¨alt kein offenes nicht leeres Intervall und ist deshalb nirgends dicht, denn ein solches m¨ usste auf jeder ” Stufe“ in einem der Restintervalle liegen, deren L¨angen jedoch eine Nullfolge bilden. Letztendlich gilt λ(C) = 0, denn λ(O1 ) = 1/3, λ(O2 ) = λ(O3 ) = 1/9, λ(O4 ) = · · · = λ(O7 ) = 1/27 etc., also (geometrische Reihe) λ(C) = 1 −
∞ j=1
λ(Oj ) = 1 −
1 3
+
2 4 + + · · · = 0. 9 27
Varianten dieser Konstruktion liefern nirgends dichte Mengen mit positivem Maß (Aufgabe IV.10.18). Die Cantormenge und ihre Varianten sind f¨ ur manche ¨ Uberraschung gut. Genau wie Mengen 1. Kategorie in Baireschen R¨aumen (siehe Abschnitt I.8) k¨ onnen Nullmengen als vernachl¨ assigbar angesehen werden. Aber hier ist ein wenig Vorsicht geboten, da die beiden Begriffe von vernachl¨assigbar“ inkompati” bel sind. Ist n¨ amlich Cn eine nirgends dichte kompakte Teilmenge von [0, 1] vom Maß λ(Cn ) ≥ 1 − 1/n (Aufgabe IV.10.18), so ist C∞ = n Cn definitionsgem¨aß
244
IV.
Maß- und Integrationstheorie
von 1. Kategorie und andererseits vom Maß 1, also ist [0, 1] = C∞ ∪ ([0, 1] \ C∞ ) die Vereinigung einer Menge 1. Kategorie und einer Lebesgueschen Nullmenge, aber gewiss nicht, in welchem Sinn auch immer, vernachl¨assigbar. Auf fast u ¨berall bestehende Eigenschaften kommt man typischerweise durch eine Integration, andersherum ist es f¨ ur eine Integration gleichg¨ ultig, wenn der Integrand auf einer (messbaren) Nullmenge abge¨andert wird. Lemma IV.6.4 Sei f : S → [−∞, ∞] bzgl. µ integrierbar. (a) Dann gilt |f | < ∞ µ-f.¨ u. (b) Aus S |f | dµ = 0 folgt f = 0 µ-f.¨ u. (c) Ist g messbar und f = g µ-f.¨ u., so ist g bzgl. µ integrierbar mit S g dµ = f dµ. S
Beweis. (a) F¨ ur alle n ist nχ{|f |=∞} ≤ |f |; daher folgt (beachte {|f | = ∞} ∈ A ) nµ({|f | = ∞}) =
S
nχ{|f |=∞} dµ ≤
S
|f | dµ < ∞
und daraus µ({|f | = ∞}) = 0. (b) Sei En := {|f | ≥ 1/n} ∈ A . Dann ist 1 |f | dµ ≥ µ(En ); |f | dµ ≥ 0= n S En
∞ also ist stets µ(En ) = 0 und deshalb µ({f = 0}) = µ n=1 En = 0. (c) Ist N ∈ A eine Menge vom Maß 0 und h ≥ 0 messbar, so ist nach Lemma IV.5.4(d) N h dµ = 0. Es folgt
S
|g| dµ = =
{f =g}
{f =g}
=
{f =g}
=
S
|g| dµ +
|g| dµ |f | dµ +
{f =g}
{f =g}
|g| dµ
|f | dµ
|f | dµ < ∞,
was die von g zeigt. zeigt man Genauso Integrierbarkeit und S f − dµ = S g − dµ, so dass S f dµ = S g dµ.
S
f + dµ =
S
g + dµ 2
Im folgenden werden wir auch fast u ¨ berall definierte Funktionen zulassen (z.B. s → 1/s auf [0, 1]); es d¨ urfte klar sein, wie solche Funktionen zu integrieren sind.
IV.6
Konvergenzs¨ atze
245
Korollar IV.6.5 Die Funktionen fn : S → [−∞, ∞] seien integrierbar, und limn→∞ fn (s) existiere fast u ¨ berall. Falls eine integrierbare Funktion g: S → [0, ∞] mit |fn | ≤ g fast u berall f¨ ur alle n existiert, so gelten: ¨ (a) Die fn sind integrierbar. (b) Es existiert eine integrierbare Funktion f : S → R mit limn→∞ fn (s) = f (s) fast ¨ uberall sowie |fn − f | dµ → 0, fn dµ → f dµ. S
S
S
Beweis. Es seien Nn = {fn > |g|} und N0 ∈ A eine Nullmenge mit s∈ / N0
⇒
lim fn (s) existiert in [−∞, ∞].
n→∞
∞ Dann ist N = n=0 Nn ∈ A ebenfalls eine Nullmenge. Die Funktionen f˜n := χ∁Nn fn erf¨ ullen die Voraussetzungen von Theorem IV.6.2; f˜ = limn f˜n existiert jetzt u ¨ berall. Daher ist f˜ integrierbar, und Lemma IV.6.4(a) gestattet es, eine R-wertige integrierbare Funktion f mit f = f˜ fast u ¨ berall zu finden. Die Behauptung folgt nun aus Theorem IV.6.2 und Lemma IV.6.4. 2 Der Konvergenzsatz von Lebesgue liefert ein bequemes Kriterium zur Differentiation unter dem Integral. Im folgenden Satz notieren wir Punkte des Rd+1 als (t, x), t ∈ R, x ∈ Rd ; alle Integrierbarkeitsbegriffe beziehen sich nat¨ urlich auf das Lebesguemaß. Satz IV.6.6 Sei f : Rd+1 → R stetig differenzierbar, und x → f (t, x) sei f¨ ur alle t integrierbar. F¨ ur alle t0 ∈ R existiere eine Umgebung U und eine integrierbare Funktion g: Rd → R mit ∂f (t, x) ≤ g(x) ∀t ∈ U, x ∈ Rd . ∂t Dann gilt f¨ ur alle t ∈ R
d dt
Rd
f (t, x) dx =
Rd
∂f (t, x) dx. ∂t
Beweis. Gelte tn → t0 , ohne Einschr¨ ankung liegen alle tn in der im Satz beschriebenen Umgebung U . Dann ist f (tn , x) dx − Rd f (t0 , x) dx f (tn , x) − f (t0 , x) ∂f Rd (t0 , x) dx, = dx → tn − t0 t − t d d n 0 R R ∂t
denn es liegt punktweise Konvergenz der Integranden vor, welche nach dem Mittelwertsatz und nach Voraussetzung durch die integrierbare Majorante g(x) absch¨ atzbar sind. 2 Der letzte Satz dieses Abschnitts stellt eine u ¨berraschende Verbindung zwischen punktweiser und gleichm¨ aßiger Konvergenz her.
246
IV.
Maß- und Integrationstheorie
Satz IV.6.7 (Satz von Egorov) Es gelte µ(S) < ∞, und die Folge (fn ) messbarer Funktionen konvergiere fast u ¨ berall gegen 0. Zu jedem ε > 0 existiert dann eine Menge E ∈ A mit µ(∁E) ≤ ε derart, dass (fn ) auf E gleichm¨aßig gegen 0 konvergiert. Beweis. Sei k ∈ N zun¨ achst fest. Die Mengen Ek,m = n≥m {|fn | ≤ 1/k} sind der Schl¨ ussel zum Beweis des Satzes. Nach Voraussetzung existiert eine Nullmenge N ∈ A mit m Ek,m = S \ N . Da Ek,1 ⊂ Ek,2 ⊂ . . . gilt, folgt µ(Ek,m ) → µ(S) mit m → ∞ (Satz IV.2.3). Weil µ ein endliches Maß ist, kann man einen Index mk mit µ(∁Ek,mk ) ≤ ε · 2−k w¨ ahlen. Nun ist E := k Ek,mk die gesuchte Menge, denn µ(∁E) ≤
k
µ(∁Ek,mk ) ≤ ε
und f¨ ur n ≥ mk und s ∈ E gilt konstruktionsgem¨aß |fn (s)| ≤ 1/k, denn insbesondere ist E ⊂ Ek,mk . Das heißt, dass (fn ) auf E gleichm¨aßig gegen 0 konvergiert. 2 Der Satz von Egorov braucht f¨ ur unendliche Maßr¨aume nicht zu gelten; betrachte etwa µ = z¨ ahlendes Maß auf N und fn = χ{n} . Alle S¨ atze dieses Abschnitts bleiben f¨ ur komplexwertige Integrale g¨ ultig, soweit sinnvoll.
IV.7
Die L p -R¨ aume
In diesem Abschnitt behandeln wir Vektorr¨ aume messbarer Funktionen. Im folgenden ist (S, A , µ) ein fester Maßraum. Das Symbol K steht f¨ ur R oder C. Definition IV.7.1 F¨ ur 0 < p < ∞ setze
" ! |f |p dµ < ∞ . L p (S, A , µ) = f : S → K: f messbar, S
Der Buchstabe L (der demn¨ achst in L verwandelt wird) soll an Lebesgue erinnern; dass der Exponent in allen B¨ uchern p heißt, hat historische Gr¨ unde, denn p steht f¨ ur das franz¨ osische puissance (Potenz). Statt L p (S, A , µ) wird in der Regel L p (µ) geschrieben; ist S ⊂ Rd , A die Borel-σ-Algebra und µ das Lebesguemaß, ist auch die Notation L p (S) gebr¨auchlich. Als erstes u ¨ berlegen wir, dass L p (µ) bzgl. der punktweise definierten algebraischen Operationen, also (f + g)(s) = f (s) + g(s),
(λf )(s) = λ f (s),
IV.7
Die L p -R¨ aume
247
ein Vektorraum ist. Nur die Invarianz unter Summen ist nicht offensichtlich (außer im Fall p = 1). Da f¨ ur reelle oder komplexe Zahlen die Ungleichung |x + y| ≤ |x| + |y| ≤ 2 max{|x|, |y|} gilt, folgt f¨ ur f, g ∈ L p (µ) und 0 < p < ∞ p |f (s) + g(s)| dµ(s) ≤ 2p max{|f (s)|p , |g(s)|p } dµ(s) S S p ≤ 2 |f (s)|p + |g(s)|p dµ(s) S p |f (s)|p dµ(s) + |g(s)|p dµ(s) < ∞; = 2 S
S
p
also f + g ∈ L (µ). (Beachte, dass alle Integranden wirklich messbar sind.) Wir setzen f¨ ur f ∈ L p (µ) f L p = f p =
S
1/p |f (s)| dµ(s) . p
Unser Ziel ist zu zeigen, dass f¨ ur 1 ≤ p < ∞ die Halbnormeigenschaften6 λf p = |λ| f p
(IV.11)
f + gp ≤ f p + gp
(IV.12)
f¨ ur f, g ∈ L p (µ) und λ ∈ K gelten. Hier ist (IV.11) klar (sogar f¨ ur alle p > 0), und (IV.12) ist klar f¨ ur p = 1. Der Fall p > 1 ist jedoch alles andere als offensichtlich; hier hilft folgende Ungleichung weiter. Satz IV.7.2 (H¨ oldersche Ungleichung) Sei 1 < p < ∞ und q = p/(p − 1), also g ∈ L q (µ) ist f g ∈ L 1 (µ), und es gilt
1 p
+
1 q
= 1. F¨ ur f ∈ L p (µ) und
f g1 ≤ f p gq . Beweis. Zun¨ achst erinnern wir an die gewichtete Ungleichung vom geometri” schen und arithmetischen Mittel“: σ r τ 1−r ≤ rσ + (1 − r)τ
∀σ, τ ≥ 0, 0 < r < 1
(IV.13)
[Beweis hierf¨ ur: Die Behauptung ist klar, falls σ = 0 oder τ = 0. F¨ ur σ, τ > 0 ist sie jedoch ¨ aquivalent zur Konkavit¨ at der Logarithmusfunktion: log(σ r τ 1−r ) = r log σ + (1 − r) log τ ≤ log rσ + (1 − r)τ 6 Mehr
dazu in Kapitel V, vgl. Definition V.1.1.
248
IV.
Maß- und Integrationstheorie
log τ log(rσ+(1−r)τ ) r log σ+(1−r) log τ σ rσ+(1−r)τ
τ
log σ
Eine zweimal stetig differenzierbare Funktion f ist aber genau dann konkav, wenn f ′′ ≤ 0 gilt; und die zweite Ableitung von log ist t → −t−2 , also in der Tat negativ.] Zum Beweis der H¨ olderschen Ungleichung setzen wir zur Abk¨ urzung A = ankung darf A, B > 0 angenommen werden; f pp , B = gqq . Ohne Einschr¨ sonst ist n¨ amlich nach Lemma IV.6.4 f = 0 f.¨ u. oder g = 0 f.¨ u., und es ist nichts zu zeigen. Wir setzen in (IV.13) r=
1 |f (s)|p |g(s)|q 1 , also 1 − r = , σ = , τ= p q A B
und integrieren; das liefert |f (s)| |g(s)| 1 1 1 1 p q |f (s)| dµ(s) + |g(s)| dµ(s) dµ(s) ≤ 1/p B 1/q p A S q B S S A 1 1 = + = 1. p q Es folgt
S
was zu zeigen war.
|f g| dµ ≤ A1/p B 1/q = f p gq , 2
Als Korollar erhalten wir die Dreiecksungleichung“ (IV.12), die einen eige” nen Namen tr¨ agt. Korollar IV.7.3 (Minkowskische Ungleichung) F¨ ur 1 ≤ p < ∞ und f, g ∈ L p (µ) ist f + gp ≤ f p + gp .
IV.7
Die L p -R¨ aume
249
Beweis. Da die Ungleichung f¨ ur p = 1 trivial ist, nehmen wir p > 1 an und setzen q = p/(p − 1), also 1/p + 1/q = 1. Dann ist f + gpp = |f + g|p dµ S |f + g| · |f + g|p−1 dµ = S p−1 ≤ |f | · |f + g| dµ + |g| · |f + g|p−1 dµ. S
S
q Nun ist |f + g|p−1 ∈ L q (µ), da ja S |f + g|p−1 dµ = |f + g|p dµ < ∞, denn L p (µ) ist ein Vektorraum. Die H¨ oldersche Ungleichung liefert daher f + gpp ≤ f p |f + g|p−1 q + gp |f + g|p−1 = f p + gp f + gp/q p = f p + gp f + gp−1 , p
woraus die Behauptung folgt.
q
2
Damit ist gezeigt, dass . p auf L p (µ) eine Halbnorm ist. Die Konvergenz fn → f im Raum L p (µ) (also fn − f p → 0) wird auch Konvergenz im p-ten Mittel genannt. Wie gewiss aus der Analysisvorlesung bekannt ist, kann man mit dem Ansatz d(x, y) = x−y aus einer Norm eine Metrik ableiten; dies wird in Abschnitt V.1 noch einmal dargestellt. Geht man von einer Halbnorm aus, bekommt man so im allgemeinen nur eine Pseudometrik, f¨ ur die das Definitheitsaxiom d(x, y) = 0 ” f¨ ur x = y“ verletzt sein kann. Die Sprache der metrischen R¨aume (Cauchyfolgen, Vollst¨ andigkeit etc.) l¨ asst sich jedoch auch in diesem Fall verwenden, was wir im folgenden auch tun werden. Die im n¨ achsten Satz ausgedr¨ uckte Vollst¨ andigkeit des Raums L p (µ) ist eines der Kernresultate der Lebesgueschen Integrationstheorie, das sie vor der Riemannschen auszeichnet. Theorem IV.7.4 F¨ ur 1 ≤ p < ∞ ist L p (µ) ein vollst¨andiger halbnormierter Raum. Beweis. Sei (fn ) eine Cauchyfolge in L p (µ). Dann existiert eine Teilfolge mit fnk+1 − fnk p ≤ 2−k . Setze gm =
m
k=1
|fnk+1 − fnk |,
g=
∞
k=1
|fnk+1 − fnk |.
250
IV.
Maß- und Integrationstheorie
Die Funktion g nimmt Werte in [0, ∞] an. Da L p (µ) ein Vektorraum ist, ist gm ∈ L p (µ), und nach der Minkowskischen Ungleichung gilt gm p ≤
m
k=1
fnk+1 − fnk p ≤
m
k=1
2−k ≤ 1.
p Nun konvergiert (gm ) monoton gegen g, also gilt auch gm ր g p ; der Satz von Beppo Levi zeigt daher p dµ ≤ 1. g p dµ = lim gm m→∞
S
Deshalb ist g fast u ¨ berall endlich (Lemma IV.6.4), sagen wiraußerhalb einer ∞ messbaren Nullmenge N . F¨ ur s ∈ / N konvergiert also die Reihe k=1 (fnk+1 (s)− andigkeit von R oder C konvergiert die fnk (s)) absolut, und wegen der Vollst¨ Reihe selbst. Setze ∞ f (s) = (fnk+1 (s) − fnk (s)) k=1
f¨ ur s ∈ / N und f (s) = 0 sonst. Als punktweiser Limes messbarer Funktionen ist f messbar, und es gilt |f | ≤ g und daher auch |f |p ≤ g p . Es folgt wegen |f |p dµ ≤ g p dµ ≤ 1, S
S
dass f ∈ L p (µ). Zeigen wir jetzt ∞
k=1
(fnk+1 − fnk ) = f
bzgl. der Halbnorm von L p (µ), d.h. die . p -Konvergenz der Partialsummen. m Nach Konstruktion liegt f.¨ u.-Konvergenz vor. F¨ ur hm = |f − k=1 (fnk+1 −fnk )|p gilt daher hm → 0 f.¨ u. Andererseits ist p hm ≤ |fnk+1 − fnk | ≤ g p , k>m
was integrierbar ist. Der Lebesguesche Konvergenzsatz liefert S hm dµ → 0, was zu zeigen war. Nach dem Teleskopsummentrick ist aber solch eine Partialsumme nichts anderes als fnm+1 −fn1 , die Teilfolge (fnm ) konvergiert also gegen f +fn1 ∈ L p (µ) im p-ten Mittel. Als letzten Schritt muss man nur noch beachten, dass eine Cauchyfolge, die eine konvergente Teilfolge besitzt, selbst konvergiert (Beweis?). Damit ist der Beweis der Vollst¨ andigkeit von L p (µ) erbracht. 2
IV.7
Die L p -R¨ aume
251
F¨ ur den Maßraum (N, P(N), z¨ ahlendes Maß) schreibt man u ¨brigens ℓp statt L (µ); explizit ist (vgl. Beispiel IV.5(d)) p
∞ p ℓ = (an ): |an | < ∞ . p
n=1
Wir werden als n¨ achstes die Skala der L p -R¨aume (nach oben) abschließen, indem wir L ∞ (µ) = f : S → K: f messbar, ∃α ≥ 0: µ({|f | > α}) = 0
setzen. F¨ ur f ∈ L ∞ (µ) definieren wir f L ∞ = inf α ≥ 0: µ({|f | > α}) = 0 .
Da f¨ ur f, g ∈ L ∞ (µ) und α, β ≥ 0
µ({|f | > α}) = 0, µ({|g| > β}) = 0 ⇒ µ({|f + g| > α + β}) = 0 gilt, sieht man, dass L ∞ (µ) ein Vektorraum und . L ∞ eine Halbnorm ist. Offenbar ist f L ∞ =
inf
sup |f (s)|;
(IV.14)
N ∈A s∈S\N µ(N )=0
daher wird . L ∞ auch wesentliche Supremumshalbnorm genannt. Damit kann man den Grenzfall p = 1 der H¨ olderschen Ungleichung formulieren: f ∈ L 1 (µ), g ∈ L ∞ (µ) ⇒ f g ∈ L 1 (µ), f g1 ≤ f 1 gL ∞ . (Beweis?) Das ist ein Indiz, dass die Bezeichnung L ∞ mit Bedacht gew¨ahlt ist; ein anderes pr¨ asentiert Aufgabe IV.10.40. Wir wollen die Vollst¨ andigkeit von L ∞ (µ) zeigen. Beginnen wir mit der Vorbemerkung, dass das Infimum in (IV.14) angenommen wird; w¨ahle n¨amlich zu k ∈ N Nullmengen Nk′ ∈ A mit f L ∞ ≥ sups∈N / k′ |f (s)| − 1/k und setze dann N ′ = k Nk′ . Sei nun (fn ) eine Cauchyfolge in L ∞ (µ). Wir w¨ahlen gem¨aß der Vorbemerkung Nullmengen Nn,m ∈ A , so dass fn − fm L ∞ = sup |fn (s) − fm (s)| s∈N / n,m
Erst recht ist dann f¨ ur die Nullmenge N =
n,m Nn,m
fn − fm L ∞ = sup |fn (s) − fm (s)| s∈N /
∀n, m ∈ N.
∀n, m ∈ N.
(Hier gilt ≤“ nach Definition der L ∞ -Halbnorm und ≥“, weil Nn,m ⊂ N .) ” ” alt man fn = gn f.¨ u., gn ist beschr¨ankt und messbar auf S, F¨ ur gn = χ∁N fn erh¨
252
IV.
Maß- und Integrationstheorie
und (gn ) ist eine Cauchyfolge bzgl. der u ¨ blichen Supremumsnorm7 . Nun borgen wir uns aus Beispiel (c) in Abschnitt V.1 das Resultat, dass die beschr¨ankten Funktionen auf einer Menge S in der von der Supremumsnorm abgeleiteten Metrik einen vollst¨ andigen Raum bilden; also konvergiert (gn ) gleichm¨aßig gegen eine beschr¨ ankte Funktion g. Diese muss wegen Satz IV.4.4 messbar sein, also ist g ∈ L ∞ (µ). Es bleibt zu zeigen, dass g ein Grenzwert von (fn ) bzgl. der Halbnorm . L ∞ ist; das folgt aus fn − gL ∞ ≤ sup |fn (s) − g(s)| = sup |gn (s) − g(s)| → 0. s∈S
s∈N /
Wir haben folgenden Satz gezeigt. Satz IV.7.5 L ∞ (µ) ist ein vollst¨andiger halbnormierter Raum. Wir schließen den Abschnitt mit zwei Dichtheitsaussagen. Die erste ist allgemeiner Natur. Satz IV.7.6 Ist 1 ≤ p ≤ ∞ und f ∈ L p (µ), so existiert eine Folge von Treppenfunktionen mit fn − f L p → 0. Mit anderen Worten liegen die Treppenfunktionen dicht im halbnormierten Raum L p (µ). Beweis. F¨ ur p = ∞ folgt das sofort aus Satz IV.4.6(c). Sei nun p < ∞ und f zun¨achst (reellwertig und) nichtnegativ, also f ≥ 0. Dann existieren Treppenfunktionen 0 ≤ fn ր f (Satz IV.4.6(a)). Wegen |f − fn |p ≤ (|f | + |fn |)p ≤ 2p f p (letzteres wegen 0 ≤ fn ≤ f ) und f ∈ L p (µ) zeigt der Lebesguesche Konvergenzsatz 1/p p |f − fn | dµ → 0. f − fn L p = S
Im allgemeinen Fall zerlege reellwertige f in f + − f − und komplexwertige in Re f + i Im f . 2
Die n¨ achste Aussage bezieht sich auf das Lebesguemaß. Ist S ein topologischer Raum und f : S → K eine Funktion, so nennt man die abgeschlossene Menge supp(f ) := {s ∈ S: f (s) = 0}
den Tr¨ager von f und bezeichnet mit K (S) den Vektorraum (sic!) aller stetigen Funktionen mit kompaktem Tr¨ ager. Satz IV.7.7 Ist 1 ≤ p < ∞ und f ∈ L p (Rd ), so existiert eine Folge (gn ) von stetigen Funktionen mit kompaktem Tr¨ager und gn − f p → 0. Mit anderen Worten liegt K (Rd ) dicht im halbnormierten Raum L p (Rd ), falls p < ∞. 7 g ∞
= sups∈S |g(s)|.
IV.8 Produktmaße und der Satz von Fubini
253
Beweis. Wir betrachten zuerst den Fall einer Indikatorfunktion f = χA mit einer beschr¨ ankten Borelmenge A. Wegen der Regularit¨at des Lebesguemaßes (Satz IV.3.15) k¨ onnen wir zu δ > 0 eine kompakte Menge C und eine offene Menge O mit C ⊂ A ⊂ O und λd (O \ C) < δ p w¨ahlen; wie der Beweis von Satz IV.3.15 zeigt, kann die Menge O dann ebenfalls als beschr¨ankt gew¨ahlt werden. Nun gestattet der Satz von Tietze-Urysohn (Theorem I.7.4), eine stetige Funktion ϕ: Rd → [0, 1] mit ϕ(x) = 1 auf C und ϕ(x) = 0 außerhalb von O zu konstruieren; es ist also ϕ ∈ K (Rd ). Ferner ist χA −ϕp ≤ (λd (O \ C))1/p < δ. Ist A eine beliebige Borelmenge und setzt man An = {x ∈ A: x ≤ n}, so liefert der Satz von Beppo Levi χAn − χA p → 0, und deshalb sieht man mit Hilfe des ersten Schritts und der Minkowskischen Ungleichung, dass zu δ > 0 wieder eine Funktion ϕ ∈ K (Rd ) mit χA − ϕp < δ existiert. Daraus ergibt sich nun sofort (dank der Minkowskischen Ungleichung) die Approximierbarkeit von Treppenfunktionen durch stetige Funktionen mit komn paktem Tr¨ ager: Ist n¨ amlich f = j=1 λj χAj eine Treppenfunktion in L p (Rd ) n ur ϕ = j=1 λj ϕj ∈ und ϕj ∈ K (Rd ) so, dass χAj − ϕj p < ε/(n|λj |), so ist f¨ K (Rd ) n |λj | χAj − ϕj p ≤ ε. f − ϕp ≤ j=1
Eine Anwendung von Satz IV.7.6 schließt den Beweis ab.
2
Dieser Satz gestattet folgende Verbesserung ur das Lebesmvon Satz IV.7.6 f¨ guemaß. Eine Treppenfunktion der Gestalt k=1 ak χIk mit d-dimensionalen Intervallen Ik heiße eine Stufenfunktion. Korollar IV.7.8 Ist 1 ≤ p < ∞ und f ∈ L p (Rd ), so existiert eine Folge von Stufenfunktionen mit fn − f L p → 0. Mit anderen Worten liegen die Stufenfunktionen dicht im halbnormierten Raum L p (Rd ). Beweis. Nach Satz IV.7.7 liegt K (Rd ) dicht in L p (Rd ) bzgl. der Halbnorm . L p . Weil stetige Funktionen mit kompaktem Tr¨ager gleichm¨aßig stetig sind, k¨onnen diese durch Treppenfunktionen mit kompaktem Tr¨ager, deren Stufen d-dimensionale Intervalle sind, gleichm¨ aßig approximiert werden. Es folgt, dass 2 diese Treppenfunktionen auch dicht bzgl. der L p -Halbnorm liegen. In Abschnitt IV.9 diskutieren wir die Approximation durch glatte Funktionen (vgl. Satz IV.9.8).
IV.8
Produktmaße und der Satz von Fubini
Gegeben sei eine Borel-messbare Funktion f : R2 → R. H¨aufig trifft man in der Analysis auf das iterierte Integral R ( R f (x, y) dx) dy und dann auf das Problem, die Integrationsreihenfolge zu vertauschen. In diesem Abschnitt werden
254
IV.
Maß- und Integrationstheorie
wir leicht verifizierbare Kriterien f¨ ur die Vertauschbarkeit entwickeln, und zwar nicht nur f¨ ur das Lebesguemaß, sondern auch f¨ ur beliebige σ-endliche Maße (der Aufwand ist marginal gr¨ oßer). En passant treffen wir dabei auf die auch an sich interessante Konstruktion des sogenannten Produktmaßes. Als erstes f¨ uhren wir kanonisch eine σ-Algebra auf dem Produkt von zwei Mengen ein. Definition IV.8.1 Seien (S1 , A1 ) und (S2 , A2 ) messbare R¨aume. Die auf dem kartesischen Produkt S1 ×S2 von den messbaren Rechtecken“ A1 ×A2 , Aj ∈ Aj , ” erzeugte σ-Algebra heißt Produkt-σ-Algebra und wird mit A1 ⊗ A2 bezeichnet. Man beachte, dass im Fall des R2 die messbaren Rechtecke“ Produkte ” von Borelmengen und daher geometrisch viel komplizierter als Rechtecke im landl¨ aufigen Sinn sind. Lemma IV.8.2 Sei πj : S1 ×S2 → Sj , (s1 , s2 ) → sj , die kanonische Projektion. Eine Abbildung T von einem messbaren Raum (S, A ) nach (S1 × S2 , A1 ⊗ A2 ) ist genau dann messbar, wenn die Abbildungen πj ◦ T bzgl. A und Aj messbar sind. Beweis. Die πj sind jedenfalls messbar, denn f¨ ur A1 ∈ A1 ist π1−1 (A1 ) = A1 × S2 ∈ A1 ⊗ A2 (analog f¨ ur j = 2). Daher ist πj ◦ T messbar, wenn T es ist. ur Aj ∈ Aj zu Umgekehrt ist nach Lemma IV.4.2(a) T −1 (A1 × A2 ) ∈ A f¨ zeigen. Beachte daf¨ ur nur A1 × A2 = π1−1 (A1 ) ∩ π2−1 (A2 ), um in der Tat T −1 (A1 × A2 ) = (π1 ◦ T )−1 (A1 ) ∩ (π2 ◦ T )−1 (A2 ) ∈ A zu erhalten.
2
Beispiele. (a) Es ist Bo (Rk ) ⊗ Bo (Rl ) = Bo (Rk+l ). Hier gilt die Inklusion ⊃“, da Bo (Rk+l ) von speziellen messbaren Rechtecken, n¨amlich den Interval” len, erzeugt wird. Die Aussage ⊂“ werden wir zun¨achst so u ¨ bersetzen, dass ” Lemma IV.8.2 mit Gewinn angewandt werden kann. ⊂“ bedeutet, dass die ” Identit¨ at auf Rk+l bzgl. Bo (Rk+l ) und Bo (Rk ) ⊗ Bo (Rl ) messbar ist, was nach Lemma IV.8.2 a ¨quivalent zur Borel-Messbarkeit der Projektionen von Rk+l auf Rk bzw. Rl ist. Die sind jedoch stetig; also gilt ⊂“. ” (b) Es ist P(N) ⊗ P(N) = P(N × N), denn jedes E ⊂ N × N ist abz¨ahlbar, und einpunktige Mengen liegen in P(N) ⊗ P(N). Hingegen ist f¨ ur Mengen S, deren Kardinalit¨ at gr¨ oßer als die von R ist, P(S) ⊗ P(S) = P(S × S) (siehe etwa Behrends [1987], S. 120). Wir f¨ uhren nun einige Bezeichnungen ein. Es sei E ⊂ S1 × S2 sowie f : S1 × S2 → [−∞, ∞] eine Funktion. F¨ ur s1 ∈ S1 setze Es1 = {s2 ∈ S2 : (s1 , s2 ) ∈ E}
IV.8
Produktmaße und der Satz von Fubini
und f¨ ur s2 ∈ S2
255
E s2 = {s1 ∈ S1 : (s1 , s2 ) ∈ E}
sowie fs1 : S2 → [−∞, ∞], fs1 (t) = f (s1 , t), f s2 : S1 → [−∞, ∞], f ss (t) = f (t, s2 ).
Abb. IV.1. Eine Menge E mit Schnitt Es
Lemma IV.8.3 (a) F¨ ur E ∈ A1 ⊗ A2 und sj ∈ Sj ist Es1 ∈ A2 sowie E s2 ∈ A1 . (b) Ist f : S1 × S2 → [−∞, ∞] eine A1 ⊗ A2 -messbare Funktion, so sind alle partiellen Funktionen fs1 bzw. f s2 A2 - bzw. A1 -messbar. Beweis. Zu s1 ∈ S1 betrachte ϕs1 : t → (s1 , t). Diese Funktion ist nach Lemma IV.8.2 messbar, und es ist Es1 = ϕ−1 s1 (E) sowie fs1 = f ◦ ϕs1 . Analog zeigt man die s2 betreffenden Aussagen. 2 Nehmen wir nun an, es seien Maße µj auf Aj erkl¨art. Unser Ziel ist, jetzt ein Maß τ auf A1 ⊗ A2 mit τ (A1 × A2 ) = µ1 (A1 ) · µ2 (A2 )
∀Aj ∈ Aj
zu definieren. Wir beschr¨ anken uns hier auf den Fall σ-endlicher Maße (Definition IV.3.6). Lemma IV.8.4 Seien (S1 , A1 , µ1 ) und (S2 , A2 , µ2 ) σ-endliche Maßr¨aume. F¨ ur E ∈ A1 ⊗ A2 sind dann die Funktionen s1 → µ2 (Es1 ) A1 -messbar und s2 → µ1 (E s2 ) A2 -messbar. Beweis. Die Funktionen sind wohldefiniert nach Lemma IV.8.3. Aus Symmetriegr¨ unden reicht es, die erste der beiden Funktionen zu studieren. Zuerst sei angenommen, dass µ2 sogar endlich ist. Wir werden zeigen, dass D := {E ∈ A1 ⊗ A2 : s1 → µ2 (Es1 ) ist A1 -messbar}
256
IV.
Maß- und Integrationstheorie
ein Dynkinsystem ist (Definition IV.3.8), das alle messbaren Rechtecke umfasst. Da diese einen ∩-stabilen Erzeuger von A1 ⊗ A2 bilden, denn (A1 × A2 ) ∩ (B1 × B2 ) = (A1 ∩ B1 ) × (A2 ∩ B2 ), zeigt Satz IV.3.9 dann die Behauptung im endlichen Fall. Nun zu den Einzelheiten; schreibe abk¨ urzend µE 2 (s1 ) = µ2 (Es1 ). Es ist ∅ ∈ D S1 ×S2 ∅ = µ2 (S2 ) konstante Funktionen sind. und S1 × S2 ∈ D, da µ2 = 0 und µ2 E Ferner ist D invariant unter Komplementbildung, da µ∁E 2 = µ2 (S2 )−µ2 und das Maß µ2 endlich ist. Seien schließlich E1 , E2 , · · · ∈ D paarweise disjunkte Mengen ∞ Ej und E ihre Vereinigung. Wegen der Disjunktheit ist µE 2 = j=1 µ2 , und das ist als punktweiser Limes messbarer Funktionen messbar. Daher ist E ∈ D, und die drei definierenden Bedingungen eines Dynkinsystems sind gezeigt. Ferner 1 ×A2 = µ2 (A2 )χA1 . geh¨ oren alle A1 × A2 , Aj ∈ Aj zu D, da µA 2 Jetztsei µ2 σ-endlich. W¨ ahle also Mengen endlichen Maßes B1 ⊂ B2 ⊂ · · · ∈ A2 mit n Bn = S2 . F¨ ur die endlichen Maße νn (A2 ) = µ2 (A2 ∩ Bn ) wissen wir bereits, dass s1 → νn (Es1 ) stets messbar ist. Wegen µ2 (Es1 ) = sup νn (Es1 ) n
folgt die Behauptung im allgemeinen Fall aus Satz IV.4.4.
2
Satz IV.8.5 Seien (S1 , A1 , µ1 ) und (S2 , A2 , µ2 ) σ-endliche Maßr¨aume. Dann existiert genau ein Maß µ1 ⊗ µ2 auf A1 ⊗ A2 mit (µ1 ⊗ µ2 )(A1 × A2 ) = µ1 (A1 ) · µ2 (A2 )
∀Aj ∈ Aj .
(IV.15)
µ1 (E s2 ) dµ2 (s2 )
(IV.16)
Es hat die Eigenschaft (µ1 ⊗ µ2 )(E) =
µ2 (Es1 ) dµ1 (s1 ) =
S2
S1
f¨ ur alle E ∈ A1 ⊗ A2 . Das in diesem Satz beschriebene Maß heißt Produktmaß von µ1 und µ2 . Es ist nach (IV.15) ebenfalls σ-endlich. Beweis. Die Eindeutigkeit ist eine unmittelbare Konsequenz von Satz IV.3.10, denn jedes Maß, das (IV.15) erf¨ ullt, ist σ-endlich auf dem ∩-stabilen Erzeuger der messbaren Rechtecke. Nun zur Existenz. Definiere f¨ ur E ∈ A1 ⊗ A2 µ2 (Es1 ) dµ1 (s1 ), τ1 (E) = S 1 τ2 (E) = µ1 (E s2 ) dµ2 (s2 ); S2
IV.8
Produktmaße und der Satz von Fubini
257
die Integranden sind nach Lemma ur ∞IV.8.4 messbar. Dann ist τ1 (∅) = 0, und f¨ eine disjunkte Vereinigung E = j=1 Ej gilt τ1 (E) =
µ2
S1
=
S1
= = =
µ2
∞
j=1 ∞ j=1
∞
S1 j=1 ∞ j=1 ∞
S1
Ej
s1
Ej s1
dµ1 (s1 )
dµ1 (s1 )
µ2 (Ej )s1 dµ1 (s1 )
µ2 (Ej )s1 dµ1 (s1 )
τ1 (Ej );
j=1
im vorletzten Schritt wurde der Satz von Beppo Levi in der Form von Korollar IV.5.8 benutzt. Damit ist τ1 ein Maß, das (IV.15) erf¨ ullt: τ1 (A1 × A2 ) =
S1
χA1 (s1 ) · µ2 (A2 ) dµ1 (s1 ) = µ1 (A1 ) · µ2 (A2 ).
undete Eindeutigkeit liefert τ1 = τ2 . Dasselbe gilt f¨ ur τ2 , und die bereits begr¨ Damit ist der Satz bewiesen. 2 F¨ ur das Lebesguemaß gilt λk ⊗ λl = λk+l auf Bo (Rk ) ⊗ Bo (Rl ) = Bo (Rk+l ). (IV.15) zeigt n¨ amlich insbesondere, dass λk ⊗λl mit dem Jordanschen Inhalt auf Intervallen u ¨ bereinstimmt. Da der Jordansche Inhalt eindeutig zu einem Maß auf den Borelmengen fortsetzbar ist (Satz IV.3.12), folgt die Behauptung. Die in Satz IV.8.5 aufgezeigte M¨ oglichkeit, zum Beispiel Volumina durch Integration ihrer zweidimensionalen Schnitte zu berechnen (λ3 = λ2 ⊗ λ1 ), heißt Cavalierisches Prinzip. Es impliziert z.B. f¨ ur E, F ∈ Bo (R3 ) = Bo (R2 )⊗Bo (R), dass E und F dasselbe Volumen haben, wenn alle zweidimensionalen Schnitte acheninhalt besitzen. E s , F s , s ∈ R, denselben Fl¨ Kommen wir nun zur Integration bzgl. des Produktmaßes. Der diesbez¨ ugliche Satz, der Satz von Fubini (Theorem IV.8.8), geh¨ort zu den Eckpfeilern der Integrationstheorie. Zuerst ein Lemma. Lemma IV.8.6 Seien (S1 , A1 , µ1 ) und (S2 , A2 , µ 2 ) σ-endlich, und f : S1 × S2 → [0, ∞] sei A1 ⊗ A2 -messbar. Dann ist s1 → S2 fs1 dµ2 A1 -messbar und s2 → S1 f s2 dµ1 A2 -messbar.
258
IV.
Maß- und Integrationstheorie
Beweis. Die Integranden sind nach Lemma IV.8.3 messbar. Nach Lemma IV.8.4 ist die Behauptung richtig, wenn f eine Indikatorfunktion ist, denn (χE )s1 dµ2 = µ2 (Es1 ). S2
Daher gilt die Behauptung f¨ ur Treppenfunktionen, denn Integration ist linear, und nach Satz IV.4.6 und dem Satz von Beppo Levi allgemein. 2 Satz IV.8.7 (Satz von Tonelli) Unter den Voraussetzungen von Lemma IV.8.6 gilt f (s1 , s2 ) dµ2 (s2 ) dµ1 (s1 ) f d(µ1 ⊗ µ2 ) = S S S1 ×S2 1 2 = f (s1 , s2 ) dµ1 (s1 ) dµ2 (s2 ). S2
S1
Beweis. Die Integranden sind messbar nach Lemma IV.8.6, und alle Integrale existieren in [0, ∞], da f positiv ist. Nun stimmt die Aussage f¨ ur Indikatorfunktionen, denn nach Satz IV.8.5 ist µ2 (Es1 ) dµ1 (s1 ) = (µ1 ⊗ µ2 )(E). χE (s1 , s2 ) dµ2 (s2 ) dµ1 (s1 ) = S1
S2
S1
Mit der u ¨ blichen Methode wie im letzten Lemma erh¨alt man die Behauptung allgemein. 2 Wir machen jetzt den Schritt von den positiven messbaren zu den integrierbaren Funktionen. Notgedrungen ist die Formulierung des folgenden Satzes etwas schwerf¨ allig; eine griffigere Formulierung folgt danach. Theorem IV.8.8 (Satz von Fubini) Seien (S1 , A1 , µ1 ) und (S2 , A2 , µ2 ) σ-endliche Maßr¨aume, und f : S1 × S2 → [−∞, ∞] sei A1 ⊗ A2 -messbar sowie µ1 ⊗ µ2 -integrierbar. ur µ2 -fast alle s2 ist f s2 (a) F¨ ur µ1 -fast alle s1 ist fs1 µ2 -integrierbar, und f¨ µ1 -integrierbar. (b) Seien ⎧ ⎨ fs1 dµ2 falls fs1 µ2 -integrierbar, If (s1 ) = ⎩ S2 0 sonst, ⎧ ⎨ f s2 dµ1 falls f s2 µ1 -integrierbar, Jf (s2 ) = S1 ⎩ 0 sonst. Dann sind If und Jf messbar und µ1 - bzw. µ2 -integrierbar.
IV.8
Produktmaße und der Satz von Fubini
(c)
S1 ×S2
f d(µ1 ⊗ µ2 ) =
If dµ1 =
259
Jf dµ2 .
S2
S1
Beweis. (a) Die Messbarkeit dieser Funktionen wurde in Lemma IV.8.3 beobachtet. Die Behauptung ergibt sich nun aus Satz IV.8.7 und Lemma IV.6.4(a), denn ersterer zeigt |f | d(µ1 ⊗ µ2 ) < ∞, |f (s1 , s2 )| dµ2 (s2 ) dµ1 (s1 ) = S1
S1 ×S2
S2
und letzteres impliziert dann S2 |fs1 | dµ2 < ∞ µ1 -fast u ¨ berall. (b) Es reicht aus Symmetriegr¨ unden, die Funktion If zu behandeln. Da der sonst“ Fall auf der messbaren Menge {s1 : S2 |fs1 | dµ2 = ∞} eintritt (beachte ” Lemma IV.8.6), folgt die Messbarkeit von If durch Zerlegung f = f + − f − aus der entsprechenden Aussage u ¨ber positive Funktionen in Lemma IV.8.6. Nun zeigt Satz IV.8.7 die Integrierbarkeit: |f | d(µ1 ⊗ µ2 ) < ∞. |f (s1 , s2 )| dµ2 (s2 ) dµ1 (s1 ) = |If | dµ1 ≤ S1
S1
S1 ×S2
S2
(c) stimmt f¨ ur f + und f − nach Satz IV.8.7, also auch f¨ ur f , da ja If + −If − = ur Jf . 2 If + −f − = If und analog f¨ Um den Satz von Fubini anwenden zu k¨ onnen, muss man sich zuerst von der Integrierbarkeit von f u ¨berzeugen; nach dem Satz von Tonelli muss man dazu nur“ eines der iterierten Integrale von |f | berechnen oder absch¨atzen. Als ” ¨ Konsequenz erh¨ alt man die Ubereinstimmung der iterierten Integrale von f : f (s1 , s2 ) dµ1 (s1 ) dµ2 (s2 ), f (s1 , s2 ) dµ2 (s2 ) dµ1 (s1 ) = S1
S2
S2
S1
(IV.17)
wobei zu bemerken ist, dass in dieser Formulierung die Integranden eventuell nur fast u ¨ berall definiert sind. Die f¨ ur die Anwendungen gebr¨ auchlichste Variante des Satzes von Fubini/Tonelli l¨ asst sich so formulieren. • Falls die Maßr¨aume (S1 , A1 , µ1 ) und (S2 , A2 , µ2 ) σ-endlich sind, die ist und eines der Funktion f : S1 × S 2 → [−∞, ∞] A1 ⊗ A2 -messbar iterierten Integrale S1 ( S2 |f | dµ2 ) dµ1 oder S2 ( S1 |f | dµ1 ) dµ2 endlich ist, gilt die Integralvertauschungsformel (IV.17). Als Anwendung des Satzes k¨ onnen wir bequem R sin x lim dx R→∞ 0 x
260
IV.
Maß- und Integrationstheorie
∞ berechnen (vgl. Beispiel II.4.11). (Wir schreiben nicht 0 sin x/x dx, da dieses uneigentliche Riemann-Integral nicht im ∞Lebesgueschen Sinn existiert, siehe Beispiel (a) auf Seite 239.) Wegen 1/x = 0 e−ux du ist n¨amlich R R ∞ sin x dx = sin x · e−ux du dx. x 0 0 0 Um die Integrationsreihenfolge zu vertauschen, u ufen wir die obigen Vor¨ berpr¨ aussetzungen: [0, R] und [0, ∞), jeweils mit den Borelmengen und dem Lebesguemaß versehen, sind σ-endlich; (x, u) → f (x, u) = sin x · e−ux ist stetig, also messbar (beachte Bo (R) ⊗ Bo (R) = Bo (R2 )); und wegen |sin x| ≤ |x| ist R R ∞ 1 |sin x| · dx ≤ R < ∞. |f (x, u)| du dx = x 0 0 0 Also ist
0
R
sin x dx = x
∞ R
e−ux sin x dx du
0 ∞ 10
2 1 −uR 1 − e du (u sin R + cos R) 1 + u2 0 (durch zweimalige partielle Integration) ∞ ∞ du u sin R + cos R −uR = − e du. 2 1 + u 1 + u2 0 0 =
Das erste Integral ist = π/2, und das zweite kann betragsm¨aßig nach oben gegen ∞ ∞ 1 −uR →0 eu e−uR du = (u + 1)e du ≤ R −1 0 0
werden. Das zeigt
R
π sin x dx = . R→∞ 0 x 2 Die Integralvertauschung im Rahmen der Riemannschen Integrationstheorie zu begr¨ unden w¨ are m¨ uhsamer, wenn auch nicht unm¨oglich. Als weitere Anwendung des Satzes von Fubini diskutieren wir nun die Transformationsformel der mehrdimensionalen Integralrechnung; sie lautet: lim
Satz IV.8.9 Es seien U, V ⊂ Rd offen und Φ: U → V ein C 1 -Diffeomorphismus; es ist also Φ bijektiv, und Φ und Φ−1 sind stetig differenzierbar. Es bezeichne JΦ (x) = det(DΦ)(x) die Determinante der Jacobimatrix von Φ bei x. Dann ist eine messbare Funktion f : V → R genau dann integrierbar, wenn (f ◦ Φ) · |JΦ |: U → R integrierbar ist, und es gilt dann f (y) dy = f (Φ(x))|JΦ (x)| dx. (IV.18) V
U
Die Gleichung gilt stets in [0, ∞] f¨ ur positive messbare Funktionen f .
IV.8
Produktmaße und der Satz von Fubini
261
Diese Formel verallgemeinert die traditionelle eindimensionale Substitutionsregel b Φ(b) f (Φ(x))Φ′ (x) dx. f (y) dy = a
Φ(a)
B A Man beachte, dass diese Integrale eine Orientierung tragen, d.h. A = − B , und deshalb die Ableitung ohne Betrag auftaucht. Schreibt man stattdessen U = (a, b) oder U = [a, b] und V = Φ(U ), lautet die Substitutionsregel
f (y) dy =
f (Φ(x))|Φ′ (x)| dx.
(IV.19)
U
V
Der folgende elegante Beweis des Transformationssatzes mit Hilfe des Satzes von Fubini stammt aus Th. Br¨ ockers Analysisvorlesungen8. Zun¨achst ei−1 ne Vorbemerkung: Da Φ stetig ist, ist f¨ ur eine Borelmenge A ⊂ U auch Φ(A) = (Φ−1 )−1 (A) ⊂ V eine Borelmenge. Den eigentlichen Beweis zerlegen wir in mehrere Teiletappen. (1) Wendet man die (noch unbewiesene) Transformationsformel auf die Indikatorfunktion χΦ(A) , A ⊂ U eine Borelmenge, an, erh¨alt man λd (Φ(A)) =
A
|JΦ (x)| dx
∀A ∈ Bo (U ).
(IV.20)
Umgekehrt liefert (IV.20) die Transformationsformel (IV.18) zun¨achst f¨ ur Indikatorfunktionen, dann f¨ ur Treppenfunktionen und schließlich (Satz von Beppo Levi) f¨ ur positive messbare Funktionen. Indem man eine beliebige messbare Funktion f = f + − f − in Positiv- und Negativteil zerlegt, erh¨alt man die Aussage von Satz IV.8.9. Daher reicht es, (IV.20) zu beweisen. (2) Die eindimensionale Substitutionsregel impliziert, dass (IV.20) im Fall d = 1 stimmt; denn das ist f¨ ur kompakte Intervalle der Fall (vgl. (IV.19)), und diese bilden einen ∩-stabilen Erzeuger von Bo (U ), auf dem die Maße A → λ(Φ(A)) und A → A |Φ′ (x)| dx σ-endlich sind. Satz IV.3.10 liefert dann (IV.20) f¨ ur d = 1. (3) Aus der Definition des Lebesguemaßes ergibt sich sofort, dass (IV.20) f¨ ur eine Koordinatenpermutation Φ stimmt. (4) Ist (IV.20) und damit auch (IV.18) f¨ ur Transformationen ψ: U → V und ρ: V → W bewiesen, so folgen diese Aussagen auch f¨ ur Φ = ρ ◦ ψ: U → W ; man hat n¨ amlich f¨ ur positive messbare Funktionen f : W → R, indem man die Kettenregel und die Multiplikativit¨ at der Determinante benutzt, f (ρ(y)) |Jρ (y)| dy f (z) dz = W
8 Th.
V
Br¨ ocker, Analysis II, BI-Verlag 1992.
262
IV.
= =
Maß- und Integrationstheorie
U
f (ρ(ψ(x))) |Jρ (ψ(x))| |Jψ (x)| dx
U
f (Φ(x)) |JΦ (x)| dx.
(5) Wir kommen zum entscheidenden Beweisschritt und zeigen (IV.20) f¨ ur solche Transformationen Φ, die eine Koordinate festhalten. Wegen (3) und (4) d¨ urfen wir annehmen, dass dieses die erste Koordinate ist. Schreiben wir Elemente des Rd = R×Rd−1 als (t, x), so hat eine solche Transformation die Gestalt Φ(t, x) = (t, Φt (x)), wobei Φt vom Schnitt Ut = {x ∈ Rd−1 : (t, x) ∈ U } nach Vt operiert. Dann ist Φt nach Konstruktion ebenfalls ein C 1 -Diffeomorphismus. Nehmen wir nun an, (IV.20) sei bereits f¨ ur alle Φt gezeigt. Dann ergibt sich diese Formel wie folgt f¨ ur Φ. Schreibt man λd als Produktmaß λ ⊗ λd−1 , so liefert (IV.16) in Satz IV.8.5 und die Darstellung des Schnitts Φ(A)t = Φt (At ) d−1 d λd−1 (Φt (At )) dt. λ (Φ(A)t ) dt = λ (Φ(A)) = R
R
Nach Annahme kann man f¨ ur den letzten Term auch |JΦt (x)| dx dt R
At
schreiben. Aufgrund der speziellen Gestalt von Φ ergibt sich f¨ ur die Jacobimatrix von Φ (im folgenden steht ∗ f¨ ur einen Eintrag, dessen Kenntnis unerheblich ist) ⎞ ⎛ ··· 0 1 0 ⎟ ⎜ ∗ ⎟ ⎜ (DΦ)(t, x) = ⎜ . ⎟ ⎠ ⎝ .. (DΦt )(x) ∗ und deshalb JΦ (t, x) = JΦt (x). Daher lautet der letzte Term auch χAt (x) |JΦ (t, x)| dx dt, R
Rd−1
was nach dem Satz von Fubini χA (t, x) |JΦ (t, x)| dt dx = |JΦ | dλd Rd
A
ist, was zu zeigen war. Damit ist gezeigt: Wenn (IV.20) f¨ ur alle Transformationen in der Dimension d − 1 gilt, gilt (IV.20) auch f¨ ur solche Transformationen in der Dimension d, die eine Koordinate festhalten. Um daraus, angefangen mit Schritt (2), einen Induktionsbeweis f¨ ur die Transformationsformel zu erhalten, ist noch zu u ¨ berlegen,
IV.8
Produktmaße und der Satz von Fubini
263
dass die G¨ ultigkeit von (IV.20) f¨ ur die genannten speziellen Transformationen die G¨ ultigkeit f¨ ur s¨ amtliche Transformationen (in derselben Dimension) nach sich zieht. Das geschieht in den verbleibenden Schritten. (6) Sei Φ = (Φ1 , . . . , Φd ): U → V ein C 1 -Diffeomorphismus und p ∈ U . Es folgt, dass mindestens eine partielle Ableitung ∂Φi /∂xj bei p nicht verschwindet. Indem man statt Φ f¨ ur geeignete Koordinatenpermutationen σ ˜ Φσ betrachtet und die Schritte (3) und (4) beachtet, d¨ urfen wir (∂Φ1 /∂x1 )(p) = 0 annehmen. Setze ψ(x1 , . . . , xd ) = (Φ1 (x), x2 , . . . , xd ). Da die Jacobimatrix von ψ die Gestalt ⎛ ∂Φ
⎞ (x) ∗ · · · ∗ ⎟ 0 1 ⎟ .. ⎟ .. ⎠ . . 0 1
1
⎜ ⎜ (Dψ)(x) = ⎜ ⎝
∂x1
0
0
hat und deshalb bei p invertierbar ist, existiert eine offene Umgebung U (p), auf der ψ ein C 1 -Diffeomorphismus ist. Damit ist auch ρ: ψ(U (p)) → Φ(U (p)),
ρ = Φ ◦ ψ −1
ein C 1 -Diffeomorphismus, der die Gestalt ρ(y1 , . . . , yd ) = (y1 , ρ2 (y), . . . , ρd (y)) hat. Daher halten sowohl ψ als auch ρ mindestens eine Koordinate fest. Gilt die Transformationsformel also f¨ ur ψ und ρ, so nach (4) auch f¨ ur Φ|U(p) = ρ◦ψ |U(p) . (7) Um den Beweis des Transformationssatzes abzuschließen, ist noch folgendes zu u ¨berlegen: Ist Φ ein C 1 -Diffeomorphismus und besitzt jeder Punkt p ∈ U eine offene Umgebung U (p), so dass (IV.20) f¨ ur Φ|U(p) gilt, dann gilt (IV.20) auch f¨ ur Φ selbst. Hierf¨ ur ist eine topologische Vorbetrachtung notwendig. Die U (p), p ∈ U , ¨ bilden eine offene Uberdeckung von U . Jedes U (p) umfasst eine offene Kugel K(p) mit Mittelpunkt in Qd und rationalem Radius, welche p enth¨alt. Nun gibt es aber nur abz¨ ahlbar viele Kugeln dieser Art; deshalb existiert eine abz¨ahlbare ∞ Teil¨ ubedeckung9 {U (pj ): j = 1, 2, . . . }: U = j=1 U (pj ). Wie schon bei anderer Gelegenheit auch, machen wir die U (pj ) mittels B1 = U (p1 ), B2 = U (p2 ) \ B1 , B3 = U (p3 ) \ (B1 ∪ B2 ) etc. disjunkt. Sei A ⊂ U eine Borelmenge, und setze Aj = A∩Bj . Das liefert eine disjunkte Zerlegung von A in Borelsche Teilmengen Aj ⊂ U (pj ), j = 1, 2, . . . . Da nach Voraussetzung (IV.20) ¨ der Topologie wird ein Raum, f¨ ur den jede offene Uberdeckung eine abz¨ ahlbare Teil¨ uberdeckung hat, ein Lindel¨ of-Raum genannt. Das Argument hier zeigt, dass separable metrische R¨ aume Lindel¨ of-R¨ aume sind. 9 In
264
IV.
Maß- und Integrationstheorie
f¨ ur jedes Aj gilt und beide Seiten dieser Gleichung σ-additive Mengenfunktionen definieren, folgt (IV.20) auch f¨ ur die Borelmenge A. Damit ist der Beweis des Transformationssatzes abgeschlossen. 2 Den folgenden Spezialfall der Transformationsformel k¨onnte man auch aus der Definition des Lebesguemaßes herleiten. Korollar IV.8.10 Ist Φ: Rd → Rd bijektiv und linear, so gilt f¨ ur A ∈ Bo (Rd ) λd (Φ(A)) = |det Φ| · λd (A) sowie f¨ ur f ∈ L 1 (Rd )
Φ(A)
f (y) dy = |det Φ|
f (Φ(x)) dx.
A
Ein in der Physik wichtiges Beispiel f¨ ur ein Koordinatensystem sind die Kugelkoordinaten. Ein Punkt p ∈ R3 wird dabei durch seinen Abstand r vom Ursprung, seine geographische Breite“ θ ∈ [0, π] und seinen L¨angengrad“ ” ” ϕ ∈ [0, 2π] auf der Oberfl¨ ache der Kugel vom Radius r beschrieben. Die Transformation von Kugel- auf kartesische Koordinaten lautet daher x = r sin θ cos ϕ, y = r sin θ sin ϕ, z = r cos θ; die Transformation Φ: (r, θ, ϕ) → (x, y, z) ist auf der offenen Menge U = (0, ∞)× (0, π) × (0, 2π) ein C 1 -Diffeomorphismus. Die Determinante der Jacobimatrix lautet JΦ (r, θ, ϕ) = r sin θ (nachrechnen!) und die Transformationsformel ∞ π 2π f (Φ(r, θ, ϕ)) r sin θ dϕ dθ dr. f (x, y, z) dx dy dz = R3
0
0
0
Hierbei ist zu beachten, dass rechter Hand eigentlich u ¨ ber die offene Menge U und linker Hand u ¨ ber das Bild Φ(U ) zu integrieren ist. Da aber ([0, ∞) × [0, π] × [0, 2π])\ U und R3 \ Φ(U ) Nullmengen sind, darf man die Transformationsformel in der obigen Weise formulieren.
IV.9
Einige Anwendungen
Der Weierstraßsche Approximationssatz Dieser Satz behauptet folgendes. Satz IV.9.1 Sei f : [a, b] → C eine stetige Funktion auf einem kompakten Intervall. Dann existiert eine Folge von Polynomen, die auf [a, b] gleichm¨aßig gegen f konvergiert.
IV.9
Einige Anwendungen
265
Zum Beweis formulieren wir zuerst ein sehr allgemeines Konvergenzprinzip, das vielf¨ altige Anwendungen hat (siehe Satz V.4.13). Es baut auf folgendem Begriff auf. Definition IV.9.2 Eine Folge integrierbarer Funktionen ∆n : Rd → R heißt Diracfolge, falls (1) ∆n (x) ≥ 0 f¨ ur alle x ∈ Rd , n ∈ N, (2) Rd ∆n (x) dx = 1, (3) f¨ ur alle δ > 0 gilt { x ≥δ} ∆n (x) dx → 0.
Abb. IV.2. Drei Funktionen einer Diracfolge
Außerdem ben¨otigen wir den Begriff der Faltung zweier L 1 -Funktionen f und g auf Rd . Wir setzen (f ∗ g)(x) = f (x − y)g(y) dy, (IV.21) Rd
falls dieses Integral existiert, und (f ∗ g)(x) = 0 sonst. Durch eine Anwendung des Satzes von Fubini und Korollar IV.8.10 sieht man, dass |f (x − y)g(y)| dy dx ≤ f 1g1 (IV.22) Rd
Rd
und daher Rd |f (x − y)g(y)| dy < ∞ f.¨ u. Deshalb ist f ∗ g fast u ¨ berall durch (IV.21) definiert, und f ∗ g ist integrierbar (zur Messbarkeit verwende Lemma IV.8.6). Ist zus¨ atzlich f oder g beschr¨ ankt, existiert das Integral in (IV.21) f¨ ur alle x; das wird im weiteren stillschweigend benutzt. Die Transformation Φ(y) = x − y zeigt schließlich f ∗ g = g ∗ f . Dann gilt folgender Approximationssatz. Satz IV.9.3 Sei (∆n ) eine Diracfolge, und f : Rd → C sei stetig, beschr¨ankt und integrierbar. Dann konvergiert die Folge (∆n ∗ f ) auf jeder kompakten Teilmenge K von Rd gleichm¨aßig gegen f .
266
IV.
Maß- und Integrationstheorie
Beweis. Setze B = supx∈Rd |f (x)|. Sei ε > 0. Da f auf kompakten Mengen gleichm¨ aßig stetig ist, existiert ein δ > 0 mit y ≤ δ, x ∈ K
⇒ |f (x − y) − f (x)| ≤ ε.
(IV.23)
Zu ε und δ w¨ ahle n0 so, dass f¨ ur n ≥ n0 ∆n (x) dx ≤ ε { x ≥δ}
(Bedingung (3) aus Definition IV.9.2). Dann gilt f¨ ur alle n ≥ n0 und alle x ∈ K |(f ∗ ∆n )(x) − f (x)| = f (x − y)∆n (y) dy − f (x) d R = f (x − y)∆n (y) dy − f (x)∆n (y) dy Rd
≤ =
R
Rd
(Bedingung (2) aus Definition IV.9.2)
d
|f (x − y) − f (x)|∆n (y) dy [. . . ] dy + [. . . ] dy.
{ y 0; dann gilt 1 η n √ 1 (1 − t2 )n dt z / 1 − z dz cn (1 − t2 )n dt = δ1 ∆n (t) dt = 2 = 01 √ 2 n (1 − t ) dt z n / 1 − z dz δ {|t|≥δ} 0 0 mit der Substitution z = 1 − t2 und η = 1 − δ 2 < 1. Weiter ist η η zn η n+1 1 1 √ z n dz = √ dz ≤ √ 1−η 0 1−η n+1 1−z 0 sowie
1
√
0
Zusammen folgt
zn dz ≥ 1−z
1
z n dz =
0
1 . n+1
η n+1 ∆n (t) dt ≤ √ →0 1−η {|t|≥δ}
mit n → ∞. Satz IV.9.3 ist daher anwendbar; er liefert, dass (∆n ∗ f ) auf [0, 1] gleichm¨aßig gegen f konvergiert. Es bleibt zu u ufen, dass die ∆n ∗ f |[0,1] Polynome ¨berpr¨ sind. In der Tat ist f¨ ur x ∈ [0, 1] 1 1 (∆n ∗ f )(x) = cn (1 − (x − t)2 )n f (t) dt, ∆n (x − t)f (t) dt = 0
0
da f (t) = 0 außerhalb von [0, 1] und |x−t| ≤ 1 f¨ ur x, t ∈ [0, 1]. Ausmultiplizieren liefert 2n (n) (1 − (x − t)2 )n = aij xi tj , i,j=0
so dass
(∆n ∗ f )(x) =
2n 2n i=0
j=0
(n)
aij
0
1
2n (n) bi xi tj f (t) dt xi =: i=0
wirklich ein Polynom auf [0, 1] mit komplexen Koeffizienten ist; ist f reellwertig, sind es die Koeffizienten auch. Von der Zusatzannahme f (0) = f (1)) = 0 befreit man sich mittels der Hilfsfunktion g(x) = f (x) − (rx + s) =: f (x) − l(x), wo r und s so gew¨ahlt sind, dass g(0) = g(1) = 0 gilt. Konvergiert nun pn → g gleichm¨aßig auf [0, 1], so auch pn + l → f , und mit pn ist auch pn + l ein Polynom. Schließlich erh¨alt man den Weierstraßschen Approximationssatz f¨ ur beliebige a und b, indem statt f : [a, b] → C die Funktion f˜: [0, 1] → C, f˜(x) = f (a + (b − a)x), betrachtet. 2 Wir werden noch das Analogon von Satz IV.9.3 f¨ ur 2π-periodische Funktionen ben¨ otigen. Definition IV.9.2 ist jetzt so zu modifizieren: Wir sprechen von
268
IV.
Maß- und Integrationstheorie
einer periodischen Diracfolge (∆n ), wenn alle ∆n 2π-periodische messbare Funktionen auf R sind, ¨ ber [0, 2π] integrierbar sind, wenn alle ∆n ≥ 0 sind und die u 1 wenn in (3) 2π {π≥|t|≥δ} ∆n (t) dt → 0 gilt. Die Faltung wird im periodischen Fall durch π 1 (f ∗ g)(x) = f (x − t)g(t) dt 2π −π erkl¨ art. Dann gelten Satz IV.9.3 und sein Beweis genauso im periodischen Fall. Gl¨ attung von Funktionen Die Faltung kann auch benutzt werden, um Funktionen zu gl¨atten“. Dem liegt ” folgende Idee zugrunde. Ist ϕ ≥ 0 und integrierbar mit Rd ϕ(x) dx = 1, so kann die Faltung ϕ ∗ f so interpretiert werden, dass (ϕ ∗ f )(x) ein Mittelwert der Funktionswerte von f ist; deshalb sollte ϕ ∗ f glatter als f sein. (Ein Blick auf die DAX-Kurve im Vergleich zur Kurve des 200 Tage-Mittels des DAX, die t¨ aglich in manchen Zeitungen abgebildet sind, bekr¨aftigt die G¨ ultigkeit dieser Idee.) Ist dabei ϕ sehr stark bei der 0 konzentriert (was nach Bedingung (3) aus Definition IV.9.2 bei Diracfolgen f¨ ur große n der Fall ist), so wird haupts¨achlich u ber Werte in der N¨ a he von x gemittelt. ¨ Um das auszuf¨ uhren, ben¨ otigen wir die L p -Version der Faltung. Dazu seien 1 d 1 < p < ∞, f ∈ L (R ) und g ∈ L p (Rd ). Es sei noch 1/p + 1/q = 1. Dann zeigt die H¨ oldersche Ungleichung 0 0/ / |f (x − y)|1/q |g(y)||f (x − y)|1/p dy |f (x − y)| |g(y)| dy = Rd
Rd
≤ =
Rd
|f (x − y)| dy
1/q f 1
1/q
Rd
p
|f (x − y)| |g(y)| dy p
Rd
|f (x − y)| |g(y)| dy
1/p
1/p
,
denn die erste eckige Klammer definiert eine L q -Funktion und die zweite f¨ ur fast alle x eine L p -Funktion von y (letzteres wurde im Anschluss an (IV.21) begr¨ undet). Es folgt (der zweite Schritt benutzt den Satz von Fubini) Rd
Rd
|f (x − y)| |g(y)| dy
p
p/q
dx ≤ f 1
p/q
Rd
Rd
|f (x − y)| |g(y)|p dy dx
= f 1 f 1 gpp .
Genau wie im Fall p = 1 zeigt das, dass auch f¨ ur f ∈ L 1 (Rd ), g ∈ L p (Rd ) das Faltungsintegral f (x − y)g(y) dy (f ∗ g)(x) = Rd
IV.9
Einige Anwendungen
269
f¨ ur fast alle x existiert und mutatis mutandis eine L p -Funktion definiert. Zieht man in der obigen Absch¨ atzung die p-te Wurzel, erh¨alt man eine wichtige Ungleichung (der Fall p = 1 wurde bereits in (IV.22) begr¨ undet). Satz IV.9.4 (Youngsche Ungleichung) Sei 1 ≤ p < ∞. F¨ ur f ∈ L 1 (Rd ) und g ∈ L p (Rd ) ist f ∗ g ∈ L p (Rd ), und es gilt f ∗ gp ≤ f 1 gp . Nun k¨ onnen wir den Approximationssatz IV.9.3 auf L p -Funktionen ausdehnen. Satz IV.9.5 Seien (∆n ) eine Diracfolge und f ∈ L p (Rd ), wobei 1 ≤ p < ∞. Dann konvergiert (∆n ∗ f ) gegen f in L p (Rd ), d.h. ∆n ∗ f − f p → 0. Beweis. Wir f¨ uhren den Beweis zuerst unter der Voraussetzung, dass f eine stetige Funktion mit kompaktem Tr¨ ager ist. Dann existiert also ein R ≥ 0 mit f (x) = 0, falls x > R. Sei K die abgeschlossene Kugel um 0 mit dem Radius R + 1. Nach Satz IV.9.3 strebt ∆n ∗ f → f gleichm¨aßig auf K, und es folgt |(∆n ∗ f )(x) − f (x)|p dx → 0. (IV.24) K
Sei nun x > R + 1. Dann ist (∆n ∗ f )(x) = (f ∗ ∆n )(x) = =
Rd
f (x − y)∆n (y) dy
{ y ≥1}
f (x − y)∆n (y) dy
= f ∗ (∆n χ{ y ≥1} ) = (∆n χ{ y ≥1} ) ∗ f. In dieser Rechnung konnte die Kommutativit¨ at der Faltung benutzt werden, da ˜ n = ∆n χ{ y ≥1} . jeweils beide Faktoren in L 1 liegen. Setze nun zur Abk¨ urzung ∆ ˜ n 1 → 0. Damit erh¨alt man aus Wegen Bedingung (3) einer Diracfolge gilt ∆ der Youngschen Ungleichung ˜ n ∗ f )(x)|p dx |(∆ |(∆n ∗ f )(x) − f (x)|p dx = ∁K ∁K ˜ n ∗ f )(x)|p dx |(∆ ≤ Rd
˜ n ∗ f p ≤ ∆ ˜ n p f p → 0. (IV.25) = ∆ p p 1
Die Behauptung des Satzes ergibt sich f¨ ur f ∈ K (Rd ) nun sofort aus (IV.24) und (IV.25).
270
IV.
Maß- und Integrationstheorie
Ist f ∈ L p (Rd ) beliebig, w¨ ahle zu ε > 0 gem¨aß Satz IV.7.7 eine Funktion g ∈ K (Rd ) mit f − gp ≤ ε. Sei n0 so groß, dass ∆n ∗ g − gp ≤ ε f¨ ur n ≥ n0 ; solch ein n0 existiert nach dem ersten Beweisteil. F¨ ur diese n ist nach der Minkowskischen und Youngschen Ungleichung ∆n ∗ f − f p ≤ ∆n ∗ (f − g)p + ∆n ∗ g − gp + g − f p ≤ f − gp + ∆n ∗ g − gp + f − gp ≤ 3ε,
und Satz IV.9.5 ist allgemein gezeigt.
2
Im folgenden betrachten wir Diracfolgen spezieller Bauart. Es sei ϕ ≥ 0 mit ϕ(x) dx = 1 eine integrierbare Funktion mit kompaktem Tr¨ager, und f¨ ur ε > 0 sei 1 x ϕε (x) = d ϕ . ε ε F¨ ur jede Nullfolge (εn ) ist dann (ϕεn ) eine Diracfolge; f¨ ur Bedingung (2) beachte ur große n, da Korollar IV.8.10 und f¨ ur Bedingung (3), dass ϕεn |{y: y >δ} = 0 f¨ ϕ einen kompakten Tr¨ ager hat.
Rd
Abb. IV.3. Die Funktionen ϕ1 , ϕ1/2 und ϕ1/4
Speziell folgt aus Satz IV.9.5 f¨ ur f ∈ L p (Rd ) ϕεn ∗ f − f p → 0.
(IV.26)
aufig differenWir wollen begr¨ unden, dass ϕ ∗ f (und damit ϕεn ∗ f ) genauso h¨ zierbar ist wie ϕ, ohne dass f differenzierbar zu sein braucht. Dazu dient der n¨achste Satz. Satz IV.9.6 Ist ϕ: Rd → C eine stetig differenzierbare Funktion mit kompaktem Tr¨ager und f ∈ L p (Rd ), so ist ϕ ∗ f ebenfalls stetig differenzierbar mit ∂ ∂ϕ (ϕ ∗ f ) = ∗ f. ∂xj ∂xj Hat f einen kompakten Tr¨ager, dann auch ϕ ∗ f .
IV.9
Einige Anwendungen
271
Beweis. Man braucht nur Satz IV.6.6 anzuwenden; da die partielle Ableitung ∂ϕ/∂xj beschr¨ ankt ist (ϕ hat einen kompakten Tr¨ager), etwa durch c, ist n¨amlich der Integrand in ∂ϕ ∂ϕ ∗ f (x) = (x − y)f (y) dy ∂xj ∂x d j R f¨ ur x < r durch die integrierbare Funktion cf χ{ y ≤r+s} dominiert, wobei s so gew¨ ahlt ist, dass ϕ(z) = 0 f¨ ur z > s. (Zur Integrierbarkeit dieser Funktion siehe Aufgabe IV.10.38.) Die Aussage u ager folgt unmittelbar aus der Definition der Faltung. ¨ ber die Tr¨ 2 Durch Induktion l¨ asst sich dieses Resultat ausdehnen. Wir setzen D(Rd ) = {ϕ ∈ C ∞ (Rd ): supp(ϕ) ist kompakt}, wobei C ∞ (Rd ) den Raum der beliebig h¨ aufig differenzierbaren Funktionen auf ur h¨ ohere partielle Ableitungen benutzt man die MultiindexRd bezeichnet. F¨ schreibweise Dα ϕ =
∂ α1 +···+αd ϕ , ∂xα11 . . . ∂xαdd
α = (α1 , . . . , αd ) ∈ Nd0 .
Korollar IV.9.7 (Friedrichssche Gl¨ attung) Ist ϕ ∈ D(Rd ) und f ∈ L p (Rd ), so ist ϕ ∗ f ∈ C ∞ (Rd ), und f¨ ur alle h¨oheren partiellen Ableitungen gilt Dα (ϕ ∗ f ) = (Dα ϕ) ∗ f. Hat f einen kompakten Tr¨ager, dann auch ϕ ∗ f . Das Problem mit diesem Korollar ist, dass man – ausger¨ ustet mit dem Arsenal der Schulmathematik – außer ϕ = 0 kein Beispiel f¨ ur eine Funktion in D(Rd ) hat. Und doch existieren solche Funktionen in H¨ ulle und F¨ ulle. Ausgangspunkt zu ihrer Konstruktion ist die C ∞ -Funktion auf R
−1/t e t > 0, ψ(t) = 0 t ≤ 0. Dann definiert ϕ(x) = ψ(1 − x2 ) eine Funktion in D(Rd ). Satz IV.9.8 Sei 1 ≤ p < ∞ und f ∈ L p (Rd ). Dann existiert eine Folge (fn ) in D(Rd ) mit fn − f p → 0. Mit anderen Worten liegt D(Rd ) dicht im halbnormierten Raum L p (Rd ), falls p < ∞.
272
IV.
Maß- und Integrationstheorie
Beweis. Die gesuchte Folge kann so konstruiert werden. Setze gn = f χ{ x ≤n} . Nach dem Satz von Beppo Levi gilt gn − f p → 0. Zu η > 0 w¨ahle nun N so groß, dass gN − f ≤ η. Sei ϕ ∈ D(Rd ) nichtnegativ mit Rd ϕ(x) dx = 1; nach (IV.26) gilt f¨ ur hinreichend kleine ε > 0 auch ϕε ∗ gN − gN p ≤ η und deshalb ϕε ∗ gN − f p ≤ 2η. Wie in Korollar IV.9.7 beobachtet, liegt ϕ ∗ gN in D(Rd ).
2
Dieselbe Aussage gilt auch auf Teilmengen des Rd (Lemma V.3.7). Im Hinblick auf sp¨ atere Anwendungen notieren wir noch ein weiteres Ergebnis. Satz IV.9.9 Sei K ⊂ Rd kompakt und f : K → C stetig. Dann existiert eine Folge (fn ) ⊂ D(Rd ), die auf K gleichm¨aßig gegen f konvergiert. Beweis. Mit Hilfe des Satzes von Tietze-Urysohn (Theorem I.7.4) k¨onnen wir f zu einer mit demselben Symbol bezeichneten Funktion in K (Rd ) fortsetzen. Ist unschte: Die ϕ ∈ D(Rd ) nichtnegativ mit Integral 1, leistet fn = ϕ1/n ∗f das Gew¨ Differenzierbarkeit und die Tr¨ agerbedingung wurden in Korollar IV.9.7 gezeigt und die gleichm¨ aßige Konvergenz in Satz IV.9.3. 2 Das Volumen der d-dimensionalen Kugel ur die euklidiEs sei Bd = {x ∈ Rd : x ≤ 1} die abgeschlossene Einheitskugel f¨ sche Norm des Rd . Wir wollen ihr d-dimensionales Volumen, also ωd = λd (Bd ) bestimmen. Zun¨ achst k¨ onnen wir aus (IV.16) in Satz IV.8.5 eine Rekursionsformel herleiten. Denken wir uns Rd als R × Rd−1 geschrieben, so ist f¨ ur −1 ≤ s ≤ 1 nach dem Satz von Pythagoras der Schnitt (Bd )s = {y ∈ Rd−1 : y ≤ (1−s2 )1/2 }, welcher naxh Korollar IV.8.10 das (d − 1)-dimensionale Volumen (1−s2)(d−1)/2 ωd−1 hat. Also liefert (IV.16) 1 (1 − s2 )(d−1)/2 ds · ωd−1 . ωd = −1
F¨ ur das hier auftretende Integral zeigt die Substitution s = cos t π/2 1 sind t dt. Id := (1 − s2 )(d−1)/2 ds = 2 −1
0
Es ist I0 = π, I1 = 2, und f¨ ur d ≥ 2 erh¨ alt man mittels partieller Integration, indem man einen Faktor sin t abspaltet, Id =
d−1 Id−2 . d
IV.9
Einige Anwendungen
273
Daraus ergibt sich I2k = π
k 2m − 1 , 2m m=1
I2k+1 = 2
k
2m 2m + 1 m=1
und weiter Id Id−1 = 2π/d sowie ωd = Id ωd−1 = Id Id−1 ωd−2 =
2π ωd−2 , d
was schließlich ω2k =
1 k π , k!
ω2k+1 =
2k+1 πk 1 · 3 · · · · · (2k + 1)
(IV.27)
impliziert. Eine u ur d → ∞ ¨ berraschende Konsequenz hiervon ist ωd → 0 f¨ (Beweis?). Wer die Gammafunktion kennt (Aufgabe II.6.39), kann u ¨ brigens (IV.27) auf einheitliche Weise durch π d/2 ωd = Γ(1 + d/2) wiedergeben. Der Brouwersche Fixpunktsatz Dieser Satz ist ein wichtiges Hilfsmittel, um die Existenz von L¨osungen gewisser Gleichungen zu zeigen. Er besagt, dass stetige Selbstabbildungen der euklidischen Einheitskugel Bd = {x ∈ Rd : x ≤ 1} stets Fixpunkte besitzen. Theorem IV.9.10 (Brouwerscher Fixpunktsatz) Sei f : Bd → Bd stetig. Dann existiert ein ξ ∈ Bd mit f (ξ) = ξ. Im Fall d = 1 ist der Brouwersche Fixpunktsatz eine einfache Konsequenz des Zwischenwertsatzes, aber in h¨ oheren Dimensionen ist er hochgradig nichttrivial; f¨ ur d = 2 kann man mit funktionentheoretischen Argumenten arbeiten (vgl. Aufgabe II.6.13). Wir geben jetzt einen analytischen Beweis dieses Satzes, der auf dem Transformationssatz beruht10 . Er erfolgt in mehreren Schritten. (1) Wendet man Satz IV.9.9 auf jede Koordinatenfunktion von f an, erh¨alt man (beliebig oft) stetig differenzierbare Abbildungen fn : Rd → Rd , die auf Bd gleichm¨ aßig gegen f konvergieren. Ersetzt man noch fn durch die Funktion 10 Dieser Beweis erschien zuerst in der 1. Auflage von H. Heusers Funktionalanalysis aus dem Jahre 1975 (Teubner-Verlag) sowie in Noten von J. Milnor (Analytic proofs of the “Hairy ball theorem” and the Brouwer fixed point theorem, Amer. Math. Monthly 85 (1978), 521– 524), C.A. Rogers (A less strange version of Milnor’s proof of Brouwer’s fixed-point theorem, Amer. Math. Monthly 87 (1980), 525–527) und K. Gr¨ oger (A simple proof of the Brouwer fixed point theorem, Math. Nachr. 102 (1981), 293–295).
274
IV.
Maß- und Integrationstheorie
fn /(supBd f (x) + 1/n), kann man zus¨ atzlich erreichen, dass fn (Bd ) ⊂ Ud := {x ∈ Rd : x < 1}. Wenn jedes fn einen Fixpunkt ξn ∈ Bd besitzt, dann ¨ auch f : Nach Ubergang zu einer Teilfolge kann man n¨amlich annehmen, dass (ξn ) konvergiert, etwa gegen ξ. Es folgt dann f (ξ) − ξ ≤ f (ξ) − f (ξn ) + f (ξn ) − fn (ξn ) + fn(ξn ) − ξn + ξn − ξ → 0, denn der erste Summand strebt gegen 0, weil f stetig ist, der zweite, weil (fn ) gleichm¨ aßig konvergiert, und der vierte nach Konstruktion; der dritte Summand verschwindet, da ξn Fixpunkt von fn ist. Daher ist ξ Fixpunkt von f . Es reicht also, den Brouwerschen Fixpunktsatz f¨ ur C 1 -Abbildungen f : Rd → Rd , die Bd in Ud abbilden, zu beweisen. (2) Nehmen wir an, es g¨ abe eine fixpunktfreie Abbildung f wie oben beschrieben. Dann existiert eine auf einer offenen Umgebung W von Bd definierte C 1 -Abbildung g mit g(Bd ) ⊂ ∂Bd und g(x) = x f¨ ur x ∈ ∂Bd . Eine solche, Retraktion genannte Abbildung g kann man wie folgt gewinnen. Nach Annahme ist f auf Bd fixpunktfrei. F¨ ur x ∈ Bd wird g(x) als der Schnittpunkt der von f (x) u angerten Halbgeraden mit ∂Bd definiert; ¨ ber x verl¨ es ist dann klar, dass g(Bd ) ⊂ ∂Bd und g(x) = x auf ∂Bd gelten. In Formeln ist g(x) = f (x) + λ(x)(x − f (x)), wo λ(x) die gr¨ oßere L¨osung der quadratischen Gleichung f (x) + λ · (x − f (x))2 = 1, d.h. x − f (x)2 λ2 + 2f (x), x − f (x)λ + f (x)2 − 1 = 0, ist. Schreibt man die Gleichung in der Form a(x)λ2 + b(x)λ + c(x) = 0, erh¨ alt man f¨ ur die gr¨ oßere L¨ osung die Darstellung −b(x) + b(x)2 − 4a(x)c(x) . λ(x) = 2a(x) Hier sind a, b, c stetig differenzierbare Abbildungen auf Rd , es ist a(x) > 0 auf Bd und deshalb auch auf einer offenen Umgebung W von Bd , die noch so klein gew¨ ahlt werden kann, dass f (W ) ⊂ Ud ; mit anderen Worten ist c(x) < 0 auf W . Damit ist λ als C 1 -Funktion sogar auf W definiert und genauso g: x → f (x) + λ(x)(x − f (x)). (3) Wir werden nun argumentieren, dass es eine Abbildung g wie unter (2) beschrieben nicht gibt. Nehmen wir stattdessen an, es sei eine solche Abbildung g vorgelegt. Wir setzen h(x) = g(x) − x,
gt (x) = (1 − t)x + tg(x) = x + th(x)
IV.9
Einige Anwendungen
275
f¨ ur x ∈ W und 0 ≤ t ≤ 1; dies sind ebenfalls C 1 -Abbildungen, und man hat gt (Bd ) ⊂ Bd . Wir werden als erstes zeigen, dass gt f¨ ur hinreichend kleine t auf Bd injektiv ist. Als stetig differenzierbare Abbildung erf¨ ullt h auf der kompakten Menge Bd nach dem Mittelwertsatz eine Lipschitz-Bedingung: h(x) − h(y) ≤ Cx − y
∀x, y ∈ Bd .
Sei nun t < 1/C und gt (x) = gt (y) f¨ ur zwei Punkte x, y ∈ Bd . Es folgt x − y = t(h(y) − h(x)) und weiter x − y ≤ tCx − y, was x = y impliziert. (4) Betrachte nun die Jacobimatrix (Dgt )(x). Wir zeigen, dass f¨ ur hinreichend kleine t und alle x ∈ Bd die Determinante det(Dgt )(x) > 0 ist; insbesondere ist dann (Dgt )(x) invertierbar. Es ist n¨ amlich ∆(t, x) := det(Dgt )(x) = det(Id + t(Dh)(x)) eine stetige Funktion von (t, x), und es ist ∆(0, x) = 1 auf Bd . Ein Kompaktheitsargument (Aufgabe IV.10.63) liefert die Existenz eines t0 > 0 mit ∆(t, x) > 0 auf [0, t0 ] × Bd . ahlen, dass gt f¨ ur 0 ≤ t ≤ t0 auf Bd injektiv (5) Wir k¨ onnen t0 noch so klein w¨ ist (Schritt 3). F¨ ur diese t folgt dann aus dem Satz u ¨ ber die inverse Funktion, dass Gt := gt (Ud ) als bijektives Bild einer offenen Menge selbst offen ist. Da klarerweise Gt ⊂ Bd ist, folgt also Gt ⊂ Ud . Wir werden jetzt Gt = Ud zeigen. Zun¨ achst folgt aus Gt = gt (Ud ) ⊂ gt (U d ) ⊂ Gt und der Tatsache, dass gt (Bd ) als stetiges Bild einer kompakten Menge wieder kompakt ist, die Gleichheit gt (Bd ) = Gt .
(IV.28)
Sei nun u ∈ Bd \ Gt ; wir werden u = 1 und so Gt = Ud zeigen. Sei z ∈ Gt ein fester Punkt. Setzt man λ0 = sup{0 ≤ λ ≤ 1: (1 − λ)z + λu ∈ Gt }, so ist / Gt , weil Gt offen ist. Nach (IV.28) existiert b := (1 − λ0 )z + λ0 u ∈ ∂Gt , aber b ∈ ein x ∈ Bd mit gt (x) = b; da x ∈ Ud die Konsequenz b ∈ Gt nach sich z¨oge, muss x = 1 sein. Nun operiert gt auf ∂Bd identisch, so dass b = x ∈ ∂Bd folgt. Da b nach Konstruktion eine Konvexkombination von u und z ist, muss u = b und deshalb ebenfalls u = 1 sein. (6) Als Schlusspunkt des Beweises zeigen wir jetzt, wie eine Anwendung der Transformationsformel einen Widerspruch zu Tage f¨ordert. Dazu setze det(Dgt )(x) dx J(t) = Ud
1
f¨ ur 0 ≤ t ≤ 1. F¨ ur t ≤ t0 ist gt ein C -Diffeomorphimus von Ud auf Ud (Schritt 5), und der Integrand ist > 0 (Schritt 4). Daher liefert die Transformationsformel (Satz IV.8.9) dx = λd (Ud )
J(t) =
Ud
∀t ≤ t0 .
276
IV.
Maß- und Integrationstheorie
Nun ist det(Dgt )(x) ein Polynom in t (dessen Koeffizienten von x abh¨angen), denn (Dgt )(x) ist von der Form A + tB. Deshalb ist auch J ein Polynom in t, das, wie gerade gezeigt, auf einem Intervall konstant ist. Also ist J konstant mit der Konsequenz J(1) = λd (Ud ) = 0. Eine direkte Rechnung zeigt jedoch J(1) = 0: Es ist n¨amlich g1 = g und daher det(Dg)(x) dx. J(1) = Ud
Ferner ist stets g(x) = 1 auf Ud , also g(x), g(x) = 1. Differenziert man diese Gleichung, ergibt sich 2((Dg)(x))(g(x)) = 0; weil g(x) = 0 ist, kann (Dg)(x) nicht invertierbar sein, hat also stets die Determinante 0. Es folgt J(1) = 0. Mit diesem Widerspruch ist der Beweis des Brouwerschen Fixpunktsatzes erbracht. 2 Man beachte, dass im Gegensatz zum Banachschen Fixpunktsatz der Beweis hier nicht konstruktiv ist und dass keine Eindeutigkeitsaussage getroffen werden kann. Der Brouwersche Fixpunktsatz gilt nicht nur f¨ ur stetige Selbstabbildungen der Kugel, sondern auch auf Mengen K, die zu solchen Kugeln hom¨oomorph oomorphismus und ξ ein Fixpunkt von sind. (Ist n¨ amlich h: Bd → K ein Hom¨ h−1 f h: Bd → Bd , so ist h(ξ) ein Fixpunkt von f .) Wir werden zeigen, dass dies insbesondere f¨ ur kompakte konvexe Mengen der Fall ist. Lemma IV.9.11 Jede kompakte konvexe Teilmenge K = ∅ von Rd ist zu einer Kugel Bm geeigneter Dimension hom¨oomorph. Beweis. Ohne Einschr¨ ankung ist 0 ∈ K, da Translationen x → x−x0 Hom¨oomorphismen sind. Sei E die lineare H¨ ulle von K und m = dim E; dann enth¨alt K 1 (b1 + · · · + bm ) ∈ K; eine Basis b1 , . . . , bm von E. Da K konvex ist, ist b = m in der Tat ist b ein innerer Punkt von K relativ zu E. Die Menge K ′ = {x − b: x ∈ K} ist dann ebenfalls kompakt und konvex, hom¨oomorph zu K und eine Nullumgebung relativ zu E. Ferner ist B ′ = {x ∈ E: x ≤ 1} hom¨oomorph zu onnte man sagen, dass B ′ = Bm ist.) Bm . (Weniger pedantisch k¨ Wir konstruieren jetzt einen Hom¨ oomorphismus von B ′ auf K ′ . Definiere " ! x p: E → [0, ∞), p(x) = inf α > 0: ∈ K ′ . α Die Konvexit¨ at von K ′ liefert f¨ ur x, y ∈ E und λ > 0 p(x + y) ≤ p(x) + p(y) p(λx) = λp(x);
ferner ist f¨ ur eine Konstante M ≥ 0 p(x) ≤ M x,
IV.9
Einige Anwendungen
277
da K ′ eine Nullumgebung in E ist. Man erh¨ alt daraus p(x) − p(y) = p((x − y) + y) − p(y) ≤ p(x − y) ≤ M x − y sowie aus Symmetriegr¨ unden |p(x) − p(y)| ≤ M x − y und so die Stetigkeit von p. Dann ist h: E → E,
⎧ ⎨ x x f¨ ur x = 0, h(x) = p(x) ⎩ 0 f¨ ur x = 0,
ebenfalls stetig, und h bildet B ′ hom¨ oomorph auf K ′ ab; dazu beachte, dass ′ K = {x ∈ E: p(x) ≤ 1} und p(x) = 0 nur f¨ ur x = 0, weil K ′ kompakt ist. 2 Die im letzten Beweis konstruierte Funktion p wird Minkowski-Funktional genannt. Die obige Diskussion liefert also: Korollar IV.9.12 Sei K ⊂ Rd kompakt, konvex und nichtleer; es sei f : K → K stetig. Dann existiert ein ξ ∈ K mit f (ξ) = ξ. Das Lebesguemaß auf einer Mannigfaltigkeit In diesem Unterabschnitt soll kurz beschrieben werden, wie die Integration auf Untermannigfaltigkeiten des Rn , die in der Regel im dritten Teil der Analysisvorlesung behandelt wird, im Rahmen der Lebesgueschen Theorie formuliert werden kann. Wir legen folgenden Begriff zugrunde11 : Eine d-dimensionale Untermannigfaltigkeit des Rn ist eine Teilmenge M ⊂ Rn , so dass es f¨ ur jeden Punkt p ∈ M eine bez¨ uglich der Relativtopologie offene Umgebung Up ⊂ M , eine offene Teilmenge C ⊂ Rd und eine C 1 -Abbildung ϕ: C → Rn gibt, die C ur die die (n × d)-Jacobimatrizen (Dϕ)(x), hom¨ oomorph auf Up abbildet und f¨ x ∈ C, stets vollen Rang haben. Solch ein ϕ heißt eine Karte und Up eine Kartenumgebung. Wir verwenden die Borel-σ-Algebra auf M (vgl. Lemma IV.1.9). Um zu einem Maß auf Bo (M ) zu gelangen, liegt es nahe, das Lebesguemaß auf Rd mittels der Abbildungen ϕ nach M zu transportieren; dabei ist jedoch der richtige Verzerrungsfaktor zu beachten. Im einfachsten Fall, in dem M ein d-dimensionaler Untervektorraum und ϕ: Rd → Rn eine injektive lineare Abbildung ist, die bez¨ uglich der Standardbasen durch eine (n×d)-Matrix L repr¨asentiert ist, w¨ urde man so etwas wie die Determinante als Verzerrungsfaktor erwarten (vgl. Korollar IV.8.10). F¨ ur eine nicht quadratische Matrix ist die Determinante freilich 11 Zu
diesen Dingen sei auf O. Forster, Analysis 3, Vieweg 1981, §14 verwiesen.
278
IV.
Maß- und Integrationstheorie
nicht erkl¨ art, und man muss einen Ausweg suchen. Dieser besteht darin, die positiv definite (d × d)-Matrix L∗ L zu betrachten, die lauter positive Eigenwerte und deshalb eine positive√Determinante hat. Der richtige Verzerrungsfaktor im linearen Fall w¨ are dann det L∗ L. Da C 1 -Abbildungen sich im Kleinen“ wie ” ¨ ihre Jacobimatrizen verhalten, suggeriert diese Uberlegung folgenden Ansatz f¨ ur das Lebesguemaß auf einer Kartenumgebung bzgl. einer Karte ϕ: C → U : Mit gϕ (x) = det(Dϕ)(x)∗ (Dϕ)(x), der Gramschen Determinante von ϕ, setze f¨ ur eine Borelmenge A ⊂ U 3 λM gϕ (x) dx U (A) = ϕ−1 (A)
(rechter Hand steht ein d-dimensionales Integral). Es ist nach dem Satz von Beppo Levi klar, dass auf diese Weise ein (σ-additives) Maß auf Bo (U ) definiert wird. Um daraus ein Maß auf ganz Bo (M ) zusammenzusetzen, greifen wir zuerst eine Beobachtung aus Schritt (7) des Beweises des Transformationssatzes IV.8.9 auf; vgl. Fußnote 9 auf Seite 263. Danach kann M durch abz¨ahlbar viele Kar∞ origen Karten tenumgebungen u berdeckt werden, etwa M = ¨ j=1 Uj mit zugeh¨ ϕj : Cj → Uj . Mit der u blichen Technik k¨ o nnen wir die U gem¨ aß B1 = U1 , ¨ j B2 = U2 \ B1 , B3 = U3 \ (B1 ∪ B2 ) etc. disjunkt machen, und f¨ ur eine Borelmenge A ⊂ M kann man M
λ (A) =
∞
λM Uj (A
j=1
∩ Bj ) =
∞ j=1
ϕ−1 j (A∩Bj )
3 gϕj (x) dx
(IV.29)
setzen. Es ist noch zu u ¨ berlegen, dass λM (A) nicht von der Wahl ∞ der Karten und der Auswahl der Teil¨ uberdeckung abh¨ angt. Sei dazu M = i=1 Vi eine weitere ¨ Uberdeckung mit Kartenumgebungen und zugeh¨origen Karten ψi : Di → Vi , durch Disjunktifizieren entstehe aus den Vi die Folge A1 , A2 , . . . . Nun ist f¨ ur eine Borelmenge A nachzuweisen, dass A ∩ Ai ∩ Bj in beiden Varianten der Definition dasselbe Maß zugeordnet bekommt (was klar ist, wenn diese Menge −1 leer ist). Mit C = ϕ−1 j (A ∩ Ai ∩ Bj ) und D = ψi (A ∩ Ai ∩ Bj ) ist also 3 3 gϕj (x) dx = gψi (x) dx C
D
zu zeigen. Bezeichnet Φ den C 1 -Diffeomorphismus12 ψi−1 ◦ ϕj , so gilt wegen der Kettenregel (Dϕj )(x)∗ (Dϕj )(x) = (DΦ)(x)∗ (Dψi )(Φx)∗ (Dψi )(Φx)(DΦ)(x) 12 O.
Forster, a.a.O, §14, Satz 3.
IV.9
Einige Anwendungen
279
und deshalb gϕj (x) = det(DΦ)(x)∗ gψi (Φx)(DΦ)(x) = gψi (Φx) |det(DΦ)(x)|2 . Die Behauptung ergibt sich also aus dem Transformationssatz IV.8.9. Das durch (IV.29) erkl¨ arte Maß heißt das Lebesguemaß auf der Untermannigfaltigkeit M . Kommen wir zu einem Beispiel. Wir betrachten den Rand der Einheitskugel im R3 S 2 = {u ∈ R3 : u = 1}. Durch ψ: (0, 2π) × (0, π) → S 2 ⊂ R3 ,
ψ(ϕ, θ) = (cos ϕ sin θ, sin ϕ sin θ, cos θ)
wird eine Karte definiert, deren Bild U die S 2 ohne Nord- und S¨ udpol und ohne den 0-L¨ angengrad ist. Es ist gψ (ϕ, θ) = sin θ (nachrechnen!), und f¨ ur eine Borelmenge A ⊂ U ist 2 λS (A) = sin θ dθ dϕ. (IV.30) ψ −1 (A)
Nimmt man noch Karten hinzu, die einen anderen L¨angengrad bzw. die zwei ¨ H¨alften des Aquators auslassen, kann man die (IV.29) entsprechende Formel in diesem Beispiel aufstellen. Das ist aber gar nicht n¨otig, da sich S 2 \ U als Menge vom Maß 0 herausstellt. Daher gilt (IV.30) f¨ ur alle Borelmengen A ⊂ S 2 , insbesondere ist die Oberfl¨ ache der Einheitskugel 2π π 2 sin θ dθ dϕ = 4π. λS (S 2 ) = 0
0
Mit den u ¨ blichen Schritten (von Indikatorfunktionen u ¨ ber Treppenfunktionen zu integrierbaren Funktionen) kommt man zum Integral bzgl. λM ; das Resultat ist mit den Bezeichnungen von oben ∞ 3 f dλM = f (ϕj (x)) gϕj (x) dx. M
j=1
ϕ−1 j (Bj )
Die Bildmaßformel der Wahrscheinlichkeitstheorie Das Fundament der Wahrscheinlichkeitstheorie ist die Maß- und Integrationstheorie; in der Tat ist einem Bonmot Mark Kac’ zufolge Wahrscheinlichkeitstheorie “measure theory with a soul”. Ausgangspunkt ist ein Wahrscheinlichkeitsraum (S, A , µ), also ein Maßraum mit µ(S) = 1. Nach den Konventionen der Stochastik wird ein Wahrscheinlichkeitsraum mit (Ω, A , P) bezeichnet. Der Kernbegriff der Stochastik ist der einer Zufallsvariablen, das ist einfach eine messbare Funktion X: Ω → R (hier haben wir uns erneut einer typischen
280
IV.
Maß- und Integrationstheorie
Nomenklatur der Wahrscheinlichkeitstheorie bedient, wonach Zufallsvariablen mit X, Y etc. bezeichnet werden). Die entscheidende Frage ist nun die nach der Verteilung von X, d.h. mit welcher Wahrscheinlichkeit X Werte in einer gegebenen Menge annimmt. Hier ist folgender allgemeiner Begriff n¨ utzlich. Definition IV.9.13 Es seien (S, A , µ) ein Maßraum, (S ′ , A ′ ) ein messbarer Raum und T : S → S ′ eine messbare Abbildung. Das Bildmaß von µ unter T wird durch µT (A′ ) = µ(T −1 (A′ )) = µ({T ∈ A′ })
∀A′ ∈ A ′
definiert. Da T messbar ist, ist µT wohldefiniert, und es ist leicht zu verifizieren, dass µT : A ′ → [0, ∞] wirklich ein Maß ist. Es gilt dann folgende Bildmaßformel. Satz IV.9.14 Eine messbare Funktion f : S ′ → R ist genau dann µT -integrierbar, wenn f ◦ T : S → R µ-integrierbar ist. In diesem Fall ist f dµT = f ◦ T dµ ∀A′ ∈ A ′ . (IV.31) A′
T −1 (A′ )
Diese Formel gilt stets f¨ ur positive messbare Funktionen f in [0, ∞]. Der Beweis ist sehr einfach und folgt der Standardtechnik: Nach Definition des Bildmaßes gilt (IV.31) f¨ ur Indikatorfunktionen, also f¨ ur Treppenfunktionen, also f¨ ur positive messbare Funktionen, also f¨ ur integrierbare Funktionen. 2 Die Transformationsformel (IV.20) l¨ asst sich in diesem Kontext auch so interpretieren, dass das Lebesguemaß das Bildmaß des Maßes mit der Dichte |JΦ | unter dem Diffeomorphismus Φ ist. F¨ ur eine Zufallsvariable X: Ω → R ist die Verteilung von X nichts anderes als das Bildmaß PX ; PX ist ein Borel-Wahrscheinlichkeitsmaß auf R. F¨ ur das Integral einer Zufallsvariablen, in der Wahrscheinlichkeitstheorie Erwartungswert genannt und mit E(X) bezeichnet, ergibt sich aus (IV.31) x dPX (x). X dP = E(X) = Ω
R
In der elementaren Wahrscheinlichkeitsrechnung wird diese Gleichung u ¨ blicherweise in den Spezialf¨ allen, dass PX ein diskretes Maß ist oder eine Dichte bzgl. des Lebesguemaßes besitzt, diskutiert. Die Unabh¨ angigkeit zweier Zufallsvariablen X und Y bedeutet definitionsgem¨ aß, dass die gemeinsame Verteilung P(X,Y ) , das ist das Bildmaß unter der R2 -wertigen Abbildung ω → (X(ω), Y (ω)), gleich dem Produktmaß PX ⊗PY ist. Die Konstruktion des Produktmaßes gestattet es umgekehrt, f¨ ur eine gegebene
IV.10 Aufgaben
281
Zufallsvariable X einen Wahrscheinlichkeitsraum zu bilden, auf dem zwei unabh¨ angige Kopien von X mit derselben Verteilung wie X erkl¨art sind, n¨amlich (R2 , Bo (R2 ), PX ⊗ PY ) mit X1 (x, y) = x und X2 (x, y) = y. Um jedoch fundamentale Aussagen der Wahrscheinlichkeitstheorie wie das starke Gesetz der großen Zahl zu formulieren, reicht das nicht aus; hier braucht man eine Folge unabh¨ angiger Kopien von X, und die kann man erst mit Hilfe unendlicher Produkte konstruieren. Noch kompliziertere Existenzs¨atze ben¨otigt die Theorie der stochastischen Prozesse (Satz von Kolmogorov); diese Dinge findet man zum Beispiel in den in den Literaturhinweisen genannten B¨ uchern von Behrends, Bauer, Billingsley und Dudley.
IV.10
Aufgaben
Mit Messbarkeit im Kontext von R oder Rd ist, sofern nichts anderes gesagt ist, stets die Borel-Messbarkeit gemeint. Aufgabe IV.10.1 Ist {A ⊂ R: A ⊂ [0, 1] oder ∁A ⊂ [0, 1]} eine σ-Algebra auf R? Ist es ein Ring? Aufgabe IV.10.2 Sei R ⊂ P(S) ein Ring. Mit der symmetrischen Differenz A ∆ B = (A \ B) ∪ (B \ A) als Addition und dem Schnitt ∩ als Multiplikation ist R dann ein Ring im Sinn der Algebra. Aufgabe IV.10.3 (a) Zeige, dass die Menge aller positiven reellen Zahlen, die in ihrer Dezimaldarstellung an der n-ten Stelle hinter dem Komma (n ∈ N fest) eine 2 aufweisen, eine Borelmenge ist. (b) Zeige, dass die Menge aller positiven reellen Zahlen, die in ihrer Dezimaldarstellung irgendwo hinter dem Komma eine 2 aufweisen, eine Borelmenge ist. Um Mehrdeutigkeiten zu vermeiden, wollen wir bei der Dezimaldarstellung nur Darstellungen ohne die Periode 9 zulassen, d.h. keine Zahlen der Form A,d1 d2 d3 999 . . . . Aufgabe IV.10.4 Sei S eine Menge und A ⊂ P(S) eine σ-Algebra. Zeige, dass A endlich oder u ahlbar ist. ¨berabz¨ Aufgabe IV.10.5 F¨ ur A ⊂ Rd und α > 0 sei αA = {αx: x ∈ A}. Zeige mit dem Prinzip der guten Mengen: Ist A eine Borelmenge, so auch αA. Aufgabe IV.10.6 Sei (S, A , µ) ein Maßraum. F¨ ur A1 , A2 , · · · ⊂ S definiere lim sup An =
∞ ∞
An .
k=1 n=k
(a) lim sup An besteht aus allen s ∈ S, die zu unendlich vielen der An geh¨ oren. (b) Sind alle An ∈ A , so ist auch lim sup An ∈ A .
282
IV. (c) Sind alle An ∈ A und gilt von Borel-Cantelli ).
∞
n=1
Maß- und Integrationstheorie
µ(An ) < ∞, so ist µ(lim sup An ) = 0 (Lemma
Aufgabe IV.10.7 Beweise Lemma IV.1.9. Aufgabe IV.10.8 Es sei S u ahlbar und A die σ-Algebra der abz¨ ahlbaren und ¨ berabz¨ koabz¨ ahlbaren Mengen aus Beispiel IV.1(c). Dann definiert f¨ ur 0 ≤ r ≤ ∞
0 falls A abz¨ ahlbar, µr (A) = r sonst ein Maß auf A . Aufgabe IV.10.9 F¨ ur jeden Inhalt auf einem Ring gilt µ(A ∪ B) ≤ µ(A) + µ(B). Aufgabe IV.10.10 Gibt es ein Lebesguemaß auf Q? Sei IQ ⊂ P(Q) das System der halboffenen rationalen Intervalle“ I = (a, b] ∩ Q mit a, b ∈ Q und FQ das System der ” endlichen Vereinigungen solcher Intervalle; das ist ein Ring. Gibt es ein Pr¨ amaß auf ange zuordnet? FQ , das jedem I ∈ IQ dessen elementargeometrische L¨ Aufgabe IV.10.11 F¨ ur eine endliche Teilmenge B von N bezeichne #B die Anzahl der Elemente von B. F¨ ur eine beliebige Teilmenge A von N definiere α(A) = lim sup n→∞
#(A ∩ {1, . . . , n}) . n
Ist α ein ¨ außeres Maß auf P(N)? Ist α ein Inhalt auf P(N)? Was ist α(P) f¨ ur die Menge P der Primzahlen? [Um diese Frage beantworten zu k¨ onnen, ben¨ otigen Sie den Primzahlsatz, Theorem II.5.1.] Aufgabe IV.10.12 Sei R = {A ⊂ R: A oder R \ A ist endlich}; dies ist ein Ring. Ferner seien µ1 , µ2 : R → [0, ∞] durch
0 falls A endlich, µ1 (A) = 1 sonst
0 falls A endlich, µ2 (A) = ∞ sonst definiert. (a) µ1 und µ2 sind Pr¨ amaße auf R. (b) Bestimme die zugeh¨ origen ¨ außeren Maße µ∗1 und µ∗2 sowie die µ∗1 - bzw. µ∗2 messbaren Mengen. (c) Diskutiere die Eindeutigkeit der Fortsetzung von µi zu Maßen auf σ(R) bzw. Mµ∗i . Aufgabe IV.10.13 Sei R der Ring der endlichen Teilmengen von R und µ = 0 auf R das triviale Pr¨ amaß. Bestimme die σ-Algebra der µ∗ -messbaren Mengen Mµ∗ und aß Theorem IV.3.5. die σ-additive Fortsetzung von µ zu einem Maß auf Mµ∗ gem¨
IV.10
Aufgaben
283
Aufgabe IV.10.14 Sei µ ein σ-endliches Pr¨ amaß auf einem Ring R ⊂ P(S). Dann sind f¨ ur A ⊂ S ¨ aquivalent: (i) A ∈ Mµ∗ . (ii) Es existiert ein N ⊂ S mit µ∗ (N ) = 0 und A ∪ N ∈ σ(R). Aufgabe IV.10.15 Das Lebesguemaß ist auf der σ-Algebra M(λd )∗ der Lebesguemessbaren Mengen translationsinvariant. Tipp: Aufgabe IV.10.14. Aufgabe IV.10.16 Gib ein Beispiel eines Dynkin-Systems, das keine σ-Algebra ist. Aufgabe IV.10.17 Sei f : Rd → R eine Funktion, und sei S die Menge ihrer Stetigkeitspunkte. Die Oszillationsfunktion zu f ist durch ωf (x) = inf sup{|f (y1 ) − f (y2 )|: yi − x < ε} ε>0
erkl¨ art. (a) Beschreibe S mit Hilfe von ωf . (b) {x: ωf (x) < r} ist f¨ ur alle r ∈ R offen. (c) Zeige, dass S eine Borelmenge ist. Aufgabe IV.10.18 Konstruiere zu ε > 0 eine kompakte, nirgends dichte, u ahl¨berabz¨ bare Teilmenge von [0, 1], deren Lebesguemaß gr¨ oßer als 1 − ε ist. Gibt es auch eine solche Menge vom Maß 1? Aufgabe IV.10.19 Seien α > 0 und ε > 0. Definiere Mengenfunktionen hα,ε und hα auf P(Rd ) durch ∞ (diam(Ej ))α , hα,ε (A) = inf j=1
¨ wobei sich das Infimum u ahlbaren Uberdeckungen A⊂ ¨ber alle abz¨ gen vom Durchmesser diam(Ej ) ≤ ε erstreckt, bzw.
j
Ej durch Men-
hα (A) = sup hα,ε (A). ε
Zeige, dass hα,ε und hα ¨ außere Maße sind. (hα heißt das α-dimensionale Hausdorffmaß. Man kann zeigen, dass jede Borelmenge hα -messbar ist und dass hd , eingeschr¨ ankt auf Bo (Rd ), ein Vielfaches des Lebesguemaßes λd ist.) Aufgabe IV.10.20 Eine Funktion f : R → R ist folgendermaßen definiert: f (x) = 0, wenn x irrational ist, f (0) = 0, und wenn x = 0 rational ist und als gek¨ urzter Bruch x = p/q mit p ∈ Z und q ∈ N dargestellt ist, ist f (x) = 1/q. Zeige, dass f messbar ist. Aufgabe IV.10.21 Eine Funktion f : Rd → R ist folgendermaßen definiert: f (x) = 0, wenn x = 0 oder x > 1, f (x) = 1/ x , wenn 0 < x ≤ 1. Zeige, dass f messbar ist. Aufgabe IV.10.22 Jede monotone Funktion f : R → R ist messbar.
284
IV.
Maß- und Integrationstheorie
Aufgabe IV.10.23 Seien f, g: S → R messbare Funktionen auf einem messbaren Raum (S, A ). Dann liegen die Mengen {f ≥ g} und {f = g} in A . Aufgabe IV.10.24 Sei S eine Menge und f : S → R eine Funktion. Setze Af = {f −1 (A): A ⊂ R eine Borelmenge} ⊂ P(S). Dann ist Af eine σ-Algebra, und es ist die kleinste σ-Algebra A auf S, so dass f : (S, A ) → (R, Bo (R)) messbar ist. Aufgabe IV.10.25 Sei f : R → R differenzierbar. Dann ist die Ableitung f ′ messbar. Aufgabe IV.10.26 Sei A die σ-Algebra der abz¨ ahlbaren und koabz¨ ahlbaren Teilmengen von R aus Beispiel IV.1(c). Charakterisiere die (R, A )-(R, Bo (R))-messbaren Funktionen. Aufgabe IV.10.27 Sei M ein metrischer (oder topologischer) Raum. Die von den offenen Mengen erzeugte σ-Algebra heißt die Borel-σ-Algebra von M . (a) F¨ ur M ⊂ Rd ist diese Definition konsistent mit Definition IV.1.8. (b) Jede stetige Funktion f : M → R ist Borel-messbar. Aufgabe IV.10.28 Sei f : [0, 1] × [0, 1] → R eine separat stetige Funktion, d.h., f¨ ur jedes x ist y → f (x, y) stetig, und f¨ ur jedes y ist x → f (x, y) stetig. Dann ist f messbar. Hinweis: Betrachte zu n ∈ N die durch k + 1 k + 1 k k +f fn (x, y) = n f ,y x − ,y −x n n n n f¨ ur k/n ≤ x ≤ (k + 1)/n, k = 0, . . . , n − 1, und 0 ≤ y ≤ 1 definierte Funktion (Skizze?). [Dieses Resultat stammt aus der ersten Publikation von Lebesgue aus dem Jahr 1898.] Aufgabe IV.10.29 F¨ ur eine Funktion f : Rd → R und x ∈ Rd definiere die um x verschobene Funktion fx durch fx (y) = f (y − x). (a) Mit f ist auch fx messbar. (b) Mit f ist auch fx integrierbar, und es gilt f dλd = fx dλd . Rd
Rd
[Tipp: Methode wie in den Beispielen von Abschnitt IV.5.] Aufgabe IV.10.30 Seien fn integrierbare Funktionen auf einem Maßraum (S, A , µ), f dµ < ∞, ist auch f integrierbar (s) ր f (s) f¨ u r alle s ∈ S. Falls sup und gelte f n n n S und S f dµ = supn S fn dµ.
Aufgabe IV.10.31 Sei f integrierbar. Dann gilt f > 0 f.¨ u. genau dann, wenn > 0 f¨ ur alle A ∈ A mit µ(A) > 0.
A
f dµ
IV.10
Aufgaben
285
Aufgabe IV.10.32 Sei (S, A , µ) ein Maßraum, und sei f : S → R messbar. Dann ist f genau dann integrierbar, wenn ∞
n=−∞
2n µ({2n ≤ |f | ≤ 2n+1 }) < ∞.
Aufgabe IV.10.33 Sei F : R → R stetig differenzierbar und monoton wachsend und µF das zugeh¨ orige Lebesgue-Stieltjes-Maß, das am Ende von Abschnitt IV.3 konstruiert wurde. Eine messbare Funktion ist genau dann µF -integrierbar, wenn |f (x)|F ′ (x) dx < ∞ R
ist, und dann ist
f (x) dµF (x) = R
f (x)F ′ (x) dx. R
Aufgabe IV.10.34 Zeige lim
n→∞
∞ 0
sin(ex ) dx = 0. 1 + nx2
Aufgabe IV.10.35 Zu einer Lebesgue-integrierbaren Funktion f : R → C definiert man ihre Fourier-Transformierte f4 durch 1 e−ixy f (x) dx. f4(y) = √ 2π R (a) Warum ist die Funktion f4 wohldefiniert? (b) Ist die Funktion f4 stetig?
Aufgabe IV.10.36 √ ur 0 < s ≤ 1 und f (s) = 0 sonst definiert. (a) Sei f : R → R durch f (s) = 1/ s f¨ Zeige, dass f messbar ist, und berechne R f dλ. −n (b) Sei (rn ) eine Aufz¨ ahlung von Q und g(s) = ∞ f (s−rn ) ∈ [0, ∞]. Zeige, n=1 2 dass g integrierbar ist, und schließe, dass g(s) < ∞ λ-f.¨ u. gilt. (c) Die Funktion g ist an keiner Stelle stetig und auf jedem offenen Teilintervall von R unbeschr¨ ankt. (d) Ein Beispiel wie unter (c) ließe sich einfacher konstruieren (wie?); die Funktion g dieser Aufgabe hat jedoch noch eine st¨ arkere Eigenschaft: Sei h: R → R eine messbare Funktion mit h = g λ-f.¨ u. Dann ist auch h ∈ L 1 (R), h ist an keiner Stelle stetig und auf jedem offenen Teilintervall von R unbeschr¨ ankt. Aufgabe IV.10.37 Gelte µ(S) < ∞ und 1 ≤ r ≤ p. Dann folgt L p (µ) ⊂ L r (µ) und
f r ≤ µ(S)1/r−1/p f p f¨ ur f ∈ L p (µ). Aufgabe IV.10.38 Ist f ∈ L p (Rd ), 1 ≤ p ≤ ∞, und K ⊂ Rd kompakt, so ist f |K ∈ L 1 (K).
286
IV.
Maß- und Integrationstheorie
ur 1 ≤ Aufgabe IV.10.39 Es gilt weder L r (R) ⊂ L p (R) noch L p (R) ⊂ L r (R) f¨ r < p ≤ ∞. Aufgabe IV.10.40 (a) L ∞ [0, 1] ⊂ p 0 und A = {s ∈ S : |f (s)| ≥ ε}. Zeige µ(A) ≤
f pp . εp
Tipp: |f | ≥ εχA . Aufgabe IV.10.43 Gelte µ(S) < ∞. Eine Folge messbarer Funktionen (fn ) auf S konvergiert gegen die messbare Funktion f dem Maße nach, wenn µ({|fn − f | ≥ ε}) → µ 0 f¨ ur alle ε > 0; in Zeichen fn −→ 0. (In der Wahrscheinlichkeitstheorie wird dieser Konvergenzbegriff stochastische Konvergenz oder Konvergenz in Wahrscheinlichkeit genannt.) µ u., dann fn −→ 0. (a) Wenn fn → f f.¨ Tipp: Satz von Egorov. (b) Die Umkehrung gilt nicht. µ u. (c) Wenn fn −→ 0, existiert eine Teilfolge mit fnk → f f.¨ Tipp: Finde Indizes nk mit µ({|fnk − f | ≥ 2−k }) ≤ 2−k und verwende das Lemma von Borel-Cantelli (Aufgabe IV.10.6). µ (d) Wenn fn → f in L p (µ), dann fn −→ f . Tipp: Chebyshevsche Ungleichung, Aufgabe IV.10.42. Aufgabe IV.10.44 Sei f : Rd → R stetig. Es gelte
sup f p < ∞. Dann ist f
1≤p a > 0 das Integral ∞ −ax e − e−bx dx. x 0 b Tipp: Schreibe den Integranden als a [. . . ] dy.
Aufgabe IV.10.51 Berechne das Integral π π sin y dy dx. y x 0 Aufgabe IV.10.52 Berechne lim
m→∞
∞
n=1
1 . n2 + m2
Tipp: (N, P(N), z¨ ahlendes Maß).
2
e−x dx. 2 2 Anleitung: Berechne das Integral R2 e−(x +y ) dx dy durch Transformation auf Polarkoordinaten und verwende den Satz von Fubini. Aufgabe IV.10.53 Berechne
R
Aufgabe IV.10.54 Sind f, g ∈ L 2 (Rd ), so ist f ∗ g via (IV.21) fast u ¨ berall definiert, und es ist nach Aufhebung der Definitionsl¨ ucken f ∗ g ∈ L ∞ (Rd ).
288
IV.
Maß- und Integrationstheorie
Aufgabe IV.10.55 Ist f ∈ L 1 (Rd ) und g ∈ L ∞ (Rd ), so ist f ∗ g via (IV.21) u ¨ berall definiert, und f ∗ g ist stetig. Aufgabe IV.10.56 Ist A ⊂ R eine Borelmenge mit λ(A) > 0, so ist A − A := {a − b: a, b ∈ A} eine Nullumgebung. (Man beachte, dass A keine inneren Punkte zu besitzen braucht; Aufgabe IV.10.18.) Tipp: Betrachte χA ∗ χ−A und verwende Aufgabe IV.10.55. Aufgabe IV.10.57 Bestimme das Volumen im R3 , das vom Paraboloid z = 4−x2 −y 2 und der xy-Ebene begrenzt wird. Fertige dazu auch eine Skizze an! Aufgabe IV.10.58 F¨ ur welche α ∈ R existiert das Integral B x −α dx u ¨ ber die Einheitskugel B = {x ∈ R3 : x ≤ 1} des R3 bzgl. der euklidischen Norm? F¨ ur welche α ∈ R existiert das Integral M x −α dx u ¨ ber die Menge M = {x ∈ R3 : x ≥ 1}?
Aufgabe IV.10.59 Berechne den Fl¨ acheninhalt des von der positiven x-Achse und dem in Polarkoordinaten durch r = 2ϕ, 0 ≤ ϕ ≤ 2π, gegebenen Kurvenst¨ uck umschlossenen Bereichs.
Aufgabe IV.10.60 Der energetisch niedrigste Zustand des Elektrons im Wasserstoffatom wird beschrieben durch das sog. 1s-Orbital 1 1 3/2 −r/a0 ϕ(x, y, z) = √ e , ϕ: R3 → R, π a0 wobei r = x2 + y 2 + z 2 und a0 = 5.291772 · 10−11 m der Bohrsche Atomradius ist. Die physikalische Bedeutung der Funktion ϕ liegt darin, dass ihr Quadrat als Wahrscheinlichkeitsdichte interpretiert werden kann: Die Wahrscheinlichkeit P , mit alt, wird gegeben der sich das Elektron im Grundzustand im Bereich A ⊂ R3 aufh¨ durch |ϕ(x, y, z)|2 d(x, y, z), P = A
wobei der Nullpunkt die Position des punktf¨ ormig gedachten Protons markiert. Berechne mittels Kugelkoordinaten die Wahrscheinlichkeit, dass sich das Elektron weiter alt! als (a) a0 , (b) 0.2 nm, (c) 0.4 nm vom Kern entfernt aufh¨
Aufgabe IV.10.61 Berechne das Volumen eines Torus. Aufgabe IV.10.62 Sei f : R → R eine Funktion, die auf ganz R gleichm¨ aßiger Grenzwert einer Folge von Polynomen ist. Was kann man daraus u ¨ ber f schließen? Aufgabe IV.10.63 Zeige folgende Aussage, die im Beweis des Brouwerschen Fixpunktsatzes benutzt wurde: Sei Bd = {x ∈ Rd : x ≤ 1}, und sei f : Bd × [0, 1] → R stetig mit f (x, 0) = 1 f¨ ur alle x ∈ Bd . Dann existiert ein τ > 0 mit f (x, t) = 0 f¨ ur alle x ∈ Bd und alle 0 ≤ t ≤ τ . Aufgabe IV.10.64 Betrachte das Einheitsquadrat Q = [0, 1] × [0, 1]. W¨ ahle einen Punkt A auf der linken senkrechten Kante, einen Punkt B auf der rechten senkrechten Kante, einen Punkt C auf der unteren waagerechten Kante und einen Punkt D auf der oberen waagerechten Kante. Sei ϕ∗ das Bild einer stetigen Kurve ϕ in Q, die A und B verbindet, und sei ψ∗ das Bild einer stetigen Kurve ψ in Q, die C und D verbindet. [D.h., es gibt eine stetige Funktion ϕ: [−1, 1] → Q mit ϕ(−1) = A, ϕ(1) = B und ur ψ∗ .] Zeige, dass ϕ∗ und ψ∗ sich schneiden. ϕ([−1, 1]) = ϕ∗ , und analog f¨
IV.11 Literaturhinweise
289
(a) Versuche einen Beweis ohne den Brouwerschen Fixpunktsatz. (b) Versuche einen Beweis mit dem Brouwerschen Fixpunktsatz, gem¨ aß folgender Idee: Betrachte auf [−1, 1] × [−1, 1] die Funktion ψ1 (t) − ϕ1 (s), ϕ2 (s) − ψ2 (t) f (s, t) = . ψ1 (t) − ϕ1 (s), ϕ2 (s) − ψ2 (t) ∞
Aufgabe IV.10.65 (Satz von Perron) agen > 0. Zeige, dass A einen strikt Sei A = (aij ) eine reelle n × n-Matrix mit Eintr¨ positiven Eigenwert mit einem strikt positiven Eigenvektor, d.h. mit Eintr¨ agen > 0, besitzt. Tipp: Betrachte f (x) = Ax/ Ax 1 auf {x = (x1 , . . . , xn ): x 1 = 1, alle xj ≥ 0}. Hier ist x 1 = j |xj | die Summennorm des Vektors x. Aufgabe IV.10.66 Berechne die Oberfl¨ ache eines Torus.
Aufgabe IV.10.67 Jede Untermannigfaltigkeit des Rn ist eine Borelmenge von Rn .
IV.11
Literaturhinweise
Eine recht knappe Einf¨ uhrung in die Maß- und Integrationstheorie ist: ◮ D. W. Stroock: A Concise Introduction to the Theory of Integration. 3. Auflage, Birkh¨ auser, 1999.
Ausf¨ uhrlichere Darstellungen sind: ◮ E. Behrends: Maß- und Integrationstheorie. Springer, 1987. ◮ D. L. Cohn: Measure Theory. Birkh¨ auser, 1980. ◮ J. Elstrodt: Maß- und Integrationstheorie. 4. Auflage, Springer, 2005.
Die folgenden B¨ ucher betonen den Zusammenhang zur Wahrscheinlichkeitstheorie: ◮ H. Bauer: Maß- und Integrationstheorie. 2. Auflage, De Gruyter, 1992. ◮ P. Billingsley: Probability and Measure. 3. Auflage, Wiley, 1995. ◮ R. Dudley: Real Analysis and Probability. 2. Auflage, Cambridge University Press, 2002.
w¨ ahrend ◮ G. B. Folland: Real Analysis. 2. Auflage, Wiley, 1999.
analytisch orientiert ist. Das volle Spektrum der Maßtheorie entfaltet sich in ◮ D. H. Fremlin: Measure Theory, Vols. 1–5. Torres Fremlin, 2000–200?. [OnlineVersion unter www.essex.ac.uk/maths/staff/fremlin/mt.htm]
von denen vier B¨ ande bereits erschienen sind.
290
IV.
Maß- und Integrationstheorie
Einen ganz anderen, eher topologisch-funktionalanalytischen Zugang, der von Bourbaki stammt, findet man bei: ◮ O. Forster: Analysis 3. Vieweg, 1981. ◮ G. Pedersen: Analysis Now. Springer, 1989.
Kapitel V
Funktionalanalysis
Die Grundidee der Funktionalanalysis ist es, Folgen oder Funktionen als Punkte in einem geeigneten Vektorraum zu interpretieren und Probleme der Analysis durch Abbildungen auf einem solchen Raum zu studieren. Zu nichttrivialen Aussagen kommt man aber erst, wenn man Vektorr¨aume mit einer Norm versieht und analytische Eigenschaften wie Stetigkeit etc. der Abbildungen untersucht. Es ist dieses Zusammenspiel von analytischen und algebraischen Ph¨anomenen, das die Funktionalanalysis auszeichnet und reizvoll macht. Die funktionalanalytische Denkweise soll an einem Beispiel, das als Leitmotiv f¨ ur dieses Kapitel dienen kann, veranschaulicht werden. Wir betrachten eine sogenannte Fredholmsche Integralgleichung zweiter Art 1 k(s, t)f (t) dt = g(s), s ∈ [0, 1]. (V.1) f (s) − 0
Hier sind g: [0, 1] → R und k: [0, 1] × [0, 1] → R gegebene stetige Funktionen, und gesucht ist eine stetige L¨ osung f . (V.1) kann als System unendlich vieler Gleichungen (f¨ ur jedes s eine) mit unendlich vielen Unbekannten aufgefasst werden, die stetig zusammenpassen“ sollen. ” Der erste Schritt ist nun, (V.1) als eine Gleichung von Funktionen zu schrei 1 urzer ben. Setzt man (T f )(s) = 0 k(s, t)f (t) dt, so lautet (V.1) k¨ f − T f = g.
(V.2)
Wenn man nun noch feststellt, dass die Transformation f → T f eine lineare Abbildung des Raums aller stetigen Funktionen C[0, 1] in sich darstellt, erh¨alt man die kompakte Schreibweise (Id − T )f = g.
(V.3)
Die Tatsache, dass T und damit Id − T linear ist, er¨offnet die M¨oglichkeit, die Sprache der linearen Algebra f¨ ur die L¨ osungstheorie der Gleichung (V.3) zu benutzen.
292
V.
Funktionalanalysis
Diese allein f¨ uhrt aber noch nicht zu nichttrivialen Resultaten. Dazu muss man die Analysis ins Spiel bringen, indem man den Raum C[0, 1] mit der Supremumsnorm f ∞ = supt |f (t)| versieht und so einen metrischen Raum erh¨alt. Die entscheidende Eigenschaft ist nun, dass der Operator T in dem Sinn kompakt ist, dass f¨ ur jede beschr¨ ankte Folge (fn ) die Bildfolge (T fn ) eine gleichm¨aßig konvergente Teilfolge besitzt. Das gestattet es, zu der Aussage zu gelangen, dass (V.3) f¨ ur jede rechte Seite g eine L¨ osung in unserem Funktionenraum besitzt, wenn die zugeh¨ orige homogene Gleichung (Id − T )f = 0 nur die triviale L¨osung f = 0 zul¨ asst. (Das ist eine H¨ alfte der Fredholmschen Alternative, vgl. Korollar V.6.11.) Das, und vieles mehr, soll in diesem Kapitel ausgef¨ uhrt werden. Außer der elementaren Theorie metrischer R¨ aume aus Abschnitt I.1 ben¨otigen wir Aussagen zur Kompaktheit aus I.5 und den Satz von Baire aus I.8, aber jeweils nur f¨ ur metrische R¨ aume. Außerdem ist f¨ ur die Diskussion der Lp -R¨aume der Abschnitt IV.7 relevant. Wir beginnen mit einem gewiss schon bekannten Begriff, n¨amlich dem einer Norm.
V.1
Normierte R¨ aume
Im folgenden betrachten wir Vektorr¨ aume u ¨ber dem K¨orper R oder C; statt R oder C wird K geschrieben, wenn die Wahl des Skalarenk¨orpers unerheblich ist. Definition V.1.1 Sei X ein K-Vektorraum. Eine Abbildung x → x von X nach [0, ∞) heißt Halbnorm, wenn (a) λx = |λ| · x f¨ ur alle λ ∈ K, x ∈ X, (b) x + y ≤ x + y f¨ ur alle x, y ∈ X. Gilt zus¨ atzlich (c) x = 0 ⇒ x = 0, heißt . eine Norm. Ein mit einer (Halb-) Norm versehener Vektorraum wird (halb-) normierter Raum genannt. Eine Anwendung von (a) mit λ = 0 zeigt sofort 0 = 0 in jedem halbnormierten Raum. Im Hinblick auf ihre geometrische Interpretation im Kontext der euklidischen Norm des R2 wird Bedingung (b) Dreiecksungleichung genannt. Beispiele. (a) In Analysisvorlesungen kommen auf dem Rn (oder Cn ) die Normen (t1 , . . . , tn )1 = (t1 , . . . , tn )2 =
n
|tk |,
k=1 n
k=1
2
|tk |
1/2
,
(t1 , . . . , tn )∞ = max{|t1 |, . . . , |tn |}
V.1
Normierte R¨ aume
293
zur Sprache. Diese sind verschieden, aber in einem technischen Sinn a¨quivalent (vgl. Definition V.1.6). (b) Ein weiteres Beispiel einer Norm ist die Supremumsnorm. Sie ist auf dem ankten Funktionen f : T → K durch Raum ℓ∞ (T ) aller beschr¨ f ∞ = sup |f (t)| t∈T
erkl¨ art. Von den drei Forderungen an eine Norm bedarf, wie in praktisch al¨ len Beispielen, nur die Dreiecksungleichung einer Uberlegung. Seien also f, g ∈ ∞ ℓ (T ) und t ∈ T . Dann ist |(f + g)(t)| = |f (t) + g(t)| ≤ |f (t)| + |g(t)| ≤ f ∞ + g∞ , ¨ was die Beschr¨ anktheit von f + g sowie nach Ubergang zum Supremum f + g∞ ≤ f ∞ + g∞ zeigt. Ist (X, . ) ein normierter Raum, so definiert d(x, y) = x − y eine Metrik auf X; ist . nur eine Halbnorm, so kann die Definitheitsbedingung einer Metrik (d(x, y) = 0 ⇔ x = y) verletzt sein, und d wird dann eine Pseudometrik genannt. Die eine (Pseudo-) Metrik definierenden Eigenschaften (vgl. Abschnitt I.1) ergeben sich unmittelbar aus den Eigenschaften von . , insbesondere impliziert die Dreiecksungleichung f¨ ur . die Dreiecksungleichung f¨ ur d. Daher stehen in jedem (halb-) normierten Raum die Begriffe der Topologie und der Theorie der metrischen R¨ aume zur Verf¨ ugung1 . Besonders wichtig ist die Vollst¨ andigkeit. Definition V.1.2 Ein vollst¨ andiger normierter Raum heißt Banachraum 2 . Als erstes Beispiel eines Banachraums wollen wir zeigen, dass (ℓ∞ (T ), . ∞ ) vollst¨ andig ist. Sei dazu (fn ) eine Cauchyfolge in ℓ∞ (T ). F¨ ur jedes t ∈ T gilt |fn (t) − fm (t)| ≤ fn − fm ∞ ,
(V.4)
also ist (fn (t)) eine Cauchyfolge reeller oder komplexer Zahlen, die daher einen Grenzwert besitzt, den wir f (t) nennen wollen. Damit ist eine Funktion f : 1 Cauchyfolgen, Vollst¨ andigkeit etc. werden in pseudometrischen R¨ aumen genauso wie in metrischen R¨ aumen erkl¨ art. 2 Der polnische Mathematiker Stefan Banach legte mit seiner 1922 erschienenen Dissertation einen der Grundsteine der Funktionalanalysis. Er selbst nennt in seiner Monographie Th´ eorie des op´ erations lin´ eaires von 1932 Banachr¨ aume R¨ aume vom Typ (B)“. ”
294
V.
Funktionalanalysis
T → K definiert, die nach Konstruktion der punktweise Limes von (fn ) ist. Wir werden argumentieren, dass f beschr¨ ankt ist, also zu ℓ∞ (T ) geh¨ort, und Grenzwert von (fn ) bzgl. der Supremumsnorm ist. Seien dazu ε > 0 gegeben und n0 = n0 (ε) ∈ N gem¨aß der Cauchy-Bedingung gew¨ ahlt, also ∀n, m ≥ n0 . fn − fm ∞ ≤ ε Insbesondere ist f¨ ur jedes t ∈ T wegen (V.4) |fn (t) − fm (t)| ≤ ε
∀n, m ≥ n0 ,
und der Grenz¨ ubergang m → ∞ liefert |fn (t) − f (t)| ≤ ε
∀n ≥ n0 .
Das zeigt einerseits |f (t)| ≤ |fn0 (t)|+ε ≤ fn0 ∞ +ε und damit die Beschr¨anktheit von f und andererseits fn − f ∞ ≤ ε f¨ ur n ≥ n0 , d.h. (fn ) konvergiert gegen f bzgl. der Supremumsnorm. Man beachte, dass die Konvergenz in der Supremumsnorm die gleichm¨aßige Konvergenz ist. Wir haben gezeigt: • Der Raum (ℓ∞ (T ), . ∞ ) ist ein Banachraum. Weitere Beispiele. (c) Ist T ein topologischer Raum, so ist der Raum C b (T ) der beschr¨ ankten stetigen Funktionen auf T ein wichtiger Untervektorraum von ℓ∞ (T ). Die Diskussion der Vollst¨ andigkeit kann jetzt mit Hilfe des folgenden Lemmas vereinfacht werden. Lemma V.1.3 Sei X ein normierter Raum und U ⊂ X. (a) Wenn U vollst¨andig ist, ist U abgeschlossen. (b) Wenn X vollst¨andig und U abgeschlossen ist, ist auch U vollst¨andig. Beweis. (a) Sei (un ) eine Folge in U mit un → x ∈ X. Da (un ) erst recht eine Cauchyfolge und U vollst¨ andig ist, besitzt (un ) einen Grenzwert u ∈ U . Wegen der Eindeutigkeit von Grenzwerten muss u = x sein, und x liegt in U . (b) Sei diesmal (un ) eine Cauchyfolge in U . Da (un ) auch eine Cauchyfolge in X und X vollst¨ andig ist, existiert x := limn→∞ un in X. Die Abgeschlossenheit von U liefert x ∈ U , und U ist vollst¨ andig. 2 Im obigen Beispiel fortfahrend k¨ onnen wir jetzt leicht die Vollst¨andigkeit unden. Dazu ist nach Lemma V.1.3 nur zu zeigen, dass von (C b (T ), . ∞ ) begr¨ C b (T ) in ℓ∞ (T ) abgeschlossen ist. Das ist jedoch eine unmittelbare Konsequenz der Tatsache, dass eine gleichm¨ aßig konvergente Folge stetiger Funktionen eine stetige Grenzfunktion hat. Dieser Satz ist f¨ ur metrische R¨aume T Gegenstand
V.1
Normierte R¨ aume
295
der Analysis-Grundvorlesung; im Fall eines topologischen Raums T zeigt man ihn mit einem a ¨hnlichen ε/3-Argument: Gelte fn − f ∞ → 0, also fn → f gleichm¨ aßig, und seien ε > 0 und t ∈ T gegeben. W¨ahle n0 = n0 (ε) ∈ N mit fn − f ∞ ≤
ε 3
∀n ≥ n0 .
Da fn0 stetig ist, existiert eine Umgebung V von t mit |fn0 (s) − fn0 (t)| ≤
ε 3
∀s ∈ V.
Dann gilt f¨ ur s ∈ V |f (s) − f (t)| ≤ |f (s) − fn0 (s)| + |fn0 (s) − fn0 (t)| + |fn0 (t) − f (t)| ε ε ε ≤ + + = ε, 3 3 3 und f ist stetig. Auf kompakten R¨ aumen ist jede stetige Funktion beschr¨ankt, also ist der Raum C(K) der stetigen Funktionen auf einem Kompaktum K in der Supremumsnorm vollst¨ andig. • Die R¨aume (C b (T ), . ∞ ) bzw. (C(K), . ∞ ), wenn K kompakt ist, sind Banachr¨aume. (d) Wir betrachten die Folgenr¨ aume ℓ∞ = {(tn ): (tn ) beschr¨ ankt}, c = {(tn ): (tn ) konvergent},
c0 = {(tn ): (tn ) konvergent gegen 0}, d = {(tn ): ∃N ∀n ≥ N tn = 0}
und versehen sie mit der Supremumsnorm (tn )∞ = sup |tn |. n
Da ℓ∞ nichts anderes als ℓ∞ (N) aus Beispiel (b) ist, ist ℓ∞ ein Banachraum. Wir werden sehen, dass c und c0 in ℓ∞ abgeschlossen und daher ebenfalls Banachr¨ aume sind, der Raum der abbrechenden“ Folgen d jedoch nicht. ” Um das zu beweisen, m¨ ussen wir Folgen von Folgen betrachten; die Verwendung von Doppelindizes ist also unvermeidlich. Sei nun (xn ) eine Folge in c, und es gelte xn − x∞ → 0 f¨ ur ein x ∈ ℓ∞ . Wir haben x ∈ c zu zeigen und verwenden dazu ein ε/3-Argument wie unter (c). Wir schreiben (n) (n) xn = t(n) m m∈N , x = (tm )m∈N , t∞ = lim tm . m→∞
296
V.
Funktionalanalysis
(n) Wegen |limm→∞ sm | ≤ (sm )∞ f¨ ur (sm ) ∈ c ist t∞ n∈N eine Cauchyfolge in (n)
K (denn (xn ) ist eine Cauchyfolge in c). Folglich existiert t∞ := limn→∞ t∞ . Um x ∈ c zu zeigen, gen¨ ugt es, limm→∞ tm = t∞ zu beweisen. Zum Beweis hierf¨ ur w¨ ahle zu ε > 0 eine nat¨ urliche Zahl N mit ε ε ) xN − x∞ ≤ , |t(N ∞ − t∞ | ≤ . 3 3
Dann bestimme m0 ∈ N mit m ≥ m0
) (N ) ⇒ |t(N m − t∞ | ≤
ε . 3
Folglich ist f¨ ur m ≥ m0 ) (N ) (N ) (N ) |tm − t∞ | ≤ |tm − t(N m | + |tm − t∞ | + |t∞ − t∞ | ε ε ≤ ε. ≤ xN − x∞ + + 3 3
Jetzt zur Abgeschlossenheit von c0 . Gelte wieder xn − x∞ → 0 f¨ ur ein x ∈ ℓ∞ . Nach dem bereits Bewiesenen ist x ∈ c, d.h., in den obigen Bezeichnungen existiert t∞ = limm→∞ tm , und es ist t∞ = 0 zu zeigen. Das ist jedoch im obigen (n) Beweis schon geschehen, denn t∞ = limn→∞ t∞ = 0, da xn ∈ c0 . Betrachten wir zum Schluss d. Dass d nicht abgeschlossen ist, kann man so sehen: Zu n ∈ N setze 1 , . . . ) = ( n1 )n∈N . xn = (1, 12 , . . . , n1 , 0, 0, . . . ), x = (1, 12 , . . . , n1 , n+1 1 Dann gilt xn ∈ d, xn − x∞ = n+1 → 0, aber x ∈ / d. Wer Aufgabe I.9.51 u ¨ber die Ein-Punkt-Kompaktifizierung lokalkompakter R¨ aume bearbeitet hat, kann auch argumentieren, dass c mit C(αN) identifiziert werden kann, was nach Beispiel (c) abgeschlossen in ℓ∞ (αN) und deshalb vollst¨ andig ist. Zusammengefasst gilt:
• Die Folgenr¨aume c0 , c und ℓ∞ sind bzgl. der Supremumsnorm Banachr¨aume, d ist kein Banachraum. (e) Der Raum C 1 [0, 1] = {f ∈ C[0, 1]: f ist stetig differenzierbar} kann mit der Supremumsnorm versehen werden. Dieser normierte Raum ist jedoch nicht vollst¨ andig, denn nach dem Weierstraßschen Approximationssatz (Satz IV.9.1) liegt C 1 [0, 1], das ja alle Polynome enth¨alt, dicht im Banachraum C[0, 1] und ist deshalb nicht abgeschlossen. Verwendet man jedoch die Norm f C 1 = f ∞ + f ′ ∞
V.1
Normierte R¨ aume
297
auf C 1 [0, 1], erh¨ alt man einen Banachraum. Ist n¨amlich (fn ) eine Cauchyfolge bzgl. dieser Norm, sind (fn ) und (fn′ ) auch Cauchyfolgen bzgl. der Supremumsnorm, also existieren f := limn fn und g := limn fn′ in C[0, 1], jeweils als gleichm¨ aßige Limiten. Ein bekannter Satz der Analysis3 u ¨ ber die Vertauschung von gleichm¨ aßiger Konvergenz und Differenzierbarkeit liefert nun, dass f differenzierbar mit Ableitung f ′ = g ist; also liegt f in C 1 [0, 1], und es gilt fn − f C 1 → 0. (f) In Abschnitt IV.7 wurden die halbnormierten R¨aume L p (µ) f¨ ur 1 ≤ p ≤ ∞ definiert und ihre Vollst¨ andigkeit gezeigt. Im Spezialfall des z¨ahlenden Maßes µ auf der Potenzmenge von N erh¨ alt man f¨ ur p < ∞ f¨ ur L p (µ) den Folgenraum ℓp =
(tn ):
∞
n=1
mit der Halbnorm (tn )p =
|tn |p < ∞
∞
n=1
p
|tn |
1/p
,
die sich hier offensichtlich als Norm erweist. Die R¨aume ℓp kann man allerdings ¨ auch ohne den Uberbau der Maßtheorie studieren; das soll im folgenden skizziert werden. Die Beweise daf¨ ur, dass die ℓp -R¨ aume f¨ ur 1 ≤ p < ∞ normierte Vektorr¨aume sind, k¨ onnen wie in Abschnitt IV.7 erbracht werden, indem man Integrale durch Summen ersetzt. Zur Veranschaulichung dieser Strategie zeigen wir die H¨oldersche Ungleichung f¨ ur Folgen, auf der die Dreiecksungleichung f¨ ur . p aufbaut, vgl. Korollar IV.7.3. F¨ ur zwei Folgen x = (sn ) und y = (tn ) setzen wir xy = (sn tn ). Satz V.1.4 (H¨ oldersche Ungleichung, Version f¨ ur Folgen) (a) F¨ ur x ∈ ℓ1 und y ∈ ℓ∞ ist xy ∈ ℓ1 , und es gilt xy1 ≤ x1 y∞ . (b) Sei 1 < p < ∞ und q = ist xy ∈ ℓ1 , und es gilt
p p−1
(also
1 p
+
1 q
= 1). F¨ ur x ∈ ℓp und y ∈ ℓq
xy1 ≤ xp yq . Man kann beide Teile gleichzeitig formulieren, indem man f¨ ur p = 1 den konjugierten Exponenten“ q = ∞ definiert; auf diese Weise erscheint die Be” zeichnung ℓ∞ f¨ ur den Raum der beschr¨ ankten Folgen nat¨ urlich. (Ein weiteres Indiz daf¨ ur: Es gilt limp→∞ xp = x∞ , siehe Aufgabe V.8.7.) 3 Z.B.
O. Forster, Analysis 1, § 21, Satz 5.
298
V.
Funktionalanalysis
Beweis. (a) ist trivial. Um (b) zu beweisen, erinnern wir wie im Beweis von Satz IV.7.2 an die gewichtete Ungleichung vom geometrischen und arithmetischen Mittel σ r τ 1−r ≤ rσ + (1 − r)τ
∀σ, τ ≥ 0, 0 < r < 1.
(V.5)
Zum Beweis der H¨ olderschen Ungleichung setzen wir zur Abk¨ urzung A = xpp , B = yqq . O.E. darf A, B > 0 angenommen werden (sonst ist nichts zu zeigen). Wir schreiben nun x = (sn ), y = (tn ) und setzen in (V.5) bei beliebigem n∈N 1 1 |sn |p |tn |q r = , also 1 − r = , σ = , τ= p q A B und erhalten 1/p 1/q |tn |q |sn |p 1 |sn |p 1 |tn |q + . ≤ A B p A q B Summieren u ¨ ber n liefert 1 |tn |q 1 1 1 |sn |p |sn tn | + = + = 1. ≤ p A q B p q A1/p B 1/q Folglich gilt xy1 =
|sn tn | ≤ A1/p B 1/q = xp yq .
2
Wie in Korollar IV.7.3 ergibt sich dann f¨ ur p > 1 die Minkowskische Ungleichung ∀x, y ∈ ℓp , x + yp ≤ xp + yp
also die Dreiecksungleichung f¨ ur . p , die f¨ ur p = 1 im u ¨ brigen trivial ist. Zum Beweis der Vollst¨ andigkeit von ℓp sei (xn ) eine Cauchyfolge in ℓp . Wir (n) schreiben xn = tm m∈N . Da f¨ ur alle x = (tm ) ∈ ℓp und alle m ∈ N die Un (n) gleichung |tm | ≤ xp gilt, sind bei beliebigem m die tm n∈N skalare Cauchy(n)
folgen. Sei tm = limn→∞ tm und x = (tm )m∈N . Es ist nun noch x ∈ ℓp und xn − xp → 0 nachzuweisen. Zu ε > 0 w¨ ahle N = N (ε) mit xn − xn′ p ≤ ε
∀n, n′ ≥ N.
Insbesondere folgt f¨ ur alle M ∈ N M
(n) t − t(n′ ) p
m=1
m
m
1/p
≤ xn − xn′ p ≤ ε
∀n, n′ ≥ N.
Mache nun den Grenz¨ ubergang n′ → ∞, um f¨ ur alle M ∈ N, n ≥ N M
(n) tm − tm p
m=1
1/p
≤ε
V.1
Normierte R¨ aume
299
zu erhalten. Da M beliebig war, impliziert das ∞
(n) tm − tm p
m=1
1/p
≤ε
∀n ≥ N,
und daraus folgt zun¨ achst x − xN ∈ ℓp und deshalb x = (x − xN ) + xN ∈ ℓp sowie xn − xp → 0. Zusammengefasst gilt: ur 1 ≤ p < ∞ ein Banachraum. • (ℓp , . p ) ist f¨ Man kann nat¨ urlich die ℓp -Normen auch auf dem endlichdimensionalen Raum K einf¨ uhren; so normiert, wird Kn mit ℓp (n) bezeichnet. ur (g) Im Fall eines beliebigen Maßes ist die L p -Halbnorm keine Norm; f¨ das Lebesguemaß auf R gilt zum Beispiel χ{0} p = 0, obwohl χ{0} nicht die Nullfunktion ist. Man assoziiert zum halbnormierten Raum L p (µ) nun einen normierten Raum Lp (µ) auf folgende Weise. Sei N der Kern der L p -Halbnorm, also n
N = {f ∈ L p (µ): f L p = 0}. Nach Lemma IV.6.4 besteht N genau aus allen messbaren Funktionen, die fast u ¨ berall verschwinden. Auf dem Quotientenvektorraum Lp (µ) = L p (µ)/N , der ¨ aus den Aquivalenzklassen [f ] = f + N , f ∈ L p (µ), besteht, ist dann die Abbildung [f ] → [f ]Lp := f L p wohldefiniert, wie man sofort best¨ atigt, und die Halbnormeigenschaften u ¨ bertragen sich von . L p auf . Lp . Letzteres ist aber nach Konstruktion sogar eine Norm, denn [f ]Lp = 0 bedeutet f ∈ N und deshalb [f ] = [0]. Schließlich u agt sich auch die Vollst¨ andigkeit von L p (µ) auf Lp (µ), denn ([fn ]) ist ¨ bertr¨ ¨ eine Cauchyfolge (bzw. konvergente Folge) von Aquivalenzklassen genau dann, wenn es die Folge der Repr¨ asentanten ist. ¨ Die obigen Uberlegungen treffen genauso im Fall p = ∞ zu. Daher: • F¨ ur 1 ≤ p ≤ ∞ ist Lp (µ), versehen mit der Norm . Lp , ein Banachraum. F¨ ur eine messbare Teilmenge S ⊂ Rd schreibt man wieder Lp (S), wenn ur p < ∞ auch mit . p das Lebesguemaß gemeint ist. Die Lp -Norm wird f¨ bezeichnet. Im praktischen Umgang mit Lp -R¨ aumen hat es sich eingeb¨ urgert, nicht pe¨ dantisch zwischen Funktionen und ihren Aquivalenzklassen zu unterscheiden. Man schreibt also f ∈ Lp statt [f ] ∈ Lp usw. In der Regel treten dadurch keine Komplikationen auf. Beispielsweise ist f → R f dλ eine wohldefinierte Abbildung auf L1 (R), nicht jedoch f → f (t0 ). Ferner brauchen die Repr¨asentanten
300
V.
Funktionalanalysis
√ der f ∈ Lp nur fast u ¨berall definiert zu sein; in diesem Sinn ist etwa t → 1/ t in L1 [0, 1]. Es folgen einige einfache Eigenschaften einer Norm. Wir beginnen mit einem einfachen Satz, der besagt, dass Addition, Skalarmultiplikation und . stetige Abbildungen auf normierten R¨ aumen sind. Satz V.1.5 (a) Aus (b) Aus (c) Aus
Sei X ein normierter Raum. xn → x und yn → y folgt xn + yn → x + y. λn → λ in K und xn → x folgt λn xn → λx. xn → x folgt xn → x.
Beweis. W¨ ortlich wie im Endlichdimensionalen, also: (a) Klar wegen (xn + yn ) − (x + y) ≤ xn − x + yn − y → 0. (b) Klar wegen λn xn − λx ≤ λn xn − λn x + λn x − λx
= |λn | xn − x + |λn − λ| x → 0.
(c) Zuerst u ¨ berlegen wir, dass die umgekehrte Dreiecksungleichung gilt: x − y ≤ x − y ∀x, y ∈ X;
diese folgt aus der Ungleichung x − y ≤ x − y + y − y = x − y und der dazu symmetrischen Ungleichung y − x ≤ y − x. Die umgekehrte Dreiecksungleichung impliziert sofort xn − x ≤ xn − x → 0. 2 ist eine konvergente Folge (xn ) beschr¨ankt, d.h., die Folge Insbesondere xn der Normen ist beschr¨ ankt. Sehr viele Banachr¨ aume sind mit einer kanonischen Norm ausgestattet; mit Ausnahme von C 1 [0, 1] war das in allen obigen Beispielen der Fall. Auf C 1 [0, 1] k¨ onnte man außer der Norm f C 1 = f ∞ + f ′ ∞ genausogut die Variante |||f |||C 1 = max{f ∞ , f ′ ∞ } betrachten. Diese beiden Normen sind in folgendem Sinn ¨ aquivalent. Definition V.1.6 Zwei Normen . und ||| . ||| auf einem Vektorraum X heißen ¨aquivalent, wenn es Konstanten 0 < m ≤ M mit mx ≤ |||x||| ≤ M x gibt.
∀x ∈ X
V.1
Normierte R¨ aume
301
Zum Beispiel gilt f¨ ur f ∈ C 1 [0, 1]
1 f C 1 ≤ |||f |||C 1 ≤ f C 1 . 2 Satz V.1.7 Seien . und ||| . ||| zwei Normen auf X. Dann sind folgende Aussagen ¨aquivalent: (i) . und ||| . ||| sind ¨aquivalent. (ii) Eine Folge ist bzgl. . konvergent genau dann, wenn sie es bzgl. ||| . ||| ist; außerdem stimmen die Limiten ¨ uberein. (iii) Eine Folge ist . -Nullfolge genau dann, wenn sie eine ||| . |||-Nullfolge ist. Beweis. Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind klar. (iii) ⇒ (i): Nehmen wir etwa an, dass f¨ ur kein M > 0 die Ungleichung |||x||| ≤ M x f¨ ur alle x ∈ X gilt. F¨ ur jedes n ∈ N gibt es dann xn ∈ X mit |||xn ||| > nxn . Setze yn = xn /(nxn ); dann ist yn = n1 → 0, also (yn ) eine . -Nullfolge, aber |||yn ||| > 1 f¨ ur alle n, folglich (yn ) keine ||| . |||-Nullfolge, was (iii) widerspricht. Die Existenz von m zeigt man entsprechend. 2 ¨ Aquivalente Normen erzeugen also vom topologischen Standpunkt denselben metrischen Raum. Es folgt außerdem aus der Definition, dass dann (X, . ) und (X, ||| . |||) dieselben Cauchyfolgen besitzen. Daher sind die R¨aume (X, . ) und (X, ||| . |||) entweder beide vollst¨ andig oder beide unvollst¨andig. Versieht man jedoch eine Menge T mit zwei Metriken derart, dass (T, d1 ) dieselben konvergenten Folgen wie (T, d2 ) besitzt, so brauchen diese Metriken nicht dieselben Cauchyfolgen zu besitzen. Ein Beispiel ist R mit den Metriken d1 (s, t) = |s − t|, d2 (s, t) = |arctan s − arctan t|; hier ist die Folge (n) der nat¨ urlichen Zahlen eine d2 -Cauchyfolge, und (R, d2 ) ist nicht vollst¨andig. Dieses Gegenbeispiel wird dadurch erm¨ oglicht, dass die identische Abbildung von (T, d2 ) nach (T, d1 ) zwar stetig ist, aber nicht gleichm¨aßig stetig. Einleitend wurden drei Standardnormen des Rn genannt: die Summennorm, die euklidische Norm und die Maximumsnorm. Diese sind paarweise ¨aquivalent, denn x∞ ≤ x2 ≤ x1 ≤ nx∞ . Wie der n¨achste Satz zeigt, gilt jedoch viel mehr. Satz V.1.8 Auf einem endlichdimensionalen Raum sind je zwei Normen ¨aquivalent. Beweis. Gelte etwa dim X = n. Sei {e1 , . . . , en } eine Basis von X und n . eine Norm auf X. Wir werden zeigen, dass . zur euklidischen Norm i=1 αi ei 2 n 2 1/2 = aquivalent ist. ¨ i=1 |αi | Setze K = max{e1 , . . . , en } > 0. Dann folgt aus der Dreiecksungleichung f¨ ur . und der H¨ olderschen Ungleichung 1/2 1/2 n n n n 2 2 αi ei ≤ ei , |αi | |αi | ei ≤ i=1
i=1
i=1
i=1
302
V.
so dass
√ x ≤ K nx2
Funktionalanalysis
∀x ∈ X.
Damit ist . bzgl. . 2 stetig, da aus xk − x2 → 0
√ xk − x ≤ xk − x ≤ K nxk − x2 → 0
folgt. Ferner ist S := {x: x2 = 1} in (X, . 2 ) abgeschlossen, denn S ist {1} der abgeschlossenen Menge {1} unter der abgeschlossenes Urbild . −1 2 stetigen Abbildung . 2 (vgl. Lemma V.1.5(c)), und S ist beschr¨ankt bzgl. . 2 , also kompakt nach dem Satz von Heine-Borel. (Beachte, dass . 2 die u ¨ bliche Topologie auf dem endlichdimensionalen Raum X erzeugt.) Die stetige Funktion . nimmt daher auf S ihr Minimum m ≥ 0 an, und da . eine Norm und nicht nur eine Halbnorm ist, muss m > 0 gelten. Also folgt mx2 ≤ x
∀x ∈ X,
denn x/x2 ∈ S f¨ ur x = 0. aquivalent, und das zeigt die Behauptung des Damit ist jede Norm zu . 2 ¨ Satzes. 2 Speziell erh¨ alt man aus Satz V.1.8, dass in jedem endlichdimensionalen normierten Raum abgeschlossene und beschr¨ ankte Mengen kompakt sind, dass alle endlichdimensionalen R¨ aume vollst¨ andig sind und deshalb (Lemma V.1.3) endlichdimensionale Unterr¨ aume von normierten R¨aumen abgeschlossen sind. Als n¨ achstes zeigen wir, dass die erstgenannte Eigenschaft endlichdimensionale R¨ aume charakterisiert. Dazu benutzen wir das folgende Lemma, das von unabh¨ angigem Interesse ist. Lemma V.1.9 (Rieszsches Lemma) Sei U ein abgeschlossener Unterraum des normierten Raums X, und sei U = X. Ferner sei 0 < δ < 1. Dann existiert xδ ∈ X mit xδ = 1 und xδ − u ≥ 1 − δ
∀u ∈ U.
Beweis. Sei x ∈ X \U . Da U abgeschlossen ist, gilt d := inf{x−u: u ∈ U } > 0, denn andernfalls g¨ abe es eine Folge (un ) in U mit un − x → 0, und x l¨age in d d , und es existiert uδ ∈ U mit x − uδ < 1−δ . Setze U = U . Deshalb ist d < 1−δ xδ := so dass xδ = 1.
x − uδ , x − uδ
V.1
Normierte R¨ aume
303
Sei nun u ∈ U beliebig. Dann ist x uδ − −u x − uδ x − uδ 1 = x − (uδ + x − uδ u) x − uδ d (denn uδ + x − uδ u ∈ U ) ≥ x − uδ > 1−δ
xδ − u =
nach Wahl von uδ .
2
Satz V.1.10 F¨ ur einen normierten Raum X sind ¨aquivalent: (i) dim X < ∞. (ii) Die abgeschlossene Einheitskugel BX := {x ∈ X: x ≤ 1} ist kompakt. (iii) Jede beschr¨ankte Folge in X besitzt eine konvergente Teilfolge. Beweis. (i) ⇒ (ii): Das haben wir bereits im Anschluss an Satz V.1.8 bemerkt. (ii) ⇒ (iii): In einem kompakten metrischen Raum besitzt jede Folge eine konvergente Teilfolge, vgl. Satz I.5.4. (iii) ⇒ (i): Wir nehmen dim X = ∞ an. Sei x1 ∈ X mit x1 = 1 beliebig. Setze U1 = lin{x1 }; dann ist U1 endlichdimensional, folglich abgeschlossen und von X verschieden. Nach dem Rieszschen Lemma (Lemma V.1.9), angewandt mit δ = 12 , existiert x2 ∈ X mit x2 = 1 und x2 − x1 ≥ 21 . Nun betrachte U2 = lin{x1 , x2 } und wende das Rieszsche Lemma erneut an, um x3 mit x3 = 1, x3 −x1 ≥ 21 , x3 −x2 ≥ 12 zu erhalten. Dann betrachte U3 = lin{x1 , x2 , x3 }, etc. Auf diese Weise wird induktiv eine Folge (xn ) mit xn = 1 und xn −xm ≥ 1 ur alle m, n ∈ N, m = n definiert. Die Folge (xn ) ist beschr¨ankt, hat aber 2 f¨ keine Cauchy-, erst recht keine konvergente Teilfolge. 2 In Definition I.2.8 wurde ein topologischer Raum als separabel definiert, wenn es eine abz¨ ahlbare dichte Teilmenge gibt. Zur Entscheidung der Separabilit¨ at normierter R¨ aume ist das folgende Kriterium n¨ utzlich. Lemma V.1.11 F¨ ur einen normierten Raum X sind ¨aquivalent: (i) X ist separabel. (ii) Es gibt eine abz¨ahlbare Menge A mit X = lin A := lin A. Beweis. (i) ⇒ (ii) ist klar, denn X = A impliziert X = lin A. (ii) ⇒ (i): Wir betrachten zuerst den Fall K = R. Setze n λi xi : n ∈ N, λi ∈ Q, xi ∈ A . B= i=1
Dann ist B abz¨ ahlbar, und wir werden B = X, genauer
304
V.
• ∀x ∈ X ∀ε > 0 ∃y ∈ B
Funktionalanalysis
x − y < ε
n zeigen. Zun¨ achst w¨ ahle y0 ∈ lin A, also y0 = i=1 λi xi mit i ∈ R, xi ∈ A, so λ ≤ ε/2. W¨ ahle dann λ′i ∈ Q mit |λi − λ′i | ≤ ε/ 2 ni=1 xi . Dann dass x − y0 n gilt f¨ ur y = i=1 λ′i xi ∈ B x − y ≤ x − y0 + y0 − y ≤ ε/2 + max |λi − λ′i | i
Im Fall K = C verwende Q + iQ statt Q.
n i=1
xi ≤ ε. 2
Beispiele. (a) ℓp ist separabel f¨ ur 1 ≤ p < ∞. Sei n¨amlich en der n-te Einheitsvektor en = (0, . . . , 0, 1, 0, . . . ) (1 an der n-ten Stelle) urlich bzgl. und A = {en : n ∈ N}. Dann ist ℓp = lin A = d, wo der Abschluß nat¨ . p zu bilden ist. F¨ ur x = (tn )n ∈ ℓp gilt n¨ amlich x−
n i=1
ti e i
= p
∞
i=n+1
p
|ti |
1/p
→ 0.
(b) Genauso zeigt man die Separabilit¨ at von c0 . (c) Hingegen ist ℓ∞ nicht separabel. (Man mache sich klar, dass die Methode aus (a) f¨ ur p = ∞ nicht funktioniert!) F¨ ur M ⊂ N betrachte n¨amlich die Folge ur n ∈ M und χM (n) = 0 sonst. Dann ist ∆ := {χM : χM ∈ ℓ∞ , wo χM (n) = 1 f¨ ur M = M ′ . Ist nun M ⊂ N} u ahlbar, und es gilt χM − χM ′ ∞ = 1 f¨ ¨ berabz¨ ∞ A irgendeine abz¨ ahlbare Teilmenge von ℓ , so kann f¨ ur jedes x ∈ A die Menge {y ∈ ℓ∞ : x − y∞ ≤ 41 } wegen der Dreiecksungleichung h¨ochstens ein y ∈ ∆ enthalten, so dass A nicht dicht liegen kann. Ein ¨ ahnliches Argument zeigt die Inseparabilit¨at von L∞ [0, 1] und allgemei∞ ner L (S), wenn S ⊂ Rd positives Lebesguemaß hat. (d) Nach dem Weierstraßschen Approximationssatz IV.9.1 liegen die Polynome, das ist die lineare H¨ ulle der Monome t → tn , n ≥ 0, dicht in C[0, 1] bzgl. der Supremumsnorm; also ist C[0, 1] separabel. (e) Sei m1 ≤ p < ∞. Nach Korollar IV.7.8 liegen die Treppenfunktionen der Gestalt k=1 ak χIk dicht in Lp (Rd ), wobei die Ik d-dimensionale Intervalle sind. Indem man jedes Stufenintervall I durch ein Intervall J mit Eckpunkten in Qd ulle ersetzt, so dass χI − χJ p sehr klein“ ist, sieht man, dass die lineare H¨ ” solcher Intervalle, wovon es nur abz¨ ahlbar viele gibt, ebenfalls dicht in Lp (Rd ) liegt. Also ist Lp (Rd ) separabel. Da f¨ ur jede messbare Teilmenge S ⊂ Rd der Raum Lp (S) in kanonischer Weise, n¨ amlich mittels Fortsetzung aller f ∈ Lp (S) auf Rd \ S durch 0, als Unterraum von Lp (Rd ) aufgefasst werden kann und Teilr¨aume separabler metrischer R¨ aume separabel sind (Aufgabe I.9.9), ist auch Lp (S) separabel.
V.2 Lineare Operatoren
V.2
305
Lineare Operatoren
In diesem Abschnitt beginnen wir die Untersuchung linearer Abbildungen zwischen normierten R¨ aumen. Die folgende Sprechweise ist u ¨ blich. Definition V.2.1 Eine stetige lineare Abbildung zwischen normierten R¨aumen heißt stetiger Operator. Ist der Bildraum der Skalarenk¨orper, sagt man Funktional statt Operator. Ein stetiger Operator T : X → Y erf¨ ullt also eine der ¨aquivalenten Bedingungen: (i) Falls limn→∞ xn = x, so gilt limn→∞ T xn = T x. (ii) F¨ ur alle x0 ∈ X und alle ε > 0 existiert δ > 0 mit x − x0 ≤ δ
−1
⇒ T x − T x0 ≤ ε.
(iii) F¨ ur alle offenen O ⊂ Y ist T (O) = {x ∈ X: T x ∈ O} offen in X. Wir haben hier, einer verbreiteten Konvention folgend, T x statt T (x) geschrieben. Außerdem h¨ atte man nach der reinen Lehre die Normen von X und Y durch unterschiedliche Symbole, etwa . X und . Y , bezeichnen m¨ ussen. Da eine Verwechslungsgefahr praktisch ausgeschlossen ist, wird die Norm eines gegebenen normierten Raums, wenn nichts anderes vereinbart ist, stets mit dem Symbol . belegt. Die folgende Charakterisierung stetiger Operatoren ist zwar elementar zu beweisen, aber von gr¨ oßter Bedeutung. Satz V.2.2 Seien X und Y normierte R¨aume, und sei T : X → Y linear. Dann sind folgende Aussagen ¨aquivalent: (i) T ist stetig. (ii) T ist stetig bei 0. (iii) Es existiert M ≥ 0 mit T x ≤ M x
∀x ∈ X.
(iv) T ist gleichm¨aßig stetig. Beweis. (iii) ⇒ (iv) ⇒ (i) ⇒ (ii) ist trivial; in der Tat folgt aus (iii) die Lipschitzstetigkeit von T , denn T x − T x0 = T (x − x0 ) ≤ M x − x0 . (ii) ⇒ (iii) (vgl. den Beweis von Satz V.1.7): W¨are (iii) falsch, so existierte zu jedem n ∈ N ein xn ∈ X mit T xn > nxn . Setze yn = xn /(nxn ) (warum ist xn =
0?), dann ist yn = n1 , aber T yn =
T xn > 1. nxn
Mit anderen Worten: (yn ) ist eine Nullfolge, ohne dass (T yn ) gegen T (0) = 0 konvergiert, was (ii) widerspricht. 2
306
V.
Funktionalanalysis
Definition V.2.3 Die kleinste in (iii) von Satz V.2.2 auftauchende Konstante wird mit T bezeichnet, d.h. T := inf{M ≥ 0: T x ≤ M x ∀x ∈ X}. Zur Rechtfertigung dieser Bezeichnung siehe den folgenden Satz. Es gilt offensichtlich: T x = sup T x = sup T x T = sup x =0 x x =1 x ≤1 sowie die fundamentale Ungleichung T x ≤ T x
∀x ∈ X.
(V.6)
x Um etwa die erste Gleichung einzusehen, setze M0 = supx =0 T x , so dass sofort T x ≤ M0 x f¨ ur alle x ∈ X folgt; daher gilt T ≤ M0 . W¨ahlt man andererseits zu ε > 0 ein xε = 0 mit T xε ≥ M0 (1 − ε)xε , so ergibt sich T ≥ M0 (1 − ε). Zusammen folgt T = M0 und daraus (V.6). Da stetige Operatoren nach Satz V.2.2 die Einheitskugel
BX := {x ∈ X: x ≤ 1} auf eine beschr¨ ankte Menge abbilden, spricht man auch von beschr¨ankten Operatoren. Wir betrachten nun L(X, Y ) := {T : X → Y : T ist linear und stetig}. Da Summen und skalare Vielfache von Nullfolgen wieder Nullfolgen sind, ist L(X, Y ) bez¨ uglich der algebraischen Operationen (S + T )(x) = Sx + T x (λT )(x) = λ T x ein Vektorraum. (Stets liegt der Nulloperator x → 0 in L(X, Y ), also ist L(X, Y )
= ∅.) Wir setzen noch L(X) = L(X, X) und X ′ = L(X, K); X ′ heißt der Dualraum von X. Satz V.2.4 (a) T = sup x ≤1 T x definiert eine Norm auf L(X, Y ), die sog. Operatornorm. (b) Falls Y vollst¨andig ist, ist – unabh¨angig von der Vollst¨andigkeit von X – der Operatorraum L(X, Y ) vollst¨andig. Insbesondere ist der Dualraum eines normierten Raums stets vollst¨andig.
V.2
Lineare Operatoren
307
Beweis. (a) Scharfes Hinsehen liefert λT = |λ| T und T = 0 ⇒ T = 0. Nun zur Dreiecksungleichung. Sei x ≤ 1. Dann gilt (S + T )x = Sx + T x ≤ Sx + T x ≤ S + T . ¨ Der Ubergang zum Supremum zeigt S + T ≤ S + T . (b) Sei (Tn ) eine Cauchyfolge in L(X, Y ). F¨ ur alle x ∈ X ist dann (Tn x) eine Cauchyfolge im Banachraum Y . Wir bezeichnen ihren Limes mit T x. Die so definierte Abbildung T : X → Y ist linear, denn T (λx1 + µx2 ) = lim Tn (λx1 + µx2 ) = n→∞
lim (λTn x1 + µTn x2 )
n→∞
= λ lim Tn x1 + µ lim Tn x2 = λT x1 + µT x2 . n→∞
n→∞
Wir zeigen jetzt T ∈ L(X, Y ) (also T < ∞) und Tn − T → 0. Zu ε > 0 w¨ahle n0 ∈ N mit Tn − Tm ≤ ε ∀n, m ≥ n0 .
Sei x ∈ X, x ≤ 1. W¨ ahle m0 = m0 (ε, x) ≥ n0 mit Tm0 x − T x ≤ ε. Es folgt f¨ ur alle n ≥ n0 , dass Tn − T ≤ 2ε, denn
Tn x − T x ≤ Tn x − Tm0 x + Tm0 x − T x ≤ Tn − Tm0 + ε ≤ 2ε.
Daher gilt T < ∞ und Tn − T → 0.
2
Bevor einige Beispiele besprochen werden, bemerken wir noch ein einfaches Lemma. Lemma V.2.5 F¨ ur S ∈ L(X, Y ) und T ∈ L(Y, Z) gilt T S ∈ L(X, Z) mit T S ≤ T S. Beweis. Die Linearit¨ at von T S ist klar, und die Stetigkeit folgt sofort aus Satz V.2.2: T (Sx) ≤ T Sx ≤ T S x also T S ≤ T S.
∀x ∈ X, 2
Einfache Beispiele zeigen, dass im allgemeinen T S < T S gilt (etwa S: (s, t) → (s, 0) und T : (s, t) → (0, t) auf R2 ). Beispiele. Es ist in allen folgenden Beispielen trivial oder elementar, die Linearit¨ at der untersuchten Abbildung zu zeigen; Linearit¨at wird daher stillschweigend als erwiesen angenommen.
308
V.
Funktionalanalysis
(a) Ist X endlichdimensional und Y ein beliebiger normierter Raum, so ist jede lineare Abbildung T : X → Y stetig. Zum Beweis mache zun¨achst die wichtige Bemerkung, dass die Stetigkeit von T erhalten bleibt, wenn man zu einer ¨ aquivalenten Norm auf X oder Y u ¨ bergeht; die Gr¨oße der Zahl T h¨angt hingegen sehr wohl von der konkreten Wahl der Nach Satz V.1.8 Normen ab. d¨ urfen wir annehmen, dass X mit der Norm ni=1 αi ei = ni=1 |αi | versehen ist, wo {e1 , . . . , en } irgendeine Basis von X ist. Es folgt T
n i=1
αi ei
n
= ≤
αi T ei
i=1 n i=1
|αi | T ei
≤ max T ei i=1,...,n
n
αi ei .
i=1
(b) Sind . und ||| . ||| zwei Normen auf dem Vektorraum X, so sind . und ||| . ||| genau dann a ¨quivalent, wenn Id: X, . → X, ||| . |||
und
Id: X, ||| . ||| → X, .
stetig sind (vgl. Satz V.1.7). Gilt nur die obere Stetigkeit, also |||x||| ≤ M x, so nennt man . feiner und ||| . ||| gr¨ober. (c) Setze T : C[0, 1] → K, T f = f (0). Dann ist T stetig mit T = 1. (Dabei wird auf C[0, 1] die Supremumsnorm betrachtet.) Um das einzusehen, u ¨ berlege zun¨achst, dass |T f | = |f (0)| ≤ sup |f (t)| = f ∞ t∈[0,1]
∀f ∈ C[0, 1]
und daher T ≤ 1 gilt. Andererseits betrachte die konstante Funktion 1, f¨ ur die 1∞ = 1 = T 1 ist; es folgt T = 1. 1 (d) Es ist einfach zu sehen, dass T : C[0, 1] → K, T f = 0 f (t) dt, stetig ist mit T = 1. Allgemeiner betrachte zu g ∈ C[0, 1] das Funktional Tg : C[0, 1] → K mit 1
f (t)g(t) dt.
Tg (f ) =
0
Dann gilt Tg =
1
|g(t)| dt. In der Tat ergibt sich ≤“ aus ” 1 1 1 |Tg (f )| = f (t)g(t) dt ≤ |g(t)| dt f ∞ . |f (t)| |g(t)| dt ≤ 0
0
0
0
V.2
Lineare Operatoren
309
Umgekehrt setze zu ε > 0 g(t) . |g(t)| + ε
fε (t) =
Dann gilt fε ∈ C[0, 1], fε ∞ ≤ 1 sowie |Tg (fε )| =
1
0
|g(t)|2 dt ≥ |g(t)| + ε
1
|g(t)|2 − ε2 dt = |g(t)| + ε
0
0
1
|g(t)| dt − ε,
daher erhalten wir Tg =
sup |Tg (f )| ≥ sup |Tg (fε )| ≥ ε>0
f ∞ ≤1
0
1
|g(t)| dt.
ur x = (tn ). Man sieht leicht, dass (e) Betrachte T : c →K, T x = limn→∞ tn f¨ T = 1. Da c0 = T −1 {0} gilt, liefert die Stetigkeit von T einen eleganten Beweis f¨ ur die Abgeschlossenheit von c0 in c, denn die einpunktige Menge {0} ist abgeschlossen. (f) Eine bedeutende Klasse linearer Abbildungen der Analysis besteht aus den Differentialoperatoren und den Integraloperatoren. Zun¨achst zu den Differentialoperatoren. Wir betrachten den Ableitungsoperator D: C 1 [0, 1] → C[0, 1], der wohldefiniert und linear ist. Wir betrachten die Supremumsnorm auf C[0, 1] und ur fn (t) = tn gilt fn ∞ = 1, aber C 1 [0, 1]. Dann ist D nicht stetig; denn f¨ n−1 Dfn ∞ = supt nt = n. Versehen wir C 1 [0, 1] jedoch mit der Norm f C 1 = f ∞ + f ′ ∞ , so ist D wegen Df ∞ = f ′ ∞ ≤ f C 1 stetig. (g) Es sei k: [0, 1] × [0, 1] → K stetig und f ∈ C[0, 1]. Betrachte die durch (Tk f )(s) :=
1
k(s, t)f (t) dt
0
definierte Funktion. Aus der gleichm¨ aßigen Stetigkeit von k folgt die Stetigkeit ahle n¨ amlich zu ε > 0 eine positive Zahl δ = δ(ε) mit von Tk f . W¨ (s, t) − (s′ , t′ ) ≤ δ
⇒ |k(s, t) − k(s′ , t′ )| ≤ ε,
ur |s − s′ | ≤ δ wo . die euklidische Norm auf R2 ist. Dann gilt f¨ ′
|(Tk f )(s) − (Tk f )(s )| ≤
≤ ε
1
0
0
|k(s, t) − k(s′ , t)| |f (t)| dt 1
|f (t)| dt ≤ εf ∞ .
(V.7)
310
V.
Funktionalanalysis
Tk definiert also eine lineare Abbildung von C[0, 1] in sich. Diese Abbildung ist bzgl. der Supremumsnorm stetig, denn Tk =
sup Tk f ∞
f ∞ ≤1
=
sup |(Tk f )(s)|
sup
f ∞ ≤1 s∈[0,1]
= sup
sup
s∈[0,1] f ∞ ≤1
= sup s∈[0,1]
1
0
1
k(s, t)f (t) dt
|k(s, t)| dt
0
nach Beispiel (d) mit g(t) = k(s, t), s fest. Wir erhalten daher eine explizite Formel f¨ ur die Norm von Tk : 1 Tk = sup |k(s, t)| dt ≤ k∞ (V.8) s∈[0,1]
0
Der Operator Tk heißt Fredholmscher Integraloperator und k sein Kern. (h) Integraloperatoren k¨ onnen auf diversen Funktionenr¨aumen definiert werden; z.B. zeigt das Argument unter (g), dass ein Fredholmscher Integraloperator mit stetigem Kern auch von L1 [0, 1] nach C[0, 1] und von Lp [0, 1] in sich wohldefiniert und stetig ist. Besonders wichtig ist die L2 -Theorie. Seien k ∈ L2 ([0, 1]2 ) und f ∈ L2 ([0, 1]). (Genau genommen sind in den folgenden Bemerkungen f und k beliebige Repr¨asentanten der entsprechen¨ den Aquivalenzklassen.) Aus dem Satz von Fubini (Theorem IV.8.8) folgt, dass u r fast alle s, und nach der H¨olderschen Ungleichung exik(s, . ) ∈ L2 ([0, 1]) f¨ stieren die Integrale k(s, t)f (t) dt f¨ ur fast alle s. Man erh¨alt so eine messbare Funktion 1
k(s, t)f (t) dt,
(Tk f )(s) :=
0
die zun¨ achst nur fast u ¨ berall definiert ist und auf der fehlenden Nullmenge = 0 gesetzt wird. Wir werden zeigen, dass Tk ein stetiger Operator von L2 ([0, 1]) in sich ist. Es gilt n¨ amlich nach der H¨ olderschen Ungleichung (mit p = q = 2) und dem Satz von Fubini 2 1 1 2 Tk f L2 = k(s, t)f (t) dt ds 0
≤
≤ =
0
1
0
1
1 0
1
|k(s, t)| |f (t)| dt
0
0
0
1
0
1
2
|k(s, t)| dt
2
1
0
|k(s, t)|2 ds dt f 2L2 ,
ds
2
|f (t)| dt ds
V.2
Lineare Operatoren
311
also Tk ≤ kL2 ([0,1]2 ) . (Im allgemeinen gilt keine Gleichheit in dieser Absch¨atzung.) Analog definiert ein Kern k ∈ L2 (µ ⊗ ν) einen stetigen Integraloperator Tk : 2 L (ν) → L2 (µ). In diesen Beispielen waren alle auf Banachr¨aumen definierten Operatoren stetig. Es folgen zwei der Haupts¨ atze der Funktionalanalysis, die unter anderem erkl¨ aren, warum es praktisch unm¨ oglich ist, unstetige lineare Operatoren auf vollst¨ andigen R¨ aumen explizit, d.h. durch eine Formel, zu definieren. Die Beweise beruhen auf dem Baireschen Kategoriensatz (siehe Abschnitt I.8, insbesondere Korollar I.8.6), dessen Aussage in unserem Kontext so wiedergegeben werden kann. • Ist X ein Banachraum und sind A1 , A2 , . . . abgeschlossene Teilmengen mit ∞ n=1 An = X, so besitzt eine dieser Mengen einen inneren Punkt.
Unter zus¨ atzlichen geometrischen Voraussetzungen kann man mehr aussagen: Lemma V.2.6 Ist X ein Banachraum und sind A1 , A2 , . . . abgeschlossene, konvexe und symmetrische (d.h. −x ∈ An , falls x ∈ An ) Teilmengen mit ∞ n=1 An = X, so ist eine dieser Mengen eine Nullumgebung.
ur ein ε > 0 die Beweis. Ist n¨ amlich x ein innerer Punkt von AN , so dass f¨ Kugel B(x, ε) := {y: y − x ≤ ε} in AN liegt, so ist wegen der Symmetrie auch B(−x, ε) ⊂ AN und wegen der Konvexit¨at B(0, ε) ⊂ AN ; um letzteres einzusehen, schreibe man y ∈ B(0, ε) als Konvexkombination y = 21 (y + x) + 1 2 2 (y − x) mit y ± x ∈ B(±x, ε) ⊂ AN . Der folgende wichtige Satz wird manchmal auch Satz von Banach-Steinhaus genannt. Theorem V.2.7 (Prinzip der gleichm¨ aßigen Beschr¨anktheit) Seien X ein Banachraum, Y ein normierter Raum, I eine Indexmenge und ur i ∈ I. Falls die Familie der Ti punktweise beschr¨ankt ist in Ti ∈ L(X, Y ) f¨ dem Sinn, dass ∀x ∈ X sup Ti x < ∞ i∈I
gilt, so gilt sogar die gleichm¨aßige Beschr¨anktheit sup Ti < ∞. i∈I
312
V.
Funktionalanalysis
Beweis. Zu n ∈ N setze A n = {x ∈ X: supi∈I Ti x ≤ n}. Die Voraussetzung besagt dann X = n∈N An . Da die Ti stetig sind, ist jedes An = −1 [0, n] abgeschlossen. Ferner zeigt diese Darstellung, dass die i∈I Ti ( · ) An konvex und symmetrisch sind. Nach Lemma V.2.6 ist eines der An eine Nullumgebung. F¨ ur geeignete ε > 0 und N ∈ N gilt also: Wenn x ≤ ε ist, ist ur alle i ∈ I. Es folgt Ti x ≤ N f¨ sup Ti ≤ i∈I
N < ∞. ε
2
Beachte, dass der Beweis keinen Aufschluss u ¨ ber die Gr¨oße von supi Ti gibt, nur die Endlichkeit dieser Zahl wird bewiesen. Dass die Vollst¨ andigkeit von X wesentlich f¨ ur die G¨ ultigkeit von Theorem V.2.7 ist, sieht man an folgendem Beispiel. Betrachte den normierten Raum (d, . ∞ ) und Tn : d → K, (sm )m∈N → nsn . Da nur endlich viele sm von 0 verschieden sind, erf¨ ullt (Tn ) die Voraussetzungen von Theorem V.2.7, aber es ist Tn = n. Wir behandeln nun die punktweise Konvergenz von Operatorfolgen. Bekanntlich reicht die punktweise Konvergenz einer Folge stetiger Funktionen nicht aus, um die Stetigkeit der Grenzfunktion zu garantieren. Deshalb ist das folgende Resultat bemerkenswert. Korollar V.2.8 Sei X ein Banachraum und Y ein normierter Raum, ferner ur n ∈ N. F¨ ur x ∈ X existiere T x := limn→∞ Tn x. Dann seien Tn ∈ L(X, Y ) f¨ ist T ∈ L(X, Y ). Beweis. Die Linearit¨ at von T ist klar, siehe den Beweis von Satz V.2.4(b). Nun zur Stetigkeit von T . Da (Tn x) f¨ ur alle x ∈ X konvergiert, ist stets supn Tn x < ∞. Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit liefert supn Tn =: M < ∞. Es folgt T x = lim Tn x ≤ M x. 2 n→∞
Auf den zweiten Blick ist das Korollar nicht mehr so u ¨ berraschend. Eine offensichtliche Variante von Satz I.8.7 f¨ ur Funktionen mit Werten in einem metrischen Raum liefert n¨ amlich, dass T einen Stetigkeitspunkt besitzt, und weil T linear ist, ist dann auch x = 0 ein Stetigkeitspunkt, und T ist nach Satz V.2.2 stetig. Der zweite Hauptsatz dieses Abschnitts ist der Satz von der offenen Abbildung. Wir beginnen mit einer Definition. Definition V.2.9 Eine Abbildung zwischen topologischen R¨aumen heißt offen, wenn sie offene Mengen auf offene Mengen abbildet.
V.2
Lineare Operatoren
313
Im Gegensatz zur analogen Definition der Stetigkeit kann man hier offene Mengen nicht durch abgeschlossene Mengen ersetzen; mit anderen Worten, eine offene Abbildung braucht abgeschlossene Mengen nicht auf abgeschlossene Mengen abzubilden. Hier ein Beispiel: Die Abbildung p: R2 → R, (s, t) → s, ist offen, bildet aber die abgeschlossene Menge {(s, t): s ≥ 0, st ≥ 1} auf (0, ∞) ab. Die obige Definition ist maßgeschneidert, um die Stetigkeit von inversen Abbildungen zu untersuchen, denn es ist klar, dass eine bijektive Abbildung genau dann offen ist, wenn ihre Inverse stetig ist. Wir sind an der Offenheit linearer Abbildungen zwischen normierten R¨aumen interessiert. Daf¨ ur ist das folgende Kriterium n¨ utzlich. Lemma V.2.10 F¨ ur eine lineare Abbildung T : X → Y zwischen normierten R¨aumen X und Y sind ¨aquivalent: (i) T ist offen. (ii) T bildet offene Kugeln um 0 auf Nullumgebungen ab; m.a.W., mit Ur := {x ∈ X: x < r}, Vε := {y ∈ Y : y < ε} gilt ∀r > 0 ∃ε > 0
Vε ⊂ T (Ur ).
(iii) Es existiert ein ε > 0 mit Vε ⊂ T (U1 ). Beweis. (i) ⇒ (ii) folgt aus 0 ∈ T (Ur ) und der vorausgesetzten Offenheit dieser Menge. (ii) ⇒ (i): Sei O ⊂ X offen und x ∈ O, also T x ∈ T (O). Da O offen ist, existiert r > 0 mit x + Ur ⊂ O, folglich T x + T (Ur ) ⊂ T (O). Mit (ii) folgt T x + Vε ⊂ T (O). Da x beliebig war, muss T (O) offen sein. (ii) ⇔ (iii): Das ist klar. 2 Offensichtlich ist eine offene lineare Abbildung surjektiv. Der folgende Satz von Banach, der bei vollst¨ andigen R¨ aumen die Umkehrung garantiert, ist einer der wichtigsten S¨ atze der Funktionalanalysis. Theorem V.2.11 (Satz von der offenen Abbildung) Seien X und Y Banachr¨aume und T ∈ L(X, Y ) surjektiv. Dann ist T offen. Beweis. Wir zeigen (iii) aus Lemma V.2.10. Der Beweis hierf¨ ur zerf¨allt in zwei Teile. 1. Teil. Zun¨ achst wird mit Hilfe der Vollst¨ andigkeit von Y gezeigt: ∃ε0 > 0
Vε0 ⊂ T (U1 ).
(V.9)
(Die Bezeichnungen sind wie in Lemma V.2.10.) Zum Beweis schreiben wir An = T (Un ); dies sind abgeschlossene, konvexe und symmetrische Mengen. (Konvexit¨ at und Symmetrie u ¨bertragen sich sofortvon Un auf T (Un ) und dann auf den Abschluss.) Weil T surjektiv ist, gilt Y = n∈N An . Nach Lemma V.2.6
314
V.
Funktionalanalysis
ist eine der Mengen, etwa AN , eine Nullumgebung, d.h. Vε ⊂ T (UN ) f¨ ur ein ε > 0, woraus Vε/N ⊂ T (U1 ) folgt. 2. Teil. Sei ε0 wie in (V.9). Mit Hilfe der Vollst¨andigkeit von X werden wir nun sogar Vε0 ⊂ T (U1 )
(V.10)
schließen, woraus wegen Lemma V.2.10 die Offenheit von T folgt. Zum Beweis sei y < ε0 . W¨ ahle ε > 0 mit y < ε < ε0 und betrachte y := εε0 y. Dann ist y < ε0 , und nach (V.9) gilt y ∈ T (U1 ). Es existiert also y0 = T x0 ∈ T (U1 ) mit y − y0 < αε0 , wobei wir 0 < α < 1 so klein gew¨ ahlt haben, dass ε 1 0 |B(x, x)| ≥ mx2
∀x ∈ H,
so ist S invertierbar mit S −1 ≤ 1/m. Beweis. Zu festem y ∈ H betrachte das lineare Funktional ℓy : x → B(x, y), das nach Voraussetzung stetig mit Norm ≤ M y ist. Nach dem Satz von Fr´echetRiesz kann es als Skalarprodukt mit einem von y abh¨angigen Vektor, den wir Sy nennen, dargestellt werden, d.h. B(x, y) = ℓy (x) = x, Sy
∀x, y ∈ H.
V.3
Hilbertr¨ aume
323
Außerdem ergibt sich die Normabsch¨ atzung Sy = ℓy ≤ M y. Da B sesquilinear ist, ist S linear, und die letzte Ungleichung zeigt S ≤ M . Die Eindeutigkeit des darstellenden Operators ist klar. Wenn B koerzitiv ist, kann man mx2 ≤ |B(x, x)| = |x, Sx| ≤ xSx, also Sx ≥ mx
∀x ∈ H
(V.14)
schließen. Daraus folgt, dass S bijektiv von H auf seinen Wertebereich ran(S) operiert und die Umkehrabbildung S −1 : ran(S) → H die Normabsch¨atzung ullt (Aufgabe V.8.20). S −1 ≤ 1/m erf¨ Es bleibt zu zeigen, dass ran(S) = H ist. Dazu begr¨ unden wir, dass ran(S) abgeschlossen und dicht ist. Ist n¨ amlich (yn ) = (Sxn ) eine Folge in ran(S) mit yn → y ∈ H, so ist (yn ) und wegen (V.14) auch (xn ) eine Cauchyfolge. Mit x = limn xn folgt Sx = limn Sxn = y, und y ∈ ran(S). Steht schließlich z senkrecht auf ran(S), so ist insbesondere 0 = |z, Sz| = |B(z, z)| ≥ mz2 , also z = 0. Das zeigt, dass ran(S) dicht liegt.
2
Die n¨ achste Anwendung betrifft ein wichtiges Ergebnis der Maßtheorie. In Beispiel IV.5(b) wurden Maße mit Dichten, also solche der Form ν(E) = E g dµ betrachtet; offensichtlich ist dann die Bedingung µ(E) = 0
⇒
ν(E) = 0
(V.15)
erf¨ ullt. Allgemein nennt man ν absolutstetig bzgl. µ, in Zeichen ν ≪ µ, wenn (V.15) erf¨ ullt ist. Erstaunlicherweise gibt es im σ-endlichen Fall keine anderen absolutstetigen Maße als die der genannten Form; das ist der Inhalt des n¨achsten Satzes. Satz V.3.15 (Satz von Radon-Nikod´ ym) Seien µ und ν σ-endliche Maße auf einem messbaren Raum (S, A ). Es gelte ν ≪ µ. Dann existiert eine messbare Funktion g ≥ 0 auf S mit ν(E) = E g dµ f¨ ur alle E ∈ A ; mit anderen Worten, ν besitzt eine Dichte in bezug auf µ. Beweis. Wir betrachten zun¨ achst den Fall, dass µ und ν beide endlich sind. Setze dann σ = µ + ν und betrachte auf dem reellen Hilbertraum L2 (σ) die lineare Abbildung ℓ(f ) =
f dµ;
S
324
V.
Funktionalanalysis
beachte dazu die Inklusionen L2 (σ) ⊂ L2 (µ) ⊂ L1 (µ) (Aufgabe IV.10.37). Nach derselben Aufgabe ist außerdem |ℓ(f )| ≤ f L1(µ) ≤ µ(S)1/2 f L2(µ) ≤ µ(S)1/2 f L2 (σ) , also ist ℓ stetig auf L2 (σ). Nach dem Satz von Fr´echet-Riesz existiert eine Funktion h ∈ L2 (σ) mit f h dσ ∀f ∈ L2 (σ). (V.16) ℓ(f ) = S
Da µ und ν endlich sind, sind beschr¨ ankte messbare Funktionen in L2 (σ), insbesondere kann man Indikatorfunktionen in (V.16) einsetzen. Das liefert f¨ ur E∈A µ(E) = ℓ(χE ) = h dσ (V.17) E
sowie ν(E) = σ(E) − µ(E) =
E
(1 − h) dσ.
Daraus ergibt sich zun¨ achst 0 ≤ h ≤ 1 σ-f.¨ u. Setzt man in (V.17) E = {h = 0}, erh¨ alt man µ({h = 0}) = 0. Andererseits ist wegen ν ≪ µ auch σ ≪ µ, also σ({h = 0}) = 0, und h−1 existiert σ-f.¨ u. Weiter ergibt sich aus (V.17) f¨ ur messbare Funktionen ϕ ≥ 0 (vgl. Beispiel IV.5(b)) ϕh dσ, ϕ dµ = E
E
−1
speziell zeigt die Wahl ϕ = h h−1 dµ = σ(E) = µ(E) + ν(E), E
also ν(E) =
E
(h−1 − 1) dµ.
Sind µ und ν nur σ-endlich, kann man einerseits eine disjunkte Zerlegung S = n En mit µ(En ) < ∞ und andererseits eine disjunkte Zerlegung S = F mit ν(Fn ) < ∞ finden. Auf Gn,m = En ∩ Fm sind µ und ν dann beide n n endlich, und der erste Teil liefert eine Dichte gn,m auf G n,m . Diese messbaren Funktionen k¨ onnen zu einer einzigen Dichte g auf S = n,m Gn,m kanonisch zusammengesetzt werden. 2 In Satz V.5.2 ben¨ otigen wir noch eine Variante, in der ν ein reell- oder komplexwertiges Maß“ sein kann. Dazu definieren wir: ”
V.3
Hilbertr¨ aume
325
Definition V.3.16 Eine σ-additive Mengenfunktion ν: A → R (bzw. ν: A → C) auf einer σ-Algebra mit ν(∅) = 0 heißt signiertes (bzw. komplexes) Maß. Offensichtlich kann jedes komplexe Maß als Kombination ν = Re ν + i Im ν signierter Maße ausgedr¨ uckt werden. Wir werden argumentieren, dass jedes signierte Maß als Differenz ν = ν + − ν − von positiven Maßen geschrieben werden kann; dies nennt man Jordansche Zerlegung von ν. Dazu sei A + das System aller A ∈ A mit der Eigenschaft, dass f¨ ur B ⊂ A, B ∈ A , stets ν(B) ≥ 0 gilt; offensichtlich ist das System A + nicht leer, da ∅ ∈ A + . Setze nun α = sup{ν(A): A ∈ A + }; dann existiert eine aufsteigende Folge (An ) in A + mit ν(An ) → α. F¨ ur P = n An folgt dann P ∈ A + und ν(P ) = α; insbesondere ist α < ∞. Da ν(P ) maximal ist, kann keine Teilmenge von N = S \ P echt positives ν-Maß haben. Mit ν + (E) = ν(P ∩ E) und ν − (E) = −ν(N ∩ E) hat man die gew¨ unschte Darstellung ν = ν + − ν − gefunden. Sei nun µ ein weiteres positives Maß auf A , und das signierte Maß ν sei absolutstetig bzgl. µ; das heißt wieder µ(E) = 0
⇒
ν(E) = 0.
(F¨ ur komplexe Maße ist die Definition der Absolutstetigkeit genauso.) Da aus µ(E) = 0 auch µ(P ∩ E) = 0 und deshalb ν(P ∩ E) = 0 folgt, sind dann auch ν + und ν − absolutstetig bzgl. µ. Damit erh¨ alt man folgendes Korollar. Korollar V.3.17 Sei µ ein positives σ-endliches Maß, und sei ν ein signiertes oder komplexes Maß auf einem messbaren Raum (S, A ); es gelte ν ≪ µ. Dann ur existiert eine integrierbare Funktion g: S → R (bzw. C) mit ν(E) = E g dµ f¨ alle E ∈ A . Beweis. Ist ν ein signiertes Maß, schreibe ν = ν + − ν − wie oben und wende den Satz von Radon-Nikod´ ym auf ν + ≪ µ und ν − ≪ µ an. Man erh¨alt positive Dichten g1 und g2 f¨ ur diese Maße. Da ν + und ν − endliche Maße sind, sind diese unschte. Dichten integrierbar. Die Funktion g = g1 − g2 leistet dann das Gew¨ Ein komplexes Maß zerlege man in Real- und Imagin¨arteil. 2 Wir werfen jetzt einen ersten Blick auf die Operatortheorie in Hilbertr¨aumen. Der Satz von Fr´echet-Riesz gestattet es, wie bei Matrizen einem Operator T ∈ L(H) einen adjungierten Operator zuzuordnen; in der Tat ist dies ein Spezialfall des Satzes von Lax-Milgram (Satz V.3.14). Betrachtet man n¨amlich die Sesquilinearform B(x, y) = T x, y,
ist der Satz von Lax-Milgram anwendbar, und es existiert ein weiterer stetiger Operator, der zu T adjungierter Operator genannt und mit T ∗ bezeichnet wird, so dass ∀x, y ∈ H. T x, y = x, T ∗ y
326
V.
Funktionalanalysis
Einfache Eigenschaften des adjungierten Operators sammelt der n¨achste Satz. Satz V.3.18 Seien S, T ∈ L(H) und λ ∈ K. (a) (S + T )∗ = S ∗ + T ∗ . (b) (λT )∗ = λT ∗ . (c) (ST )∗ = T ∗ S ∗ . (d) T ∗∗ = T . (e) T ∗ ∈ L(H) und T = T ∗ . (f) T T ∗ = T ∗ T = T 2. (g) ker T = (ran T ∗ )⊥ , ker T ∗ = (ran T )⊥ ; insbesondere ist T genau dann injektiv, wenn ran T ∗ dicht liegt. ¨ Beachte die Ahnlichkeit der Abbildung T → T ∗ mit λ → λ auf C. Beweis. (a)–(d) folgen sofort aus der Definition. In (e) ist die Ungleichung T ∗ ≤ T eine automatische Konsequenz aus der Konstruktion via Satz V.3.14, und (d) liefert dann umgekehrt T = T ∗∗ ≤ T ∗ . (f) Es gilt T x2 = T x, T x = x, T ∗ T x ≤ x T ∗T x, also T 2 = sup T x2 ≤ sup x T ∗T x ≤ T ∗ T ≤ T ∗ T = T 2, x ≤1
x ≤1
(letzteres nach (e)). Daher ist T 2 = T ∗ T und folglich T 2 = T ∗ 2 = T ∗∗ T ∗ = T T ∗. (g) Es gilt ker T = (ran T ∗ )⊥ , denn Tx = 0
⇔
⇔ ⇔
T x, y = 0 ∀y ∈ H
x, T ∗ y = 0 ∀y ∈ H x ∈ (ran T ∗ )⊥ ,
und daher auch ker T ∗ = (ran T ∗∗ )⊥ = (ran T )⊥ .
2
Wir definieren jetzt eine wichtige Klasse von Hilbertraumoperatoren. Definition V.3.19 Sei T ∈ L(H). T heißt selbstadjungiert (oder hermitesch), falls T = T ∗ .
V.3
Hilbertr¨ aume
327
Selbstadjungierte Operatoren sind also durch T x, y = x, T y
∀x, y ∈ H
gekennzeichnet. Beispiele. (a) Sei H = Kn . Wird T ∈ L(H) durch die Matrix (aij )i,j dargestellt, so wird T ∗ durch (aji )i,j dargestellt. Definition V.3.19 verallgemeinert also einen bekannten Begriff der linearen Algebra. (b) Sei H = L2 [0, 1] und Tk ∈ L(H) der Integraloperator 1 (Tk f )(s) = k(s, t)f (t) dt 0
(Beispiel V.2(h)). Dann ist Tk∗ = Tk∗ mit k ∗ (s, t) = k(t, s), denn mit Hilfe des Satzes von Fubini schließt man 1 1 k(s, t)f (t) dt g(s) ds Tk f, g = 0
0
=
1
0
=
f (t)
k(s, t)g(s) ds dt
0
1
0
f (t)
0
= f, Tk∗ g.
1
1
k(s, t)g(s) ds dt
Dies kann als kontinuierliches Analogon von Beispiel (a) aufgefasst werden. Tk ist genau dann selbstadjungiert, wenn k(s, t) = k(t, s) fast u ¨ berall gilt; man nennt k dann einen symmetrischen Kern. (c) Betrachte den (Links-) Shiftoperator T : x = (s1 , s2 , . . . ) → (s2 , s3 , . . . ) auf ℓ2 . F¨ ur y = (t1 , t2 , . . . ) gilt T x, y =
∞
k=1
sk+1 tk =
∞
sk u k
k=2
mit uk = tk−1 f¨ ur k ≥ 2. Daher ist T ∗ der (Rechts-) Shiftoperator T ∗ : (t1 , t2 , . . . ) → (0, t1 , t2 , . . . ). T ist nicht selbstadjungiert. (d) T ∗ T und T T ∗ sind stets selbstadjungiert. F¨ ur die Norm eines selbstadjungierten Operators gilt:
328
V.
Funktionalanalysis
Satz V.3.20 F¨ ur selbstadjungiertes T ∈ L(H) ist T = sup |T x, x|. x ≤1
Beweis. ≥“ ist klar. Umgekehrt setze M := sup x ≤1 |T x, x|. Aus T = T ∗ ” folgt durch simples Ausrechnen T (x + y), x + y − T (x − y), x − y = 2T x, y + 2T y, x
= 2T x, y + 2x, T y = 4 ReT x, y.
Daher gilt wegen der Parallelogrammgleichung 4 ReT x, y ≤ M (x + y2 + x − y2 ) = 2M (x2 + y2 ) und folglich ReT x, y ≤ M
∀x, y ≤ 1.
Nach Multiplikation mit einem geeigneten λ, |λ| = 1, erh¨alt man |T x, y| ≤ M
∀x, y ≤ 1
und deshalb T ≤ M .
2
Korollar V.3.21 Ist T ∈ L(H) selbstadjungiert und gilt T x, x = 0 f¨ ur alle x ∈ H, so ist T = 0.
V.4
Orthonormalbasen und Fourierreihen
In diesem Abschnitt ist H stets ein Hilbertraum. Definition V.4.1 Eine Teilmenge S ⊂ H heißt Orthonormalsystem, falls e = 1 und e, f = 0 f¨ ur e, f ∈ S, e = f , gelten. Ein Orthonormalsystem S heißt Orthonormalbasis, falls lin S = H gilt. Eine Orthonormalbasis wird auch vollst¨andiges Orthonormalsystem genannt. Warum eine Orthonormalbasis Basis heißt, erkl¨art Satz V.4.8. Dort wird n¨ amlich gezeigt, dass f¨ ur eine Orthonormalbasis {e1 , e2 , . . . } eines separablen Hilbertraums H jedes Element x ∈ H in eine Reihe x=
∞
x, en en
n=1
entwickelt werden kann. Wir werden uns haupts¨ achlich mit separablen Hilbertr¨aumen besch¨aftigen. Der Grund ist, dass dann jedes Orthonormalsystem h¨ochstens abz¨ahlbar ist. Da
V.4
Orthonormalbasen und Fourierreihen
329
zwei verschiedene Vektoren eines Orthonormalsystems den Abstand e − f √ = √ 2 haben, g¨ abe es sonst n¨ amlich u berabz¨ a hlbar viele Vektoren mit Abstand 2, ¨ und das Argument zur Inseparabilit¨ at von ℓ∞ (vgl. Beispiel (c) auf Seite 304) zeigt, dass H nicht separabel sein kann. Beispiele. (a) In H = ℓ2 ist die Menge S = {en : n ∈ N} der Einheitsvektoren en = (0, . . . , 0, 1, 0, . . . ) (1 an der n-ten Stelle) eine Orthonormalbasis. (b) Sei H = L2 [−π, π] und
1 1 1 S = √ 1 ∪ √ cos n · : n ∈ N ∪ √ sin n · : n ∈ N . π π 2π Dann ist S ein Orthonormalsystem, wie unschwer durch partielle Integration gezeigt werden kann. (c) In H = L2C [−π, π], dem Raum der komplexwertigen L2 -Funktionen, ist
1 S = √ ein· : n ∈ Z 2π ein Orthonormalsystem. Diese Orthonormalsysteme sind sogar Orthonormalbasen, wie sp¨ater gezeigt werden wird (Satz V.4.16). Satz V.4.2 (Gram-Schmidt-Verfahren) Sei {xn : n ∈ N} eine linear unabh¨angige Teilmenge von H. Dann existiert ein Orthonormalsystem S = {e1 , e2 , . . . } mit lin{e1 , . . . , en } = lin{x1 , . . . , xn } f¨ ur alle n. Folglich ist lin S = lin{xn : n ∈ N}. Beweis. Setze e1 = x1 /x1 . Betrachte f2 = x2 − x2 , e1 e1 und e2 = f2 /f2 . (Es ist f2 = 0, da {x1 , x2 } linear unabh¨ angig ist.) Dann ist e1 ⊥ e2 . Wenn e1 , . . . , ek wie im Satz bereits konstruiert sind, setze fk+1 = xk+1 − und ek+1 =
k i=1
xk+1 , ei ei
fk+1 fk+1
(beachte fk+1 = 0). Nach Konstruktion ist lin{e1 , . . . , ek+1 } = lin{x1 , . . . , xk+1 }, und S := {e1 , e2 , . . . } ist ein Orthonormalsystem. Daher ist auch lin S = lin{xn : n ∈ N}. 2 Da es in einem separablen Hilbertraum H eine abz¨ahlbare (oder endliche) linear unabh¨ angige Menge mit lin A = H gibt, folgt:
330
V.
Funktionalanalysis
Korollar V.4.3 Jeder separable Hilbertraum hat eine Orthonormalbasis. ∞ Wir werden an Reihen der Form n=1 xn mit paarweise orthogonalen Summanden interessiert sein. Lemma V.4.4 Seien x1 , x2 , . . . paarweise orthogonal. Dann konvergiert die ∞ ∞ Reihe n=1 xn genau dann, wenn x 2 < ∞ ist. In diesem Fall konn n=1 ∞ vergiert jede Umordnung n=1 xπ(n) , π: N → N bijektiv, gegen den gleichen Grenzwert. m Beweis. Sei sm = n=1 xn ; dann ist sm − sk 2 =
m
ν,n=k+1
xν , xn =
n
n=k+1
xn 2 ,
also ist (sm ) genau dann eine Cauchyfolge, wenn n xn 2 < ∞. Fall ist wegen der absoluten Konvergenz der letzten Reihe auch In diesem 2 n xπ(n) < ∞, und x = n xn und y = n xπ(n) existieren beide. Da die ur jedes p und deshalb x, z = y, z xn orthogonal sind, ist x, xp = y, xp f¨ urlich auch, wenn z orthogonal zu f¨ ur jedes z ∈ lin{x1 , x2 , . . . }. Das gilt nat¨ {x1 , x2 , . . . } ist; daher ist x, z = y, z f¨ ur jedes z ∈ H, und es folgt x = y. 2 Das Lemma impliziert, dass f¨ ur ein Orthonormalsystem eine Reihe n an en (wenn u angig von der Reihenfolge der Summanden konvergiert. ¨ berhaupt) unabh¨ Dieses Ph¨ anomen nennt man unbedingte Konvergenz. Speziell ist die Wahl an = x, en von Bedeutung. Satz V.4.5 (Besselsche Ungleichung) Ist {en : n ∈ N} ein Orthonormalsystem und x ∈ H, so ist ∞
n=1
|x, en |2 ≤ x2 .
N Beweis. Sei N ∈ N beliebig. Setze xN = x − n=1 x, en en , so dass xN ⊥ ek f¨ ur k = 1, . . . , N gilt. Es folgt aus dem Satz von Pythagoras (V.13) 2
2
x = xN + = xN 2 + ≥
N
n=1
N
2
x, en en
n=1 N
n=1
|x, en |2
|x, en |2 .
Da N beliebig war, folgt die Behauptung.
2
V.4
Orthonormalbasen und Fourierreihen
331
Wir werden die folgenden unmittelbaren Konsequenz ben¨otigen. Lemma V.4.6 Sei {en : n ∈ N} ein Orthonormalsystem, und seien x, y ∈ H. Dann gilt ∞ |x, en en , y| < ∞. n=1
Beweis. Das folgt aus der H¨ olderschen Ungleichung (p = q = 2 in Satz V.1.4) und der Besselschen Ungleichung (Satz V.4.5). 2 Satz V.4.7 Sei S = {e1 , e2 , . . . } ⊂ H ein Orthonormalsystem. (a) F¨ ur alle x ∈ H konvergiert n x, en en unbedingt. (b) P : x → n x, en en ist die Orthogonalprojektion auf lin S.
Beweis. (a) Das folgt aus Lemma V.4.4 und der Besselschen Ungleichung. (b) Es ist x − P x ∈ (lin S)⊥ = S ⊥ zu zeigen, d.h., dass 6 5 ∞ x, en en , ep = 0 x− n=1
∀p ∈ N
gilt. Das ist jedoch klar.
2
Wir behandeln jetzt Orthonormalbasen. Satz V.4.8 Sei H ein separabler unendlichdimensionaler Hilbertraum, und sei S = {e1 , e2 , . . . } ⊂ H ein Orthonormalsystem. Dann sind folgende Aussagen ¨aquivalent: (i) Ist x ∈ H und x ⊥ S, so ist x = 0. (ii) S ist eine Orthonormalbasis. ∞ (iii) x = x, en en f¨ ur alle x ∈ H. n=1
(iv) x, y =
∞
x, en en , y f¨ ur alle x, y ∈ H.
n=1
(v) (Parsevalsche Gleichung) x2 =
∞
n=1
|x, en |2 f¨ ur alle x ∈ H.
Beweis. (i) ⇔ (ii): Klar nach Definition bzw. Korollar V.3.12. (ii) ⇒ (iii): Satz V.4.7. (iii) ⇒ (iv): Einsetzen, beachte Lemma V.4.6. (iv) ⇒ (v): Setze x = y. (v) ⇒ (i): Sonst existierte x mit x = 1, so dass S ∪ {x} ein Orthonormal2 system ist; folglich erg¨ abe sich der Widerspruch n |x, en |2 = 0. Dieser Satz gilt, wie aus der linearen Algebra bekannt, analog im endlichdimensionalen Fall. Die Bedingung (iii) legt die Bezeichnung Basis“ nahe. Es kann ”
332
V.
Funktionalanalysis
sich nat¨ urlich nicht um eine Vektorraumbasis handeln (es sei denn dim H < ∞), da bei einer solchen alle Summen endlich viele Summanden haben m¨ ussen. Wir wollen als n¨ achstes zeigen, dass jeder separable unendlichdimensionale Hilbertraum mit dem Folgenraum ℓ2 identifiziert werden kann. Dazu treffen wir folgende Definition. Definition V.4.9 Ein linearer Operator T zwischen normierten R¨aumen heißt Isomorphismus, falls er bijektiv und samt seiner Umkehrabbildung stetig ist. Gilt sogar zus¨ atzlich T x = x f¨ ur alle x, so heißt T ein isometrischer Isomorphismus. Wenn zwischen zwei normierten R¨ aumen X und Y ein isometrischer Isomorphismus existiert, schreiben wir X ∼ = Y. Isometrisch isomorphe R¨ aume sind also als normierte R¨aume nicht zu unterscheiden. Satz V.4.10 Ist H separabel und unendlichdimensional, so ist H ∼ = ℓ2 . Beweis. Sei {e1 , e2 , . . . } eine Orthonormalbasis von H. Zu x ∈ H definiere T x ∈ ℓ2 durch T x = (x, en )n . (Aus der Besselschen Ungleichung folgt, dass wirklich T x ∈ ℓ2 .) Der Operator T : H → ℓ2 ist linear und nach der Parsevalschen Gleichung isometrisch. Ist (an ) ∈ ℓ2 , so definiert x = n an en ein Element von H (siehe Lemma V.4.4), und es gilt T x = (an ). Daher ist T ein isometrischer Isomorphismus. 2 Beachte, dass T sogar T x, T y = x, y erf¨ ullt (Satz V.4.8(iv)), d.h. T ist nicht nur normerhaltend, sondern auch winkelerhaltend“. ” Korollar V.4.11 (Satz von Fischer-Riesz) L2 [0, 1] ∼ = ℓ2 . Wir wollen jetzt beweisen, dass das trigonometrische System eine Orthonormalbasis von L2 [−π, π] bildet; dazu sind einige Vorbereitungen n¨otig. Das Problem der Vollst¨ andigkeit des trigonometrischen Systems ist eng verwandt mit der Untersuchung der Konvergenz von Fourierreihen. Wir werden das komplexe trigonometrische System auf [−π, π] untersuchen, also 1 en (t) = √ eint 2π
(n ∈ Z).
Einer gegebenen integrierbaren Funktion f : [−π, π] → C werden wir die Fourierkoeffizienten π 1 f (s)e−ins ds (n ∈ Z) γn = γn (f ) = √ 2π −π
V.4
Orthonormalbasen und Fourierreihen
333
zuordnen. Ist sogar f ∈ L2 [−π, π], kann man dies als γn (f ) = f, en L2 [−π,π]
schreiben. Die Fourierreihe von f ist die formale Reihe n∈Z γn (f )en , und ein sehr delikates Problem der klassischen Analysis ist die Untersuchung der Konvergenz solcher Reihen (punktweise, gleichm¨ aßig, in Lp , etc.). Die Anordnung der Reihe ist dabei als γ0 e0 + γ1 e1 + γ−1 e−1 + γ2 e2 + γ−2 e−2 + · · · zu verstehen. Durch gliedweise Integration sieht man sofort, dass, falls eine Reihe aßig gegen f konvergiert, notwendigerweise alle cn = γn (f ) n∈Z cn en gleichm¨ sind: π ck π 1 f (s)e−ins ds = eiks e−ins ds = cn . γn (f ) = √ 2π −π 2π −π k∈Z
Manchmal stellt man sich statt eines f ∈ L1 [−π, π] einen Repr¨asentanten auf (−π, π] vor, der dann kanonisch zu einer 2π-periodischen Funktion auf R fortgesetzt werden kann. Insofern handelt sie Fourieranalyse von der Darstellung 2π-periodischer Funktionen. Wir beginnen mit einem einfachen Kriterium, das die gleichm¨aßige Konvergenz sicherstellt. Satz V.4.12 Sei f : R → C 2π-periodisch und zweimal stetig differenzierbar. Dann konvergiert die Fourierreihe von f (gemeint ist von f |[−π,π] ) gleichm¨aßig. Beweis. Mit partieller Integration erh¨ alt man f¨ ur n = 0 π π 1 1 1 1 ′ −ins √ √ γn (f ) = f (s)e ds = f ′′ (s)e−ins ds; −in 2π −π −n2 2π −π die Randterme verschwinden wegen der Periodizit¨at. Also gilt eine Absch¨atzung der Form |γn (f )| ≤ M/n2 , und n γn (f )en konvergiert nach dem Majorantenkriterium gleichm¨ aßig. 2 Der Haken bei dem Satz ist, dass nicht a priori klar ist, dass die Reihe auch gegen f konvergiert. Nennt man die Grenzfunktion g, so folgt wegen der gleichm¨ aßigen Konvergenz nur γn (f ) = γn (g) f¨ ur alle n ∈ Z. Dass das f¨ ur stetige Funktionen f = g impliziert, ist eine Konsequenz des n¨achsten Satzes, der auf Fej´er zur¨ uckgeht und seinerzeit die Fachwelt in Erstaunen versetzte4 . 4 T. K¨ orner schreibt in Fourier Analysis, Cambridge University Press 1988, dazu: “To the surprise of everybody Fej´er (then aged only 19) showed that [f = g]. [. . . ] (Any reader discouraged by Fej´er’s precocity should note that a few years earlier his school considered him so weak in mathematics as to require extra tuition.)” (S. 4–5)
334
V.
Funktionalanalysis
Zun¨ achst einige Bezeichnungen. Zu einer integrierbaren Funktion auf [−π, π] assoziieren wir die Partialsummen der Fourierreihe (Sn f )(t) =
n
γk (f )ek (t)
k=−n
sowie deren arithmetische Mittel (Tn f )(t) =
n−1 1 (Sk f )(t). n k=0
Wir wollen Sn f und Tn f anders darstellen. Es ist π n 1 f (s)e−iks ds eikt (Sn f )(t) = 2π −π k=−n π n 1 f (s) = eik(t−s) ds 2π −π k=−n
sowie (geometrische Reihe) n
e(2n+1)iu − 1 eiu − 1
eiku = e−inu
k=−n 1
=
1
e(n+ 2 )iu − e−(n+ 2 )iu 1
1
e 2 iu − e− 2 iu sin(n + 12 )u = . sin u2 Man nennt die hier auftauchende Funktion Dn (u) :=
sin(n + 21 )u , sin u2
die man durch Dn (0) = n + 12 an der Stelle u = 0 stetig erg¨anzt, den n-ten Dirichletkern. Die obige Darstellung f¨ ur Sn f l¨ asst sich also kurz als π 1 Sn f (t) = f (s)Dn (t − s) ds 2π −π schreiben. Setzt man dies in die Definition von (Tn )(f ) ein, ben¨otigt man n−1 k=0
sin(k + 12 )u = Im
n−1 k=0
1
ei(k+ 2 )u
inu −1 iu/2 e = Im e eiu − 1
V.4
Orthonormalbasen und Fourierreihen
335
einu − 1 eiu/2 − e−iu/2 cos nu − 1 + i sin nu = Im 2i sin u2 1 − cos nu = 2 sin u2 = Im
=
sin2 n u2 . sin u2
Setzt man Fn (u) =
1 sin2 n u2 n sin2 u2
f¨ ur u = 0 und Fn (0) = n, so erh¨ alt man den stetigen Fej´erkern und die Integraldarstellung π 1 (Tn f )(t) = f (s)Fn (t − s) ds. 2π −π
Abb. V.1. Dirchletkern Dn und Fej´erkern Fn f¨ ur verschiedene n
Das Konvergenzproblem f¨ ur Fourierreihen ist nun, ob Sn f → f gilt; Fej´ers Idee war es, stattdessen die Konvergenz Tn f → f zu untersuchen. Satz V.4.13 (Satz von Fej´er) Ist f : R → C 2π-periodisch und stetig, so konvergiert die Folge (Tn f ) gleichm¨aßig gegen f . ucken. Beweis. Mit Hilfe der (periodischen) Faltung l¨asst sich Tn f als f ∗Fn ausdr¨ Nach der periodischen Version von Satz IV.9.3 ist nur zu zeigen, dass (Fn ) eine periodische Diracfolge ist (vgl. Seite 268). Es ist klar, dass diese Funktionen positiv, stetig und 2π-periodisch sind. Sie sind wegen 1 2π
π
−π
Fn (s) ds = (Tn 1)(0) =
n−1 1 (Sk 1)(0) = 1 n k=0
336
V.
Funktionalanalysis
auch normiert. Zum Beweis der dritten Bedingung aus der Definition einer periodischen Diracfolge sei δ > 0. Sei B = 1/sin2 2δ . Dann gilt
1 2π
1 Fn (t) dt = 2πn
{δ≤|t|≤π}
{δ≤|t|≤π}
sin2 nt B 2 2 t dt ≤ n → 0. sin 2
Damit ist die periodische Version von Satz IV.9.3 anwendbar; und die Behauptung ist bewiesen. 2 Hingegen braucht die Fourierreihe einer stetigen Funktion nicht gleichm¨aßig, ja nicht einmal punktweise zu konvergieren. Dieses Resultat kann man auf funktionalanalytischem Wege mit dem Prinzip der gleichm¨aßigen Beschr¨anktheit (Theorem V.2.7) gewinnen. Sei C2π der Raum aller 2π-periodischen stetigen Funktionen, versehen mit der Supremumsnorm; C2π kann mit dem abgeschlossenen Unterraum {f ∈ C[−π, π]: f (−π) = f (π)} von C[−π, π] identifiziert werden und ist deshalb ein Banachraum. Nehmen wir an, die Fourierreihe jeder Funktion f ∈ C2π w¨are bei t = 0 konvergent; dann w¨ aren die linearen stetigen Funktionale π 1 f (s)Dn (s) ds Ln : C2π → C, Ln (f ) = (Sn f )(0) = 2π −π insbesondere punktweise beschr¨ ankt, d.h. supn |Ln (f )| < ∞ f¨ ur alle f , und nach dem Prinzip der gleichm¨ aßigen Beschr¨ anktheit w¨ urde supn Ln < ∞ folgen. Gem¨ aß (einer leichten Modifikation von) Beispiel V.2(d) gilt π 1 ln := Ln = |Dn (s)| ds. 2π −π Aber es ist ln =
1 π
π
−π
|sin(n + 21 )s| 1 ds ≥ s |2 sin 2 | π
π
−π
|sin(n + 21 )s|
ds . |s|
Mit der Variablensubstitution σ = (n + 12 )s ergibt sich nun 2 ln ≥ π
(n+ 12 )π
0
|sin σ|
dσ σ
n 2 kπ dσ ≥ |sin σ| π σ k=1 (k−1)π n n kπ 2 2 2 1 1 ≥ , |sin σ| dσ = π kπ (k−1)π π k k=1
k=1
also folgt ln → ∞. Daher kann (Sn f (0)) nicht f¨ ur alle f ∈ C2π konvergieren.
V.4
Orthonormalbasen und Fourierreihen
337
Damit hat man zwar die Existenz stetiger Funktionen mit divergenter Fourierreihe begr¨ undet, aber noch kein konkretes Gegenbeispiel in der Hand. Das ist auch viel subtiler; ein solches Gegenbeipiel ist5 k3
f (t) =
3 ∞ 2 sin(2k +1 t) sin lt
k2
k=1
l=1
l
.
Das st¨ arkste positive Resultat in Sachen punktweise Konvergenz von Fourierreihen ist gewiss der Satz von Carleson, wonach die Fourierreihe einer L2 Funktion f fast u ¨ berall gegen f konvergiert. Es folgen einige wichtige Korollare aus dem Satz von Fej´er. Korollar V.4.14 Haben zwei stetige 2π-periodische Funktionen dieselben Fourierkoeffizienten, so sind sie gleich. Ein trigonometrisches Polynom ist eine Funktion der Gestalt (m, n ∈ Z) g(t) =
n
ck eikt .
k=m
Weil Tn f stets ein trigonometrisches Polynom ist, impliziert der Satz von Fej´er: Korollar V.4.15 (2. Weierstraßscher Approximationssatz) Die trigonometrischen Polynome liegen dicht in C2π . Da {f ∈ C[−π, π]: f (−π) = f (π)} dicht in L2 [−π, π] liegt (sogar D(−π, π) liegt nach Lemma V.3.7 dicht), liegen die trigonometrischen Polynome, also die lineare H¨ ulle des trigonometrischen Systems, ebenfalls dicht in L2 [−π, π]. Damit haben wir bewiesen: Satz V.4.16 Das trigonometrische System bildet eine Orthonormalbasis von L2 [−π, π]. Die allgemeine Theorie liefert f¨ ur das trigonometrische System: Korollar V.4.17 Die Fourierreihe einer Funktion f ∈ L2 [−π, π] konvergiert gegen f in der Norm von L2 . F¨ ur die Fourierkoeffizienten gilt ∞
n=−∞
|γn (f )|2 = f 2L2 .
5 A. Zygmund, Trigonometric Series, Vol. I, 2. Auflage, Cambridge University Press 1959, S. 299
338
V.
Funktionalanalysis
Wir beschließen diesen Themenkreis mit einem Beispiel. Sei f (t) = t, −π ≤ t ≤ π; wir fassen f als Funktion in L2 [−π, π] auf. Wir berechnen die Fourierkoeffizienten. Klar ist γ0 (f ) = 0. Sei nun k = 0. Dann gilt mit partieller Integration π 1 γk (f ) = √ se−iks ds 2π −π π 1 π −ikπ 1 1 −π ikπ = √ e e e−iks ds −√ − −ik 2π −ik 2π −ik −π √ 1 π 2π −ikπ ikπ (e (−1)k . = √ +e )= −ik −ik 2π 2 Also ist |γk (f )|2 = 2π/k 2 f¨ ur k = 0 und k∈Z |γk (f )|2 = 4π ∞ k=1 1/k . Ande π 2 3 2 2 rerseits ist f L2 = −π s ds = 3 π . Die Parsevalsche Gleichung liefert daher ∞ 1 π2 = . k2 6 k=1
In der rein reellen Theorie w¨ urde man u ¨ brigens lieber mit dem Orthonormalsystem aus Beispiel (b) arbeiten und ∞
a0 + (an cos nt + bn sin nt) 2 n=1
mit
1 π 1 π f (t) cos nt dt, bn = f (t) sin nt dt π −π π −π die Fourierreihe von f nennen. Da die Funktionen t → cos nt und t → sin nt (komplexe) Linearkombinationen von en und e−n und umgekehrt sind, ergeben sich inhaltlich dieselben Aussagen f¨ ur reelle wie komplexe Fourierreihen; die Darstellung f¨ ur das komplexe trigonometrische System ist jedoch viel u ¨ bersichtlicher. Wir behandeln jetzt noch einen wichtigen Konvergenzbegriff. an =
Definition V.4.18 Eine Folge (xn ) in einem Hilbertraum H heißt schwach ur alle konvergent gegen x ∈ H, in Zeichen xn ⇀ x, wenn xn , y → x, y f¨ y ∈ H. Jede norm-konvergente Folge ist auch schwach konvergent; die Umkehrung gilt nicht. Ist zum Beispiel (en ) ein Orthonormalsystem, so gilt en ⇀ 0, denn die Besselsche Ungleichung impliziert en , y → 0 f¨ ur jedes y. Nat¨ urlich ist (en ) keine Norm-Nullfolge. Dass der schwache Grenzwert einer Folge eindeutig bestimmt ist, ist klar, ˜ ziehen f¨ ur alle z denn xn ⇀ x und xn ⇀ x x, z = lim xn , z = ˜ x, z n→∞
und deshalb x = x ˜ nach sich.
V.4
Orthonormalbasen und Fourierreihen
339
Ein nichttriviales Resultat ist: Satz V.4.19 Eine schwach konvergente Folge in einem Hilbertraum H ist beschr¨ankt. Beweis. Gelte xn ⇀ x∞ . Definiere die Funktionale ℓn : H → K,
ℓn (x) = x, xn .
Nach Voraussetzung ist die Folge (ℓn (x)) stets beschr¨ankt, weil konvergent. Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit liefert supn xn = supn ℓn < ∞, was zu zeigen war. 2 F¨ ur Hilbertr¨ aume gilt ein schwaches Kompaktheitsprinzip. Satz V.4.20 Jede beschr¨ankte Folge in einem separablen Hilbertraum hat eine schwach konvergente Teilfolge. ankt, und sei (ek ) eine Orthonormalbasis des sepaBeweis. Sei (xn ) ⊂ H beschr¨ rablen Hilbertraums H. Dann sind alle Folgen (xn , ek )n beschr¨ankte skalare Folgen. Wir werden die gesuchte Teilfolge mit einem Diagonalfolgenargument konstruieren. Zun¨ achst gibt es eine konvergente Teilfolge von (xn , e1 )n∈N ; wir bezeichnen sie mit (xn , e1 )n∈N1 . Die Indexfolge N1 l¨asst eine weitere Teilfolge ur die (xn , e2 )n∈N2 konvergiert, und (xn , e1 )n∈N2 konvergiert N2 ⊂ N1 zu, f¨ nat¨ urlich auch. So fortfahrend, erh¨ alt man eine absteigende Folge von Teilfolur k ≤ r konvergiert. Es gen N ⊃ N1 ⊃ N2 ⊃ . . . , so dass (xn , ek )n∈Nr f¨ sei pr das r-te Element von Nr und (yr ) = (xpr ) die Diagonalfolge. Bis auf die ersten m − 1 Glieder ist (yr ) eine Teilfolge von (xn )n∈Nm , deshalb existiert ak = limr→∞ yr , ek f¨ ur alle k. Als n¨ achstes u berlegt man, dass (ak ) in ℓ2 liegt. Ist n¨amlich supn xn = M ¨ und N ∈ N beliebig, folgt N
k=1
|ak |2 = lim
r→∞
N
k=1
|yr , ek |2 ≤ lim sup yr 2 ≤ M 2 r→∞
2 2 wegen der Besselschen Ungleichung, also auch ∞ k=1 |ak | ≤ M . Im Beweis von Satz V.4.10 wurde mit x = a e ein Element von H k k k konstruiert, f¨ ur das stets x, ek = ak ist; mit anderen Worten gilt lim yr , ek = x, ek
r→∞
f¨ ur alle k. Es folgt yr , z → x, z f¨ ur alle z ∈ lin{e1 , e2 , . . . } und wegen der Beschr¨ anktheit von (yr ) auch f¨ ur alle z ∈ H (Aufgabe V.8.41). Das heißt yr ⇀ x. 2 Im n¨ achsten Abschnitt diskutieren wir die schwache Konvergenz in normierten R¨ aumen.
340
V.
V.5
Funktionalanalysis
Der Satz von Hahn-Banach; Reflexivit¨ at
In Abschnitt V.2 wurde der Dualraum X ′ eines normierten Raums X eingef¨ uhrt; das ist der Raum aller stetigen linearen Funktionale. Versehen mit der Norm x′ = sup |x′ (x)| x ≤1
ist X ′ stets ein Banachraum (Satz V.2.4). Nach dem Satz von Fr´echet-Riesz (Theorem V.3.13) kann der Dualraum eines Hilbertraums mit diesem identifiziert werden. Wir werden nun einige weitere Dualr¨ aume berechnen. Die Elemente eines Dualraums werden wir mit x′ , y ′ etc. bezeichnen, was nicht mit dem Ableitungsstrich bei differenzierbaren Funktionen zu verwechseln ist. Satz V.5.1 (a) Sei 1 ≤ p < ∞ und
1 p
1 q
+
= 1 (mit
T : ℓq → (ℓp )′ ,
1 ∞
= 0). Dann ist die Abbildung
(T x)(y) =
∞
s n tn
n=1
(wo x = (sn ) ∈ ℓq , y = (tn ) ∈ ℓp ) ein isometrischer Isomorphismus. (b) Dieselbe Abbildungsvorschrift vermittelt einen isometrischen Isomorphismus zwischen ℓ1 und (c0 )′ . Beweis. Wir betrachten nur 1 < p < ∞ in (a). Der Fall p = 1 und Teil (b) lassen sich a ¨hnlich beweisen. ∞ Zun¨ achst folgt aus der H¨ olderschen Ungleichung V.1.4, dass n=1 sn tn tats¨ achlich konvergiert (sogar absolut) und dass |(T x)(y)| ≤ xq yp ist. Da die Linearit¨ at von T x und T klar ist, folgt die Wohldefiniertheit von T sowie T x ≤ xq . Außerdem ist T injektiv, denn aus T x = 0 folgt sn = ur alle n ∈ N (wo en wie u (T x)(en ) = 0 f¨ ¨ blich den n-ten Einheitsvektor bezeichnet) und deshalb x = 0. Wir zeigen jetzt die Surjektivit¨ at von T und – en passant – die Isometrie. Sei y ′ ∈ (ℓp )′ . Zu n ∈ N setze sn := y ′ (en ) und x = (sn ). Es ist zu zeigen: x ∈ ℓq ,
T x = y′,
xq ≤ y ′ .
Zu diesem Zweck definiere tn =
|sn |q /sn f¨ ur sn = 0, 0 f¨ ur sn = 0.
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
341
Nun gilt f¨ ur alle N ∈ N N
p
n=1
|tn | =
N
p(q−1)
n=1
|sn |
=
N
|sn |q
n=1
sowie N
n=1
|sn |q =
N
s n tn =
n=1
≤ y ′
N
tn y ′ (en ) = y ′
n=1
N
n=1
|tn |p
N
tn e n
n=1
1/p
= y ′
N
n=1
|sn |q
1/p
.
Es folgt N
n=1
|sn |q
1/q
≤ y ′
∀N ∈ N,
daher x ∈ ℓq und xq ≤ y ′ . Um schließlich T x = y ′ einzusehen, beachte, dass nach Konstruktion (T x)(en ) = y ′ (en ) f¨ ur alle n ∈ N gilt. Da T x und y ′ linear sind, stimmen sie auch auf lin{en : n ∈ N} = d u ¨berein, und da sie stetig sind, 2 auf d = ℓp (vgl. Beispiel (a) auf Seite 304). Daher gilt T x = y ′ . Kurz gesagt behauptet Satz V.5.1 p ′ ℓ ′ c0
∼ = ℓq ∼ = ℓ1 .
f¨ ur 1 ≤ p < ∞,
Hingegen wird in Satz V.5.9 gezeigt, dass (ℓ∞ )′ echt gr¨oßer als ℓ1 ist. Der obige Beweis funktioniert f¨ ur die n-dimensionalen ℓp -R¨aume ℓp (n). p ′ auch q ∼ In diesem Kontext gilt ℓ (n) = ℓ (n) selbst f¨ ur p = ∞, q = 1. Wir wollen als n¨ achstes den Dualraum der Lp -R¨aume bestimmen. Dazu ben¨ otigen wir als wichtiges Hilfsmittel den Satz von Radon-Nikod´ ym in der Version von Korollar V.3.14. Insbesondere kann das folgende Resultat f¨ ur das Lebesguemaß angewandt werden. Satz V.5.2 Sei 1 ≤ p < ∞ und (S, A , µ) ein σ-endlicher Maßraum. Ferner gelte p1 + q1 = 1. Dann definiert T : L (µ) → Lp (µ) ′ , q
einen isometrischen Isomorphismus.
(T g)(f ) =
S
f g dµ
342
V.
Funktionalanalysis
Beweis. Nach der H¨ olderschen Ungleichung ist T wohldefiniert mit T g ≤ ur gLq . Es gilt sogar T g = gLq , denn f¨ g f= |g|
|g| gLq
q/p
(mit der Vereinbarung 00 = 0) gilt f Lp = 1 und S f g dµ = gLq ; dieses Argument ist f¨ ur p = 1 und q = ∞ entsprechend zu modifizieren. Um die Surjektivit¨ at zu zeigen, sei y ′ ∈ Lp (µ) ′ gegeben. Wir setzen im folgenden voraus, dass µ sogar endlich ist; der σ-endliche Fall ergibt sich daraus (Aufgabe V.8.36). Betrachte die Funktion ν: A → K,
ν(E) = y ′ (χE ).
Da µ momentan als endlich angenommen wurde, liegt die Indikatorfunktion χE in Lp (µ), und ν ist wohldefiniert. Es ist klar, dass ν(∅) = 0 und dass ν additiv ist, und die Voraussetzung p < ∞ impliziert, dass ν sogar σ-additiv ist. ν ist also ein signiertes (oder komplexes) Maß. Aus der Konstruktion von ν folgt, dass ν absolutstetig bzgl. µ ist, denn aus µ(E) = 0 ergibt sich χE = 0 µ-fast u ¨ berall, also χE = 0 ∈ Lp (µ) und ν(E) = y ′ (χE ) = 0. Nach dem Satz von Radon-Nikod´ ym, Korollar V.3.14, existiert eine µ-integrierbare Dichte g mit χE g dµ ∀E ∈ A . g dµ = ν(E) = S
E
Als n¨ achstes beweisen wir ′
y (f ) =
f g dµ
S
∀f ∈ L∞ (µ).
(V.18)
ur alle Indikatorfunktionen Nach Konstruktion ist n¨ amlich y ′ (f ) = S f g dµ f¨ f und daher auch f¨ ur Linearkombinationen von Indikatorfunktionen, da y ′ linear ist. Deshalb gilt diese Formel auch f¨ ur Treppenfunktionen. Da schließlich ∞ (µ) nach Lp (µ) stetig ist, ist y ′ bzgl. . L∞ die identische Abbildung von L ∞ 1 stetig; und f → S f g dµ ist stetig auf L (µ), da g ∈ L (µ). Folglich gilt ′ y (f ) = S f g dµ auch auf dem . L∞ -Abschluß der Treppenfunktionen, d.h. (Satz IV.7.6) auf L∞ (µ). Jetzt kann mit einer ¨ ahnlichen Methode wie im ℓp -Fall g ∈ Lq (µ) gezeigt werden, so dass T g definiert ist. Falls q < ∞, definiere hierzu ( 00 = 0 wie oben) f (s) =
|g(s)|q . g(s)
Die Funktion f ist messbar, und es gilt |g|q = f g = |f |p .
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
343
Nun betrachte zu n ∈ N die messbare Menge En = {s: |g(s)| ≤ n}. Dann ist χEn f ∈ L∞ (µ), und ferner liefert (V.18) q |g| dµ = (χEn f )g dµ = y ′ (χEn f ) ≤ y ′ χEn f Lp S
En
′
= y folglich
En
En
p
|f | dµ
|g|q dµ
1/q
1/p
′
= y
≤ y ′
En
q
|g| dµ
1/p
,
∀n ∈ N.
1/q = gLq Da nach dem Satz von Beppo Levi (Satz IV.5.5) supn En |g|q dµ gilt, ist damit g ∈ Lq (µ) bewiesen. Im Fall q = ∞ (also p = 1) betrachte E = {s: |g(s)| > y ′ } und setze are µ(E) > 0, folgte f = χE |g|/g ∈ L∞ (µ). W¨ ′ µ(E)y < f g dµ = y ′ (f ) ≤ y ′ f L1 |g| dµ = E
S
im Widerspruch zu µ(E) = f L1 . Also gilt |g| ≤ y ′ fast u ¨ berall, d.h. g ∈ L∞ (µ). Da beide Funktionale y ′ und T g auf Indikatorfunktionen und daher auf deren linearer H¨ ulle, den Treppenfunktionen, u ¨ bereinstimmen und die Treppenfunktionen in Lp (µ) dicht liegen (Satz IV.7.6), gilt schließlich y ′ = T g. 2 H¨ angen p und q gem¨ aß p1 + 1q = 1 zusammen, nennt man q u ¨ brigens den zu p konjugierten Exponenten. Wie im Fall der Folgenr¨ aume sind (L∞ )′ und L1 nicht isomorph (es sei denn, sie sind endlichdimensional). Ohne Beweis beschreiben wir noch den Dualraum eines Raums stetiger Funktionen. Satz V.5.3 (Rieszscher Darstellungssatz) Sei K ein kompakter metrischer (oder topologischer) Raum. Zu jedem Funktional ℓ ∈ C(K)′ existiert dann ein signiertes (oder komplexes) Maß µ auf der Borel-σ-Algebra von K mit ℓ(f ) = f dµ. K
(Die Integration nach einem signierten oder komplexen Maß wird mittels der Jordan-Zerlegung auf die Integration nach positiven Maßen zur¨ uckgef¨ uhrt.) Wir legen jetzt unser Augenmerk auf die Untersuchung von Dualr¨aumen im allgemeinen. In der fortgeschrittenen Funktionalanalysis versucht man, Informationen u ¨ ber einen normierten Raum mit Hilfe seines Dualraums zu gewinnen;
344
V.
Funktionalanalysis
um solch ein Programm durchzuf¨ uhren, ben¨ otigt man Aussagen, die die Existenz nichttrivialer Funktionale sicherstellen. A priori ist n¨amlich nur klar, dass 0 ∈ X ′ , und bis jetzt haben wir keinen allgemeinen Satz bewiesen, der ausschließt, dass X ′ nur aus dem Nullfunktional besteht. Dass in der Tat X ′ stets sehr reichhaltig ist, ist eine Konsequenz des n¨ achsten wichtigen Satzes. Theorem V.5.4 (Fortsetzungssatz von Hahn-Banach) Sei X ein normierter Raum und U ein Untervektorraum. Zu jedem stetigen linearen Funktional u′ : U → K existiert dann ein stetiges lineares Funktional x′ : X → K mit x′ |U = u′ , x′ = u′ . Jedes stetige lineare Funktional kann also normgleich fortgesetzt werden. Beweis. Ohne Einschr¨ ankung ist u′ = 1. Der Beweis besteht aus zwei Teilen. Zuerst wird gezeigt, wie man so ein x′ findet, wenn X eine Dimension mehr“ als U hat, wenn also dim X/U = 1 ist. ” Dann folgt ein Induktionsschritt. Von U ausgehend nimm eine Dimension zu U hinzu und l¨ ose das Fortsetzungsproblem nach Schritt 1, nimm eine weitere Dimension hinzu und l¨ ose das Fortsetzungsproblem usw. Die mathematische Pr¨azisierung des usw.“-Schritts besteht in der Verwendung des Zornschen Lem” mas. Wir betrachten zun¨ achst den Fall reeller Skalare. Im ersten Schritt zeigen wir also, dass das Fortsetzungsproblem l¨ osbar ist, wenn dim X/U = 1 ist. Sei aßt sich dann eindeutig als x0 ∈ X \ U beliebig. Jedes x ∈ X l¨ x = u + λx0
(u ∈ U, λ ∈ R)
schreiben. Sei r ∈ R ein noch freier Parameter. Der Ansatz Lr (x) = u′ (u) + λr definiert dann eine lineare Abbildung, die u′ fortsetzt. Durch passende Wahl von r werden wir Lr ∈ X ′ und Lr ≤ 1 und deshalb Lr = 1 sicherstellen. In der Tat gilt Lr ≤ 1 genau dann, wenn Lr (u + λx0 ) = u′ (u) + λr ≤ u + λx0
∀u ∈ U, λ ∈ R
(V.19)
gilt. Nach Voraussetzung gilt (V.19) f¨ ur λ = 0 und alle u ∈ U . Sei λ > 0. Dann gilt (V.19) genau dann, wenn
⇔ ⇔
λr ≤ u + λx0 − u′ (u) ∀u ∈ U u ′ u ∀u ∈ U + x0 − u r ≤ λ λ r ≤ inf v + x0 − u′ (v) . v∈U
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
345
Analog ist im Fall λ < 0 die Bedingung (V.19) a¨quivalent zu
⇔ ⇔
λr ≤ u + λx0 − u′ (u) ∀u ∈ U u u ′ −r ≤ ∀u ∈ U − x0 − u −λ −λ ′ r ≥ sup u (w) − w − x0 . w∈U
Daher existiert r ∈ R mit Lr ≤ 1 genau dann, wenn u′ (w) − w − x0 ≤ v + x0 − u′ (v)
∀v, w ∈ U
gilt, also dann und nur dann, wenn u′ (v) + u′ (w) ≤ v + x0 + w − x0
∀v, w ∈ U
(V.20)
gilt. Da die Absch¨ atzung u′ (v) + u′ (w) = u′ (v + w) ≤ v + w ≤ v + x0 + w − x0 (V.20) beweist, ist der erste Schritt gezeigt. Im zweiten Schritt wenden wir das Zornsche Lemma an. Es lautet: Sei (A, ≤) eine teilweise geordnete nichtleere Menge, in der jede Kette (das ist eine total geordnete Teilmenge, also eine Teilmenge, f¨ ur deren Elemente stets a ≤ b oder b ≤ a gilt) eine obere Schranke besitzt. Dann liegt jedes Element von A unter einem maximalen Element von A, also einem Element m mit m ≤ a ⇒ a = m. Wir verwenden
V Unterraum von X mit U ⊂ V ; A := (V, LV ): LV ∈ V ′ mit LV ≤ 1, LV |U = u′ mit der Ordnung (V1 , LV1 ) ≤ (V2 , LV2 )
⇔ V1 ⊂ V2 , LV2 |V1 = LV1 .
Es ist A = ∅, da (U, u′ ) ∈ A. Ist (Vi , LVi )i∈I total geordnet, so ist in der Tat (V, LV ) mit V = ur x ∈ Vi Vi , LV (x) = LVi (x) f¨ i∈I
eine obere Schranke; LV ist wohldefiniert, da (Vi , LVi )i∈I total geordnet ist. Sei nun m = (X0 , LX0 ) ein maximales Element. W¨are X0 = X, so g¨abe es nach dem ersten Schritt eine echte Majorante von m, und m k¨onnte nicht maximal sein. Es folgt X0 = X, und x′ := LX0 l¨ost das Fortsetzungsproblem.
346
V.
Funktionalanalysis
Der komplexe Fall wird fast genauso behandelt. Man muss nur beobachten, dass x′ ≤ 1 a ¨quivalent zu Re x′ (x) ≤ x
∀x ∈ X
ist; das folgt daraus, dass f¨ ur einen geeigneten Skalar vom Betrag 1 Re x′ (x) = |x′ (λx x)| gilt. Damit ist Theorem V.5.4 bewiesen.
2
Beachte, dass der Parameter r im ersten Beweisschritt im allgemeinen nicht eindeutig bestimmt ist. Daher ist auch x′ im allgemeinen nicht eindeutig bestimmt. Die folgenden Korollare besagen, dass der Dualraum eines normierten Raums X umfassend genug ist, um Eigenschaften von X und seinen Elementen kodieren zu k¨ onnen. Dadurch werden Probleme u ¨ber Vektoren letztendlich auf Probleme ′ u ber Zahlen zur¨ u ckgespielt; die x (x), wo x′ den Dualraum von X durchl¨auft, ¨ k¨ onnen somit als Koordinaten“ von x angesehen werden. ” Korollar V.5.5 In jedem normierten Raum X existiert zu jedem x ∈ X, x = 0, ein Funktional x′ ∈ X ′ mit x′ = 1
und
x′ (x) = x.
Speziell trennt X ′ die Punkte von X; d.h., zu x1 , x2 ∈ X, x1 = x2 , existiert x′ ∈ X ′ mit x′ (x1 ) = x′ (x2 ). Beweis. Setze das Funktional u′ : lin{x} → K, u′ (λx) = λx, normgleich auf X fort. Zum Beweis des Zusatzes betrachte einfach x = x1 − x2 . 2 Korollar V.5.6 In jedem normierten Raum gilt x = sup |x′ (x)| x′ ∈BX ′
∀x ∈ X.
(V.21)
Beweis. ≥“ gilt nach Definition von x′ , und ≤“ nach Korollar V.5.5 (der ” ” Fall x = 0 ist trivial). 2 Bemerke die Symmetrie der Formel (V.21) zur Definition x′ = sup |x′ (x)| x∈BX
∀x′ ∈ X ′ .
Im Gegensatz hierzu wird das Supremum in (V.21) sogar stets angenommen.
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
347
Korollar V.5.7 Seien X ein normierter Raum, U ein abgeschlossener Unterraum und x ∈ X, x ∈ / U . Dann existiert x′ ∈ X ′ mit x′ |U = 0
und
x′ (x) = 0.
Beweis. Wir definieren ein lineares Funktional auf dem Unterraum V = lin(U ∪ {x}) durch v ′ (u + λx) = λ. Da ker v ′ = U , also abgeschlossen ist, ist v ′ nach Aufgabe V.8.13 stetig. Eine Hahn-Banach-Fortsetzung x′ ∈ X ′ von v ′ ∈ V ′ leistet das Gew¨ unschte. 2 Unmittelbar aus Korollar V.5.7 folgt: Korollar V.5.8 Ist X ein normierter Raum und U ein Untervektorraum, so sind ¨aquivalent: (i) U ist dicht in X. (ii) Falls x′ ∈ X ′ und x′ |U = 0, so gilt x′ = 0. Wir k¨ onnen jetzt zeigen, dass sich Satz V.5.1(a) nicht auf p = ∞ ausdehnen l¨asst. ∞ Satz V.5.9 Die Abbildung T : ℓ1 → (ℓ∞ )′ , (T x)(y) = n=1 sn tn f¨ ur x = (sn ), y = (tn ), ist isometrisch, aber nicht surjektiv. Beweis. Der Beweis der Isometrie ist einfach und wird den Lesern u ¨ berlassen. Um zu zeigen, dass T nicht surjektiv ist, betrachte das Funktional lim: c → K und setze es mit dem Satz von Hahn-Banach zueinem stetigen Funktional x′ : ∞ atte x′ eine Darstellung x′ (y) = n=1 sn tn , so w¨are (ek = k-ter ℓ∞ → K fort. H¨ Einkeitsvektor) ∀k ∈ N, sk = x′ (ek ) = lim ek = 0 also x′ = 0. Widerspruch!
2
Dass es u ¨ berhaupt keinen Isomorphismus zwischen ℓ1 und (ℓ∞ )′ geben kann, zeigt der folgende Satz. (Zur Erinnerung: ℓ1 ist separabel, ℓ∞ aber nicht; Beispiele (a) und (c) auf Seite 304.) Satz V.5.10 Ein normierter Raum X mit separablem Dualraum ist selbst separabel. Beweis. Mit X ′ ist SX ′ = {x′ ∈ X ′ : x′ = 1} separabel (Aufgabe I.9.9(d)). Sei ahle xi ∈ BX mit |x′i (xi )| ≥ 12 . Wir also die Menge {x′1 , x′2 , . . . } dicht in SX ′ . W¨ setzen U := lin{x1 , x2 , . . . } und werden zeigen, dass U dicht in X liegt. are x′ = 0, k¨ onnte ohne Einschr¨ankung x′ = 1 Sei x′ ∈ X ′ mit x′ |U = 0. W¨ angenommen werden. Dann existiert x′i0 mit x′ − x′i0 ≤ 14 . Es folgt 1 1 ≤ |x′i0 (xi0 )| = |x′i0 (xi0 ) − x′ (xi0 )| ≤ x′i0 − x′ xi0 ≤ . 2 4
348
V.
Funktionalanalysis
Also muss x′ = 0 sein, und wegen Korollar V.5.8 liegt U dicht. Nach Lemma V.1.11 ist X separabel. 2 Sei X ein normierter Raum, X ′ sein Dualraum und X ′′ := (X ′ )′ dessen Dualraum. Man nennt X ′′ den Bidualraum von X. Ist x ∈ X, so kann auf kanonische Weise eine Abbildung i(x) (x′ ) = x′ (x) i(x): X ′ → K,
definiert werden; man betrachtet also im Ausdruck x′ (x) diesmal x′ als variabel und h¨ alt x fest. Es ist klar, dass i(x) linear ist. Auch die Stetigkeit von i(x) ist klar, sie folgt aus |x′ (x)| ≤ x′ x. Insbesondere ist i(x) ≤ x. Der Satz von Hahn-Banach liefert die weitaus sch¨ arfere Aussage i(x) = x, siehe Korollar V.5.6. Da die so definierte Abbildung i: X → X ′′ offensichtlich linear ist, haben wir gezeigt: Satz V.5.11 Die Abbildung i: X → X ′′ , i(x) (x′ ) = x′ (x), ist eine (im allgemeinen nicht surjektive) lineare Isometrie.
Wir nennen i die kanonische Abbildung eines normierten Raums X in seinen Bidualraum; um die Abh¨ angigkeit von X zu betonen, schreibt man bisweilen auch iX . Auf diese Weise wird X mit einem Unterraum von X ′′ identifiziert. Mit X ist auch i(X) vollst¨ andig; also wird ein Banachraum X mit einem abur einen norgeschlossenen Unterraum von X ′′ identifiziert. Auf jeden Fall ist f¨ mierten Raum X der Unterraum i(X) im Banachraum X ′′ abgeschlossen und ergo vollst¨ andig. Daher gilt folgendes Korollar, das eine elegante Konstruktion der Vervollst¨ andigung eines normierten Raums liefert. Korollar V.5.12 Jeder normierte Raum ist isometrisch isomorph zu einem dichten Unterraum eines Banachraums. Beispiele. (a) Sei X = c0 . Nach Satz V.5.1 ist“ X ′ = ℓ1 , X ′′ = ℓ∞ . Unter dieser ” 1 Identifizierung gilt ic0 (x) man y = (tn ) ∈ ℓmit dem = x, denn identifiziert Funktional x = (sn ) → n sn tn , so siehtman ic0 (x) (y) = y(x) = n sn tn = z(y), wo z ∈ ℓ∞ das Funktional (tn ) → n sn tn darstellt, also z = x = ic0 (x). Insbesondere ist ic0 nicht surjektiv. (b) Nach Satz V.5.9 ist auch iℓ1 nicht surjektiv. (c) Wie unter (a) sieht man, dass f¨ ur 1 < p < ∞ die kanonische Einbettung iℓp mit dem identischen Operator Id: ℓp → ℓp u ¨ bereinstimmt und deswegen ¨ surjektiv ist. Die gleichen Uberlegungen gelten f¨ ur Lp (µ). Definition V.5.13 Ein Banachraum X heißt reflexiv, wenn iX surjektiv ist. (Nat¨ urlich hat ein unvollst¨ andiger Raum keine Chance, reflexiv zu sein.) F¨ ur reflexive R¨ aume gilt nach Definition X ∼ = X ′′ , aber diese Bedingung ist nicht hinreichend, wenngleich Gegenbeispiele nicht auf der Hand liegen6 . 6 Ein
solches ist der von R.C. James konstruierte und heute nach ihm benannte JamesRaum; siehe J. Lindenstrauss, L. Tzafriri, Classical Banach Spaces, Vol. 1, Springer 1977, S. 25.
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
349
Aus den obigen Beispielen folgt: ur 1 < p < ∞ reflexiv. • ℓp und Lp (µ) sind f¨ • c0 und ℓ1 sind nicht reflexiv. • Endlichdimensionale R¨aume sind X trivialerweise reflexiv, da nach Beispiel V.2(a) dim X = dim X ′ = dim X ′′ . • Hilbertr¨aume sind reflexiv. (Im separablen Fall ist ein Hilbertraum n¨amlich zu ℓ2 isometrisch isomorph oder endlichdimensional. Das allgemeine Argument ist in Aufgabe V.8.40 skizziert.) Satz V.5.14 (a) Abgeschlossene Unterr¨aume reflexiver R¨aume sind reflexiv. (b) Ein Banachraum X ist genau dann reflexiv, wenn X ′ reflexiv ist. Beweis. (a) Sei X reflexiv und U ⊂ X ein abgeschlossener Unterraum. Sei nun u′′ ∈ U ′′ . Dann liegt die Abbildung x′ → u′′ (x′ |U ) in X ′′ , denn |u′′ (x′ |U )| ≤ u′′ x′ |U ≤ u′′ x′ . Da X reflexiv ist, existiert x ∈ X mit x′ (x) = u′′ (x′ |U )
∀x′ ∈ X ′ .
(V.22)
W¨ are x ∈ / U , so g¨ abe es nach Korollar V.5.7 ein Funktional x′ ∈ X ′ mit x′ (x) = 1 ′ urde u′′ (x′ |U ) = 0 folgen. Es muss und x |U = 0. Im Widerspruch zu (V.22) w¨ also x ∈ U sein, und aus notationstechnischen Gr¨ unden werden wir u statt x schreiben. Es ist noch u′′ (u′ ) = u′ (u)
∀u′ ∈ U ′
zu zeigen. In der Tat: Sei u′ ∈ U ′ gegeben, und sei x′ ∈ X ′ irgendeine HahnBanach-Fortsetzung gem¨ aß Theorem V.5.4. Dann gilt u′′ (u′ ) = u′′ (x′ |U )
(V.22)
=
x′ (u) = u′ (u).
Daher ist u′′ = iU (u), und U ist reflexiv. (Wo ging die Abgeschlossenheit von U in diesem Beweis ein?) (b) Sei X reflexiv. Wir m¨ ussen zeigen, dass iX ′ : X ′ → X ′′′ surjektiv ist. Sei ′′′ ′′′ ′ also x ∈ X . Dann ist x : X → K, x → x′′′ iX (x) , linear und stetig, also x′ ∈ X ′ . Wir beweisen jetzt, dass x′′′ = iX ′ (x′ ) gilt. Da X reflexiv ist, hat jedes x′′ ∈ X ′′ die Gestalt x′′ = iX (x). Also gilt x′′′ (x′′ ) = x′′′ iX (x) = x′ (x) = iX (x) (x′ ) = x′′ (x′ ),
was zu zeigen war.
350
V.
Funktionalanalysis
Sei X ′ reflexiv. Nach dem gerade Gezeigten ist X ′′ reflexiv, nach Teil (a) auch der abgeschlossene Unterraum iX (X) und deshalb X. 2 Aus Satz V.5.14 folgt, dass auch ℓ∞ , L1 [0, 1], L∞ [0, 1] und C[0, 1] nicht reflexiv sind (Aufgabe V.8.39). Wir notieren noch eine unmittelbare Konsequenz von Satz V.5.10. Korollar V.5.15 Ein reflexiver Raum ist genau dann separabel, wenn es sein Dualraum ist. Als n¨ achstes wird der Begriff der schwachen Konvergenz einer Folge in einem normierten Raum eingef¨ uhrt und anschließend insbesondere in reflexiven R¨ aumen studiert; zum Hilbertraumfall siehe Definition V.4.18. Definition V.5.16 Eine Folge (xn ) in einem normierten Raum X heißt schwach konvergent gegen x ∈ X, in Zeichen xn ⇀ x, wenn lim x′ (xn ) = x′ (x)
∀x′ ∈ X ′
n→∞
gilt. Wegen des Satzes von Fr´echet-Riesz enth¨ alt diese Definition die im letzten Abschnitt gegebene Definition schwacher Konvergenz in Hilbertr¨aumen. Die Eindeutigkeit des schwachen Grenzwerts liegt diesmal tiefer; sie folgt aus Korollar V.5.5 und beruht also auf dem Satz von Hahn-Banach. Selbstverst¨ andlich sind konvergente Folgen schwach konvergent. Die Umkehrung gilt nicht, wie bereits f¨ ur Folgen im Hilbertraum beobachtet wurde. Als Beispiel f¨ ur schwache Konvergenz betrachten wir die Funktionen fn = χ[n,n+1] auf R. In Lp (R) gilt dann fn ⇀ 0, wenn 1 < p < ∞, nicht aber f¨ ur amlich nach Satz V.5.2 zu zeigen, dass p = 1. Im Lp -Fall ist n¨ an :=
fn (t)g(t) dt = R
n+1
g(t) dt → 0
n
f¨ ur jede Funktion g ∈ Lq (R). Nun ist nach der H¨olderschen Ungleichung |an | ≤ fn p g |[n,n+1] q =
n+1
n
|g(t)|q dt
1/q
und deshalb n |a n |q ≤ gqq < ∞. Erst recht gilt an → 0, wie behauptet. Im L1 -Fall ist jedoch R fn (t) dt = 1, d.h. unter dem von g = 1 ∈ L∞ (R) erzeugten Funktional ist (fn ) keine Nullfolge. Das Analogon zu Satz V.4.19 gilt allgemein. Satz V.5.17 Eine schwach konvergente Folge in einem normierten Raum X ist beschr¨ankt.
V.5
Der Satz von Hahn-Banach; Reflexivit¨ at
351
Beweis. Gelte xn ⇀ x∞ , und betrachte die Elemente ℓn = i(xn ) von X ′′ . Nach Voraussetzung ist (ℓn (x′ )) stets beschr¨ ankt, weil konvergent; daher ist die Folge der auf dem Banachraum X ′ definierten Funktionale ℓn punktweise beschr¨ankt. Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit liefert supn ℓn < ∞, und nach Satz V.5.11 ist ℓn = xn . Deshalb ist (xn ) beschr¨ankt. 2 Im n¨ achsten Satz, der Satz V.4.20 verallgemeinert, wird eine Form der schwachen Kompaktheit“ in reflexiven R¨ aumen bewiesen. (Zur Erinnerung: ” Genau in endlichdimensionalen R¨ aumen ist die abgeschlossene Einheitskugel kompakt; Satz V.1.10.) Theorem V.5.18 In einem reflexiven Raum X besitzt jede beschr¨ankte Folge eine schwach konvergente Teilfolge. Beweis. Wir nehmen zun¨ achst zus¨ atzlich an, dass X separabel ist; nach Korollar V.5.15 ist dann auch X ′ separabel, etwa X ′ = {x′1 , x′2 , . . . }. Sei nun (xn ) eine beschr¨ ankte Folge in X. Mit Hilfe des Diagonalfolgentricks (siehe den Beweis von Satz V.4.20) findet man eine Teilfolge, genannt (yn ), so dass x′i (yn ) n∈N f¨ ur ur alle x′ ∈ X ′ alle i konvergiert. Als n¨ achstes wird gezeigt, dass x′ (yn ) n∈N f¨ konvergiert. Seien ε > 0 und x′ ∈ X ′ . W¨ ahle i ∈ N mit x′i − x′ ≤ ε. Es folgt (mit M := supn xn ) |x′ (yn ) − x′ (ym )| ≤ 2M x′i − x′ + |x′i (yn ) − x′i (ym )| ≤ (2M + 1)ε f¨ ur hinreichend große m und n. Daher ist x′ (yn ) n∈N eine Cauchyfolge und ergo konvergent. Es ist noch nicht gezeigt, dass (yn ) schwach konvergiert; es muss noch der Grenzwert angegeben werden. Betrachte dazu die Abbildung ℓ: x′ → lim x′ (yn ) n→∞
auf X ′ , die nach dem ersten Beweisschritt wohldefiniert und linear ist. Wegen (M wie oben) |ℓ(x′ )| = lim x′ (yn ) = lim |x′ (yn )| ≤ x′ M n→∞
n→∞
liegt ℓ in X ′′ . Da X reflexiv ist, existiert x ∈ X mit ℓ = i(x), also tats¨achlich x′ (x) = lim x′ (yn ) n→∞
∀x′ ∈ X ′ ,
und (yn ) konvergiert schwach gegen x. Im Fall eines beliebigen reflexiven Raumes betrachte wieder eine beschr¨ankte Folge (xn ) und Y := lin{x1 , x2 , . . . }. Dann ist Y separabel (Lemma V.1.11) und reflexiv (Satz V.5.14). Nach dem soeben Bewiesenen existieren eine Teilfolge
352
V.
Funktionalanalysis
(yn ) und y ∈ Y mit limn→∞ y ′ (yn ) = y ′ (y) f¨ ur alle y ′ ∈ Y ′ . Sei x′ ∈ X ′ . Dann ′ ′ ′ ist x |Y ∈ Y und deshalb auch limn→∞ x (yn ) = x′ (y). Das zeigt, dass (yn ) schwach gegen y konvergiert. 2 Der obige Satz charakterisiert sogar reflexive unter allen Banachr¨aumen (Satz von Eberlein-Shmulyan).
V.6
Eigenwerttheorie kompakter Operatoren
Die Kenntnis der Eigenwerte einer Matrix A offenbart wichtige Erkenntnisse; zum Beispiel hatten wir in Lemma III.7.2 gesehen, dass limt→∞ eAt = 0 genau dann gilt, wenn alle Eigenwerte von A negativen Realteil haben. Wir wollen diesen Ideenkreis auf lineare Operatoren in normierten und insbesondere in Hilbertr¨ aumen ausdehnen. Wie in der linearen Algebra nennt man eine Zahl λ ∈ K einen Eigenwert des linearen Operators T : X → X auf einem normierten Raum, wenn es ein x = 0 mit T x = λx gibt; solch ein x wird Eigenvektor oder, wenn X ein Funktionenraum ist, Eigenfunktion genannt. Ein Eigenwert ist also dadurch charakterisiert, dass der Operator λ · Id − T , wof¨ ur h¨aufig abk¨ urzend λ − T geschrieben wird, nicht injektiv ist. Offensichtlich erf¨ ullt jeder Eigenwert die Absch¨ atzung |λ| ≤ T . Die Injektivit¨ at einer linearen Selbstabbildung eines endlichdimensionalen Raums ist zu deren Surjektivit¨ at ¨ aquivalent. Im Unendlichdimensionalen ist das im allgemeinen nicht der Fall: Auf ℓ2 ist (s1 , s2 , . . . ) → (s2 , s3 , . . . ) surjektiv, aber nicht injektiv, und (s1 , s2 , . . . ) → (0, s1 , s2 , . . . ) ist injektiv, aber nicht surjektiv. Daher studiert man in der fortgeschrittenen Funktionalanalysis nicht nur Eigenwerte, sondern allgemeiner das Spektrum σ(T ) eines Operators T auf einem Banachraum, das durch σ(T ) = {λ: λ − T nicht bijektiv} erkl¨art ist. Man beachte, dass f¨ ur bijektive T auf vollst¨andigen R¨aumen die Umkehrabbildung nach dem Satz von der offenen Abbildung automatisch stetig ist (vgl. Korollar V.2.12). In diesem Abschnitt wollen wir jedoch nicht auf die allgemeine Spetraltheorie eingehen, sondern eine Klasse von stetigen linearen Abbildungen studieren, f¨ ur die es eine ad¨ aquate Eigenwerttheorie gibt. Zun¨ achst ein wichtiges Resultat, das die Invertierbarkeit eines Operators sicherstellt. Die im folgenden Satz auftauchende Reihe wird die Neumannsche Reihe genannt. F¨ ur einen Operator T ∈ L(X) setzt man T 0 = Id und T n = T ◦ · · · ◦ T (n Faktoren).
V.6
Eigenwerttheorie kompakter Operatoren
353
Satz V.6.1 Sei X ein Banachraum und T ∈ L(X) mit T < 1. Dann konver∞ giert n=0 T n in L(X), und Id − T ist invertierbar mit (Id − T )−1 =
∞
T n.
n=0
Es ist dann (Id − T )−1 ≤ (1 − T )−1. ∞ ∞ n n n Beweis. F¨ ur T < 1 gilt ∞ n=0 T ≤ n=0 T < ∞, also ist n=0 T absolut konvergent. Ist X vollst¨ andig, soauch L(X) (Satz V.2.4(b)), und aus ∞ Aufgabe V.8.8 folgt die Konvergenz von n=0 T n . m n Setze Sm = n=0 T . Dann ist (Teleskopreihe) (Id − T )Sm = Sm (Id − T ) = Id − T m+1 .
Nun bemerke, dass in jedem normierten Raum die Glieder einer konvergenten Reihe eine Nullfolge bilden (Beweis wie im skalaren Fall) und dass f¨ ur festes R die linearen Abbildungen S → RS und S → SR nach Lemma V.2.5 stetig auf L(X) sind. Es folgt Id = lim (Id − T m+1 ) = lim (Id − T )Sm = (Id − T ) lim Sm m→∞
m→∞
m→∞
und genauso Id = lim Sm (Id − T ), m→∞
also (Id − T )−1 = Aus
∞
n=0
T n.
∞
n=0
Tn ≤
∞
n=0
T n = (1 − T )−1
ergibt sich die behauptete Normabsch¨ atzung.
2
Das eigentliche Ziel dieses Abschnitts liegt in der Untersuchung spezieller Operatoren, die wir jetzt einf¨ uhren. Definition V.6.2 Eine lineare Abbildung T zwischen normierten R¨aumen X und Y heißt kompakt, wenn T (BX ) relativkompakt ist (d.h., wenn T (BX ) kompakt ist). Die Gesamtheit der kompakten Operatoren wird mit K(X, Y ) bezeichnet; ferner setzen wir K(X) = K(X, X). Offenbar ist eine lineare Abbildung T : X → Y genau dann kompakt, wenn T beschr¨ ankte Mengen auf relativkompakte Mengen abbildet, bzw. wenn f¨ ur jede beschr¨ ankte Folge (xn ) in X die Folge (T xn ) ⊂ Y eine konvergente Teilfolge enth¨ alt; vgl. Satz I.5.4. Da kompakte Mengen beschr¨ankt sind (Beweis?), sind kompakte Operatoren stetig; es gilt also stets K(X, Y ) ⊂ L(X, Y ).
354
V.
Funktionalanalysis
¨ Ublicherweise werden kompakte Operatoren zwischen Banachr¨aumen betrachtet. Der Grund ist, dass dann der Abschluss von T (BX ) im richtigen“ ” Raum gebildet wird. Die Vollst¨ andigkeit von Y ist in Teil (a) des n¨achsten Satzes wesentlich; f¨ ur X und Teil (b) w¨ urde es reichen, normierte R¨aume vorauszusetzen. Satz V.6.3 (a) Seien X und Y Banachr¨aume. Dann ist K(X, Y ) ein abgeschlossener Teilraum von L(X, Y ). Speziell ist K(X, Y ) selbst ein Banachraum. (b) Sei Z ein weiterer Banachraum. Sind T ∈ L(X, Y ) und S ∈ L(Y, Z) und ist T oder S kompakt, so ist ST kompakt. Beweis. (a) Es ist klar, dass mit T auch λT kompakt ist (λ ∈ K). Seien nun S, T ∈ K(X, Y ), und sei (xn ) eine beschr¨ ankte Folge in X. W¨ahle eine Teilfolge (xnk ), so dass (Sxnk )k∈N konvergiert, und w¨ahle dann eine Teilteilfolge (xnkl )l∈N , die wir kurz als (xn )n∈M notieren, so dass (T xn )n∈M konvergiert. Dann konvergiert auch (Sxn + T xn )n∈M , und S + T ist kompakt. K(X, Y ) ist also ein Untervektorraum von L(X, Y ). Zum Beweis der Abgeschlossenheit verwenden wir ein Diagonalfolgenargument. Seien Tn ∈ K(X, Y ) und T ∈ L(X, Y ) mit Tn − T → 0. Sei (xn ) eine beschr¨ ankte Folge in X. Da T1 kompakt ist, existiert eine konvergente Teilfolge (T1 xn1 , T1 xn2 , T1 xn3 , . . . ). (1)
Schreibe xi
Beachte, dass
= xni . Da T2 kompakt ist, gibt es eine konvergente Teilfolge (1) (1) T2 x(1) m1 , T2 xm2 , T2 xm3 , . . . . (1) (1) T1 x(1) m1 , T1 xm2 , T1 xm3 , . . . (2)
(1)
nach wie vor konvergiert. Nun schreibe xi = xmi . Nochmalige Ausd¨ unnung liefert eine konvergente Teilfolge (2) (2) T3 x(2) p1 , T3 xp2 , T3 xp3 , . . . ;
(2) (2) und auch T1 xpi i und T2 xpi i konvergieren. So fortfahrend, erh¨alt man N ⊃ ur k ≤ r konvergiert. Betrachte nun die N1 ⊃ N2 ⊃ . . . , so dass (Tk xi )i∈Nr f¨ Diagonalfolge, also in der obigen Bezeichnung (2) ξ1 = xn1 , ξ2 = x(1) m2 , ξ3 = xp3 , etc.
Da die Folge der ξi vom k-ten Glied an Teilfolge der k-ten Ausd¨ unnung ist, haben wir erreicht: (Tn ξi )i∈N konvergiert f¨ ur alle n ∈ N.
V.6
Eigenwerttheorie kompakter Operatoren
355
Wir werden jetzt die Konvergenz von (T ξi )i∈N und dazu die Cauchyeigenschaft f¨ ur diese Folge nachweisen. Sei ε > 0. Ohne Einschr¨ ankung nehmen wir xn ≤ 1 f¨ ur alle n und folglich ur alle i an. W¨ ahle n ∈ N mit Tn − T ≤ ε und danach i0 mit ξi ≤ 1 f¨ Tn ξi − Tn ξj ≤ ε
∀i, j ≥ i0 .
F¨ ur diese i und j gilt dann T ξi − T ξj ≤ T ξi − Tn ξi + Tn ξi − Tn ξj + Tn ξj − T ξj ≤ T − Tn + ε + T − Tn ≤ 3ε.
(b) Ist (xn ) eine beschr¨ ankte Folge und ist S kompakt, so ist auch (T xn ) beschr¨ ankt, und (ST xn ) besitzt eine konvergente Teilfolge. Ist S stetig, T kompakt und (T xnk ) konvergent, so ist auch (ST xnk ) konvergent. 2 Beispiele. (a) Ist X endlichdimensional, so ist jede lineare Abbildung T : X → Y kompakt. T ist n¨ amlich stetig (Beispiel V.2(a)) und bildet deshalb die kompakte Menge BX auf eine kompakte Menge ab. (b) Ist T ∈ L(X, Y ) und der Bildraum ran(T ) endlichdimensional, so ist T ankt, und beschr¨ankte Teilmengen endlichdikompakt, denn T (BX ) ist beschr¨ mensionaler R¨ aume sind relativkompakt. Diese Bemerkung f¨ uhrt zusammen mit Satz V.6.3(a) zu folgendem Korollar. Korollar V.6.4 Seien X und Y Banachr¨aume, und sei T ∈ L(X, Y ). Falls eine Folge (Tn ) stetiger linearer Operatoren mit endlichdimensionalem Bild und Tn − T → 0 existiert, ist T kompakt. Es war lange Zeit ein offenes Problem der Funktionalanalysis, ob die Umkehrung von Korollar V.6.4 gilt, bis 1973 ein Gegenbeispiel gefunden wurde. Wir kommen in V.6.6 und V.6.7 noch einmal auf diese Frage zur¨ uck. Weitere Beispiele. (c) Betrachte den Fredholmschen Integraloperator Tk : L2 (R) → L2 (R), (Tk f )(s) = k(s, t)f (t) dt R
2
2
mit k ∈ L (R ); vgl. Beispiel V.2(h). Dort wurde bereits Tk ≤ kL2 gezeigt. In Korollar IV.7.8 wurde bewiesen, dass man k durch Treppenfunktionen, deren Stufen Rechtecke sind, approximieren kann. Das heißt, dass messbare Funktionen der Gestalt kn (s, t) =
(n) N
i,j=1
(n)
αij χE (n) (s)χF (n) (t) i
j
356
V.
Funktionalanalysis
mit kn − kL2 → 0 existieren. Es folgt Tkn − Tk = Tk−kn ≤ k − kn L2 → 0. ¨ halber Aber Tkn hat die Gestalt (den Index (n) lassen wir der Ubersichtlichkeit weg) N N f (t) dt χEi (s), αij (Tkn f )(s) = i=1
j=1
Fj
also gilt Tkn f ∈ lin{χE1 , . . . , χEN }
∀f ∈ L2 (R).
Daher haben alle Tkn endlichdimensionales Bild, und nach Korollar V.6.4 ist Tk kompakt. (d) Betrachte den Integraloperator 1 Tk : C[0, 1] → C[0, 1], (Tk f )(s) = k(s, t)f (t) dt 0
mit k ∈ C [0, 1]2 . Dann ist Tk kompakt. In der Tat ist M := Tk (BC[0,1] ) beschr¨ ankt (Beispiel V.2(g)), und (V.7) auf Seite 309 zeigt die gleichgradige Stetigkeit von M . Nach dem Satz von Arzel`a-Ascoli (Satz I.5.5) bzw. der ihm folgenden Bemerkung ist M relativkompakt. Genauso sieht man, dass ein Integraloperator k(s, t)f (t) dµ(t) Tk : C(S) → C(S), (Tk f )(s) = S
mit k ∈ C(S × S) kompakt ist, wenn S ein mit einem endlichen Borelmaß µ versehener kompakter metrischer Raum ist. Kompakte Operatoren auf Hilbertr¨ aumen lassen sich wie folgt charakterisieren. Satz V.6.5 Sei H ein Hilbertraum und T ∈ L(H). Dann sind ¨aquivalent: (i) T ist kompakt. (ii) T u uhrt schwache Nullfolgen in Norm-Nullfolgen. ¨ berf¨ ∗ (iii) T ist kompakt. Beweis. (i) ⇒ (ii): W¨ are dies falsch, existierte eine schwache Nullfolge (xn ) mit inf T xn > 0. Nach Satz V.4.19 ist (xn ) beschr¨ankt, also besitzt (T xn ) eine konvergente Teilfolge, etwa T xnk → y. Andererseits ist T xn ⇀ 0, denn ur alle z ∈ H. Also ist y = 0, da der schwache T xn , z = xn , T ∗ z → 0 f¨ Grenzwert eindeutig ist, und es muss inf T xn = 0 sein: Widerspruch! (ii) ⇒ (i): Sei (xn ) eine beschr¨ ankte Folge. Nach Theorem V.5.18 (im separablen Fall reicht Satz V.4.20) besitzt (xn ) eine schwach konvergente Teilfolge,
V.6
Eigenwerttheorie kompakter Operatoren
357
sagen wir xnk ⇀ x. Sei yk = xnk − x. Wegen yk ⇀ 0 liefert (ii) T yk → 0, und daher besitzt (T xn ) eine konvergente Teilfolge, und T ist kompakt. ¨ (i) ⇒ (iii): Wegen der bereits bewiesenen Aquivalenz ist nur ⇒
xn ⇀ 0
T ∗ xn → 0
zu zeigen. Das sieht man so: T ∗ xn 2 = T ∗ xn , T ∗ xn = xn , T T ∗ xn ≤ xn T T ∗xn → 0, ankt und T ∗ xn ⇀ 0 (siehe oben). denn (xn ) ist beschr¨ (iii) ⇒ (i) folgt aus dem bereits Gezeigten wegen T ∗∗ = T .
2
Nun soll die Umkehrung von Korollar V.6.4 untersucht werden. Bezeichnet man mit F (X, Y ) den Raum der stetigen linearen Operatoren von X nach Y mit endlichdimensionalem Bild (F steht f¨ ur finite rank“), so besagt Korollar V.6.4 ” F (X, Y ) ⊂ K(X, Y ) f¨ ur alle Banachr¨ aume X und Y . Wir zeigen jetzt, dass f¨ ur die bis jetzt diskutierten separablen Banachr¨ aume Y sogar stets Gleichheit gilt. Zun¨ achst ein allgemeiner Satz. Satz V.6.6 Sei X ein beliebiger Banachraum und Y ein (separabler) Banachraum mit der Eigenschaft: Es existiert eine beschr¨ankte Folge (Sn ) in F (Y ) mit lim Sn y = y
n→∞
∀y ∈ Y.
(V.23)
Dann gilt F (X, Y ) = K(X, Y ). Beweis. Sei T ∈ K(X, Y ). Dann ist Sn T ∈ F (X, Y ), und es reicht, Sn T − T → 0 zu zeigen. Zum Beweis hierf¨ ur sei ε > 0 gegeben. Setze K = sup Sn < ∞. Wegen der Kompaktheit von T existieren endlich viele y1 , . . . , yr mit T (BX ) ⊂
r
{y ∈ Y : y − yi < ε}.
i=1
Auf Grund von (V.23) gibt es N ∈ N mit Sn yi − yi ≤ ε
∀n ≥ N, i = 1, . . . , r.
Wir zeigen jetzt Sn T x − T x ≤ (K + 2)ε f¨ ur alle x ∈ BX , n ≥ N . F¨ ur x ∈ BX w¨ ahle n¨ amlich j ∈ {1, . . . , r} mit T x − yj < ε. Dann gilt f¨ ur n ≥ N Sn T x − T x ≤ Sn (T x − yj ) + Sn yj − yj + yj − T x ≤ Kε + ε + ε = (K + 2)ε, was den Beweis abschließt.
2
358
V.
Funktionalanalysis
Hier noch einige Bemerkungen: (1) Es ist nicht schwer zu sehen, dass ein Raum Y mit der in (V.23) genannten Eigenschaft separabel sein muss. (2) (V.23) ist nat¨ urlich schw¨ acher als Sn − Id → 0; nach Satz V.1.10 und Korollar V.6.4 w¨ urde daraus dim Y < ∞ folgen. (3) Nach dem Prinzip der gleichm¨ aßigen Beschr¨anktheit, Theorem V.2.7, impliziert (V.23) automatisch die Beschr¨ anktheit der Folge (Sn ). Korollar V.6.7 Sei X ein beliebiger Banachraum und Y einer der separablen Banachr¨aume c0 , ℓp , C[0, 1], Lp [0, 1] (1 ≤ p < ∞). Dann gilt F (X, Y ) = K(X, Y ). Insbesondere trifft das zu, wenn Y ein separabler Hilbertraum ist. Beweis. Es ist nur (V.23) zu verifizieren. F¨ ur Y = c0 oder ℓp betrachte Sn (t1 , t2 , . . . ) = (t1 , . . . , tn , 0, 0, . . . ), und f¨ ur Y = C[0, 1] setze Sn f = ∆n ∗ f mit der im Beweis des Weierstraßschen Approximationssatzes IV.9.1 verwandten Diracfolge (∆n ); dort wurde auch Sn f → f gezeigt sowie, dass Sn f ein Polynom vom Grade ≤ 2n ist. Im Fall Y = Lp [0, 1] sei Sn ein bedingter Erwartungsoperator der Form Sn f =
n 2 −1
i=0
1 2−n
(i+1)2−n
i2−n
f (t) dt χ[i2−n ,(i+1)2−n ] .
Es ist allen Leserinnen und Lesern u ufen, dass die Sn jeweils ¨ berlassen zu pr¨ (V.23) erf¨ ullen und endlichdimensionales Bild haben. 2 Die Aussage von Korollar V.6.7 gilt auch f¨ ur die nichtseparablen Banachr¨ aume ℓ∞ und L∞ ; f¨ ur den Raum H ∞ aus Aufgabe V.8.4 ist das aber noch ein offenes Problem. Nun wollen wir das Eigenwertverhalten kompakter Operatoren untersuchen. Das n¨ achste Lemma besagt, dass die zu Eigenwerten λ = 0 geh¨origen Eigenr¨ aume eines kompakten Operators stets endlichdimensional sind. Lemma V.6.8 Ist X ein normierter Raum und T : X → X kompakt sowie λ = 0, so ist ker(λ − T ) endlichdimensional. Beweis. Schreibe abk¨ urzend S = λ − T . Sei (xn ) eine beschr¨ankte Folge in ker S. Da T kompakt ist, konvergiert eine geeignete Teilfolge (T xnk ). Wegen 0 = Sxnk = λxnk − T xnk konvergiert (xnk ) in X, und da ker S abgeschlossen ist, auch in ker S. Nach Satz V.1.10 ist ker S endlichdimensional. 2 Die Dimension von ker(λ − T ) ist ein Maß daf¨ ur, wieviel dem Operator T an der Injektivit¨ at fehlt. Ein ¨ ahnliches Maß f¨ ur den Mangel an Surjektivit¨at ist
V.6
Eigenwerttheorie kompakter Operatoren
359
die Kodimension des Bildraums codim ran(λ − T ) := dim X/ran(λ − T ). Ein fundamentales Resultat der Theorie kompakter Operatoren ist, dass diese beiden Werte f¨ ur alle λ = 0 u ¨ bersinstimmen: dim ker(λ − T ) = codim ran(λ − T ).
(V.24)
Das gilt f¨ ur jeden kompakten Operator auf einem Banachraum. In diesem Abschnitt werden wir einen Beweis f¨ ur den Hilbertraumfall geben; dies gestattet es, den Beweis u ¨ bersichtlicher darzustellen als im allgemeinen Fall. Zun¨achst ein weiteres Lemma. Lemma V.6.9 Ist H ein Hilbertraum und T : H → H kompakt sowie λ = 0, so ist ran(λ − T ) abgeschlossen. Beweis. Nach Ausklammern von λ darf man λ = 1 annehmen; setze S = Id − T . Seien nun yn = Sxn ∈ ran S mit yn → y ∈ H. Der entscheidende Schritt ist zu zeigen, dass (xn ) beschr¨ ankt gew¨ ahlt werden kann. Zerlege dazu xn orthogonal in xn = un + vn ∈ ker S ⊕ (ker S)⊥ ; dann ist are unbeschr¨ankt. Dann g¨abe es eine Teilfolge Sxn = Svn . Nehmen wir an, (vn ) w¨ (wn ) von (vn ) mit wn → ∞. Setze zn = wn /wn . Es folgt zn = 1 und Szn = Swn /wn → 0, da (Swn ) wegen limn Swn = y beschr¨ankt ist. Nun ist ankte Folge, und (T zn ) besitzt eine konvergente Teilfolge und (zn ) eine beschr¨ wegen zn − T zn = Szn → 0 auch (zn ) selbst, etwa (znk ). F¨ ur z = limk znk folgt nun z = 1, z ∈ (ker S)⊥ und Sz = 0. Das widerspricht aber der Tatsache, dass S |(ker S)⊥ konstruktionsgem¨ aß injektiv ist. ankt, und (T vn ) besitzt eine konvergente Teilfolge, etwa Also ist (vn ) beschr¨ (T ξn ). Dann konvergiert auch (ξn ) = (Sξn + T ξn ), sagen wir gegen ξ, und es 2 folgt y = limn Sξn = Sξ. Wir beweisen jetzt den Hauptsatz u ¨ber das Eigenwertverhalten im Hilbertraumkontext7 . Theorem V.6.10 Seien H ein Hilbertraum und T ∈ K(H) sowie λ = 0. Dann gilt dim ker(λ − T ) = dim ker(λ − T ∗ ) = codim ran(λ − T ). Insbesondere ist der Operator λ − T genau dann surjektiv, wenn er injektiv ist. 7 Die
Beweisidee folgt J. Lindenstrauss, L. Tzafriri, Classical Banach Spaces, Vol. 1, Springer 1977, S. 77; siehe auch A.G. Ramm, A simple proof of the Fredholm alternative and a characterization of the Fredholm operators, Amer. Math. Monthly 108 (2001), 855–860.
360
V.
Funktionalanalysis
Beweis. Indem man λ ausklammert und T durch T /λ ersetzt, sieht man, dass es reicht, den Fall λ = 1 zu behandeln. Sei also wieder S = Id − T . Die zweite Gleichung ergibt sich sofort aus (ran S)⊥ = ker S ∗ (Satz V.3.18) und der Tatsache, dass f¨ ur abgeschlossene Unterr¨aume U ⊂ H codim U = dim U ⊥
(V.25)
gilt, und U = ran S ist nach Lemma V.6.9 abgeschlossen. Zum Beweis von (V.25) ist nur zu bemerken, dass x → x + U ein Vektorraumisomorphismus von U ⊥ auf den Faktorraum H/U ist. Die erste Gleichung ist schwieriger zu beweisen. Wir betrachten zuerst einen Operator T ∈ K(H) endlichen Ranges, d.h. mit endlichdimensionalem Bild. Ein solcher Operator kann in der Form Tx =
p
x, uk vk
k=1
geschrieben werden, und die Rechnung x, T ∗ y = T x, y = zeigt, dass T ∗ die Darstellung
p
k=1
x, uk vk , y =
T ∗y =
p
k=1
5 6 p x, y, vk uk k=1
y, vk uk
besitzt. Sei nun x ∈ ker S; dann ist also x = T x ∈ ran T = lin{v1 , . . . , vp } und deswegen x ∈ ker S |ran T . Es folgt ker S = ker S |ran T , denn die umgekehrte p Inklusion ist trivial. Man kann daher den Ansatz x = l=1 al vl f¨ ur eine L¨osung von Sx = 0 in H machen, ohne L¨ osungen zu verlieren. Das f¨ uhrt wegen p p p p p Tx = al · T vl = al vl , uk vk = vl , uk al vk l=1
l=1
k=1
k=1
l=1
auf das Gleichungssystem ak =
p l=1
vl , uk al ,
k = 1, . . . , p,
das also von der Matrix8 M = (δk,l − vl , uk )k,l=1,...,p regiert wird. 8δ k,l
= 0 oder = 1, je nachdem ob k = l oder k = l (Kroneckersymbol).
(V.26)
V.6
Eigenwerttheorie kompakter Operatoren
361
¨ Dieselben Uberlegungen f¨ ur ker S ∗ f¨ uhren zu dem Resultat, dass ein Element y ∈ H genau dann in ker S ∗ liegt, wenn y ∈ ker S ∗ |ran T ∗ , und der Ansatz p uhrt dann auf das Gleichungssystem y = l=1 bl ul f¨ bk =
p l=1
ul , vk bl ,
k = 1, . . . , p,
(V.27)
dessen Systemmatrix die zu M adjungierte Matrix M ∗ = (δk,l − ul , vk )k,l=1,...,p = (δk,l − vk , ul )k,l=1,...,p ist. Deshalb haben die beiden Gleichungssysteme (V.26) und (V.27) dieselbe Anzahl von linear unabh¨ angigen L¨ osungen (Spaltenrang = Zeilenrang!), d.h. dim ker S = dim ker S ∗ . Nun sei T ein beliebiger kompakter Operator. Nach Korollar V.6.7 kann T durch endlichdimensionale Operatoren approximiert werden. W¨ahle also einen Operator F endlichen Ranges mit T − F < 1, und schreibe Id − T = (Id − (T − F )) − F =: J − F. Der Satz V.6.1 u ¨ ber die Neumannsche Reihe impliziert, dass J (stetig) invertierbar ist, und es folgt Id − T = J(Id − J −1 F ) sowie (Id − T )∗ = (Id − (J −1 F )∗ )J ∗ . Weil J und J ∗ Isomorphismen sind, liefert die bereits bewiesene Aussage dim ker(Id−T ) = dim ker(Id−J −1 F ) = dim ker(Id−J −1 F )∗ = dim ker(Id−T )∗ , denn J −1 F hat endlichdimensionales Bild. Damit ist Theorem V.6.10 bewiesen.
2
Wir formulieren Theorem V.6.10 in der Sprache der Operatorgleichungen um; zum Beweis ist nur noch zu beachten, dass ran(λ − T ) nach Lemma V.6.9 abgeschlossen ist und deshalb (Satz V.3.18) mit (ker(λ − T ∗ ))⊥ u ¨ bereinstimmt. Korollar V.6.11 (Fredholmsche Alternative) Seien H ein Hilbertraum, T ∈ K(H) und λ = 0. Dann hat entweder die homogene Gleichung λx − T x = 0
nur die triviale L¨osung, und in diesem Fall ist die inhomogene Gleichung λx − T x = y
f¨ ur jedes y ∈ H eindeutig l¨osbar, oder es existieren n := dim ker(λ − T ) (< ∞) linear unabh¨angige L¨osungen der homogenen Gleichung, und auch die adjungierte Gleichung λξ − T ∗ ξ = 0 hat genau n linear unabh¨angige L¨osungen; in diesem Fall ist die inhomogene Gleichung genau dann l¨osbar, wenn y ∈ (ker(λ − T ∗ ))⊥ ist.
362
V.
Funktionalanalysis
Eine praktische Konsequenz der Fredholmschen Alternative l¨asst sich in der Parole Eindeutigkeit impliziert Existenz“ zusammenfassen. In der Regel ist ” es n¨ amlich einfacher nachzuweisen, dass eine Operatorgleichung h¨ochstens eine L¨osung besitzt, als dass sie tats¨ achlich l¨ osbar ist. ¨ Uber die Anzahl der Eigenwerte eines kompakten Operators l¨asst sich folgendes sagen. Satz V.6.12 Sei X ein Banachraum und T ∈ K(X). Dann besitzt T h¨ochstens abz¨ahlbar viele Eigenwerte, und diese bilden entweder eine endliche Menge oder eine Nullfolge. Beweis. Es reicht, die folgende Behauptung zu zeigen. • F¨ ur alle ε > 0 ist die Menge der Eigenwerte von T mit |λ| ≥ ε endlich. Nimm das Gegenteil an. Dann existieren ε > 0, eine Folge (λn ) in K und eine Folge (xn ) in X mit |λn | ≥ ε,
xn = 0,
λn = λm f¨ ur n = m.
T xn = λn xn ,
Die Menge {xn : n ∈ N} ist dann linear unabh¨ angig. W¨are das n¨amlich nicht so, g¨ abe es N ∈ N, linear unabh¨ angige x1 , . . . , xN und Skalare α1 , . . . , αN mit N xN +1 = i=1 αi xi , wo nicht alle αi verschwinden. Es folgt T xN +1 =
N
αi T xi =
N
λi αi xi
i=1
i=1
sowie andererseits T xN +1 = λN +1 xN +1 =
N
λN +1 αi xi .
i=1
Es folgt λi = λN +1 f¨ ur ein i im Widerspruch zur Wahl der λn . Setzt man En = lin{x1 , . . . , xn }, so folgt nun E1 E2 E3 . . . . Beachte, dass stets T (En ) ⊂ En gilt. Das Rieszsche Lemma V.1.9 gestattet es, n (n) yn = i=1 αi xi ∈ En mit yn = 1,
inf
z∈En−1
yn − z >
1 2
zu finden. Dann folgt f¨ ur n > m T yn − T ym = λn yn − (T ym + λn yn − T yn ).
V.6
Eigenwerttheorie kompakter Operatoren
363
Hier ist T ym ∈ Em ⊂ En−1 sowie λn yn − T yn = daher existiert zn−1 ∈ En−1 mit
n
i=1 (λn
(n)
− λi )αi xi ∈ En−1 ;
1 T yn − T ym = |λn | yn − zn−1 ≥ ε · , 2 was der Kompaktheit von T widerspricht.
2
Noch weitreichendere Aussagen als bisher lassen sich f¨ ur selbstadjungierte Operatoren treffen. Ein Problem im allgemeinen Fall, das bei kompakten selbstadjungierten Operatoren nicht vorkommen kann (siehe unten), ist n¨amlich, dass es u ¨berhaupt keine Eigenwerte zu geben braucht (Aufgabe V.8.47). Wir beginnen mit einem Lemma; besonders wichtig ist Teil (c). Lemma V.6.13 Sei H ein Hilbertraum und T ∈ K(H) selbstadjungiert. (a) Jeder Eigenwert von T ist reell. (b) Verschiedene Eigenwerte haben orthogonale Eigenvektoren. (c) Es ist T oder −T Eigenwert von T . Beweis. (a) Sei λ ein Eigenwert von T . Dann gilt f¨ ur ein x = 0 λx, x = T x, x = x, T x = T x, x = λx, x. Daher ist λ reell. (b) Gelte T x = λx und T y = µy mit λ = µ. Dann folgt wegen (a) λx, y = λx, y = T x, y = x, T y = x, µy = µx, y, also x, y = 0. (c) Nach Satz V.3.20 existiert eine Folge (xn ) in BH mit |T xn , xn | → T . ¨ Nach evtl. Ubergang zu einer Teilfolge darf die Existenz der Limiten λ := lim T xn , xn , n→∞
y := lim T xn n→∞
angenommen werden, weil T kompakt ist. Nun gilt T xn − λxn 2 = T xn − λxn , T xn − λxn = T xn 2 − 2λT xn , xn + λ2 xn 2 ≤ 2λ2 − 2λT xn , xn → 0.
Daher ist y = limn→∞ λxn und T y = λ limn T xn = λy. Wegen |λ| = T ist damit die Behauptung gezeigt, wenn y = 0 ist. W¨are aber y = 0, so w¨are (T xn ) eine Nullfolge, und es folgte T = limT xn , xn = 0. In diesem Fall ist die Behauptung von (c) trivial. 2
364
V.
Funktionalanalysis
Theorem V.6.14 (Spektralsatz f¨ ur kompakte selbstadjungierte Operatoren) Sei H ein Hilbertraum und T ∈ K(H) selbstadjungiert. Dann existieren ein (evtl. endliches) Orthonormalsystem e1 , e2 , . . . sowie eine (evtl. abbrechende) Nullfolge (λ1 , λ2 , . . . ) in R \ {0}, so dass H = ker T ⊕ lin{e1 , e2 , . . . } sowie Tx =
k
λk x, ek ek
∀x ∈ H;
und zwar sind die λk die von 0 verschiedenen Eigenwerte (richtig gez¨ahlt), und ek ist ein Eigenvektor zu λk . Ferner gilt T = supk |λk |. Beweis. Es sei µ1 , µ2 , . . . die Folge der paarweise verschiedenen Eigenwerte von T , die nicht verschwinden; vgl. Satz V.6.12. Die zugeh¨origen Eigenr¨aume ker(µi − T ) sind dann endlichdimensional, ihre Dimension, die sog. geometrische Vielfachheit von µi , sei mit di bezeichnet. Die Folge der λk entsteht durch Wiederholung der µi : (λk ) = (µ1 , . . . , µ1 , µ2 , . . . , µ2 , µ3 , . . . , µ3 , . . . ), und zwar tauche jedes µi genau di -mal auf. Wegen µi → 0 gilt dann auch ahle in jedem Eigenraum ker(µi − T ) eine Orthonormalbasis λk → 0. Ferner w¨ {ei1 , . . . , eidi } und definiere die ek durch (ek ) = (e11 , . . . , e1d1 , e21 , . . . , e2d2 , e31 , . . . , e3d3 , . . . ). Nach Lemma V.6.13(b) bilden die ek ein Orthonormalsystem, und es gilt T ek = λk ek
∀k ∈ N.
Setze H1 = lin{e1 , e2 , . . . } und H2 = H1⊥ . Wir zeigen jetzt H2 = ker T . Da die Elemente von ker T Eigenvektoren zum Eigenwert 0 sind, ist nach Lemma V.6.13(b) ker T ⊂ H2 . Zum Beweis der umgekehrten Inklusion beachte, dass ur x ∈ H2 gilt T x, ek = x, T ek = λk x, ek = 0 f¨ ur alT (H2 ) ⊂ H2 , denn f¨ aße diese Einschr¨ ankung nach Lemma V.6.13(c) einen le k. W¨ are T |H2 = 0, bes¨ von 0 verschiedenen Eigenwert, aber jeder zugeh¨orige Eigenvektor m¨ usste nach Konstruktion in H1 liegen. Also ist T |H2 = 0, das heißt H2 ⊂ ker T . Jedes x ∈ H kann deshalb in der Form x=y+ x, ek ek k
mit y ∈ ker T geschrieben werden; vgl. Satz V.4.8. Die Stetigkeit von T ergibt nun λk x, ek ek . x, ek T ek = Tx = Ty + k
k
V.6
Eigenwerttheorie kompakter Operatoren
365
Schließlich ist nach Lemma V.6.13(c) T = max |µk | = max |λk |. Damit ist der Spektralsatz bewiesen. 2 Erg¨ anzt man das Orthonormalsystem {e1 , e2 , . . . } zu einer Orthonormalbasis von H, so muss man eine Orthonormalbasis von ker T , also Eigenvektoren zum Eigenwert 0 hinzunehmen; aber ker T kann im Gegensatz zu den Eigenr¨aumen ker(λ − T ) f¨ ur λ = 0 unendlichdimensional (ja sogar nichtseparabel) sein. Man kann den Spektralsatz auch in dieser Sprache formulieren. Korollar V.6.15 Ist H ein separabler Hilbertraum und T ∈ K(H) selbstadjungiert, so besitzt H eine Orthonormalbasis aus Eigenvektoren von T . Entwickelt man in eine solche Orthonormalbasis, so nimmt der Operator T eine Diagonalgestalt“ an; es gilt n¨ amlich ” x, ek ek ⇒ T x = λk x, ek ek . x= k
k
Daher ist der Spektralsatz das Analogon zur Hauptachsentransformation der linearen Algebra. Wir werden noch eine Umformung des Spektralsatzes angeben und dabei die Bezeichnungen des obigen Beweises benutzen. Sei Ek die Orthogonalprojektion auf den zu µk geh¨ orenden Eigenraum ker(µk − T ); es ist also Ek x =
dk i=1
x, eki eki .
Der Spektralsatz zeigt dann Tx =
∞
µk Ek x
k=1
∀x ∈ H.
Diese Reihe konvergiert aber nicht nur punktweise, sondern auch in der Operatornorm. Korollar V.6.16 (Spektralsatz; Projektionsversion) Unter den Voraussetzungen von Theorem V.6.14 und mit den obigen Bezeichnungen konvergiert ∞ T = µk Ek k=1
in der Operatornorm. Beweis. Es gilt T−
N
k=1
µk Ek =
k>N
µk Ek = sup |µk | → 0, k>N
366
V.
Funktionalanalysis
da die Norm eines selbstadjungierten kompakten Operators gleich dem betragsgr¨ oßten Eigenwert ist. 2 Korollar V.6.16 kann so interpretiert werden, dass ein kompakter selbstadjungierter Operator aus den einfachsten Operatoren dieses Typs, n¨amlich (Aufgabe V.8.29) den endlichdimensionalen Orthogonalprojektionen, zusammengesetzt werden kann.
V.7
Sturm-Liouvillesche Eigenwertprobleme
In Abschnitt III.8 hatten wir folgendes Randwertproblem, das (regul¨are) SturmLiouvillesche Randwertproblem, betrachtet und gel¨ost: ⎫ Ly := (py ′ )′ + qy = g ⎬ R1 y := α1 y(a) + α2 y ′ (a) = 0 (V.28) ⎭ R2 y := β1 y(b) + β2 y ′ (b) = 0
Hier sind p, q und g reellwertige stetige Funktionen auf [a, b], und p ist sogar stetig differenzierbar und stets > 0. 2 [a, b] Die in Satz III.8.2 erzielte L¨ osung l¨ asst sich so beschreiben. Sei CR der Raum aller zweimal stetig differenzierbaren Funktionen auf [a, b], die die ullen. Falls der Sturm-Liouville-Operator Randbedingungen R1 y = R2 y = 0 erf¨ 2 L: CR [a, b] → C[a, b] injektiv ist, ist L bijektiv, und der Umkehroperator L−1 : 2 [a, b] ist ein Fredholmscher Integraloperator C[a, b] → CR (L
−1
g)(x) =
b
G(x, ξ)g(ξ) dξ a
mit einer stetigen und symmetrischen Kernfunktion G, der Greenschen Funktion des Problems, die sich mit Hilfe eines Fundamentalsystems der Differentialgleichung explizit berechnen l¨ asst. Wir k¨ onnen den Integraloperator als stetigen Operator T : L2 [a, b] → L2 [a, b] auffassen. Wegen der Symmetrie des Kerns ist T selbstadjungiert, und wegen der Stetigkeit von G ist er kompakt; daher kann T gem¨aß dem Spektralsatz spektral zerlegt werden. Wir wollen jetzt die Konsequenzen daraus f¨ ur den Operator L aufzeigen. Aus der Absch¨atzung (V.7) folgt, wenn man im letzten Schritt nicht gegen die Supremumsnorm, sondern die L2 -Norm absch¨atzt, dass T den Raum L2 [a, b] nach C[a, b] abbildet. F¨ ur einen Eigenwert λ = 0 von T bedeutet das, dass jede zugeh¨ orige Eigenfunktion f sogar stetig ist, denn T f = λf . Ist aber f stetig, so 2 [a, b], und man kann auf T f = λf den Differentialoperator ist T f = L−1 f ∈ CR L anwenden. Das zeigt f = LT f = λ Lf oder Lf =
1 f. λ
V.7
Sturm-Liouvillesche Eigenwertprobleme
367
In naheliegender Verallgemeinerung der bisher benutzten Begriffe heißt das, dass 1/λ ein Eigenwert von L ist, und die Eigenfunktionen sind dieselben wie zu T . Ist umgekehrt ν ein Eigenwert von L, so ist 1/ν ein Eigenwert von T . Schließlich ist 0 kein Eigenwert von T , da bei einem selbstadjungierten Operator Kern und 2 [a, b] und Bild senkrecht aufeinander stehen (Satz V.3.18), und ran T umfasst CR daher erst recht den dichten Unterraum D(a, b). Die Eigenwerte von L sind also genau die Reziproken der Eigenwerte von T . All dies wurde unter der Annahme abgeleitet, dass L injektiv ist, mit anderen Worten, dass 0 kein Eigenwert von L ist. Wir wollen begr¨ unden, dass diese Annahme f¨ ur qualitative Aussagen u ¨ ber Sturm-Liouville-Probleme nicht einschr¨ ankend ist. Dazu beobachten wir als erstes, dass L die Symmetriebedingung Ly1 , y2 = y1 , Ly2
2 ∀y1 , y2 ∈ CR [a, b]
(V.29)
erf¨ ullt, wobei hier wie im folgenden mit . , . das kanonische Skalarprodukt des reellen Hilbertraums L2 [a, b] gemeint ist. Das folgt durch zweimalige partielle Integration; die Randterme fallen wegen R1 yj = R2 yj = 0 weg. (V.29) wird Lagrangesche Identit¨at genannt. Sie erkl¨ art, warum (py ′ )′ + qy = g als selbstadjungierte Form der Differentialgleichung bezeichnet wurde. (Es sei jedoch darauf hingewiesen, dass der Operator L in unserer Nomenklatur nicht selbstadjungiert ist, weil er nicht stetig ist. Es ist allerdings m¨oglich, den Begriff der Selbstadjungiertheit auf unbeschr¨ ankte Operatoren auszudehnen, und die Symmetrie des Operators wie in (V.29) ist eine notwendige, aber leider nicht hinreichende Bedingung daf¨ ur.) Wie in Lemma V.6.13(b) sieht man nun, dass zu verschiedenen (reellen) Eigenwerten von L orthogonale Eigenfunktionen geh¨oren, und da L2 [a, b] separabel ist, kann L nach dem Argument vom Beginn des Abschnitts V.4 nur abz¨ahlbar viele Eigenwerte haben. Insbesondere gibt es eine reelle Zahl µ ˜, die ˜ = L−µ kein Eigenwert von L ist. Betrachtet man statt L den Operator L ˜, so ˜ injektiv, und die in III.8 entwickelte und oben zusammengefasste Theorie ist L ˜ angewandt werden. Die Eigenwerte von L und L ˜ unterscheiden sich kann auf L um µ ˜, deshalb gilt f¨ ur jeden Sturm-Liouville-Operator, ob injektiv oder nicht, der folgende Satz. Satz V.7.1 Zu jedem regul¨aren Sturm-Liouville-Operator L existiert eine Orthonormalbasis von L2 [a, b] aus Eigenfunktionen von L. Die Eigenwerte von L bilden eine Folge, die betragsm¨aßig gegen ∞ strebt. Das ergibt sich aus dem Spektralsatz f¨ ur kompakte selbstadjungierte Operatoren (Theorem V.6.14). Dass es tats¨ achlich unendlich viele Eigenwerte gibt, ˜ −1 entsprezeigt Korollar V.6.16; denn andernfalls w¨ are das Bild von T˜ , dem L 2 −1 2 ˜ chenden Integraloperator auf L [a, b], und deshalb ran L = CR [a, b] endlichdimensional.
368
V.
Funktionalanalysis
Nehmen wir nun wieder an, L sei injektiv, und sei (en ) eine Orthonormalbasis von L2 [a, b] aus Eigenfunktionen von L bzw. dessen Umkehroperator L−1 . Um das Sturm-Liouville-Problem (V.28) zu l¨ osen, entwickeln wir g ∈ C[a, b] in diese Orthonormalbasis: g, en en . g= n
Man erh¨ alt die L¨ osung
f = L−1 g =
n
λn g, en en ,
wobei λn die Eigenwerte von L−1 sind. Die Konvergenz dieser Reihe ist a priori die L2 -Konvergenz; tats¨ achlich gilt jedoch mehr. 2 Satz V.7.2 Ist f ∈ CR [a, b], so gilt
f (x) =
∞
f, en en (x)
∀x ∈ [a, b],
n=1
wobei die Konvergenz absolut und gleichm¨aßig ist. Beweis. Sei g = Lf . Da die behauptete Gleichheit stets im Sinn der L2 -Konvergenz gilt, ist nur die gleichm¨ aßige Konvergenz der Reihe n
|f, en en (x)| =
∞
n=1
|λn g, en en (x)|
in x zu zeigen. Zun¨ achst gilt f¨ ur alle x ∞
n=1
|λn en (x)|2 = =
∞
n=1 ∞
n=1
|(T en )(x)|2 |G(x, . ), en |2
(Besselsche Ungleichung) ≤ G(x, . )2L2 b |G(x, ξ)|2 dξ = a
≤ G2∞ .
W¨ ahlt man zu ε > 0 ein N ∈ N, so dass ∞
n=N
|g, en |2 ≤ ε2
V.7
Sturm-Liouvillesche Eigenwertprobleme
369
ist, folgt aus der Cauchy-Schwarz-Ungleichung f¨ ur alle x ∞
n=N
|λn g, en en (x)| ≤
∞
n=N
2
|λn en (x)|
1/2 ∞
n=N
was die behauptete gleichm¨ aßige Konvergenz zeigt.
2
|g, en |
1/2
≤ G∞ ε, 2
Zum Schluss wollen wir skizzieren, wie Sturm-Liouvillesche Eigenwertprobleme auf nat¨ urliche Weise bei Anfangsrandwertproblemen f¨ ur partielle Differentialgleichungen auftreten. Das einfachste Beispiel daf¨ ur ist das Problem der schwingenden Saite. Eine an den Enden eingespannte Saite wird angeregt und vollf¨ uhrt Schwingungen; die Auslenkung u(x, t) an der Stelle x und zur Zeit t gen¨ ugt dabei (in passenden physikalischen Einheiten) der Wellengleichung utt = uxx . Zus¨ atzlich ist die Anfangsauslenkung und -geschwindigkeit durch zwei Funktionen u(x, 0) = ϕ(x) ut (x, 0) = ψ(x) gegeben, und dass die Saite eingespannt ist, schl¨agt sich in Randbedingungen nieder. Die Konstanten in der Rechnung werden besonders einfach, wenn man die L¨ ange der Saite zu π normiert; dann lauten die Randbedingungen u(0, t) = u(π, t) = 0. Um das Problem zu l¨ osen, macht man den Ansatz der Trennung der Verachst L¨ osungen der Form ¨anderlichen und sucht zun¨ u(x, t) = v(x)w(t). Einsetzen in die Differentialgleichung liefert v(x)w′′ (t) = v ′′ (x)w(t) bzw.
w′′ (t) v ′′ (x) = w(t) v(x)
(vorausgesetzt, man dividiert nicht durch 0). Hier h¨angt die linke Seite nur von t und die rechte nur von x ab; also m¨ ussen beide Seiten gleich einer Konstanten ν sein: w′′ (t) v ′′ (x) =ν= . w(t) v(x)
370
V.
Funktionalanalysis
Zusammen mit der Randbedingung ergibt sich f¨ ur v das Sturm-Liouvillesche Eigenwertproblem v ′′ = νv,
v(0) = v(π) = 0.
(V.30)
Ist ν >√0, so sind die L¨ osungen dieser Differentialgleichung Linearkombinationen ullt die Randvon e± νx , und keine dieser Linearkombinationen außer v = 0 erf¨ ¨ bedingung in (V.30). Ahnliches gilt f¨ ur ν = 0, weshalb alle Eigenwerte negativ sind. Schreibt man ν = −µ2 (mit µ > 0), so sind die L¨osungen der Differentialgleichung jetzt von der Form c1 cos µx + c2 sin µx, und die Randbedingung v(0) = 0 erzwingt c1 = 0. Die zweite Randbedingung kann auf nichttriviale Weise nur erf¨ ullt werden, wenn µ ∈ N ist. Deshalb sind die Eigenwerte des Problems (V.30)die Zahlen νn = −n2 , n ∈ N, mit den zugeh¨origen Eigenfunktionen vn (x) = 2/π sin nx; diese haben wir so normiert, dass vn L2 [0,π] = 1. Die f¨ ur w resultierende Gleichung w′′ = −n2 w wird nun durch alle Funktionen der Bauart wn (t) = an cos nt + bn sin nt gel¨ ost. Diese sehr speziellen L¨ osungen werden in der Regel nicht die Anfangswerte erf¨ ullen. Wir machen daher jetzt den Ansatz, die tats¨achliche L¨osung durch ¨ Uberlagerung der speziellen L¨ osungen vn (x)wn (t) zu erhalten: ) ∞ 2 u(x, t) = (an cos nt + bn sin nt) sin nx (V.31) π n=1 Ist die Konvergenz der Reihe gut genug, kann man u(x, 0) bzw. ut (x, 0) durch Einsetzen von t = 0 bzw. gliedweises Differenzieren erhalten. Das Problem ist dann, die an und bn so zu bestimmen, dass ) ∞ ∞ 2 ϕ(x) = an sin nx = an vn (x), π n=1 n=1 ) ∞ ∞ 2 nbn sin nx = nbn vn (x). ψ(x) = π n=1 n=1
Es sind also ϕ und ψ in die Orthonormalbasis (vn ), d.h. eine Fourier-Sinusreihe, zu entwickeln. Es folgt 1 ψ, vn . n Sind ϕ und ψ hinreichend glatt, konvergieren diese Reihen in der Tat so gut (vgl. Satz V.4.12), dass die hier gemachten Manipulationen gerechtfertigt sind. Da die an und bn quadratisch summierbar sind und die Funktionen (x, t) → sin nt sin nx bzw. (x, t) → cos nt sin nx orthogonal in L2 ([0, π] × [0, 2π]) sind, konvergiert (V.31) in diesem Hilbertraum. Die Zusatzvoraussetzungen an die Glattheit von ϕ und ψ, die oben notwendig waren, sind jedoch v¨ollig sachfremd; man m¨ ochte sogar nichtdifferenzierbare Anfangswerte zulassen (Zupfen einer Saite). Dazu muss man den klassischen L¨osungsbegriff aufgeben und mit schwachen Ableitungen argumentieren. an = ϕ, vn ,
bn =
V.8 Aufgaben
V.8
371
Aufgaben
Aufgabe V.8.1 Sei X der Vektorraum (!) aller Lipschitz-stetigen Funktionen von [0, 1] nach R. F¨ ur x ∈ X setze x(s) − x(t) .
x Lip = |x(0)| + sup s−t s=t (a) . Lip ist eine Norm, und es gilt x ∞ ≤ x Lip f¨ ur x ∈ X. (b) (X, . Lip ) ist ein Banachraum.
Aufgabe V.8.2 F¨ ur x = (sn ) ∈ ℓ1 setze
n
x = sup sj . n j=1
Zeige, dass (ℓ1 , . ) ein normierter Raum ist. Ist es ein Banachraum? Aufgabe V.8.3 Sei C0 (Rn ) = {f : Rn → K: f stetig, lim x →∞ f (x) = 0}. Zeige, dass (C0 (Rn ), . ∞ ) ein Banachraum ist. ankten analytischen Funktionen auf Aufgabe V.8.4 Sei H ∞ der Raum der beschr¨ der offenen Einheitskreisscheibe {z ∈ C: |z| < 1}. Zeige, dass (H ∞ , . ∞ ) ein Banachraum ist. Hinweis: Konvergenzsatz von Weierstraß, Satz II.3.16. Aufgabe V.8.5 F¨ ur welche s, t ∈ R gilt (ns ) ∈ ℓp bzw. ns (log(n + 1))t ∈ ℓp ?
Aufgabe V.8.6 (a) Zeige f¨ ur 1 ≤ p ≤ q < ∞ die Inklusion ℓp ⊂ ℓq , genauer ∀x ∈ ℓp .
x q ≤ x p (b)
(Hinweis: Behandle zun¨ achst den Fall x p = 1 !) p p 0 mit m x ≤ T x
∀x ∈ X
existiert. Dann ist T injektiv, und die Umkehrabbildung T −1 : ran T → X ist stetig mit T −1 ≤ 1/m. Aufgabe V.8.21 Sei P der Vektorraum aller Polynome auf R und . eine Norm auf P. Dann ist (P, . ) kein Banachraum. (Tipp: Bairescher Kategoriensatz!) Aufgabe V.8.22 Gegeben sei ein Vektorraum X mit zwei Normen . 1 und . 2 , die beide X zu einem Banachraum machen. Man finde den Fehler in folgendem falschen aquivalent sind: BetrachArgument f¨ ur die (falsche) Aussage, dass . 1 und . 2 ¨ ” te x = x 1 + x 2 ; dann ist (X, . ) ebenfalls ein Banachraum, da (X, . 1 ) und (X, . 2 ) es sind. Ferner gilt stets x j ≤ x , also sind . und . j nach Korollar V.2.13 ¨ aquivalent und deshalb auch . 1 und . 2 .“ Aufgabe V.8.23 F¨ ur eine reelle Folge (sn ) sind ¨ aquivalent: ∞ (i) n=1 sn konvergiert absolut. (ii) F¨ ur alle Nullfolgen (tn ) konvergiert ∞ n=1 sn tn . (Tipp: Verwende Korollar V.2.8 und Satz V.5.1. ) Gib auch eine elementare“ L¨ osung, die mit Mitteln der Analysis I auskommt! ”
374
V.
Funktionalanalysis
Aufgabe V.8.24 Sei w ∈ CR [0, 1]. Betrachte auf C[0, 1] × C[0, 1] die Abbildung . , . w : (f, g) →
1
f (t)g(t)w(t) dt. 0
Gib notwendige und hinreichende Bedingungen daf¨ ur an, dass . , . w ein Skalarprodukt ist. Wann ist die von . , . w abgeleitete Norm ¨ aquivalent zur vom u ¨ blichen 1 Skalarprodukt (f, g) → 0 f (t)g(t) dt abgeleiteten Norm? ¨ Aufgabe V.8.25 In einem Hilbertraum gilt die Aquivalenz
xn ⇀ x xn → x ⇐⇒
xn → x
Aufgabe V.8.26 (Partielle Integration) (a) Sei f : Rn → C stetig differenzierbar mit kompaktem Tr¨ ager. Dann gilt ∂f (x) dx = 0 ∀j = 1, . . . , n. Rn ∂xj (Tipp: Satz von Fubini.) (b) Seien f, g: Rn → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager. Dann gilt ∂g ∂f (x)g(x) dx = − (x) dx ∀j = 1, . . . , n. f (x) ∂x ∂x n n j j R R (c) Sei Ω ⊂ Rn offen, seien f, g: Ω → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager (in Ω!). Dann gilt
Ω
∂f (x)g(x) dx = − ∂xj
f (x) Ω
∂g (x) dx ∂xj
∀j = 1, . . . , n.
(Tipp: Setze die Funktion f g kanonisch auf Rn fort.) Aufgabe V.8.27 Gib Beispiele f¨ ur Pr¨ ahilbertr¨ aume X und Unterr¨ aume U ⊂ X mit (a) U = U ⊥⊥ , (b) U ⊕ U ⊥ = X. Aufgabe V.8.28 Seien U und V abgeschlossene Unterr¨ aume des Hilbertraums H und PU und PV die entsprechenden Orthogonalprojektionen. Zeige U ⊂ V ⇐⇒ PU = PV PU = PU PV . Aufgabe V.8.29 Sei PU wie in Aufgabe V.8.28. Dann ist PU selbstadjungiert. Aufgabe V.8.30 (a) Die Rademacherfunktionen rn (t) = sign sin(2n πt), n = 0, 1, 2, . . . , bilden ein Orthonormalsystem, aber keine Orthonormalbasis von L2 [0, 1].
V.8
Aufgaben
375
ur fast alle t ∈ [0, 1]. (b) limn→∞ n1 n−1 k=0 rk (t) = 0 f¨ 04 1 / 1 n−1 (Hinweis: Betrachte 0 n k=0 rk (t) dt und verwende den Satz von Beppo Levi.) Aufgabe V.8.31 Zu ψ = χ[0,1/2) − χ(1/2,1] setze ψj,k (t) = 2k/2 ψ(2k t − j), j, k ∈ Z. ur n = 2k + j ≥ 1 Die Haarschen Funktionen hn : [0, 1] → R sind wie folgt definiert: F¨ anze diese (k = 0, 1, 2, . . . , j = 1, . . . , 2k − 1) setze hn (t) = ψj,k (t) auf [0, 1) und erg¨ Funktionen stetig bei t = 1; ferner sei h0 (t) = 1 auf [0, 1]. (Skizze!) (a) {hn : n ≥ 0} ist ein Orthonormalsystem in L2 [0, 1], und {ψj,k : j, k ∈ Z} ist ein Orthonormalsystem in L2 (R). m (b) f → 2n=0−1 f, hn hn ist die Orthogonalprojektion auf den Unterraum der auf den Intervallen [r2−m , (r + 1)2−m ) konstanten Funktionen in L2 [0, 1]. aßig gegen f . (c) F¨ ur f ∈ C[0, 1] konvergiert die Reihe ∞ n=0 f, hn hn gleichm¨ (d) Die hn bilden eine Orthonormalbasis von L2 [0, 1]. (e) Die ψj,k bilden eine Orthonormalbasis von L2 (R). Aufgabe V.8.32 Seien H ein Hilbertraum, {x 1 , . . . , xn } ein Orthonormalsystem und x ∈ H. Finde Zahlen α1 , . . . , αn , so dass x − n k=1 αk xk minimal ist.
Aufgabe V.8.33 Sei f (t) = t2 f¨ ur −π ≤ t ≤ π. Bestimme die Fourierreihe von f und 4 1/n mit der Parsevalschen Gleichung. berechne ∞ n=1 Aufgabe V.8.34 Zeige Satz V.5.1(a) f¨ ur p = 1 und Satz V.5.1(b).
Aufgabe V.8.35 Seien X und Y normierte R¨ aume, und betrachte die direkte Summe X ⊕Y. (a) Setze (x, y) p = ( x p + y p )1/p falls 1 ≤ p < ∞ und (x, y) ∞ = max{ x ,
y } f¨ ur (x, y) ∈ X ⊕ Y . Zeige, dass dies ¨ aquivalente Normen auf X ⊕ Y sind. So normiert, bezeichnen wir die direkte Summe mit X ⊕p Y . (b) Mit X und Y ist auch X ⊕p Y vollst¨ andig. (c) Beschreibe den Dualraum von X ⊕p Y mit Hilfe der Dualr¨ aume von X und Y . aumen, und sei 1 ≤ p ≤ ∞. Aufgabe V.8.36 Sei E1 , E2 , . . . eine Folge von Banachr¨ Man setzt 1/p ∞ 9 En = (xn ): xn ∈ En , (xn ) p =
xn p N . F¨ ur passendes N versuche ℓ(z) ≈ ℓ1 + ℓ2 zu zeigen.) Aufgabe V.8.38 (Rieszscher Darstellungssatz f¨ ur (C[0, 1])′ ) Sei ℓ ∈ (C[0, 1])′ und L eine Hahn-Banach-Fortsetzung zu einem Funktional L ∈ (ℓ∞ [0, 1])′ . Setze yt = χ[0,t] ∈ ℓ∞ [0, 1]. Zeige C[0, 1] ⊂ lin{yt : t ∈ [0, 1]}. Setze ankter Variation ist. Beweise schließlich g(t) = L(yt ) und zeige, dass g von beschr¨ die Darstellung des Funktionals ℓ als Stieltjes-Integral ℓ(f ) =
1
f (t) dg(t) 0
∀f ∈ C[0, 1].
(Zum Begriff des Stieltjes-Integrals siehe z.B. W. Rudin, Principles of Mathematical Analysis, 3. Auflage, McGraw-Hill 1976, S. 122.) Dieser Beweis stammt von Banach. Aufgabe V.8.39 Keiner der R¨ aume ℓ∞ , C[0, 1], L1 [0, 1], L∞ [0, 1] ist reflexiv. Aufgabe V.8.40 Hilbertr¨ aume sind reflexiv. Anleitung f¨ ur den komplexen Fall: Zu einem Hilbertraum H assoziiere den Hilbertraum ¯ dessen Elemente dieselben wie die von H sind, mit derselben Addition wie in H. Die H, ¯ wird durch λ⊙x = λx und das Skalarprodukt Skalarmultiplikation des Vektorraums H ¯ und durch x, yH¯ = y, xH erkl¨ art. Dann ist H ′ (linear) isometrisch isomorph zu H ′′ ∼ ¯ H = H = H auf kanonische Weise. Aufgabe V.8.41 Zeige, dass eine beschr¨ ankte Folge (xn ) in einem normierten Raum X genau dann gegen x ∈ X schwach konvergiert, wenn es eine Teilmenge D ⊂ X ′ mit lin D = X ′ und limn→∞ x′ (xn ) = x′ (x) f¨ ur alle x′ ∈ D gibt. Aufgabe V.8.42 Sei 1 < p < ∞. F¨ ur eine Folge (fn ) in Lp [0, 1] sind ¨ aquivalent:
(i) fn → 0 schwach. (ii) supn fn Lp < ∞ und A fn (t) dt → 0 f¨ ur alle Borelmengen A ⊂ [0, 1]. x ur alle x ∈ [0, 1]. (iii) supn fn Lp < ∞ und 0 fn (t) dt → 0 f¨ ¨ Welche Aquivalenzen bleiben f¨ ur p = 1 g¨ ultig?
V.8
Aufgaben
377
Aufgabe V.8.43 Sei 1 < p < ∞ und k ∈ C([0, 1]2 ). Zeige, dass der Integraloperator 1 Tk f (s) = k(s, t)f (t) dt 0
p
ur dessen Norm ein stetiger Operator von L [0, 1] in sich ist, f¨
Tk ≤ sup s
1 0
|k(s, t)| dt
1/q
p
sup t
1 0
|k(s, t)| ds
1/p
p
gilt, wo 1/p + 1/q = 1. Ferner ist Tk : L [0, 1] → L [0, 1] kompakt. ur g ∈ Lq [0, 1], oder benutze (V.7).) (Tipp: Betrachte (Tk f )(s)g(s) ds f¨
Aufgabe V.8.44 (a) Sei z ∈ ℓ∞ und Tz : ℓp → ℓp , Tz (x) = z·x (vgl. Aufgabe V.8.16). Tz ist kompakt dann und nur dann, wenn z ∈ c0 ist. (b) C 1 [0, 1] trage (wie u ¨ blich) die Norm f = f ∞ + f ′ ∞ . Dann ist die Inklusionsabbildung (C 1 [0, 1], . ) → (C[0, 1], . ∞ ) kompakt. (Tipp: Satz von Arzel` a-Ascoli!) Aufgabe V.8.45 Sei k ∈ C([0, 1]2 ). Der Integraloperator Tk : C[0, 1] → C[0, 1], s (Tk x)(s) = k(s, t)x(t) dt, 0
heißt dann Volterrascher Integraloperator. Zeige, dass Tk wohldefiniert und kompakt ist. Aufgabe V.8.46 Sei X ein Banachraum. Dann ist die Menge Ω aller stetig invertierbarer Operatoren auf X eine offene Teilmenge von L(X), und die Abbildung T → T −1 ist stetig auf Ω. (Hinweis: Neumannsche Reihe!) Aufgabe V.8.47 Sei T : ℓ2 → ℓ2 durch (s1 , s2 , s3 , . . . ) → (0, s1 , s2 /2, s3 /3, . . . ) erkl¨ art. Dann ist T ein kompakter Operator ohne Eigenwerte. Aufgabe V.8.48 Sei h: R → R 2π-periodisch und gerade (d.h. h(t) = h(−t)) mit h|[−π,π] ∈ L2 [−π, π]. Betrachte den Operator Th : L2 [−π, π] → L2 [−π, π], Th f (s) =
π −π
f (t)h(s − t)
dt . 2π
(a) Th ist wohldefiniert, selbstadjungiert und kompakt. (b) Durch Entwicklung von h in eine Fourierreihe bestimme die Eigenfunktionen und Eigenwerte von Th . (c) Bestimme die Spektralzerlegung von Th .
378
V.
Funktionalanalysis
Aufgabe V.8.49 Seien H ein Hilbertraum, (en )n∈N ein Orthonormalsystem und (λn ) eine beschr¨ ankte Zahlenfolge in R. Setze Tx =
∞
n=1
λn x, en en .
(a) T ∈ L(H), und T ist selbstadjungiert. (b) T ist kompakt genau dann, wenn limn→∞ λn = 0. (c) Bestimme die Eigenwerte und Eigenvektoren von T . Aufgabe V.8.50 Bestimme die Eigenwerte und Eigenfunktionen des Sturm-LiouvilleOperators Ly = y ′′ mit den Randbedingungen (a) y ′ (0) = y ′ (π) = 0, (b) y(0) = y ′ (π) = 0. Aufgabe V.8.51 Was kann man u aume bei einem re¨ber die Dimension der Eigenr¨ gul¨ aren Sturm-Liouvilleschen Eigenwertproblem aussagen?
V.9
Literaturhinweise
Dieses Kapitel kann man als Kurzfassung von ◮ D. Werner: Funktionalanalysis. 5. Auflage, Springer, 2004.
ansehen. Andere elementar gehaltenen Einf¨ uhrungen sind: ◮ J. Appell, M. V¨ ath: Elemente der Funktionalanalysis. Vieweg, 2005. ◮ Y. Eidelman, V. Milman, A. Tsolomitis: Functional Analysis. American Mathematical Society, 2004. ◮ K. Saxe: Beginning Functional Analysis. Springer, 2002.
Insbesondere das Buch von Appell und V¨ ath ist sehr reich an Beispielen. Vertiefende Darstellungen mit unterschiedlichen Schwerpunkten findet man unter anderem in: ◮ ◮ ◮ ◮ ◮
H. W. Alt: Lineare Funktionalanalysis. 3. Auflage, Springer, 1999. H. Heuser: Funktionalanalysis. 3. Auflage, Teubner, 1992. M. Mathieu: Funktionalanalysis. Spektrum-Verlag, 1998. R. Meise, D. Vogt: Einf¨ uhrung in die Funktionalanalysis. Vieweg, 1992. M. Reed, B. Simon: Methods of Modern Mathematical Physics. I: Functional Analysis. 2. Auflage, Academic Press, 1980. ◮ W. Rudin: Functional Analysis. 2. Auflage, McGraw-Hill, 1991. ◮ E. Zeidler: Applied Functional Analysis (2 Bde.). Springer, 1995.
Zur Fourieranalysis sind h¨ ochst empfehlenswert: ◮ G. B. Folland: Fourier Analysis and its Applications. Wadsworth and Brooks/Cole, 1992. ◮ T. W. K¨ orner: Fourier Analysis. Cambridge University Press, 1988.
Symbolverzeichnis
Allgemeines ∁A P(S) K f |S χB 1 {f ≥ r} {f ∈ B} supp(f ) DΦ(x) JΦ (x)
. Rm×n
B
Komplement der Menge A Potenzmenge von S R oder C (Kapitel V) Einschr¨ ankung der Funktion f auf die Menge S Indikatorfunktion der Menge B konstante Funktion t → 1 {t: f (t) ≥ r} {t: f (t) ∈ B} {t: f (t) = 0}, Tr¨ ager von f Ableitung von Φ bei x, Jacobimatrix det DΦ(x), Jacobideterminante euklidische Norm in Kapitel I bis IV, generische Norm in Kapitel V Raum der m × n Matrizen Norm einer Matrix B (Kapitel III)
Metrische und topologische R¨ aume Uε (t), Bε (t) offene bzw. abgeschlossene Kugel in einem metrischen Raum dist(x, A) Abstand des Punkts x von der Menge A: dist(x, A) = inf{d(x, a): a ∈ A} diam(M ) Durchmesser von M M Abschluss von M int M Inneres von M ∂M Rand von M MS Menge der Funktionen von S nach M Funktionentheorie Re z, Im z Real- und Imagin¨ arteil von z z¯ konjugiert komplexe Zahl Sp(γ) Spur einer Kurve γ
380 f (z) dz γ f (z) |dz| γ n(γ; z) res(f ; z)
∞ n=1 an ζ(z) π(x) pn
Symbolverzeichnis komplexes Kurvenintegral f ds, Kurvenintegral nach der Bogenl¨ ange γ Umlaufzahl Residuum unendliches Produkt Zetafunktion Anzahl der Primzahlen ≤ x n-te Primzahl
Maß- und Integrationstheorie F 1, F d Ring der Figuren Bo (Rd ) Borelsche σ-Algebra λd Lebesguemaß Diracmaß δx σ(E ) von E erzeugte σ-Algebra d(E ) von E erzeugtes Dynkinsystem f dµ abstraktes Lebesguesches Integral S f.¨ u. fast u ¨ berall Produkt-σ-Algebra A1 ⊗ A2 µ1 ⊗ µ2 Produktmaß ν≪µ absolutstetige Maße Funktionen- und Folgenr¨ aume C(T ), C b (T ), C0 (Rd ) R¨ aume stetiger Funktionen C2π Raum der 2π-periodischen stetigen Funktionen Raum der stetig differenzierbaren Funktionen C 1 [0, 1] Sobolevr¨ aume W 1 (Ω), H01 (Ω) Folgenr¨ aume (Beispiel V.1(d)) d, c0 , c, ℓ∞ ℓp ℓp -Folgenraum (Beispiel V.1(f)) A (G) Raum der analytischen Funktionen auf G L p -Raum L p (S), L p (µ) K (S) Raum der stetigen Funktionen mit kompaktem Tr¨ ager D(Ω) Raum der beliebig oft differenzierbaren Funktionen mit kompaktem Tr¨ ager Funktionalanalysis
f L p , f p
f Lp , f p
f ∞ BX SX lin A lin A U⊥ X∼ =Y X ′ , X ′′ iX
L p -Halbnorm von f Lp -Norm von f Supremumsnorm von f abgeschlossene Einheitskugel: {x: x ≤ 1} Einheitssph¨ are: {x: x = 1} lineare H¨ ulle von A abgeschlossene lineare H¨ ulle von A orthogonales Komplement isometrisch isomorphe Banachr¨ aume Dualraum und Bidualraum von X kanonische Einbettung eines Banachraums X in seinen Bidualraum
Symbolverzeichnis xn ⇀ x ker(T ), ran(T ) λ−T T∗ L(X, Y ) K(X, Y ) F (X, Y ) L(X), K(X), F (X)
381 schwache Konvergenz Kern und Bild eines Operators T λ Id − T adjungierter Operator Raum der linearen stetigen Operatoren von X nach Y Raum der kompakten Operatoren von X nach Y Raum der linearen stetigen Operatoren von X nach Y mit endlichdimensionalem Bild entsprechender Raum von Operatoren von X nach X
Namen- und Sachverzeichnis
abgeschlossene Menge 3, 7, 20 Abschluss einer Menge 3, 8, 20 absolutstetig 323 Abz¨ ahlbarkeitsaxiom 48 Alexandrov-Kompaktifizierung 53 analytische Fortsetzung 80 Anfangswertproblem 130 maximale L¨ osung 150 nicht eindeutig l¨ osbares 133 aperiodischer Grenzfall 137 Approximation, beste 321 aquivalente Norm 300, 301, 315 ¨ Argumentprinzip 103 asymptotisch stabil 180 Attraktor 181 a ¨ußeres Maß 220 Baireraum 39 Bairescher Kategoriensatz 42, 311 Banach, S. 6, 293 Banachraum 293 endlichdimensionaler 301, 303 reflexiver 348 Banachscher Fixpunktsatz 144 Besselsche Ungleichung 330 Bidualraum 348 Bildmaß 280 Borelmenge 212 Borel-σ-Algebra 212, 284 Brouwerscher Fixpunktsatz 122, 273, 277
Cantormenge 16, 243, 283 Cauchy-Riemannsche Differentialgleichungen 61 Cauchy-Schwarzsche Ungleichung 315 Cauchyfolge 5 Cauchysche Integralformel 89, 90 f¨ ur den Kreis 77, 80 Cauchyscher Integralsatz f¨ ur konvexe Gebiete 72 Homotopieversion 74 Cavalierisches Prinzip 257 Chebyshevsche Ungleichung 286 D’Alembertsches Reduktionsverfahren 201 DDT 193 Diagonalfolgenargument 25, 339, 354 dichte Menge 11 Differentialgleichung autonome 129 gew¨ ohnliche 129 lineare inhomogene 141 n-ter Ordnung 167 logistische 132 mit getrennten Ver¨ anderlichen 138 partielle 129 Differentialgleichungssystem 136 Hamiltonsches 205 lineares 153 inhomogenes 158
384 Differentiation unter dem Integral 245 Diracfolge 265 periodische 268 Diracmaß 215, 239 Dirichletkern 334 Dirichletreihe 127 Dreiecksungleichung 292 f¨ ur Integrale 64, 143 umgekehrte 300 Dualraum 306 separabler 347, 350 von c0 340 von C(K) 343 von Lp 341 von ℓp 340 von ℓ∞ 347 Dynkinsystem 224
Namen- und Sachverzeichnis
Eigenfunktion 352 Eigenwert eines Operators 352 Vielfachheit 364 einfach zusammenh¨ angend 73 einfacher Pol 96 Einheitsvektor 304 Ein-Punkt-Kompaktifizierung 53 endlich additiv 214 endliche Durchschnittseigenschaft 27 erstes Integral 190 Erwartungswert 280 Erzeuger einer σ-Algebra 212 ∩-stabiler 224 erzwungene Schwingung 174 Existenzsatz von Peano 149 von Picard-Lindel¨ of 146 Exponentialfunktion 58 einer Matrix 160
Fortsetzungssatz von Tietze 37 Fourierkoeffizient 332 Fourierreihe 177, 333, 338, 377 gleichm¨ aßige Konvergenz 333 L2 -Konvergenz 337 punktweise Konvergenz 336 Fouriertransformierte 285 Fr´echet, M. 3 Fredholmsche Alternative 361 Fredholmsche Integralgleichung 291 Fredholmscher Integraloperator 310 Friedrichssche Gl¨ attung 271 Fundamentalmatrix 156 Fundamentalsatz der Algebra 83, 105 Fundamentalsystem 156, 169 Funktion analytische 57 der 1. Baireschen Klasse 42 ganze 82 gleichm¨ aßig stetige 5 Greensche 198 halbstetige 51 harmonische 64 holomorphe 57 integrierbare 236 komplex differenzierbare 57 komplexe Wurzelfunktion 93 meromorphe 94 messbare 228 R-wertige 231 nirgends differenzierbare 45 rationale 58 stetige 4, 13, 21 Funktional stetiges 305 unstetiges 372
Faltung 265, 269 fast u ¨ berall 242 Fej´er, L. 333 Fej´erkern 335 Figur 210 Filterbasis 26 Fluss 178 folgenkompakter Raum 23 Fortsetzungssatz von Carath´eodory 222
Gammafunktion 127 Gδ -Menge 41 Gebiet 63 gerichtete Menge 19 Gleichgewichtspunkt 181 gleichgradig stetig 24 Gramschen Determinante 278 Gram-Schmidt-Verfahren 329 Greensche Funktion 198, 366 Gr¨ onwallsches Lemma 182
Namen- und Sachverzeichnis Haarfunktionen 375 Halbnorm 247, 292 halbnormierter Raum 292 Hamiltonsche Systeme 205 H¨ aufungspunkt 3 Hauptteil einer Laurentreihe 96 Hausdorff, F. 3 Hausdorffmaß 283 Hausdorffraum 17 Hilbertraum 316 H¨ oldersche Ungleichung 247, 251, 297 hom¨ oomorphe R¨ aume 16 Hom¨ oomorphismus 16, 22 Homotopie geschlossener Kurven 73 Identit¨ atssatz 80 Indikatorfunktion 18 Inhalt 214 Jordanscher 216 innerer Punkt 2, 8 Inneres einer Menge 3, 8 inneres Produkt 315 Integraloperator 309, 327, 355, 356 Fredholmscher 310 Volterrascher 377 Intervall d-dimensionales 210 irrational slope space 35 isometrisch isomorph 332 Isomorphismus 332 isometrischer 332 Jordansche Zerlegung 325 Jordanscher Inhalt 216 Karte 277 Kategorie von erster 41, 243 von zweiter 41 Kern eines Integraloperators 310 kompakter Raum 5, 21 vs. folgenkompakter Raum 29 konforme Abbildung 106 konjugierter Exponent 343 konvergente Folge 3, 17 konvergentes Netz 19 Konvergenz im p-ten Mittel 249
385 stochastische 286 unbedingte 330 Konvergenzradius 55 Konvergenzsatz von Weierstraß 85 konvexe Menge 71 Kuratowskische H¨ ullenoperation 48 Kurve 65 Kurvenintegral 65 Lagrangesche Identit¨ at 367 Laurentreihe 96 Lebesgue, H. 208 Lebesguemaß 226, 257 auf einer Untermannigfaltigkeit 279 Regularit¨ at 227 Translationsinvarianz 226, 283 Lebesguescher Konvergenzsatz 241, 245 Lebesguesches Integral 236, 239 Lebesgue-Stieltjes-Maß 228, 285 Lemma von Borel-Cantelli 282 Lemma von Fatou 240 Lemma von Urysohn 37 Lindel¨ of-Raum 263 Lipschitzbedingung 146 lokale 146 lokalkompakter Raum 52 Lotka-Volterra-Gleichungen 135, 190 L p -Halbnorm 247 Lp -Norm 299 L p -Raum 246 Vollst¨ andigkeit 249 Lp -Raum 299 L ∞ -Raum 251 L∞ -Raum 299 Lyapunovfunktion 187 Maß 215 absolutstetiges 323 außeres 220 ¨ komplexes 325 mit Dichte 239 regul¨ ares 227 signiertes 325 Maßraum 232 mathematisches Pendel 188 Phasenportr¨ at 190
386 maximale L¨ osung eines Anfangswertproblems 150 Maximumprinzip 83 messbare Menge 220 messbarer Raum 228 Metrik 2 metrischer Raum 2 kompakter 5 vollst¨ andiger 5 metrisierbarer Raum 7 Minkowskische Ungleichung 248, 298 Multiindex 271 Netz 19 konvergentes 19 universelles 26 Neumannsche Reihe 352 nirgends dichte Menge 41 Norm 5, 292 aquivalente 300, 315 ¨ feinere 308 gr¨ obere 308 normale Familie 86 normaler Raum 36, 37 normierter Raum 5, 292 nullhomotop 73 Nullmenge 242 offene Abbildung 312 offene Menge 2, 6 Operator adjungierter 325 beschr¨ ankter 306 endlichdimensionaler 355 kompakter 353, 364 endlichdimensionale Approximation 357 selbstadjungierter 326 stetiger 305 Operatornorm 306 Ordnung einer Nullstelle 102 eines Pols 96 orthogonal 320 Orthonormalbasis 328 Orthonormalsystem 328 Parallelogrammgleichung 317
Namen- und Sachverzeichnis Parsevalsche Gleichung 331 partielle Integration 374 partikul¨ are L¨ osung 142 Phasenportr¨ at 178 des mathematischen Pendels 190 Phasenraum 178 Pol 94 positiv definit 315 Potenzreihe 55, 59 Pr¨ amaß 215 Pr¨ ahilbertraum 316 Primzahlen 9 Primzahlsatz 106, 119 Prinzip der gleichm¨ aßigen Beschr¨ anktheit 311 Prinzip der guten Mengen 213 Produktmaß 256 Produkt-σ-Algebra 254 Produkttopologie 11, 28, 48 Projektionssatz 320 Pseudometrik 2 pseudometrischer Raum 2 Rademacherfunktionen 374 Rand einer Menge 3, 8 Randwertproblem 195 Sturm-Liouvillesches 196, 366 R¨ auber-Beute-Gleichungen 135, 190 reflexiv 348 relativ abgeschlossene Menge 12 relativ offene Menge 12 relativkompakt 21, 353 Relativtopologie 12 Residuensatz 97 Residuum 96 Resonanz 175 Resonanzkatastrophe 177 Richtungsfeld 134 Riemann, B. 107 Riemannsche Fl¨ ache 93 Riemannsche Vermutung 119 Riemannscher Abbildungssatz 106 Riemannscher Hebbarkeitssatz 95 Rieszscher Darstellungssatz 343, 376 Rieszsches Lemma 302 Ring 209
Namen- und Sachverzeichnis Satz von der dominierten Konvergenz 241, 245 Satz von der Gebietstreue 105 Satz von der monotonen Konvergenz 235 Satz von der offenen Abbildung 313 Satz von Arzel` a-Ascoli 24, 50 Baire 39, 42, 311 Banach-Steinhaus 311 Beppo Levi 235 Carath´eodory 222 Carleson 337 Casorati-Weierstraß 95 Egorov 246 Fej´er 335 Fischer-Riesz 332 Fr´echet-Riesz 322 Fubini 258, 259 Hahn-Banach 344 Hurwitz 126 Lax-Milgram 322 Lebesgue 241, 245 Liouville 82 Montel 86 Morera 85 Peano 149 Perron 289 Picard 95, 123 Picard-Lindel¨ of 146 Pythagoras 320 Radon-Nikod´ ym 323, 325 Rouch´e 103 Tietze-Urysohn 37 Tikhonov 29 Tonelli 258 schwache Ableitung 319 schwache Konvergenz 338, 350, 374 schwaches Kompaktheitsprinzip 339, 351 Schwarzsches Lemma 123 Schwingungsgleichung 136, 173 selbstadjungiert 326 separabler Raum 11, 303 sesquilinear 315 Shiftoperator 327 Sierpi´ nski-Raum 7
387 σ-additiv 215 σ-Algebra 209 Borelsche 212, 284 erzeugte 212 Spur- 214 σ-endlich 224 Singularit¨ at hebbare 94 wesentliche 94 Sinuskurve des Topologen 33 Skalarprodukt 315 Sobolevr¨ aume 319 Sorgenfrey-Ebene 48 Sorgenfrey-Gerade 48 Spaltensummennorm 372 Spektralsatz f¨ ur kompakte Operatoren 364, 365 Spektrum 352 Spur einer Kurve 65 Spur-σ-Algebra 214 Spurtopologie 12 stabil 180 asymptotisch 180 sternf¨ ormiges Gebiet 74 stochastische Konvergenz 286 Stufenfunktion 253 Sturm-Liouvillesches Eigenwertproblem 366 Sturm-Liouvillesches Randwertproblem 196, 366 Supremumsnorm 6, 293 wesentliche 251 T2 -Raum 36 T4 -Raum 36 Teilnetz 26 Topologie 3, 6 der gleichm¨ aßigen Konvergenz auf Kompakta 11 der punktweisen Konvergenz 11 diskrete 7 feinere 14 gr¨ obere 14 topologischer Raum 6 Bairescher 39 folgenkompakter 23 kompakter 5, 21, 27 lokalkompakter 52
388 topologischer Raum (Forts.) normaler 36, 37 wegzusammenh¨ angender 32 zusammenh¨ angender 30 Transformationsformel f¨ ur mehrdimensionale Integrale 260 Treppenfunktion 231 Dichtheit in Lp 252 kanonische Darstellung 232 trigonometrisches Polynom 337 Ultrafilter 27 Umgebung 2, 8 Umgebungsbasis 8 Umlaufintegral 65 Umlaufzahl 89 unendliches Produkt 108 Untermannigfaltigkeit 277 Variation der Konstanten 140, 157, 169 verallgemeinerte Ableitung 319 Verteilung einer Zufallsvariablen 280 Vervollst¨ andigung 348 Vielfachheit eines Eigenwerts 364
Namen- und Sachverzeichnis Vollst¨ andigkeit 5 Volterrascher Integraloperator 377 Wahrscheinlichkeitsraum 279 wegzusammenh¨ angender Raum 32 Weierstraßscher Approximationssatz 264 zweiter 337 Weierstraßscher Konvergenzsatz 85 Wellengleichung 369 Wirtinger-Ableitungen 121 Wronskideterminante 157, 201, 203 Wurzelfunktion komplexe 93 Youngsche Ungleichung 269 Zeilensummennorm 372 Zetafunktion 107 Nullstellen 112, 119 Zornsches Lemma 345 Zufallsvariable 279 zusammenh¨ angender Raum 30, 63 Zusammenhangskomponente 51 Zweig des Logarithmus 90