Ehrhard Behrends
Analysis Band 1
Ehrhard Behrends
Analysis Band 1 Ein Lernbuch für den sanften Wechsel von der Schule zur Uni 3., verbesserte Auflage
Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
Prof. Dr. Ehrhard Behrends Fachbereich Mathematik und Informatik Freie Universität Berlin Arnimallee 2 – 6 14195 Berlin E-Mail:
[email protected] Online-Service: www.math.fu-berlin.de/˜behrends/analysis
1. Auflage Februar 2001 1. Auflag e November 2001 1. Auflage April 2003 2., verbesserte Auflage April 2004 3., verbesserte Auflage Januar 2007 Alle Rechte vorbehalten © Friedr. Vieweg & Sohn Verlag | GWV Fachverlage GmbH, Wiesbaden 2007 Lektorat: Ulrike Schmickler-Hirzebruch | Petra Rußkamp Der Vieweg Verlag ist ein Unternehmen von Springer Science+Business Media. www.vieweg.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. In diesem Buch sind eine Reihe von Bildern von Mathematikern enthalten. Autor und Verlag gehen davon aus, dass die Rechte frei verfügbar sind. Umschlaggestaltung: Ulrike Weigel, www.CorporateDesignGroup.de Druck und buchbinderische Verarbeitung: MercedesDruck, Berlin Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier. Printed in Germany ISBN 978-3-8348-0085-5
Vorwort Zun¨ achst: Herzlichen Gl¨ uckwunsch zu Ihrem Entschluss, Mathematik zu studieren. Sie haben sich ein Fach ausgesucht, das Sie ein ganzes Leben lang faszinieren kann und das gleichzeitig interessante und gut bezahlte Berufsperspektiven er¨ offnet. Zu Beginn des Studiums stehen zwei Bereiche im Vordergrund, einmal die Analysis, in der es um Fragen im Zusammenhang mit Grenzwerten, Differentialund Integralrechnung geht, und dann die Lineare Algebra, in der Sie Grundlegendes u aume und die Verbindungen zur analytischen Geometrie ¨ ber Vektorr¨ und dem L¨ osen von Gleichungssystemen lernen. Beides zusammen ist so etwas wie das Alphabet, das alle kennen m¨ ussen, die sich ernsthaft mit Mathematik auseinander setzen wollen. Im vorliegenden Buch geht es um die Analysis, es ist aus einem Skript entstanden, das schon mehrfach die Grundlage f¨ ur Vorlesungen an der Freien Universit¨ at Berlin gewesen ist. Bei der Ausarbeitung spielte die engagierte Mitwirkung einer Gruppe von Studierenden eine ganz wesentliche Rolle. Durch sie wurden zahlreiche Anregungen zus¨ atzlich aufgenommen, damit das im Unterti¨ tel anvisierte Ziel, der sanfte Ubergang“, auch wirklich erreicht wird. Auf diese ” Weise hat das Buch so etwas wie ein Studentenzertifikat. Die ausf¨ uhrlichen Erl¨ auterungen betreffen nicht nur die Analysis, es werden auch Probleme behandelt, die sich ganz allgemein rund um das Mathematikstudium ergeben: Wie schreibt man einen Beweis auf? Was bedeuten die logischen Zeichen? Wie wird Mathematik angewendet?
Viel Erfolg bei Ihrem Studium! Ehrhard Behrends, Berlin (Fr¨ uhjahr 2003)
Vorwort zur zweiten und dritten Auflage Nach erfreulich kurzer Zeit waren die erste und zweite Auflage ausverkauft. In der nun vorliegenden dritten Auflage sind nur einige Tippfehler verbessert ¨ worden, auf die aufmerksame Leser hingewiesen haben. Inhaltliche Anderungen hat es nicht gegeben. Ehrhard Behrends, Berlin (Januar 2007)
Einleitung Es geht nicht anders, lieber T¨ orleß, die Mathematik ist eine ganze Welt f¨ ur sich, und man muß reichlich lange in ihr gelebt haben, um alles zu f¨ uhlen, was in ihr notwendig ist. (aus: Die Verwirrungen des Z¨ oglings T¨ orleß“ von Robert Musil.) ”
Wenn jemand wissen will, wie ein Radio funktioniert, so kann er sich in einem kleinen Vortrag dar¨ uber informieren lassen, wie man Transistoren, Kondensatoren usw. zusammenl¨ oten muss, um die Radiosignale des Senders in h¨orbare Musik zu verwandeln. Auf die Anschlussfrage Wie funktioniert ein Transistor?“ ” m¨ usste ein Kurzreferat zur Festk¨ orperphysik folgen, schnell ist man bei der Quantenmechanik und den Grenzen des gegenw¨ artigen Wissens im subatomaren Bereich. Stets l¨ asst sich eine weitere Warum?“-Frage stellen, ein Ende des ” Weiterfragens gibt es nicht. In der Mathematik ist es ¨ ahnlich; um trotzdem mit der Arbeit anfangen zu k¨ onnen, geht man von Axiomen aus. Ein Axiom ist ein Ausgangspunkt, der nicht mehr hinterfragt wird; die Idee, auf diese Weise ein belastbares Fundament der Mathematik zu schaffen, wurde erstmals vor u ¨ber 2000 Jahren von Euklid verwirklicht. Bei ihm ging es um Geometrie, in diesem Buch werden Zahlen die Hauptrolle spielen. Ausgangspunkt der Analysis wird eine axiomatische Festlegung der Eigenschaften der reellen Zahlen sein, das wollen wir in Kapitel 1 in Angriff nehmen. Am Ende dieses Kapitels wird klar sein, was wir unter der Menge der re” ellen Zahlen“ verstehen wollen. Dazu muss man einige Vokabeln“ lernen, die ” ausf¨ uhrlich motiviert und erl¨ autert werden: Menge, Addition, . . . Außerdem werden schon die ersten Folgerungen aus den Axiomen gezogen, Sie lernen die ersten S¨atze und Beweise kennen. Dazu ist ein Exkurs in Logik notwendig; von dem Wort sollte sich aber niemand erschrecken lassen, denn es ist nichts weiter er¨ forderlich als die Ubertragung des gesunden Menschenverstands in den Bereich der Mathematik. In Kapitel 2 besch¨aftigen wir uns dann ausf¨ uhrlich mit dem Grenzwertbegriff. Der ist fundamental f¨ ur die gesamte Analysis, wirklich alles, was folgt, baut uck, ihn in einer vergleichsweise darauf auf. Sie als Anf¨anger1) haben das große Gl¨ gut verst¨ andlichen Form kennen lernen zu k¨ onnen. Das war nicht immer so, bis zum 19. Jahrhundert war man auf eine mehr oder weniger gut funktionierende Intuition angewiesen, um mit den unendlich kleinen Gr¨oßen“ sinnvoll arbeiten ” zu k¨ onnen. Rund um den Grenzwertbegriff wird von einigen damit zusammenh¨ angenden Begriffen die Rede sein, wie Folgen, Reihen, Cauchy-Folgen usw. Kapitel 3 ist den Themen Abstand“ und Stetigkeit“ gewidmet. Oft ist es ” ” n¨ amlich so, dass man mit Zahlen oder Funktionen arbeiten muss, die man nur ungef¨ahr kennt. Statt mit der richtigen“ Zahl/Funktion muss man mit einer ” 1) Nat¨ urlich sind Anf¨ angerinnen ebenfalls gemeint. Diese Bemerkung gilt sinngem¨ aß auch f¨ ur die vielen anderen Stellen dieses Buches, an denen Sie pers¨ onlich angesprochen werden.
viii √ arbeiten, die in der N¨ ahe liegt, z.B. statt mit 2 mit der Approximation 1.414. Hat das zu große Fehler f¨ ur das Endresultat zur Folge? Der geeignete Rahmen f¨ ur die Behandlung dieser Fragen ist der Begriff des metrischen Raumes, damit wird in Kapitel 3 begonnen. Wir besch¨aftigen uns ¨ zun¨ achst mit der Ubertragung des Konvergenzbegriffs und mit offenen und abgeschlossenen Mengen. Dann studieren wir Kompaktheit . Das ist ein f¨ ur Anf¨anger etwas schwieriger zug¨ anglicher Begriff, Motivation und Aufbau werden dementsprechend besonders ausf¨ uhrlich sein. Und am Ende des Kapitels behandeln wir stetige Funktionen“, das sind Ab” bildungen, die nahe beieinander liegende Objekte auf ebenfalls nahe beieinander liegende abbilden. Bei dieser Gelegenheit wird auch etwas u ¨ber mathematische Modelle gesagt werden: Wie wird Mathematik in der richtigen“ Welt angewen” det? Kapitel 4 kn¨ upft wieder an ein Thema an, das Ihnen aus der Schule vertraut ist, es geht um die Differentiation. Das Kapitel beginnt mit der Formalisierung ur eine Funktion f bedeutet, dass sie in der Idee, dass differenzierbar bei x0“ f¨ ” ” der N¨ ahe von x0“ durch ihre Tangente ersetzt werden darf. Es handelt sich um eine Eigenschaft mit weit reichenden Konsequenzen, insbesondere werden wir die Mittelwerts¨atze kennen lernen. Dann ist es Zeit, sich um ein fast unersch¨opfliches Reservoir konkreter Funktionen zu k¨ ummern, um Potenzreihen. Das sind Funktionen, die sich aus den einfachsten Bausteinen f¨ ur das Arbeiten mit Zahlen, also aus +“, ·“ und ” ” Grenzwerten aufbauen lassen. Potenzreihen werden gleich angewendet, um einige spezielle, f¨ ur konkrete Rechnungen wichtige Funktionen – Exponentialfunktion, Logarithmus und trigonometrische Funktionen – kennen zu lernen. Damit ist dann der Weg frei, um einige einfache Typen von Differentialgleichungen zu l¨ osen. Differentialgleichungen sind deswegen wichtig, weil sie am Ende vieler mathematischer Modellierungen stehen, der Grund ist die Tatsache, dass viele Ph¨ anomene allein durch Nahwirkungs-Einfl¨ usse beschrieben werden k¨onnen. Außerdem wird gezeigt, wie sich aus der Existenz beliebiger Wurzeln im Bereich der komplexen Zahlen der Fundamentalsatz der Algebra mit analytischen Mitteln herleiten l¨ asst. Ich m¨ ochte Sie noch auf einige Besonderheiten aufmerksam machen, die Ihnen das Durcharbeiten des Buches erleichtern sollen: ¨ • Am Ende jedes Kapitels finden Sie Ubungsaufgaben. In der Mathematik ist es n¨ amlich wie beim Geige spielen, Ski fahren, Schn¨ ursenkel binden: Aus B¨ uchern allein kann man es nicht lernen, man muss es selber gemacht haben. Mit hoher Wahrscheinlichkeit klappt es nicht gleich beim ersten Mal perfekt. Deswegen haben wir f¨ ur Sie einige Musterl¨osungen auf der Internetseite http://www.math.fu-berlin.de/~behrends/analysis ins Netz gestellt. • Jedes Kapitel schließt mit einer Reihe von Verst¨andnisfragen. Was sollten Sie nach dem Durcharbeiten kennen, was sollten Sie k¨onnen? Antworten sind nat¨ urlich auch vorbereitet, die stehen ebenfalls im Internet.
ix • Es gibt am Anfang eines Mathematik-Studiums ziemlich viele neue Begriffe, die man verinnerlichen muss. Deswegen ist versucht worden, das schnelle Finden von Informationen durch Ausnutzen der Randspalten zu erleichtern. Sie finden Stichpunkte zum behandelten Stoff sowie ? (das wird gleich nachstehend erl¨ autert). • Um Ihnen gleich beim Lesen aktives Mitdenken zu erm¨oglichen, gibt es im Text zahlreiche Fragen an die Leser. Die sollten Sie ohne große Schwierigkeiten beantworten k¨ onnen, der Schwierigkeitsgrad liegt deutlich unter ¨ dem von Ubungsaufgaben. Sie sind am Rand durch ein ? gekennzeichnet, die L¨ osungen sind im Anhang zusammengestellt. • Ist immer noch nicht alles klar? Auf der Internetseite gibt es auch die M¨ oglichkeit, mit uns in Kontakt zu kommen: f¨ ur Fragen, f¨ ur Kritik (Lob ist auch nicht verboten), f¨ ur Vorschl¨ age usw. • Es wird auch ber¨ ucksichtigt werden, dass Computer heute eine wesentliche Rolle spielen. Dazu gibt es zwei Anh¨ange. Im ersten finden Sie einige kurze Informationen u ¨ ber Computeralgebra-Systeme, das sind – teilweise sehr komplexe – Programme, durch die man sich analytische Sachverhalte veranschaulichen lassen kann und die einem z.B. das Differenzieren komplizierter Funktionen oder die Berechnung von Integralen abnehmen k¨ onnen. In einem zweiten Anhang wird dargestellt, warum das Internet f¨ ur Mathematiker ein unverzichtbares Arbeitshilfsmittel ist, Sie sollten es so bald wie m¨ oglich nutzen. Wie schon erw¨ ahnt, sind in dieses Buch die Erfahrungen einiger Studierender beim Lernen der Analysis eingegangen. Martin G¨otze, Sonja Lange, Timm Rometzki und Tina Scherer haben sie bei mir von Anfang an geh¨ort, J¨org Beyer und Vivian Rometzki haben ihre ersten Erfahrungen mit der Analysis bei anderen Dozenten gemacht. Mit allen gab es eine intensive und sehr produktive Zusammenarbeit, f¨ ur die ich mich an dieser Stelle sehr herzlich bedanken m¨ ochte. Ehrhard Behrends, Berlin (Fr¨ uhjahr 2003) P.S.: Das gleiche Konzept wie im vorliegenden Buch soll in Band 2 der Analysis verwirklicht werden. Inhaltlich wird es dann um Funktionenr¨aume, das Integral und um die Differentiation von Funktionen in mehreren Variablen gehen.
?
Inhaltsverzeichnis 1 Die Menge R der reellen Zahlen 1.1 Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . .
1 3
Die Strategie: Wie wird das Axiomensystem f¨ ur R hergeleitet?
1.2
Mengen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
Mengen, Mengenoperationen, Abbildungen.
1.3
Algebraische Strukturen . . . . . . . . . . . . . . . . . . . . . . .
16
Innere Kompositionen und ihre Eigenschaften, K¨ orper, logischer Exkurs, K¨ orpereigenschaften.
1.4
Angeordnete K¨ orper . . . . . . . . . . . . . . . . . . . . . . . . .
33
Positivbereich, angeordnete K¨ orper, Gegenbeispiele.
1.5
Nat¨ urliche Zahlen, vollst¨ andige Induktion . . . . . . . . . . . . .
37
Definition von N , Induktion, Musterbeweise, Eigenschaften von N .
1.6
Die ganzen und die rationalen Zahlen
. . . . . . . . . . . . . . .
48
Das Archimedesaxiom . . . . . . . . . . . . . . . . . . . . . . . .
52
Z und Q , Dichtheitssatz.
1.7
Archimedesaxiom und Folgerungen.
1.8
Vollst¨ andigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . .
56
Dedekindsche Schnitte, Schnittzahlen, Vollst¨ andigkeit, das Axiomensystem f¨ ur R .
1.9
Von R zu C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
Der K¨ orper C , Eigenschaften.
1.10 Wie groß ist R ? . . . . . . . . . . . . . . . . . . . . . . . . . . . .
63
Erg¨ anzungen zur Mengenlehre, Mengen mit gleicher Kardinalzahl, abz¨ ahlbar und u ahlbar, die Cantorschen Diagonalverfahren. ¨berabz¨
1.11 Erg¨ anzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
Peano-Axiome, der konstruktive“ Aufbau der reellen Zahlen, Gleichheit in der ” Mathematik, Eindeutigkeit von R , Sicherheit der Grundlagen.
1.12 Verst¨ andnisfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . ¨ 1.13 Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . .
77 81
INHALTSVERZEICHNIS
xii
2 Folgen und Reihen 87 2.1 Folgen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 Folgen, Teilfolgen, Umordnungen.
2.2
Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
Betrag in R , Existenz der Wurzel, Betrag in C , Nullfolge, Konvergenz, Konvergenzbeweise.
2.3
Cauchy-Folgen und Vollst¨andigkeit . . . . . . . . . . . . . . . . . 120 Cauchy-Folgen, Zusammenhang zur Konvergenz, Ordnungsrelationen, Supremum und Infimum, ¨ aquivalente Versionen der Vollst¨ andigkeit.
2.4
Unendliche Reihen . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Reihen, Konvergenzkriterien, absolut konvergente Reihen.
2.5
Erg¨ anzungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Dezimalentwicklung, ungeordnete Summation, Folgenr¨ aume.
2.6 2.7
Verst¨ andnisfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 ¨ Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
3 Metrische R¨ aume und Stetigkeit 167 3.1 Metrische R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 Metriken und Normen, Konvergenz, Kugeln, offene und abgeschlossene Teilmengen, Abschluss und Inneres, dichte Teilmengen.
3.2
Kompaktheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Kompaktheit, Kompaktheitskriterien, Charakterisierung der kompakten Teilmengen endlich-dimensionaler R¨ aume, Zweipunktkompaktifizierung von R .
3.3
Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 Stetige Funktionen, Lipschitzabbildungen, Permanenzeigenschaften, Charakterisierung, Zwischenwertsatz, Satz vom Maximum, gleichm¨ aßige Stetigkeit.
3.4 3.5
Verst¨ andnisfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . 222 ¨ Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
4 Differentiation (eine Ver¨ anderliche) 229 4.1 Differenzierbare Funktionen . . . . . . . . . . . . . . . . . . . . . 230 Stetige Erg¨ anzung, differenzierbare Funktionen, Ableitungsregeln.
4.2
Mittelwerts¨ atze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 Satz von Rolle, Mittelwerts¨ atze, Regeln von l’Hˆ opital.
4.3
Taylorpolynome . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 Taylor-Polynome, Restglied, Restgliedformel, Extremwertaufgaben.
4.4
Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 Potenzreihen, Konvergenzradius, Limes superior und Limes inferior, Formel f¨ ur den Konvergenzradius, Differenzierbarkeit von Potenzreihen, entwickelbare Funktionen, das Gegenbeispiel von Cauchy.
4.5
Spezielle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . 293 Zwei Differentialgleichungen zur Motivation, Exponentialfunktion, Logarithmus, allgemeine Potenz, Sinus und Cosinus, spezielle Funktionen im Komplexen, Polardarstellung.
4.6
Fundamentalsatz, Differentialgleichungen
. . . . . . . . . . . . . 320
Fundamentalsatz, L¨ osung spezieller Typen von Differentialgleichungen.
4.7 4.8
Verst¨ andnisfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 ¨ Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
INHALTSVERZEICHNIS Anh¨ ange Computeralgebra . . . . . . . Mathematik und neue Medien Die Internetseite zum Buch . Griechische Symbole . . . . . L¨osungen zu den ?“ . . . . . ” Register . . . . . . . . . . . .
xiii
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
341 342 344 345 346 347 355
xiv
Inhalt von Band 2 5. Funktionenr¨ aume 5.1 Funktionenr¨ aume 5.2 Punktweise und gleichm¨ aßige Konvergenz 5.3 Der Raum CK 5.4 Folgerungen aus der Vollst¨ andigkeit 6. Integration 6.1 Definition des Integrals 6.2 Die Berechnung von Integralen 6.3 Erweiterungen der Integraldefinition 6.4 Parameterabh¨ angige Ingrale 6.5 Lp -Normen 6.6 exp(x2 ) hat keine einfache Stammfunktion 7. Anwendungen der Integralrechnung 7.1 Faltungen und der Satz von Weierstraß 7.2 Kurvendiskussion 7.3 Sinus und Cosinus: der geometrische Ansatz 7.4 Laplacetransformation 7.5 Zahlentheorie 7.6 Existenzsatz f¨ ur Differentialgleichungen 8. Differentialrechnung im R n 8.1 Vorbereitungen 8.2 Differenzierbarkeit, partielle Ableitungen 8.3 Der Satz vom Taylor im Rn 8.4 Extremwertaufgaben, Konvexit¨at 8.5 Vektorwertige differenzierbare Abbildungen 8.6 Der Satz von der inversen Abbildung 8.7 Koordinatentransfomationen 8.8 Der Satz u ¨ ber implizite Funktionen 8.9 Extremwerte mit Nebenbedingungen Mathematische Ausblicke Lebesgue-Integral Fourierreihen Mehrfachintegrale Anh¨ ange Englisch f¨ ur Mathematiker Literaturtipps L¨ osungen zu den ?“ ” Register
INHALTSVERZEICHNIS
Kapitel 1
Die Menge R der reellen Zahlen Nach Vorwort und Einleitung geht es nun richtig los. Vielleicht haben Sie aufgrund Ihrer Schulerfahrung schon konkrete Erwartungen und sind ganz gespannt darauf, nun endlich ganz komplizierte Funktionen zu differenzieren und zu integrieren. Das werden wir nat¨ urlich auch tun, aber vorl¨ aufig geht es erst einmal darum, Sie mit den reellen Zahlen vertraut zu machen. Das h¨ ort sich ganz harmlos an, aber da bei dieser Gelegenheit auch viele grundlegende Begriffe und Techniken erkl¨ art werden sollen und Ihr Einstieg in die Welt der Mathematik besonders sanft“ sein soll, wird dies ein recht umfangreiches Kapitel. ” Die Struktur ist wie folgt: • In Abschnitt 1.1 wird die Strategie erkl¨art, nach der wir die Axiome f¨ ur die reellen Zahlen nach und nach entwickeln werden. Die Zahlen aus der Schulerfahrung, die wir die naiven“ Zahlen nennen werden, bilden unser ” Anschauungsmaterial. • Als Erstes geht es dann in Abschnitt 1.2 um Mengenlehre. Eigentlich ist es nur erforderlich, sich u ¨ ber einige Schreibweisen und einfache Konstruktionen zu verst¨andigen: Wie redet man u ¨ ber Mengen, was ist der Durchschnitt von zwei Mengen, . . . ? Zus¨atzlich wird aber auch die viel grunds¨ atzlichere Frage diskutiert, warum die Begr¨ undung einer mathematischen Theorie in der Mengenlehre sinnvoll ist. • In Abschnitt 1.3 sollen Sie verstehen, was es eigentlich genau mit der Addition und der Multiplikation auf sich hat. Da Sie in diesem Abschnitt auch Ihren ersten richtigen Beweis kennen lernen werden, ist ein ausf¨ uhrlicher Exkurs u ¨ber Logik und Beweise eingeplant. • Je zwei Zahlen kann man auch miteinander vergleichen, welche ist gr¨ oßer? Die zugeh¨ orige Theorie der Ordnung“ wird in Abschnitt 1.4 besprochen. ”
2
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN • Dann sollen in Abschnitt 1.5 die nat¨ urlichen Zahlen innerhalb der reellen Zahlen eingef¨ uhrt werden, also die Zahlen 1, 1+1, 1+1+1, . . . Da man auf den P¨ unktchen aber keine Theorie aufbauen kann, wird die Definition etwas komplizierter aussehen. Außerdem wird die vollst¨andige Induktion behandelt. Das ist eine der wichtigsten Techniken der Mathematik u ¨berhaupt, deshalb wird sehr viel dazu gesagt werden. • Von den nat¨ urlichen zu den ganzen Zahlen und den rationalen Zahlen ist es nur ein kleiner Schritt, den machen wir in Abschnitt 1.6. Dort wird auch nachgewiesen, dass wir – leider – mit den rationalen Zahlen nicht auskommen werden. Es gibt zum Beispiel keine rationale Zahl, deren Quadrat exakt 2 ist. • Es wird immer wieder eine wichtige Rolle spielen, dass es beliebig große“ ” nat¨ urliche Zahlen gibt. Was das genau heißt, steht in Abschnitt 1.7. • Nun fehlt nur noch wenig, um das Axiomensystem f¨ ur die reellen Zahlen formulieren zu k¨onnen. Wir m¨ ussen uns noch um die Tatsache k¨ ummern, dass es keine L¨ocher“ geben soll. Das wird dann Vollst¨andigkeit genannt, ” alles dazu f¨ ur uns Wissenswerte steht in Abschnitt 1.8. ¨ • Uber reelle Zahlen ist damit eigentlich alles gesagt. Wir ben¨ otigen aber sp¨ater auch komplexe Zahlen, und die kann man sich ziemlich leicht aus den reellen konstruieren. Sp¨atestens nach dem Lesen von Abschnitt 1.9 werden Sie wissen, was (1 + 2i)(3 − 9i) bedeutet und wie man es ausrechnen kann. • Dann besch¨aftigen wir uns in Abschnitt 1.10 mit der Gr¨oße von Zahlen” mengen“, unter anderem k¨onnen wir pr¨ azise formulieren und beweisen, dass es genau so viele rationale Zahlen wie nat¨ urliche Zahlen gibt und dass die Menge der reellen Zahlen viel gr¨oßer“ als die Menge der rationalen ” Zahlen ist (da lernen wir die ber¨ uhmten Cantorschen Diagonalverfahren kennen). Das wird es u ¨brigens erforderlich machen, noch ein bisschen mehr u ¨ ber Mengenlehre zu wissen, als in Abschnitt 1.2 behandelt wurde, es wird also einige Erg¨anzungen zur Mengenlehre geben. • Es folgt dann noch ein Abschnitt, den Sie beim ersten Lesen ruhig u ¨ berspringen k¨onnen: In Abschnitt 1.11 skizzieren wir eine alternative M¨ oglichkeit, die reellen Zahlen einzuf¨ uhren (den so genannten konstruktiven Weg), wir zeigen, dass R durch das Axiomensystem eindeutig festgelegt ist, und schließlich wird noch kurz u ¨ ber die Frage philosophiert, wie sicher das so gelegte Fundament denn nun ist.
1.1. VORBEMERKUNGEN
1.1
3
Vorbemerkungen
Wovon wir ausgehen Wir werden nichts voraussetzen, um die Analysis streng zu entwickeln: Im Prinzip m¨ ussten Sie den nachstehenden Ausf¨ uhrungen auch dann folgen k¨ onnen, wenn Sie keine mathematischen Vorkenntnisse haben. Das ist aber nur die halbe Wahrheit, denn in diesem Fall w¨ urden Sie bald Motivationsprobleme haben; viele der neuen Begriffe m¨ ussten recht gek¨ unstelt wirken. Daher wird gelegentlich an einige Ihrer bisherigen mathematischen Erfahrungen zu erinnern sein. Denken Sie zum Beispiel an Ihre Kenntnisse u ¨ ber Zahlen. Schon Vorschulkinder wissen“, dass 3 + 4 = 7 ist, auch wenn sie nicht pr¨ azisieren k¨ onnten, ” was die einzelnen Symbole 3“, +“ usw. denn eigentlich sind“. Die auf diesem ” ” ” mathematischen Niveau auftretenden Zahlen 1, 2, 3, usw. werden die nat¨ urlichen ater werZahlen genannt, ihre Gesamtheit werden wir mit N naiv bezeichnen. (Sp¨ den wir daf¨ ur das Symbol N verwenden1) . Hier und in den folgenden F¨ allen soll der Zusatz naiv“ daran erinnern, dass wir uns erst im Vorfeld pr¨ aziser Be” griffsbildungen bewegen.) Nimmt man zu N naiv die Null und −1, −2, −3, usw. hinzu, so nennt man diesen erweiterten Bereich die ganzen Zahlen (hier: Z naiv ). Quotienten ganzer Zahlen (mit von Null verschiedenem Nenner) werden rationale Zahlen genannt, die Gesamtheit derartiger Zahlen wird vorl¨ aufig mit Q naiv bezeichnet. Q naiv ist gen¨ ugend umfangreich, um alle in praktischen Problemen auftretenden Rechnungen darin abwickeln zu k¨onnen. Trotzdem wurde schon fr¨ uh in der Entwicklung der Mathematik (n¨amlich bei der Behandlung geometrischer Probleme durch griechische Mathematiker) festgestellt, dass es Zahlen gibt“, die nicht rational sind. Bekanntestes Beispiel: die L¨ ange der Diagonalen ” des Einheitsquadrates. In der Schule hilft man sich h¨aufig dadurch, dass man zu den rationalen Zahlen – die man sich als abbrechende oder periodische Dezimalbr¨ uche vorstellen kann – alle m¨ oglichen (also auch die nicht abbrechenden) Dezimalzahlen hinzunimmt. Der so erweiterte Bereich, die reellen Zahlen, wird bis auf weiteres R naiv genannt werden; mitunter werden wir uns R naiv als Zahlengerade vorstellen: ···
Rnaiv : · · · 0 Bild 1.1: R naiv als Zahlengerade ¨ Noch einmal zur Ubersicht:
1) In diesem Buch folgen wir der Konvention, dass die erste nat¨ urliche Zahl die Zahl 1 ist. F¨ ur andere Autoren – nach meiner Einsch¨ atzung eine Minderheit – ist die 0 die erste nat¨ urliche Zahl.
Planung
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
4
N naiv (nat¨ urliche Zahlen) : 1, 2, 3, 4, . . . Z naiv (ganze Zahlen)
: 0, 1, −1, 2, −2, . . .
uche ganzer Zahlen mit von Null Q naiv (rationale Zahlen) : alle Br¨ verschiedenem Nenner. R naiv (reelle Zahlen)
: alle Dezimalzahlen.
Soviel zu Zahlen. (Falls Sie in der Schule schon komplexe Zahlen kennen gelernt haben: Die sparen wir uns f¨ ur sp¨ ater auf.) Sie werden außerdem an einer Reihe von Beispielen – etwa aus Geometrie, Technik, Natur- und Wirtschaftswissenschaften – gesehen haben, dass mit Hilfe mathematischer Methoden nichtmathematische Probleme behandelt werden k¨ onnen und dass dabei nicht nur Zahlen auftreten, sondern kompliziertere, mit Zahlen zusammenh¨ angende Begriffsbildungen: Funktionen, Ableitungen von Funktionen, Integrale, . . . All das werden wir im Laufe der Zeit kennen lernen, auf Einzelheiten braucht hier noch nicht eingegangen zu werden. Im Laufe des Aufbaus der Analysis wird es sp¨ater reichlich Gelegenheit dazu geben. Was wir wollen Hauptziel der Analysis wird es sein, die im vorherigen Abschnitt genannten Zahlen“, Funktionen“ usw. in einem mathematisch pr¨ azisen Rahmen zu ” ” behandeln. Die Kenntnis der zu besprechenden Ergebnisse bildet eine notwendige Voraussetzung f¨ ur praktisch alle Anwendungen von Mathematik sowie f¨ ur weiterf¨ uhrende Vorlesungen. Es ist plausibel, dass eine systematische Untersuchung mit den Zahlen selbst beginnen muss. Nahziel wird also sein, das naiv“ in N naiv , Z naiv , Q naiv und ” R naiv loszuwerden. Dabei wird sich zeigen, dass es reicht, den Schritt von R naiv nach R zu bew¨altigen; alles andere ist dann einfach. Unser Programm f¨ ur den Rest von Kapitel 1 heißt folglich:
Von R naiv zu R .“ ” Was wir erwarten k¨ onnen: die axiomatische Methode Axiome
Wirklich alles, was man heute u ¨ ber Zahlen weiß, ist aus den dann formulierten Axiomen ableitbar. Ich m¨ochte jetzt schon betonen, dass es dabei – genau genommen – immer nur um Folgerungen geht. Wenn Sie z.B. die Aussage F¨ ur jede reelle Zahl x ist 1 + x2 gr¨ oßer als Null.“ ” lesen, so heißt das eigentlich: Unter der Annahme der Axiome f¨ ur reelle Zahlen gilt: ” oßer als Null.“ F¨ ur jede reelle Zahl x ist 1 + x2 gr¨
1.1. VORBEMERKUNGEN
5
So kompliziert dr¨ uckt man es meist nicht aus, aber es ist f¨ ur Sie wichtig zu wissen, dass Mathematik nicht untersucht, was ist, sondern was sich folgern l¨asst. Hier gibt es noch weitere Verst¨ andnishilfen zum Thema Axiome“, das ” vielen Anf¨ angern Probleme bereitet. Sie k¨ onnen sie beim ersten Lesen u berspringen. ¨ Zun¨ achst ist klar, dass das Voranstellen eines Axiomensystems nicht bedeuten kann, dass das fragliche Objekt in irgendeinem materiellen Sinn existiert, so wie etwa das Urmeter bei Paris aufbewahrt wird. Durch die axiomatische Methode wird aber sichergestellt, dass jedesmal dann, wenn in einer konkreten Situation alle Axiome erf¨ ullt sind, s¨ amtliche Resultate der Theorie sofort zur Verf¨ ugung stehen. (Eine vergleichbare Erfahrung haben Sie schon zu Beginn Ihrer Schulzeit gemacht: Wenn Sie einmal ver” standen“ hatten, dass 3 + 4 = 7 ist, dann war auch klar, was 3 Tische und ¨ ¨ 4 Tische, 3 Apfel und 4 Apfel usw. sind.) Das alles sollten Sie wissen, wenn Sie hier in der Analysis oder in anderen Vorlesungen Axiomensysteme kennen lernen. Dass die Objekte der Mathematik in Wirklichkeit nicht existieren, ist allerdings nur so etwas wie die offizielle Wahrheit. Tats¨ achlich ist es u ¨blich und legitim, sich die Objekte konkret vorzustellen und quasi so zu tun, als ob es sie wirklich geben w¨ urde. Mathematiker reden u ¨ ber 3, π und die Sinusfunktion genau so wie u allig gerade nicht anwesend ist. ¨ ber einen guten Bekannten, der nur zuf¨ Als weitere Verdeutlichung m¨ ochte ich an das Schachspiel erinnern, Sie k¨ onnen aber auch jedes andere Spiel daf¨ ur einsetzen. Die Spielregeln entsprechen den Axiomen, und aus diesen Axiomen des Schachspiels“ lassen ” sich Folgerungen ziehen. Schachspieler wissen: Weiß kann gewinnen, wenn Schwarz nur noch den K¨ onig, ” Weiß aber noch den K¨ onig, die Dame und beide T¨ urme hat“ ist eine richtige Aussage. Hier ist nicht so wichtig, dass eine Gewinnstrategie dann nicht schwer zu finden ist, sondern dass es eigentlich heißen m¨ usste: Unter der Voraussetzung der ” Schachregeln ist richtig, dass . . .“. Das Ergebnis ist unabh¨ angig von konkret existierenden Schachbrettern, f¨ ur das Finden eines L¨ osungswegs kann es aber hilfreich sein, sich eins vorzustellen. Am Schachspiel lassen sich auch andere Aspekte von Axiomensystemen ¨ verdeutlichen. Zum Beispiel: Eine kleine Anderung der Spielregeln (Axioaufen (Theorien) f¨ uhren. Oder: Es me) kann zu v¨ ollig anderen Spielverl¨ gibt unter den richtigen Aussagen manche, die einfach, und andere, die wesentlich schwieriger zu beweisen sind. F¨ ur manche werden wir vielleicht nie erfahren, ob sie wahr sind, zum Beispiel Wer das Spiel er¨ offnet, kann ” gewinnen“.
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
6 Was zu tun ist
In der Einleitung wurde schon betont, dass jede mathematische Theorie auf eine axiomatische Grundlage gestellt werden muss. Aber was sind denn nun die richtigen“ Axiome f¨ ur R ? Das Problem soll durch die folgende Strategie gel¨ ost ” werden: Wir werden uns von unserer Erfahrung mit reellen Zahlen – also von R naiv – leiten lassen und so lange von uns als wichtig eingesch¨ atzte Eigenschaften zu Axiomen bef¨ ordern, bis durch das dann gefundene Axiomensystem die reellen Zahlen mit der von uns gew¨ unschten Struktur festgelegt sind. Dieses Verfahren hat klassische Vorbilder, Euklid hat es genauso gemacht, als er vor u ur die Geometrie zusammengestellt hat. ¨ ber 2000 Jahren die Axiome f¨ Bei ihm ging es um die Begriffe Punkt“ und Gerade“, bei uns um Zahl“, ” ” ” Summe zweier Zahlen“ usw. ” Wie bei jeder axiomatisch zu begr¨ undenden Theorie ist die Frage zu entscheiden, welche der gew¨ unschten Eigenschaften denn nun Axiome werden sollen. Da ist man in der Geschichte der Mathematik pragmatisch vorgegangen: Vieles wird ausprobiert (besonders, wenn eine Theorie noch jung ist), nach einiger Zeit kristallisiert sich ein besonders g¨ unstiger Zugang heraus, der von der Mehrheit der Mathematikergemeinde als optimal angesehen wird2) . Man kann es in fast allen F¨allen auch ganz anders machen, letztlich entscheiden recht schwer messbare ¨ Kriterien wie Okonomie des Aufbaus oder Eleganz der Darstellung.
1.2
Georg Cantor 1845 – 1918
Mengen
Sie wollen Auto fahren? Dann eignen Sie sich in der Fahrschule die f¨ ur das Autofahren wichtigsten Kenntnisse an (Verkehrsregeln? Wie wechsle ich einen Reifen?), und danach kann es los gehen. Keiner kommt auf die Idee, erst einmal einige Semester Kraftfahrzeugbau, Verkehrsrecht usw. zu studieren. So ¨ahnlich verh¨alt es sich mit dem Stellenwert der Mengenlehre innerhalb der Analysis. Es kann hier nicht die Absicht sein, Sie in die Feinheiten des Gebiets einzuf¨ uhren, daf¨ ur ist in sp¨ateren Semestern immer noch Zeit. Hier geht es nur um ein erstes Kennenlernen, insbesondere brauchen wir einige Vokabeln. Wir beginnen mit der klassischen Definition des Mengenbegriffs, sie geht auf uck: Georg Cantor3) (1845 – 1918) zur¨
Menge
Eine Menge ist jede Zusammenfassung von bestimmten wohl” unterschiedenen Objekten unserer Anschauung oder unseres Denkens.“ 2) Obwohl der Vergleich ein bisschen gewagt ist, k¨ onnte man das als Darwinismus in der Mathematik bezeichnen. 3) Seine ber¨ uhmten Werke zur Mengenlehre entstanden zwischen 1879 und 1884. Auf seine Anregung hin wurde die Deutsche Mathematiker-Vereinigung 1890 gegr¨ undet.
1.2. MENGEN
7
Im t¨ aglichen Leben trifft man diese Zusammenfassung zu einem Ganzen“ ” h¨ aufig an. Jeder weiß, was das Kollegium der Schule X“, die Einwohner Ber” ” lins“ usw. sind. Kommunikation zwischen Menschen ist eigentlich nur dadurch m¨ oglich, dass man die Gespr¨achsgegenst¨ande auf diese Weise ein bisschen vorsortiert. Mengen in der Mathematik Wenn ein Mathematiker einen Satz mit Sei M eine Menge . . .“ anf¨ angt, so ” soll das eigentlich nur bedeuten, dass u ort oder ¨ ber die Frage, ob etwas zu M geh¨ nicht, Einigkeit besteht. Mengenlehre schafft damit ein Fundament, von dem aus die Arbeit losgehen kann, auf diese Weise vermeidet man ein Weiterfragen ad infinitum. Seit Cantor hat es sich immer mehr durchgesetzt, Theorien auf der Basis der Mengenlehre zu entwickeln. (Es soll nicht verschwiegen werden, dass dadurch die Gefahr besteht, vor lauter Mengenlehre die wichtigen Ideen zu vernebeln; mehr dazu auf Seite 12 bei der Definition der Abbildungen.) So wollen wir es hier auch halten: 1.2.1. Der erste Schritt zum Axiomensystem f¨ ur R : R ist eine Menge. Wie redet man u ¨ber Mengen? Beim Reden u ¨ber Mengen sind zwei F¨alle zu unterscheiden. Wenn in irgendeinem Zusammenhang bekannt ist, dass eine Menge vorliegt, so kann man – entsprechend der Definition – f¨ ur jedes Objekt eindeutig entscheiden, ob es zu der Menge geh¨ ort oder nicht. Wenn umgekehrt eine Menge definiert werden soll, so muss eindeutig klar sein, welche Objekte enthalten sein sollen und welche nicht. So w¨ are es legitim zu sagen M soll die Menge sein, die aus den Zahlen 0, −13 und 3333 besteht.“ ” Unzul¨assig w¨ are dagegen ein Versuch der Form M ist die Menge der ABC” Zahlen“, wenn vorher nicht erkl¨art wurde, was ABC-Zahlen sind. Hier nun einige Begriffe, sie geh¨oren zur Minimalausstattung, um u ¨ ber Mengen reden zu k¨ onnen. Definition von Mengen durch Aufz¨ ahlung Um Mengen durch Aufz¨ahlung der Elemente festzulegen, schreibt man einfach die Objekte, die zu der Menge geh¨oren sollen, zwischen geschweifte Klammern { }, so genannte Mengenklammern“. Dabei werden die einzelnen Elemen” te durch Kommata getrennt. Die vor wenigen Zeilen betrachtete Menge schreibt man also als {0, −13, 3333}. Wollen wir einen Namen daf¨ ur einf¨ uhren, z.B. M , so lautet die Schreibweise M := {0, −13, 3333}. Gesprochen wird das als M , definiert als die Menge der Zahlen 0, −13 und ” 3333“. Hier einige weitere Beispiele unter Verwendung von N naiv und R naiv : {1, 2, 15, 3}, {1}, {3.2, 12, π}.
{...}
8
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN Dabei steht 3.2 f¨ ur diejenige Dezimalzahl, die Sie in der Schule vielleicht als 3,2 – also mit einem Komma – geschrieben haben. Ein Komma w¨ urde hier aber sehr verwirren, denn die Menge {3, 2, 12, π} ist etwas ganz anderes. Also: Verabschieden Sie sich vom Dezimalkomma, ab jetzt gibt es den Dezimalpunkt.
Es ist u uhren oder ¨ brigens nicht verboten, einige Elemente mehrfach aufzuf¨ die Reihenfolge zu ¨andern. {1, 2, 4} ist die gleiche Menge wie {1, 1, 2, 4} oder wie {4, 1, 2}. Der Sinn dieser Vereinbarung wird deutlich, wenn man Mengen der Form {a, b, c} untersucht, wobei a, b, c erst sp¨ ater festgesetzt werden. Dann ist es ganz praktisch, auch dann {a, b, c} schreiben zu k¨ onnen, wenn etwa a = b gilt.
{.. | ...}
Definition von Mengen durch Angabe einer Eigenschaft Das geht so: Man sagt, um welche Objekte es gehen soll und welche Eigenschaft sie haben sollen. Die Menge aller (naiven) nat¨ urlichen Zahlen, die eine ” Primzahl sind“ w¨ urde dann so geschrieben werden: {n | n ist Primzahl}. Es geht also los mit einer ¨offnenden Mengenklammer {“, dann kommt ein ” allgemeines Symbol (im Beispiel wurde ein n verwendet), es geht weiter mit 4) einem senkrechten Strich . Dann erst geht es um die eigentliche Definition, und das Ganze schließt mit }“. Irgendwo in der Mengenklammer muss also die ” definierende Eigenschaft untergebracht sein, wenn es mehrere gleichzeitig sind, kann man die durch Komma trennen: {n | n ist Primzahl, n > 1000} steht f¨ ur die Menge aller Primzahlen, die gr¨ oßer als 1000 sind. Diese Art, Mengen zu deklarieren, ist deswegen so wichtig, weil es f¨ ur unendliche Mengen keine andere M¨ oglichkeit gibt. (Eine Ausnahme wird gleich anschließend besprochen werden.) Das heißt aber nicht, dass so immer unendliche Mengen entstehen m¨ ussten. Beispielsweise ist {n | n ist Primzahl, n < 12} mit der Menge {2, 3, 5, 7, 11} identisch. Das zeigt auch, dass es mehrere M¨ oglichkeiten geben kann, die gleiche Menge zu beschreiben. Definition von Mengen durch P¨ unktchen Betrachten Sie die Mengendefinition M := {2, 4, 6, 8, . . .}. Den Typ kennen wir noch nicht, und eigentlich haben ja P¨ unktchen bei einem strengen Aufbau nichts zu suchen. Aber: Jeder weiß doch, dass von der Menge {n | n ist eine (naive) nat¨ urliche Zahl, n ist gerade} 4) Manche Autoren verwenden statt des |“ einen Doppelpunkt, sie w¨ urden also ” {n : n ist Primzahl} schreiben.
1.2. MENGEN
9
die Rede ist, aber hier wie in vielen anderen Situationen ist es viel suggestiver, mit den P¨ unktchen zu arbeiten. ¨ Unter Mathematikern gibt es eine Ubereinkunft, P¨ unktchen in solchen Zusammenh¨ angen ausnahmsweise zuzulassen. Jeder kann sie ja in nahe liegender ” Weise“ in eine strenge Definition u ¨bersetzen, wenn es denn notwendig werden sollte. Intellektuelle Anstrengen sind da nicht zu bef¨ urchten, schwieriger als im vorstehenden Fall wird es nie. Grundlegende Begriffe Es folgen, in Kurzfassung, die f¨ ur uns wichtigsten Begriffe zur Mengenlehre. Inhaltlich ist alles hochgradig einfach, in den sechziger Jahren des vorigen Jahrhunderts wurde dieser Teil der Mengenlehre an den Grundschulen vermittelt, mitunter sogar im Kindergarten. Das Zeichen ∅“: die leere Menge ” Die leere Menge ist die eindeutig bestimmte Menge, die keine Elemente enth¨ alt. Das klingt harmlos, macht aber vielen Anf¨angern Schwierigkeiten. Mehr dazu sp¨ ater im Kasten auf Seite 127. Das Zeichen ∈“: Element von ” Ist M eine Menge und x irgendein mathematisches Objekt, so steht x ∈ M“ ” – gesprochen x Element von M“ – f¨ ur die Aussage x geh¨ ort zu M“. Wie bei ” ” jeder sinnvollen Aussage kann das richtig oder falsch sein. Beispiele : 3 ∈ {4, 7, 9} ist eine falsche, 4 ∈ {4} dagegen eine wahre Aussage. Das Zeichen ∈“: / nicht Element von ” ∈“ / steht f¨ ur geh¨ ort nicht zu“, ist also das Gegenteil der Aussage ∈“. ” ” ” Beispiele : 3 ∈ / {4, 7, 9} ist eine wahre, 4 ∈ / {4} eine falsche Aussage. Das Zeichen ∪“: Vereinigung zweier Mengen ” Sind M und N Mengen, so bezeichnet M ∪ N – gesprochen M vereinigt N“ ” oder die Vereinigung von M und N“ – diejenige Menge, die aus allen Elementen ” besteht, die zu M , zu N oder zu beiden Mengen geh¨ oren. Man stellt sich die Vereinigung am besten so vor:
M
N M ∪N
Bild 1.2: Vereinigung Beispiel : Die Vereinigung von {1, 2, 3} und {3, 4, 5} ist die Menge {1, 2, 3, 4, 5}; in Kurzfassung {1, 2, 3} ∪ {3, 4, 5} = {1, 2, 3, 4, 5}.
∅
∈
∈ /
∪
10 ∩
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Das Zeichen ∩“: Durchschnitt zweier Mengen ” Diesmal geht es um diejenigen Elemente, die gleichzeitig zu M und zu N geh¨oren, ihre Gesamtheit wird mit M ∩ N bezeichnet ( der Durchschnitt von ” M und N“ oder auch M geschnitten mit N“). Das Bild zur Definition sieht ” diesmal so aus:
M
N M ∩N
Bild 1.3: Durchschnitt Beispiel : Der Durchschnitt von {1, 2, 3} und {3, 4, 5} ist die Menge {3}, d.h. {1, 2, 3} ∩ {3, 4, 5} = {3}. disjunkt
disjunkte Vereinigung
⊂
? =
\
Zusatz 1: Ist M ∩ N = ∅, so sagt man, dass M und N disjunkt sind. So sind etwa {2, 3} und {4, 5} disjunkt, {2, 3} und {3, 4, 5} aber nicht. Zusatz 2: Eine Vereinigung, die aus disjunkten Mengen gebildet wird, heißt eine disjunkte Vereinigung. Zum Beispiel ist {1, 2, 3} disjunkte Vereinigung der Mengen {1, 2} und {3}. Das Zeichen ⊂“: Teilmenge von ” Mal angenommen, M und N sind Mengen. Falls dann jedes Element von M auch Element von N ist, so schreibt man daf¨ ur M ⊂ N und sagt M Teilmenge ” von N“. Das Zeichen ⊂“ wird das Inklusionszeichen genannt. ” Beispiele: {1, 2, 3} ⊂ {1, 2, 3, 4, 5} ist eine richtige Aussage, {1, 2, 3} ⊂ {−1, 2, 3, 4, 5} dagegen nicht. (Warum eigentlich?)5) Das Zeichen =“: ist gleich ” Zwei Mengen M und N sollen dann gleich genannt werden, wenn sowohl M ⊂ N als auch N ⊂ M gilt. Achtung also: Wenn jemand behauptet, dass M = N richtig ist, so sind f¨ ur den Nachweis zwei Beweise erforderlich, n¨ amlich einer f¨ ur M ⊂ N und einer f¨ ur N ⊂ M . Beispiel : {1} = {0, 1} ∩ {1, 14}. Das Zeichen \“: relatives Komplement, Komplement¨ armenge ” F¨ ur Mengen M und N kann man eine neue Menge M \ N ( M ohne N“ oder ” M Komplement N“ oder das relative Komplement von N in M“) dadurch ” ” bilden, dass man alle diejenigen Elemente von M betrachtet, die nicht Element von N sind. Beispiel : {1, 2, 3} \ {3, 4, 9} = {1, 2}. Falls schon klar ist, dass es nur um Teilmengen einer festen Menge M geht und N so eine Teilmenge ist, wird M \ N auch einfach die Komplement¨armenge von N genannt. 5) Dieses und die sp¨ ateren ?“ sollen Sie zum Mitdenken anregen. Die Antworten finden Sie ” ab Seite 347.
1.2. MENGEN
11
Mengeninklusion: ⊂“ oder ⊆“? ” ” Es ist schon ein bisschen verwirrend. (Achtung: Nach dem Lesen dieses Abschnitts sind Sie vielleicht noch verwirrter als vorher.) F¨ ur jede Menge M gilt nat¨ urlich M ⊂ M , und deswegen ist ⊂“ so etwas ” wie das Zeichen ≤“ bei den Zahlen. Warum heißt es dann aber nicht ” M ⊆ N , dann h¨atte man das Zeichen ⊂“ doch f¨ ur Situationen frei, ” wo die links stehende Menge sogar echt enthalten ist (bei denen also beide Mengen verschieden sind)? Die Frage ist berechtigt, und wirklich findet man manchmal ⊆“ ” statt ⊂“. F¨ ur echte Inklusionen – also f¨ ur Situationen, in denen ” gleichzeitig ist enthalten“ und nicht gleich“ gilt – schreiben diese ” ” Autoren dann konsequenterweise ⊂“, wobei sie Gefahr laufen, dass ” sie dann von der Mehrheit der Mathematikergemeinde missverstanden werden. Wir werden bei ⊂“ bleiben, und wenn wir wirklich ” einmal ausdr¨ ucken wollen, dass M eine echte Teilmenge von N ist, m¨ ussen wir die u allige Schreibweise ¨bliche, aber doch recht schwerf¨ M N verwenden. P(M )“: die Potenzmenge von M ” Ist M eine Menge, so versteht man unter der Potenzmenge von M diejenige Menge, die alle Teilmengen von M enth¨alt, sie wird mit P(M ) bezeichnet. Potenzmengen werden hier in der Analysis keine große Rolle spielen, deswegen haben Sie noch eine Weile Zeit, sich an diesen Begriff zu gew¨ ohnen. Die Potenzmenge einer Menge hat viel mehr Elemente als die Menge selber, das sieht man schon an dem einfachen Beispiel M = {1, 2, 3}, da geh¨ oren
P(M )
∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, {1, 2, 3} zur Potenzmenge. M × N“: das (kartesische) Produkt von M und N ” M und N sollen Mengen sein. F¨ ur ein x aus M und ein y aus N kann man zwar die zweielementige Menge {x, y} bilden, doch ist die – wie schon gesagt – mit {y, x} identisch. Manchmal ist es aber w¨ unschenswert, auf die Reihenfolge Wert zu legen, und daf¨ ur f¨ uhrt man den Begriff geordnetes Paar ein. Man schreibt (x, y), nennt es das aus x und y gebildete geordnete Paar“und vereinbart, ” dass zwei Paare (x, y) und (x , y ) nur dann als gleich angesehen werden, wenn sowohl x = x als auch y = y gilt. So wird sichergestellt, dass die Reihenfolge eine wichtige Rolle spielt6) . Geordnete Paare sind auch Nichtmathematikern gel¨ aufig. Wenn man zum Beispiel Informationen u ur m¨ ogliche neue Wohnungen ¨ ber Kandidaten f¨ 6) Falls Sie die Konstruktion ubrigens zu vage finden sollten: Man kann geordnetes Paar“ ¨ ” auch ganz allein mit Hilfe von Mengensymbolen ausdr¨ ucken. Wenn man (x, y) als {x, {x, y}} erkl¨ art, so ist wirklich (x, y) = (x , y ) genau dann, wenn x = x und y = y . Kein Mathematiker denkt an diese schwerf¨ allige Definition, wenn er u ¨ber geordnete Paare spricht. Wenn aber jemand auf einem Zugang besteht, in dem nur Ausdr¨ ucke aus der Mengenlehre vorkommen, l¨ asst sich dieser Aufwand kaum vermeiden.
M ×N
12
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN sammelt und jeweils Quadratmeteranzahl“ und Miete (in Euro)“ notie” ” ren m¨ ochte, so h¨ angt die Attraktivit¨ at eines Angebots sehr wohl von der Reihenfolge ab.
Nach dieser Vorbereitung k¨onnen wir die Menge M × N definieren, es soll einfach die Menge aller m¨oglichen geordneten Paare (x, y) (mit x ∈ M und y ∈ N ) sein. Man sagt dazu M kreuz N“ oder spricht vom kartesischen ” ” Produkt von M und N“. Beispiele: {1, 12} × {0, 1, 2} = {(1, 0), (1, 1), (1, 2), (12, 0), (12, 1), (12, 2)}, und R × R ist gerade die kartesische Zahlenebene.
?
Fast m¨ochte ich mich daf¨ ur entschuldigen, dass dieser Teil so schwerf¨ allig formal geworden ist. Inhaltlich handelt es sich wirklich um Sachverhalte, die allen aus der Umgangssprache bestens vertraut sind. Die folgenden Mengen“ ” sind sicher jedem verst¨andlich, erkennen Sie, welche der eben eingef¨ uhrten Mengenkonstruktionen sich dahinter verbergen? - Alle Bundesligaspieler, die deutsche Staatsb¨ urger sind.“ ” - Alle Studenten, die an der Humboldt-Universit¨ at oder der Freien Univer” sit¨at eingeschrieben sind.“ - Die Menge der Personen, die M¨ uller‘ heißen, deren Vorname aber nicht ” ’ Klaus‘ ist.“ ’ Wir n¨ahern uns nun einer der f¨ ur die Analysis (und die gesamte Mathematik) wichtigsten Definitionen, der Abbildungsdefinition. Es handelt sich um eine Verallgemeinerung des aus der Schule bekannten Funktionsbegriffs, man denke etwa an Funktionen wie x2 oder sin x. F¨ ur alle, die den Begriff Abbildung“ erkl¨ aren sollen, gibt es ein didaktisches ” Problem. Einerseits geht es dabei um etwas Dynamisches, das Abbilden ist eine Handlung. So sollte man es sich vorstellen. Andererseits gibt es in der Mathematik das ungeschriebene, aber dennoch streng einzuhaltende Gesetz, dass alles (ja: alles!) auf Begriffe der Mengenlehre zur¨ uckgef¨ uhrt werden muss. Und dann sieht der Abbildungsbegriff wirklich ¨ außerst schwerf¨ allig aus, von der Idee, die man eigentlich damit verbindet, ist absolut nichts mehr zu sehen. Deswegen gibt es hier zwei Definitionen. Die erste ist viel wichtiger, das ist die Definition, mit der man am besten arbeiten kann, und mit ihr wird auch deutlich, warum Abbildungen eine so wichtige Rolle spielen, wenn es um mathematische Modelle der wirklichen Welt geht. Die zweite steht eigentlich nur aus quasi sportlichen Gr¨ unden hier: Ja, es ist m¨oglich, Abbildung“ nur unter Verwendung der ” Worte Menge“, Teilmenge“, Element“ usw. zu formulieren. Sie k¨ onnen sie ” ” ” beim ersten Lesen u ur ein genaueres Verstehen ist sp¨ ater – etwa zur ¨ berfliegen, f¨ Pr¨ ufungsvorbereitung – immer noch Zeit.
1.2. MENGEN
13
Hier die erste, die dynamische“ M¨oglichkeit, Abbildungen zu definieren. ” Definition 1.2.2. Angenommen, M und N sind Mengen. Wenn dann eine Zuordnungsvorschrift erkl¨art ist, die jedem Element aus M genau ein Element aus N zuordnet, so nennt man das eine Abbildung von M nach N . Ist f der Name f¨ ur diese Abbildung, so schreibt man kurz f : M → N und bezeichnet, f¨ ur x ∈ M , mit f (x) dasjenige Element aus N , das x zugeordnet wird. Bemerkungen und Beispiele: ¨ 1. Die Begriffe Abbildung“ und Funktion“ werden synonym verwendet: Uber” ” all, wo man Abbildung“ sagt, darf man auch Funktion“ sagen und umgekehrt. ” ” Eine leichte Vorliebe f¨ ur die Bezeichnung Funktion“ gibt es, wenn es um Ab” bildungen zwischen Mengen von Zahlen geht. 2. Eine Abbildung kann man sich als eine Art Automat vorstellen: F¨ ur jedes x ∈ M wird ein eindeutig bestimmtes f (x) ∈ N produziert. Beachten Sie, dass hier jedes Wort wichtig ist! (Im nachstehenden K¨astchen ist das noch etwas ausf¨ uhrlicher dargestellt.) 3. Wenn eine Abbildung gegeben ist, so kann man sich darauf verlassen: F¨ ur alle x ∈ M ist bekannt, was f (x) ist, und dieses Element liegt in N . Wenn man selber eine definieren soll, so muss man daf¨ ur sorgen, dass wirklich alle Forderungen erf¨ ullt sind. 4. Es gibt mehrere M¨oglichkeiten, Abbildungen zu definieren, die wichtigsten sind: a) Definition durch konkrete Zuordnung; da setzt man einfach f¨ ur jedes Element x aus M einzeln fest, was f (x) sein soll. Zum Beispiel k¨ onnte man eine Abbildung f von {4, 3, 0} nach R naiv dadurch definieren, dass man sagt: f (4) := 1.1, f (3) := −22222, f (0) := 0. Offensichtlich ist dieses Verfahren nur f¨ ur nicht zu große“ M praktikabel. ” b) Definition durch eine Formel; etwa bei der durch f (n) := n23 definierten Abbildung von N naiv nach N naiv . c) Definition durch Fallunterscheidung; soll die zu definierende Abbildung (von R naiv nach R naiv ) den positiven Zahlen die Zahl 2 und den negativen (einschließlich der Null) die Zahl 3.3 zuordnen, so schreibt man das in Kurzfassung als 2 : x>0 x → f (x) := 3.3 : x ≤ 0. Dabei wird x → f (x)“ als x wird abgebildet auf f (x)“ ausgesprochen. ” ” d) Das Zeichen →“ eignet sich oft gut dazu, Abbildungen schnell zu definieren. ” Ist zum Beispiel klar, dass von Abbildungen von R nach R die Rede ist, so uhren, deren Graph die kann man durch f : x → x2 eine Abbildung f einf¨ Standardparabel ist. 5. Im Prinzip kann jeder Buchstabe oder jedes sonstige Symbol zur Bezeichnung einer Abbildung verwendet werden, besonders gebr¨auchlich sind f, g, h, f1 , f2 , . . .
Abbildung
14
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN Vier Fallen bei der Abbildungsdefinition Die Abbildungsdefinition f ist eine Abbildung von M nach N , falls ” . . .“ sieht harmlos aus, es gibt aber vier Fallen, in die man stolpern kann: Achtung 1: Die Abbildung muss f¨ ur jedes m ∈ M definiert sein. Z.B. ist die Definition f : {1, 2, 3} → {0, 1}, f (1) := 0, f (3) := 1 nicht vollst¨andig, da f (2) nicht definiert ist. Achtung 2: Ebenfalls unzul¨ assig ist der Definitionsversuch f : {1, 2, 3} → {0, 1}, f (x) := 0 f¨ ur x ≤ 2, f (x) := 1 f¨ ur x ≥ 2, denn f (2) ist nicht eindeutig erkl¨ art. Achtung 3: Die f (m) m¨ ussen wirklich in N liegen. Durch f : {1, 2, 3} → {0, 1}, f (1) := 0, f (2) := 13, f (3) := 1 wird keine Abbildung definiert.
wohldefiniert
Achtung 4: Wir kommen nun zur t¨ uckischsten Falle, hin und wieder wird sie auch f¨ ur Profis gef¨ ahrlich. Zur Erl¨ auterung betrachten wir die Definition“, die einer positiven rationalen Zahl r, geschrieben ” als r = m/n mit nat¨ urlichen Zahlen m und n, die ganze Zahl m − n zuordnet. Das geht nicht: Hier wird nicht der Zahl selbst etwas zugeordnet, sondern einer der vielen m¨ oglichen Darstellungen dieser Zahl. Die Abbildung weiß nicht“, was sie zum Beispiel 3/2 zuordnen soll: ” Den Wert 1, da 3 − 2 = 1? Oder doch lieber 5000, denn man kann ja 3/2 auch als 15000/10000 schreiben? Man sagt in so einem Fall, dass f nicht wohldefiniert ist. Positiv ausgedr¨ uckt: M¨ochte man bei der Abbildungsdefinition eine konkrete, nicht eindeutig festgelegte Beschreibung des Objekts verwenden, so ist nachzupr¨ ufen, ob das Endergebnis von der zuf¨ allig gew¨ahlten Darstellung unabh¨ angig ist. (So w¨ are zum Beispiel die ur r = m/n, wohldeAbbildung f : Q naiv → Z naiv , f (r) := m2 /n2 f¨ finiert: Es ist nur die Zuordnungsvorschrift r → r2 in Verkleidung.)
Es folgt nun die zweite Abbildungsdefinition, diesmal ganz im Rahmen der Mengenlehre. Den Begriff Abbildung“ sollte man sich zwar wie in Definition ” 1.2.2 (am besten auswendig) merken, Puristen k¨ onnten jedoch das Wort Zu” ordnungsvorschrift“ als zu vage bem¨ angeln. Durch einen Kunstgriff l¨ asst sich das leicht vermeiden. Er besteht darin, f¨ ur eine Abbildung den Graphen als das prim¨ar Gegebene aufzufassen, f¨ ur x → x2 also das Gebilde {(x, x2 ) | x ∈ R naiv }:
1.2. MENGEN
15 x2
x Bild 1.4: Der Graph der Abbildung x → x2 Wir m¨ ochten geeignete Teilmengen von M × N als Abbildungsgraphen auftreten lassen, es beginnt mit der folgenden Definition 1.2.3. M und N seien Mengen. Unter einer Relation zwischen Elementen aus M und N verstehen wir eine Teilmenge R von M × N . Ist R ⊂ M × N eine Relation, so schreibt man statt (x, y) ∈ R auch x R y.
Relation
Relationen gibt es wie Sand am Meer, nur wenige sind aber wirklich wichtig. Wir haben es u ¨ brigens wieder mit einem Begriff zu tun, den auch Nichtmathematiker verinnerlicht haben. x ist befreundet mit y“ ist eine Relation zwischen ” Menschen, x hat y gelesen“ eine zwischen Menschen und B¨ uchern usw. ” Der Rest ist eine einfache Denksportaufgabe: Welche Eigenschaften muss eine Relation R haben, damit sie als Graph einer Abbildung aufgefasst werden kann? Die L¨ osung sieht so aus: Definition 1.2.4. M und N seien Mengen und R ⊂ M × N eine Relation. R heißt Abbildungsrelation , wenn f¨ ur jedes x ∈ M genau ein y ∈ N mit (x, y) ∈ R existiert. ¨ Stellen Sie zur Ubung fest, welche der folgenden Relationen Abbildungsrelationen sind:
Abbildungsrelation
?
Bild 1.5: Welche Teilmengen von M × N sind Abbildungsrelationen? Versuchen Sie, f¨ ur Relationen R ⊂ R × R ein anschauliches Verfahren zu finden, um zu entscheiden, ob R Abbildungsrelation ist. Kleiner Tipp: Betrachten Sie geeignete Geraden und untersuchen Sie, wie oft diese Geraden R schneiden. Falls nun jemand bei Definition 1.2.2 Bedenken hatte, m¨ oge er statt mit Abbildungen mit Abbildungsrelationen arbeiten. Das verankert zwar Abbildungen in das Begriffsger¨ ust der Mengenlehre, doch wird dieser Purismus mit einer großen Schwerf¨ alligkeit erkauft. Abbildungen und entsprechen sich: Ist f : M → N Abbildungsrelationen Abbildung, so ist { x, f (x) | x ∈ M } Abbildungsrelation. Ist R ⊂ M × N
?
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
16
Abbildungsrelation, so ist f : M → N , definiert durch f (x) := das eindeutig ” bestimmte y ∈ N mit (x, y) ∈ R“ eine Abbildung. Deswegen d¨ urfen wir uns von nun an die jeweils bequemere Definition aussuchen, das wird Definition 1.2.2 sein. Das Paradies der Mengenlehre Heute ist die Mengenlehre die unbestrittene Basis aller Mathematik. Sie hatte jedoch große Widerst¨ ande zu u ¨ berwinden, da viele einflussreiche Mathematiker die entsprechenden Beweismethoden ablehnten. Zur Illustration der Problematik betrachten wir die folgende Definition: A soll die Menge aller reellen x sein, f¨ ur die in der 1000 1010 -ten Stelle der Dezimalbruchentwicklung eine 7 steht. So etwas schreibt man heute ohne Skrupel hin, es ist auch m¨ oglich, einiges u ur so gut wie keine ¨ ber A zu beweisen. Allerdings kann man f¨ konkret ort oder nicht. √ gegebene Zahl feststellen, ob sie zu A geh¨ Liegt 2 drin, wie ist es mit e und π? Es ist verst¨andlich, dass man Bedenken haben kann, sich mit solchen wenig fassbaren Objekten auseinanderzusetzen. Stellvertretend f¨ ur die m¨oglichen Einsch¨ atzungen der Mengenlehre folgen zwei Zitate: Hilbert: Niemand wird uns wieder aus dem Paradies vertreiben, ” das Georg Cantor f¨ ur uns ge¨ offnet hat.“ ¨ Poincar´ e: Mengenlehre ist ein widernat¨ urliches Ubel, von dem die ” Mathematik eines Tages geheilt sein wird.“
1.3
Algebraische Strukturen
Wir arbeiten weiter am Grundger¨ ust der Analysis. In diesem Abschnitt wird u angen. ¨ ber Begriffe zu sprechen sein, die mit +“ und ·“ zusammenh¨ ” ” Betrachten wir zun¨achst +“, etwa f¨ ur ganze Zahlen. Bevor wir uns um ” kompliziertere Eigenschaften k¨ ummern, formulieren wir die Aussage mit a und ” b ist auch a + b eine ganze Zahl“ in der Sprache der Mengenlehre: innere Komposition
Definition 1.3.1. Sei M eine Menge. Unter einer inneren Komposition auf M verstehen wir eine Abbildung von M × M nach M , d.h. eine Zuordnungsvorschrift, die je zwei Elementen aus M ein weiteres Element aus M zuordnet. Ist ur z.B. ”◦“ die Bezeichnung dieser inneren Komposition, so schreiben wir f¨ ◦ (x, y) – wie es ja eigentlich heißen m¨ usste – k¨ urzer x ◦ y. Bemerkungen: 1. Man sagt zwar bei Abbildungen f von x“ und schreibt f (x), bei inneren ” Kompositionen w¨ urde das aber zu schwerf¨ allig sein. Es heißt einfach x Kringel ” y“, wenn man die innere Komposition ◦“ vorher als Kringel“ getauft hat. (Es ” ” sagt ja auch niemand + von (x, y)“ f¨ ur x + y“ . . . ) ” ”
1.3. ALGEBRAISCHE STRUKTUREN
17
2. Durch die Bezeichnung innere Komposition“ soll betont werden, dass das ” Ergebnis der Verkn¨ upfung von je zwei Elementen aus M wieder in M liegt. Es gibt auch a ¨ußere Kompositionen, da wird je zwei Elementen aus M ein Element einer weiteren Menge N zugeordnet. (In anderen F¨ allen wird auch eine Abbildung von M × N nach M studiert.) Beispiele: 1. +“ und ·“ sind innere Kompositionen auf N naiv , denn Summen und Pro” ” dukte nat¨ urlicher Zahlen sind wieder nat¨ urliche Zahlen. Entsprechend sind +“ ” und ·“ auch innere Kompositionen auf Z naiv , Q naiv und R naiv . ” 2. x ◦ y := x − y ist innere Komposition auf Z naiv , denn beim Subtrahieren ganzer Zahlen voneinander bleibt man im Bereich der ganzen Zahlen. Das geht genauso in Q naiv und R naiv , nicht jedoch auf N naiv . Warum?
?
3. Sei M eine Menge und P(M ) die auf Seite 11 definierte Potenzmenge von M . Dann k¨ onnen ∩“ und ∪“ als innere Kompositionen auf P(M ) aufgefasst ” ” werden. Mengen mit einer vorgegebenen inneren Komposition (oder mehreren), die gewisse sch¨ one“ Eigenschaften haben, bilden den Ausgangspunkt der Untersu” chungen in der Algebra (daher algebraische Struktur“). In einer langen histo” rischen Entwicklung hat sich herauskristallisiert, welches die wichtigsten Eigenschaften f¨ ur innere Kompositionen sind. Wir werden die folgenden ben¨ otigen: ◦“ sei eine innere Komposition auf der Menge M . ” ◦“ heißt assoziativ, wenn f¨ ur x, y, z ∈ M stets gilt:
Definition 1.3.2. (i)
”
assoziativ
(x ◦ y) ◦ z = x ◦ (y ◦ z). (ii)
”
◦“ heißt kommutativ, wenn
kommutativ
x◦y = y◦x f¨ ur alle x, y ∈ M ist. (iii) Ein Element e ∈ M heißt neutral bez¨ uglich ◦“, wenn e ◦ x = x ◦ e = x ” f¨ ur jedes x ∈ M gilt (e heißt dann auch eine Einheit bez¨ uglich ◦“). ” (iv) Sei e eine Einheit f¨ ur ◦“ und x ∈ M . Ein Element y ∈ M heißt invers ” zu x, wenn x ◦ y = y ◦ x = e. Nimmt man wie bisher die bekannten Zahlenmengen N naiv , Z naiv , Q naiv und auterung R naiv als gegeben an, so lassen sich leicht zahlreiche Beispiele zur Erl¨ der Definitionen finden. Betrachten wir etwa die innere Komposition +“ auf ” Z naiv . Die Zahl 0 ist sicher ein neutrales Element, denn die Addition von 0 ver¨ andert den Wert einer Zahl nicht. In der Schule lernt man, dass +“ kom” mutativ und assoziativ ist, und jedes x ∈ Z naiv besitzt ein inverses Element: −3 ist invers zu 3, die Zahl 5 ist invers zu −5, allgemein ist −x invers zu x.
neutral Einheit invers
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
18
?
Diskutieren Sie analog die inneren Kompositionen • ◦ : (x, y) → 0 auf Z naiv (d.h., die innere Komposition ◦“ ist durch die ” Vorschrift x ◦ y := 0, f¨ ur alle x, y ∈ Z naiv , definiert). • (x, y) → x − y auf Z naiv . • (m, n) → mn auf N naiv .
Beweise
¨ Da Sie noch keine Ubung im Beweisen haben, hier einige erste Hinweise. Die u ¨ bliche Situation ist wie in den vorstehenden Beispielen, dass n¨ amlich M und ◦“ vorgege” ben sind. Betrachten wir etwa die Frage nach der Kommutativit¨ at. Falls ◦“ wirklich ” kommutativ ist und Sie das nachweisen sollen, so m¨ ussen Sie die Gleichheit von x ◦ y und y ◦ x f¨ ur alle M¨ oglichkeiten von x und y nachpr¨ ufen. Hat z.B. M 12 Elemente, ur unendliche Mengen so bedeutet das, dass 122 Gleichungen zu untersuchen sind. F¨ m¨ ussen Sie die Gleichheit von x ◦ y und y ◦ x allein aus den Eigenschaften erschließen, die die Elemente von M definieren bzw. aus der Definition von ◦“ herleiten. ” ¨ Sind Sie dagegen der Uberzeugung, dass ◦“ nicht kommutativ ist – etwa, nachdem ” Sie sich lange mit Beweisversuchen gequ¨ alt haben –, so ist zu beachten, dass das Gegenteil von f¨ ur alle gilt“ mindestens einmal gilt nicht“ ist. Sie sind also dann ” ” mit dem Beweis von ◦‘ ist nicht kommutativ“ fertig, wenn es Ihnen gelingt, zwei ”’ Elemente x, y ∈ M mit x ◦ y = y ◦ x anzugeben. Z.B. ist die durch x ◦ y := xy auf N naiv definierte innere Komposition ◦“ nicht kommutativ, weil man leicht Beispiele ” f¨ ur Zahlen x, y mit xy = y x findet (so ist etwa 23 = 32 ). Ein typischer Anf¨ angerirrtum w¨ are die Annahme, dass im Falle der Nicht-Kommutativit¨ at stets x ◦ y = y ◦ x gelten m¨ usste. Das ist nat¨ urlich nicht zu erwarten, denn mindestens im Fall x = y gilt nat¨ urlich bestimmt xy = y x . Das weiß jeder auch aus dem t¨ aglichen Leben: Das Gegenteil der Aussage alle sind nett zu mir“ ist doch nicht alle sind unfreundlich zu mir“, ” ” sondern es gibt jemanden, der nicht nett zu mir ist“. ” Analog verh¨ alt es sich mit Beweisen zu Aussagen wie ◦‘ ist assoziativ“ oder 7 ”’ ” ist neutral f¨ ur (x, y) → xy auf N naiv“. Etwas mehr m¨ ussen Sie u ¨berlegen, wenn Sie etwa zeigen wollen, dass f¨ ur (x, y) → x − y keine Einheiten existieren: Sie m¨ ussen f¨ ur jedes e einen Versager“ x angeben, f¨ ur den e − x = x oder x − e = x gilt; nat¨ urlich ” m¨ ussen das f¨ ur verschiedene e nicht unbedingt verschiedene x sein.
Hier noch einige von Zahlen unabh¨ angige innere Kompositionen: Beispiele:
?
1. Sei M eine Menge, wir betrachten die innere Komposition ∪“ (Vereinigung) ” auf P(M ). Das ist eine kommutative innere Komposition, denn x geh¨ ort zu ” A oder x geh¨ort zu B“ ist f¨ ur zwei Teilmengen A und B von M offensichtlich gleichwertig zu x geh¨ort zu B oder x geh¨ ort zu A“(mehr dazu auf Seite 23). ” Versuchen Sie, auch die G¨ ultigkeit der folgenden Aussagen zu beweisen: • ∪ ist eine assoziative innere Komposition. • ∅ (die leere Menge) ist neutrales Element bzgl. ∪. • ∅ ist das einzige Element in P(M ), das bzgl. ∪ ein Inverses besitzt.
1.3. ALGEBRAISCHE STRUKTUREN
19
2. Sei M eine Menge. Dann gilt f¨ ur die innere Komposition ∩“ (Durchschnitt) ” auf P(M ): • ∩ ist kommutativ und assoziativ. • M ist neutrales Element. • M ist das einzige Element in P(M ), das ein Inverses besitzt. K¨ onnen Sie auch hier begr¨ unden, woran das liegt? Die Abschlussklassenarbeit Auch in der Umgangssprache gibt es so etwas wie innere Verkn¨ upfungen, man kann zum Beispiel aus Zaun“ und K¨ onig“ das Wort ” ” Zaunk¨ onig“ bilden, auch d¨ urfen S¨atze durch Hintereinanderschrei” ben zu neuen S¨atzen zusammengestellt werden. Man kann sich dann fragen, ob es so etwas wie ein Assoziativgesetz oder ein Kommutativgesetz f¨ ur Sprache gibt. Die Antwort lautet in beiden F¨ allen nein“. ” F¨ ur das Kommutativgesetz ist das klar, auch f¨ ur das Assoziativgesetz sind Gegenbeispiele leicht zu finden: Eine Abschlussklassen” Arbeit“ ist etwas anderes als eine Abschluss-Klassenarbeit“. ” Da das Assoziativgesetz nicht gilt, muss man in Zweifelsf¨ allen klar machen, welche der beiden M¨oglichkeiten gemeint ist. Die Sprache kann das nicht immer gut ausdr¨ ucken, manchmal ist das Gemeinte nur aus dem Zusammenhang zu erschließen. Betrachten Sie etwa die Zeitungsmeldung M¨ adchen und Jungen ” aus Elternh¨ ausern mit h¨oherer Schulbildung werden besonders intensiv von ihren Lehrern gef¨ordert“. Von den zwei sinnvollen Interpretationen, n¨amlich (M¨adchen und Jungen aus Elternh¨ ausern ” mit h¨ oherer Schulbildung) werden besonders intensiv von ihren Lehrern gef¨ ordert“ und M¨adchen und (Jungen aus Elternh¨ ausern mit ” h¨ oherer Schulbildung) werden besonders intensiv von ihren Lehrern gef¨ ordert“ war die zweite gemeint, wie allerdings erst aus dem nachfolgenden Text klar wurde. ¨ ¨ Ahnlich mehrdeutig ist die Uberschrift Justiz ermittelt nach To” ussen gegen Polizisten“. Bei aufmerksamem Lesen kann man dessch¨ in der Zeitung ziemlich oft f¨ undig werden. (Mehr dazu finden Sie in www.mathematik.de unter Informationen/Landkarte.) 3. Sei M eine Menge und Abb(M, M ) die Menge aller Abbildungen von M nach M (denken Sie etwa an endliche Mengen oder an M = R naiv ). Als innere Komposition auf Abb(M, M ) betrachten wir die Abbildungsverkn¨ upfung: F¨ ur Abbildungen f, g:M → M soll eine neue Funktion f ◦ g durch die Vorschrift (f ◦ g)(x) := f g(x) erkl¨art sein. Man sagt f¨ ur f ◦ g“ dann f ” ” Kringel g“ oder etwas seri¨oser f verkn¨ upft mit g“. ”
?
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
20
Zur Illustration betrachten wir auf R naiv die Abbildungen f (x) = x3 und g(x) = x − 12. Es ist dann f ◦ g die Abbildung (x − 12)3 , g ◦ f dagegen ist durch x3 − 12 gegeben. Machen Sie sich an vielen weiteren Beispielen mit der Abbildungsverkn¨ upfung vertraut, diese Konstruktion muss Ihnen m¨ oglichst schnell in Fleisch und Blut u ¨ bergehen.
?
Es gilt dann (warum?): • ◦ ist assoziativ und besitzt eine Einheit (n¨ amlich die Abbildung, die jedes Element auf sich abbildet: x → x). • Besitzt M mehr als ein Element, so ist ◦ nicht kommutativ und es gibt Elemente in Abb(M, M ), die kein Inverses haben. Nun ist es an der Zeit, die ersten Beweise kennen zu lernen. Es soll gezeigt werden, dass eine innere Komposition, die gewisse Bedingungen erf¨ ullt, dann ganz bestimmt auch noch weitere Eigenschaften hat. (Erinnern Sie sich: Es wurde schon weiter oben betont, dass Mathematik nicht untersucht, was ist, sondern was folgt.) Das ist auch eine g¨ unstige Gelegenheit, Sie mit einigen Fakten zum Thema Logik“ vertraut zu machen. Deswegen gibt es jetzt einen ” kleinen Exkurs, mit den inneren Kompositionen geht es auf Seite 24 weiter. Logischer Exkurs Zun¨achst eine Entwarnung: Die Logik, die hier in der Analysis gebraucht wird, ist allen aus dem t¨aglichen Leben wohlbekannt. Hier wollen wir einige Vokabeln herausarbeiten und einige Beweisprinzipien kennen lernen. Zur Illustration werden wir wieder die naiven“ Zahlen, also N naiv usw. verwenden. ” In der Mathematik geht es um Aussagen, die richtig oder falsch sein k¨ onnen. Damit man das aber entscheiden kann, muss die betrachtete Aussage sinnvoll sein. Das kennen Sie schon: Karl der Große wurde im Jahr 800 zum Kaiser gekr¨ont. ist eine sinnvolle Aussage. Sie ist sogar richtig, wie Sie jedem Lexikon entnehmen k¨onnen. Dagegen ist die Aussage Karl der Große xx/+ Donnerstag nicht sinnvoll – was soll der Unsinn denn heißen?? –, eine weitere Diskussion er¨ ubrigt sich damit. Nun kann man aus sinnvollen Aussagen neue sinnvolle Aussagen bilden, ben¨ otigt werden die Operationen und“, oder“, nicht“ und folgt“. ” ” ” ”
1.3. ALGEBRAISCHE STRUKTUREN
21
und Sind p und q sinnvolle Aussagen, so soll auch p und q“ betrachtet werden ” d¨ urfen, man schreibt daf¨ ur p ∧ q“. Diese Aussage soll genau dann wahr sein7) , ” wenn p und q beide wahr sind. Das ist nicht u ¨ berraschend: Ich bin hungrig und durstig“ ist nur ” dann wahr, wenn ich gleichzeitig einen leeren Magen und eine trockene Kehle habe. Man kann die Vereinbarung u ¨ ber und“ u ¨ brigens u ¨ bersichtlich in dem folgenden ” Schema zusammenfassen, das ist die Wahrheitstafel f¨ ur ∧“: ” ........................................................................... q
W
F
W W
F
F
F
p
∧
∧
....... ...... .... .... ... ..... ... ... .. .... ........ .... .... ... ... ... ....................................................................................... ............................................................................ ... ........ .... .... .... .... ... .. ........................................................................................ ... .. .... .. ... ... ...... ... ... ... ... ...... .... ... .. ...... ...........................................................................
F
(Wenn Sie zum Beispiel wissen wollen, was im Fall p ist wahr und q ist ” falsch“ herauskommt, so gehen Sie in die Zeile mit dem W“ und die Spalte mit ” dem F“. Da steht ein F“, also ist p ∧ q in diesem Fall falsch.) ” ” Beispiele: (3 > 0) ∧ (4 + 6 = 10) ist eine wahre Aussage, (3 > 0) ∧ (4 = 132) ist dagegen falsch. oder Hier muss man ein bisschen vorsichtig sein, da oder“ im t¨ aglichen Leben ” in zwei verschiedenen Bedeutungen verwendet wird: • Wenn ich im Lotto sechs Richtige habe oder meine Eltern mir 20 000 ” Euro schenken, kann ich mir ein Auto kaufen.“ Daraus kann man doch v¨ ollig zu Recht schließen, dass dem Autokauf nichts im Wege steht, wenn sogar beide dieser erfreulichen Ereignisse eingetreten sein sollten. • Du isst jetzt Deinen Nachtisch oder es gibt kein Taschengeld!“ ” Das zweite Beispiel ist ein Entweder-Oder, es kommt in der Mathematik so gut wie nie vor. Wenn also ein Mathematiker oder“ sagt, so ist immer das oder“ ” ” in der ersten der beiden Bedeutungen gemeint: p oder q“ soll in allen F¨ allen ” (und nur in diesen) wahr sein, in denen eine der beiden Aussagen – vielleicht sogar beide – wahr sind. Man schreibt f¨ ur diese Aussage p ∨ q und sagt p oder q“. Wahr sind damit ” die Aussagen (3 = 5) ∨ (7 < 10000000) sowie (1 < 3) ∨ (3 = 5), falsch dagegen ist (1 = 2) ∨ (7 = 7). Als Wahrheitstafel schreibt man es so: ............................................................................... ... ..... ... .... ... ... ..... ...... ... ... ... .... .... .. .. .. .. ........................................................................................ ................................................................................. ... ...... ... ... ... ...... ... ... ... .... .. .. .................................................................................... ... ... ...... ... ... ...... ... .... .. ...... ... ... ...........................................................................
p
∨
q
W
F
W W W F
W
F
7) Genau dann“ ist die Abk¨ urzung f¨ ur die zwei Aussagen dann und nur dann“. Ausf¨ uhr” ” licher: Erstens soll p ∧ q wahr sein, wenn p und q wahr sind, und zweitens soll aus p ∧ q ist ” wahr“ folgen, dass p und q wahr sind.
∨
22 ¬
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
nicht Da geht es einfach um das Gegenteil einer Aussage p, sie wird mit ¬p ( nicht p“) bezeichnet. Die Wahrheitstafel lautet: ”
¬
.............................................................. ... ........ .... ..... ...... ... .. .... .. ................................................................................................................... .... .. . . ... ..... .... . ... .... ...... .. ................................................................. ... ...... ... ... ...... ... ... .... .. ................................................................
p
¬p
W
F
F
W
Auch das kennen Sie schon, in der Sprache verwendet man das nicht“ in der gleichen Bedeutung. Beispiele d¨ urften sich er¨ ubrigen. ” ⇒
folgt Diese Verkn¨ upfung logischer Aussagen tritt sehr h¨ aufig auf. Man schreibt p ⇒ q und sagt p folgt q“ oder auch p impliziert q“, wenn jedesmal, wenn p ” ” wahr ist, auch q wahr ist. Auf den ersten Blick erkl¨art diese Definition nur die erste Zeile der zu ⇒“ ” geh¨origen Wahrheitstafel: .............................................................................. ... ..... .... ... ... ... ..... ...... ... ... ... .... .... ... .. .. .. ........................................................................................ ................................................................................. ... ...... ... ... ... ... ...... ... ... .... .. .. .................................................................................... ... ...... ... ... .. ... ...... ... ... ... .... .. ..............................................................................
⇒
q
W
F
W W
F
p
F
W W
Wie kommt die zweite Zeile zustande? Einfach dadurch, dass eine Aussage p ⇒ q auch dann als wahr anzusehen ist, wenn p falsch und q beliebig ist. Hier haben die meisten Anf¨ anger Probleme. Vielleicht ist es deswegen hilfreich, daran zu erinnern, dass man es umgangssprachlich genauso h¨ alt: Jedesmal, wenn es regnet, brauche ich einen Schirm“ ist auch in der ” Sahara eine wahre Aussage. Man sollte sich merken: Aus einer falschen Aussage kann alles M¨ ogliche gefolgert werden.
Wie schon gesagt, sind Aussagen der Form p ⇒ q h¨ aufig zu untersuchen. Es lohnt folglich, sich klarzumachen, dass diese Aussage gleichwertig zu anderen ist, die im Einzelfall vielleicht einfacher zu beweisen sind. Statt p ⇒ q kann man genau so gut die Aussage ¬q ⇒ ¬p oder ¬(p ∧ ¬q) untersuchen, man spricht im ersten Fall vom Nachweis der logischen Kontraposition, im zweiten von einem indirekten Beweis. Kommt Ihnen das sehr abstrakt vor? Dann sollten Sie sich klarmachen, dass es sich nur um eine Umformulierung von Schlussweisen handelt, die man im t¨ aglichen Leben problemlos akzeptiert. Nehmen wir zum Beispiel an, Sie sollten einen Reisebericht u ¨ ber London schreiben, und Sie wollen darin aufnehmen, dass Londoner stets mit einem Schirm anzutreffen sind. Dazu gleichwertig ist es doch zu sagen:
1.3. ALGEBRAISCHE STRUKTUREN •
23
Wenn man jemanden ohne Schirm trifft, so war es bestimmt kein ” Londoner“.
• Oder: Es ist unm¨ oglich, einen Londoner ohne Schirm anzutreffen“. ” Die erste Umformulierung entspricht einem Beweis durch logische Kontraposition, die zweite einem indirekten Beweis.
Zur Begr¨ undung f¨ ur die Gleichwertigkeit braucht man nur nachzupr¨ ufen, dass f¨ ur alle m¨ oglichen Wahrheitswerte von p und q das gleiche Ergebnis herauskommt. Ist zum Beispiel p wahr und q falsch, so haben sowohl p ⇒ q als auch ¬q ⇒ ¬p und ¬(p ∧ ¬q) den Wahrheitswert F“, und das gleiche gilt in ” den anderen drei F¨ allen (beide wahr; beide falsch; p falsch und q wahr). Bei dieser Gelegenheit k¨onnen auch endlich Eigenschaften von ∧“ und ∨“ ” ” nachgetragen werden, die schon weiter oben verwendet wurden. So ist es zum Beispiel f¨ ur den Nachweis von A ∩ B = B ∩ A – also f¨ ur die Kommutativit¨ at der inneren Komposition ∩“ auf der Potenzmenge einer Menge – wichtig zu ” wissen, dass p ∧ q gleichwertig zu q ∧ p ist. Und das ist klar, wenn man sich von der Gleichheit beider Aussagen beim Einsetzen beliebiger Wahrheitswerte f¨ ur p und q u ¨berzeugt hat. Notwendig und hinreichend Gilt eine Aussage der Form p ⇒ q, so sagt man: p ist hinreichend ” f¨ ur q“ und q ist notwendig f¨ ur p“. ” Ein Beispiel: Da ein Trapez ein Viereck ist, in dem es zwei parallele Seiten gibt, ist jedes Rechteck ein Trapez8) . Das heißt, dass aus R ist Rechteck“ stets die Aussage R ist Trapez“ gefolgert werden ” ” kann, und deswegen ist Rechteck“ eine hinreichende Bedingung f¨ ur ” Trapez“. ” In der Umgangssprache verwendet man notwendig“ und hinrei” ” chend“ recht ungenau, und deswegen werden beide Worte im Folgenden auch so weit wie m¨oglich vermieden, um niemanden zu verwirren. (Apropos Verwirrung: Es ist ziemlich erschreckend, wie schwer vielen Mitb¨ urgern die Unterscheidung von p und q bei Aussagen der Form p ⇒ q f¨ allt.) ¨ Aquivalenz Gilt f¨ ur zwei Aussagen p und q, dass man daf¨ ur p ⇒ q und gleichzeitig q ⇒ p beweisen kann, so schreibt man p ⇔ q und sagt, dass p und q ¨aquivalent sind. (Oder dass p genau dann gilt, wenn q gilt.) So w¨ are etwa die Aussage Eine reelle Zahl x ist genau dann nicht negativ, wenn es ein y mit ” ¨ eine y 2 = x gibt.“ sinnvoll und sogar richtig, sp¨ater werden Aquivalenzbeweise große Rolle spielen. Ansonsten ist nicht viel zu diesem neuen Symbol zu sagen, da es ja mit Hilfe des eben ausf¨ uhrlich kommentierten Zeichens ⇒“ erkl¨ art ist. Hier ist die ” zugeh¨ orige Wahrheitstafel: 8) Diese Frage wurde Anfang 2003 in der Presse diskutiert, da in einer popul¨ aren Fernsehsendung das Gegenteil behauptet worden war.
⇔
24
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN .............................................................................. ... ..... .... ... ... ... ..... ........ ... .... ... .... .. ... .. .. ......................................................................................... ................................................................................. ... ...... .... ... .. ... ...... ... .. .. .... .. ................................................................................ .. ..... .... . .... . ... .... ... ........ ... ... .. .... ..............................................................................
⇔
q
W
F
W W
F
F
W
p
F
¨ Sie sollten sich aber merken: Wann immer eine Aquivalenzaussage zu zeigen ist, so sind daf¨ ur zwei Beweise zu f¨ uhren. (Ende des Exkurses zur Logik) Ausgehend von inneren Kompositionen mit vorgegebenen Eigenschaften lassen sich weitere Eigenschaften ermitteln. Alles, was wir ein f¨ ur allemal nachgewiesen haben, d¨ urfen wir immer dann verwenden, wenn die entsprechenden Voraussetzungen erf¨ ullt sind. Als Erstes k¨ ummern wir uns um eine Eigenschaft von neutralen und inversen Elementen. Es geht um die allgemeine Fassung der Beobachtung, dass es nur eine Null und zu x nur ein −x gibt: Satz 1.3.3. Es sei ◦“ eine assoziative innere Komposition auf einer Menge ” M. (i) Sind e1 und e2 neutrale Elemente, so gilt e1 = e2 . Anders ausgedr¨ uckt: Wenn es ¨ uberhaupt ein neutrales Element gibt, dann ist es eindeutig bestimmt. In so einem Fall ist man daher berechtigt, von dem neutralen Element zu sprechen. (ii) Wir nehmen an, dass es ein neutrales Element e zu der Verkn¨ upfung ◦“ ” gibt. Ist dann x ein beliebiges Element von M und sind y1 und y2 zu x invers, so ist y1 = y2 . Das heißt: Wenn es ein inverses Element zu x gibt, so ist es eindeutig bestimmt. Man bezeichnet es ¨ ublicherweise mit x−1 (gesprochen x hoch −1“). ” Achtung: Die Bezeichnung x−1 ist dann u ¨ blich, wenn es um allgemeine innere Kompositionen geht. Im Fall von Zahlen und der inneren Komposition +“ ” ur das schreibt man −x an Stelle von x−1 . Das Zeichen x−1 reserviert man f¨ ¨ Inverse bez¨ uglich ·“. Auf diese Weise ist man in Ubereinstimmung mit der aus ” der Schule gewohnten Schreibweise. Beweis: (i) Der Beweis ist bemerkenswert einfach, man muss nur das Element e1 ◦ e2 richtig interpretieren. Einerseits ist es gleich e1 , denn wegen der Neutralit¨at von e2 darf e2 einfach weggelassen werden. Andererseits ist es gleich e2 , da wird die Neutralit¨at von e1 ausgenutzt. Folglich ist, wie behauptet, e1 = e2 . (ii) Nach Voraussetzung wissen wir, dass e = x ◦ y1 . Dann ist aber auch (nach
1.3. ALGEBRAISCHE STRUKTUREN
25
Multiplikation“ von links mit y2 ) ” y2
=
y2 ◦ e
=
y2 ◦ (x ◦ y1 )
= =
(y2 ◦ x) ◦ y1 e ◦ y1
=
y1 .
Bei dieser Umformung haben wir neben der Voraussetzung wirklich nur die Neutralit¨ at von e und die G¨ ultigkeit des Assoziativgesetzes verwendet. 9) Wir wollen hier die Untersuchung innerer Kompositionen nicht systematisch weiter verfolgen. Wir arbeiten weiter an der Verwirklichung unseres Programms, die richtigen“ Eigenschaften von +“ und ·“ der (naiven) reellen ” ” ” Zahlen zu Axiomen zu bef¨ordern. Was dabei richtig“ heißt, hat sich im Lauf ” der Mathematik-Geschichte herausgestellt, R soll sp¨ ater so aussehen: Definition 1.3.4. Sei K eine Menge, auf der zwei innere Kompositionen +“ ” und ·“ vorgegeben sind. ” K (genauer: das Tripel (K, +, ·)) heißt K¨orper, wenn gilt: A1:
K¨ orper
+“ ist assoziativ und kommutativ.
” A2: Es existiert in K ein bzgl. +“ neutrales Element, das wir 0“ nennen ” ” wollen. A3: F¨ ur jedes x ∈ K gibt es bez¨ uglich +“ ein inverses Element, das mit −x ” bezeichnet wird. ·“ ist assoziativ und kommutativ. ” M2: Es existiert in K ein zu ·“ neutrales Element, genannt 1“. ” ” uglich ·“ ein inverses Element, genannt M3: F¨ ur jedes x = 0 in K gibt es bez¨ ” x−1 .
0 −x
M1:
D: Es gilt das Distributivgesetz, d.h. f¨ ur x, y, z ∈ K ist x · (y + z) = x · y + x · z. (Ausf¨ uhrlich m¨ usste es (x · y) + (x · z) heißen. Im Interesse einer bes¨ seren Ubersichtlichkeit behalten wir die in der Schule ¨ ubliche Regelung bei, dass Punktrechnung vor Strichrechnung“ geht. Außerdem vereinba” ren wir, dass der Mal-Punkt weggelassen werden darf: xy ist als x · y zu lesen.) Schließlich verlangen wir, dass die Elemente 1 und 0 verschieden sind. 9) Hier wurde zum ersten Mal das Zeichen “ verwendet: Es bedeutet, dass der Beweis an ” dieser Stelle beendet ist.
1 x−1 Distributivgesetz
26
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN Sprache und Distributivgesetz Auf Seite 19 wurde bemerkt, dass f¨ ur Sprache weder ein Assoziativnoch ein Kommutativgesetz existiert. Es gibt aber etwas, was man als Distributivgesetz der Sprache bezeichnen k¨ onnte, wir haben im vorigen Satz davon Gebrauch gemacht: . . . Assoziativ- noch ein ” Kommutativgesetz . . .“ ist doch nur die Abk¨ urzung f¨ ur . . . Asso” ziativgesetz noch ein Kommutativgesetz . . .“. ¨ Ahnlich ist es mit Ausdr¨ ucken wie Weihnachtskarten und -p¨ ack” chen“, da wurde von links multipliziert“. Auch kann es um ganze ” Satzteile gehen: Ich habe einen Brief und ein P¨ ackchen an sie ge” schickt.“
Bemerkungen/Beispiele: In unseren ersten Beispielen f¨ ur K¨ orper werden wir wieder die u ¨ blichen naiven“ ” Zahlenmengen als Anschauungsmaterial verwenden: 1. Z naiv , zusammen mit der u ¨blichen Addition und Multiplikation, ist kein K¨orper: M3 gilt nicht, da sich Elemente in Z naiv angeben lassen (z.B. 4711), die kein multiplikativ inverses Element haben, obwohl sie von Null verschieden sind. Beachten Sie u uhrliche Formulierung der vorstehenden Aus¨ brigens die ausf¨ orper“ ohne den Zusatz mit der u sage: Die Aussage Z naiv ist kein K¨ ¨ blichen ” ” Addition und Multiplikation“ ist sinnlos, da eine Menge nur zusammen mit zwei fest vorgegebenen inneren Kompositionen auf K¨ orpereigenschaften hin untersucht werden kann. So u ¨bervorsichtig ist man u ¨ blicherweise aber nicht: Im Zweifelsfall ist von den nahe liegenden, bekannten inneren Kompositionen auszugehen. 2. Q naiv und R naiv (versehen mit den u orper. Zur ¨ blichen Kompositionen) sind K¨ Begr¨ undung muss man nur das Schulwissen reaktivieren: Summen und Vielfache rationaler Zahlen sind wieder rational, ebenso der Kehrwert einer von Null verschiedenen rationalen Zahl, usw. 3. H¨atten wir den letzten Satz in der Definition weggelassen, so h¨ atte man K = {0} mit 0 + 0 := 0 und 0 · 0 := 0 als K¨ orper erhalten (hier w¨ are wirklich 0 neutral bez¨ uglich ·“, also 0 = 1). Nur um dieses Trivialbeispiel auszuschließen – ” das in der Formulierung vieler S¨atze eine Fallunterscheidung notwendig machen w¨ urde – wird 0 = 1 verlangt. {0, 1}
4. Man betrachte K := {0, 1} und definiere zwei innere Kompositionen auf K durch die folgende Vorschrift: Definition von +“: 0 + 0 := 1 + 1 := 0; 0 + 1 := 1 + 0 := 1. ” Dabei haben wir die abk¨ urzende Schreibweise a := b := c anstelle von a := c und b := c verwendet. Definition von ·“ : 0 · 0 := 1 · 0 := 0 · 1 = 0; 1 · 1 := 1. ” Dann ist (K, +, ·) wirklich ein K¨ orper, wobei die jeweils neutralen Elemente schon vorausschauend richtig bezeichnet sind. Der Nachweis der K¨ orpereigenschaften ist einfach aber langwierig und wird hier nicht gef¨ uhrt. Z.B. sind f¨ ur
1.3. ALGEBRAISCHE STRUKTUREN
27
ufen. Dieses K den Nachweis von +‘ ist assoziativ“ 23 Gleichungen nachzupr¨ ”’ ist der kleinstm¨ogliche K¨orper . 1 + 1 = 0? Dass 1 + 1 gleich 2 ist, darauf war doch die ganze Schulzeit u ¨ber Verlass. Kein Wunder, dass die meisten Anf¨anger Probleme haben, wenn sie die Gleichung 1 + 1 = 0 sehen. Um das R¨ atsel zu l¨osen, sind einfach zwei Dinge zu beachten. Erstens kann man, wenn innere Kompositionen untersucht werden, Elemente mit bestimmten Eigenschaften mit einem speziellen Namen versehen, wenn das eindeutig m¨oglich ist. So kommen in K¨ orpern die Null und die Eins ins Spiel. Und zweitens k¨onnen wir die gewohnten Namen aus Bequemlichkeit u ¨ bernehmen: 2 ist definiert als 1 + 1, 3 als 2 + 1 usw. Das einzig Gew¨ ohnungsbed¨ urftige ist dann, dass die Zahl 2 sehr wohl mit dem neutralen Element der Addition u ¨ bereinstimmen kann, dass also 2 = 0 m¨ oglich ist. (Ein Beispiel wurde gerade angegeben.) Die Tatsache, dass das bei den Zahlen, wie wir sie kennen, nicht stimmt, ist ein Indiz daf¨ ur, dass die K¨orperaxiome zu ihrer Charakterisierung nicht ausreichen. Das 1 + 1 = 0“-Problem wird nach dem Abschnitt ” Ordnung“ verschwunden sein. ”¨ Ubrigens: Im K¨orper {0, 1} ist auch −1 = 1 und 5 = 3. Ist Ihnen klar, warum? 5. Falls Sie an einem anspruchsvolleren Beispiel interessiert sind: F¨ ur irgendeine nat¨ urliche Zahl p ≥ 2 sei K := {0, 1, . . . , p−1}. Wir definieren zwei innere Kompositionen + und • durch Der Rest, der sich beim Teilen x + y (bzw. x • y) := von x + y (bzw. x · y) durch p ergibt. allen Man sagt auch, dass x+ + y gleich x+y modulo p“ ist. In Spezialf¨ ” kennen u ¨ brigens auch Nichtmathematiker das Rechnen modulo einer Zahl. Dass in 49 Tagen der gleiche Wochentag ist wie heute, liegt einfach daran, dass 49 modulo 7 gleich Null ist. Entsprechend ist klar, dass in 52 Stunden der Stundenzeiger vier Stunden mehr anzeigen wird als in diesem Augenblick, denn 52 modulo 12 ist gleich 4. Es folgen zur Illustration einige weitere Beispiele. Wir w¨ ahlen p = 11, dann ist K = {0, 1, . . . , 10}. Es ist 3 + 10 = 2, denn 13 l¨ asst beim Teilen durch 11 den Rest 2. Entsprechend folgt, dass 6 • 6 = 3, 2 • 2 = 4, usw. ur (K, + , •) alle Aus elementaren Rechenregeln f¨ ur N naiv folgt dann, dass f¨ K¨ orperaxiome bis auf eventuell M3 erf¨ ullt sind. Ist p Primzahl, so ist auch M3 richtig, d.h. K ist ein K¨orper (der K¨orper der Restklassen modulo p). Der Fall p = 2 liefert u ¨ brigens den K¨orper aus Beispiel 4.
?
28
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Wegen Beispiel 2 ist klar, wie der n¨ achste Schritt zur Axiomatisierung von R aussehen wird: 1.3.5. Der zweite Schritt zum Axiomensystem f¨ ur R : R ist ein K¨orper. R ist also eine Menge, auf der zwei innere Kompositionen +“ und ·“ vorge” ” geben sind, derart, dass f¨ ur (R , +, ·) alle K¨orperaxiome erf¨ ullt sind. Hier nun ein Satz u orpern gelten, insbesondere ¨ ber Tatsachen, die in allen K¨ werden wir sie sp¨ater in R verwenden k¨ onnen. Sie werden sicher viele gute alte Bekannte wiedererkennen. Satz 1.3.6. (K, +, ·) sei ein K¨orper. (i) Sind x, y ∈ K mit x + y = x, so ist y = 0 ( einmal neutral, immer ” neutral“). Entsprechend gilt f¨ ur die Multiplikation: Sind x, y ∈ K und ist x · y = x, so folgt im Falle x = 0, dass y = 1 ist. ur jedes x ∈ K ist 0 · x = 0. (ii) F¨ (iii) −x (f¨ ur alle x) und x−1 (f¨ ur alle x = 0) sind eindeutig bestimmt, ebenfalls 0 und 1. (iv) (−1)x = −x f¨ ur alle x. (v) F¨ ur x = 0 ist auch x−1 = 0. −1
(vi) −(−x) = x (f¨ ur alle x), (x−1 )
nullteilerfrei
= x (f¨ ur alle x = 0).
(vii) F¨ ur x = 0, y = 0 ist x · y = 0. Anders formuliert: Ist x · y = 0, so muss x = 0 oder y = 0 gelten ( K¨orper ” sind nullteilerfrei“). (viii) F¨ ur x, y ∈ K definieren wir x − y := x + (−y). Dann gilt x − y = −(y − x). Auch vereinbaren wir, dass x/y die Abk¨ urzung f¨ ur x · y −1 sein soll, wenn y = 0 gilt. Es ist dann (x/y)−1 = y/x, falls x und y von Null verschieden sind. ur alle x, y = 0). (ix) −(x+y) = (−x)+(−y) (f¨ ur alle x, y); (xy)−1 = x−1 y −1 (f¨ (x) (−x)(−y) = xy, (−x)y = x(−y) = −(xy) (f¨ ur alle x, y). Beweis: (i) Unter Ausnutzung von x + y = x m¨ ussen wir zeigen, dass y = 0 ist. Sei also x + y = x. Wir addieren auf beiden Seiten der Gleichung −x (das existiert wegen A3) und erhalten −x + (x + y) = −x + x. Ausrechnen beider Seiten (unter Verwendung des Assoziativgesetzes, der Definition von −x und der Tatsache, dass 0 neutral ist) ergibt wirklich y = 0. Der gleiche Beweis lautet in mathematischer Kurzfassung: x+y =x
⇒ −x + (x + y) = −x + x = 0 A3
⇒ (−x + x) + y = 0 A1
⇒ 0+y =0 A3
⇒ y = 0. A2
1.3. ALGEBRAISCHE STRUKTUREN
29
(Die Kurznotatation ⇒“ f¨ ur ... folgt, weil wir A1 vorausgesetzt haben“ wird ” ” D sp¨ ater auch in einer Variante verwendet: =“ steht zum Beispiel zur Abk¨ urzung ” f¨ ur ist gleich wegen des Distributivgesetzes“.) ” Der zweite Teil des Beweises verl¨auft v¨ollig analog: Man multipliziert mit x−1 und nutzt M1, M2 und M3 aus. A1
(ii) Da wir (i) schon bewiesen haben, brauchen wir nur x + 0 · x = x zu zeigen. Das ergibt sich so: x+0·x
M2
= D =
1·x+0·x (1 + 0) · x
A2
1·x x.
= =
M2
(iii) Das ist ein Spezialfall von Satz 1.3.3. (iv) Der Beweis wird unter Verwendung von (iii) durch den Nachweis der Gleichung x + (−1)x = 0 gef¨ uhrt: x + (−1)x
M2
= D
=
1 · x + (−1)x 1 + (−1) x
A3
=
0·x
(ii)
0.
=
(−1)x hat damit die gleichen Eigenschaften wie −x, also m¨ ussen – wegen (iii) – die Elemente −x und (−1)x u ¨bereinstimmen. (v) Dieser Beweis ist etwas komplizierter. Das zugrunde liegende Schlussprinzip ist [(p oder q) und (nicht q)] ⇒ p“. ” In Worten: Wir wollen zeigen, dass eine Aussage p wahr ist, und wir zeigen dazu, dass p ∨ q eine wahre und q eine falsche Aussage ist. Dass das eine legitime Schlussweise ist, kann formal leicht eingesehen werden: Beim Einsetzen beliebiger Wahrheitswerte W“ und F“ f¨ ur p und q ist ” ” die Aussage (p ∨ q) ∧ ¬q ⇒ p wahr, und damit gilt (p ∨ q) ∧ ¬q ⇒ p allgemein. ¨ Das ist f¨ ur manche wohl eine Uberdosis an logischen Symbolen, deswegen ist es vielleicht n¨ utzlich, darauf hinzuweisen, dass die entsprechende Schlussweise Allgemeingut ist: Wenn ich sicher bin, meinen Schl¨ ussel eingesteckt zu haben – er also in einer meiner beiden Manteltaschen sein muss – und ich ihn in der rechten nicht finde, dann muss er garantiert in der linken sein. Oder wenn die Freundin ganz bestimmt am Wochenende kommen wollte, sich aber am Sonnabend nicht blicken ließ: Am Sonntag ist bestimmt mit ihr zu rechnen.
[(p ∨ q) ∧ ¬q] ⇒ p
30
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Sei also x irgendein K¨orperelement mit x = 0. F¨ ur x−1 (das wegen M3 existiert), gibt es zwei M¨oglichkeiten, es kann gleich Null oder von Null verschieden sein. Wenn wir also unter p bzw. q die Aussage x−1 = 0“ bzw. x−1 = 0“ verstehen, ” ” so ist p ∨ q ganz bestimmt eine wahre Aussage. Und q kann beim besten Willen nicht wahr sein, denn in diesem Fall w¨ are 1
=
x−1 · x
= =
0·x 0
(ii)
im Widerspruch zu unserer Forderung 1 = 0. (vi) Der Beweis ist sehr elegant, wenn man (iii) verwendet. Man schaue sich die Gleichung x + (−x) = 0 an, die ja nur die Definition von −x wiedergibt. Anders gelesen besagt sie doch aber auch, dass x ein Kandidat f¨ ur ein additiv inverses Element von −x ist, die Eindeutigkeit von Inversen f¨ uhrt dann zu −(−x) = x. −1 Analog folgt (x−1 ) = x aus x · x−1 = 1. Beachten Sie, dass wir nur wegen (v) −1 berechtigt sind, (x−1 ) zu betrachten. (vii) Es sei x · y = 0, wobei x = 0. Nach Multiplikation (von links) mit x−1 erhalten wir daraus die Gleichung y · 1 = 0, d.h. y = 0. (viii) Diese Aussage l¨asst sich auf das Rechnen mit −1 zur¨ uckf¨ uhren: −(y − x)
Def. von y − x, (iv)
=
D, M1
=
(iv)
=
(vi) f¨ ur 1
(−1) y + (−1)x (−1)y + (−1)(−1) x −y + −(−1) x
=
−y + 1 · x
M2
=
−y + x
A1
x + (−y)
=
x − y.
Def.
=
Es gibt auch eine Alternative: Man rechnet leicht unter Verwendung von Kommutativit¨at und Assoziativit¨at nach, dass (x − y) + (y − x) = 0. Die Behauptung folgt dann aus (iii). Die entsprechende Aussage f¨ ur die Multiplikation ergibt sich sofort aus x y · = 1. y x (ix) Auch in diesem Beweis muss man nur von −x auf (−1)x umsteigen“: ” −(x + y)
(iv)
=
(−1)(x + y)
D
(−1)x + (−1)y
= (iv)
=
(−x) + (−y).
1.3. ALGEBRAISCHE STRUKTUREN
31
Zum zweiten Teil: (xy)−1 (das existiert wegen (vii)) ist eindeutig dadurch charakterisiert, dass (xy)(xy)−1 = 1. Es reicht also, (xy)(x−1 y −1 ) = 1 zu zeigen, und das folgt unmittelbar aus M1 und M3: (xy)(x−1 y −1 )
M1
(xx−1 )(yy −1 )
M3
1·1 1.
= = =
M2
¨ (Ubrigens: Auf analoge Weise h¨atte man auch den Beweis f¨ ur den ersten Teil f¨ uhren k¨ onnen.) (x) Wieder ist nur (iv) anzuwenden, f¨ ur den Nachweis der ersten Gleichung ist auch (iv) (vi) (−1)(−1) = −(−1) = 1 zu beachten. K¨ onnen Sie die Einzelheiten, die zu einem vollst¨ andigen Beweis noch fehlen, selber erg¨anzen? Bemerkungen: ¨ 1. Bitte merken Sie sich f¨ ur die Beweise, die Sie in den Ubungen selbst f¨ uhren sollen: Bei jedem Beweisschritt ist klarzustellen, warum das Verfahren legitim ist. Sie d¨ urfen sich dabei lediglich auf Axiome sowie bereits bewiesene S¨ atze beziehen (und letztere werden gl¨ ucklicherweise immer mehr). 2. Um m¨ oglichen Frustrationen vorzubeugen – etwa: Die Aussage x · y = 0 f¨ ur ” x, y = 0 h¨ atte ich wohl noch finden k¨onnen, aber auf den Beweis w¨ are ich beim besten Willen nicht gekommen“ –, hier ein Trost: Es handelt sich wirklich um f¨ ur Anf¨ anger wenig plausible Beweise. Schach und Mathematik Schon in Abschnitt 1.1 auf Seite 5 wurde ein Vergleich Mathematik/Schach verwendet: Die Axiome entsprechen den Spielregeln. Der Vergleich l¨ asst sich aber unter den Aspekten Satz“ und Beweis“ ” ” noch weiter f¨ uhren. Jeder, der einmal vor einem schwierigen Schachproblem gesessen hat, weiß doch: • Am schwierigsten ist es, wenn nicht klar ist, ob u ¨ berhaupt eine vern¨ unftige L¨osung existiert. Das ist die u ¨ bliche Situation des Spielers vor dem Schachbrett. • Etwas besser sieht es aus, wenn das Problem als Schachaufgabe gestellt wird: Weiß zieht und gewinnt“, oder Matt in drei ” ” Z¨ ugen“. Besonders einfach ist es mit einer kleinen Anleitung: Zeigen Sie, wie Weiß durch ein spektakul¨ ares Damenopfer in ” drei Z¨ ugen Matt setzen kann.“
?
32
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN ¨ Hier die Ubertragung in die Mathematik: In der Regel weiß ein Mathematiker nicht, ob eine Aussage, die ihn gerade interessiert, wahr ¨ ist oder nicht. Fast nur auf Ubungszetteln zu Universit¨ atsvorlesungen ist das Problem schon mundgerecht vorformuliert: Zeigen Sie, ” dass . . .“, Definiere . . . Dann ist . . .“ Und manchmal ist auch ei” ne Anleitung dabei, damit Anf¨ anger u ¨ berhaupt eine Chance haben: Zeigen Sie unter Verwendung von Lemma xxx, dass . . .“ ” Nur wenig u ¨ berspitzt kann man sagen, dass das Finden einer richtigen mathematischen Aussage in vielen F¨ allen genauso schwierig ist wie das Auffinden eines Beweises dazu.
3. Im Zusammenhang mit dem Nachweis von Existenz und Eindeutigkeit bei neutralen Elementen und Inversen folgt noch eine allgemeine Bemerkung zum Thema taufen“: ” Taufen in der Mathematik In der Mathematik kommt es oft vor, dass ein Objekt einen eigenen Namen erh¨alt: So redet es sich besser dar¨ uber. Wann darf man taufen? Erst dann, wenn klar ist, dass es genau ein Objekt mit der fraglichen Eigenschaft gibt, wenn also vorbereitend schon zwei Nachweise gef¨ uhrt worden sind: Existenz und Eindeutigkeit. ater werden wir n-te Eben haben wir −x“ und x−1“ getauft, sp¨ ” ” Wurzeln, die Zahlen e und π, die Sinusfunktion und viele andere mathematische Objekte taufen. Im t¨aglichen Leben ist es u ahnlich: Man darf den bestimm¨ brigens ¨ ten Artikel nur dann verwenden, wenn Existenz und Eindeutigkeit gesichert sind. Der Satz Ich habe gestern deinen Bruder getroffen“ ” ist sinnlos, wenn es gar keinen oder mehrere Br¨ uder gibt. 4. Zum x-ten Male: S¨atze sind von der Struktur her Folgerungen. Zum Nachweis von p ⇒ q braucht Sie nicht zu interessieren, ob p nun wirklich erf¨ ullt ist. Nur: Wenn es erf¨ ullt ist, dann ist es Ihre Aufgabe nachzuweisen, dass auch q gilt. Anf¨anger haben oft Schwierigkeiten damit, typisch w¨ are etwa bei Beginn des Beweises zu 1.3.6(i) die Frage: Woher weiß ich denn, dass x + y = x ist?“ Das ” wissen Sie nat¨ urlich nicht, nur wenn Sie es wissen, dann . . . Ein weiteres Beispiel: Wenn 1 + 1 = 0 ist, so ist auch (1 + 1)−1 = 0“ ” ist eine richtige Aussage (Spezialfall von Satz 1.3.6(v)). Sie f¨ uhrt jedoch nicht in beliebigen K¨orpern zu einer neuen Information, da 1 + 1 nicht notwendig von Null verschieden zu sein braucht.
¨ 1.4. ANGEORDNETE KORPER
1.4
33
Angeordnete K¨ orper
Der vorige Abschnitt hat gezeigt, dass das bisherige Axiomensystem R ist ein ” K¨ orper“ sicher noch viel zu ¨armlich ist, um in R die vertrauten Eigenschaften von R naiv wiederzufinden. Zum einen sind noch nicht alle uns wohlvertrauten Aussagen sinnvoll formulierbar (z.B.: 1 liegt rechts von der 0“), zum anderen ” ¨ kann es noch unangenehme Uberraschungen geben, etwa dass 1 + 1 = 0 gelten kann. Daher: Zur¨ uck zu R naiv . Hier geht es jetzt darum, Begriffen wie gr¨ oßer“, ” links“ usw. eine mathematische Fundierung zu geben. ” Wir erinnern uns daran, dass in R naiv die Aussage x < y“ das gleiche ” bedeutet wie y − x > 0 (wof¨ ur man auch y − x ist positiv“ sagt). Wegen dieser ” Beobachtung reicht es, sich auf Eigenschaften positiver Elemente zu beschr¨ anken und von den richtigen“ Eigenschaften auszugehen. Die folgende Definition hat ” sich als geeigneter Zugang erwiesen: Definition 1.4.1. (K, +, ·) sei ein K¨orper und P ⊂ K (P ist unser Kandidat f¨ ur die positiven Elemente). P heißt Positivbereich, wenn
positiv
Positivbereich
(i) f¨ ur jedes x = 0 in K ist x ∈ P oder −x ∈ P , es gilt f¨ ur diese x aber nie gleichzeitig x ∈ P und −x ∈ P ; die 0 liegt nicht in P ; (ii) f¨ ur x, y ∈ P ist x + y ∈ P sowie x · y ∈ P . Ein K¨orper zusammen mit einem Positivbereich heißt angeordneter K¨ orper. F¨ ur x ∈ P schreibt man dann auch x > 0. Testen Sie in den folgenden F¨allen, ob es sich um Positivbereiche handelt:
?
• P = ∅ im K¨ orper {0, 1} (s. Seite 26). • P = {1}, ebenfalls in {0, 1}. • P = {x | x ≥ 1} in Q naiv . • P = {x | x < 1} in Q naiv . • P = Q naiv in Q naiv . Wir beeilen uns, das Axiomensystem f¨ ur R der aktuellen Entwicklung anzupassen: 1.4.2. Der dritte Schritt zum Axiomensystem f¨ ur R : R ist ein angeordneter K¨orper. Genauer: In dem K¨orper (R , +, ·) ist eine (von nun an festgehaltene) Teilmenge P , die Menge der positiven Elemente, ausgezeichnet. Durch R¨ uckw¨ artslesen der Motivation vor Definition 1.4.1 bekommen wir nun leicht die gew¨ unschte Anordnung der Elemente von R : Wir vereinbaren, dass x < y die abk¨ urzende Schreibweise f¨ ur y − x geh¨ ort zu P“ sein soll ”
x 0} wird10) ). Diese Vereinbarung soll allgemein in angeordneten K¨orpern gelten. Es ist auch n¨ utzlich, ein eigenes Zeichen f¨ ur die Aussage x < y oder x = y“ einzuf¨ uhren, wir schreiben daf¨ ur x ≤ y und sagen ” x ist kleiner oder gleich y“. ” Manchmal ist es bequem, auch die Zeichen >“ und ≥“ zu verwenden. ” ” x > y“ ist nat¨ urlich die Abk¨ urzung von y < x“, und x ≥ y“ steht f¨ ur ” ” ” y ≤ x“. ”
Wieder k¨onnen wir uns von R naiv leiten lassen, um zu Eigenschaften angeordneter K¨orper zu kommen. Im nachstehenden Satz sind einige wichtige Folgerungen aus den Ordnungsaxiomen zusammengestellt: Satz 1.4.3. Sei (K, +, ·, P ) ein angeordneter K¨orper. (i) 0 geh¨ort nicht zu P . Die Aussage 0 < 0 ist also falsch, und damit l¨asst sich aus x > 0 immer x = 0 folgern. (ii) x1 < x2 und y1 < y2 impliziert x1 + y1 < x2 + y2 ( Ungleichungen d¨ urfen ” addiert werden“). (iii) Aus x < y und z > 0 folgt xz < yz ( Ungleichungen d¨ urfen mit einer ” positiven Zahl multipliziert werden“). (iv) x < y impliziert x + z < y + z f¨ ur jedes z ( in Ungleichungen darf auf ” jeder Seite die gleiche Zahl addiert werden“). (v) x < y impliziert −y < −x ( bei Multiplikation mit −1 kehrt sich die ” Ungleichung um“). (vi) F¨ ur x < y und z < 0 ist xz > yz ( Multiplikation mit beliebigen negativen ” Zahlen kehrt die Ungleichung um“). (vii) F¨ ur jedes x = 0 ist x2 > 0; insbesondere ist 1 > 0 (na endlich! 1 liegt wirklich rechts von der 0“). ” (viii) Ist x > 0, so gilt x−1 > 0, und aus x < 0 folgt x−1 < 0. (ix) In den Aussagen (ii) bis (vi) darf 0 umschreiben.
¨ 1.4. ANGEORDNETE KORPER
35
Dabei haben wir im vorletzten Beweisschritt ausgenutzt, dass (x2 − x1 ) + (y2 − y1 ) = (x2 + y2 ) − (x1 + y1 ) ist; dazu beachte man Satz 1.3.6(ix) und die Kommutativit¨ at der Addition. (Ab hier werden wir solche einfachen algebraischen Umformungen nur noch selten bis zu den K¨ orperaxiomen zur¨ uckverfolgen.) (iii) Gilt x < y und z > 0, so folgt y − x ∈ P und z ∈ P
1.4.1(ii)
⇒
z(y − x) ∈ P
⇒
zy − zx ∈ P
⇒
zx < zy.
Distributivgesetz Def.
(iv) Im Fall x < y argumentieren wir wie folgt: y−x∈P
⇒ (y − x) + (z − z) ∈ P ⇒ (y + z) − (x + z) ∈ P ⇒ x + z < y + z.
(v) Wir wenden (iii) mit z = −x − y an: x −0 = 0. Wegen (ii) d¨ urfen wir daraus (−z)x < (−z)y, d.h. −zx < −zy, schließen, und eine nochmalige Anwendung von (v) liefert wirklich zy < zx. (vii) F¨ ur x = 0 gibt es aufgrund von Definition 1.4.1(i) nur zwei M¨ oglichkeiten: Es ist x > 0 oder −x > 0. Fall 1: x > 0. Dann ergibt eine Multiplikation dieser Ungleichung mit x sofort x2 > 0 · x = 0, wobei Satz 1.3.6(iii) ausgenutzt wurde. Fall 2: −x > 0. Diesmal multiplizieren wir die Ungleichung mit −x und erhalten (−x)2 = x2 > (−x) · 0 = 0. (viii) Wenn x > 0 ist, so d¨ urfen wir wegen (i) das Element x−1 betrachten. Mal angenommen, es w¨are x−1 < 0. Dann w¨ urde durch Multiplikation dieser Ungleichung mit x > 0 mit Hilfe von (iii) auch 1 < 0 folgen, was wegen (vii) nicht m¨ oglich ist. Auch x−1 = 0 scheidet aus, denn das liefert nach Multiplikation mit x den Widerspruch 1 = 0. Fazit: Es bleibt nur x−1 > 0 u ¨brig. Der zweite Teil der Aussage wird genauso bewiesen. (ix) Da muss man nur den Fall =“ jeweils noch extra diskutieren, als Beispiel ” betrachten wir die Aussage (iv). Gilt da x = y, so ist sicher auch x + z = y + z.
36
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Kurz: Die Aussage bleibt richtig, wenn es ≤ statt < heißt. F¨ ur die anderen Aussagen sind die Beweise ¨ahnlich einfach. Satz 1.4.3(vii) gestattet eine interessante und wichtige Folgerung11) : Korollar 1.4.4. Sei (K, +, ·) ein K¨orper. Falls −1 als Summe von Quadraten geschrieben werden kann, so existiert in K kein Positivbereich (d.h. es ist nicht m¨oglich, K zu einem angeordneten K¨orper zu machen). ur geeignete x, y, beide sollen Beweis: Es sei, zum Beispiel, −1 = x2 + y 2 f¨ von Null verschieden sein. G¨abe es nun einen Positivbereich P , so k¨ onnten wir so argumentieren: Sowohl x2 als auch y 2 ist nach Teil (vi) des vorigen Satzes gr¨oßer als Null, aus Teil (i) folgt dann −1 = x2 + y 2 > 0. Kombiniert man das mit 1 > 0“, so folgt 0 = (−1) + 1 > 0 im Widerspruch zu Teil (i) des vorigen ” Satzes. Ganz ¨ahnlich argumentiert man, wenn −1 selber Quadratzahl ist oder als Summe von 3 oder noch mehr Quadraten geschrieben werden kann. (Mehr dazu auf Seite 42.) Folgerungen f¨ ur konkrete K¨ orper: 1. Im K¨orper {0, 1} ist −1 = 12 = 1, d.h. −1 ist eine Quadratzahl. Folglich kann {0, 1} nicht angeordnet werden12) .
?
2. Versuchen Sie, allgemeiner zu zeigen, dass die Restklassenk¨ orper modulo p (p eine Primzahl) nicht angeordnet werden k¨ onnen. 3. Am Ende dieses Kapitels werden wir den K¨ orper C der komplexen Zahlen kennen lernen, vielleicht kam er bei Ihnen schon in der Schule vor. Dort gibt es ein Element i mit i2 = −1, d.h. C kann nicht angeordnet werden. Diese Anwendungen zeigen, dass R durch 1.4.2 schon wesentlich besser be¨ schrieben wird als durch die bloßen K¨ orperaxiome. So eine b¨ ose Uberraschung wie 1 + 1 = 0 k¨onnen wir nun nicht mehr erleben: Wegen 1 > 0 ist n¨ amlich 1 + 1 gr¨oßer als Null und folglich von Null verschieden. Der eigentliche Grund f¨ ur 1 + 1 = 0 ist damit ein ordnungstheoretischer.
11) Bei der Gelegenheit kann darauf hingewiesen werden, dass es f¨ ur mathematische Aussagen so etwas wie eine Hierarchie gibt. Vorbereitende Ergebnisse heißen Lemma“, so richtig ” schwierige Sachverhalte werden Theorem“ genannt, meistens formuliert man aber – wie wir ” bisher – einen Satz“. Und ist aus einem Satz ein weiteres Ergebnis schnell zu erhalten, spricht ” man von einem Korollar“. ” 12) Das steht zur Abk¨ urzung f¨ ur: Es ist nicht m¨ oglich, in diesem K¨ orper K einen Positivbe” reich zu definieren.“
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION
1.5
37
Natu andige Induktion ¨rliche Zahlen, vollst¨
Fassen wir kurz zusammen: R ist ein angeordneter K¨ orper, wir d¨ urfen wie gewohnt addieren, multiplizieren und mit Ungleichungen rechnen. Wir erinnern uns, dass nat¨ urliche Zahlen bei vielen Rechnungen eine wichtige Rolle spielen, und mit denen wollen wir uns nun ausf¨ uhrlich besch¨ aftigen. Nach der (¨ uberraschend aufw¨andigen) Definition dieser Zahlen werden wir mit einiger M¨ uhe sehen, dass wirklich fast alle unsere Erfahrungen mit N naiv beweisbare Resultate sind. Die einzige Ausnahme wird dann in Abschnitt 1.8 behandelt. Alles, was wir beweisen werden, gilt in beliebigen angeordneten K¨ orpern (K, +, ·, P ), wir fixieren irgendeinen. Definition 1.5.1 (Die unkritische Definition von N ). Unter den nat¨ urlichen Zahlen in K verstehen wir die Gesamtheit derjenigen Elemente, die sich als endliche Summe von Einsen schreiben lassen, also 1, 1 + 1, 1 + 1 + 1, usw.; ublicherweise schreibt man 2 := 1 + 1, 3 := 1 + 1 + 1, . . . Wir werden hier das ¨ Zeichen N f¨ ur die Menge der nat¨ urlichen Zahlen in K verwenden13) .
N
Mit dieser Definition haben Sie sicher die richtige“ Vorstellung von N , doch ” leider taugt sie nicht f¨ ur das Weiterarbeiten. Hauptkritikpunkt: Was heißt hier endliche Summe“ oder usw.“? ” ” Wir ben¨ otigen daher eine genauere Definition. Falls Ihnen die am Anfang zu kompliziert ist, k¨ onnen Sie ohne gr¨oßeren Schaden die n¨ achsten Zeilen u ¨ berspringen und mit Satz 1.5.5 weitermachen. (Wobei Sie den Satz dann glauben m¨ ussen, wichtig ist, dass Sie ihn anwenden k¨onnen.) Als Vorbereitung erinnern wir noch einmal an die Definition des Durchschnitts: M ∩ N ist die Menge aller x, die zu M und N geh¨ oren. Wir ben¨ otigen hier eine Verallgemeinerung: Definition 1.5.2. M sei eine Menge und M eine Teilmenge der Potenzmenge von M . Das bedeutet einfach, dass M aus gewissen Teilmengen von M besteht. Unter dem Durchschnitt u ¨ber das Mengensystem M verstehen wir dann die Menge aller x, die zu jedem N ∈ M geh¨oren: M := {x ∈ M | x ∈ N f¨ ur jedes N ∈ M}. Das ist f¨ ur Anf¨ anger, die sich gerade mit dem Durchschnitt von zwei Mengen angefreundet haben, ziemlich schwierig, deswegen behandeln wir zur Illustration die folgenden Beispiele: 1. M soll die Menge N naiv sein, und M soll aus denjenigen Teilmengen bestehen, die die Zahl 1234 enthalten. Behauptung: In diesem Fall besteht M aus der einelementigen Menge {1234}. 13) Meist macht man das f¨ ur K = R , die zu beweisenden Ergebnisse gelten aber in beliebigen angeordneten K¨ orpern.
M
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
38
Begr¨ undung: 1234 geh¨ort sicher zum Durchschnitt, denn diese Zahl istnach Definition in allen N ∈ M enthalten. Weitere Zahlen gibt es aber nicht in M, das folgt aus {1234} ∈ M.
?
2. Es sei M = R naiv und M = {y | y ∈ R naiv , −x ≤ y ≤ x} x ∈ R naiv , x ≥ 0 . Wie sieht dann M aus?
?
3. Wieder sei M = R naiv , wir betrachten M = {y | y ∈ R naiv , y ≥ x} x ∈ R naiv . Was ist in diesem Fall M? Zur¨ uck zu unserem angeordneten K¨ orper (K, +, ·, P ).
induktiv
Definition 1.5.3. Eine Teilmenge M ⊂ K heiße induktiv, wenn sie die beiden folgenden Eigenschaften hat: (i) 1 ∈ M , (ii) x ∈ M impliziert x + 1 ∈ M .
?
Z.B. ist sicher M = K induktiv, und in R naiv sind {x | x ≥ 1} und Z naiv induktiv, {1} und { 12 + n | n ∈ N naiv } aber nicht (warum?).
N
Definition 1.5.4 (Die kritische Definition von N ). SeiM das System der induktiven Teilmengen von K. Wir definieren dann N := M und nennen N die Menge der nat¨ urlichen Zahlen. Es ist plausibel, dass dieses N gerade die Zahlen 1, 1 + 1, usw. enthalten muss: • 1 muss zu N geh¨oren, da 1 in allen induktiven Mengen liegt, ebenso 1 + 1, 1 + 1 + 1, . . . • Andere Elemente als 1, 1 + 1, 1 + 1 + 1, . . . k¨ onnen nicht in N liegen. Die 0 z.B. deswegen nicht, weil {x | x ∈ K, x > 0} eine induktive Menge ist, die 0 nicht enth¨alt. Die Definition von N als Schnitt u oglicht ¨ ber die induktiven Teilmengen erm¨ ein sehr wirkungsvolles Beweisverfahren, die vollst¨andige Induktion. Das ist in seiner Wichtigkeit kaum zu u atzen, quasi alles, was sich u urliche ¨ bersch¨ ¨ ber nat¨ Zahlen zeigen l¨asst, beruht darauf.
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION
39
Satz 1.5.5 (Prinzip der vollst¨andigen Induktion). Sei A eine Teilmenge von N mit
Induktion
(i) 1 ∈ A, (ii) n ∈ A impliziert n + 1 ∈ A. (A ist also eine induktive Teilmenge von N .) Dann ist A = N . Beweis: Ist n ∈ N beliebig, so geh¨ort n (nach Definition) zu jeder induktiven Teilmenge, insbesondere zu A. Das beweist A ⊃ N . A ⊂ N gilt nach Voraussetzung, d.h. es ist A = N . Vollst¨ andige Induktion muss von allen Mathematikern verinnerlicht werden, dieses Beweisprinzip muss man im Schlaf k¨onnen. Wir werden es daher sehr ausf¨ uhrlich behandeln. Hier zun¨achst eine andere Formulierung : Um f¨ ur eine Eigenschaft E, die f¨ ur nat¨ urliche Zahlen sinnvoll formuliert werden kann, den Nachweis zu f¨ uhren, dass E f¨ ur alle nat¨ urlichen Zahlen richtig ist, braucht man nur zu zeigen: • E ist f¨ ur 1 richtig. • E richtig f¨ ur n ⇒ E richtig f¨ ur n + 1. Begr¨ undung: Dann ist n¨amlich {n ∈ N | E ist richtig f¨ ur n} eine induktive Teilmenge und damit gleich N . Ebenso gilt: Soll in irgendeinem Zusammenhang etwas f¨ ur jedes n ∈ N definiert werden, so reicht es • zu sagen, wie die Definition f¨ ur 1 aussieht; • die Definition f¨ ur n + 1 unter Verwendung der Definition f¨ ur n anzugeben. Es folgen einige Beispiele f¨ ur die Definition durch vollst¨andige Induktion: 1. Fakult¨at: Wir vereinbaren 1! := 1 und (n + 1)! := (n + 1) · n!. Dadurch ist n! (gesprochen n Fakult¨at“) f¨ ur jedes n ∈ N definiert. ”
n!
2. Potenz: Sei x ∈ K (oder x Element irgendeiner Menge, die eine innere Komposition ◦“ tr¨ agt). x1 := x, xn+1 := x · xn (im allgemeinen Fall setzen wir: ” n+1 n x := x ◦ x ) definiert dann xn f¨ ur jedes n ∈ N .
1 3. Summe: F¨ ur jedes n ∈ N sei xn ein Element von K. Durch k=1 xk := x1 ,
n+1
n
n ur jedes n ∈ N definiert. k=1 xk := k=1 xk + xn+1 wird dann k=1 xk f¨
xn
40
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN Vollst¨ andige Induktion oder P¨ unktchen“? ” Anschaulich ist nat¨ urlich nk=1 xk = x1 + x2 + · · · + xn . Durch die saubere Definition konnten wir die P¨ unktchen · · ·“ vermeiden. ” Umgekehrt: Wenn Sie in einem mathematischen Zusammenhang P¨ unktchen · · ·“ antreffen, so wollte jemand sehr wahrscheinlich eine ” vollst¨andige Induktion bei einem Beweis oder einer Definition einsparen. Das ist h¨aufig von Vorteil, da Beweise und Definitionen in P¨ unktchen-Schreibweise oft plausibler werden, etwa: n! := 1 · 2 · · · n xn := x · x · · · x . n-mal
Im Prinzip m¨ usste aber jede Definition, jeder Beweis ohne P¨ unkt¨ chen auskommen k¨onnen. Kleine Ubung: Versuchen Sie sich an einer sauberen Definition f¨ ur das Produktzeichen: n
xk := x1 · x2 · · · xn .
k=1
?
Was ist ein Produkt aus einem einzigen Faktor, wie behandelt man n + 1 Faktoren, wenn f¨ ur n Faktoren schon alles bekannt ist?
Nun zu den Beweisen durch vollst¨andige Induktion. Wie schon gesagt, ist diese Technik von grundlegender Wichtigkeit, entsprechend nachdr¨ ucklich ist meine Empfehlung, hier besonders aufmerksam zu lesen. Wir beginnen mit einem konkreten Beispiel: Satz 1.5.6. F¨ ur jedes n ∈ N ist n
k = 1 + ···+ n =
k=1
n(n + 1) . 2
Beweis 1 (zu ausf¨ uhrlich): Sei E f¨ ur nat¨ urliche Zahlen n die Eigenschaft n k=1
k=
n(n + 1) . 2
Anders ausgedr¨ uckt: Eine nat¨ urliche Zahl n soll die Eigenschaft genau dann haben, wenn die zu beweisende Formel f¨ ur die entsprechende Summe aus n Summanden gilt. Wir wollen zeigen, dass E f¨ ur alle nat¨ urlichen Zahlen richtig ist, und m¨ ussen dazu beweisen, dass
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION
41
1. E gilt f¨ ur 1. 2. Gilt E f¨ ur n, so auch f¨ ur n + 1. Beweis von 1.“: Das k¨onnen wir sofort nachrechnen, denn es ist wirklich: ” 1
k=1=
k=1
1(1 + 1) ; 2
hier wurde nur ausgenutzt, wie das Summenzeichen bei einem einzigen Summanden definiert war. Beweis von
2.“: E gelte f¨ ur n, d.h. n ist irgendeine nat¨ urliche Zahl mit der ” n Eigenschaft k=1 k = n(n + 1)/2. Wir haben zu zeigen, dass E f¨ ur n + 1 gilt, d.h. dass n+1 (n + 1)[(n + 1) + 1] . k= 2 k=1
Nun ist aber n+1
n
Def.
k
=
k=1
k + (n + 1)
k=1 Voraussetzung
=
=
n(n + 1) + (n + 1) 2 (n + 1)[(n + 1) + 1] , 2
und damit ist der Beweis vollst¨andig.
Beweis 2 (Standard): Der Beweis besteht wieder aus drei Teilen: einer kleinen Rechnung, der Formulierung der Aussage die Behauptung gilt f¨ ur n“ und dem ” Nachweis, dass die Behauptung dann auch f¨ ur n + 1 gilt: • Induktionsanfang: Der Satz ist richtig f¨ ur n = 1 wegen 1
k=1=
k=1
1(1 + 1) . 2
• Induktionsvoraussetzung: Der Satz gelte f¨ ur ein festes n ∈ N , d.h. es sei n n(n + 1) . k= 2 k=1
• Induktionsschluss: Der Satz gilt dann auch f¨ ur n + 1: n+1 k=1
k = ··· =
(n + 1)[(n + 1) + 1] (wie in Beweis 1). 2
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
42
Damit ist die Behauptung bewiesen.
Es gibt noch eine dritte Variante, die f¨ ur Fortgeschrittene: Da schreibt man einfach Der Beweis ist kanonisch durch vollst¨ andige Induktion zu f¨ uhren“. Das ” ist immer dann gerechtfertigt, wenn keine unerwarteten Schwierigkeiten beim Induktionsbeweis auftreten werden, die technischen Einzelheiten also jedem ausgebildeten Mathematiker u onnen. ¨ berlassen bleiben k¨ Kommentare: 1. Sp¨ater werden auch wir viele elementare, eigentlich durch vollst¨ andige Induktion zu beweisende Aussagen nicht weiter begr¨ unden, h¨ ochstens wird ein Beweis mit P¨ unktchen gegeben. Das ist deswegen gerechtfertigt, weil vollst¨ andige Induktion zu den bei jedem Mathematiker vorausgesetzten Grundfertigkeiten geh¨ort; f¨ ur solche Standardbeweise ist die knappe Zeit in den Vorlesungen zu schade. Stillschweigend ist das schon einmal geschehen, n¨ amlich im Beweis von Korollar 1.4.4. Erst jetzt k¨onnen wir Aussage und Beweis pr¨ azise formulieren: −1 ist Summe von Quadraten“ soll nat¨ urlich bedeuten, dass n ∈ N und ” x1 , . . . , xn ∈ K mit −1 = x21 + · · · + x2n existieren. Aus 1.4.3(iv) haben wir auch gefolgert, dass x21 + · · · + x2n > 0 gilt. (Und hier w¨ are eigentlich ein sehr einfacher Beweis durch vollst¨andige Induktion nachzutragen.) 2. Der eigentliche Beweis besteht also aus einer (in der Regel sehr leicht nachpr¨ ufbaren) Aussage und dem Nachweis einer Folgerung, d.h. einer Aussage der Form p ⇒ q. Das bedeutet insbesondere, dass sich die Frage nach der G¨ ultigkeit von p er¨ ubrigt (Anf¨angerfrage: Woher weiß ich denn, dass die Aussage f¨ ur n ” richtig ist?“), nur der Nachweis der Implikation ist von Bedeutung. Der Beweis ist erst dann g¨ ultig, wenn Sie beides, Induktionsanfang und Induktionsschluss, bew¨altigt haben; erst dann gilt die Aussage f¨ ur alle n ∈ N . Betrachten Sie etwa • Satz (falsch!): F¨ ur alle n ∈ N ist n = 1. (Hier k¨ onnen Sie den Induktionsanfang noch zeigen, der Induktionsschluss gelingt jedoch nicht.) Oder: • Satz (falsch!): F¨ ur alle n ∈ N ist 1n = 0. (Hier geht der Induktionsschluss glatt, der Induktionsanfang ist aber nicht beweisbar.)
3. Das Prinzip der vollst¨andigen Induktion gibt uns leider kein Hilfsmittel, zu den g¨ ultigen S¨atzen zu kommen. Erst wenn der Satz formuliert ist, kann das Prinzip zum Beweis eingesetzt werden. Um den Satz zu finden, braucht es – wie fast immer in der Mathematik – Intuition, Erfahrung, Phantasie, . . . Zum vorstehenden Satz: Das Ergebnis springt in die Augen, wenn Sie die nachstehende Figur richtig“ anschauen: ”
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION n
⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ n
Gesamt߬ache =
⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ Bild 1.6:
n
43
n2 n + 2 2
k anschaulich
k=1
Als zweites Beispiel wollen wir uns einem Ergebnis zuwenden, in dem es nicht notwendig um Zahlen geht. Betrachten Sie irgendeine Menge M , auf der eine kommutative und assoziative innere Komposition ·“ definiert ist; wir werden ” xy statt x · y schreiben: 1. Die Erfahrung: Falls Sie oft mit M zu tun haben, werden Sie sicher auf Ausdr¨ ucke der Form (xy)(xy) stoßen und feststellen, dass man sie zu xxyy vereinfachen kann (sozusagen die x und y sortieren kann). Ebenfalls bemerken Sie, dass (xy)(xy)(xy) = (xxx)(yyy) ist. Dann geht Ihnen ein Licht auf und Sie formulieren: 2. Satz: Stets ist (xy)n = xn y n . Dass will nun bewiesen werden, als Erstes werden Sie einen Beweis mit P¨ unktchen“ skizzieren: ” (xy)n
Def.
=
Kommutativit¨ at Assoziativit¨ at
=
Def.
=
(xy)(xy) · · · (xy) (x · · · x)(y · · · y) xn y n .
Da haben Sie im zweiten Beweisschritt unter Ausnutzung von Kommutativit¨ at und Assoziativit¨at einfach die x und y sortiert. Wenn man es ganz
44
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN pr¨azise machen soll, braucht man aber einen Beweis durch vollst¨andige Induktion: • Induktionsanfang: Nach Definition ist (xy)1 = xy. • Induktionsvoraussetzung: Es gelte (xy)n = xn y n . • Induktionsschluss: Es gilt dann: (xy)n+1
Def.
=
Ind.Vor.
=
Kommutativit¨ at Assoziativit¨ at
=
Def.
=
(xy)n (xy) (xn y n )(xy) (xn x)(y n y) xn+1 y n+1 .
Je ¨ofter man solche Beweise gef¨ uhrt hat, umso mehr kommen sie einem entbehrlich vor, denn die Aussagen beweisen sich sozusagen von alleine“. Irgend” wann werden Sie dann auch selber schreiben: Mit vollst¨ andiger Induktion sieht ” man sofort ein, dass . . .“, doch vorl¨ aufig sollten Sie noch eher zu ausf¨ uhrlich als zu knapp argumentieren. Es sei noch auf einige (selten ben¨ otigte) Varianten zur vollst¨ andigen Induktion hingewiesen: 1. Sei E eine Eigenschaft, die f¨ ur nat¨ urliche Zahlen sinnvoll formuliert werden kann. E gelte f¨ ur n0 (eine feste nat¨ urliche Zahl), und E gilt f¨ ur n, wobei ” n ≥ n0“ impliziere stets E gilt f¨ ur n + 1“. Dann gilt E f¨ ur alle n ∈ N mit ” n ≥ n0 . ˜ die f¨ (Begr¨ undung: Man betrachte die Eigenschaft E, ur nat¨ urliche n durch E gilt f¨ ur n + n0 − 1“ definiert ist. Es kann dann leicht aufgrund der ” ˜ f¨ Voraussetzungen mit vollst¨andiger Induktion bewiesen werden, dass E ur alle nat¨ urlichen Zahlen richtig ist, und das bedeutet gerade die G¨ ultigkeit von E f¨ ur die n mit n ≥ n0 .) Ein Beispiel: Wir behaupten, dass n! > 2n f¨ ur n ≥ 4. Dann ist erstens klar, dass das f¨ ur n = 4 gilt, denn 24 > 16. Und zweitens kann man – f¨ ur n ≥ 4 – aus n! > 2n die Aussage n+1 folgern, man muss nur die Ungleichungen n! > 2n (n+1)! > 2 mit n + 1 > 2 multiplizieren. Das beweist n! > 2n f¨ ur alle n ≥ 4. 2. E sei sinnvoll f¨ ur Tupel (n, m) nat¨ urlicher Zahlen. Um nachzuweisen, dass E f¨ ur alle (n, m) gilt, kann man wie folgt verfahren (geschachtelte Induktion). Bezeichne f¨ ur jedes n mit En die Eigenschaft: E gilt f¨ ur (n, m), alle m. Zeige im ersten Schritt, dass E1 gilt, d.h. dass E f¨ ur (1, 1), f¨ ur (1, 2), f¨ ur (1, 3) usw. richtig ist. Dazu ist durch Induktion nach m zu beweisen, dass (1, m) f¨ ur alle m gilt.
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION
45
Zeige in einem zweiten Schritt, dass En stets En+1 impliziert: Wenn man schon weiß, dass bei festem n die Eigenschaft E f¨ ur (n, m) gilt (f¨ ur alle m), so soll man daraus die G¨ ultigkeit von E f¨ ur (n + 1, m) (ebenfalls f¨ ur alle m) schließen. Als N¨ achstes geht es nun darum zu zeigen, dass die hier eingef¨ uhrten nat¨ urlichen Zahlen alle Eigenschaften haben, die wir nach jahrelanger Erfahrung mit urlicher N naiv erwarten. Jeder weiß“ doch, dass Summen und Produkte nat¨ ” Zahlen wieder nat¨ urliche Zahlen sind. Gilt das in N ? Erwartungsgem¨ aß stimmt es, diese und verwandte Aussagen findet man in unserem n¨ achsten Satz. Die Beweise werden mit vollst¨ andiger Induktion gef¨ uhrt – womit auch sonst –, einige sind ein bisschen anspruchsvoll. Satz 1.5.7. Wieder betrachten wir einen angeordneten K¨orper (K, +, ·, P ) und darin die in Definition 1.5.4 eingef¨ uhrte Menge N der nat¨ urlichen Zahlen. (i) F¨ ur jedes n ∈ N ist auch n + 1 ∈ N . (ii) Summen und Produkte nat¨ urlicher Zahlen sind wieder nat¨ urliche Zahlen. (iii) Aus n ∈ N folgt n ≥ 1; insbesondere ist stets n > 0 und damit n = 0. (iv) n ∈ N und n = 1 impliziert die Existenz eines m ∈ N mit m + 1 = n: Außer 1 haben alle nat¨ urlichen Zahlen einen Vorg¨anger“. ” (v) Es seien n ∈ N und k ∈ K mit k > 0 so vorgelegt, dass n + k ∈ N . Dann ist auch k ∈ N . (vi) Sind n, m ∈ N mit n > m gegeben, so folgt n − m ∈ N . Damit gilt auch n ≥ m + 1. (vii) Ist A ⊂ N und A nicht leer, so gibt es ein n0 ∈ A mit: ur alle n ∈ A. n ≥ n0 f¨ Die Zahl n0 ist damit so etwas wie das kleinstm¨ogliche“ Element in A. ” (viii) Es sei A eine nicht leere und durch eine nat¨ urliche Zahl nach oben beur jedes schr¨ankte Teilmenge von N ; es soll also ein n0 ∈ N mit n ≤ n0 f¨ ur alle n ∈ A. n ∈ A geben. Dann existiert ein n1 ∈ A mit: n ≤ n1 f¨ (Anschaulich ist n1 das gr¨oßtm¨ogliche Element in A.) Beweis: (i) Sei n ∈ N und A eine induktive Teilmenge von K. Dann liegt die Zahl n nach Definition auch in A, und folglich ist n + 1 ∈ A. So waren induktive Teilmengen ja gerade definiert. Zusammen: n + 1 liegt in allen induktiven Teilmengen, folglich auch in N . (ii) Sei n eine beliebige – f¨ ur das Folgende fixierte – nat¨ urliche Zahl. Wir zeigen zun¨ achst durch Induktion nach m, dass n + m f¨ ur alle m zu N geh¨ ort. • Induktionsanfang: Die Aussage ist richtig f¨ ur m = 1 wegen Teil (i) des Satzes.
N: Eigenschaften
46
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN • Induktionsvoraussetzung: Die Aussage sei richtig f¨ ur ein festes m ∈ N . • Induktionsschluss: Wir wollen die Aussage f¨ ur m + 1 beweisen: Geh¨ ort n + (m + 1) zu N ? Dazu schreiben wir n + (m + 1) als (n + m) + 1 (Assoziativgesetz!). Dann geh¨ort n + m nach Induktionsvoraussetzung zu N , und wenn man noch einmal Teil (i) anwendet, so ergibt sich wirklich n + (m + 1) ∈ N .
Damit ist gezeigt, dass Summen nat¨ urlicher Zahlen wieder nat¨ urlich sind. Wir k¨ ummern uns nun um Produkte, wieder beweisen wir – bei festgehaltenem n – durch Induktion nach m. Der Induktionsanfang ist leicht, sicher geh¨ ort mit n auch n · 1 zu N . Der Induktionsschluss macht ebenfalls keine Schwierigkeiten: Weiß man, dass die Zahl n · m eine nat¨ urliche Zahl ist, so weiß man das auch f¨ ur n · (m + 1), denn n · (m + 1) ist gleich n · m + n, also die Summe zweier urlicher Zahlen. nat¨ (iii) Die Menge {x | x ∈ K, x ≥ 1} ist sicher eine induktive Teilmenge, man muss nur die in Satz 1.4.3 bewiesene Aussage 1 > 0“ mit der Voraussetzung ” kombinieren, dass Positivbereiche unter Addition abgeschlossen sind. Da N der Schnitt u ¨ ber alle induktiven Teilmengen ist, ist schon alles gezeigt. (iv) Betrachte A := {n ∈ N | n = 1 oder (es gibt ein m ∈ N mit m + 1 = n)}. A ist induktiv, denn 1. 1 ∈ A; das ist nach Definition klar. 2. Sei n ∈ A, d.h. es ist n = 1 oder n l¨ asst sich als n = m + 1 schreiben. Wir m¨ ussen zeigen, dass auch n + 1 von der Form k + 1 mit einer geeigneten nat¨ urlichen Zahl k ist. Das ist im Fall n = 1 klar, wir brauchen ja nur k = 1 zu w¨ ahlen. Im Fall n = m + 1 ist n + 1 = (m + 1) + 1, und damit leistet k := m + 1 das Verlangte. 1.5.5 impliziert nun A = N und damit (iv). (v) Der Beweis wird durch vollst¨andige Induktion nach n gef¨ uhrt: • Induktionsanfang: Es ist zu zeigen, dass 1 + k ∈ N stets k ∈ N impliziert (alle k > 0). Sei also 1 + k eine nat¨ urliche Zahl, wegen k > 0 ist sie von 1 verschieden. (iv) garantiert die Existenz eines m ∈ N mit 1 + k = 1 + m, und wenn wir auf beiden Seiten dieser Gleichung −1 addieren, erhalten wir k = m ∈ N . • Induktionsvoraussetzung: (v) gelte f¨ ur n. • Induktionsschluss: (v) ist f¨ ur n+ 1 zu zeigen. Sei also k ∈ K mit k > 0 und (n + 1) + k ∈ N gegeben. Liest man das als n + (1 + k) ∈ N und beachtet 1 + k > 0, so folgt aus der Induktionsvoraussetzung, dass 1 + k ∈ N . Wenden wir darauf den Induktionsanfang an, so ergibt sich k ∈ N . Damit gilt (v) f¨ ur n + 1.
¨ ¨ 1.5. NATURLICHE ZAHLEN, VOLLSTANDIGE INDUKTION
47
(vi) Das ist nichts weiter als eine Umformulierung von (v), wenn man k := n−m betrachtet. Der Zusatz folgt aus (iii): n = m + (n − m) ≥ m + 1. (vii) Wir f¨ uhren hier einen indirekten Beweis. Die Existenz eines n0 mit den geforderten Eigenschaften soll dadurch gezeigt werden, dass die Nichtexistenz auf einen Widerspruch gef¨ uhrt wird. Angenommen also, so ein n0 g¨abe es nicht. Wir betrachten dann B := {n0 ∈ N | f¨ ur alle n ∈ A ist n > n0 }. B ist eine induktive Teilmenge von N , denn 1. 1 ∈ B; da A kein kleinstes Element enthalten soll, aber 1 ≤ n f¨ ur alle nat¨ urlichen Zahlen gilt, kann 1 nicht in A liegen. Folglich ist 1 < n f¨ ur jedes n ∈ A. ussen zeigen, dass n0 + 1 ∈ B, d.h. n > n0 + 1 f¨ ur jedes 2. Sei n0 ∈ B, wir m¨ n ∈ A. Es gilt n0 < n und folglich (wegen (vi)) n0 + 1 ≤ n f¨ ur alle n ∈ A. ur irgendein n1 ∈ A. Dann g¨ abe es in Angenommen, es w¨are n0 + 1 = n1 f¨ A doch ein kleinstes Element – n¨amlich n1 – im Widerspruch zu unserer Annahme. Damit ist wirklich n0 + 1 < n f¨ ur alle n ∈ A. B ist also induktiv und Satz 1.5.5 impliziert B = N . Das geht aber nicht: A soll ja mindestens ein Element enthalten. Nennt man das n1 , so kann n1 beim besten Willen nicht zu B geh¨oren. Dieser Widerspruch beweist die Behauptung. (viii) Hier wird (vii) gleich angewendet: Wir betrachten A0 := {m | m ∈ N , f¨ ur alle n ∈ A ist n ≤ m}, A0 ist also die Menge der oberen Schranken von A. A0 ist nicht leer nach Voraussetzung, (vii) liefert uns folglich ein kleinstes Element n1 von A0 . W¨ are n1 kein Element von A, d.h. w¨ urde n < n1 f¨ ur alle n ∈ A gelten, so ur alle n ∈ A (wegen (vi)). Da A = ∅ gilt, k¨ onnen wir w¨ are auch n ≤ n1 − 1 f¨ n1 = 1 ausschließen, n1 − 1 ist also auch eine nat¨ urliche Zahl. Das w¨ urde der Tatsache widersprechen, dass n1 kleinstm¨ ogliche Schranke ist, are sicher eine bessere. Teil (viii) ist damit vollst¨ andig bewiesen. denn n1 − 1 w¨ Schlusskommentar: Wahrscheinlich h¨atte kaum jemand geahnt, was f¨ ur komplizierte Beweise man f¨ uhren muss, um Erfahrungstatsachen“ u ¨ ber die schein” bar so harmlosen Zahlen 1, 2, 3, . . . auch wirklich zu beweisen. Jetzt, wo wir es geschafft haben, stehen aber auch sehr wirksame Beweishilfsmittel zur Verf¨ ugung, die man in vielen Bereichen der Mathematik anwenden kann. Nehmen wir zum Beispiel Teil (vii) des vorstehenden Satzes: Jede nicht leere Menge von nat¨ urlichen Zahlen hat ein kleinstes Element. Das kommt Ihnen
48
wohlgeordnet
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
sicher offensichtlich vor, man sollte sich aber klar machen, dass es eine Tatsache ist, die nicht automatisch f¨ ur Mengen von Zahlen erf¨ ullt ist. Zum Beispiel hat der Positivbereich P in einem geordneten K¨ orper niemals ein kleinstes Element, denn f¨ ur jedes noch so kleine“ x ∈ P ist x/2 ∈ P und x/2 < x. ” Die Eigenschaft jede nicht leere Teilmenge hat ein kleinstes Element“ spielt ” eine so wichtige Rolle, dass es daf¨ ur einen eigenen Namen gibt: Man sagt, dass N wohlgeordnet ist. Viele schwierige Beweise nutzen die Wohlordnung aus, ein erstes Beispiel werden Sie schon im n¨ achsten Abschnitt auf Seite 51 kennen lernen.
1.6
Die ganzen und die rationalen Zahlen
Unser Axiomensystem ist inzwischen so weit entwickelt, dass wir die Menge der reellen Zahlen als angeordneten K¨ orper postulieren, R soll die entsprechenden Axiome erf¨ ullen. In R – allgemeiner sogar in jedem angeordneten K¨ orper – haben wir die Menge N der nat¨ urlichen Zahlen definiert und mit ziemlich schwierigen Beweisen eingesehen, dass dieses N Eigenschaften hat, die mit unseren Erfahrungen mit N naiv bestens u ¨ bereinstimmen. Es ist nun leicht, sich mit Hilfe von N die Menge der ganzen Zahlen zu verschaffen: Z
Definition 1.6.1. In R definieren wir Z, die Menge der ganzen Zahlen, durch Z := {n − m | n, m ∈ N }. Alles, was wir u ¨ber Z naiv wissen, findet man in Z wieder: Satz 1.6.2. Die Menge Z hat die folgenden Eigenschaften: (i) Z = N ∪ {−n | n ∈ N } ∪ {0}. (ii) (Z, +, ·) erf¨ ullt alle K¨orperaxiome (siehe 1.3.4) bis auf M3 14) : Es gibt von Null verschiedene Zahlen, die kein multiplikativ inverses Element haben. Beweis: (i) Zur Abk¨ urzung soll die rechts stehende Menge M heißen. Wir zeigen zun¨achst, dass M ⊂ Z gilt. Dazu muss man nur ein n ∈ N (bzw. die Zahl 0 bzw. eine Zahl der Form −n) als (n + 1) − 1 (bzw. als 1 − 1 bzw. als 1 − (n + 1)) schreiben. F¨ ur den Beweis von Z ⊂ M geben wir eine beliebige ganze Zahl n − m vor. Ist n = m, so ist n − m gleich 0 und damit in M . Falls n > m gilt, so gibt es wegen Satz 1.5.7 ein k ∈ N mit n = m + k, folglich ist n − m = k ∈ M . Ganz ahnlich f¨ uhrt der Fall n < m auf eine nat¨ urliche Zahl k mit n − m = −k ∈ M . ¨ Da aufgrund der K¨orperaxiome f¨ ur je zwei Zahlen stets eine der Beziehungen =“, “ gilt, sind alle F¨ alle ber¨ ucksichtigt. ” ” ” 14) (Z, +, ·) ist damit ein kommutativer Ring mit Einheit. Diese Ringe studiert man in der Algebra.
1.6. DIE GANZEN UND DIE RATIONALEN ZAHLEN
49
(ii) Der Beweis ist Routine, alles, was man wissen muss, folgt aus K¨ orperaxiomen f¨ ur R und schon bewiesenen Eigenschaften von N . Als Erstes ist zu zeigen, dass +“ eine innere Komposition auf Z ist. Also: ” Sind n1 −m1 und n2 −m2 Elemente aus Z, liegt dann auch (n1 −m1 )+(n2 −m2 ) in Z? Anders formuliert: Ist (n1 − m1 ) + (n2 − m2 ) Differenz nat¨ urlicher Zahlen? Die Antwort ist leicht, denn alles Erforderliche ist schon bewiesen: (n1 − m1 ) + (n2 − m2 ) ist wegen der Ergebnisse aus Satz 1.3.6 die gleiche Zahl wie (n1 + n2 ) − (m1 + m2 ), und mit n1 , n2 , m1 , m2 sind – wegen Satz 1.5.7 – urliche Zahlen. auch n1 + n2 und m1 + m2 nat¨ ¨ Ahnlich zeigt man, dass Produkte ganzer Zahlen wieder ganzzahlig sind, hier ist (n1 − m1 )(n2 − m2 ) = (n1 n2 + m1 m2 ) − (n1 m2 + m1 n2 ) zu beachten. Die 0 und die 1 geh¨oren offensichtlich zu Z, und die u ¨ blichen Rechengesetze (Assoziativgesetz usw.) gelten deswegen, weil sie in R gelten. Es ist eigentlich nur noch zu begr¨ unden, dass inverse Elemente der Multiplikation im Allgemeinen nicht zu erwarten sind. Wir behaupten, dass zum Beispiel stets 2z = 1 gilt, dass also 2 kein multiplikativ Inverses hat. Ist irgendein z gegeben, so wissen wir nach Teil (i), dass z = 0, z ≥ 1 oder z ≤ −1 gelten muss. Es folgt 2z = 0, 2z ≥ 2 oder 2z ≤ −2, insbesondere ist ganz bestimmt nicht 2z = 1. Der n¨ achste Schritt ist auch nicht schwierig, wir f¨ uhren die rationalen Zahlen ein. (Die heißen deswegen so, weil ratio“ auf Latein so etwas wie Verh¨ altnis“ ” ” bedeutet): Definition 1.6.3. Unter den rationalen Zahlen in R verstehen wir die Menge m Q := m ∈ Z, n ∈ N , n also die Menge der Quotienten aus ganzen und nat¨ urlichen Zahlen. Reelle Zahlen, die nicht zu Q geh¨oren, heißen irrational. Algebraisch hat Q alles, was man sich nur w¨ unschen kann: Satz 1.6.4. Q , versehen mit der Addition und Multiplikation von R , ist ein K¨orper. Definiert man einen Positivbereich durch m m, n ∈ N , P := n so wird Q zu einem angeordneten K¨orper. Beweis: Auch das ist ein Ergebnis, das sich von alleine“ beweist. Warum, zum ” Beispiel, sind Summen rationaler Zahlen wieder rational? Einfach deswegen, m2 m1 n 2 + m2 n 1 m1 und gerade die Zahl ist, wobei weil die Summe aus n1 n2 n1 n2 urliche Zahl ist. Alle anderen zu m1 n2 + m2 n1 eine ganze und n1 n2 eine nat¨
Q
50
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
beweisenden Eigenschaften sind ebenfalls leicht einzusehen, ein kleines bisschen muss man nur bei den Inversen u ¨ berlegen. Wie sieht das multiplikativ Inverse zu m/n aus, wenn m/n von 0 verschieden ist. Man muss eine Fallunterscheidung machen: m = 0 scheidet aus, denn m/n soll ja gerade nicht Null sein. Ist m ∈ N , so ist n/m invers zu m/n, und im Fall −m ∈ N schließlich k¨ onnen wir −n/−m als Inverses anbieten. Warum sind wir mit Q nicht zufrieden? Das ist doch schon ein riesiges Reservoir an Zahlen, das sollte doch f¨ ur alle Zwecke ausreichen. Leider stimmt das nicht, man kann in Q nicht einmal Wurzeln ziehen:
√
2 irrational
Die Wurzel aus 2 ist irrational Es wurde schon vor fast 2500 Jahren festgestellt, dass man unm¨ oglich zwei nat¨ urliche Zahlen√m und n so finden kann, dass m2 /n2 = 2 ist. Anders ausgedr¨ uckt:√Die Zahl 2, wenn sie denn existieren sollte, ist irrational. Da 2 eine wichtige Rolle spielt – z.B. hat nach dem Satz von Pythagoras die Diagonale im Einheitsquadrat genau diese L¨ ange –, wird man in der Mathematik nicht weit kommen, wenn man nur mit rationalen Zahlen arbeiten m¨ ochte. Das Ergebnis motiviert damit die Notwendigkeit, die L¨ ucken in Q “ irgendwie zu ” schließen. √ Es folgen zwei Beweise f¨ ur die Irrationalit¨at von 2, beide sind von der Beweisstruktur her interessant. Dass der Nachweis nicht leicht sein kann, ist klar, denn man muss doch garantieren, dass niemand zwei Zahlen m, n mit m2 /n2 =2 findet; und w¨are er noch so klug, und w¨ aren m und n beide unvorstellbar groß, und w¨ urde man noch so lange warten. (Viel einfacher w¨ are ein Nachweis des Gegenteils, wenn es denn stimmen w¨ urde. Da muss man nur zwei konkrete Zahlen m und n mit m2 = 2n2 finden.) Erster Beweis: Dieser Beweis ist ein Klassiker, er nutzt die Eigenschaften des Begriffs gerade Zahl“ aus. ” Definition: Eine nat¨ urliche Zahl k heißt gerade, wenn es ein l ∈ N so gibt, dass k = 2l. Wir ben¨otigen die folgenden Ergebnisse: Ergebnis 1: Jede rationale Zahl r > 0 kann in der Form r = m/n geschrieben werden, wobei mindestens eine der Zahlen m, n nicht gerade ist. Ergebnis 2: Ist, f¨ ur eine nat¨ urliche Zahl k, die Zahl k 2 gerade, so ist auch k gerade. Beide Ergebnisse sind klar, wenn man schon weiß, dass jede nat¨ urliche Zahl auf genau eine Weise als Produkt von Primzahlen dargestellt werden kann. Zum Beweis von Ergebnis 1 k¨ urze man in Z¨ ahler und Nenner so viele Zweien wie m¨oglich. F¨ ur Ergebnis 2 beachte man, dass die Primzahlpotenzen in der Darussen. Kommt also in k 2 der Faktor 2 u stellung von k 2 alle gerade sein m¨ ¨ ber-
1.6. DIE GANZEN UND DIE RATIONALEN ZAHLEN
51
haupt vor, dann gibt es ihn auch mindestens zweimal; folglich musste k gerade gewesen sein15) . √ Der eigentliche Beweis ist dann indirekt: Angenommen, es w¨ are 2 = m/n, wobei wir wegen Ergebnis 1 annehmen k¨onnen, dass m oder n ungerade ist. Dann gilt m2 = 2n2 , also ist m2 gerade. Wir schreiben m = 2k – die Zahl m ist ja wegen Ergebnis 2 gerade – und beachten, dass dann 2n2 = 4k 2 , also n2 = 2k 2 gilt. Folglich muss – wieder wegen Ergebnis 2 – die Zahl n ebenfalls gerade sein, und damit haben wir den gew¨ unschten Widerspruch erhalten.
k
n−k
m
n
k
n
Bild 1.7:
√ 2 ist irrational (Skizze zum zweiten Beweis)
Zweiter Beweis: Auch der ist indirekt, er hat√den Vorteil, dass man ihn quasi sehen kann. Wieder gehen wir davon aus, dass 2 = m/n gilt. Unser Ziel ist es, einen Widerspruch herzuleiten. Wir d¨ urfen annehmen, dass die Zahl n dabei kleinstm¨ oglich ist. (Man muss sich nur daran erinnern, dass N wohlgeordnet ist (Satz 1.5.7 (vii)) und ein kleinstes Element in der – nach Annahme nicht leeren – Menge √ n n ∈ N, es gibt m mit m/n = 2 w¨ ahlen.) √ so gilt Wir √ schreiben noch m als m = n+k und beachten: Ist 2 = (n+k)/n, auch 2 = (n − k)/k, denn beide Formeln sind gleichwertig zu n2 = k 2 + 2nk. 15) Beide Ergebnisse sind auch ohne Primfaktorzerlegungen beweisbar. F¨ ur das erste schreibe man r als m/n mit kleinstm¨ oglichem n; so eine Darstellung gibt es wegen Satz 1.5.7 (vii). Und f¨ ur das zweite nutze man aus, dass ungerade Zahlen die Form 2k + 1 haben, das Quadrat – die Zahl 4k 2 + 2k + 1 – also ebenfalls ungerade sein muss.
52
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
√ Nun ist aber n der kleinstm¨ ogliche Nenner, der bei Darstellungen von 2 auftritt, also muss k ≥ n gelten. Dann aber w¨ are m = n + k ≥ 2n und folglich √ 2 = m/n ≥ 2. Wir w¨ urden durch Quadrieren bei 2 ≥ 4 ankommen, und dieser Widerspruch zeigt, dass die Annahme der Rationalit¨ at nicht aufrecht erhalten werden kann. √ √ ¨ Man kann die Aquivalenz von 2 = (n + k)/n und 2 = (n − k)/k mit etwas geometrischer Anschauung auch am vorstehenden Bild 1.7 sehen: F¨ ur das Quadrat mit den Seitenl¨ angen n hat die Hypotenuse nach dem Satz von Pythagoras die L¨ ange m, falls m2 = 2n2 gilt. Die rechtwinkligen Dreiecke oben links haben die gleiche Hypotenuse, und eine der Seiten hat in beiden Dreiecken die L¨ ange n. Damit muss die dritte Seite auch u ange ist gleich k. Daraus ¨ bereinstimmen, ihre L¨ folgt, dass die Hypotenuse des Dreiecks links unten gleich n − k ist, und nach dem Satz von Pythagoras heißt das 2k 2 = (n − k)2 .
1.7
Das Archimedesaxiom
Wir haben in N alles wiedergefunden, was man aufgrund der Erfahrung mit N naiv nur erwarten konnte. Wirklich alles? Es gibt eine Erfahrung bez¨ uglich des Verhaltens von N naiv in R naiv , die bisher noch nicht behandelt wurde: N naiv enth¨alt beliebig große“ Zahlen, genauer: F¨ ur jedes x ∈ R naiv gibt es eine ” ” nat¨ urliche Zahl n mit n ≥ x.“ Falls wir versuchen wollten, diese Aussage f¨ ur N zu beweisen, w¨ urden auch die intensivsten Bem¨ uhungen nicht zum Ziel f¨ uhren. Das ist ein Indiz daf¨ ur, dass es sich gar nicht um eine in beliebigen angeordneten K¨ orpern (K, +, ·, P ) g¨ ultige Aussage handelt. Und wirklich: Es gibt einen derartigen K¨ orper, in dem diese Eigenschaft nicht erf¨ ullt ist. Ein Gegenbeispiel
F¨ ur alle, die das nicht nur glauben wollen, folgt hier eine Beweisskizze: Wir wollen einen angeordneten K¨ orper angeben, in dem die fragliche Eigenschaft nicht gilt. Und da wir aus dem Nichts nichts konstruieren k¨ onnen, berufen wir uns auf etwas schon Bekanntes, wir gehen von Q – dem K¨ orper der rationalen Zahlen – aus. Schritt 1: Als Erstes definieren wir eine Menge K, sie soll alle Ausdr¨ ucke der Form n a0 + a1 x + · · · + an x b0 + b1 x + · · · + bm x m enthalten. Dabei d¨ urfen n und m beliebige nat¨ urliche und die a und b beliebige rationale Zahlen sein. Wir verlangen nur, dass nicht alle b gleich Null sind. Hier einige Beispiele: 22.222x10000000 − 1 3x − 4 x12 − 3x + 5 , , , ... 20 1 x + 5.1x −2x10000000000000 + 3 Stellen Sie sich die Elemente aus K einfach als rationale Funktionen vor, also die, die Sie wahrscheinlich irgendwann einmal beim Thema Kurven” diskussion“ kennen gelernt haben.
1.7. DAS ARCHIMEDESAXIOM
53
Schritt 2: Auf K werden nun eine Addition und eine Multiplikation dadurch definiert, dass wir einfach die entsprechenden Operationen f¨ ur rationale Funktionen kopieren. Zum Beispiel ist x2 − 1 x − 7 x3 − 7x2 − x + 7 · = . x+1 3 3x + 3 ¨ Dann kann man mit einer langwierigen Rechnung, die keinerlei Uberraschungen bietet, f¨ ur K und diese inneren Kompositionen die K¨ orperaxiome nachweisen16) . Schritt 3: Es fehlt noch ein Positivbereich P , der soll aus der Menge derjenigen rationalen Funktionen bestehen, f¨ ur die die rationale Zahl an bm gr¨ oßer als Null ist. So geh¨ ort zum Beispiel (3x + 1)/(7.2x − 200) zu P (da 3 · 7.2 > 0), die Funktion (−x + 12)/(333.3x2 ) aber nicht. Dann ist (K, +, ·, P ) wirklich ein angeordneter K¨ orper, auch dieser Beweis wird hier nicht ausgef¨ uhrt. Und nun die Pointe: Die nat¨ urlichen Zahlen“ in diesem K¨ orper entspre” chen den konstanten Funktionen n/1, wobei n die gew¨ ohnlichen nat¨ urlichen Zahlen durchl¨ auft. Und f¨ ur alle diese n/1 gilt n/1 < x/1, denn x/1 − n/1 = (x − n)/1 liegt in P . Es gibt also K¨ orperelemente, die von keiner nat¨ urlichen Zahl u ¨ bertroffen werden, die also in gewisser Weise zu ” groß“ sind.
achst formulieren F¨ ur R naiv wissen“ wir, dass das nicht passieren kann. Zun¨ ” wir die fragliche Eigenschaft als Definition, um besser dar¨ uber reden zu k¨ onnen: Definition 1.7.1. Sei (K, +, ·, P ) ein angeordneter K¨orper. Wir sagen, dass K archimedisch geordnet ist (oder dass das Archimedesaxiom in K gilt), falls f¨ ur jedes x ∈ K ein n ∈ N mit n ≥ x existiert. Kommentar: Dieses Axiom wurde erstmals von dem griechischen Mathematiker Eudoxos (um 400 v.Chr.) formuliert, und zwar bei der Behandlung geometrischer Fragestellungen. Eudoxos erkannte, dass die Aussage F¨ ur je zwei Strecken kann die zweite durch gen¨ ugend h¨ aufiges An” einanderlegen der ersten u ¨ bertroffen werden.“
Bild 1.8: Bild zum Archimedesaxiom ein Axiom ist und keine Folgerung aus den anderen Forderungen an die geometrischen Objekte. 16) Es ist allerdings eine Feinheit zu beachten. Damit wirklich alles gut geht, m¨ ussen rationale Funktionen identifiziert werden, die als Funktionen nicht zu unterscheiden sind. So wie man zwei Br¨ uche m1 /n1 und m2 /n2 als gleich ansehen muss, wenn m1 n2 = n1 m2 gilt, so muss man hier – zum Beispiel – auch (x + 1)/(x + 7) mit (5x + 5)/(5x + 35) identifizieren. F¨ ur eine ¨ ganz pr¨ azise Diskussion dieses Punktes br¨ auchte man die Begriffe Aquivalenzrelation“ und ” ¨ Aquivalenzklasse“; dazu wird erst auf Seite 69 etwas gesagt werden. ”
Archimedesaxiom
54
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN Das Archimedesaxiom als Erfahrungstatsache Es gibt viele Beispiele aus dem t¨ aglichen Leben, die man als Illustration zu a + a + · · · + a wird beliebig groß, falls nur a > 0“ anf¨ uhren ” k¨onnte. Hier noch ein Zitat aus dem M¨ archen Das Hirtenb¨ ublein“ der Ge” br¨ uder Grimm: . . . In Hinterpommern liegt der Demantberg, der hat ei” ne Stunde in die H¨ohe, eine Stunde in die Breite und eine Stunde in die Tiefe; dahin kommt alle hundert Jahre ein V¨ogelein und wetzt sein Schn¨ ablein daran, und wenn der ganze Berg abgewetzt ist, dann ist eine Sekunde der Ewigkeit vergangen . . .“ Kann man das Archimedesaxiom poetischer ausdr¨ ucken?
Da wir schon wissen, dass nicht alle angeordneten K¨ orper archimedisch geordnet sind, wir aber auf diese Eigenschaft auch nicht verzichten k¨ onnen, muss der n¨achste (und vorletzte) Schritt zur Axiomatik von R folgendermaßen lauten: 1.7.2. Der vierte Schritt zum Axiomensystem f¨ ur R : R ist ein angeordneter K¨orper, in dem das Archimedesaxiom gilt. Das Archimedesaxiom wird in der Analysis von u ¨ berragender Bedeutung sein. Grob vereinfacht ausgedr¨ uckt, ist der Grund darin zu suchen, dass es wegen dieses Axioms in gewisser Weise ausreicht, N gut zu kennen. Hier einige leichte Folgerungen aus dem Archimedesaxiom Satz 1.7.3. Gilt in (K, +, ·, P ) das Archimedesaxiom (insbesondere also in R ), so folgt: (i) F¨ ur jedes ε ∈ K, ε > 0, gibt es ein n ∈ N mit
1 ≤ ε. n
(ii) F¨ ur jedes ε ∈ K, ε > 0, und jedes M ∈ K gibt es ein n ∈ N mit nε ≥ M . Beweis: (i) Wir w¨ahlen ein n ∈ N mit n ≥ 1/ε. Multiplikation dieser Ungleichung mit ε · 1/n ergibt 1/n ≤ ε. Dabei haben wir davon Gebrauch gemacht, dass mit n > 0 auch 1/n > 0 gilt und folglich die Multiplikation mit 1/n die Ungleichung erh¨alt (vgl. Satz 1.4.3). (ii) Man w¨ahle n mit n ≥ M ε−1 und multipliziere mit ε. Epsilon Im vorstehenden Satz tauchte erstmals der griechische Buchstabe ε (Epsilon) auf. Es handelt sich dabei um den unbestritten wichtigsten Buchstaben der Analysis, ab Kapitel 2 werden wir laufend damit zu tun haben.
1.7. DAS ARCHIMEDESAXIOM
55
Nat¨ urlich sind Buchstaben v¨ollig unerheblich, jede andere Bezeichnungsweise ist logisch gleichwertig. Dennoch: Eine konsequent durchgehaltene Bezeichnungsdisziplin tr¨agt wesentlich zum einfacheren Lernen und zum besseren Verst¨andnis bei (mit N haben wir das schon versucht, die Elemente wurden und werden auch in Zukunft wann immer m¨oglich mit n, m, n1 usw. bezeichnet). ε wird immer dann verwendet, wenn – wenigstens anschaulich – die Aussage bzw. der Beweis f¨ ur sehr, sehr kleines“ ε schwieriger oder interessanter ” ist als f¨ ur riesengroßes“ ε (versuchen Sie, das durch Satz 1.7.3 zu ” illustrieren). Aus dem Archimedesaxiom folgt, dass rationale Zahlen u ¨ berall in R zu finden sind. Was das genau heißen soll, steht im folgenden Satz, dem so genannten Dichtheitssatz : Satz 1.7.4. Es seien x und y Elemente aus R mit x < y. Dann gibt es ein m m ∈ Q mit x ≤ ≤ y. n n Beweis: Der Beweis macht wesentlich vom Archimedesaxiom Gebrauch, wir beginnen mit zwei Vorbereitungsschritten: Vorbereitung 1: F¨ ur jedes x0 ≥ 1 gibt es ein m0 ∈ N mit x0 ≤ m0 ≤ x0 + 1. Beweis dazu: Sei x0 ≥ 1 und A := {n ∈ N | n ≥ x0 }. A ist nicht leer (Archimedes-Axiom!), besitzt also wegen der Wohlordnungseigenschaft 1.5.7(vii) der nat¨ urlichen Zahlen ein kleinstes Element m0 . Wir behaupten, dass m0 die geforderten Eigenschaften hat. Dass m0 in N ort ja zu A. Es bleibt zu liegt und dass m0 ≥ x0 gilt, ist klar, denn m0 geh¨ zeigen, dass m0 ≤ x0 + 1 ist. Angenommen, das w¨are nicht der Fall. Dann w¨ are atte also m0 > x0 + 1. Insbesondere w¨are m0 > 1, und wegen Satz 1.5.7(iv) h¨ m0 einen Vorg¨ anger: Wir k¨onnten m0 mit einem m0 ∈ N als m0 + 1 schreiben. Das w¨ are aber ein Widerspruch, denn aus m0 + 1 = m0 > x0 + 1 w¨ urde are, m0 > x0 folgen. Damit w¨are m0 ein Element in A, das echt kleiner als m0 w¨ und dieser Widerspruch beweist die Behauptung. Vorbereitung 2: F¨ ur beliebige x, y mit 0 < x < y existieren nat¨ urliche Zahlen n, m mit x ≤ m/n ≤ y. Beweis dazu: Zun¨ achst w¨ahlen wir n1 , n2 ∈ N mit n1 x ≥ 1, n2 (y − x) ≥ 1. Hier nutzen wir Satz 1.7.3 aus. F¨ ur n := n1 + n2 ist dann nx ≥ 1 und n(y − x) ≥ 1. Nun w¨ ahlen wir ein m ∈ N mit nx ≤ m ≤ nx + 1 (vgl. Vorbereitung 1). Und nun sind wir aber auch schon fertig, denn wegen n(y − x) ≥ 1 ist nx + 1 ≤ ny, also nx ≤ m ≤ nx + 1 ≤ ny, und wir brauchen nur noch durch n zu teilen. Nach diesen Vorbereitungen ist der eigentliche Beweis leicht, wir f¨ uhren ihn durch Fallunterscheidung nach der Lage der 0 relativ zu x und y. Es gibt die folgenden M¨ oglichkeiten: • x ≤ 0 ≤ y: In diesem Fall w¨ahle man m/n := 0/1 ∈ Q . • 0 < x < y: Dieser Fall wurde bereits durch Vorbereitung 2 erledigt.
Dichtheitssatz
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
56
• x < y < 0: Es ist dann 0 < −y < −x, wir k¨ onnen also n, m ∈ N mit −y ≤ m/n ≤ −x w¨ahlen (wieder wegen Vorbereitung 2). Es folgt x ≤ −m/n ≤ y, und −m/n geh¨ ort zu Q .
1.8
Richard Dedekind 1831 – 1916
Dedekindscher Schnitt
Vollst¨ andigkeit
Wir stehen nun kurz vor der endg¨ ultigen Formulierung des Axiomensystems f¨ ur R . Das bisherige Axiomensystem sichert zwar, dass wir in R die Erfahrungen mit R naiv in Bezug auf die algebraischen Eigenschaften, die Ordnung und die nat¨ urlichen Zahlen wiederfinden, wir k¨ onnen aber nicht garantieren, dass es genug“ reelle Zahlen gibt. Durch die bisherigen Axiome ist n¨ amlich R von Q ” nicht zu unterscheiden – auch Q ist ein archimedisch angeordneter K¨ orper – und in Q gibt es, wie wir gesehen haben, nicht einmal die Wurzel aus 2. In Q existieren zwar Zahlen, deren Quadrat ziemlich genau gleich 2 ist, wie zum Beispiel 1.414, aber es fehlt“ ein x, f¨ ur das das exakt geht. F¨ ur R brauchen ” wir aber auch diese Zahlen, es soll keine L¨ ucken geben! Es stellt sich nat¨ urlich die Frage, wie das pr¨ azise zu formulieren ist, es bieten sich daf¨ ur mehrere L¨osungsm¨oglichkeiten an. Hier wird die f¨ ur Anf¨ anger am leichtesten zug¨angliche vorgestellt, mehr zu diesem Thema finden Sie in Kapitel 2.3. Die Idee stammt von dem Mathematiker Richard Dedekind17) (18311916). Wir stellen sie gleich vor, zun¨ achst ben¨ otigen wir die Definition 1.8.1. Sei (K, +, ·, P ) ein angeordneter K¨orper. Ein Paar (A, B) zweier Teilmengen A, B von K heißt Dedekindscher Schnitt, falls gilt: (i) A, B sind beide nicht leer. (ii) F¨ ur x ∈ A und y ∈ B ist stets x < y (insbesondere ist damit A ∩ B = ∅). (iii) A ∪ B = K.
Schnittzahl
Ist (A, B) ein Dedekindscher Schnitt, so heißt x0 ∈ K eine Schnittzahl zu (A, B), falls x ≤ x0 ≤ y f¨ ur alle x ∈ A und y ∈ B. ·· ·
A
x0
B
· ··
Bild 1.9: Schnitt (A, B) mit Schnittzahl x0 Ein Dedekindscher Schnitt ist also eine Aufteilung von K in einen linken“ ” Teil A und einen rechten“ B, und eine Schnittzahl ist eine Zahl, die genau ” dazwischen liegt. Um uns mit dieser Definition vertraut zu machen, folgen einige 17) Dedekind griff mit den heute so genannten Dedekindschen Schnitten eine Idee von Eudoxos auf, um Vollst¨ andigkeit exakt definieren zu k¨ onnen ( Stetigkeit und irrationale Zahlen“, 1872). ”
¨ 1.8. VOLLSTANDIGKEIT
57
Beispiele: 1. Ist x0 ein beliebiges Element aus K, so ist sicher A := {x | x < x0 }, B := {x | x0 ≤ x} ein Dedekindscher Schnitt mit Schnittzahl x0 . 2. Das klappt genauso, wenn man die Rollen von < “ und ≤“ vertauscht. ” ” Auch A := {x | x ≤ x0 }, B := {x | x0 < x} ist ein Dedekindscher Schnitt mit Schnittzahl x0 . 3. Wie man sich auch in R naiv anstrengt: Alle Dedekindschen Schnitte scheinen dort von der in Beispiel 1 und Beispiel 2 beschriebenen Form zu sein, insbesondere haben alle eine Schnittzahl. 4. In Q naiv kann das Fehlen der Wurzel aus 2 in die Konstruktion eines Dedekindschen Schnittes ohne Schnittzahl umgeschrieben werden. F¨ ur jedes rationale x ist doch x2 < 2 oder x2 > 2. Daraus folgt, dass durch A B
:= {x ∈ Q | x ≤ 0 oder x2 < 2}, := {x ∈ Q | x > 0 und x2 > 2}
ein Dedekindscher Schnitt definiert wird. Der kann aber keine Schnittzahl haben, denn der einzige Kandidat daf¨ ur w¨are eine rationale Zahl, deren Quadrat 2 ist, und so eine gibt es ja nicht. Wollte man das streng beweisen, so w¨ are doch noch etwas Arbeit zu investieren. Die Beweisstruktur w¨ are so: x0 beliebig; es soll gezeigt werden, dass x0 keine Schnittzahl ist. Das geht durch Fallunterscheidung: ur ein sehr kleines“ Fall 1: x0 ∈ A. In diesem Fall wird gezeigt, dass – f¨ ” ε > 0 auch x0 + ε in A liegt. Dann ist x0 keine Schnittzahl, denn alle Elemente aus A sollen ja links von x0 liegen. ur das x0 − ε ∈ B. Fall 2: x0 ∈ B. Diesmal wird ein ε > 0 konstruiert, f¨ Schnittzahlen sollen kleiner (oder h¨ ochstens gleich) als alle Elemente von B sein, also kann x0 keine sein. Das ist ziemlich aufw¨ andig, aber es zeigt zweierlei: Erstens kann man die √ L¨ ucke“ bei 2 in Q durch das Fehlen von Schnittzahlen f¨ ur einen geeig” neten Dedekindschen Schnitt ausdr¨ u cken, und zweitens haben wir schon √ eine Idee, wie wir umgekehrt 2 finden k¨ onnen, wenn stets Schnittzahlen zur Verf¨ ugung stehen. Genau so werden wir in Abschnitt 2.2 Wurzeln konstruieren (vgl. Seite 97).
Entsprechend unserer bisherigen Strategie, f¨ ur R alles zum Axiom zu bef¨ ordern, was wir von R naiv her kennen, aus den bisherigen Axiomen aber nicht folgern k¨ onnen, lautet der n¨ achste Schritt:
58
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
1.8.2. Der f¨ unfte (und letzte!) Schritt zum Axiomensystem von R : R ist ein angeordneter K¨orper, in dem das Archimedesaxiom gilt und in dem jeder Dedekindsche Schnitt eine Schnittzahl besitzt. vollst¨ andig
Die Eigenschaft jeder Dedekindsche Schnitt besitzt eine Schnittzahl“ eines ” angeordneten K¨orpers K wird auch mit K ist vollst¨andig“ bezeichnet. Das soll ” zum Ausdruck bringen, dass die Existenz eines Dedekindschen Schnittes ohne Schnittzahl als K hat L¨ ucken“ (es fehlt gerade die Schnittzahl) interpretiert ” werden kann. Schlusskommentar: Es ist nun wirklich geschafft: Die Antwort auf die Frage Wovon werden wir in der Analysis ausgehen?“ aus Ab” schnitt 1.1 steht in 1.8.2. Das werden wir allen S¨ atzen der Analysis zu Grunde legen. Auch wenn diese S¨ atze mit Es gilt . . .“ beginnen, ” so ist stillschweigend immer gemeint Unter der Voraussetzung von ” 1.8.2 k¨onnen wir folgern, dass . . .“ Soweit der formale Aspekt. Ziel dieses Buches ist es aber, dass Sie eine wirkliche Vorstellung von R gewinnen. Diese Vorstellung wird sich stark an das anlehnen, was Sie als R naiv“ schon vorher kannten. Der Hauptunterschied gegen¨ uber dem ” naiven Vorgehen – und daf¨ ur haben wir uns so viel Arbeit gemacht – besteht darin, dass wir jetzt wissen, welche Eigenschaften zu fordern sind und welche sich als Folgerung ergeben.
1.9
Von R zu C Du, hast Du das vorhin verstanden?“ ” Was?“ ” Die Geschichte mit den imagin¨ aren Zahlen?“ ” Ja, das ist doch gar nicht so schwer. Man muß nur feststellen, daß die ” Quadratwurzel aus negativ Eins die Rechnungseinheit ist.“ Das ist es ja gerade: Die gibt es doch gar nicht . . . “ ” Ganz recht; aber warum sollte man nicht trotzdem versuchen, auch ” bei einer negativen Zahl die Operation des Quadratwurzelziehens anzuwenden?“ Wie kann man das aber, wenn man bestimmt, ganz mathematisch ” bestimmt weiß, daß es unm¨ oglich ist?“ (aus: Die Verwirrungen des Z¨ oglings T¨ orleß“ von Robert Musil.) ”
C
Ausgehend von R haben wir uns schon N , Z und Q (ohne naiv“!) verschafft. ” Hier wollen wir einen weiteren wichtigen Zahlbereich einf¨ uhren, den K¨orper C der komplexen Zahlen. Wir definieren zun¨achst C als die Menge C := R × R und stellen uns C als die kartesische Ebene vor (s. Bild 1.10). Auf dieser Menge definieren wir zwei innere Kompositionen + und • durch: (x1 , y1 ) + (x2 , y2 ) := (x1 , y1 ) • (x2 , y2 ) :=
(x1 + x2 , y1 + y2 ), (x1 x2 − y1 y2 , x1 y2 + x2 y1 );
1.9. VON R ZU C
59
dabei sind +“ und ·“ – also die nicht fett gedruckten Zeichen – die gew¨ ohnliche ” ” Addition bzw. Multiplikation in R . C
2i i −2
−1
1
2
−i −2i Bild 1.10: Die Menge C = R × R Zum ersten Kennenlernen hier zwei konkrete Beispiele: Um etwa die Summe (2, 1) + (−12.2, 3.1) zu bestimmen, muss man nur + (−12.2, 3.1) = (2 − 12.2, 1 + 3.1) = (−10.2, 4.1) (2, 1) + rechnen, und entsprechend leicht ergibt sich (1, 3) • (4, −2) = (1 · 4 − 3 · (−2), 3 · 4 + 1 · (−2)) = (10, 10).
Das sieht sehr merkw¨ urdig aus, insbesondere die Definition von •“ ist u ¨ ber” haupt nicht plausibel. Trotzdem gilt u ¨berraschenderweise: + (bzw. •) ist Satz 1.9.1. (C , + , •) ist ein K¨orper. Das neutrale Element bzgl. + (0, 0) (bzw. (1, 0)). Beweis: Wir werden den Beweis hier nicht vorf¨ uhren. Wirklich alle ben¨ otigten Aussagen folgen aus schon behandelten Eigenschaften von R . Die Rechnungen sind Routine, wenn auch teilweise etwas l¨anglich (z.B. der Nachweis des Dis+“ und (1, 0) tributivgesetzes). Als neutrale Elemente ergeben sich (0, 0) f¨ ur + ” f¨ ur •“. Es gibt nur eine einzige Stelle, an der mehr Durchhalteverm¨ ogen ge” fordert ist, n¨ amlich beim Beweis, dass jedes von Null verschiedene Element ein multiplikativ Inverses besitzt. Da hier (0, 0) die Null ist, bedeutet das den Nachweis der folgenden Aussage: Zu jedem (x0 , y0 ) = (0, 0) existiert ein (x, y) mit (x0 , y0 ) • (x, y) = (xx0 − yy0 , xy0 + yx0 ) = (1, 0). Es ist also zu zeigen: ⎧ Das Gleichungssystem (f¨ ur x, y): ⎪ ⎨ xx − yy = 1 0 0 (x0 , y0 ) = (0, 0) ⇒ ⎪ xy0 + yx0 = 0 ⎩ ist l¨osbar.
60
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Man ist versucht, die L¨osung – gefunden mit elementarer Schulmathematik – x=
y0 x0 , y=− 2 x20 + y02 x0 + y02
sofort hinzuschreiben, doch Achtung: Woher wissen wir denn, dass x20 + y02 = 0 ist? Im vorliegenden Fall geht wirklich alles gut, wenn auch nicht trivialerweise. Sie m¨ ussen schon Satz 1.4.3(iv) (also ein ordnungstheoretisches Argument) bem¨ uhen, um aus (x0 , y0 ) = (0, 0)“ die Aussage x20 + y02 = 0“ folgern zu ” ” k¨ onnen. In C gibt es Elemente mit bemerkenswerten Eigenschaften. Durch Nachrechnen folgt sofort, dass (0, 1) • (0, 1) = (−1, 0) = −(1, 0), man k¨ onnte das kurz als −1 ist eine Quadratzahl“ ausdr¨ ucken. Als wichtige Folgerung erhalten wir ” daraus unter Verwendung von Korollar 1.4.4: In C gibt es keinen Positivbereich +, •) kann nicht angeordnet werden). (oder: (C , + Die bisherige Schreibweise ist leider viel zu schwerf¨ allig. Um dem abzuhelfen, treffen wir folgende Vereinbarung: i
1. Wir setzen zur Abk¨ urzung i := (0, 1) und, f¨ ur x ∈ R , x := (x, 0). Mit dieser Vereinbarung ist (x, y) = x + ur alle (x, y) ∈ C . Nach+ i • y f¨ rechnen ergibt sofort, dass: 0 1 xx x + x
= Null in C , = Eins in C , = x • x , = x + x .
Wegen dieser Beobachtung ist es v¨ ollig unn¨ otig, immer x“ anstatt x“ zu ” ” schreiben, die Unterstreichung darf also weggelassen werden. (Mathematisch bedeutet das, dass wir R als Teilmenge von C auffassen, genauso, wie wir geometrisch die x-Achse als Teilmenge der Ebene auffassen k¨ onnen. Legitim ist das deswegen, weil – wie vorstehend ausgef¨ uhrt – auf R die algebraische Struktur von C mit der von R zusammenf¨ allt.) Außerdem: Da im Falle reeller Zahlen alles zu den alten Ergebnissen f¨ uhrt, ist nicht einzusehen, warum immer +“ und •“ geschrieben werden soll; ” ” +“ und ·“ zu schreiben, kann zu keinen Missverst¨ andnissen f¨ uhren. Das ” ” f¨ uhrt zu Realteil Imagin¨ arteil
2. Wir schreiben f¨ ur (x, y) ∈ C ab jetzt x + iy, die reellen Bausteine“ einer ” komplexen Zahl heißen der Realteil (das ist das x) bzw. der Imagin¨arteil (das y) dieser Zahl. In Formeln: Der Realteil von z wird mit Re z, der Imagin¨arteil mit Im z bezeichnet.
1.9. VON R ZU C
61
Zum Beispiel ist Re (3 + 4i) = 3, Re i = 0, Re 5 = 5, Im (16 − 12i) = −12, Im i = 1.
Außerdem treffen wir die aus R gewohnten Vereinbarungen: Punktrechnung geht vor Strichrechnung, Multiplikationspunkte d¨ urfen weggelassen werden. alt man die Kombiniert man noch C ist ein K¨orper“ mit i2 = −1“ , so erh¨ ” ” Faustregel: Elemente von C sind Ausdr¨ ucke der Form x + iy mit reellen x, y. Es darf gerechnet werden wie von R her gewohnt, und i2 darf stets durch −1 ersetzt werden. (Wegen dieser Faustregel brauchen Sie die Definition der Multiplikation in C auch nicht auswendig zu lernen. Es reicht, wenn Sie sich i2 = −1 merken.) Beispiele: 3 + 4i − 9 + 0.6i = −6 + 4.6i; (3i)(19 + 4i) = 57i + 12i2 = −12 + 57i; (1 + i)(6 − 2i) = 6 − 2i + 6i − 2i2 = 8 + 4i. Zur Vereinfachung von Divisionsaufgaben mit a + ib im Nenner erweitere man mit a − ib, der Nenner wird dann reell18) : 1+i 3−i
= = =
(1 + i)(3 + i) (3 − i)(3 + i) 2 + 4i 10 1 2 + i. 5 5
Wie R wird uns nun auch C immer wieder in S¨ atzen und Anwendungen begegnen. Stark vereinfacht kann man den Zusammenhang zwischen R und C so beschreiben (zum Teil k¨onnen Sie das jetzt schon einsehen): • Aussagen f¨ ur R f¨ uhren zu Aussagen f¨ ur C . • R ist ordnungstheoretisch reichhaltiger; S¨atze, die ordnungstheoretische Schlussweisen enthalten, k¨onnen nicht unmittelbar auf C u ¨ bertragen werden. • C ist algebraisch reichhaltiger. Das muss Ihnen noch sehr vage vorkommen, denn nach unserem bisherigen Kenntnisstand sind R und C beides 18) Ist
z = a + bi, so heißt z := a − bi die zu z konjugiert komplexe Zahl.
62
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN K¨orper. Beachten Sie als Erstes Indiz f¨ ur einen tiefgreifenden Unterschied, dass die Gleichung x2 + 1 = 0 in R keine L¨osung besitzen kann (Korollar 1.4.4), in C aber L¨ osungen existieren. (Eine ersch¨opfende Antwort zu diesem Problem gibt der Fundamentalsatz der Algebra, wir werden ihn in Kapitel 4.6 beweisen.)
Carl-Friedrich Gauß 1777 – 1855
¨ Ubrigens: Schon Mathematiker des 16. Jahrhunderts stießen bei der Behandlung algebraischer Probleme auf die M¨ oglichkeit, durch Einf¨ uhrung komplexer ” Gr¨oßen“ zu wesentlichen Vereinfachungen zu kommen (Beispiel: Die CardanoFormel, durch die Nullstellen von Gleichungen dritten Grades geschlossen angegeben werden k¨onnen). Diese komplexen Gr¨ oßen“ blieben lange Zeit in ei” nem mystischen Halbdunkel, durch die Darstellung als Paare reeller Zahlen (Gauß19) , Argand) ist eine exakte Fundierung m¨ oglich geworden. Der Z¨ ogling T¨ orleß und die Mathematik Die am Anfang dieses Abschnitts beschriebenen Irritationen des jungen T¨orleß sollten, wenn er sich bis hierhin durcharbeiten k¨ onnte, ausger¨aumt sein. Seine Verwirrung r¨ uhrte sicher daher, dass man f¨ ur osbar ist. Erst durch eine Erreelle Zahlen weiß, dass x2 = −1 unl¨ weiterung des Zahlbereichs zu den komplexen Zahlen ist es m¨ oglich, sich auf mathematisch pr¨azise Weise L¨ osungen dieser Gleichung zu verschaffen. T¨orleß ist u ¨ brigens in guter Gesellschaft. Auch heute findet man noch B¨ ucher, in denen allerlei Mysteri¨ oses u ¨ ber die Zahl i verbreitet wird.
19) Gauß war nach allgemeiner Einsch¨ atzung der bedeutendste Mathematiker, der bisher gelebt hat. Von ihm gibt es wichtige Beitr¨ age in quasi allen Teilgebieten der Mathematik. Er war der erste, der einen hieb- und stichfesten Beweis des Fundamentalsatzes der Algebra f¨ uhrte.
1.10. WIE GROSS IST R ?
1.10
63
Wie groß ist R? Salvatore: Frage ich nun, wieviele Quadratzahlen es gibt, so kann man in Wahrheit antworten, ebensoviel als es Wurzeln gibt, denn jedes Quadrat hat eine Wurzel, jede Wurzel hat ihr Quadrat, kein Quadrat hat mehr als eine Wurzel, keine Wurzel mehr als ein Quadrat. . . . Und doch sagten wir, dass es mehr Zahlen als Quadrate gibt. Sagredo: Was ist denn zu tun, um das Problem zu l¨ osen? Salvatore: Ich sehe keinen anderen Ausweg als zu sagen, dass die Attribute des Gleichen, des Gr¨ oßeren und des Kleineren bei Unendlichem nicht gelten. (Aus den Discorsi“ von Galileo Galilei, 1638, Erster Tag) ”
Alle ben¨ otigten Axiome f¨ ur R sind bereitgestellt, wir gehen davon aus, dass wir es mit einem archimedisch angeordneten, vollst¨andigen K¨ orper zu tun haben. Es k¨ onnte ja nun sein, dass es viele verschiedene M¨oglichkeiten gibt, sich so ein R zu verschaffen: Das ist aber nicht der Fall, im n¨achsten Abschnitt werden wir kurz skizzieren, in welchem Sinn R eindeutig bestimmt ist. Alle Mathematiker dieser Welt, auch die in Vergangenheit und Zukunft, haben es also mit dem gleichen Objekt zu tun. Nat¨ urlich m¨ochte man m¨oglichst viel dar¨ uber erfahren, in diesem Abschnitt k¨ ummern wir uns um die Gr¨oße“ von R . ” Nun ist es in der Mathematik so, dass Fragen nach dem Vorliegen von irgendwelchen Attributen eigentlich nie sinnvoll gestellt, geschweige denn beantwortet werden k¨ onnen: Niemand w¨ usste zu sagen, was R ist groß“ eigentlich bedeuten ” soll. Anders sieht es mit Aussagen der Form Q hat genauso viele Elemente ” wie N“ und R ist gr¨oßer als Q“ aus. Dazu kann die Mathematik etwas beitra” gen, in diesem Abschnitt wollen wir die Grundz¨ uge der zugeh¨ origen – auf Georg Cantor zur¨ uckgehenden – Theorie kennen lernen. Sie ist f¨ ur sich interessant, und wir werden einige Ergebnisse im Folgenden ben¨ otigen. Um beginnen zu k¨onnen, m¨ ussen wir etwas mehr von der Mengenlehre wissen, als wir in Abschnitt 1.2 behandelt haben. Deswegen gibt es zun¨ achst einen Exkurs: Erg¨ anzungen zur Mengenlehre Zur Erinnerung: Eine Abbildung ist doch eine Zuordnungsvorschrift, die jedem Element einer Menge M genau eine Element einer Menge N zuordnet. Manchmal kommt es vor, dass niemals zwei Elemente aus M auf das gleiche Element von N abgebildet werden oder dass alle Elemente aus N getroffen“ ” werden. Abbildungen mit diesen Eigenschaften spielen eine wichtige Rolle. Hier die daf¨ ur u ¨ bliche Bezeichnungsweise: Definition 1.10.1. Seien M und N Mengen und f : M → N eine Abbildung. (i) f heißt injektiv, wenn aus m1 = m2 stets f (m1 ) = f (m2 ) folgt. (ii) f heißt surjektiv, wenn f¨ ur alle n ∈ N ein m ∈ M mit f (m) = n existiert. (iii) f wird bijektiv genannt, wenn f sowohl injektiv als auch surjektiv ist. (iv) Ist f : M → N bijektiv, so kann man die so genannte inverse Abbildung
injektiv surjektiv bijektiv f −1
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
64
f −1 : N → M definieren. Sie ordnet jedem n ∈ N das eindeutig bestimmte m zu, f¨ ur das f (m) = n gilt. Das ist, zugegeben, ein bisschen viel auf einmal, wenn Sie diese Begriffe hier zum ersten Mal sehen. Vielleicht hilft es, mit diesen Definitionen ein anschauliches Bild zu verbinden: A
f
B
A
Bild 1.11: allgemeines f A
f
B
Bild 1.13: surjektiv
f
B
Bild 1.12: injektiv A
f
B
Bild 1.14: bijektiv
Zur Illustration gibt es einige Bemerkungen und Beispiele: 1. Da p ⇒ q“ gleichwertig zu ¬q ⇒ ¬p“ ist, kann Injektivit¨ at alternativ auch ” ” so definiert werden: f ist injektiv, wenn aus f (m1 ) = f (m2 ) stets m1 = m2 geschlossen werden kann. 2. M und N seien die Menge Z der ganzen Zahlen, wir betrachten die durch z → z + 12 definierte Abbildung f . Die ist injektiv, denn aus f (z1 ) = f (z2 ) (d.h. aus z1 + 12 = z2 + 12) folgt durch Addition von −12, dass z1 = z2 gelten muss. Sie ist auch surjektiv, denn f¨ ur jedes ganzzahlige w findet man ein ganzzahliges z mit w = z + 12; man definiere einfach z := w − 12. Folglich liegt sogar eine bijektive Abbildung vor. Die inverse Abbildung entsteht, indem man w = z + 12 nach z aufl¨ ost: z = w − 12. Deswegen ist f −1 durch w → w − 12 definiert. 3. M und N seien wie vorstehend, diesmal interessieren wir uns f¨ ur die Abbildung z → z 2 . Ist die injektiv? Stimmt es, dass verschiedene Zahlen verschiedene
1.10. WIE GROSS IST R ?
65
Quadrate haben? Nein, denn stets ist z 2 = (−z)2 . Die Abbildung ist also nicht injektiv. Ist sie surjektiv, ist jede ganze Zahl das Quadrat einer ganzen Zahl? Wieder nein, denn negative Zahlen, aber auch 2, 3, 5, . . . treten nicht als Quadrat auf. 4. Hat man sich eine Abbildung durch ihren Graphen veranschaulicht, so kann man die Injektivit¨ at und Surjektivit¨at sehen“. Eine Abbildung ist genau dann ” injektiv (bzw. surjektiv bzw. bijektiv), wenn jede waagerechte Gerade den Graphen h¨ ochstens einmal schneidet (bzw. mindestens einmal bzw. genau einmal schneidet). 5. Hier soll eine spezielle Abbildung f von N nach Z diskutiert werden. f soll dadurch definiert sein, dass die Zahlen 1, 2, . . . auf 0, 1, −1, 2, −2, 3, −3, . . . abgebildet werden20) . Da in 0, 1, −1, 2, −2, . . . alle ganzen Zahlen auftreten und keine Zahl mehrfach vorkommt, ist f bijektiv. Folgerung: Es gibt eine bijektive Abbildung von N nach Z. (Warum das bemerkenswert ist, wird gleich erl¨autert.) 6. Inverse Abbildungen spielen an verschiedenen Stellen eine Rolle. Zum Beispiel ist die n-te Wurzel, die wir sp¨ater kennen lernen werden, die inverse Abbildung zu x → xn , der Logarithmus ist invers zur Exponentialfunktion usw. (Ende des Exkurses zur Mengenlehre) So, nun k¨ onnen wir sagen, wann wir zwei Mengen als gleich groß ansehen wollen. Das verallgemeinert den entsprechenden Sachverhalt f¨ ur endliche Mengen, jeder weiß doch, dass zum Beispiel {1, 2, 3, 4} und {7.2, −2, 55, 100000} die gleiche Anzahl von Elementen haben. Definition 1.10.2. M und N seien Mengen. (i) M und N sollen isomorph (oder auch gleichm¨achtig) heißen, wenn es eine bijektive Abbildung f von M nach N gibt. Man sagt dann auch, dass M und N die gleiche Kardinalzahl haben und schreibt card (M ) = card (N ).
card (N )
(ii) Ist M gleichm¨achtig zur Menge der nat¨ urlichen Zahlen, so sagt man, dass M abz¨ ahlbar ist.
abz¨ ahlbar
(iii) Ist eine Menge M nicht gleichm¨achtig zu einer Teilmenge der nat¨ urlichen Zahlen, so heißt sie u ¨berabz¨ahlbar.
u ahlbar ¨ berabz¨
(iv)
card (M ) ≤ card (N )“ wird als Abk¨ urzung f¨ ur die Aussage verwendet, ” dass es eine injektive Abbildung von M nach N gibt.
Diese Definition von hat genau so viele Elemente wie“ ist gew¨ ohnungs” bed¨ urftig. 20) Wer auf eine Definition ohne P¨ unktchen Wert legt, kann das durch eine Definition durch Fallunterscheidung erreichen: Es soll f (n) := n/2 f¨ ur gerade n und f (n) := −(n − 1)/2 f¨ ur ungerade n sein.
66
endlich
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Wir betrachten zun¨achst den Fall endlicher Mengen etwas genauer, da gibt ¨ es noch keine Uberraschungen. Zun¨ achst definieren wir, was endlich“ eigentlich ” heißen soll: Eine Menge M wird endlich genannt, wenn sie leer ist oder wenn es ein n ∈ N so gibt, dass M und die Menge {1, . . . , n} (das ist die Abk¨ urzung von {m | m ∈ N , 1 ≤ m ≤ n}) gleichm¨ achtig sind, wenn man also die Elemente aus M mit den Zahlen 1, . . . , n durchnummerieren kann. Die Zahl n heißt die Anzahl der Elemente von M . Es gelten dann die folgenden Aussagen: • Eine Menge M ist genau dann endlich, wenn es keine echte Teilmenge von M gibt, die gleichm¨achtig zu M ist. • Teilmengen endlicher Mengen sind wieder endlich. • Die Vereinigung von zwei endlichen Mengen ist endlich. • Die Potenzmenge einer endlichen Menge ist endlich. Die Beweise sollen hier nicht gef¨ uhrt werden, da wir von diesen Ergebnissen keinen Gebrauch machen werden. (Wenn Sie es selbst versuchen, werden Sie feststellen, dass sie schwieriger sind, als man es bei diesen offensichtlichen“ ” Tatsachen erwarten w¨ urde.) Kardinalzahlen Manchen wird aufgefallen sein, dass wir bisher nur definiert haben, was es bedeutet, dass zwei Mengen die gleiche Kardinalzahl haben. Es wurde aber nicht gesagt, was eine Kardinalzahl nun eigentlich ist. Was also bedeutet card (M ), zum Beispiel f¨ ur eine dreielementige Menge M ? Die naive Antwort: Diese Kardinalzahl ist gleich drei. M¨ ochte man es allgemein und exakt machen, ist die Antwort schwierig. Die Ann¨ aherung an die richtige Antwort sieht wie folgt aus. Wir fassen alle diejenigen Mengen zu einem neuen Objekt zusammen, welche die gleiche Kardinalzahl haben. Demnach w¨ are 3“ eigentlich die Gesamtheit ” aller dreielementigen Mengen. Nichtmathematikern begegnen u ano¨brigens manchmal a ¨hnliche Ph¨ mene. Man kann z.B. von zwei großen B¨ uffelherden auch dann feststellen, dass sie gleich viele Tiere enthalten, wenn man u ¨berhaupt nicht z¨ahlen kann, man braucht die Tiere ja nur paarweise durch ein Tor laufen zu lassen. F¨ ur unendliche Mengen kann es merkw¨ urdige Ph¨ anomene geben, die schon Galilei vor fast 400 Jahren aufgefallen sind (vgl. das Motto zu Beginn dieses Abschnitts). Zum Beispiel ist die Menge M := {1001, 1002, 1003, . . .} gleichm¨ achtig zur Menge N , also abz¨ahlbar, denn eine bijektive Abbildung von M nach N ist mit n → n − 1000 schnell gefunden. Noch u ¨ berraschender ist, dass N und Z gleich viele Elemente haben, Z also abz¨ ahlbar ist (das haben wir vor wenigen Zeilen bewiesen). Wir stellen noch einige Ergebnisse zusammen:
1.10. WIE GROSS IST R ?
67
• Sind M und N und ebenfalls N und K gleichm¨ achtig, so auch M und K. (Das liegt an der elementaren Tatsache, dass Kompositionen bijektiver Abbildungen wieder bijektiv sind.) • Aus card (M ) = card (N ) folgt card (N ) = card (M ). (Hier ist zu beachten, dass die inverse Abbildung f −1 einer bijektiven Abbildung f ebenfalls bijektiv ist.) • Gilt card (N ) ≤ card (M ) sowie card (M ) ≤ card (N ), so impliziert das card (M ) = card (N ). (Das ist ein tief liegendes Ergebnis, der Satz von Schr¨ oder-Bernstein, den wir hier nur zitieren.) • F¨ ur beliebige Mengen M und N gilt stets card (M ) ≤ card (N ) oder card (N ) ≤ card (M ). Auch das ist schwierig zu zeigen. Wir beweisen nun zwei ber¨ uhmte S¨atze zum Thema abz¨ ahlbar“, die beide ” auf Georg Cantor zur¨ uckgehen. Satz 1.10.3. Q ist abz¨ahlbar. Beweis (1. Cantorsches Diagonalverfahren): Man schreibe Q als quadratisches Schema, etwa • in die erste Zeile alle
m mit n = 1, n
• in die zweite Zeile alle
m mit n = 2, n
• usw. Dabei sind schon einmal ber¨ ucksichtigte Elemente fortzulassen (wie etwa 2/2 in Zeile 2). Dieses Schema kann dann leicht – etwa wie durch den eingezeichneten Abz¨ ahlungsvorschlag – bijektiv auf N abgebildet werden21) : 0
1
−1
2
−2
3 ···
1 2
− 12
3 2
− 32
5 2
− 52 · · ·
1 3
− 13 .. .
2 3
− 23 .. .
4 3
− 43 · · · .. .
.. .
.. .
.. .
Satz 1.10.4. R ist nicht abz¨ahlbar. Insbesondere muss es reelle Zahlen geben, die nicht rational sind. 21) Die
Skizze ist so zu interpretieren: 1 wird auf 0 abgebildet, 2 auf 1, 3 auf 1/2 usw.
68
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Beweis (2. Cantorsches Diagonalverfahren): Der Zusatz ist klar: W¨ are R = Q , so w¨are ja R nach dem 1. Diagonalverfahren abz¨ ahlbar. Wir zeigen, dass es keine surjektive Abbildung von N nach R gibt (erst recht keine bijektive), d.h.: f : N → R vorgelegt ⇒ es existiert x ∈ R mit f (n) = x f¨ ur alle n ∈ N . Sei also f : N → R vorgegeben. Mit an ∈ {0, . . . , 9} bezeichnen wir die n-te Ziffer nach dem Komma in der Dezimalzahlentwicklung von f (n). (Es ist also a3 = 4, falls f (3) = 412.1241, oder a7 = 0, falls f (7) = 97. Die Dezimalentwicklung benutzen wir hier im Vorgriff, mehr dazu wird in Abschnitt 4.5 gesagt werden.) Definiert man nun f¨ ur jedes n ∈ N 1 falls an = 1 bn := 2 falls an = 1, so ist b := 0.b1 b2 b3 . . . ganz bestimmt ein Element aus R , das von allen f (n) verschieden ist22) : b und f (n) unterscheiden sich (mindestens) in der n-ten Stelle nach dem Komma. Die ganze Wahrheit ist sogar noch u ¨ berraschender: Egal, wie nahe zwei Zahlen a und b mit a < b beieinander liegen, die Menge {x | x ∈ R , a < x < b} ist gleichm¨ achtig zu R und folglich nicht abz¨ ahlbar. Wie eine bijektive Abbildung zwischen dieser Menge und R aussehen k¨ onnte, soll am Spezialfall A := {x | x ∈ R , 0 < x < 2} skizziert werden. Man definiert f : A → R durch f (x) := (1/x) − 1 f¨ ur 0 < x ≤ 1 und f (x) := 1/(x − 2) + 1 f¨ ur 1 ≤ x < 2. Diese aus zwei Hyperbelb¨ ogen zusammengesetzte Abbildung ist bijektiv. (Wenn Sie das beweisen m¨ ochten, sollten Sie vorher eine Skizze machen, dann ist der Nachweis eigentlich ganz einfach.)
Kardinalzahlbeweise Kardinalzahlbeweise sind oft ein wirkungsvolles Hilfsmittel, um zu Existenzaussagen zu kommen. Die Idee ist einfach: A ⊂ B sei vorgegeben. Wenn man nun in der Lage ist zu zeigen, dass keine bijektive Abbildung zwischen A und B existieren kann, so muss A eine echte Teilmenge sein, denn im Fall A = B ist ja so eine Abbildung leicht angebbar. Anders ausgedr¨ uckt: Es muss dann Elemente aus B geben, die nicht zu A geh¨oren. Der Nachteil derartiger Beweise ist, dass man damit kein einziges konkretes b ∈ B gefunden hat, das nicht in A liegt. Der entsprechende Nachweis kann viel schwieriger sein. 22) Die b , b , . . . dienen also als Ziffern f¨ ur die Dezimalentwicklung von b. Sollte es zum 1 2 Beispiel so sein, dass kein einziges an gleich 1 ist, so wird b als 0.11111111 . . . – also als 1/9 – definiert.
¨ 1.11. ERGANZUNGEN
1.11
69
Erg¨ anzungen
Der konstruktive“ Weg ” Wie schon erw¨ ahnt: Man kann bei geh¨origem Arbeitsaufwand auch mit einem sehr viel kleineren Axiomensystem zum Ziel kommen. Bei dieser (so genannten) konstruktiven Begr¨ undung der Analysis geht man aus von den Peano23) -Axiomen: N ist eine Menge zusammen mit einer Abbildung n → n und einem ausgezeichneten Element 1, so dass die folgenden Bedingungen erf¨ ullt sind:
Guiseppe Peano 1858 – 1939
1. n = m ⇒ n = m. 2. n ∈ N ⇒ n = 1. 3. Ist A ⊂ N vorgelegt mit 1 ∈ A und (n ∈ A ⇒ n ∈ A), so ist A = N. Alles, was nun kommt, h¨atte zu beginnen mit Unter der Voraussetzung der ” Peano-Axiome gilt . . .“ Ein m¨ uhevoller Weg, bei dem immer und immer wieder besonders das letzte der Peano-Axiome (das Induktionsaxiom) ausgenutzt wird, f¨ uhrt dann von N zu R . Die Etappen auf diesem Weg werden nun kurz angedeutet. ¨ Da Aquivalenzrelationen dabei eine ganz wichtige Rolle spielen, muss vor¨ bereitend einiges dazu gesagt werden. Eine Aquivalenzrelation auf einer Menge 24) M ist eine Relation π auf M mit den folgenden Eigenschaften: • π ist reflexiv , es gilt also stets m π m. • π ist symmetrisch: Aus m1 π m2 folgt m2 π m1 . • π ist transitiv: Aus m1 π m2 und m2 π m3 folgt m1 π m3 . ¨ Aquivalenzrelationen sind die mathematische Pr¨azisierung derjenigen Relationen, die man aus dem t¨aglichen Leben als . . . ist genauso gut wie . . .“ oder ” . . . ist gleichwertig zu . . .“ kennt. Zum Kennenlernen sollte man sich klarma” ¨ chen, dass auf jeder Menge =“ eine Aquivalenzrelation ist. F¨ ur ein interessan” teres Beispiel suchen wir uns irgendeine nat¨ urliche Zahl n und betrachten auf Z die Relation z π w genau dann, wenn z − w durch n teilbar ist“. Auch das ” ¨ ist eine Aquivalenzrelation. ¨ Liegt eine Aquivalenzrelation vor, so kann man zu jedem m die Menge aller ¨ m ˜ ∈ M betrachten, f¨ ur die m π m ˜ gilt. Sie heißt die zu m geh¨ orige Aqui” valenzklasse“. Mindestens geh¨ort m dazu, und aufgrund der Forderungen an ¨ ¨ Aquivalenzrelationen sind je zwei Aquivalenzklassen disjunkt25) . 23) Peano ist heute haupts¨ achlich wegen zweier Ergebnisse bekannt: Erstens zeigte er, dass man alle Eigenschaften reeller Zahlen aus einer Handvoll Axiome gewinnen kann, und zweitens bewies er einen wichtigen Existenzsatz f¨ ur Differentialgleichungen. 24) Zur Erinnerung: Eine Relation auf M ist eine Teilmenge von M × M . 25) D.h., ihr Durchschnitt ist leer.
¨ Aquivalenzrelation
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
70
¨ Im Beispiel der Relation =“ sind alle Aquivalenzklassen einelementig, in ” ¨ unserem zweiten Beispiel gibt es genau n Aquivalenzklassen: erstens die Menge aller ganzen Zahlen, die durch n teilbar sind; dann die Zahlen, die beim Teilen durch n den Rest 1 haben; als N¨ achstes die, wo der Rest 2 bleibt; usw., die letzte Klasse besteht aus den Zahlen, die den Rest n − 1 lassen. Es folgt nun eine Konstruktionsskizze: Wie kann man sich R verschaffen, ¨ wenn man nur N kennt und mit Aquivalenzrelationen gut umgehen kann? Der erste Schritt, +“ und ·“ f¨ ur N : Man m¨ ochte wissen, was n + m, n · m ” ” f¨ ur beliebige nat¨ urliche Zahlen m, n bedeutet. Das macht man induktiv durch n + 1 := n , n · 1 := n,
n + (m + 1) := (n + m) ; n · (m + 1) := n · m + n.
Es ist dann schon recht m¨ uhsam nachzuweisen, dass +“ und ·“ die gewohnten ” ” Eigenschaften haben (etwa Kommutativit¨ at oder Distributivgesetz). Der zweite Schritt, die Definition von Z: Wir f¨ uhren auf N × N eine Relation π ein durch (n1 , m1 ) π (n2 , m2 )“ genau dann, wenn n1 + m2 = n2 + m1 . ” ¨ ¨ Diese Relation π entpuppt sich als Aquivalenzrelation, und die Aquivalenzklassen heißen ganze Zahlen“. Z soll die Menge aller ganzen Zahlen sein. ” N
−1 0 1 2
N
Bild 1.15: Veranschaulichung von Z Man kann sich Z leicht veranschaulichen: Jede ganze Zahl z entspricht einer Geraden“ in N × N , die die x-Achse“ gerade bei z schneiden w¨ urde. ” ” N darf als Teilmenge von Z aufgefasst werden, wenn man n ∈ N mit der zu ¨ (n + 1, 1) geh¨origen Aquivalenzklasse identifiziert. Der dritte Schritt, +“ und ·“ f¨ ur Z: z1 , z2 seien ganze Zahlen, wobei z1 ” ” ¨ bzw. z2 die zu (n1 , m1 ) bzw. (n2 , m2 ) geh¨ orige Aquivalenzklasse bezeichne. Wir definieren dann: z1 + z2 z1 · z2
:= :=
die Klasse, die zu (n1 + n2 , m1 + m2 ) geh¨ ort, die Klasse, die zu (n1 n2 + m1 m2 , n1 m2 + n2 m1 ) geh¨ ort.
¨ 1.11. ERGANZUNGEN
71
Hier ist eine Motivationshilfe: Zu diesen Formeln kommt man, wenn man sich z = Klasse zu (n, m)“ heimlich als n − m vorstellt. ” Dann stimmen +“ und ·“ mit den entsprechenden Operatoren auf N u ¨ ber” ” ein, wenn man N ⊂ Z auffasst. Außerdem: In (Z, +, ·) gelten die u ¨ blichen Rechenregeln (genauer: es gelten alle K¨ orperaxiome bis auf M3. Man sagt: (Z, +, ·) ist ein Ring). Der vierte Schritt, von Z nach Q : Zur Konstruktion von Z hatte man sich einen Ersatz f¨ ur die i.A. nicht existierenden Differenzen n − m verschafft. Hier geht es darum, zu den Quotienten m/n mit m ∈ Z, n ∈ N zu kommen. Das Verfahren ist analog: ¨ Auf Z × N wird eine Aquivalenzrelation π ˜ durch (m1 , n1 ) π ˜ (m2 , n2 ) genau dann, wenn m1 n2 = m2 n1 ¨ definiert. Die Gesamtheit der Aquivalenzklassen (die rationale Zahlen genannt werden) heiße Q . Es l¨asst sich Z dann als Teilmenge von Q auffassen, und die Definition von +“ und ·“ auf Q ergibt sich auf kanonische Weise, wenn man ” ” sich an der Vorstellung Klasse zu (m, n) bedeutet m/n“ orientiert. ” urfen. InsbeQ leistet dann wirklich alles, was wir von Q naiv her erwarten d¨ sondere ist Q ein angeordneter K¨orper (mit m/n > 0, falls m, n ∈ N“). ” Der f¨ unfte Schritt, von Q nach R : Das ist wirklich interessant und schwierig (die bisherigen Schritte sind Standardkonstruktionen, die zum t¨ aglichen Brot jedes Algebraikers geh¨ oren. Wegen des hohen Abstraktionsgrades ergeben sich f¨ ur die meisten Anf¨ anger dennoch Schwierigkeiten). Hier ist Plausibilit¨ at oder Anschaulichkeit bei der Definition leider nicht zu verwirklichen. Ein kurzer Abriss des L¨osungsvorschlags von Dedekind muss gen¨ ugen. Dedekind hatte die folgende geniale Idee: Da das Ziel darin besteht, dass jeder Dedekindsche Schnitt ein Objekt aus R (gerade die Schnittzahl) definiert, erkl¨ are man kurzum R als Menge der Dedekindschen Schnitte auf Q . Und unter Wahrung gewisser Vorsichtsmaßregeln (dass man z.B. zwei Schnitte identifiziert, wenn sie in Q die gleiche Schnittzahl haben, etwa den Schnitt ({x | x < 0}, {x | x ≥ 0}) mit achlich! √ ({x | x ≤ 0}, {x | x > 0}) klappt das tats¨ In dieser Definition ist z.B. 2 der Schnitt ({x | x2 < 2 oder x < 0}, {x | x2 > 2 und x > 0}). Wie fast immer geht es nach einer genialen Idee mit der Arbeit erst richtig los. Man muss +“ und ·“ auf R erkl¨aren, d.h z.B. sagen, welchen Schnitt man ” ” unter der Summe zweier Schnitte verstehen will. R wird so ein K¨ orper. Und so weiter. Am Ende steht dann wirklich da: Dieses R gen¨ ugt allen Axiomen aus 1.8.2. Naive Leser k¨ onnten u andig¨ brigens glauben, dass wir wenigstens die Vollst¨ keit von R wegen unserer Definition durch Schnitte fast geschenkt bekommen. Dem ist nicht so, denn die Definition betrifft Schnitte in Q , wir m¨ ussen aber beim Nachweis der Vollst¨ andigkeit Schnitte in R behandeln.
72
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Eindeutigkeit von R Wir wollen nun untersuchen, inwieweit R durch das Axiomensystem eindeutig bestimmt ist. Das ist, wie wir sehen werden, leichter beantwortet als sauber formuliert. Anzustreben ist: Wenn zwei Mathematiker sich auf irgendeine Weise ein Objekt verschaffen, f¨ ur das alle Axiome aus 1.8.2 gelten, so haben beide das gleiche“ Objekt. Das ist deswegen w¨ unschenswert, weil dann beide die gleiche ” Analysis entwickeln werden. Um diesen vagen Ann¨ aherungsversuch durch ein Negativbeispiel zu erl¨autern, betrachten Sie statt des Axiomensystems f¨ ur R das Axiomensystem f¨ ur K¨orper: In diesem Fall ist Eindeutigkeit sicher nicht gegeben, da z.B. die K¨orper Q und {0, 1} bestimmt wesentlich verschieden sind. Da in einer pr¨azisen Definition von Eindeutigkeit sicher eine vern¨ uftige Erkl¨arung von Gleichheit“ vorkommen muss, wollen wir uns zun¨ achst dieser Pro” blematik zuwenden. Was bedeutet Gleichheit in der Mathematik? Dazu erinnern wir uns daran, was Gleichheit im nichtmathematischen Bereich bedeutet. Wichtige Erkenntnis: Unter gleich“ wird ” h¨aufig gleichwertig in Bezug auf . . .“ verstanden. Zum Beispiel: ” • Alle Taxis sind gleich“, wenn es darum geht, zum Flughafen ” zu kommen. Es ist v¨ollig gleichg¨ ultig, welches spezielle Taxi Sie erwischen. • Wenn Sie jemandem die Form einer Violine klarmachen wollen, sind je zwei x-beliebige Violinen gleich (gleich in Bezug auf Form einer Violine“). Das gilt nicht mehr, wenn Sie Gleichheit ” in Bezug auf Klang einer Violine“ demonstrieren wollen. ” • Wenn Sie Papier f¨ ur eine dringende Notiz ben¨ otigen, sind Ihnen ein Telefonbuch oder ein spannender Kriminalroman gleich“. ” In Bezug auf Abendlekt¨ ure“ liegt Gleichheit offensichtlich ” nicht mehr vor. Zur¨ uck zur Mathematik. Wie in den vorstehenden nichtmathematischen Beispielen ist weniger Gleichheit“ schlechthin als vielmehr Gleichheit in Bezug ” ” auf einen (speziellen, von Fall zu Fall eventuell verschiedenen) mathematischen Zusammenhang“ von Interesse. Allgemein definiert man zwei mathematische Objekte als isomorph, wenn sich die f¨ ur den jeweiligen Kontext relevanten Gegebenheiten eineindeutig entsprechen. Isomorphe Objekte sind in der jeweiligen Theorie v¨ollig gleichwertig und k¨ onnen durch nichts voneinander unterschieden werden. Das ist also der f¨ ur die Mathematik angemessene Gleichheitsbegriff. Nun zu den speziellen F¨allen: 1. Mengen: Zwei Mengen M, N sollen isomorph heißen, wenn sich die Elemente eineindeutig entsprechen. Das soll bedeuten: Es gibt eine Abbildung f : M → N , die bijektiv ist.
¨ 1.11. ERGANZUNGEN
73
Diesen Gleichheitsbegriff haben wir im vorigen Abschnitt schon kennen gelernt. 2. K¨ orper: Zwei K¨orper K und L heißen isomorph, falls es eine Abbildung f : K → L gibt, so dass • f ist bijektiv, • f (x + y) = f (x) + f (y), • f (x · y) = f (x) · f (y) (f¨ ur alle x, y ∈ K). −1 (Man k¨ onnte noch fordern, dass f (0) = 0, f (1) = 1, f (x−1 ) = f (x) f¨ ur alle x ∈ K, x = 0, doch das folgt automatisch.) Ein f mit diesen Eigenschaften heißt K¨orper-Isomorphismus. Aus K und L sind isomorph als K¨orper“ folgt offenbar K und L sind ” ” isomorph als Mengen“, die Umkehrung gilt jedoch nicht: R und C sind gleichm¨ achtig, was wir hier aber nicht beweisen wollen. R und C k¨ onnen aber nicht als K¨ orper isomorph sein, da sich z.B. die Aussage x2 + 1 = 0 ist l¨ osbar“ unter K¨ orperisomorphismen ” u agt. ¨ bertr¨
Auch ohne Isomorphiedefinition h¨atten wir bei der Vorgabe des K¨ orpers26) {−1, 17} mit (−1) + (−1) := 17 + 17 := (−1) (−1) + 17 := 17 + (−1) := 17 (−1) · (−1) := 17 · (−1) := (−1) · 17 := (−1) 17 · 17 := 17 schnell zu dem Verdacht kommen k¨onnen, dass das eigentlich“ der wohl” bekannte K¨ orper {0, 1} ist. Jetzt k¨onnen wir das pr¨ aziser fassen: {0, 1} und der eben eingef¨ uhrte K¨orper sind isomorph, man w¨ ahle als Isomorphismus f : {0, 1} → {−1, 17} mit f (0) = −1, f (1) = 17. 3. Angeordnete K¨ orper: Hier verlangt man noch zus¨ atzlich, dass x >K 0 gleichwertig zu f (x) >L 0 ist. Nach diesen Vorbereitungen k¨onnen wir sagen, in welchem Sinn R eindeutig bestimmt ist: Satz 1.11.1. Sind R 1 und R 2 angeordnete K¨orper, die beide den Axiomen aus 1.8.2 gen¨ ugen, so sind R 1 und R 2 als angeordnete K¨orper isomorph. Kurz: Es gibt h¨ochstens ein R (bis auf Isomorphie). 26) Es
ist wirklich ein K¨ orper!
74
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
Beweis: Ziel ist doch, ein f : R 1 → R 2 mit vielen Vertr¨ aglichkeitseigenschaften zu definieren. Das geschieht nach und nach folgendermaßen: Zuerst definiert man f (1) := 1 (eigentlich f (11 ) := 12 ). Notwendig ergibt sich, dass man f (21 ) := 22 usw. definieren muss. Ebenso folgt allgemeiner, dass f (n/m) nur als n/m erkl¨ art werden kann. So erhalten wir einen K¨ orperisomorphismus f von Q (in R 1 ) nach Q (in R 2 ). Ist nun x0 ∈ R 1 beliebig, so betrachte man den Dedekindschen Schnitt ({x | x ∈ Q , x < x0 }, {x | x ∈ Q , x ≥ x0 }) in Q (⊂ R 1 ). f bildet diesen Dedekindschen Schnitt auf einen Dedekindschen Schnitt in Q (⊂ R 2 ) ab, und orige Schnittzahl (deren Existenz durch die wir definieren f (x0 ) als die zugeh¨ Vollst¨andigkeit von R 2 gesichert ist). Dieses f hat dann alle gew¨ unschten Eigenschaften. Der entsprechende Nachweis wird hier nicht gef¨ uhrt. Weitere Kommentare zum Axiomensystem f¨ ur R Das Axiomensystem f¨ ur R ist keineswegs minimal, man h¨ atte auch, wie zu Beginn dieses Abschnitts skizziert, mit der Forderung nach G¨ ultigkeit der Peano-Axiome f¨ ur N beginnen k¨ onnen. Das in 1.8.2 vorgestellte System zeichnet sich dadurch aus, dass es danach gleich mit der Analysis losgehen kann. Demgegen¨ uber ist der Weg von den Peano-Axiomen bis 1.8.2 sehr langwierig, ohne dass das sehr viel mit Analysis zu tun h¨ atte. Als Beispiel daf¨ ur, wie das System 1.8.2 selbst abgemagert“ werden k¨ onnte, ” sei bemerkt, dass die Archimedizit¨ at aus der Vollst¨ andigkeit folgt, also nicht gesondert gefordert zu werden braucht. Beweisidee: Ist (K, +, ·, P ) vollst¨ andig und soll die Archimedizit¨ at gezeigt werden, schließe man indirekt: G¨ abe es ein x0 mit n ∈ N ⇒ ” n < x0“, so betrachte den Schnitt ({x | es existert n ∈ N mit n > x}, {x | x ≥ n f¨ ur alle n ∈ N }). F¨ ur die dazu geh¨ orige Schnittzahl y0 l¨asst sich dann nachweisen, dass y0 − 1 zur rechten Schnitth¨ alfte geh¨ort. So w¨ urde der Widerspruch y0 ≤ y0 − 1 folgen. Weiter: Die Wahl von 1.8.2 als Axiomensystem ist keineswegs die einzige M¨oglichkeit. Insbesondere werden wir in Abschnitt 2.3 verschiedene gleichwertige Varianten des Vollst¨andigkeitsaxioms kennen lernen, also Bedingungen B mit der Eigenschaft 1.8.2 impliziert B“ und Ist K ein archimedisch geordneter ” ” K¨orper mit B, so ist K vollst¨andig“. Man sagt dann, dass B zur Vollst¨ andigkeit ¨aquivalent ist. Das soll Ihnen auch das Verh¨ altnis zwischen Axiom“ und ” Satz“ klarmachen. Jede sinnvolle Bedingung kann Axiom“ oder Satz“ sein, ” ” ” es h¨angt ganz allein vom gew¨ahlten Zugang zur Theorie ab. Um Sie nicht ganz zu verwirren: Unsere Axiome stehen in 1.8.2, was noch kommt, sind S¨ atze der Theorie. Nun zum Problem der Widerspruchsfreiheit. Das ist die Frage, ob man garantieren kann, dass nicht gleichzeitig eine Aussage p0“ und nicht p0“ abgeleitet ” ” werden kann. Um p0 w¨are es m¨oglicherweise nicht schade. Aber in so einem Fall sind formulierbaren Aussagen beweisbar, denn ¨ berhaupt alle u ur jede Aussage q wahr. p0 ∧ ¬p0 ⇒ q“ ist f¨ ”
¨ 1.11. ERGANZUNGEN
75
Ein Beweis k¨ onnte z.B. durch logische Kontraposition gef¨ uhrt werden. Dann ist nur ¬q ⇒ ¬p0 ∨ p0 zu zeigen, und diese Implikation ist f¨ ur alle m¨ oglichen Wahrheitswerte von p0 und q wahr, wie man durch Einsetzen und Ausrechnen mit Hilfe der Wahrheitstafeln sofort sieht.
Was sch¨ utzt uns vor diesem Zusammenbruch der Analysis, diesem u ¨ ber unseren Beweisbem¨ uhungen schwebenden Damoklesschwert?
Nichts! Es ist ungl¨ ucklicherweise nicht m¨oglich, die Existenz von Widerspr¨ uchen auszuschließen. Falls Sie jetzt die Hoffnung haben, dass das nur an der Unf¨ ahigkeit der bisherigen Mathematikergenerationen gelegen hat, steht Ihnen die n¨ achste Entt¨ auschung bevor: Man kann beweisen, dass ein Widerspruchsfreiheitsbeweis im Rahmen der Theorie nicht m¨oglich ist (das wurde von Kurt G¨ odel im Jahre 1931 gezeigt). Mathematiker k¨ onnen mit der Verdr¨angung dieser Tatsache ganz gut leben. Die bisher ohne das Auftreten von Widerspr¨ uchen gefundenen Ergebnisse sind zum Teil derartig kompliziert, dass eine Widerspruchs-Katastrophe als ziemlich unwahrscheinlich angesehen werden darf. Andererseits lehren fr¨ uhe traumatische Ergebnisse der Mathematiker mit der naiven Mengenlehre, dass ein uneingeschr¨ankter Gebrauch von Konstruktionen, die in dieser Theorie auf den ersten Blick zul¨assig sind, nicht m¨ oglich ist. Das bekannteste Beispiel einer Konstruktion, die zu Widerspr¨ uchen f¨ uhrt, stammt von Bertrand Russell: Man betrachte M := {x | x ist Menge, x ∈ / x}. Ist dann p0 die Aussage M ∈ M“, so gilt nicht p0 oder (nicht p0 ) “. ” ” Man sch¨ utzt sich, indem man beim Beweisen das Behandeln von zu großen“ ” Mengen vermeidet, etwa dadurch, dass man zu Beginn eines Satzes eine Menge auszeichnet und alle Konstruktionen, Aussagen, usw. nur auf diese Menge und ihre Teilmengen bezieht. (Das erinnert nat¨ urlich fatal an einen Zahnarzt, der seinem Patienten empfiehlt, nur noch links zu kauen, wenn er rechts beim Essen Schmerzen hat.) F¨ ur die Analysis (und analog f¨ ur andere Zweige der Mathematik) kann man noch ein pragmatisches Argument ins Feld f¨ uhren: Die Folgerungen haben sich bew¨ ahrt, Maschinen arbeiten, Raketen fliegen, Br¨ ucken halten, . . . Falls also wirklich einmal p0 und (nicht p0 )“ auftreten sollte, ist zu hoffen, dass durch ¨ ” geringf¨ ugiges Uberarbeiten der Axiomatik ( nur noch links hinten kauen“) der ” Vor-p0 -Zustand wiederhergestellt werden kann. Abschließend m¨ ochte ich noch kurz auf die Frage eingehen, ob man es nicht ganz anders h¨atte machen k¨onnen. Dazu ist daran zu erinnern, dass unser Axiomensystem einen im Laufe mehrerer Jahrhunderte entwickelten Ausgangspunkt
Bertrand Russell 1872 – 1970
76
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
der Analysis darstellt, der von praktisch allen Mathematikern (abgesehen von einer Hand voll Konstruktivisten) akzeptiert wird. Dass das Ergebnis ausgerechnet so ausgefallen ist, m¨ochte ich auf den Darwinismus in der Mathematik zur¨ uckf¨ uhren: Unter den vielen m¨ oglichen Ans¨ atzen hat sich der hier gew¨ ahlte Zugang am besten bew¨ahrt. F¨ ur ihn spricht: • Die Analysis ist streng begr¨ undbar. • Die Folgerungen sind vern¨ unftig“, entsprechen also den Erwartungen (we” nigstens meistens) und sind auf außermathematische Bereiche gut anwendbar. • Man muss keine geniale Intuition haben, um die Ergebnisse zu verstehen. Besonders durch den letzten Punkt unterscheidet sich die moderne Analysis von der klassischen“ (schauen Sie gelegentlich in die Originalarbeiten von ” z.B. Leibniz, den Bernoullis, Euler, . . . ), kaum jemand vermisst heute die unendlich kleinen Gr¨oßen“, stetige Summen“, usw. ” ” Andererseits: Es gibt einen aus der Modelltheorie entstandenen und vor einigen Jahrzehnten viel diskutierten alternativen Zugang zur Analysis, in dem die unendlich kleinen Gr¨oßen“ ein Comeback erleben (die Nonstandard-Analysis). ” Hauptvorteil ist, dass man endlich versteht“, was Leibniz und den anderen ” wohl vorgeschwebt haben k¨onnte, außerdem kommt man viel schneller zu den Haupts¨atzen der Analysis. Dabei muss man sich allerdings, wenn man alles so streng wie allgemein u uhrlich mit sehr verzwickten Teilen der Mo¨ blich entwickeln m¨ochte, sehr ausf¨ delltheorie besch¨aftigen, und deswegen spricht einiges daf¨ ur, dass diese Variante der Analysis nur eine Episode bleiben wird.
¨ 1.12. VERSTANDNISFRAGEN
1.12
77
Verst¨ andnisfragen
Mathematik lernt man dadurch, dass man aktiv mitdenkt, gewisse Kenntnisse und Fertigkeiten erwirbt und m¨oglichst viele Probleme selber l¨ ost. Diese Aspekte des Lernens werden in diesem Buch wie folgt ber¨ ucksichtigt: • Es gibt im laufenden Text die durch ?“ gekennzeichneten Anregungen ” zum Mitdenken. Die dort gestellten Fragen sollten Sie ohne große M¨ uhe beantworten k¨ onnen, wenn Sie den Text durchgearbeitet haben. Es handelt sich wirklich nur um Anregungen, ich empfehle Ihnen, sich – besonders in sp¨ ateren Kapiteln – viele entsprechende Fragen selber zu stellen, um das Gelernte zu festigen. • Außerdem haben wir f¨ ur Sie nach jedem Kapitel Verst¨andnisfragen vorbereitet: Was sollten Sie nach diesem Kapitel kennen, was sollten Sie k¨onnen? Es geht also um Sachfragen und Methodenfragen, sie sind im entsprechenden Abschnitt mit S1, S2, . . . bzw. mit M1, M2, . . . bezeichnet. Dabei handelt es sich um die absolute Grundausstattung, das, was hier aufgef¨ uhrt ist, sollten Sie ganz sicher wissen und im Schlaf beherrschen. In manchen F¨ allen werden Sie die konkreten Beispiele zu einem Abschnitt erst nach dem Durcharbeiten sp¨aterer Abschnitte behandeln k¨ onnen (wenn zum Beispiel eine Mengengleichheit an einem Beispiel ge¨ ubt werden soll, in dem es um K¨ orper geht). Dadurch kann man mehrere Aspekte gleichzeitig ber¨ ucksichtigen. Die Antworten zu den Sachfragen sind auf der zum Buch eingerichteten Internetseite http://www.math.fu-berlin.de/~behrends/analysis zu finden. ¨ • Schließlich gibt es noch die Ubungsaufgaben unterschiedlichen Schwierig¨ keitsgrades, das ist sicher die anspruchsvollste Gelegenheit zum Uben. Wir haben f¨ ur Sie einige Musterl¨osungen ausgearbeitet, die Sie ebenfalls auf der Internetseite finden k¨onnen.
Zu 1.2 Sachfragen S1: Wie lautet die Cantorsche Definition einer Menge? S2: Nennen Sie zwei M¨ oglichkeiten, Mengen zu definieren. S3: Was bedeuten ∈, ∈, ∩, ∪, ⊂, =, \, Potenzmenge“, Produktmenge“ in der ” ” Mengenlehre? S4: Was ist eine Abbildung? S5: Was ist eine Relation (insbesondere: Abbildungsrelation)? Methodenfragen M1: M ⊂ N bzw. N = M nachweisen k¨ onnen.
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
78 Zum Beispiel:
1. Ist (K, +, ·) ein K¨ orper und x ∈ K \ {0}, so ist {xy | y ∈ K} = K. 2. Ist (K, +, ·, P ) ein angeordneter K¨ orper, so ist {x2 | x ∈ K} ⊂ P ∪ {0}. Gilt im Allgemeinen die Gleichheit? M2: Abbildungen/Abbildungsrelationen behandeln k¨ onnen. Zum Beispiel: 1. Welche der folgenden Zuordnungsvorschriften definieren Abbildungen:
• g1 : N → N ,
1 x+1 n → 12n
• g2 : N → Z,
n → (die kleinste Primzahl ≥ n)
• g3 : N → Z,
n → (die gr¨ oßte Primzahl ≤ n)
• h : R → R,
x →
• r : R → R,
x →
• f : R → R,
x →
x2 0 1 2
x≥0 x≤0
x2 −x
x≥1 x≤1
2. F¨ ur welche M ist R := M × M Abbildungsrelation auf M ? 3. Bestimmen Sie A := {1, −1} × {1, 11} und B := ∅ × Q naiv .
Zu 1.3 Sachfragen S1: Was ist eine innere Komposition? Beispiele? S2: Was bedeutet (f¨ ur innere Kompositionen) assoziativ“, kommutativ“, neutrales ” ” ” Element“, inverses Element“? ” S3: Was ist ein K¨ orper? S4: Was ist der Restklassenk¨ orper modulo p? Methodenfragen M1: Eigenschaften innerer Kompositionen nachpr¨ ufen k¨ onnen. Zum Beispiel f¨ ur: 1. ∗ : (m, n) → m ∗ n := m + 2n, definiert auf R . 2. Die Abbildungsverkn¨ upfung ◦ auf der Menge der Abbildungen von M nach M ; dabei ist M eine Menge.
¨ 1.12. VERSTANDNISFRAGEN
79
Zu 1.4 Sachfragen S1: Was ist ein angeordneter K¨ orper? S2: Man nenne eine hinreichende Bedingung daf¨ ur, dass ein K¨ orper K nicht angeordnet werden kann. Methodenfragen M1: Nachpr¨ ufen k¨ onnen, ob ein Positivbereich vorliegt. Zum Beispiel: √ orper ist. Ist dann 1. Man zeige zun¨ √ achst, dass K := Q + 2 Q ein K¨ P := {a + b 2 ∈ K | a, b ∈ Q , a, b ≥ 0} ein Positivbereich? 2. Sei K der K¨ orper der rationalen Funktionen u ¨ber R (vgl. Anfang von Abschnitt 1.7). Man definiere P :=
n i i=0 ai x m i b x i=0 i
a n bm < 0 .
Ist P ein Positivbereich?
Zu 1.5 Sachfragen S1: Wie ist N auf naive Weise definiert? S2: Was ist eine induktive Teilmenge eines angeordneten K¨ orpers? S3: Wie lautet die exakte Definition von N ? S4: Was besagt das Beweisprinzip der vollst¨ andigen Induktion? S5: Was bedeutet die Aussage N ist wohlgeordnet“? ” Methodenfragen M1: Beweise durch vollst¨ andige Induktion f¨ uhren k¨ onnen. F¨ ur q ∈ K mit q = 1 ist
n k=0
qk =
q n+1 −1 . q−1
M2: Nachpr¨ ufen k¨ onnen, ob Teilmengen wohlgeordnet sind. Welcher der folgenden R¨ aume ist wohlgeordnet? 1. M := {x ∈ R | x > 0}. 2. M := irgendeine Teilmenge von N“. ” 3. M := {x ∈ R | 0 ≤ x ≤ 1}.
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
80 Zu 1.6 Sachfragen
S1: Wie sind Z und Q definiert? S2: Kennen Sie eine konkret angebbare irrationale Zahl? Wie beweist man die Irrationalit¨ at in diesem Fall? Zu 1.7 Sachfragen S1: Was besagt das Archimedesaxiom? S2: Was besagt der Dichtheitssatz? Zu 1.8 Sachfragen S1: Was ist ein Dedekindscher Schnitt, was ist eine Schnittzahl? S2: Was bedeutet (K, +, ·, P ) ist vollst¨ andig“? ” S3: Woran liegt es, dass Q nicht vollst¨ andig ist? S4: Wie lautet die abschließende Fassung des Axiomensystems f¨ ur R (Punkt 1.8.2 des Buches)? Methodenfragen M1: Paare von Mengen als Dedekindschen Schnitt erkennen k¨ onnen. Welche der folgenden Paare von Teilmengen von R sind ein Dedekindscher Schnitt? 1. (R , ∅). 2. ({x | x < 0}, {x | x > 0}). 3. ({x | x < 100}, {x | x ≥ 100}). 4. ({x | x < 0}, {x | x ≥ 1}). Zu 1.9 Sachfragen S1: Definition von C , wie sind dort +“ und ·“ erkl¨ art? Welches Zahlenpaar wird ” ” als die Zahl i bezeichnet? Wie stellt man komplexe Zahlen unter Verwendung reeller Zahlen und der Zahl i dar? S2: Wie ist die Aussage R ⊂ C gemeint? S3: Kann C angeordnet werden? S4: Was sind f¨ ur eine komplexe Zahl z der Realteil und der Imagin¨ arteil, was ist die zu z konjugiert komplexe Zahl? Methodenfragen M1: Rechnungen in C durchf¨ uhren k¨ onnen.
¨ 1.13. UBUNGSAUFGABEN
81
Zum Beispiel: 1. (4 + 9i)(6 − 2i)(1 + i)−1 = ? 2. Es gelte (4 + 9i)z = 21. Wie groß ist z? 3. Es gelte f¨ ur z, w ∈ C : 3iz − w (1 − i)z + (3 − i)w
= =
1+i 0.
Wie groß sind z und w? Zu 1.10 Sachfragen S1: Was ist eine injektive, surjektive bzw. bijektive Abbildung? Welche Abbildung bezeichnet im Fall der Bijektivit¨ at die Abbildung f −1 ? S2: Wann sagt man, dass zwei Mengen die gleiche Kardinalzahl haben? S3: Was bedeutet M ist abz¨ ahlbar“? ” S4: Welche der Mengen N , Z, Q , R sind abz¨ ahlbar? Welche Aussagen verbergen sich hinter dem ersten und dem zweiten Cantorschen Diagonalverfahren? Methodenfragen M1: Einfache Kardinalzahlbeweise f¨ uhren k¨ onnen. Zum Beispiel: 1. Die Menge der Kubikzahlen ist abz¨ ahlbar. 2. R und {x | x ∈ R , x > 0} haben die gleiche Kardinalzahl. Zu 1.11 Sachfragen S1: Was versteht man unter der konstruktiven Begr¨ undung f¨ ur R ? S2: Was besagen die Peano-Axiome?
1.13
¨ Ubungsaufgaben
Zu Abschnitt 1.2 1.2.1 Man beweise f¨ ur Teilmengen A, B, C einer Menge M : (a) (A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C). (b) (A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C). Beweisen Sie die de Morganschen Regeln: (c) (A ∪ B)c = Ac ∩ B c ,
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
82
(d) (A ∩ B)c = Ac ∪ B c ; Dabei ist Ac , das Komplement von A, definiert durch Ac := {x ∈ M | x ∈ / A}. Sie d¨ urfen die logischen Verkn¨ upfungen und“ und oder“ hier naiv verwenden. ” ” 1.2.2 Welche der folgenden Definitionen ist eine zul¨ assige Abbildungsdefinition: (a) n → n5 , auf N naiv . (b) n/m → n/m2 , auf Q naiv . (c) (x1 , . . . , xm ) → xm , auf K m .
Zu Abschnitt 1.3 1.3.1 Diskutieren Sie die innere Verkn¨ upfung (x, y) →
y x + y x
¨ auf R \ {0}: Uberpr¨ ufen Sie Wohldefiniertheit, Assoziativit¨ at, Kommutativit¨ at, Existenz eines neutralen Elements und Existenz von inversen Elementen. 1.3.2 Sei (K, + +, •) der Restklassenring modulo p, wobei p ∈ N . K ist also die Menge {0, 1, . . . , p−1} zusammen mit den beiden inneren Verkn¨ upfungen + + bzw. •, die durch Rest, der bei Teilen von x + y (bzw. x · y) durch p bleibt
x+ + y (bzw. x • y) :=
gegeben sind. Man zeige, dass (K, + +, •) tats¨ achlich ein K¨ orper ist, falls p eine Primzahl ist. Die folgende Tatsache darf ohne Beweis ausgenutzt werden: Ist f¨ ur zwei nat¨ urliche Zahlen m, n der gr¨ oßte gemeinsame Teiler ggT(m, n) = d, so gibt es ganze Zahlen a, b mit d = am + bn. 1.3.3 (a) Diskutieren Sie die innere Verkn¨ upfung (x, y) → x + 3y auf R , d.h. untersuchen Sie sie auf Assoziativit¨ at, Kommutativit¨ at, Existenz eines neutralen Elements, Existenz von Inversen. (b) Man definiere f¨ ur x, y ∈ R x⊕y
:=
xy
:=
Ist dann (R , ⊕, ) ein K¨ orper?
x + y, x·y . 2
¨ 1.13. UBUNGSAUFGABEN
83
1.3.4 Es sei (K, +, ·) ein K¨ orper und y ein Element aus K. Untersuchen Sie die Abbildung f : K → K, x → x − y, auf Injektivit¨ at, Surjektivit¨ at und Bijektivit¨ at. (Die zugeh¨ origen Definitionen finden Sie in Abschnitt 1.10.) Zu Abschnitt 1.4 +, •) (der Restklassenring modulo p, p eine Primzahl) aus 1.4.1 Kann der K¨ orper (K, + Aufgabe 1.3.2 angeordnet werden? 1.4.2 Man zeige, dass es f¨ ur R nur einen Positivbereich gibt. Hinweis: Es darf ausgenutzt werden, dass zu jeder nicht negativen reellen Zahl eine Wurzel in R existiert. √ √ 1.4.3 Betrachten Sie die Menge K := Q + Q 2 (= {a + b 2 | a, b ∈ Q }). (a) Beweisen Sie, dass K mit den von R geerbten Kompositionen +“, ·“ ein K¨ orper ” ” ist. (b) Man bezeichne mit 0}, √ √ P2 := {a + b 2 ∈ K | a − b 2 > 0}. Man zeige, dass P1 und P2 verschiedene Positivbereiche sind. √ Hinweis: Man darf verwenden, dass 2 irrational ist. Warum ist das wichtig, um zu garantieren, dass P2 wohldefiniert ist? 1.4.4 F¨ ur a, b, c, d ∈ R mit b > 0 und d > 0 zeige man: a c < b d
a a+c c < < . b b+d d
⇒
Zu Abschnitt 1.5 1.5.1 Beweisen Sie die folgenden Summenformeln: (a)
n
k2 =
k=1
(b)
n
1 n(n + 1)(2n + 1). 6
k3 =
k=1
1 2 n (n + 1)2 . 4
1.5.2 Finden und beweisen Sie eine Formel f¨ ur die Zeilensummen in dem folgenden “Dreieck der ungeraden Zahlen”: 1 3 7 21
13 ···
5 9
15
11 17
19
84
KAPITEL 1. DIE MENGE R DER REELLEN ZAHLEN
1.5.3 Beweisen Sie mit vollst¨ andiger Induktion: (a) F¨ ur q ∈ R \ {1} und N ∈ N gilt N
qn =
n=0
1 − q N+1 . 1−q
(b) F¨ ur alle reellen Zahlen x mit 0 ≤ x ≤ 1 und alle nat¨ urlichen Zahlen n gilt: (1 + x)n ≤ 1 + (2n − 1)x. 1.5.4 Auf einer einsamen Insel gibt es n St¨ adte, und zwischen je zwei St¨ adten genau eine direkte Verbindung durch eine Einbahnstraße. Zeigen Sie, dass es einen Weg auf der Insel gibt, auf dem man jede Stadt genau einmal besucht, ohne die Verkehrsregeln zu verletzen. ur alle n ∈ N 1.5.5 Zeigen Sie durch vollst¨ andige Induktion, dass die Zahl n3 − 4n f¨ mit n ≥ 2 durch 3 teilbar ist. 1.5.6 Zeigen Sie durch vollst¨ andige Induktion, dass f¨ ur alle n ∈ N 2n
(−1)k k = n
k=1
gilt. 1.5.7 Beweisen Sie die binomische Formel: (a + b)n =
n k=0
n k n−k a b . k
ur k > 0 durch den Quotienten Dabei ist der so genannte Binomialkoeffizient nk f¨ n · (n − 1) · · · (n − k + 1)/k! erkl¨ art, und n0 := 1. Zu Abschnitt 1.6 1.6.1 Zeigen Sie, dass Q der kleinste K¨ orper ist, der in R enthalten ist. (Genauer: Ist K ⊂ R bez¨ uglich der u orper, so gilt Q ⊂ K.) ¨blichen Operationen ein K¨ 1.6.2 Ist Z wohlgeordnet? Zu Abschnitt 1.7 1.7.1 In R gilt: Zwischen je zwei verschiedenen rationalen Zahlen liegt eine irrationale. Tipp: Es darf ausgenutzt werden, dass es u ¨ berhaupt irrationale Zahlen gibt. Zu Abschnitt 1.8 1.8.1 Schnittzahlen Dedekindscher Schnitte sind eindeutig bestimmt. 1.8.2 Sei (A, B) ein Dedekindscher Schnitt in R . Dann gibt es ein x0 , so dass entweder A = {x | x < x0 }, B = {x | x ≥ x0 } oder A = {x | x ≤ x0 }, B = {x | x > x0 } gilt.
¨ 1.13. UBUNGSAUFGABEN
85
Zu Abschnitt 1.9 1.9.1 Schreiben Sie die folgenden Zahlen in der Form a + ib mit a, b ∈ R : 1+i , 7−i
i3 , 7−i
i19032003 ,
5021234512302
in .
n=1
√ )21 als a + ib mit reellen a, b. (Tipp: Behandeln Sie zuerst 1.9.2 Schreiben Sie ( 1+i 2 2 1+i ( √2 ) .)
1.9.3 Zeichnen Sie die folgenden Mengen in der Gaußschen Zahlenebene: (a) {z ∈ C | |z − 1| = |z + 1|}, (b) {z ∈ C | 1 ≤ |z − i| ≤ 2}, (c) {z ∈ C | Re (z 2 ) = 1}, (d) {z ∈ C | Re ( z1 ) < 12 }. 1.9.4 Beweisen Sie die so genannte Parallelogrammgleichung f¨ ur komplexe Zahlen z und w: |z + w|2 + |z − w|2 = 2 |z|2 + |w|2 . Was bedeutet die Formel geometrisch? Zu Abschnitt 1.10 1.10.1 Zeigen Sie, dass Q + Q
√
2 (vgl. Aufgabe 1.4.3) abz¨ ahlbar ist.
1.10.2 Man beweise: (a) Die Menge aller endlichen Teilmengen von N ist abz¨ ahlbar. (b) Die Menge aller Teilmengen von N ist u ahlbar. ¨ berabz¨ Zu Abschnitt 1.11 1.11.1 Zu einer komplexen Zahl z = a + ib ist die konjungiert komplexe Zahl z gem¨ aß z := a − ib definiert. Man zeige, dass die Konjugation, also die Abbildung C → C , z → z, ein K¨ orperisomorphismus auf C ist.
Kapitel 2
Folgen und Reihen Hauptziel dieses Kapitels ist es, Sie mit dem Konvergenzbegriff vertraut zu machen, dem zweifellos wichtigsten Begriff der gesamten Analysis. So gut wie ¨ alle der in sp¨ ateren Kapiteln folgenden Uberlegungen werden darauf aufbauen. Um zu erl¨ autern, worum es geht, appelliere ich wieder an Ihre Schulkenntnisse. Irgendwann wurde bestimmt die Zahl π eingef¨ uhrt1) , denken Sie etwa an die Formel Kreisumfang = 2 mal π mal Radius. Bei der Anwendung dieser Formel auf konkrete Situationen standen Sie dann vor dem Problem, f¨ ur π einen Zahlenwert einzusetzen, d.h. statt π eine Dezimalzahl zu w¨ ahlen, die gen¨ ugend nahe bei π“ liegt. Die Anzahl der Stellen hinter dem ” Komma (d.h. die G¨ ute der Approximation) wird sich nach der Problemstellung richten. F¨ ur die meisten praktischen Zwecke wird π ≈ 3.14“ gen¨ ugend genau ” sein, in jedem Fall wird u ¨ bliche Taschenrechnergenauigkeit ( π ≈ 3.141592654“) ” ausreichen. Noch weit besser ist der Wert π ≈ 3.1415926535897932384626433832795028841971693993751058209749445 9230781640628620899862803482534211706798214808651328230664709 3844609550582231725359408128481117450284102701938521105559644 6229489549303819644288109756659334461284756482337867831652712 0190914564856692346034861045432664821339360726024914127372458 7006606315588174881520920962829254091715364367892590360011330 5305488204665213841469519415116094330572703657595919530921861 1738193261179310511854807446237996274956735188575272489122793 8183011949129833673362440656643086021394946395224737190702179 8609437027705392171762931767523846748184676694051320005681271 4526356082778577134275778960917363717872146844090122495343014, doch ganz genau ist der immer noch nicht. Schlimmer noch: Man kann beweisen, dass π nicht rational ist, und insbesondere kann keine noch so lange Dezimalzahl den genauen Wert von π wiedergeben. 1) In unserer Analysis ist es bis dahin allerdings noch ein weiter Weg, wir werden π erst in Definition 4.5.14 kennen lernen.
KAPITEL 2. FOLGEN UND REIHEN
88 Von diesem Beispiel lernen wir:
• Es gibt Problemstellungen, bei denen man mit Approximationen zufrieden sein muss. • Derartige Approximationen stehen im Idealfall in jeder gew¨ unschten Genauigkeit (wenigstens im Prinzip) zur Verf¨ ugung. Im π-Beispiel etwa kann sich jeder aus den nachstehenden π-Approximationen 3.14 3.141 3.1415 3.14159 3.141592 .. . einen f¨ ur sein spezielles Problem gen¨ ugend genauen Wert aussuchen. • F¨ ur die Anwendungen ist der genaue Wert v¨ ollig unerheblich. Zur L¨ osung aller praktischen Probleme ist es mehr als ausreichend, die ersten 10 Stellen nach dem Komma zu kennen, insbesondere, da die anderen in die Rechnung eingehenden Daten (Radius usw.) mit wesentlich gr¨ oßeren Fehlern behaftet sind. F¨ ur uns wird es im Folgenden darum gehen, diese doch noch recht vagen Voru ¨ berlegungen zur Grundlage einer geeigneten Theorie werden zu lassen. Abschnitt 2.1 wird Ihnen sehr einfach vorkommen, dort wird die f¨ ur die mathematisch genaue Beschreibung von Approximations-Ph¨ anomenen fundamentale Definition vorgestellt, der Folgenbegriff. Nach der Behandlung von Beispielen und einigen Bezeichnungsweisen geht es dann in Abschnitt 2.2 weiter mit der Frage, wie denn x liegt nahe bei y“ ” pr¨azisiert werden kann. Wir werden das als der Abstand zwischen x und y ” ist klein“ interpretieren, m¨ ussen uns dazu allerdings Gedanken machen, was Abstand“ eigentlich bedeutet. F¨ ur R ist das noch recht einfach, C macht schon ” uhe. wesentlich mehr M¨ Dann aber steht der wichtigsten Definition der Analysis nichts mehr im Wege: Wir k¨onnen sagen, was es heißt, dass eine Folge konvergent ist. Erste mit dieser Begriffsbildung zusammenh¨ angende Ergebnisse werden anschließend diskutiert. Abschnitt 2.3 ist dem Zusammenhang zwischen der Vollst¨ andigkeit von R und Konvergenzaussagen gewidmet. Da spielt ein spezieller Typ von Folgen eine wichtige Rolle: Cauchy-Folgen. Die sind wichtig f¨ ur die gesamte Analysis, wir werden sie sehr ausf¨ uhrlich behandeln. Vollst¨andigkeit l¨asst sich auch durch eine ordnungstheoretische Eigenschaft ausdr¨ ucken. Wir beginnen mit einem Exkurs ¨ uber Ordnungsrelationen, in dem
2.1. FOLGEN
89
die Begriffe Supremum und Infimum eingef¨ uhrt werden. Danach wird dann gezeigt, dass es eine Reihe von gleichwertigen Versionen der Vollst¨ andigkeit gibt, die ich Ihnen in Kapitel 1 noch nicht zumuten wollte, die sich aber wesentlich besser einsetzen lassen werden als Dedekindsche Schnitte. Es ist dann nicht weiter schwer, durch Anwendung der bis dahin erzielten Resultate die wichtigsten Ergebnisse der Reihenrechnung zu erhalten: In Abschnitt 2.4 werden wir mit Hilfe des Konvergenzbegriffs erkl¨ aren, welche Zahl mit x1 + x2 + · · · gemeint ist, wenn x1 , x2 , . . . eine Folge von Zahlen ist. Einige Erg¨anzungen sind in Abschnitt 2.5 zusammengestellt. Wir werden zun¨ achst die aus der Schule bekannte Darstellung von Zahlen als Dezimalzahlen mit Hilfe der Reihenrechnung streng begr¨ unden. Danach k¨ ummern wir uns um die Frage, was denn eine (endliche oder unendliche) Summe bedeuten soll, wenn keine Reihenfolge vorgegeben ist. Anschließend wird darauf hingewiesen, dass viele unserer Ergebnisse in der Sprache der Linearen Algebra sehr einpr¨ agsam formuliert werden k¨onnen. (Keine Sorge, wenn Sie diese Vorlesung noch nicht geh¨ ort haben. Es werden Ihnen zwar einige Aha-Erlebnisse entgehen, alles Weitere werden Sie aber auch trotzdem gut verstehen k¨ onnen.) Abschnitt 2.5 schließt mit einem Versuch, den Begriff Konvergenz“ etwas allgemeiner zu fas” sen.
2.1
Folgen
Obwohl uns vorerst nur Zahlenfolgen interessieren, definieren wir gleich Folgen in beliebigen Mengen: Definition 2.1.1. Sei M eine Menge. Unter einer Folge in M verstehen wir eine Abbildung f : N → M . Da es sich um einen Spezialfall der Abbildungsdefinition handelt, ist alles zu beachten, was Sie u ¨ ber Abbildungen gelernt haben (siehe Kapitel 1 ab Definition 1.2.2): Man hat mehrere M¨oglichkeiten, eine Abbildung zu definieren, und einige Fallen sind auch zu vermeiden. Hinzu kommt, dass der Definitionsbereich N ist, Definitionen k¨ onnen damit auch durch vollst¨andige Induktion vorgenommen werden. Allerdings: Die Schreibweise ist etwas anders als bei Abbildungen. Die heißen doch f , g usw., und das, was einem x zugeordnet wird, bezeichnet man mit f (x). Bei Abbildungen w¨ urde man der Zahl 4 wird 16 zugeordnet“ als f (4) := 16“ ” ” schreiben, bei Folgen verwendet man Indizes, schreibt also a4 := 16“ oder ” x := 16“, je nachdem, ob die Folge durch ein a“ oder ein x“ oder sonstwie ” 4 ” ” bezeichnet werden soll2) . Die Abbildung n → n2 k¨onnte man also als Folge da2 durch definieren, dass man an := n setzt. Meint man die Folge insgesamt, so verwendet man noch Klammern, schreibt also (an ) und spricht von der Folge ” der an“. Einige weitere, in der mathematischen Literatur gebr¨ auchliche Bezeichnungsweisen sind nachstehend durch die Folge n → 2n illustriert: 2) Gesprochen
wird das u ¨brigens einfach als a vier“ oder x vier“. ” ”
Folge
(an )
KAPITEL 2. FOLGEN UND REIHEN
90
• (2n)n∈N ( die Folge zwei n, n aus N“). ” ∞ • (2n)n=1 ( die Folge zwei n, n von 1 bis unendlich“). ” • (2, 4, 6, 8, . . .). (P¨ unktchen sind im Interesse einer suggestiven Darstellung wieder legitim, wenn das Bildungsgesetz leicht zu entschl¨ usseln ist.) Lassen Sie sich nicht durch das Zeichen ∞“ f¨ ur unendlich“ irritieren, das ” ” hat absolut keine inhaltliche Bedeutung. Hier wird nichts unendlich groß, es soll nur ausgedr¨ uckt werden, dass die Indizes n immer weiter wachsen. Um ganz sicherzugehen, dass Sie die neue Schreibweise verstanden haben, folgen noch einige einfache Beispiele zur Illustration: • Sei an := (−1)n+1 . Dann ist (an ) die Folge (1, −1, 1, −1, . . .), das 212-te Folgenglied ist −1. • Die Folge
1 1 1 1 1 kann auch als , , , , . . . geschrieben werden. 2 n∈N 4n 4 16 36 64
• (0, 1, 0, 0, 1, 0, 0, 0, 1, . . .) entsteht durch das Bildungsgesetz eine Null, zwei ” Nullen, drei Nullen, usw., und dazwischen immer eine Eins“. Das n¨ achste Folgenglied w¨are damit eine 0, aber es ist bei dieser Darstellung nicht sofort klar, was – zum Beispiel – das 1 000 000-te Folgenglied ist. ur n ≥ 1 wird eine Folge (an ) durch • Durch a1 := 1, an+1 := 2an + 1 f¨ vollst¨andige Induktion definiert. Die ersten Folgenglieder lauten (1, 3, 7, 15, 31, . . .). Hier noch zwei Beispiele f¨ ur etwas komplizierte Folgen, n¨ amlich eine Funktionenfolge und eine Mengenfolge: • (fn )n∈N , definiert durch fn : R → R , x → xn . Damit ist (fn )n∈N eine Folge in Abb(R , R ), der Menge aller Abbildungen von R nach R . Das erste Folgenelement ist die Abbildung x → x, das zweite die Abbildung x → x2 usw. • (An )n∈N , definiert durch An := {x ∈ R | − n ≤ x ≤ n}. Diesmal kommen also als Folgenglieder Teilmengen von R heraus, (An )n∈N ist damit eine Folge in der Potenzmenge P(R ) von R (vgl. Seite 11). Vorl¨aufig werden wir es nur mit Folgen von reellen und komplexen Zahlen zu tun haben, Sie haben noch eine Weile Zeit, sich an solche etwas komplizierteren Beispiele zu gew¨ohnen. Es ist wichtig, dass Sie sich konkret gegebene Folgen anschaulich vorstellen k¨ onnen. Dazu haben Sie zwei M¨oglichkeiten: Erstens k¨ onnen Sie eine Folge in M als eine achsten Schritt Art Spaziergang in M interpretieren: Sie starten bei a1 , sind im n¨ bei a2 , dann bei a3 , usw.
2.1. FOLGEN
91
a5 M a2 a4
a1 a3
Bild 2.1: Folge als Spaziergang Zweitens k¨ onnen Sie – wenn M eine Teilmenge von R ist – den Graphen der die Folge definierenden Abbildung (das ist eine Teilmenge von N × M ) als Veranschaulichung w¨ ahlen. Betrachten Sie etwa als Beispiel die Folge (1 − n1 )n∈N :
a3 a4 a5 · · ·
a2
0 = a1
1 R
Bild 2.2: (1 − n1 )n∈N , erste M¨oglichkeit
R
1
2
3
4
5
6
7
8 N
Bild 2.3: (1 − n1 )n∈N , zweite M¨oglichkeit Je nach Situation wird eher die erste Variante – bei der man die Folge Schritt f¨ ur Schritt verfolgt – oder die zweite – da liegt die Folge als Ganzes vor – zur Veranschaulichung eines Sachverhalts g¨ unstiger sein. Ist eine Folge vorgelegt, so gibt es mehrere Verfahren, daraus neue Folgen ¨ zu konstruieren. Besonders hervorzuheben ist der Ubergang zu Teilfolgen: Aus einer Folge erh¨ alt man eine Teilfolge, wenn man an der Reihenfolge der Elemente nichts ¨ andert, aber evtl. einige Elemente ausl¨asst, quasi u ¨ berspringt:
KAPITEL 2. FOLGEN UND REIHEN
92 Folge: Teilfolge:
*
* *
*
*
* *
* *
*
* *
* *
*
*
* *
... ...
Alle nachstehenden Beispiele sind Teilfolgen von (1, 2, 3, 4, . . .): (1, 3, 5, 7, . . .), (1, 2, 3, 4, 5, . . .), (1, 2, 4, 5, 7, 8, . . .), (1, 2, 6, 24, . . . , n!, . . .).
?
Wichtig ist also, dass wirklich nur Elemente der Ausgangsfolge – und zwar jeweils h¨ochstens einmal – verwendet werden und die Reihenfolge unbedingt erhalten bleibt. Ansonsten gibt es keine Einschr¨ ankungen, insbesondere darf man auch alle Folgenglieder wiederverwenden oder beliebig große L¨ ucken lassen. Drei Gegenbeispiele: Die Folgen (1, 1, 2, 4, 6, 8, . . .), (2, 1, 4, 3, 6, 5, . . .) und (1, −1, 2, −1, 3, −1, . . .) sind keine Teilfolgen von (1, 2, 3, 4, ...), denn bei der ersten Folge taucht die 1 doppelt auf, bei der zweiten wird die Reihenfolge ver¨andert und bei der dritten gibt es sogar Folgenglieder, die gar nicht in der Ausgangsfolge zu finden sind. Testen Sie, ob Sie Teilfolgen identifizieren k¨ onnen: Welche der folgenden Beispiele sind Teilfolgen von (1, 1, −1, −1, 1, 1, −1, −1, . . .)? (1, 1, 1, 1, . . .), (1, −1, 1, −1, 1, −1, . . .), (1, −1, 1, 1, −1, −1, 1, 1, 1, −1, −1, −1, . . .). Obwohl es nun intuitiv klar sein sollte, was eine Teilfolge ist, fehlt noch eine mathematisch pr¨azise Formulierung. Die ist leider etwas schwerf¨ allig:
Teilfolge
Definition 2.1.2. (an )n∈N und (bn )n∈N seien Folgen in der Menge M . (bn )n∈N heißt Teilfolge von (an )n∈N , wenn es eine Abbildung ϕ : N → N gibt mit (i) ϕ ist strikt monoton, d.h. ϕ(n) < ϕ(m) f¨ ur alle n, m ∈ N mit n < m, und (ii) bn = aϕ(n) f¨ ur alle n. Durch die erste Forderung ist sichergestellt, dass die Reihenfolge erhalten bleibt, die zweite garantiert, dass nur Elemente von (an ) in (bn ) auftreten. Die offensichtliche“ Teilfolge (4, 16, 36, . . .) von (1, 4, 9, 16, . . .) ist auch im ” strengen Sinne eine, man muss nur ϕ(n) = 2n f¨ ur alle n w¨ ahlen. Beachten Sie, dass Sie mitunter mehrere M¨oglichkeiten haben, ein geeignetes ϕ auszuw¨ ahlen. Man kann zum Beispiel (1, 1, 1, . . .) auf viele verschiedene Weisen als Teilfolge von (1, −1, 1, −1, . . .) darstellen. Der Vollst¨andigkeit halber ist noch auf den Begriff Umordnung einer Folge“ ” hinzuweisen. In diesem Fall beh¨alt man die Folgenglieder alle bei, durchl¨ auft sie aber etvl. in einer anderen Reihenfolge.
2.2. KONVERGENZ
93
Z.B. sind (2, 1, 4, 3, 6, 5, . . .), (1, 2, 3, 4, 5, . . .) und die Folge (100, 99, . . ., 2, 1, 200, 199, . . ., 101, 300, . . .) Umordnungen der Folge (1, 2, 3, 4, . . .), nicht jedoch (3, 2, 5, 4, 7, 6 . . .) oder (1, 1, 2, 2, . . .)3) . Auch hier ist die pr¨ azise Definition etwas m¨ uhsam: Definition 2.1.3. (an )n∈N und (bn )n∈N seien Folgen in der Menge M . (bn )n∈N heißt Umordnung von (an )n∈N , wenn es eine bijektive Abbildung 4) ϕ : N → N gibt mit: bn = aϕ(n) f¨ ur alle n ∈ N . ¨ Man kann auf diese Weise durch Ubergang zu Teilfolgen und Umordnungen aus einer einzigen Folge viele neue gewinnen. Das kann man auch iterieren, zum Beispiel eine Teilfolge einer Teilfolge oder eine Umordnung einer Teilfolge betrachten. Manchmal f¨ uhrt das nicht zu wirklich neuen Folgen, denn: • Jede Teilfolge einer Teilfolge von (an ) ist eine Teilfolge von (an ). • Eine Umordnung einer Umordnung von (an ) ist eine Umordnung von (an ). Intuitiv ist das klar, wenn ein strenger Beweis gew¨ unscht wird, der die vorstehenden Definitionen verwendet, ist das auch nicht besonders schwierig. Die erste Aussage folgt daraus, dass die Verkn¨ upfung von monotonen Funktionen wieder monoton ist: Gilt f¨ ur ϕ und ψ die Bedingung 2.1.2(i), so auch f¨ ur ψ ◦ ϕ. F¨ ur die zweite muss man im Wesentlichen nur nachweisen, dass Verkn¨ upfungen bijektiver Abbildungen wieder bijektiv sind. Und wozu das alles? Sp¨ater wird es manchmal wichtig sein zu wissen, dass gewisse sch¨ one“ Eigenschaften von Folgen dann auch f¨ ur alle Teilfolgen und ” alle Umordnungen gelten, ein Beispiel daf¨ ur ist Konvergenz. Auch wird es vorkommen, dass manchmal die Eigenschaften von Teilfolgen einer Folge eine Rolle spielen, um die Folge selbst besser zu verstehen. Und deswegen haben wir diese Konstruktionen gleich zu Beginn angesprochen.
2.2
Konvergenz Convergence is our business (Anzeige der Telekom, Herbst 2002)
Mit Hilfe des Folgenbegriffes sind wir in der Lage, einen Teil unserer Vor¨ uberlegungen zur Zahl π zu Beginn dieses Kapitels zu pr¨ azisieren: Wir haben doch, 3) Die erste dieser beiden Folgen ist keine Umordnung, weil die 1, das erste Folgenglied, nicht verwendet wurde, beim zweiten Beispiel wurden Folgenglieder mehrfach aufgef¨ uhrt. 4) vgl. Definition 1.10.1.
Umordnung
94
KAPITEL 2. FOLGEN UND REIHEN
als wir π durch 3.14 3.141 3.1415 3.14159 3.141592 .. . besser und besser“ beschreiben wollten, die durch ” an := Dezimalbruchentwicklung von π auf n + 1 Stellen“ ” definierte Folge (an ) betrachtet, um dadurch f¨ ur immer gr¨ oßere“ n die Zahl π ” durch an immer genauer“ zu approximieren. ” Wie aber kann man das mathematisch pr¨ azise ausdr¨ ucken? Wir behandeln dazu zun¨achst die Frage, was denn eigentlich der Abstand zweier Zahlen“ genau ” bedeutet. Aus technischen Gr¨ unden diskutieren wir den Fall reeller und komplexer Zahlen getrennt, der zweite ist deswegen etwas schwieriger zug¨ anglich, weil wir uns als Vorbereitung um die Existenz von Wurzeln k¨ ummern m¨ ussen. Danach, in Definition 2.2.9, ist es dann Zeit f¨ ur die wichtigste Definition dieses Buches. Der Abstand zweier Zahlen: reelle Zahlen Wie k¨onnte man den Abstand zweier reeller Zahlen definieren? Dazu lassen wir uns von unserer außermathematischen Erfahrung leiten. Stellen Sie sich etwa vor, Sie w¨ urden an einem Autobahnwegweiser vorbeifahren und dort die folgenden Angaben finden: Hamburg 23 km Hannover 177 km G¨ ottingen 284 km Es ist dann klar, wie Sie daraus den Abstand zwischen je zweien dieser St¨ adte ermitteln k¨onnen, man muss nur die Differenz der Zahlen in der richtigen“ ” Reihenfolge bilden. Diese Erinnerung wird nun in eine Definition f¨ ur Abstand zweier Zahlen“ um” geschrieben, Sie finden sie im zweiten Teil von Definition 2.2.1. x und y seien reelle Zahlen. |x|
(i) Wir definieren |x| (gesprochen x Betrag“ oder Betrag von x“) durch ” ” x x≥0 |x| := −x x < 0. (ii) Unter dem Abstand zwischen x und y verstehen wir die Zahl |x − y|. (Je nachdem, welche der Zahlen die gr¨oßere ist, gilt also |x − y| = x − y oder |x − y| = y − x.)
2.2. KONVERGENZ
95
Bemerkungen und Beispiele: 1. Zum Beispiel sind |5| = 5, |0| = 0 und |−2234.21| = 2234.21. 2. Im Laufe der Analysis und in sp¨ateren Vorlesungen werden Sie noch viele Beispiele f¨ ur Abstandsdefinitionen kennen lernen (z.B. zwischen Funktionen oder zwischen Vektoren). Sie werden feststellen, dass alle diese Definitionen direkt von 2.2.1(i) abh¨ angen oder auf irgendeine andere Weise die ordnungstheoretischen Eigenschaften von R ausnutzen (vgl. die Definition des Betrages in C oder die Beispiele zu metrischen R¨aumen in Kapitel 3). Kurz: Der Ausgangspunkt aller konkreten Abstandsbegriffe ist die Ordnungsstruktur auf R . 3. Wegen |x| = |x − 0| kann |x| als Entfernung von x zur Null“ oder als die ” L¨ ange von x“ aufgefasst werden. Genau genommen wurde also zun¨ achst so ” etwas wie die Gr¨ oße“ einer Zahl erkl¨art – das ist der Betrag –, und dann ” wurde der Abstand zweier Zahlen als Gr¨oße“ der Differenz festgesetzt. Dieses ” Verfahren werden wir in Kapitel 3 in komplizierteren R¨ aumen kopieren. 4. x → |x| kann als Abbildung von R nach R aufgefasst werden, entsprechend (x, y) → |x − y| als Abbildung von R × R nach R . Hier die f¨ ur das Folgende wichtigsten Eigenschaften von Betrag und Abstand: Satz 2.2.2. F¨ ur x, y, z ∈ R gilt: (i) |x| ≥ 0, und aus |x| = 0 folgt x = 0. (ii) |xy| = |x||y|. (iii) |x + y| ≤ |x| + |y| (Dreiecksungleichung). (i)’ |x − y| ≥ 0, und aus |x − y| = 0 folgt x = y. (ii)’ |x − y| = |y − x|. (iii)’ |x − z| ≤ |x − y| + |y − z|. Beweis: (i) Der erste Teil folgt sofort durch Fallunterscheidung: Ist x < 0, so ist |x| = −x, und das ist wegen Satz 1.4.3(v) eine positive Zahl. Und f¨ ur x ≥ 0 stimmt x mit |x| u ¨berein. Den zweiten Teil beweisen wir durch logische Kontraposition: Aus x = 0 folgt |x| > 0. Das geht wieder am Bequemsten durch Fallunterscheidung: In beiden m¨ oglichen F¨ allen, also x < 0 oder x > 0, folgt sofort aufgrund der Definition, dass |x| > 0 ist. (ii) F¨ ur die Vorzeichen von x, y gibt es vier M¨oglichkeiten: x ≥ 0, x ≥ 0, x < 0, x < 0,
y y y y
≥ 0, < 0, ≥ 0, < 0.
Dreiecksungleichung
KAPITEL 2. FOLGEN UND REIHEN
96
Die behauptete Gleichheit ist f¨ ur jeden dieser vier F¨ alle nachzupr¨ ufen; alles, was zum Beweis ben¨otigt wird, steht in Satz 1.4.3. Hier als Beispiel die Argumentation im Fall x < 0, y < 0: (−x)(−y) stimmt erstens nach Definition mit |x||y| u ¨berein, darf zweitens durch xy ersetzt werden (Satz 1.3.6(x)), ist drittens positiv (Satz 1.4.3(vi)) und damit viertens nach Definition gleich dem Betrag von xy. In Formeln: |x||y| = (−x)(−y) = xy = |xy|.
?
¨ Versuchen Sie sich zur Ubung am Beweis der verbleibenden drei F¨ alle. (iii) Aus der Betragsdefinition ergibt sich sofort die auch in sp¨ ateren Beweisen n¨ utzliche Bemerkung a, b ∈ R , a ≤ b, −a ≤ b ⇒ |a| ≤ b .
(2.1)
Das folgt sofort aus der Definition des Betrages, denn |a| ist ja eine der Zahlen a oder −a. Da offensichtlich x ≤ |x| und −x ≤ |x| (Beweis durch Fallunterscheidung) und analog y ≤ |y| und −y ≤ |y| gilt, folgt durch Addition dieser Ungleichungen x + y ≤ |x| + |y| und −(x + y) = −x − y ≤ |x| + |y|. So erhalten wir mit Hilfe von (2.1): |x + y| ≤ |x| + |y|. (i)’ Das folgt sofort aus (i). (ii)’ Diese Aussage ergibt sich aus (ii): |x − y|
1.3.6(iv)
=
|(−1)(y − x)|
(ii)
|−1||y − x|
=
1.4.3(vi)
= =
1 · |y − x| |y − x|.
(iii)’ Wegen (iii) gilt: |x − z| = ≤
|(x − y) + (y − z)| |x − y| + |y − z|.
Damit ist der Satz vollst¨andig bewiesen.
Die als Dreiecksungleichung bezeichneten Ungleichungen (iii) bzw. (iii)’ sind ein unerl¨assliches Beweis-Hilfsmittel in der Analysis: Wenn man zeigen will, dass x nahe bei z“ ist, so braucht man wegen der Dreiecksungleichung nur zu zeigen, ” dass f¨ ur irgendein geeignetes y x nahe bei y“ und y nahe bei z“ liegt. ” ” Um die Bezeichnung Dreiecksungleichung“ einzusehen, m¨ ussen wir bis zur ” Herleitung eines entsprechenden Resultats f¨ ur C warten. Dann kann die Ungleichung wirklich als andere Formulierung daf¨ ur aufgefasst werden, dass in einem
2.2. KONVERGENZ
97
Dreieck die Summe zweier Seitenl¨angen mindestens so groß ist wie die dritte (vgl. die Bemerkung nach Satz 2.2.7 auf Seite 103). Der Abstand zweier Zahlen: komplexe Zahlen Die Analysis soll im Folgenden, wann immer m¨oglich, gleichzeitig f¨ ur R und C entwickelt werden, und daher ben¨otigen wir eine passende Definition f¨ ur die Gr¨ oße“ einer komplexen Zahl. ” Die Idee ist einfach, f¨ ur die Definition von Gr¨oße“ werden wir eine Anleihe ” bei der Elementargeometrie machen und den Satz von Pythagoras verwenden. Schreibt man n¨ amlich eine komplexe Zahl z als z = x + iy mit x, y ∈ R , so entsteht ein rechtwinkliges Dreieck. Die Seiten haben die L¨ ange |x| bzw. |y|, und die L¨ ange der Hypotenuse ist doch sicher ein aussichtsreicher Kandidat f¨ ur die Gr¨ oße von z“: ” Im z C z⎫= x + iy ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ y ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
2
|z
x2 + |=
y
x
Re z
Bild 2.4: Satz des Pythagoras Folglich sollte man |z| als die Wurzel aus x2 + y 2 definieren. Leider ist das Wurzelzeichen bisher aber noch nicht behandelt worden. Wir werden uns daher als Vorbereitung damit auseinander zu setzen haben, erst dann wird es mit dem Problem Abstandsdefinition auf C “ weitergehen k¨onnen. ” √ Was ist denn a f¨ ur eine reelle Zahl a ≥ 0? Das ist doch die eindeutig bestimmte Zahl b ≥ 0, deren Quadrat gleich a ist. Wenn wir w¨ ussten, dass es 5) , es soll nat¨ urlich ein eindeutig bestimmtes b gibt, d¨ u rfen wir wieder taufen“ √ ” a genannt werden. Im n¨achsten Lemma zeigen wir in Teil (i) die Eindeutigkeit und in Teil (ii) die – viel schwieriger einzusehende – Existenz. Lemma 2.2.3. Sei a ≥ 0 eine reelle Zahl. (i) Es gibt h¨ochstens ein b ≥ 0 in R mit b2 = a. Genauer: Aus b21 = b22 = a und b1 , b2 ≥ 0 folgt b1 = b2 . (ii) Es existiert ein b ≥ 0 in R mit b2 = a. 5) Vgl.
Seite 32.
KAPITEL 2. FOLGEN UND REIHEN
98
Beweis: (i) Im Fall b1 = b2 = 0 sind wir sofort fertig. Ist mindestens eine der Zahlen b1 , b2 von Null verschieden, gilt etwa b1 > 0, so folgt b1 + b2 > 0, und damit ist b1 + b2 = 0. Weiter folgt aus b21 = b22 , dass 0 = b21 − b22 = (b1 + b2 )(b1 − b2 ), und Satz 1.3.6(vii) ( K¨orper sind nullteilerfrei“) liefert uns b1 − b2 = 0, d.h. ” b1 = b2 . (ii) Dieser Beweisteil ist nun wirklich kompliziert6) , erstmals wird das Vollst¨ andigkeitsaxiom heranzuziehen sein. Was ist zu tun? Wir suchen doch – bei vorgelegtem a – ein b ≥ 0 mit einer speziellen Eigenschaft (n¨amlich b2 = a), haben aber als tiefer liegende Existenzaussage lediglich zur Verf¨ ugung, dass in R Schnittzahlen f¨ ur Dedekindsche Schnitte existieren. Die einzig Erfolg versprechende L¨ osungsmethode wird also darin bestehen, einen Dedekindschen Schnitt so geschickt zu definieren, dass das Quadrat der Schnittzahl gerade a ist. Wir wollen nat¨ urlich den Dedekindschen Schnitt √ √ ({x | x ≤ a}, {x | x > a}) (2.2) √ erhalten, doch w¨are dieser Schnitt nicht definiert (denn die Existenz von a soll ja gerade erst bewiesen werden). Wir werden also (2.2) so umformulieren, dass das Wurzelzeichen nicht mehr vorkommt. Das ist durch Quadrieren unter Beachtung einiger plausibler ordnungstheoretischer Zus¨ atze nicht schwer, wir betrachten n¨amlich statt (2.2) die Mengen ({x | x ≤ 0 oder x2 ≤ a}, {x | x > 0 und x2 > a})
(2.3)
und behaupten dann: 1. Durch (2.3) wird ein Dedekindscher Schnitt in R definiert. 2. F¨ ur die zugeh¨orige Schnittzahl b, deren Existenz durch das Vollst¨ andigkeitsaxiom 1.8.2 garantiert ist, gilt b2 = a. Die Einzelheiten dazu sind eher langwierig als schwierig: Beweis von 1.: Nachzuweisen sind die Eigenschaften 1.8.1(i), (ii) und (iii) f¨ ur Dedekindsche Schnitte, zur Abk¨ urzung werden wir A := {x | x ≤ 0 oder x2 ≤ a} und B := {x | x > 0 und x2 > a} setzen. • zu 1.8.1(i): Es ist A = ∅, denn 0 geh¨ ort nach Definition zu A. Es gilt auch B = ∅, denn wegen (a + 1)2 = a2 + 2a + 1 > a ist a + 1 ∈ B. 6) Sehr viel sp¨ ater werden wir als Anwendung des Zwischenwertsatzes eine (vom gleich anstehenden Beweis unabh¨ angige) andere Beweism¨ oglichkeit kennen lernen. Man vergleiche Korollar 3.3.7.
2.2. KONVERGENZ
99
• zu 1.8.1(ii): Seien x1 ∈ A und x2 ∈ B vorgelegt, wir haben x1 < x2 zu beweisen. Am einfachsten geht das indirekt. Wir nehmen also x1 ≥ x2 an und erhoffen uns nach einiger Rechnung einen Widerspruch: ur UngleiEs ist x2 > 0, und durch Anwendung einfacher Rechenregeln f¨ chungen (vgl. Satz 1.4.3) erhalten wir daraus x21 ≥ x22 ≥ 0. x2 > 0 impliziert auch x1 > 0, und damit muss x21 ≤ a gelten. Es folgt a ≥ x21 ≥ x22 > a und damit der Widerspruch a > a. • zu 1.8.1(iii): F¨ ur x ∈ R gibt es drei M¨oglichkeiten: x ≤ 0, x > 0 und x2 ≤ a, x > 0 und x2 > a. In den beiden ersten F¨allen geh¨ort x zu A, im dritten Fall zu B. Insgesamt: (A, B) ist wirklich ein Dedekindscher Schnitt:
0
A
x2 < a
x2 > a B
Bild 2.5: Der Dedekindsche Schnitt zur Wurzeldefinition Beweis von 2.: Sei b die zu (A, B) geh¨orige Schnittzahl, d.h. f¨ ur x1 ∈ A, x2 ∈ B ist x1 ≤ b ≤ x2 . Wir behaupten, dass b2 = a gilt und zeigen das durch ein ordnungstheoretisches Argument7) . Wie zeigt man x = y? (Ein erstes Resum´ e) Es kommt oft vor, dass man f¨ ur zwei Zahlen x und y nachweisen m¨ ochte, dass x = y gilt. Bisher stehen uns daf¨ ur die folgenden Techniken zur Verf¨ ugung: 1. Direkter Beweis: Man rechne einfach x = x1 = x2 = · · · = xn = y f¨ ur geeignete x1 , . . . , xn . Dabei wird in jedem Schritt eine einfache Umformung vorgenommen, und am Ende hat sich das x wirklich in das y transformiert. Logische Rechtfertigung f¨ ur dieses Beweisprinzip ist die Transitivit¨at der Gleichheitsrelation: Sind zwei Gr¨ oßen ” einer dritten gleich, so sind sie auch untereinander gleich.“ Mit dieser Technik werden die meisten Induktionsbeweise gef¨ uhrt. 7) Es handelt sich um eine Pr¨ ¨ azisierung der Uberlegungen, die wir am Ende von Abschnitt 1.8 angestellt haben, um die Nicht-Existenz einer Schnittzahl f¨ ur einen ¨ ahnlichen Schnitt in Q einzusehen.
KAPITEL 2. FOLGEN UND REIHEN
100
2. Beweis durch Umformen: Da geht man von einer schon als richtig erkannten Identit¨at a = b aus und formt solange um – durch Addition der gleichen Zahl auf beiden Seiten der Gleichung, Subtraktion usw. – und, bis man zu x = y gekommen ist. 3. Beweis durch Nachweis von definierenden Eigenschaften: Ein typisches Beispiel war der Beweis von Satz 1.3.6(ii): 0 · x hat die Eigenschaften eines neutralen Elements, die sind eindeutig bestimmt, folglich muss 0 · x = 0 gelten. ¨ Ahnlich geht es immer dann, wenn man weiß, dass genau ein x mit der Eigenschaft E existiert: Kommt dann ein weiteres y mit E ins Spiel, so muss x = y sein. 4. Ordnungstheoretischer Beweis, falls x und y reelle Zahlen sind: F¨ ur je zwei reelle Zahlen x und y gilt doch aufgrund der definierenden Eigenschaften eines Positivbereichs, dass x = y gefolgert werden darf, falls gleichzeitig x ≤ y und y ≤ x gilt. Außerdem ist stets eine der drei Aussagen x < y, x = y oder y < x wahr. Wenn es also gelingt zu zeigen, dass nicht x < y und auch nicht y < x sein kann, so muss x = y gelten. Wer es aus formalen logischen Gr¨ unden einsehen m¨ ochte, muss die Aussage [(p ∨ q ∨ r) ∧ (¬p) ∧ (¬r)] ⇒ q beweisen. Es empfiehlt sich, noch einmal den Beweis von Satz 1.3.6(v) nachzulesen und sich zu u ¨ berzeugen, dass das zugrunde liegende logische Prinzip wieder einmal nichts weiter ist als etwas trocken aufgeschriebene Lebenserfahrung. (Die Fortsetzung folgt: auf Seite 113.)
In unserem Fall ist zu zeigen, dass nicht b2 > a und auch nicht b2 < a sein kann. achst, dass wegen 0 ∈ A Angenommen, es w¨are b2 > a. Wir beachten zun¨ notwendig b ≥ 0 sein muss. Da b2 > a sein soll, ist b = 0 nicht m¨ oglich, es ist also b > 0. Wir suchen uns eine Zahl ε mit den folgenden drei Eigenschaften: 0 0
< ≤
2εb ≤
ε, b − ε, b2 − a.
(So ein ε gibt es wirklich, man kann ε zum Beispiel als die kleinere der beiden Zahlen b/2, (b2 − a)/2b w¨ahlen.)
2.2. KONVERGENZ
101
Dann ist b − ε ∈ B, denn b − ε ist positiv und (b − ε)2
b2 − 2εb + ε2
= ε > 0
b2 − 2εb
>
Wahl von ε
≥
a.
Da b als Schnittzahl links von allen Elementen aus B liegt, folgt b − ε ≥ b und damit ε ≤ 0 im Widerspruch zu ε > 0. Also gilt nicht b2 > a. Im Falle b2 < a verfahren wir ganz analog. Wir w¨ahlen ein ε mit 0
0 dividieren d¨ urfen.) Es ist dann b + ε ∈ A: (b + ε)2
= ε ≤ 1
≤
b2 + 2εb + ε2 b2 + 2εb + ε
Wahl von ε
≤
a.
Andererseits muss x ≤ b f¨ ur jedes x ∈ A gelten (insbesondere also b + ε ≤ b), und daraus erhalten wir den Widerspruch ε ≤ 0. Folglich gilt nicht b2 < a. Das war sehr technisch, insbesondere sehen die an die ε gestellten Bedingungen nicht sehr plausibel aus. Sie ergeben sich aber fast zwangsl¨ aufig, wenn man von (b − ε)2 > a bzw. (b + ε)2 < a ausgeht und dann daraus durch R¨ uckw¨ artsrechnen die Forderungen herleitet.
Damit ist der Beweis vollst¨andig gef¨ uhrt.
Wegen Lemma 2.2.3(i) und (ii) gibt es zu a ≥ 0 genau ein b ≥ 0 mit b2 = a. Das f¨ uhrt zu Definition 2.2.4. Sei a ∈ R mit a ≥√0. Das nach Lemma 2.2.3 eindeutig bestimmte b ≥ 0 mit b2 = a wird mit a (lies: Wurzel aus a“) oder a1/2 ” bezeichnet.
√ a
102
KAPITEL 2. FOLGEN UND REIHEN
F¨ ur sp¨atere Zwecke zeigen wir den Satz 2.2.5. Es seien a und b reelle Zahlen mit a, b ≥ 0, weiter sei c eine beliebige reelle Zahl. √ √ (i) Die Gleichung x2 = a hat die L¨osungen x = a und x = − a, weitere L¨osungen gibt es nicht. √ √ √ (ii) Es gilt ab = a b. √ (iii) Es ist c2 = |c|. √ √ (iv) Aus 0 ≤ a ≤ b folgt a ≤ b. √ √ Beweis: (i) Es ist klar, dass osungen dieser Gleichung sind: √ √ a und − a2L¨ a nach Definition, und − a wegen (−x) = x2 f¨ ur x ∈ R . Umgekehrt: Ist y irgendein Element aus R mit y 2 = a, so folgt: √ • Falls y ≥ 0, so muss y = a gelten (Teil (i) des Lemmas 2.2.3). √ • Falls y < 0, so muss y = − √a sein, denn dann ist −y > 0 sowie 2 2 (−y) = y = a, also −y = a. (ii) Wir wenden das dritte der im Kasten auf Seite 99 beschriebenen Beweisprinzipien an.√Wegen der schon√bewiesenen Eindeutigkeit der Wurzel ist nur zu √ √ zeigen, dass a b ≥ 0 und ( a b)2 = ab gilt. Beides ist aber offensichtlich richtig. (iii) Man beachte nur, dass |c| ≥ 0 ist und dass c2 falls c ≥ 0 2 |c| = 2 (−c) = c2 falls c < 0. √ Wie im vorstehenden Beweis folgt c2 = |c|. √ √ √ √ √ (iv) W¨are b < a, so folgte nach Multiplikation mit b, dass b√ 0 einen Index n0 ∈ N so gibt, dass |an | ≤ ε f¨ ur jedes n ∈ N mit n ≥ n0 gilt.
Nullfolge
KAPITEL 2. FOLGEN UND REIHEN
106
Diese Definition muss ausf¨ uhrlich erl¨ autert werden, es folgen daher zahlreiche Bemerkungen und Beispiele:
∀, ∃
1. Bisher war es nicht n¨otig, unsere Aussagen durch die Einf¨ uhrung geeigneter neuer Symbole besser zu strukturieren. Definition 2.2.8 (und analog viele weitere noch zu besprechende Sachverhalte) werden u ¨ bersichtlicher, wenn wir als Abk¨ urzungen ∀“ f¨ ur f¨ ur alle“ und ∃“ f¨ ur es existiert“ schreiben (der G¨ ultig” ” ” ” keitsbereich dieser so genannten Quantoren“ wird meist darunter geschrieben). ” Das Zeichen ∀“ muss nicht weiter erl¨ autert werden, zur Abk¨ urzung ∃“ sollte ” ” man erg¨anzen, dass sie als es existiert mindestens ein . . . mit . . .“ gemeint ist. ” Definition 2.2.8 kann unter Verwendung dieser neuen K¨ urzel so geschrieben werden: Definition |an | ≤ ε, (an )n∈N ist Nullfolge ⇐⇒
∀∃ ∀
ε>0 n0 ∈N n∈N n≥n0
dabei wird der rechts stehende Ausdruck auch gleichwertig in der Variante
∀ ∃ ∀ n≥n
0
⇒ |an | ≤ ε
ε>0 n0 ∈N n∈N
verwendet. Beachten Sie, dass Quantoren wirklich nur Abk¨ urzungen im Interesse einer u are ziemlich sinnlos, Quantoren¨ bersichtlicheren Schreibweise sind. Es w¨ Formeln stur auswendig zu lernen. Wichtig ist, dass Sie den Inhalt der Aussage verstehen. 2. Hier ein erstes Beispiel, es ist leider trivial9) : (an )n∈N sei eine Folge mit der Eigenschaft, dass an = 0 f¨ ur n ≥ n ˆ , wobei n ˆ eine nat¨ urliche Zahl ist. Von irgendeinem Index an besteht die Folge also aus lauter Nullen, man spricht auch von einer abbrechenden Folge. (Ist zum Beispiel (an ) = (1, 2, . . . , 100, 0, 0, 0, . . .), so k¨onnte man n ˆ = 101 w¨ahlen.) Das ist dann eine Nullfolge, denn unabh¨ angig von ε hat das durch n0 := n ˆ definierte n0 die gew¨ unschten Eigenschaften. Es ist nat¨ urlich nicht verboten, n0 durch eine gr¨oßere Zahl zu ersetzen. 3. Als wichtigeres Beispiel betrachten wir die Folge (1/n)n∈N , also (1, 1/2, 1/3, . . .). Wir behaupten, dass es sich um eine Nullfolge handelt. Dazu sei irgendein ε > 0 vorgelegt. Aufgrund des Archimedesaxioms – genauer, wegen der in Satz 1.7.3(i) bewiesenen Folgerung daraus – gibt es ein n0 ∈ N mit 1/n0 ≤ ε. Da f¨ ur n ≥ n0 auch 1/n ≤ 1/n0 ist und 1/n = |1/n| gilt, heißt das gerade: F¨ ur n ≥ n0 ist |1/n| ≤ ε. Und das beweist die Behauptung. 9) Trivial“ bedeutet soviel wie ganz f¨ urchterlich einfach“. Dummerweise kann man sehr ” ” unterschiedlicher Meinung dar¨ uber sein, ob eine bestimmte Aussage nun trivial ist oder nicht. Auch Ihnen wird die Erfahrung nicht erspart bleiben, dass Sie eine Aussage lesen, die mit Es ist trivial, dass . . . “ anf¨ angt, Sie aber keinen blassen Schimmer haben, wie man das denn ” begr¨ unden k¨ onnte. Varianten des Themas sind S¨ atze wie Offensichtlich ist . . . “ oder Es ist ” ” leicht zu sehen, dass . . . “. In diesem Buch allerdings ist versucht worden, das Wort trivial“ ” nur in wirklich gerechtfertigten F¨ allen zu verwenden.
2.2. KONVERGENZ
107
Die weitere Entwicklung der Analysis wird zeigen, dass (1/n)n∈N nicht irgendein x-beliebiges Beispiel einer Nullfolge ist. Diese Folge ist vielmehr so etwas wie der Urvater aller konkret zu behandelnden Nullfolgen und folglich – weil Konvergenz“ mit Hilfe von Nullfolge“ definiert werden wird – aller konver” ” genten Folgen. Konvergenzbeweise werden darauf hinauslaufen, dass irgendwo (1/n)n∈N ist Nullfolge“ ausgenutzt werden wird. Besonders simple Folgen wie ” die abbrechenden Folgen im vorstehenden Beispiel betrifft das nat¨ urlich nicht. Das ist nat¨ urlich nicht allzu u aqui¨ berraschend, denn (1/n)n∈N ist Nullfolge“ ist ¨ ” valent zum Archimedesaxiom und das ist das einzige Axiom, das die Existenz nat¨ urlicher Zahlen mit geeigneten Eigenschaften sichert, wie sie in der Definition Nullfolge“ ” gefordert werden.
Zusammenhang zum Archimedesaxiom F¨ ur belastbare Leser: Eben haben wir gesehen, dass aus dem Archimedesaxiom folgt, dass (1/n)n∈N eine Nullfolge ist. Umgekehrt gilt das auch. H¨ atten wir den Betrag und den Begriff Nullfolge“ in be” liebigen angeordneten K¨orpern eingef¨ uhrt (w¨ortlich wie in 2.2.1 bzw. 2.2.8), so kann man beweisen, dass aus (1/n)n∈N ist eine Nullfolge“ ” das Archimedesaxiom folgt. (Haben Sie eine Beweisidee?) Kurz (1/n)n∈N ist eine Nullfolge“ ist nichts weiter als eine Umfor” mulierung des Archimedesaxioms. 4. F¨ ur (an )n∈N ist Nullfolge“ schreibt man auch ” lim an = 0
n→∞
lim an = 0 −−→ 0 oder an −− n→∞
oder oder
an → 0
( Limes an f¨ ur n gegen unendlich gleich Null“), ” ( Limes an gleich Null“), ” ( an gegen 0 f¨ ur n gegen unendlich“), ” ( an geht gegen Null“); ”
wieder hat das Symbol ∞“ keinerlei inhaltliche Bedeutung. ” 5. Sei (an )n∈N eine Folge in K . Je nachdem, ob Sie sich (an )n∈N als Spaziergang ” in K“ oder durch den Graphen vorstellen (vgl. die Bemerkungen nach Definition 2.1.1 auf Seite 91), erhalten Sie f¨ ur an → 0“ folgende Veranschaulichung: ” • Die erste M¨ oglichkeit (s. Bild 2.7): a → 0“ bedeutet, dass außerhalb der Menge {x | |x| ≤ ε}10) h¨ ochstens ” n endlich viele Folgenglieder liegen, n¨amlich schlimmstenfalls a1 , a2 , . . . , an0 −1 . • Die zweite M¨ oglichkeit (Bild 2.8)11) : Die Aussage an → 0“ kann man sich so vorstellen, dass außerhalb jedes ” ε-Streifens (das ist der Bereich zwischen den Geraden y = ε und y = −ε) h¨ ochstens endlich viele der Punkte (n, an ) liegen. 10) Diese 11) Die
Menge ist in C eine Kreisscheibe und in R die Menge {x | −ε ≤ x ≤ ε}. ist nur im Fall K = R sinnvoll einzusetzen.
? lim
KAPITEL 2. FOLGEN UND REIHEN
108
ε
Bild 2.7: Nullfolge R ε
1
2
3
4
5
6
7
8 N
−ε
Bild 2.8: Graph einer Nullfolge 6. F¨ ur den Nachweis von an → 0“ ist ein aus p folgt q“-Beweis zu f¨ uhren, ” ” d.h. aus ε > 0 ist zu folgern, dass es ein n0 mit gewissen Eigenschaften gibt. Sie d¨ urfen dabei wirklich nichts weiter voraussetzen, als dass ε eine positive reelle Zahl ist. F¨ ur ein analoges Beispiel denken Sie etwa an den Induktionsschluss bei Induktionsbeweisen. Folglich hat es Sie nicht zu interessieren, woher Sie Ihr ε bekommen, wie groß es denn nun wirklich ist, usw. Sie sollen einen Beweis liefern, der unabh¨ angig vom konkreten ε klappt und nur ε > 0 ausnutzt, egal ob ε = 1000 oder ε = 1/1000! ist. Anschaulich d¨ urfen Sie sich daher den Beweis von an → 0“ als Konstruktion ” eines Automaten vorstellen, der zu gegebenem ε ein n0 mit den geforderten Eigenschaften auswirft.
2.2. KONVERGENZ
109
Um einen typischen Beweis vorzuf¨ uhren, behandeln wir die folgende Aussage: √ Behauptung: (1/ n)n∈N ist eine Nullfolge. Beweis 1 (sehr ausf¨ uhrlich): Wir haben √ zu zeigen, dass zu jedem vorgegebenen ε > 0 ein n0 existiert, so dass |1/ n| ≤ ε f¨ ur n ≥ n0 gilt. √ Heimliche Vor¨ uberlegung: ≤ ε bedeutet das gleiche wie 1/n ≤ ε2 , √ |1/ n| √ √ und f¨ ur n ≥ n0 ist |1/ n| ≤ |1/ n0 | ≤ 1/ n0 . Es wird also reichen, ein 2 n0 mit 1/n0 ≤ ε zu finden.
Sei also ε > 0 vorgegeben. Es ist dann auch ε2 > 0, d.h. aufgrund des Archimedesaxioms existiert ein n0 ∈ N mit 1/n0 ≤ ε2 . F¨ ur jedes n ≥ n0 ist dann 1 1 √ ≤ √ ≤ √1 ≤ ε; n n0 n0 dabei haben wir√Satz 2.2.5(iv) verwendet. Das beweist 1/ n → 0.
Achtung, Bezeichnungen! Es hat sich eingeb¨ urgert, auf eine gewisse Bezeichnungsdisziplin zu achten. So kann das Auge mitdenken, und der Kopf ist frei f¨ ur die wirklich interessanten Aspekte des Problems. Mathematisch w¨ are es zum Beispiel v¨ollig korrekt, den Begriff (an ) ist Nullfolge“ durch ” F¨ ur alle R > 0 gibt es ein x ∈ N , so dass f¨ ur alle x0 ∈ N mit ” x ≤ x0 die Ungleichung |ax0 | ≤ R gilt.“ zu definieren. H¨ atten Sie es aber gleich wiedererkannt? Es hat u ¨brigens recht lange in der Geschichte der Mathematik gedauert, bis man sich auf sinnvolle Abk¨ urzungen geeinigt hat. Bis ins 15. Jahrhundert wurde noch alles sozusagen in Prosa“ ausgedr¨ uckt, ” eine u oßerem Umfang ¨ bersichtliche Formelsprache setzte sich in gr¨ erst im 17. Jahrhundert durch. Beweis 2 (Standard): Sei ε > 0 vorgegeben. Man w¨ahle aufgrund des Archimedesaxioms ein n0 ∈ N mit 1/n0 ≤ ε2 . Es ist dabei zu beachten, dass wegen ε > 0 auch ε2 > 0 ist. F¨ ur n ≥ n0 ist dann 1 1 √ ≤ √ ≤ √1 ≤ ε. n n0 n0 √ Damit ist 1/ n → 0 bewiesen. 7. Am vorigen Beispiel ist wieder einmal das R¨ uckw¨ artsrechnen“ hervorzuhe” ben: Erst durch Aufl¨ osen der gew¨ unschten Ungleichung 1 √ ≤ ε n nach 1/n kam das Archimedesaxiom ins Spiel. Versuchen Sie sich analog an einem exakten Beweis von 1/2n → 0 oder 1/n2 → 0.
?
KAPITEL 2. FOLGEN UND REIHEN
110
8. Erinnern Sie sich an den Kommentar nach Satz 1.7.3 u ¨ ber die MathematikerHintergedanken zum Buchstaben ε. Anschaulich ist klar, dass Sie es f¨ ur große“ ” ε mit dem Nullfolgen-Nachweis leicht haben werden (nur m¨ aßig große“ n0 ), ” sich aber anstrengen m¨ ussen, wenn ε sehr klein“ ist (evtl. riesengroße“ n0 ). ” ” 9. Das Gegenteil von f¨ ur alle x gilt die Aussage A“ ist offensichtlich es gibt ” ” ein x, f¨ ur das A nicht gilt“, und das Gegenteil von es gibt ein x mit A“ ist f¨ ur ” ” alle x gilt A nicht“. Folglich bedeutet die Aussage (an ) ist keine Nullfolge“: ” Es gibt ein ε > 0 mit der Eigenschaft: Wie groß auch immer n0 ∈ N gew¨ahlt ist, es gibt ein n ≥ n0 mit |an | > ε. Mit Quantoren liest sich das so:
∃ ∀ ∃ |a | > ε. n
ε>0 n0 ∈N n≥n0
?
Wenn Sie also nachweisen wollen, dass eine konkret gegebene Folge (an )n∈N keine Nullfolge ist, so m¨ ussen Sie ein derartiges Versager-ε“ angeben (das wir ” dann meist mit ε0 bezeichnen werden). Man kann z.B. ε0 := 1/2 w¨ ahlen, um einzusehen, dass (1, 1, . . .) und (1, 0, 1, 0, . . .) keine Nullfolgen sind. F¨ ur den Beweis von (1/1000, 0, 1/1000, 0, . . .) ist keine Nullfolge“ m¨ ussen Sie sich um einen ” kleineren Versager bem¨ uhen. Was ist Ihr Vorschlag f¨ ur ε0 ? 10. Nach so vielen Bemerkungen sollte alles klar sein. Falls immer noch nicht: Lernen Sie die Definition f¨ urs Erste auswendig und hoffen Sie auf ein besseres Verst¨andnis im Laufe Ihrer weiteren Besch¨ aftigung mit der Analysis. Faustregel: Besser auswendig richtig als falsch gemerkt. Leider ist das keine u ussige Bemerkung, denn es kommt immer ¨ berfl¨ wieder vor, dass manche sich Nullfolge“ falsch, etwa als ” |an | ≤ ε
∃∀∀
n0 ∈N ε>0 n≥n0
?
merken. Welche Folgen werden durch diese falsche Definition eigentlich beschrieben? Die Definition von Konvergenz“ ergibt sich quasi als Anh¨ angsel. Nachdem ” wir wissen, was es bedeutet, dass eine Folge beliebig klein“ wird, k¨ onnen wir ” Konvergenz gegen a“ als die Abst¨ ande zu a werden beliebig klein“ definieren. ” ” Genauer:
konvergent
Definition 2.2.9. Sei (an )n∈N eine Folge in K und a ∈ K . Wir sagen, dass (an )n∈N gegen a konvergiert, wenn (an − a)n∈N eine Nullfolge ist. Eine Folge (an )n∈N in K heißt konvergent, wenn es ein a ∈ K gibt mit: (an )n∈N konvergiert gegen a. Mit Quantoren:
∀ ∃ ∀ |a
n
− a| ≤ ε.
ε>0 n0 ∈N n≥n0
Folgen, die nicht konvergent sind, heißen divergent.
2.2. KONVERGENZ
111
Bemerkungen und Beispiele: 1. F¨ ur (an )n∈N ist konvergent gegen a“ schreiben wir auch ” −−→ a an −− n→∞ oder oder oder
an → a lim an = a
n→∞
lim an = a
( an gegen a f¨ ur n gegen unendlich“), ” ( an gegen a“), ” ( Limes an gleich a f¨ ur n gegen unendlich“), ” ( Limes an gleich a“). ”
2. Die vorstehende Bezeichnungsweise ist vertr¨aglich mit der f¨ ur Nullfolgen, denn die gegen Null konvergenten Folgen sind gerade die Nullfolgen. Das wird manchen spitzfindig vorkommen, aber wenn es nicht so w¨ are, w¨ usste man nicht, was die Aussage an → 0“ eigentlich bedeuten soll. ” 3. Als Beispiel betrachten wir die Folge (1 + n1 )n∈N . Es ist nicht schwer zu sehen, dass 1 + n1 → 1 gilt, denn die Differenz zwischen der Folge und der Zahl 1 ist die Nullfolge ( n1 )n∈N . Das Beispiel ist leider entt¨auschend einfach, denn es ist klar, dass Folgen der Form a plus Nullfolge“ gegen a konvergieren m¨ ussen. (Umgekehrt ist dasauch ” richtig: Gilt an → a, so schreibe man die Folge (an )n∈N als a + (an − a) n∈N . Damit ist (an ) von der Form konstante Folge plus Nullfolge“.) ” Wie aber sieht es mit Folgen aus, f¨ ur die ein Kandidat f¨ ur das a weit und breit nicht in Sicht ist? Wie zeigt man etwa, dass die Folge (1, 1− 12 , 1− 12 + 13 , . . .) konvergent ist? Diese Folge ist wirklich konvergent, aber erst im n¨ achsten Abschnitt werden wir Methoden kennen lernen, das auch wirklich zu beweisen. Eine Umformulierung des Vollst¨andigkeitsaxioms wird dabei eine ganz wesentliche Rolle spielen. 4. Jetzt k¨ onnen wir sagen, was wir zu Beginn des Kapitels eigentlich gemeint haben: Die Folge (3.14, 3.141, 3.1415, 3.14159, . . .) konvergiert gegen π. Umgekehrt: Konvergenz ist aus dem gleichen Grunde allgemein wichtig wie im konkreten πBeispiel, denn im Falle an → a darf in vielen F¨allen statt mit a mit den oft ugend groß“) gerechnet werden. besser bekannten an (n gen¨ ” Soweit zur Definition der Konvergenz. Der Rest des Abschnitts ist ersten Untersuchungen dazu gewidmet. Wir behandeln • Technisches: Wie kann man einer Folge ansehen, ob sie konvergent ist? • Permanenzaussagen: Wie gewinnt man aus schon bekannten konvergenten Folgen neue? Die Kombination von Permanenzaussagen mit dem Nachweis einiger exemplarischer Beispiele f¨ ur Konvergenz (etwa 1/n → 0) liefert uns dann eine F¨ ulle von Beispielen konvergenter Folgen. Diesem Aufbau – fundamentale Beispiele plus Permanenzs¨ atze – werden wir in sp¨ateren Kapiteln noch oft begegnen.
KAPITEL 2. FOLGEN UND REIHEN
112 Hier der eher technische
Satz 2.2.10. Sei (an )n∈N eine Folge in K . Dann gilt (i)
∀ ∃ ∀
|an | < ε
⇐⇒ an → 0;
ε>0 n0 ∈N n∈N n≥n0
dabei haben wir die auf Seite 106 eingef¨ uhrten K¨ urzel f¨ ur f¨ ur alle“ und ” es existiert“ verwendet. ” |a | ≤ ε“ darf also bei Bedarf durch |an | < ε“ ersetzt werden. ” ” n (ii) Es gebe ein K > 0 mit
∀ ∃ ∀ |a | ≤ Kε. n
ε>0 n0 ∈N n∈N n≥n0
Dann ist (an )n∈N eine Nullfolge. Niemand braucht also zu verzweifeln, wenn beim Nullfolgennachweis zun¨achst nur – zum Beispiel – |an | ≤ 3ε gezeigt werden kann. ˆ mit an = bn f¨ ur n ≥ n ˆ , d.h. (iii) Es gebe eine Folge (bn )n∈N in K und ein n (an )n∈N und (bn )n∈N unterscheiden sich schlimmstenfalls durch endlich viele Folgenglieder. Ist dann (bn )n∈N konvergent, so auch (an )n∈N , und lim an = lim bn .
n→∞
n→∞
Kurz: Das Konvergenzverhalten ist nur abh¨angig von den an mit n ≥ n ˆ, wobei n ˆ beliebig groß sein kann. Jugends¨ unden“ einer Folge sind f¨ ur das ” Konvergenzverhalten unerheblich. (iv) Aus an → a und an → b folgt a = b. Der Limes ist also eindeutig bestimmt, falls er existiert. Erst aufgrund dieser Tatsache ist man berechtigt, das Zeichen lim an“ zu benutzen12) . ” Beweis: (i) ⇒“ ist klar, denn aus |an | < ε folgt erst recht |an | ≤ ε. ” Der Beweis von ⇐“ wird – zum besseren Verst¨ andnis der Konvergenzdefi” nition – besonders ausf¨ uhrlich behandelt. Wir wissen, dass
∀ ∃ ∀ |a | ≤ ε˜. n
(2.4)
ε˜>0 n0 ∈N n∈N n≥n0
Dabei haben wir ε˜ ( ε Schlange“) statt ε geschrieben, um einer f¨ ur Anf¨ anger ” nahe liegenden Begriffsverwirrung zu entgehen. Wir zeigen nun:
∀ ∃ ∀ |a | < ε. n
(2.5)
ε>0 n0 ∈N n∈N n≥n0
12) Anders ausgedr¨ uckt: K¨ onnte es vorkommen, dass f¨ ur eine Folge (an ) gleichzeitig lim an = 3 usste niemand, welche Zahl mit dem Zeichen lim an gemeint ist. und lim an = 4 ist, so w¨
2.2. KONVERGENZ
113
Sei dazu (irgendein) ε > 0 vorgegeben. Wir betrachten dann ε˜ := ε/2 und wenden unsere Voraussetzung (2.4) f¨ ur dieses ε˜ an. Das d¨ urfen wir, denn mit ε ist auch ε˜ > 0. Es existiert dann nach Voraussetzung ein n0 , so dass |an | ≤ ε˜ = ε/2 ur n ≥ n0 . f¨ ur alle n mit n ≥ n0 ist. Da aber ε/2 < ε gilt, folgt daraus |an | < ε f¨ Die Beweisidee lautet damit in Kurzfassung: Um (2.5) zu zeigen, wenden wir (2.4) f¨ ur ε/2 an13) . (ii) Die Idee ist ¨ ahnlich wie im vorigen Beweis, wir d¨ urfen uns also k¨ urzer fassen. Um an → 0 unter der Annahme zu zeigen, dass die Voraussetzung in (ii) erf¨ ullt ist, w¨ ahle man bei vorgegebenem ε > 0 ein n0 gem¨ aß Voraussetzung, aber nicht zu ε, sondern zu ε/K. Das darf man, da ε/K > 0 ist. F¨ ur das so gew¨ ahlte n0 gilt dann: ε f¨ ur n ≥ n0 . |an | ≤ K · K Wegen K ·(ε/K) = ε erf¨ ullt dieses n0 die Bedingungen, die wir f¨ ur den Nachweis der Nullfolgeneigenschaft ben¨otigen. Und damit ist gezeigt, dass (an )n∈N eine Nullfolge ist. (iii) (bn )n∈N sei konvergent gegen ein b ∈ K . Wir wollen zeigen, dass auch an → b gilt und beginnen dazu mit der Vorgabe eines ε > 0. Wegen bn → b finden wir ein n0 mit |bn − b| ≤ ε, sobald nur n ≥ n0 ist. Das bedeutet |an − b| ≤ ε, wenn ˆ ist, denn dann ist an = bn . n ≥ n0 und gleichzeitig n ≥ n Damit haben wir einen Index n1 (n¨amlich die gr¨oßere der beiden Zahlen n0 , n ˆ ) gefunden, so dass |an − b| ≤ ε ist f¨ ur alle n ≥ n1 . Das zeigt an → b. (iv) Indirekt geht es am leichtesten: W¨are a = b, so w¨ are |a − b| strikt positiv. Zu ε := |a − b|/3 g¨ abe es aufgrund der Konvergenzdefinition ein n0 ∈ N sowie ein n ˜ 0 ∈ N mit n ≥ n0 n≥n ˜0
⇒ |an − a| ≤ ε, ⇒ |an − b| ≤ ε.
W¨ ahlt man nun irgendein n, das gleichzeitig gr¨oßer als n0 und als n ˜ 0 ist, so folgt 3ε = |a − b| = |(a − an ) + (an − b)| ≤ |a − an | + |an − b| ≤ ε + ε = 2ε, also 3ε ≤ 2ε und damit der Widerspruch ε ≤ 0 . 13) Das
sollten Sie sich aber nicht als Setze ε := ε/2“ merken! ”
114
KAPITEL 2. FOLGEN UND REIHEN Wie zeigt man x = y? (Fortsetzung von Seite 99) Inzwischen haben wir weitere Methoden verwendet, um x = y zu zeigen. Wir setzen die Aufstellung von Seite 99 fort: 5. Der Beweis von x ≤ 0, falls x eine reelle Zahl ist: Wenn man zeigen kann, dass x ≤ ε f¨ ur jedes ε > 0 ist, so muss x ≤ 0 gelten. Begr¨ undung: Die Annahme x > 0 kann durch Einsetzen von ε := x/2 zu einem Widerspruch gef¨ uhrt werden. Und daraus folgt: Weiß man schon, dass x ≥ 0 ist, so darf man aus x ≤ ε f¨ ur alle ε > 0“ schließen, dass x = 0 sein muss. (Dieser Beweis ” kann auch verwendet werden, um f¨ ur komplexe Zahlen z zu zeigen, dass z = 0 gilt: Man muss ihn nur f¨ ur x := |z| f¨ uhren.) 6. Beweis von x = 0 f¨ ur reelle oder komplexe x mit Hilfe von Nullur alle n gilt, wobei folgen: Ist x ≥ 0 und weiß man, dass |x| ≤ an f¨ (an ) eine Nullfolge ist, so muss x = 0 gelten. Das folgt aus 5.“, ” man muss nur gen¨ ugend große n w¨ ahlen, um einzusehen, dass die Epsilon-Bedingung erf¨ ullt ist.
Unter einem Permanenzsatz“ versteht man ein Ergebnis, durch das aus ” den jeweils betrachteten Objekten (hier: konvergente Folgen) mittels f¨ ur diese Objekte sinnvoller Operationen (hier: Summen, Vielfache, Produkte, . . . ) neue Objekte gewonnen werden k¨ onnen. Bevor wir den f¨ ur konvergente Folgen relevanten Permanenzsatz beweisen, zeigen wir als Vorbereitung das folgende Lemma, das auch f¨ ur sich von Bedeutung ist: Lemma 2.2.11. Sei (an )n∈N eine Folge in K . Ist dann (an )n∈N konvergent, so gibt es ein M > 0 mit |an | ≤ M f¨ ur alle n ∈ N . Folgen mit dieser Eigenschaft heißen beschr¨ ankt. Kurz: Konvergente Folgen sind beschr¨ankt. Beweis: (Vgl. Bild 2.9) Sei a := lim an . Nach Definition gilt dann
∀ ∃ ∀ |a
n
− a| ≤ ε.
ε>0 n0 ∈N n∈N n≥n0
Insbesondere gibt es – wenn wir das f¨ ur ε = 1 anwenden – ein n0 ∈ N mit der Eigenschaft: Aus n ≥ n0 folgt |an − a| ≤ 1. F¨ ur n ≥ n0 ist dann: |an | = |an − a + a| ≤ |an − a| + |a| ≤ 1 + |a|, d.h. f¨ ur diese n d¨ urften wir M = 1+|a| w¨ ahlen. Leider gilt dann nicht notwendig ahlen wir M |a1 | ≤ M , . . . , |an0 −1 | ≤ M . Um auch noch das sicherzustellen, w¨ als die gr¨oßte der Zahlen |a1 |, |a2 |, . . . , |an0 −1 |, |a| + 1. Offensichtlich ist dann ur alle an . |an | ≤ M f¨
2.2. KONVERGENZ
115
0
1 |a| +
a 1
Bild 2.9: beschr¨ankte Folge
Satz 2.2.12. (an )n∈N und (bn )n∈N seien Folgen in K . (i) Gilt an → 0 und ist |bn | ≤ |an | f¨ ur alle n ∈ N , so ist auch (bn )n∈N eine Nullfolge (Vergleichskriterium oder Majorantenkriterium). (ii) Aus an → a und bn → b folgt an + bn → a + b. In Kurzfassung14) : lim(an + bn ) = lim an + lim bn . (iii) Aus an → a folgt can → ca f¨ ur jedes c ∈ K . Kurz: lim can = c lim an . (iv) Aus an → a und bn → b folgt an bn → ab. Kurz: lim an bn = (lim an )(lim bn ). ur (v) Aus an → a und bn → b folgt an /bn → a/b, falls b = 0 und bn = 0 (f¨ alle n ∈ N ) gilt. Kurz: lim an /bn = lim an /lim bn , falls lim bn = 0 und alle bn = 0. ur alle (vi) Sei K = C und an geschrieben als an = xn + iyn mit xn , yn ∈ R (f¨ n ∈ N ); weiter sei a = x + iy ∈ C mit x, y ∈ R . Dann gilt an → a genau dann, wenn xn → x und yn → y. Kurz: Konvergenzuntersuchungen in C k¨onnen auf die Konvergenz von Real- und Imagin¨arteil und damit auf Konvergenzuntersuchungen in R zur¨ uckgef¨ uhrt werden. 14) Achtung! Das ist wirklich nur eine einpr¨ agsame Kurzschreibweise. Die Formel m¨ usste eingeleitet werden mit Wenn lim an und lim bn existieren, dann . . . “ ”
Vergleichskriterium
KAPITEL 2. FOLGEN UND REIHEN
116
(vii) Es sei K = R und es gelte an → a. Ist dann an ≤ M f¨ ur eine Zahl M und alle n, so gilt a ≤ M . Entsprechend bleiben Ungleichungen der Form ≥ M im Limes erhalten. (viii) Ist (bn ) eine Teilfolge von (an ) und ist die Folge (an ) konvergent, so ist auch (bn ) konvergent. Es gilt lim bn = lim an . Beweis: (i) Sei ε > 0 vorgegeben. Wir wollen zeigen, dass es ein n0 ∈ N so ur n ≥ n0 . Wegen an → 0 finden wir ein n0 , so dass |an | ≤ ε gibt, dass |bn | ≤ ε f¨ f¨ ur n ≥ n0 . Dann ist aber erst recht |bn | ≤ ε f¨ ur n ≥ n0 . (ii) Es ist zu zeigen, dass (an + bn ) − (a + b) → 0, d.h. |(an + bn ) − (a + b)| soll klein“ werden f¨ ur große“ n. Nun ist wegen der Dreiecksungleichung ” ” |(an + bn ) − (a + b)| = |(an − a) + (bn − b)| ≤ |an − a| + |bn − b|, d.h. es reicht, dass |an − a| und |bn − b| klein“ werden. Da das durch die Voraus”¨ setzung garantiert ist, brauchen unsere Uberlegungen nur noch in einen vern¨ unftigen Beweis umgeschrieben zu werden. Sei also ε > 0 vorgegeben. Dann ist auch ε/2 > 0, und wegen an → a (bzw. ur n ≥ na bn → b) gibt es ein na ∈ N (bzw. nb ∈ N ), so dass |an − a| ≤ ε/2 f¨ (bzw. |bn − b| ≤ ε/2 f¨ ur n ≥ nb ). ur n ≥ n0 ist dann Sei n0 die gr¨oßere der beiden Zahlen na , nb . F¨ |(an + bn ) − (a + b)| ≤ ≤
|an − a| + |bn − b| ε ε + = ε. 2 2
Damit ist an + bn → a + b bewiesen. (iii) Im Fall c = 0 ist die Aussage offensichtlich richtig. Im Fall c = 0 ist es am einfachsten, Satz 2.2.10(ii) anzuwenden: Wegen |can − ca| = |c||an − a| folgt aus ur die Folge (can − ca)n∈N an → a, dass die Bedingung 2.2.10(ii) mit K = |c| f¨ erf¨ ullt ist. Also gilt can − ca → 0, d.h. can → ca. (iv) Hier nutzen wir die Aussage des Lemmas 2.2.11 aus: Es gibt ein M ≥ 0 mit |bn | ≤ M f¨ ur alle n ∈ N . Damit ist der Beweis einfach, wir brauchen nur einige schon bekannte Ergebnisse zu kombinieren. Da an bn → ab gezeigt werden soll, sch¨ atzen wir |an bn − ab| ab. Hintergedanussen also ke dabei: Wir wissen eigentlich nur etwas u ¨ ber |an − a| und |bn − b|, m¨ zu Ausdr¨ ucken dieser Form kommen (was wieder durch Addition einer geschickt geschriebenen Null gelingt). Es ist |an bn − ab| = |an bn − abn + abn − ab| ≤ |an bn − abn | + |abn − ab| = |bn ||an − a| + |a||bn − b| ≤ M |an − a| + |a||bn − b|.
2.2. KONVERGENZ
117
Nun ist |an − a| → 0, |bn − b| → 0 nach Voraussetzung, also wegen (ii) und (iii) auch M |an − a| + |a||bn − b| → 0. Dann aber folgt aus (i), dass an bn − ab → 0, d.h. gerade die Behauptung an bn → ab. (v) Die Idee ist ganz ¨ahnlich wie im vorigen Beweis: Der zu untersuchende Ausdruck |an /bn − a/b| wird durch Terme abgesch¨atzt, in denen |an − a| und |bn − b| vorkommen: an an a a a a = − − + − bn bn b bn bn b an a a a ≤ − + − bn bn bn b |a| 1 |an − a| + |b − bn |. = |bn | |bn ||b| Es w¨ urde nun genau so wie unter (iv) weitergehen, wenn wir 1/|bn | durch irgendeine Konstante M absch¨atzen k¨onnten. (Dann n¨amlich k¨ onnte die Absch¨ atzung durch |a| ≤ M |an − a| + M |bn − b| |b| weitergehen, und |an /bn − a/b| → 0 folgte aus (i), (ii) und (iii).) Wir zeigen noch, dass das wirklich m¨oglich ist: Zu ε := |b|/2 gibt es ein n0 mit der Eigenschaft, dass |bn − b| ≤ ε f¨ ur n ≥ n0 (wegen bn → b ; man beachte, dass ε > 0, denn b = 0 nach Voraussetzung). F¨ ur diese n ist dann |b| = ≤ ≤
|b − bn + bn | |b − bn | + |bn | |b| + |bn |, 2
d.h., es gilt |bn | ≥ |b|/2. Definiert man noch η als die kleinste der positiven Zahlen |b1 |, . . . , |bn0 −1 |, ur jedes n ∈ N . Damit haben wir |b|/2, so ist |bn | ≥ η und folglich 1/|bn | ≤ 1/η f¨ mit M := 1/η ein M mit den gew¨ unschten Eigenschaften gefunden. (vi) Aus xn → x und yn → y folgt durch Kombination von (ii) und (iii), dass xn + iyn → x + iy, d.h. an → a. Umgekehrt: Nach Definition ist |xn − x| = (xn − x)2 ≤ (xn − x)2 + (yn − y)2 = |an − a|. Gilt also an → a, so garantiert uns (i), dass xn → x. Ganz analog wird yn → y gezeigt.
KAPITEL 2. FOLGEN UND REIHEN
118
(vii) Angenommen, es w¨are a > M . Wir setzen dann ε := a − M > 0, aufgrund der Voraussetzung ist ε = a − M ≤ a − an ≤ |a − an | f¨ ur alle n. Deswegen k¨onnte (an ) nicht gegen a konvergent sein, und dieser Widerspruch beweist die Behauptung. (viii) Der Beweis ist leicht: Schreibt man bn = akn , so gilt doch nach Definition kn ≥ n. Ist also |a − an | ≤ ε f¨ ur n ≥ n0 , so ist erst recht |a − bn | ≤ ε f¨ ur diese Indizes n. Damit ist der Satz vollst¨andig bewiesen. Bemerkungen und Beispiele: 1. Durch Kombination der Resultate in 2.2.12 mit der Kenntnis einiger konkreter ¨ Nullfolgen ergeben sich konvergente Folgen im Uberfluss. Zum Beispiel gilt 12/n − 16/n2 → 0 (1 + 1/n) + 6i → 1 + 6i 1/n! → 0 ...
(Wegen (ii), (iii), 1/n → 0 und 1/n2 → 0.) (Wegen (iv) und 1/n → 0.) (Man beachte (i) und 1/n! ≤ 1/n.)
2. Nicht nur, dass wir nun auf bequeme Weise Beispiele f¨ ur konvergente Folgen erhalten: Es ist sogar so, dass so gut wie alle Konvergenzbeweise der Analysis durch souver¨anes Anwenden von Satz 2.2.12 gemeistert werden k¨ onnen (oft reicht schon eine Kombination des Majorantenkriteriums mit 1/n → 0 aus). Dazu zwei Beispiele: • F¨ ur q ∈ K mit |q| < 1 gilt q n → 0. Beweis: Im Fall q = 0 ist die Aussage sicher richtig, im Fall q = 0 schreiben wir die Zahl 1/|q| (sie ist nach Voraussetzung gr¨ oßer als 1) als 1 = 1 + x, |q| wo x > 0 ist. Nun gilt
∀ ∀ (1 + x)
n
≥ 1 + nx
x>0 n∈N
(die Bernoullische Ungleichung). Wir erhalten so |q n | = ≤ ≤
1 (1 + x)n 1 1 + nx 1 1 · , n x
(2.6)
2.2. KONVERGENZ
119
womit aufgrund des Majorantenkriteriums q n → 0 gezeigt ist. (Den Nach¨ weis der Bernoullischen Ungleichung sollten Sie zur Ubung in vollst¨ andiger Induktion selbst f¨ uhren.) √ • nn→1 √ Wir benutzen hier n · im Vorgriff. Wir werden sp¨ ater in Korollar 3.3.7 √ sehen, dass es zu a ≥ 0 genau ein y ≥ 0 mit y n = a gibt; dieses y soll n a genannt werden. Wenn Sie es nicht erwarten k¨onnen, empfehle ich Ihnen einen Beweisversuch in Analogie zu Lemma 2.2.3. √ aufiBeachten Sie, dass f¨ ur gr¨oßer werdende n bei der Zahl√n n zwei gegenl¨ n ge Tendenzen zu gewinnen versuchen. Die Aussage n → 1 besagt gerade, dass der Einfluss des Wurzelziehens gegen¨ uber dem Wachstum von n u ¨ berwiegt. Beweis: Wir geben nur die wichtigsten Schritte an: n(n − 1) 2 – Zeigen Sie (1 + x)n ≥ 1 + nx+ x f¨ ur n ∈ N und x ≥ 0 durch 2 vollst¨ andige Induktion; √ – schreiben Sie n n als 1+xn , wo offensichtlich xn > 0; es bleibt xn → 0 zu zeigen; – man beachte, dass √ n = ( n n)n = (1 + xn )n n(n − 1) 2 xn ≥ 1 + nxn + 2 n(n − 1) 2 xn ≥ 2 und damit xn ≤ 2/(n − 1). √ Es folgt xn → 0 und damit n n → 1. 3. Die Dreiecksungleichung spielte in den Beweisen zu (ii), (iv) und (v) eine ganz wesentliche Rolle. Es wurde schon in der Bemerkung nach Satz 2.2.2 ausgef¨ uhrt, woran das liegt. Der typische Trick“, sich das geeignete Vergleichselement zu ” beschaffen (etwa abn im Beweis von (iv)) bestand immer in der Addition einer geschickt geschriebenen Null. 4. Kombiniert man 2.2.10(ii) mit 2.2.12(i) und (iii), so erh¨ alt man sofort eine versch¨arfte Form des Majorantenkriteriums: ur alle Gilt an → 0 und gibt es M > 0, n1 ∈ N mit |bn | ≤ M |an | f¨ n ∈ N mit n ≥ n1 , so ist auch bn → 0. 5. Beachten Sie bei der Anwendung des Majorantenkriteriums immer, dass die Nullfolge auf der richtigen Seite der Ungleichung steht: Aus |bn | ≤ |an | und ur die Folge (an )n∈N gar nichts. bn → 0 folgt f¨
?
KAPITEL 2. FOLGEN UND REIHEN
120
2.3
Cauchy-Folgen und Vollst¨ andigkeit
Erinnern Sie sich an Bemerkung 3 nach Definition 2.2.9 auf Seite 110: Konvergenzbeweise ben¨otigen, bevor es u ur ¨berhaupt losgehen kann, einen Kandidaten f¨ den Limes. Das ist in vielen F¨allen ein gravierender Nachteil, denn ein derartiger Kandidat ist der konvergenten Folge h¨ aufig nicht anzusehen. Einen Ausweg aus dieser Schwierigkeit werden wir in diesem Abschnitt behandeln. Wieder wird die Vollst¨andigkeit von R eine zentrale Rolle spielen: August-Louis Cauchy 1789 – 1857
CauchyFolge
Definition 2.3.1. Sei (an )n∈N eine Folge in K . (an )n∈N heißt Cauchy-Folge, ur alle wenn f¨ ur jedes ε > 0 ein n0 ∈ N existiert, so dass |an − am | ≤ ε f¨ n, m ≥ n0 . In Quantorenschreibweise:
∀ ∃ ∀
ε>0 n0 ∈N
|an − am | ≤ ε.
n,m∈N n,m≥n0
Diese Definition15) bereitet Anf¨ angern erfahrungsgem¨ aß gr¨ oßere Schwierigkeiten als der Konvergenzbegriff. Daher einige Bemerkungen: ¨ 1. Es gibt starke formale Ahnlichkeiten zur Definition (an ) konvergiert gegen ” a“, in beiden F¨allen ist zu vorgegebenem ε > 0 ein n0 mit gewissen Eigenschaften zu finden. Hauptunterschied: Bei der Cauchy-Folgen-Definition kommen nur ur den Konvergenz-Nachweis muss noch die Folgenglieder an in der Aussage vor, f¨ der Grenzwert a von vornherein bekannt sein. Dieser Vorteil, dessen Tragweite Sie bald einsehen werden, wird durch das Auftreten von zwei Indizes m, n erkauft. Die machen Anf¨angern manchmal Schwierigkeiten. 2. Da in K die Cauchy-Folgen gerade die konvergenten Folgen sind (das wird gleich gezeigt werden), er¨ ubrigt es sich, Beispiele anzugeben. Trotzdem sollten Sie versuchen, mit der Definition eine anschauliche Vorstellung zu verbinden: ist eine Cauchy-Folge“ bedeutet, dass sich die Folgenglieder f¨ ur große“ (a ) ” ” n n∈N Indizes beliebig nahe“ kommen. ” ¨ 3. Wegen der großen Ahnlichkeit zur Konvergenzdefinition besitzen die meisten dazu gemachten Aussagen ein Analogon. Einige der Resultate sind ebenfalls sofort sinngem¨aß zu u ¨bertragen (z.B. die Aussagen in Satz 2.2.10(i), (ii), (iii)). Die f¨ ur uns wichtigsten Ergebnisse sind im nachstehenden Satz zusammengefasst. Satz 2.3.2. (an )n∈N und (bn )n∈N seien Folgen in K . (i) Ist (an )n∈N konvergent, so ist (an )n∈N eine Cauchy-Folge. (ii) Ist (an )n∈N eine Cauchy-Folge, so ist (an )n∈N beschr¨ankt: Es gibt eine ur alle n. reelle Zahl M , so dass |an | ≤ M f¨ 15) Sie geht nat¨ urlich auf Cauchy zur¨ uck. Cauchy bewies viele wichtige Resultate aus verschiedenen Gebieten der Mathematik. Von ihm stammt einer der ersten Versuche, die Analysis streng zu begr¨ unden ( Cours d’Analyse“, 1821). ”
¨ 2.3. CAUCHY-FOLGEN UND VOLLSTANDIGKEIT
121
(iii) Angenommen, (an )n∈N ist eine Cauchy-Folge. Gilt dann |bn − bm | ≤ |an − am | f¨ ur alle m, n ∈ N , so ist auch (bn )n∈N eine Cauchy-Folge. (iv) Sind (an )n∈N und (bn )n∈N Cauchy-Folgen, so auch (an + bn )n∈N und ur beliebiges c ∈ K . (can )n∈N f¨ (v) Sei K = C und an geschrieben als an = xn + iyn (mit xn , yn ∈ R ). Dann gilt: (an )n∈N Cauchy-Folge ⇐⇒ (xn )n∈N und (yn )n∈N sind Cauchy-Folgen. Beweis: (i) Der Beweis besteht aus einer einfachen Anwendung der Dreiecksungleichung, wir vergleichen den Abstand der Folgenglieder mit dem Abstand zum Limes a: |an − am | ≤ |an − a| + |am − a|. Der eigentliche Beweis nutzt dann wieder ein ε/2-Argument: Sei ε > 0 vorgegeben. Da dann auch ε/2 > 0 ist und da (an )n∈N konvergent ist, gibt es ein n0 ∈ N mit |an − a| ≤ ε/2 f¨ ur n ≥ n0 . F¨ ur n, m ≥ n0 ist dann |am − an | =
|am − a + a − an |
≤
Das zeigt, dass (an )n∈N
|an − a| + |am − a| ε ε + = ε. ≤ 2 2 Cauchy-Folge ist.
(ii) Aus der Cauchy-Folgen-Eigenschaft folgt:
∃ ∀ |a
n
− an0 | ≤ 1.
n0 n∈N n≥n0
Der Rest wird wie in Lemma 2.2.11 gezeigt. Die Beweise zu (iii), (iv) und (v) werden hier nicht gef¨ uhrt. Sie brauchen lediglich die Beweise von Satz 2.2.12(i), (ii), (iii) und (vi) zu verstehen und sinngem¨ aß zu u ¨ bertragen. Wir zeigen nun die Umkehrung von Satz 2.3.2(i), das zweifellos wichtigste Ergebnis dieses Abschnitts: Satz 2.3.3. Sei (an )n∈N eine Cauchy-Folge in K . Dann gibt es ein a ∈ K mit an → a. Kurz: Cauchy-Folgen in K sind konvergent. Beweis: Wir k¨ ummern uns zun¨achst um den reellen Fall, denn das Vollst¨ andigkeitsaxiom f¨ ur R wird eine wesentliche Rolle spielen. Wir haben von irgendwoher eine Cauchy-Folge (an )n∈N in R vorgelegt bekommen und sollen nun so lange arbeiten, bis wir sicher sind, dass es ein a ∈ R mit an → a gibt. Ein Blick auf das Axiomensystem von R gen¨ ugt, um festzustellen, dass tiefer liegende Existenzaussagen auf die Existenz von Schnittzahlen zur¨ uckgef¨ uhrt werden m¨ ussen (genauso war es beim Beweis f¨ ur die Existenz von Wurzeln in Lemma 2.2.3(ii)). Es stellt sich damit das folgende Problem:
KAPITEL 2. FOLGEN UND REIHEN
122
Gegeben sei eine Cauchy-Folge (an )n∈N in R . Man soll nun einen Dedekindschen Schnitt (A, B) so konstruieren, dass die Schnittzahl a (deren Existenz wegen 1.8.2 garantiert ist) der Limes der an ist. Vielleicht kommen Sie selbst auf einen vielversprechenden Kandidaten f¨ ur (A, B), hier machen wir mit der folgenden Definition weiter: a1 a2 a4 a3 ··· ··· x A B Bild 2.10: Der Dedekindsche Schnitt zur Folge (an )n∈N A :=
{x | x ∈ R , es existiert n0 mit an ≥ x f¨ ur alle n ≥ n0 }
B
{x | x ∈ R , x ∈ A}.
:=
Der weitere Beweisaufbau ist klar, wir behaupten: 1. (A, B) ist ein Dedekindscher Schnitt. 2. Sei a eine Schnittzahl f¨ ur (A, B), sie existiert wegen der Vollst¨ andigkeit von R . Dann gilt an → a. (Dann ist der Satz f¨ ur den Fall K = R vollst¨ andig bewiesen). Beweis von 1.: Wir zeigen, dass 1.8.1(i), (ii) und (iii) erf¨ ullt sind: • zu (i): Wegen 2.3.2(ii) gibt es ein M ≥ 0 mit |an | ≤ M f¨ ur alle n ∈ N . Das bedeutet −M ≤ an ≤ M f¨ ur n ∈ N , und daraus folgt sofort, dass −M ∈ A und M + 1 ∈ B. • zu (ii): Wir bemerken zun¨ achst, dass mit x ∈ A auch jedes x ∈ R mit x ≤ x zu A geh¨ort. Das folgt sofort aus der Definition. Es ergibt sich dann leicht, dass f¨ ur x ∈ A und y ∈ B notwendig x < y gilt: Die y ≤ x ∈ A liegen n¨amlich nach Vorbemerkung in A und damit nicht in B. • zu (iii): Das ist klar nach Definition von B. Beweis von 2.: Aufgrund der Vollst¨ andigkeit von R gibt es ein a ∈ R , so dass x ≤ a ≤ y f¨ ur x ∈ A und y ∈ B. Wir wollen an → a beweisen. Sei also ε > 0 vorgegeben. Wir zeigen: • Es gibt ein n1 ∈ N mit an ≥ a − ε f¨ ur alle n ≥ n1 . • Es gibt ein n2 ∈ N mit an ≤ a + ε f¨ ur alle n ≥ n2 . ur alle n ≥ n0 , wobei n0 die gr¨ oßere der Es ist klar, dass dann |an − a| ≤ ε f¨ beiden Zahlen n1 , n2 bezeichnet, und damit ist wirklich an → a bewiesen. Nun fehlt nur noch die Konstruktion von n1 und n2 :
¨ 2.3. CAUCHY-FOLGEN UND VOLLSTANDIGKEIT
123
n1 : Es ist a − ε < a, die Zahl a − ε kann also nicht in B liegen. Also gilt a − ε ∈ A, woraus nach Definition von A sofort die Existenz von n1 folgt. n2 : Das ist etwas schwieriger, erst hier wird die Cauchy-Folgen-Eigenschaft der Folge (an )n∈N ausgenutzt (bisher war lediglich von Bedeutung, dass (an )n∈N beschr¨ ankt ist). Wir w¨ahlen n2 so, dass |an − am | ≤ ε f¨ ur n, m ≥ n2 , und wir wollen noch zeigen, dass dieses n2 die geforderte Eigenschaft hat. Sei also n ≥ n2 gegeben. F¨ ur m ≥ n2 ist |an − am | ≤ ε und damit insbesondere am ≥ an − ε. an −ε erf¨ ullt also die f¨ ur Elemente aus A geforderte Bedingung16) , und das liefert uns, da a Schnittzahl ist, an − ε ≤ a. Und das bedeutet an ≤ a + ε f¨ ur n ≥ n2 . Soviel zum Fall K = R . Der noch ausstehende Fall K = C ergibt sich vergleichsweise leicht. Wir beginnen mit einer Cauchy-Folge (an )n∈N in C und schreiben jedes an als an = xn + iyn mit xn , yn ∈ R . Dann schließen wir folgendermaßen: (an )n∈N Cauchy-Folge
2.3.2(v)
⇒
(xn )n∈N , (yn )n∈N Cauchy-Folgen
⇒
(xn )n∈N , (yn )n∈N konvergent
erster Beweisteil
2.2.12(vi)
⇒
Damit ist der Satz (endlich!) bewiesen.
(an )n∈N konvergent.
Kommentar: Mit Satz 2.3.3 haben wir ein h¨aufig anwendbares Ergebnis gewonnen, das uns – bei gen¨ ugend geschicktem Beweis – die Existenz von Zahlen mit gew¨ unschten Eigenschaften sichert. Bisher stand uns f¨ ur derartige Existenzaussagen nur das Vollst¨ andigkeitsaxiom zur Verf¨ ugung (jedenfalls, wenn man von einfacheren Existenzaussagen wie der Existenz von Inversen oder dem Archimedesaxiom absieht). Cauchy-Folgen sind viel besser einsetzbar als Dedekindsche Schnitte, die werden ab jetzt keine wesentliche Rolle mehr spielen. Der Vorteil Dedekindscher Schnitte besteht darin, dass mit ihnen Vollst¨andigkeit relativ einfach formuliert werden kann. Cauchy-Folgen sind also konvergent, und Dedekindsche Schnitte sollen nach M¨ oglichkeit nicht mehr verwendet werden. Geht da nicht etwas von unserem Axiomensystem verloren? Nein! Wir werden in Satz 2.3.6 beweisen, dass Vollst¨ andigkeit a ¨quivalent mit Cauchy-Folgen formuliert werden kann. Bei der Gelegenheit wird es auch um weitere Umformulierungen dieses so fundamentalen Prinzips gehen, und um die zu verstehen, m¨ ussen Ihre Kenntnisse zum Thema Ordnung“ noch etwas vertieft werden. Es folgt deshalb zun¨ achst ein ” 16) N¨ amlich: Bis auf h¨ ochstens endlich viele Ausnahmen liegen alle Folgenglieder rechts von an − ε.
124
KAPITEL 2. FOLGEN UND REIHEN
Exkurs u ¨ber Ordnungsrelationen: Bisher kennen wir Ordnung“ nur aus Abschnitt 1.4: Durch die Festsetzung ” eines Positivbereichs und die damit m¨ ogliche Definition von ≤“ kann man ” in angeordneten K¨orpern je zwei verschiedene Elemente vergleichen, eins von beiden wird immer das gr¨oßere sein. Das ist allerdings nur ein Teil dessen, was man u amlich nicht nur in ¨ ber Ordnung“ unbedingt wissen muss. Es kommt n¨ ” K¨orpern vor, dass so etwas wie eine Rangfolge der Elemente“ eine Rolle spielt. ” Wir beginnen den Exkurs mit Ordnungsrelationen: Definition ≺
geordneter Raum
Es sei M eine Menge und ≺ eine Relation auf M : Es ist also eine Teilmenge ≺ von M × M vorgegeben. Wie in Definition 1.2.3 werden wir die eigentlich korrekte, aber viel zu schwerf¨allige Schreibweise (x, y) ∈ ≺“ durch x ≺ y“ ” ” ersetzen; f¨ ur x ≺ y werden wir hier x vor y“ sagen. ” M , versehen mit ≺, soll ein geordneter Raum heißen, wenn die folgenden drei Bedingungen erf¨ ullt sind: • F¨ ur jedes x ∈ M gilt x ≺ x; das nennt man die Reflexivit¨at von ≺. • F¨ ur beliebige x, y darf man aus der G¨ ultigkeit von x ≺ y und y ≺ x auf x = y schließen: Man sagt dann, dass ≺ antisymmetrisch ist. • Aus x ≺ y und y ≺ z soll man jedesmal auf x ≺ z schließen d¨ urfen. ≺ soll also transitiv sein. In diesem Fall nennen wir ≺ auch eine Ordnungsrelation auf M . Bemerkungen und Beispiele: 1. Es ist leider ein bisschen verwirrend, dass x3 (ist also x3 nicht obere Schranke), so soll x4 := (x2 + x3 )/2 sein, andernfalls setzen wir x4 := (x1 + x3 )/2; .. . xn+1 : x1 , . . . , xn seien schon konstruiert, wobei n ≥ 3. Falls xn obere Schranke von A ist, setzen wir xn+1 := xn − 2−(n−1) (x2 − x1 ), andernfalls definieren wir xn+1 := xn + 2−(n−1) (x2 − x1 ). Dann ist (xn )n∈N eine Cauchy-Folge, und es gilt lim xn = sup A. (iii) ⇒ (iv): Wir setzen voraus, dass beschr¨ ankte, nicht leere Teilmengen von R ein Supremum haben, und wir m¨ ussen zu einer vorgelegten Intervallschachtelung (an ), (bn ) ein x0 angeben, das zwischen den a und b liegt.
¨ 2.3. CAUCHY-FOLGEN UND VOLLSTANDIGKEIT
131
Das geht so: Wir definieren D als die Menge D := {x | es gibt ein n mit an ≥ x }. Dann ist D nicht leer (alle an geh¨oren zu D) und nach oben beschr¨ ankt (jedes bn ist eine obere Schranke). Folglich existiert das Supremum von D, das wir x0 nennen wollen. Aufgrund der Supremumseigenschaften und der eben zusamur alle n gelten. mengestellten Beobachtungen muss an ≤ x0 ≤ bn f¨ (iv) ⇒ (i): Diesmal wissen wir, dass es f¨ ur Intervallschachtelungen etwas genau ” dazwischen“ gibt, und daraus soll die Existenz von Schnittzahlen folgen. Wir starten also mit einem Dedekindschen Schnitt (A, B). Zun¨ achst w¨ ahlen wir irgendein Element a ∈ A und irgendein b ∈ B und taufen: a1 := a, b1 := b; da wir es mit einem Dedekindschen Schnitt zu tun haben, gilt a1 ≤ b1 . Dann betrachten wir x1 := (a1 + b1 )/2. Diese Zahl wird zu A oder zu B geh¨ oren, im ersten Fall geht es weiter mit a2 := x1 , b2 := b1 , im zweiten mit a2 := a1 , b2 := x1 . Als N¨achstes untersuchen wir die Zahl x2 := (a2 + b2 )/2. Geh¨ ort sie zu A, so wird a3 := x2 , b3 := b2 , andernfalls setzen wir a3 := a2 , b3 := x2 . So setzen wir die Konstruktion fort, nach Definition entsteht eine Intervalloren und schachtelung. Wir bemerken, dass die an zu A und die bn zu B geh¨ dass sich der Abstand von an zu bn von Schritt zu Schritt halbiert, es gilt (mit M := b1 − a1 ) die Identit¨at bn − an = M/2n−1 . ur alle n, Man w¨ ahle nun – nach Voraussetzung – ein x0 mit an ≤ x0 ≤ bn f¨ dieses x0 ist unser Kandidat f¨ ur eine Schnittzahl. Warum ist denn a ≤ x0 f¨ ur jedes a ∈ A? Dazu bemerken wir zun¨ achst, dass ur alle n gilt, denn die bn geh¨oren ja zu B. Außerdem ist an ≤ x0 ≤ bn a ≤ bn f¨ und folglich bn = x0 + (bn − x0 ) ≤ x0 + (bn − an ) ≤ x0 + M/2n−1 . So folgt a ≤ x0 + M/2n−1 , und da M/2n−1 → 0, muss a ≤ x0 gelten21) . Ganz genauso l¨ asst sich zeigen, dass x0 ≤ b f¨ ur alle b ∈ B gilt.
21) Vgl.
Beweisprinzip 5 im Kasten auf Seite 113.
KAPITEL 2. FOLGEN UND REIHEN
132
Die im vorstehenden Satz behandelten Umformulierungen des Vollst¨ andigkeitsaxioms werden eine wichtige Rolle spielen. Es folgt noch ein Beispiel zur Anwendung von Supremumstechniken, die oft sehr elegante Beweise erm¨ oglichen. Urteilen Sie selbst: Satz 2.3.7. Sei (an )n∈N eine Folge in R , so dass gilt: (i) Die Folge (an )n∈N ist monoton steigend, d.h., a1 ≤ a2 ≤ · · · . ur alle (ii) (an )n∈N ist nach oben beschr¨ankt: Es gibt ein M mit an ≤ M f¨ n ∈ N. Dann ist (an )n∈N konvergent mit lim an = sup{an | n ∈ N }. Analog gilt: Ist (an )n∈N monoton fallend und nach unten beschr¨ankt, so ist (an )n∈N konvergent mit lim an = inf{an | n ∈ N }. Beweis: Sei (an )n∈N eine monoton steigende, durch ein M ∈ R nach oben beschr¨ankte Folge: a1
a2
a3 a4 a5 · · ·
M
R
Bild 2.13: Die Folge (an )n∈N mit oberer Schranke M Dann ist A := {an | n ∈ N } nicht leer und durch M nach oben beschr¨ ankt. Folglich existiert x0 := sup A, und es bleibt an → x0 zu zeigen. Sei dazu ε > 0 vorgelegt. Da x0 − ε echt kleiner als x0 ist, kann x0 − ε keine obere Schranke von A sein (denn x0 ist ja die kleinste obere Schranke). Es existiert also ein n0 ∈ N mit an0 > x0 − ε. Aufgrund der Monotonie ist dann an ≥ an0 > x0 − ε f¨ ur alle n ≥ n0 , was zusammen mit der Voraussetzung x0 ist obere Schranke von A“ die Ungleichung ” x0 − ε < an ≤ x0 < x0 + ε (alle n ≥ n0 ) ergibt. Folglich ist |an − x0 | ≤ ε f¨ ur n ≥ n0 und damit ist alles gezeigt.
2.4. UNENDLICHE REIHEN
2.4
133
Unendliche Reihen
Es kommt h¨ aufig vor, dass Konvergenzbetrachtungen f¨ ur Folgen der Form (a1 , a1 + a2 , a1 + a2 + a3 , . . .) anzustellen sind. In diesem Abschnitt wollen wir diesen Spezialfall n¨ aher untersuchen. Definition 2.4.1. Sei (an )n∈N eine Folge in K , wie bisher bedeutet das Zeichen K den K¨orper der reellen oder der komplexen Zahlen. F¨ ur N ∈ N verstehen wir unter der N -ten Partialsumme die Zahl sN := a1 + a2 + . . . + aN =
N
an .
n=1
Falls der Limes der Folge (sN )N ∈N existiert, sagen wir, dass die zu (an )n∈N geh¨orige Reihe konvergent ist. In diesem Fall schreiben wir ∞
∞
an := lim sN .
n=1
N →∞
Die Zahl origen Reihe n=1 an wird die Reihensumme der zu (an )n∈N geh¨ genannt. Reihen, die nicht konvergent sind, heißen divergent. Bemerkungen und Beispiele:
∞ 1. F¨ ur n=1 an
schreibt man auch a1 + a2 + · · · oder, wenn der Laufbereich der Indizes klar ist, an . Es
sollte Ihnen keine
∞ Schwierigkeiten machen, die Definition auf Reihen des a oder Typs ∞ ¨bertragen. n n=0 n=5 an zu u 2. Ist (an )n∈N eine abbrechende Folge, d.h. gibt es ein n ˆ mit an = 0 f¨ ur n > n ˆ , so ist die Folge der Partialsummen vom Index n ˆ an konstant und folglich konvergent gegen a1 + · · · + anˆ . Kurz: ∞ n ˆ an = an , n=1
n=1
und in diesem Sinne sind endliche Summen ein Spezialfall konvergenter Reihen. 3. Die vorstehende Reihe war nicht besonders bemerkenswert. Wie im Fall konvergenter Folgen gibt es auch in der Reihenrechnung einen ausgezeichneten Kandidaten, der unser erstes interessanteres Beispiel darstellt. Wir behaupten: F¨ ur q ∈ K mit |q| < 1 ist die Reihe 1 + q + q 2 + · · · konvergent mit ∞ 1 . qn = 1 + q + q2 + · · · = 1 − q n=0 Der Vollst¨ andigkeit halber ist anzumerken, dass q n f¨ ur n = 0 noch nicht definiert ur alle q ∈ K , insbesondere ist auch 00 := 1. ist. Wir setzen q 0 := 1 f¨
∞
n=1
KAPITEL 2. FOLGEN UND REIHEN
134
¨ Beweis dazu: Als leichte Ubung in vollst¨ andiger Induktion erh¨ alt man n 1 − q n+1 1 + q + q2 + · · · + qn = . qk = 1−q k=0
Da wir schon wissen, dass q n → 0 f¨ ur |q| < 1 (vgl. Seite 118), ergibt sich unter Verwendung der in Satz 2.2.12 bewiesenen Resultate: ∞ n=0
geometrische Reihe
1 1 − q n+1 = . n→∞ 1−q 1−q
q n = lim
Diese Reihe – sie wird die geometrische Reihe genannt – wird f¨ ur die Reihenrechnung die gleiche fundamentale Rolle spielen wie (1/n)n∈N in der Theorie der konvergenten Folgen. 4. Wir wollen hier das paradoxe Ergebnis 1 = 0 mit Hilfe der Reihenrechnung beweisen“.
” Sei zun¨achst an eine konvergente Reihe. Wir verteilen in a1 + a2 + a3 + · · · auf beliebige Weise Klammern, etwa als (a1 ) + (a2 + a3 ) + (a4 + a5 + a6 ) + (a7 + a8 + a9 + a10 ) + · · · ,
?
wir gehen also zu b1 + b2 + b3 + · · · u ¨ ber, wobei die b Summen u ¨ ber endliche Abschnitte der an sind und die Reihenfolge nicht ver¨ andert wurde. Da die Partiorigen Partialsummenfolge alsummenfolge der (bn ) eine Teilfolge der
zu (an ) geh¨
ist, kann man sofort die Existenz von bn garantieren, auch gilt an = bn . Doch Achtung: Falls man mit nicht konvergenten Reihen das Gleiche nachmachen m¨ochte, kann Unsinn herauskommen. Ein ber¨ uhmtes Beispiel ist die Reihe 1−1+1−1+1−1±· · ·. Klammert man sie als (1−1)+(1−1)+(1−1)+· · ·, so ist das Ergebnis 0, da ja nur Nullen addiert werden. Rechnet man aber 1 + (−1 + 1) + (−1 + 1) + · · · , so ist der Wert offensichtlich 1, da ja auf die 1 nur noch Nullen folgen. Keiner braucht sich aber Sorgen zu machen, wir haben nicht 1 = 0 bewiesen, denn die obigen Umformungen d¨ urfen nur bei konvergenten Reihen vorgenommen werden.
∞ ussen, wenn n=1 an exi5. Anschaulich ist klar, dass die an klein“ werden m¨ ” stieren soll, und wirklich werden wir gleich in Satz 2.4.2 beweisen, dass f¨ ur Beikonvergente Reihen notwendig an → 0 gelten muss. Das liefert unmittelbar
∞ spiele f¨ ur nicht konvergente Reihen: Wenn (an ) keine Nullfolge ist, kann n=1 an nicht existieren. (Machen Sie sich das auch direkt, d.h. ohne Verwendung von Satz 2.4.2, an einigen Beispielen klar, etwa an (1, −1, 1, −1, . . .): Warum existiert die zugeh¨orige Reihensumme nicht?)
∞ Die Umkehrung gilt nicht : Aus an → 0 folgt nicht, dass n=1 an existiert. Das sieht man leicht am Beispiel 1 1 1 1 1 1, , , , , , . . . . 2 2 3 3 3
2.4. UNENDLICHE REIHEN
135
Die Partialsummen sind offensichtlich unbeschr¨ankt, k¨ onnen also wegen Lemma 2.2.11 keine konvergente Folge bilden. Die harmonische Reihe Etwas genauer muss man schon hinsehen, um sich klarzumachen, dass die Reihe 1 + 1/2 + 1/3 + · · · (die so genannte harmonische Reihe) nicht konvergiert. Auch hier sind die Partialsummen nicht beschr¨ ankt, was durch geschicktes Absch¨atzen offensichtlich wird: s1
=
s2
=
s4
=
s8
=
1 2 2 1 1+ ≥ 2 2 1 1 1 1 3 1 1 1 1+ + + ≥ + + + = 2 3 4 2 2 4 4 2 1 1 1 1 4 1 1 + ···+ ≥ + + 2 · + 4 · = 8 2 2 4 8 2 1≥
.. . n
s2n
=
ν−1
2 n 2 1 1 1 n+1 ≥ + = k 2 ν=1 µ=1 2ν 2 k=1
.. .
¨ 6. Andert man in (a
n )n∈N endlich viele Glieder ab, so wird dadurch das Konver∞ genzverhalten von n=1 an nicht ge¨andert, denn von einer Stelle ab stimmen die neuen Partialsummen bis auf eine additive Konstante mit den alten u ¨ berein. Die Reihensumme kann sich nat¨ urlich ¨andern. Aufgrund der Reihendefinition k¨onnen wir sofort alle diejenigen Ergebnisse ¨ aus der Theorie der konvergenten Folgen u ¨bertragen, bei denen der Ubergang von der Folge zu den Partialsummen keine Schwierigkeiten macht. Ein Negativbeispiel: Sie k¨ onnen die Partialsummen von (an bn )n∈N nicht einfach durch die Partialsummen von (an )n∈N
und (bn )n∈N ausdr¨ ucken, und deswegen werden Sie ∞ hier auch keinen Satz u ¨ ber n=1 an bn finden. Satz 2.4.2. (an )n∈N und (bn )n∈N seien Folgen in K .
∞
∞
∞ (i)
Falls exisieren, so auch n=1 an und n=1 (an + bn ). Es gilt
∞ n=1 bn
∞ ∞ n=1 (an + bn ) = n=1 an + n=1 bn . Schreibt man das als (a1 +b1 )+(a2 +b2 )+· · · = (a1 +a2 +· · · )+(b1 +b2 +· · · ), so wird klar, dass es sich um den Spezialfall eines Kommutativgesetzes f¨ ur unendliche Reihen handelt.
∞
∞ (ii) Es gilt das Distributivgesetz: Wenn so auch n=1 can
∞ n=1 an existiert,
∞ f¨ ur jedes c ∈ K . Und dann gilt n=1 can = c n=1 an .
harmonische Reihe
KAPITEL 2. FOLGEN UND REIHEN
136 (iii) CauchyKriterium
∞
ullt ist n=1 an existiert genau dann, wenn die folgende Bedingung erf¨ (das so genannte Cauchy-Kriterium): m ak ≤ ε. ε>0 n ∈N n,m∈N
∀∃ ∀
k=n+1
0
m>n≥n0
VergleichsKriterium
∞ (iv) Falls n=1 |bn |
existiert und |an | ≤ |bn | f¨ ur alle n ∈ N ist, so existiert ∞ auch die Reihe n=1 an .
∞
∞ Insbesondere impliziert die Konvergenz
von n=1 |an | diejenige von n=1 an . ∞ ∞ In diesem Fall gilt auch | n=1 an | ≤ n=1 |an |.
∞ ur alle n (v) Wenn n=1 an existiert, so ist an → 0. Außerdem gilt dann: F¨ existiert bn := an + an+1 + · · · , und bn → 0. Beweis: (i) Wir beginnen mit der Gleichung (a1 + b1 ) + · · · + (an + bn ) = (a1 + · · · + an ) + (b1 + · · · + bn ), die Puristen durch vollst¨andige Induktion beweisen m¨ ussen. Selbst bei geringer Erfahrung sieht man aber, dass das sofort aus der Kommutativit¨ at und der Assoziativit¨at der Addition folgt. Damit ist die behauptete Aussage ein Spezialfall von Satz 2.2.12(ii), in dem gezeigt wurde, dass der Limes einer Summe gleich der Summe der Limites ist. (ii) Das folgt aus (ca1 + · · · + can ) = c(a1 + · · · + an ) und Satz 2.2.12(iii).
∞ (iii) Die Existenz der Reihe n=1 an bedeutet doch nach Definition, dass die Folge (sn ) der Partialsummen konvergent ist, und das ist genau dann der Fall, wenn (sn ) eine Cauchy-Folge ist. Wenn man noch f¨ ur die Aussage (sn ) ist ” Cauchy-Folge“ die Definition einsetzt, ergibt sich die Aussage (iii). (iv) Wir beginnen mit einer Vorbereitung, dazu erinnern wir zun¨ achst an die ur c1 , c2 ∈ K . Durch vollst¨ andiDreiecksungleichung: Es ist |c1 +c2 | ≤ |c1 |+|c2 | f¨ ge Induktion ergibt sich daraus eine verallgemeinerte Dreiecksungleichung f¨ ur n Summanden: |c1 + · · · + cn | ≤ |c1 | + · · · + |cn |. Hier zeigen wir nur den Induktionsschritt: |c1 + · · · + cn + cn+1 |
≤
|c1 + · · · + cn | + |cn+1 |
≤
|c1 | + · · · + |cn | + |cn+1 |.
Dabei wurde im letzten Schritt die Induktionsannahme verwendet.
2.4. UNENDLICHE REIHEN
137
Nun zum Beweis von (iv), wir nehmen an, dass ∞ n=1 |bn | existiert. Wir wollen ullt ist. zeigen, dass f¨ ur die Reihe der (an )n∈N das Cauchy-Kriterium (iii) erf¨ Sei also ε > 0 vorgegeben. Nach Voraussetzung und (iii) gibt es ein n0 ∈ N , so dass f¨ ur m > n ≥ n0 die Ungleichung m
|bk | ≤ ε
k=n+1
erf¨ ullt ist. Dann aber gilt f¨ ur m > n ≥ n0 nach unserer Vorbereitung: m m m ak ≤ |ak | ≤ |bk | ≤ ε. k=n+1
k=n+1
(2.7)
k=n+1
Das Cauchy-Kriterium ist also erf¨ ullt, und damit ist der erste Teil von (iv) bewiesen. F¨ ur den zweiten Teil der Aussage ist es bequem, zuerst ein allgemeines Ergebnis f¨ ur Folgen zu beweisen: Ist (cn )n∈N irgendeine konvergente Folge in K und gilt |cn | ≤ M f¨ ur ein M ≥ 0 und alle n ∈ N , so ist |lim cn | ≤ M . ur jedes ε > 0 ist dann, sobald nur n Beweis dazu: Sei c := lim cn . F¨ gen¨ ugend groß ist, |cn − c| ≤ ε und folglich |c| ≤ |c − cn | + |cn | ≤ M + ε. Daraus folgt sofort |c| ≤ M (vgl. den Kasten auf Seite 113).
Man setze nun M := ∞ n=1 |an |. Da die Folge der Partialsummen zu dieser Reihe monoton steigt und M nach Satz 2.3.7 das Supremum ist, folgt n
|ak | ≤ M
k=1
f¨ ur alle n ∈ N . Dann ist |a1 + · · · + an | ≤
n
|ak | ≤ M,
k=1
∞ also gilt nach unserer Vorbereitung auch | ∞ n=1 an | ≤ M = n=1 |an |. (v) Der erste Teil folgt aus (iii) f¨ ur den Spezialfall m = n + 1. F¨ ur den zweiten Teil beachte man zun¨achst, dass sich – f¨ ur festes n – die Partialsummen der (bn )-Reihe nur bis auf eine Konstante von den Partialsummen der (an )-Reihe unterscheiden und
deswegen Konvergenz vorliegt. ∞ Weiter gilt: Ist n=1 an = a und sn die n-te Partialsumme der (an )-Reihe, so gilt sn−1 + bn = a nach Definition. Aus sn → a folgt dann bn → 0. Da wir bisher als einziges Beispiel f¨ ur konvergente Reihen (außer den abbrechenden) die geometrische Reihe zur Verf¨ ugung haben, k¨onnen wir den vorstehenden
KAPITEL 2. FOLGEN UND REIHEN
138
Permanenzsatz auch nur darauf anwenden. Aus (i) und (ii) etwa folgt, dass n n ∞ 1 1 1.6 4 + 1.6 · − 4· = 1 + 1 6 16 1 − 1 + 6 16 n=0 gilt. Wesentlich interessanter ist es, Folgerungen aus (iv) im Falle (bn ) = (q n ) zu ziehen. Die allermeisten Reihen werden auf diese Weise als konvergent erkannt, so dass der gr¨oßte Teil der Reihenrechnung aus lediglich drei Bausteinen aufgebaut ist, n¨amlich • dem Cauchy-Kriterium;
n ur |q| < 1 konvergent ist; • der Tatsache, dass q f¨ • der Ungleichung (2.7) im vorstehenden Beweis von (iv), d.h. aus |ak | ≤ |bk | folgt m m m ak ≤ |ak | ≤ |bk |. k=n+1
k=n+1
k=n+1
Diese Ungleichung ist auch in anderer Hinsicht entscheidend : An
dieser Stelle ∞ vergibt man die Chance, mit einem plausiblen Kandidaten f¨ ur n=1 an die Konvergenz direkt nachweisen zu k¨ onnen. Nach (2.7) kann nur noch Konvergenz
schlechthin bewiesen werden, ein konkreter Wert f¨ ur ∞ n=1 an muss – wenn das u ¨ berhaupt m¨oglich ist – auf andere Weise gewonnen werden. Der n¨achste Satz enth¨alt die wichtigsten Konvergenzkriterien. Wie angek¨ undigt, wird das haupts¨achlich auf eine Anwendung von Satz 2.4.2(iv) f¨ ur die Folge (bn ) = (q n ) hinauslaufen. Konvergenzkriterien
Satz 2.4.3. (an
)n∈N sei eine Folge in K . Jede der folgenden Bedingungen ∞ garantiert, dass n=1 an existiert: (i) Wurzelkriterium22) : Es gibt ein n ˆ ∈ N sowie ein q ∈ R mit 0 ≤ q < 1, so dass f¨ ur alle n ≥ n ˆ gilt: n |an | ≤ q. (ii) Quotientenkriterium: Es gibt ein n ˆ ∈ N und ein 0 ≤ q < 1, so dass f¨ ur n≥n ˆ gilt: an+1 ≤ q. an = 0 und an (iii) Kriterium f¨ ur alternierende Reihen, oder auch Leibniz23) -Kriterium: Alle an sind reell, es gilt an → 0 sowie |an+1 | ≤ |an | f¨ ur alle n, und
Gottfried Wilhelm Leibniz 1646 – 1716
√ 22) Zur Erinnerung: F¨ ur a ≥ 0 ist n a ist diejenige Zahl b ≥ 0, f¨ ur die bn = a gilt. Der Existenznachweis wird erst in Korollar 3.3.7 nachgeliefert werden, er wird unabh¨ angig vom Wurzelkriterium sein. 23) Leibniz war einer der letzten Universalgelehrten, gegen Ende des 17. Jahrhunderts schuf er - unabh¨ angig von Newton - die Grundlagen der Analysis. Auf ihn gehen einige der noch heute verwendeten Symbole zur¨ uck, z.B. das Integralzeichen. Leibniz starb verarmt und verbittert.
2.4. UNENDLICHE REIHEN
139
die Vorzeichen der an sind abwechselnd positiv und negativ. Es ist also entweder a1 ≥ 0, a2 ≤ 0, a3 ≥ 0, . . . oder umgekehrt. Beweis: (i) Da uns nur Konvergenz schlechthin interessiert, darf der Einfachheit halber n ˆ = 1 angenommen werden. ullt ist, Zum Beweis ist dann nur zu bemerken, dass 2.4.2(iv) mit bn = q n erf¨ n denn aus |an | ≤ q folgt |an | ≤ q n durch Ausnutzen der bekannten Rechenren geln f¨ ur Ungleichungen, und wegen |q| < 1 ist die Reihe ∞ n=1 q konvergent. (ii) Wieder darf der Einfachheit halber n ˆ = 1 angenommen werden. Durch Umformung der Ungleichungen a2 ≤ q, a3 ≤ q, . . . a1 a2 anfolgt |a2 | ≤ q|a1 |, |a3 | ≤ q|a2 | ≤ q 2 |a1 |, . . .. Allgemein ergibt sich durch vollst¨ dige Induktion schließlich |an | ≤ q n−1 |a1 |. Nun ist nur noch 2.4.2(iv) mit bn = q n−1 |a1 | anzuwenden. (iii) Wir betrachten eine f¨ ur das Nachpr¨ ufen des Cauchy-Kriteriums typische Summe: m ak = an+1 + an+2 + · · · + am . k=n+1
Ist etwa an+1 ≥ 0, so folgt aus |ak+1 | ≤ |ak | (alle k ∈ N ) und an+2 ≤ 0, an+3 ≥ 0, . . . , dass
0
0 ≤
an+1
0 ≤ 0 ≤ .. . 0 ≤
an+1 + an+2 ≤ an+1 an+1 + an+2 + an+3 ≤ an+1 an+1 + · · · + am ≤ an+1 .
an+1 + an+2
an+1 + an+2 + an+3
an+1 R
Bild 2.14: Einige Glieder der Partialsummenfolge Analog erh¨ alt man im Fall an+1 ≤ 0: an+1 ≤ an+1 + · · · + am ≤ 0. Stets gilt also:
m ak ≤ |an+1 |. k=n+1
KAPITEL 2. FOLGEN UND REIHEN
140
Nach dieser Vorbereitung ist das Cauchy-Kriterium 2.4.2(iii) leicht nachpr¨ ufbar: F¨ ur vorgegebenes ε > 0 w¨ahle man n0 ∈ N mit |an | ≤ ε f¨ ur n ≥ n0 , das ist m¨oglich wegen an → 0. Ist dann m > n ≥ n0 , so gilt m ak ≤ |an+1 | ≤ ε, k=n+1
und das zeigt die Existenz von
∞ n=1
an .
Bemerkungen/Beispiele: 1. Es ist wichtig zu bemerken, dass q in (i) und (ii) wirklich kleiner als 1 und von n unabh¨angig sein muss. Eine Abschw¨ achung der Voraussetzung zu an+1 n 0 ist (dann ist n¨amlich |s − sϕ | = 0, also s = sϕ ). Der Beweis besteht aus einem typischen ε/3-Argument. Darunter verstehen Mathematiker das Verfahren, die ε-Nachbarschaft zweier Zahlen a und b dadurch zu zeigen, dass man f¨ ur geeignete Zahlen c und d beweist, dass |a − c| ≤ ε/3, |c − d| ≤ ε/3, |d − b| ≤ ε/3. Dass das wirklich reicht, folgt aus der Dreiecksungleichung26): |a − b| = |(a − c) + (c − d) + (d − b)| ≤ |a − c| + |c − d| + |d − b|. Sei also ε > 0 vorgegeben. Wir w¨ahlen zun¨achst ein n0 ∈ N mit n0 ε an ≤ und s − 3 n=1
m k=n+1
|ak | ≤
ε (alle m > n ≥ n0 ). 3
So ein n0 kann gefunden werden, indem man das Cauchy-Kriterium mit der Definition der Reihenkonvergenz kombiniert. Anschließend suchen wir uns ein n1 ∈ N mit {ϕ(1), . . . , ϕ(n1 )} ⊃ {1, . . . , n0 } und n1 aϕ(k) ≤ ε/3. sϕ − k=1
Hier nutzen wir neben der Definition der Reihenkonvergenz die Tatsache aus, dass ϕ eine surjektive Abbildung ist27) . (Durch diese Wahl von n1 ist sichergestellt, dass unter den Summanden aϕ(1) , . . . , aϕ(n1 ) alle Zahlen a1 , . . . , an0 ¨ vorkommen, das wird gleich – beim Ubergang von der zweiten zur dritten Zeile in der n¨ achsten Absch¨atzung – wichtig werden.) 26) Hier
sollte man vielleicht besser Vierecksungleichung“ sagen. ” Es gibt doch nach Definition der Surjektivit¨ at Zahlen k1 , . . . , kn0 mit oßte der Zahlen k1 , . . . , kn0 . ϕ(k1 ) = 1,. . . ,ϕ(kn0 ) = n0 . Man definiere n1 als die gr¨ 27) Genauer:
KAPITEL 2. FOLGEN UND REIHEN
144
Weiterhin sei m0 die gr¨oßte der Zahlen ϕ(1), . . . , ϕ(n1 ). Dann ist n0 n0 n1 n1 |s − sϕ | = s − ak + ak − aϕ(k) + aϕ(k) − sϕ k=1 k=1 k=1 k=1 n n n n 0 0 1 1 ak + ak − aϕ(k) + aϕ(k) − sϕ ≤ s − k=1 k=1 k=1 k=1 ε ε ≤ + ak + 3 3 1 )} k∈{ϕ(1),...,ϕ(n k>n0 2 ≤ ε+ |ak | 3 ≤ ≤
2 ε+ 3
k∈{ϕ(1),...,ϕ(n1 )} k>n0 m0
|ak |
k=n0 +1
ε 2 ε + = ε. 3 3
(Es sollte nicht verschwiegen werden, dass wir zwischendurch das Summenzeichen in einer noch genau
nnicht definierten Variante benutzt haben. Wir kennen,
genommen, nur i=1 ai , hier aber tauchten Ausdr¨ ucke der Form k∈∆ ak auf, wobei ∆ eine endliche Teilmenge von N ist. Intuitiv sollte klar sein, was das bedeutet, etwas mehr wird dazu in Abschnitt 2.5 auf Seite 152 gesagt werden.) andig Wir haben wirklich |s − sϕ | = 0 gezeigt, und damit ist der Beweis vollst¨ gef¨ uhrt. Bemerkungen: 1. Eine Reihe wird unbedingt konvergent genannt, wenn jede Umordnung zur gleichen Reihensumme konvergiert. Satz 2.4.5 besagt also gerade, dass die Implikation absolut konvergent ⇒ unbedingt konvergent (2.8) gilt. Da sich f¨ ur konvergente Reihen, die nicht absolut konvergent sind, durch Umordnen jede beliebige Reihensumme erreichen l¨ asst (das wurde vor Definition 2.4.4 skizziert), gilt auch die Umkehrung: Absolute Konvergenz ist f¨ ur Reihen in K das Gleiche wie unbedingte Konvergenz. Es ist trotzdem wichtig, unbedingte und absolute Konvergenz zu unterscheiden, denn in allgemeineren Situationen28) als der hier betrachteten gilt nur (2.8), nicht aber die Umkehrung. 28) Gemeint sind Folgen in R¨ aumen, bei denen die f¨ ur die Definition relevanten Bedingungen erf¨ ullt sind: • es gibt einen Abstandsbegriff;
• Cauchy-Folgen sind konvergent; • der zu Grunde liegende Raum ist ein Vektorraum. F¨ ur Fortgeschrittene: Jeder Banachraum liefert ein Beispiel f¨ ur einen solchen Raum, und nach
2.4. UNENDLICHE REIHEN
145
2. Trivialerweise ist eine konvergente Reihe mit positiven Gliedern absolut konvergent und damit nach dem vorstehenden Satz unbedingt konvergent. Diese Bemerkung ist wichtig f¨ ur die Wahrscheinlichkeitstheorie: M¨ ochte man f¨ ur eine abz¨ ahlbare Menge E die Wahrscheinlichkeit ausrechnen, so muss man daf¨ ur die
∞ Reihensumme n=1 P ({ωn }) bestimmen, wobei E als {ω1 , ω2 , . . .} geschrieben ur das Eintreten von ωi bezeichnet. Und ist und P ({ωi }) die Wahrscheinlichkeit f¨ die Wahrscheinlichkeit von E w¨are nicht wohldefiniert, wenn die Reihensumme von der angen w¨ urde, wie man E als Folge {ω1 , ω2 , . . .} darstellt, die
Art abh¨ P ({ω }) also nicht unbedingt konvergent w¨ are. Reihe ∞ n n=1
Absolut konvergente Reihen verhalten sich noch in anderer Hinsicht so, wie man es von endlichen Reihen her gewohnt ist: Beim Multiplizieren derartiger Reihen darf ausmultipliziert“ werden. Genauer gilt der folgende Multiplikati” onssatz f¨ ur absolut konvergente Reihen:
∞
∞ Satz 2.4.6. n=1 an und n=1 bn seien absolut konvergente Reihen in K . Definiert man dann f¨ ur n ∈ N : cn :=
n
ak bn+1−k = a1 bn + a2 bn−1 + · · · + an b1 ,
k=1
so ist
∞
n=1 cn
konvergent, und es gilt: ∞ n=1
cn =
∞
! an
n=1
∞
! bn
.
n=1
Das wird ausgeschrieben noch deutlicher: (a1 + a2 + · · · )(b1 + b2 + · · · ) = a1 b1 + (a1 b2 + a2 b1 ) + (a1 b3 + a2 b2 + a3 b1 ) + · · · .
Beweis: (Auch dieser Beweis ist recht technisch, manche werden ihn sich f¨ ur sp¨ ater aufsparen wollen.)
∞ 1. Schritt: Die Reihe n=1 cn ist – sogar absolut – konvergent. Beweis dazu: Wir werden die Beschr¨anktheit der Partialsummen der zu (|cn |) geh¨ von
∞
∞origen Reihe zeigen. Wegen Satz 2.3.7 folgt daraus die Konvergenz n=1 |cn |, und ergibt sich mit Satz 2.4.2(iv) die Konvergenz von n=1 cn .
∞
∞ Man w¨ ahle M ≥ 0 als die gr¨oßere der Zahlen n=1 |an | und n=1 |bn |. F¨ ur dem gefeierten Satz von Dvoretzky und Rogers gibt es in jedem unendlich-dimensionalen Banachraum eine unbedingt konvergente Reihe, die nicht absolut konvergent ist.
KAPITEL 2. FOLGEN UND REIHEN
146
eine beliebige Partialsumme der zu |c1 | + |c2 | + · · · geh¨ origen Reihe gilt dann: n i |c1 | + |c2 | + · · · + |cn | = aj bi+1−j i=1 j=1 i n
≤
i=1 j=1 n n
≤
|aj ||bi+1−j | |ai ||bj |
i=1 j=1 n
n |ai | |bj |
=
i=1
j=1
≤
M · M.
∞
∞
∞ 2. Schritt: Wir setzen a := n=1 an , b := n=1 bn , c := n=1 cn und behaupten, dass a · b = c gilt; damit w¨are der Satz dann bewiesen. Beweis dazu: Wir werden zeigen, dass |c − a · b| ≤ ε f¨ ur jedes positive ε ist. Folglich beginnen wir mit der Vorgabe irgendeines ε > 0, von dem wir annehmen wollen dass es kleiner als 1 ist; dadurch werden wir zum Beweisende ε · ε durch ε absch¨atzen k¨onnen. Es ist doch leicht, die Zahlen a, b und c durch geeignete Partialsummen zu approximieren, ummern wir uns zun¨ achst um den Vergleich von
n
n deswegen
n k¨ i=1 ci mit ( i=1 ai )( j=1 bj ): n n n a b c − i j i i=1 j=1 i=1
ai bj = i,j=1,...,n, i+j>n+1 |ai bj |. ≤ i,j=1,...,n, i+j>n+1
Nun ist die Beobachtung wichtig, dass im Fall i, j ≥ 0, i + j > n, eine der Zahlen i oder j gr¨oßer als n/2 sein muss29) . Folglich k¨ onnen wir die Absch¨ atzung mit ≤ |ai bj | + |ai bj | i,j=1,...,n, i≥n/2
i,j=1,...,n, j≥n/2
n
n fortsetzen, wobei der erste Summand ≤ ( i=n/2 |ai |)( j=1 |bj |) und folglich
n
n ≤ ( i=n/2 |ai |)M und entsprechend der zweite ≤ ( j=n/2 |bj |)M ist.
2m
2m ur Man w¨ahle ein m0 , so dass i=m |ai | ≤ ε und gleichzeitig i=m |bi | ≤ ε f¨ m ≥ m0 ; so ein m0 gibt es wegen des Cauchy-Kriteriums. 29) Wir
wollen annehmen, dass n eine gerade Zahl ist.
2.4. UNENDLICHE REIHEN
147
ur die n ≥ 2m0 gilt. Dann sind die Summen
ngerade Zahl, f¨
nSei nun n eine atzbar, und insgesamt erhalten wir i=n/2 |ai | und j=n/2 |bj | durch ε absch¨ n n n ≤ 2M ε. a b c − i j i i=1 j=1 i=1 Wir w¨ ahlen nun n so groß, dass n ai ≤ ε, a − i=1
n b − b j ≤ ε, j=1
n ci ≤ ε. c − i=1
Wenn man dann ε1 , ε2 , ε3 durch ε1 ε2 ε3
:= a − := b − := c −
n i=1 n j=1 n
ai bj ci
i=1
definiert, so sind alle |εi | durch |ε| beschr¨ankt, und es folgt n n n |a · b − c| = ai + ε 1 bj + ε2 − ci + ε3 i=1 j=1 i=1 n n n ≤ ai bj − ci + i=1 j=1 i=1 + |ε1 |
n
|bj | + |ε2 |
j=1
n
|ai | + |ε1 ε2 | + |ε3 |
i=1
≤ 2M ε + |ε1 |M + |ε2 |M + |ε1 ε2 | + |ε3 | ≤ (4M + 2)ε. Damit haben wir zwar nicht ganz das Ziel erreicht, |a · b − c| ≤ ε zu zeigen, ¨ aber wenn wir die vorstehenden Uberlegungen mit ε/(4M + 2) statt mit ε noch einmal durchf¨ uhren, ist wirklich |a · b − c| ≤ ε f¨ ur jedes ε bewiesen, d.h. es muss c = a · b gelten.
KAPITEL 2. FOLGEN UND REIHEN
148
2.5
Erg¨ anzungen
In diesem Abschnitt geht es um einige Erg¨ anzungen zum Thema Konvergenz“. ” Zun¨achst behandeln wir die Dezimalentwicklung reeller Zahlen. Aus der Schule weiß man, dass sich jede Zahl als Dezimalzahl darstellen l¨ asst. Mit Hilfe der Reihenrechnung l¨asst sich das auch f¨ ur den hier gew¨ ahlten axiomatischen Ansatz nachweisen. Dann k¨ ummern wir uns um ungeordnete Summation. Ist M eine Menge und
art werden. Solche Summen f : M → R eine Abbildung, so soll m∈M f (m) erkl¨ treten insbesondere f¨ ur endliche und abz¨ ahlbare Mengen auf. Dann folgen noch einige Bemerkungen zum Zusammenhang zwischen Linearer Algebra und Analysis. Viele der in diesem Kapitel bewiesenen Ergebnisse haben n¨amlich eine algebraische Interpretation. So bedeutet die Aussage lim(an + bn ) = lim an + lim bn eigentlich“, dass ” die Limesabbildung auf einem geeigneten Folgenraum additiv ist. Durch solche Beobachtungen kann man einerseits neue Beispiele f¨ ur Vektorr¨ aume und lineare Abbildungen gewinnen und andererseits schon einmal strukturelles Denken trainieren, das heute in der h¨oheren Analysis eine ganz wichtige Rolle spielt. Und zum Abschluss wird es um allgemeinere Limesbegriffe gehen. Manche Folgen sind zwar nicht konvergent, trotzdem g¨ abe es manchmal gute Gr¨ unde, eine bestimmte Zahl als Limes-Ersatz anzusehen. Diese Rolle k¨ onnte etwa die Zahl 1/2 f¨ ur die Folge 1, 0, 1, 0, 1, . . . spielen, denn 1/2 liegt doch irgendwie symmetrisch zwischen den Folgengliedern. Es soll gezeigt werden, wie man solche vagen Konzepte pr¨azisieren kann. Die Dezimalentwicklung reeller Zahlen F¨ ur die meisten Menschen sind reelle Zahlen Objekte, die man mit Hilfe einer endlichen oder unendlichen Dezimalentwicklung konkret aufschreiben kann: zum Beispiel als 3.14 oder als −12.123123123 . . . Ohne Kenntnisse der Reihenrechnung kann das eigentlich nicht streng begr¨ undet werden, auch kann es mitunter Verst¨andnisprobleme geben: Aus einer e-mail an www.mathematik.de : Liebe MathematikerInnen, ich bin in der 6. Klasse und wir haben gerade periodische Dezimalbr¨ uche durchgenommen. Wir haben gelernt: 1/9 = 0.111 . . . , 3/9 = 0.333 . . . usw. Was aber ist dann 0.999 . . .? Unsere Lehrerin hat gesagt, das w¨ are 9/9. Das kann aber doch nicht sein. Das w¨ are doch 1, und 0.999 . . . ist doch ein Unendlichstel kleiner als 1. Gibt es 0.999 . . . u ¨ berhaupt? Aber eine Zahl, die ich mir ausdenken kann, muss es doch geben. Wie kommt man an 0.999 . . .? Ich w¨ urde mich u ¨ ber eine Antwort freuen. Lina
¨ 2.5. ERGANZUNGEN
149
Lina bekam die Antwort, dass sich ihr Problem in Luft aufl¨ ost, wenn man die richtigen Konvergenzbegriffe zur Verf¨ ugung hat, doch war sie nur schwer davon zu u ¨ berzeugen, dass sie wohl leider noch eine Weile warten muss, bis sie das genau versteht. Wir hingegen haben alle notwendigen Vorarbeiten geleistet: 0.999 . . . ist wirklich exakt gleich 1, alle wichtigen Informationen zur Dezimalentwicklung stehen im Satz 2.5.1. (i) Seien m ∈ N ∪ {0}, bm , . . . , b0 ∈ {0, 1, . . . , 9} und (an )n∈N eine Folge in {0, 1, . . . , 9}. Dann konvergiert die Reihe ∞ an , n 10 n=1
und wir setzen abk¨ urzend bm bm−1 . . . b0 .a1 a2 a3 . . . := bm · 10m + bm−1 · 10m−1 + · · · + b1 · 10 + b0 +
a2 a3 a1 + + + ··· . 10 100 1000
(ii) Jede nicht negative reelle Zahl besitzt eine Darstellung gem¨aß (i), d.h. zu x ∈ R , x ≥ 0 gibt es m ∈ N ∪ {0}, bm ,. . . , b0 , a1 , a2 , . . . ∈ {0, 1, . . . , 9} mit x = bm bm−1 . . . b0 .a1 a2 a3 . . . (die Dezimalentwicklung von x). (iii) Vereinbaren wir, dass eine negative Zahl x als −bm bm−1 . . . b0 .a1 a2 a3 . . . geschrieben wird, wobei bm bm−1 . . . b0 .a1 a2 a3 . . . die Darstellung von −x gem¨aß (ii) ist, so ist damit f¨ ur jede reelle Zahl die Existenz einer Dezimalentwicklung nachgewiesen. Beweis: (i) Der n-te Reihensummand ist gleich an /10n . Da alle an durch 9 beschr¨ ankt sind, folgt die – sogar absolute – Konvergenz der Reihe aus dem Vergleichskriterium (Satz 2.4.2(iv)). (ii) Sei x ≥ 0 vorgelegt. Wir beweisen die Behauptung in drei Schritten: Schritt 1: Es existieren ein n0 ∈ N 0 := N ∪ {0} und ein y ∈ R mit 0 ≤ y < 1, so dass x = n0 + y. Beweis dazu: Wir betrachten {n ∈ N | n > x}. Diese Menge ist wegen des Archimedesaxioms nicht leer, enth¨alt also nach Satz 1.5.7(vii) ein kleinstes Element n1 . Es ist damit n1 > x, und außerdem muss n1 − 1 ≤ x gelten (andernfalls w¨ are n¨ amlich n1 −1 ein echt kleinerer Kandidat in der Menge als n1 ). Damit brauchen wir nur n0 := n1 −1 ∈ N 0 und y := x − n0 zu definieren. Schritt Zu n0 ∈ N 0 gibt es m ∈ N 0 sowie bm , . . . , b0 ∈ {0, 1, . . . , 9} mit
2: m n0 = n=0 bn · 10n . Beweis dazu: Das wird durch vollst¨andige Induktion nach n0 gezeigt:
Dezimalentwicklung
KAPITEL 2. FOLGEN UND REIHEN
150
• Induktionsanfang: F¨ ur n0 = 0 ist die Aussage offensichtlich richtig: Man w¨ahle m = 0, b0 = 0. • Induktionsvoraussetzung: n0 ∈ N 0 habe eine Darstellung n0 =
m
bn · 10n = bm · 10m + · · · + b1 · 10 + b0 .
n=0
• Induktionsschluss: Falls b0 < 9 ist, liefert die Darstellung von n0 sofort eine Darstellung von n0 + 1: n0 + 1 =
m
bn · 10n + 1 =
n=0
m
bn · 10n + (b0 + 1).
n=1
Ist b0 = 9, aber b1 < 9, so erhalten wir n0 + 1 =
m
bn · 10n + (b1 + 1) · 10 + 0 = bm · 10m + · · · + (b1 + 1) · 10 + 0
n=2
als Darstellung. Ganz analog werden die F¨ alle b0 = b1 = 9, aber b2 < 9“, ” b0 = b1 = b2 = 9, aber b3 < 9“ usw. behandelt. ” Hier die Fassung ohne usw.“ f¨ ur Perfektionisten: ” W¨ ahle k ∈ N ∪ {0} mit b0 = b1 = · · · = bk = 9, aber bk+1 < 9. Im Falle k = m vereinbaren wir zus¨ atzlich bm+1 := 0. Dann ist m
n0 + 1 =
k
bn · 10n + (bk+1 + 1) · 10k+1 +
0 · 10n
n=0
n=k+2
eine Dezimaldarstellung von n0 + 1.
Schritt 3:
Zu y ∈ R , 0 ≤ y < 1 gibt es eine Folge (an )n∈N in {0, 1, . . . , 9}, so ∞ dass y = n=1 an /10n . ur alle n ∈ N gilt: Beweis dazu: Wir konstruieren a1 , a2 , . . . induktiv so, dass f¨ an ∈ {0, 1, . . . , 9}, und an an + 1 a1 a1 + ···+ n ≤ y ≤ + ···+ . 10 10 10 10n
(2.9)
• Induktionsanfang: Es ist 0 ≤ 10 · y < 10. Folglich gibt es ein a1 in oßte Ele{0, 1, . . . , 9} mit a1 ≤ 10 · y < a1 + 1. (Man definiere a1 als das gr¨ ment der Menge {n ∈ N | n ≤ 10 · y}, das existiert wegen Satz 1.5.7(viii).) Teilen durch 10 liefert (2.9) f¨ ur n = 1: a1 a1 + 1 ≤y< . 10 10 • Induktionsvoraussetzung: (2.9) gelte f¨ ur ein n ∈ N .
¨ 2.5. ERGANZUNGEN
151
• Induktionsschluss: Zun¨achst multiplizieren wir (2.9) mit 10n+1 und erhalten: a1 10n + · · · + an 10 ≤ y10n+1 ≤ a1 10n + · · · + (an + 1)10. ¨ Nun wiederholen wir die Uberlegungen, die wir eben beim Induktionsanfang f¨ ur 10 · y angestellt haben, f¨ ur y10n+1 − (a1 10n + · · · + an 10), auf diese Weise erhalten wir ein an+1 ∈ {0, . . . , 9} mit a1 10n + . . . + an 10 + an+1 = ≤
n
n+1
ak 10n+1−k ≤ 10n+1 y
k=1
ak 10
n+1−k
+ (an+1 + 1)
k=1
= a1 10n + · · · + an 10 + (an+1 + 1). Division durch 10n+1 liefert dann die Ungleichung (2.9) f¨ ur n + 1. Damit ist bereits alles gezeigt, denn (2.9) impliziert n 1 ak − y ≤ n , k 10 10 k=1
und es gilt 1/10n → 0 wegen 10 > 1. (iii) Das ist offensichtlich.
Bemerkungen: 1. Es ist hoffentlich angesichts der reichlich technischen Formulierung des Ergebnisses nicht untergegangen, dass es sich wirklich um die gute alte Dezimalentwicklung handelt, die man schon in der Schule kennen lernt. Zum Beispiel hat 1/3 wirklich die Darstellung 0.333 . . ., hier ist m = b0 = 0 und a1 = a2 = · · · = 3. ¨ 2. Ersetzt man in den vorstehenden Uberlegungen die Zahl 10 durch irgendeine nat¨ urliche Zahl g mit g > 1, so ergibt sich bei gleichem Beweis, dass jede reelle Zahl eine g-adische Entwicklung hat. Ist zum Beispiel g = 2 – man spricht dann von der Dualentwicklung – so w¨ urde etwa 10001.1010101 . . . die Abk¨ urzung f¨ ur 1 · 24 + 1 + 1/2 + 1/23 + 1/25 + · · · sein. 3. Die Darstellung von Zahlen als Dezimalzahl ist nicht eindeutig. So k¨ onnte man die Zahl 23.45000 . . . genausogut als 23.449999 . . . schreiben.
KAPITEL 2. FOLGEN UND REIHEN
152 Ungeordnete Summation
Mal angenommen, M ist eine 77-elementige Menge und jedem m ∈ M ist eine Zahl am zugeordnet30) . Dann ist offensichtlich, was das Zeichen am m∈M
bedeuten soll: Man schreibe M als {m1 , . . . , m77 } und definiere am := am1 + · · · + am77 . m∈M
Das einzige Problem besteht dann darin zu garantieren, dass diese Definition nicht von der zuf¨alligen Schreibweise von M in genau dieser Reihenfolge abh¨ angt. Das folgt – woraus sonst – nat¨ urlich aus der Kommutativit¨ at der Addition. Ein exakter Beweis durch vollst¨andige Induktion nach der Anzahl der Elemente von M w¨are recht schwerf¨allig.
Zusammengefasst: F¨ ur endliche Mengen M l¨ asst sich m∈M am so definieren, dass alle das Gleiche darunter verstehen. (Da die leere Menge nach Definition ebenfalls endlich ist, muss noch gesagt werden, was eine Summe u ¨ ber die leere Indexmenge ist: Diese Summe wird als Null definiert.) F¨ ur unendliche Mengen ist das nicht zu erwarten, wir haben ja schon gesehen, dass sich die Reihensumme bei Umordnungen ¨ andern kann. Deswegen beschr¨anken wir uns auf einen Spezialfall: Definition 2.5.2. Sei M eine nicht leere Menge, f¨ ur jedes m sei am eine reelle nicht negative Zahl. Falls dann eine Zahl R so existiert, dass m∈∆ am ≤ R f¨ ur jede endliche Teilmenge ∆ von M gilt, so definieren wir am := sup am . m∈M
∆⊂M, m∈∆ ∆ endlich
(Die Begr¨ undung, dass man das so machen kann, steht in Satz 2.3.6. Danach hat jede nicht leere, nach
oben bechr¨ankte Menge ein Supremum. Wir wenden ihn auf die Menge der m∈∆ am an, wobei ∆ alle endlichen Teilmengen von M durchl¨auft.)
?
Diese Definition sieht auf den ersten Blick etwas gek¨ unstelt aus. Trotzdem bleiben alle Eigenschaften erhalten, die man von endlichen Summen her gewohnt ist, auch f¨ uhrt die Definition im Falle abz¨ ahlbarer M zur gew¨ ohnlichen Reihensumme. ¨ Zeigen Sie zur Ubung:
• Ist am ≤ bm f¨ ur jedes m, so ist m∈M am ≤ m∈M bm .
• Es gilt m∈M c · am = c m∈M am f¨ ur jedes c ≥ 0. 30) Es
liegt also eigentlich eine Abbildung von M nach R vor.
¨ 2.5. ERGANZUNGEN
153
Etwas u ¨ berraschender ist, dass die Allgemeinheit dieser Definition nur scheinbar ist. Es gilt der
Satz 2.5.3. Die am seien nicht negativ, und m∈M am m¨oge existieren. Dann sind h¨ochstens abz¨ahlbar viele am echt gr¨oßer als Null. Beweis: Wir bezeichnen f¨ ur irgendeine nat¨ urliche Zahl k mit Mk die Menge derjenigen m ∈ M , f¨ ur die " am ≥ 1/k gilt. Dann ist aufgrund des Archimedesaxioms {m | am > 0} = k∈N Mk , und außerdem ist jede der Mengen Mk endlich: Da, f¨ ur ein geeignetes R > 0, alle endlichen Summen von am ’s durch R beschr¨ ankt sind, kann Mk h¨ochstens k ·R Elemente haben. Und deswegen ist die Menge {m | am > 0} als abz¨ahlbare Vereinigung endlicher Mengen h¨ ochstens abz¨ ahlbar. Folgenr¨ aume Wir erinnern an die Vektorraumdefinition aus der Linearen Algebra: Definition 2.5.4. Sei X eine Menge mit einer inneren Komposition + : X × X → X (Addition) und einer ¨außeren Komposition · : K × X → X 31) (Skalarmultiplikation). X heißt dann K -Vektorraum, falls (i) (X, +) ist abelsche Gruppe (d.h., +“ ist kommutativ und assoziativ, es ” gibt ein neutrales Element, und jedes Element hat ein Inverses). (ii) Es gilt f¨ ur beliebige x, y ∈ X, λ, µ ∈ K : λ · (µ · x) = λ · (x + y) =
(λ · µ) · x, λ · x + λ · y,
(λ + µ) · x =
λ · x + µ · x.
(iii) F¨ ur jedes x ∈ X ist 1 · x = x. (Wir haben hier f¨ ur die Vektoraddition und die Skalarmultiplikation die Zeichen +“ und ·“ – also die gleichen Zeichen wie f¨ ur die entsprechenden Operatio” ” nen f¨ ur Zahlen – verwendet. Das ist allgemein u ¨ blich und kann auch nicht zu Verwirrungen f¨ uhren, da aus dem Zusammenhang stets klar ist, ob es gerade um Zahlen oder Vektoren geht.) Wir werden gleich zahlreiche aus der Analysis gewonnene Beispiele angeben. Offensichtlich gilt: R ist ein R -Vektorraum und C ist ein C -Vektorraum, wenn man vereinbart, dass +“ und ·“ die aus der K¨ orperdefinition gewohnte ” ” Bedeutung haben. Jeder C -Vektorraum ist erst recht ein R -Vektorraum, wenn man die ¨ außere Komposition (λ, x) → λ · x auf den Fall reeller λ einschr¨ ankt. Insbesondere ist also C ein R -Vektorraum. 31) Wie
bisher ist K = C oder K = R .
KAPITEL 2. FOLGEN UND REIHEN
154
Definition 2.5.5. Sei X ein K -Vektorraum und Y ⊂ X. Y wird Unterraum genannt, falls das neutrale Element der Addition zu Y geh¨ort und λy1 + µy2 ∈ Y f¨ ur alle y1 , y2 ∈ Y und λ, µ ∈ K gilt. Dann ist Y bzgl. der von X geerbten Kompositionen selbst wieder ein K -Vektorraum. Als Vorbereitung der Interpretation einiger unserer Ergebnisse im Rahmen der linearen Algebra beginnen wir mit der Definition 2.5.6. (i) Sei s die Menge aller Folgen in K 32) , also s := Abb(N , K ). Wir erkl¨aren auf s eine Addition und eine Skalarmultiplikation durch: (an )n∈N + (bn )n∈N λ · (an )n∈N
:= (an + bn )n∈N , := (λan )n∈N .
(ii) Weiter definieren wir c00
:=
{(an )n∈N | es existiert n ˆ mit an = 0 f¨ ur n ≥ n ˆ} (= Menge der abbrechenden Folgen).
c0
:=
{(an )n∈N | an → 0} (= Menge der Nullfolgen).
c
:=
{(an )n∈N | (an )n∈N ist konvergent}.
:=
(= Menge der konvergenten Folgen). {(an )n∈N | es existiert M > 0 mit |an | ≤ M , alle n}.
∞
(= Menge der beschr¨ ankten Folgen).
Damit kann man einige unserer Ergebnisse in der Sprache der Linearen Algebra so formulieren: Satz 2.5.7. Es gilt: (i) s ist ein K -Vektorraum. (ii) c00 , c0 , c und ∞ sind Unterr¨aume von s, und es gilt c00 c0 c ∞ s. Beweis: (i) Die definierenden Eigenschaften eines K -Vektorraums sind ohne jede Schwierigkeiten nachzupr¨ ufen. Hervorzuheben ist lediglich, dass die gew¨ unschten Bedingungen Konsequenzen aus den Eigenschaften von K sind: So ist z.B. (0, 0, . . .) deswegen neutrales Element der Addition in s, weil 0 neutral in K ist. 32) Genau genommen m¨ ussten wir sK anstatt s schreiben. Das w¨ are recht schwerf¨ allig, wir werden der Einfachheit halber bei s bleiben.
¨ 2.5. ERGANZUNGEN
155
Diese Bemerkung trifft f¨ ur alle konkreten K -Vektorr¨ aume zu, weitere Beispiele werden Sie in sp¨ateren Kapiteln finden. In diesem Sinne ist K (d.h. im Wesentlichen unser Axiomensystem in 1.8.2) der Urvater“ aller konkreten K ” Vektorr¨ aume. (ii) Alle ben¨ otigten Aussagen sind evident, schon bewiesen oder leicht nachzupr¨ ufen. Genauer: c00 ist ein Unterraum: Das ist klar. aume : Das ist eine Umformulierung von Satz 2.2.12. c0 , c sind Unterr¨ ∞ ist Unterraum : Das folgt sofort aus der Dreiecksungleichung. c00 ⊂ c0 ⊂ c : Auch das d¨ urfte klar sein. c ⊂ ∞ : Das steht in Lemma 2.2.11. F¨ ur den Nachweis, dass alle Inklusionen echt sind, ben¨ otigen wir vier konkrete Versager“, f¨ ur c0 = c z.B. eine konvergente Folge, die keine Nullfolge ist ” (einfachstes Beispiel: (1, 1, . . .)). Zum Beweis von c00 = c0 und ∞ = s wird das Archimedesaxiom ben¨otigt. (Warum eigentlich?) Bemerkung: Es muss betont werden, dass das Umschreiben eines analytischen Resultats in die Sprache der Linearen Algebra keine bemerkenswerte mathematische Leistung darstellt. Trotzdem soll das gelegentlich getan werden, denn erstens tr¨ agt es zu einem besseren Verst¨andnis der analytischen und algebraischen Begriffsbildungen bei, und zweitens sind komplexere analytische Sachverhalte nach Umschreibung h¨ aufig pr¨agnanter formulierbar und besser verst¨ andlich. Die Hoffnung, auf diese Weise um harte“ analytische Beweise herumzukommen, ist ” allerdings unberechtigt: H¨atten wir anstelle von Satz 2.2.12(ii), (iii) die Aussage c ist ein K -Vektorraum“ ” formuliert, w¨ are der Beweis der gleiche geblieben. Wir erinnern an eine weitere Definition: Definition 2.5.8. Sei X ein K -Vektorraum. Eine Abbildung f : X → K heißt linear (genauer: K -linear), wenn f¨ ur alle x1 , x2 ∈ X und λ, µ ∈ K die Gleichung f (λx1 + µx2 ) = λf (x1 ) + µf (x2 ) gilt. Dann besagt Satz 2.2.12, dass die Abbildung lim : c → K , (an )n∈N → lim an eine lineare Abbildung ist. Zur Reihenrechnung: Dort spielt der Raum # ∞ 1 := (an )n∈N an ist absolut konvergent n=1
?
KAPITEL 2. FOLGEN UND REIHEN
156
eine wichtige Rolle. Mit Hilfe der Dreiecksungleichung sollte es Ihnen leicht m¨ oglich sein zu zeigen, dass 1 ein Unterraum von s ist. Versuchen Sie diejenigen S¨ atze zu finden, in denen wir 1 c0 bzw. Σ : 1 → K , (an )n∈N →
∞
an ist linear
n=1
?
bewiesen haben. Sollten Sie mit den grundlegenden Begriffen der Ringtheorie schon vertraut sein, k¨ onnen Sie die vorstehend erzielten Ergebnisse auch unter diesem Gesichtspunkt betrachten. Zun¨ achst definieren wir durch (an )n∈N · (bn )n∈N := (an bn )n∈N eine Multiplikation in s. Die Eigenschaften von K implizieren dann, dass s ein Ring ist. Es sollte Ihnen keine Schwierigkeiten machen, zu den nachstehenden Aussagen die Beweise zu finden (bzw. einen schon bewiesenen Satz zu zitieren) oder – falls n¨ otig – geeignete Gegenbeispiele anzugeben: • c00 , c0 , c, ∞ sind kommutative Ringe. • c, ∞ , s besitzen eine multiplikative Einheit. Welche Elemente besitzen Inverse? • c00 , c0 besitzen keine multiplikative Einheit. • s ist kein K¨ orper (ebenso wenig c und ∞ ; f¨ ur c00 und c0 ist das wegen des Fehlens einer multiplikativen Einheit sowieso nicht zu erwarten). • lim : c → K ist ein Ringhomomorphismus mit Kern c0 . • c00 ist ein Ideal in c0 , c, ∞ und s. (Ein Unterring A eines kommutativen Rings R heißt Ideal , falls a · r ∈ A f¨ ur alle a ∈ A und alle r ∈ R gilt.) • c0 ist ein Ideal in c und ∞ , nicht jedoch in s. onnen Sie einen allgemeinen Satz u (F¨ ur c0 ist Ideal in c“ k¨ ¨ ber Ring” homomorphismen auf lim : c → K anwenden.) • c ist kein Ideal in ∞ , und ∞ ist kein Ideal in s. • Falls in einem der vorstehenden F¨ alle ein Folgenraum Ideal in einem anderen war: Pr¨ ufen Sie nach, ob sogar ein Hauptideal, Primideal oder maximales Ideal vorlag. (Achtung: Die Untersuchungen zur Maximalit¨ at sind – wenigstens f¨ ur Anf¨ anger – schwierig.)
Verallgemeinerte Limesbegriffe Wir haben viel Energie darauf verwendet, um die Aussage Die Folge (an ) ” kommt der Zahl a beliebig nahe“ in der Definition 2.2.9 zu pr¨ azisieren. Daran anschließend konnten dann einige strukturelle Eigenschaften gezeigt werden, etwa: Die Menge der konvergenten Folgen bildet einen Vektorraum, und darauf
¨ 2.5. ERGANZUNGEN
157
ist die Limesabbildung linear; der Limes nicht negativer Folgen ist nicht negativ; ... Man kann aber auch umgekehrt vorgehen: Man kann zuerst sagen, welche Eigenschaften ein Limesbegriff haben soll und dann durch eine geschickte Konstruktion versuchen, diese Forderungen zu erf¨ ullen. Diesen Weg wollen wir jetzt skizzieren: Definition 2.5.9. Es sei X ein Untervektorraum des Raumes s aller reellen Folgen, der den Raum c der konvergenten Folgen umfasst. Er soll auch die folgende Eigenschaft haben: Ist (a1 , a2 , . . .) in X, so auch die verschobene“ Folge (a2 , a3 , . . .). ” Weiter sei L : X → R eine lineare Abbildung. Wir werden das Bild einer Folge (an ) mit L(an ) bezeichnen33) . L heißt ein verallgemeinerter Limes, wenn gilt:
verallgemeinerter Limes
(i) L ist linear. (ii) L setzt die u ¨bliche Limesabbildung fort: Ist (an ) eine konvergente Folge, so ist L(an ) = lim an . (Vertr¨aglichkeitsforderung) (iii) Ist an ≥ 0 f¨ ur jedes n, so gilt L(an ) ≥ 0. (Monotonie) ur jede Folge (a1 , a2 , . . .) aus X. (iv) L(a1 , a2 , . . .) = L(a2 , a3 , . . .) f¨ (Translationsinvarianz) Bisher kennen wir nur ein Beispiel: Man definiere X := c und L := lim. Dass dann die Bedingung (iv) erf¨ ullt ist, ist ein Spezialfall der Tatsache, dass Teilfolgen den gleichen Limes haben. Interessanter ist es nat¨ urlich, wenn X ein echter Oberraum des Raumes c der konvergenten Folgen ist. Es gibt einen ganzen Zoo von verallgemeinerten Limesbegriffen, Interessenten empfehle ich den Klassiker Divergent Series“ von G.H. Hardy, in dem das Problem allerdings unter dem ” Aspekt der Reihenkonvergenz behandelt wird. F¨ ur die Analysis am wichtigsten ist der folgende Ansatz: ur die die Folge Definition 2.5.10. Sei XC die Menge derjenigen Folgen (an ), f¨ a1 + a2 a1 + a2 + a3 , ,... a1 , 2 3 konvergent ist. Dann wird C - lim : XC → R durch die folgende Vorschrift definiert: a1 + · · · + ak C - lim an := lim . k k 33) Eigentlich
m¨ usste es ja L (an ) heißen.
C - lim
158
KAPITEL 2. FOLGEN UND REIHEN
Um uns mit der Definition vertraut zu machen, behandeln wir einige Beispiele: 1. F¨ ur die Folge (1, 0, 1, 0, 1, . . .) lautet die zugeh¨ orige Folge der Mittelwerte (1, 12 , 23 , 24 , 35 , 36 , 47 , 48 , . . .), das n-te Folgenglied ist gleich 1/2 f¨ ur gerade und gleich 1 1 ur ungerade n. Damit ist klar, dass (1, 0, 1, 0, 1, . . .) zu XC geh¨ ort und 2 + 2n f¨ der C-Limes dieser Folge gleich 1/2 ist. 2. Sei (an ) eine konvergente Folge, der Limes werde mit a bezeichnet. Dann konvergiert auch die Folge a1 + a2 a1 + a2 + a3 , ,... a1 , 2 3 gegen a, d.h.: c ⊂ XC , und auf c stimmt der C-Limes mit dem gew¨ ohnlichen Limes u ¨berein. Die Begr¨ undung ist nicht sehr schwer, tats¨ achlich handelt es sich um ein Er¨ gebnis von Cauchy, das so gut wie jeder Mathematikstudent als Ubungsaufgabe gestellt bekommt. (Wir werden von dieser Tradition nicht abweichen.) Dass der C-Limes v¨ollig zu Recht an dieser Stelle eingef¨ uhrt wird, ist nach dem folgenden Satz klar: Ces` aroLimes
Satz 2.5.11. Der C-Limes ist ein verallgemeinerter Limes auf dem Raum XC , er wird der Ces`aro-Limes genannt 34) . Beweis: Alle zu zeigenden Behauptungen sind leicht einzusehen, sie ergeben sich aus einer Kombination von einfachen Eigenschaften der Abbildungen lim und a1 + a2 a1 + a2 + a3 , ,... . S : (a1 , a2 , . . .) → a1 , 2 3 So bildet z.B. S nicht negative Folgen offensichtlich auf ebenfalls nicht negative ab, und der Limes einer Folge nicht negativer Zahlen ist ebenfalls gr¨ oßer oder gleich Null: So folgt sofort die Monotonie. Der Ces`aro-Limes spielt eine wichtige Rolle in der Fourieranalyse, die Sie in h¨ oheren Semestern kennen lernen werden. Da kann man n¨ amlich zeigen, dass jede stetige periodische Funktion aus einfachen Bausteinen, n¨ amlich den Sinusund Cosinusfunktionen aufgebaut ist. Einzige Vorsichtsmaßregel: Bei den dann auftretenden Reihen muss der Limes der Partialsummen im Ces`aro-Sinn bestimmt werden.
34) Kenner
sprechen den Namen als tschesa:ro aus, der Herr war Italiener.
¨ 2.6. VERSTANDNISFRAGEN
2.6
159
Verst¨ andnisfragen
Zu 2.1 Sachfragen S1: Was ist eine Folge in einer Menge M ? Nennen Sie einige M¨ oglichkeiten, eine Folge zu definieren. S2: Was versteht man unter einer Teilfolge bzw. unter der Umordnung einer Folge? Zu 2.2 Sachfragen S1: Wie sind |x| f¨ ur x ∈ R und |z| f¨ ur z ∈ C definiert? S2: Was ist |z| anschaulich? Was ist bei der Definition vorbereitend zu kl¨ aren? S3: Was versteht man unter der Dreiecksungleichung, warum heißt sie so, und welche Bedeutung hat sie f¨ ur viele Beweise in der Analysis? √ ur das Wurzelziehen? S4: Wie ist a definiert? Welche Rechenregeln gibt es f¨ S5: Was bedeutet an → 0 und allgemeiner an → a? S6: In welchem Sinne ist (1/n)n∈N die wichtigste konvergente Folge? S7: Was besagt das Vergleichskriterium, was kann man u ¨ber Summen, Produkte usw. konvergenter Folgen aussagen? S8: Was ist zu zeigen, bevor man die Schreibweise limn→∞ an = a benutzen darf? Methodenfragen M1: Konvergenzbeweise f¨ uhren k¨ onnen. Zum Beispiel: ur alle n, so folgt an bn → 0. 1. Gilt an → 0 und |bn | ≤ M f¨ 2. Umgekehrt: Ist (bn )n∈N irgendeine Folge mit an bn → 0 f¨ ur alle Nullankt. folgen (an )n∈N , so ist (bn )n∈N beschr¨ 3.
i 4 −3 n2 3n 6 − 4i/n −→ ? • 3i − 5/n2 •
2
1+
−→ ?
M2: Verst¨ andnis der Quantoren ∀, ∃. Zum Beispiel: 1. Schreiben Sie das Archimedesaxiom unter Verwendung von ∀, ∃. 2. Was wird durch
∀ ∀ ∃ |a | ≤ ε n
ε>0 n0 ∈N n≥n0
definiert? (Da hat sich einer Nullfolge“ falsch gemerkt.) Was ist das ” Gegenteil dieser Aussage?
KAPITEL 2. FOLGEN UND REIHEN
160 Zu 2.3 Sachfragen S1: Was ist eine Cauchy-Folge?
S2: Wie verhalten sich die Begriffe Cauchy-Folge“ und konvergente Folge“ zuein” ” ander? S3: Beweis(idee) zu: Cauchy-Folgen in K sind konvergent. S4: Was versteht man unter dem Supremum (bzw. Infimum) einer Teilmenge eines geordneten Raumes? S5: Wie kann man Vollst¨ andigkeit statt mit Dedekindschen Schnitten gleichwertig mit Cauchy-Folgen und mit Suprema beschreiben? S6: Was ist eine Intervallschachtelung? S7: Beweis(idee) zu der Aussage: Ist (an )n∈N monoton steigend und nach oben beschr¨ ankt, so ist (an )n∈N konvergent. Methodenfragen M1:
(a ) ist Cauchy-Folge“ nachweisen k¨ onnen. ” n n∈N Zum Beispiel: 1. (an )n∈N konvergent ⇒ (an )n∈N Cauchy-Folge. 2. Zeigen Sie direkt (d.h. ohne Verwendung von: (an )n∈N Cauchy-Folge in K ⇒ (an )n∈N konvergent), dass das Produkt aus einer CauchyFolge und einer konvergenten Folge eine Cauchy-Folge ist.
M2: Ordnungsrelationen behandeln k¨ onnen. Zum Beispiel: 1. Man definiere auf C eine Relation ≺ durch: Sei z = a + bi, z = a + b i ∈ C , (a, b, a , b ∈ R ), dann ist z ≺ z : ⇐⇒ a < a ∨ (a = a ∧ b ≤ b ). Es ist zu zeigen, dass ≺ eine Ordnungsrelation ist. 2. Sei M eine Menge und f : M → R eine Abbildung. Man finde Bedingungen an f , so dass x ≺ y : ⇐⇒ f (x) ≤ f (y) eine Ordnungsrelation auf M definiert. 3. Man finde eine Ordnung auf R mit: • Je zwei Elemente sind vergleichbar, aber • die Ordnung ist nicht mit den algebraischen Operationen vertr¨ aglich. M3: Beweise zu sup und inf f¨ uhren k¨ onnen. Zum Beispiel:
¨ 2.6. VERSTANDNISFRAGEN
161
1. Bestimmen Sie (mit Beweis) Infimum und Supremum von
1 n
|n∈N .
2. Beweisen Sie: Ist A ⊂ R nicht leer und nach oben beschr¨ ankt, so ist sup(A + x) = sup A + x f¨ ur alle x ∈ R . Dabei ist die Menge A + x durch {a + x | a ∈ A} definiert. 3. Untersuchen Sie sup ∅, inf ∅ in [0, 1] und in N (jeweils nat¨ urliche Ordnung). 4. Ist (M, ≺) ein geordneter Raum und A ⊂ M mit A = ∅, so ist inf A ≺ sup A. Zu 2.4 Sachfragen S1: Wie f¨ uhrt man Reihenkonvergenz auf Folgenkonvergenz zur¨ uck? S2: Was besagen Vergleichskriterium und Cauchy-Kriterium? S3: Welche Permanenzeigenschaften zur Reihenkonvergenz kennen Sie? S4: Was ist eine alternierende Reihe? Kennen Sie ein Konvergenzkriterium f¨ ur solche Reihen? S5: Wie lauten die Aussagen von Wurzelkriterium bzw. Quotientenkriterium? Welche konvergente Reihe wird dabei zum Absch¨ atzen herangezogen? S6: Was bedeutet absolute Konvergenz einer Reihe? Was kann man u ¨ber Umordnungen bzw. Produkte derartiger Reihen sagen? S7: Was ist unbedingte Konvergenz? Methodenfragen onnen. M1: Konvergenzkriterien anwenden k¨ Zum Beispiel: 1. Bestimmen Sie ∞ n=0
2. Ist
1 , (3i + 1)n
∞ n=0
1 2 − n+1 . (5i)n 6
1 1 1 1 − + − ± ··· 1! + 1 2! + 1 3! + 1 4! + 1
konvergent? 3. F¨ ur a ∈ R ist
∞ n=0
(−1)n · a2n (2n)!
konvergent; dabei ist 0! := 1. 4. Ist
∞ n=1
konvergent?
1 √ nn
KAPITEL 2. FOLGEN UND REIHEN
162 Zu 2.5 Sachfragen
S1: Was bedeutet in der Sprache der Reihenrechnung, dass man Zahlen als Dezimalzahlen schreiben kann. S2: Wie sind die R¨ aume s, ∞ , c, c0 , c00 definiert? Methodenfragen M1: Begriffe der (Linearen) Algebra an konkreten analytischen Situationen (z.B. an Folgenr¨ aumen) untersuchen k¨ onnen. Zum Beispiel: 1. Der R -Vektorraum C ist zweidimensional. 2. F¨ ur n ∈ N sei en die Folge (0, 0, . . . , 0, 1, 0, . . .) (1 an der n-ten angig in Stelle). Dann gilt: Die Menge {en | n ∈ N } ist linear unabh¨ s. Was ist die lineare H¨ ulle von {en | n ∈ N }? M2: Resultate der Analysis – falls daf¨ ur geeignet – im Rahmen der (Linearen) Algebra interpretieren k¨ onnen. Zum Beispiel: 1. Finden Sie eine algebraische Interpretation f¨ ur Satz 2.4.2(i) und (ii). 2. Analog f¨ ur Satz 2.3.2(ii) und (iv). 3. Was ist nachzuweisen, wenn behauptet wird: 2 :=
∞
(an )n∈N ∈ s
|an |2 konvergiert
n=1
ist ein Unterraum von s?
2.7
¨ Ubungsaufgaben
Zu Abschnitt 2.1 2.1.1 Man zeige: Jede Teilfolge einer Umordnung einer Folge kann als Umordnung einer Teilfolge geschrieben werden. Geht das auch umgekehrt? Zu Abschnitt 2.2 2.2.1 F¨ ur welche reellen Zahlen x gelten folgende Ungleichungen? (a) |x − 5| > 0.4, (b) |x + 3| ≤ |x − 2|, (c) |2x + 1| > |x − 2|.
¨ 2.7. UBUNGSAUFGABEN
163
2.2.2 Zeigen Sie, dass Umordnungen konvergenter Folgen ebenfalls konvergent sind. Muss der Grenzwert der Umordnung mit dem Grenzwert der Ausgangsfolge u ¨bereinstimmen? 2.2.3 Untersuchen Sie die nachstehenden Folgen auf Konvergenz und bestimmen Sie gegebenenfalls ihren Grenzwert. n
−
(a) an = k=0
1 2
k
.
r0 + r1 n + · · · + rk nk f¨ ur gegebene ri und si , 0 ≤ i ≤ k, sk = 0. s0 + s1 n + · · · + sk nk Dabei sei der Nenner f¨ ur alle n ∈ N von 0 verschieden.
(b) bn =
(c) cn = (−5)n .
√ 2 + 1/ n (d) dn = √ . n + 5−n 2.2.4 Was passiert, wenn man in der Nullfolgendefinition ε durch 1/ε ersetzt: Welche Folgen (an ) sind durch F¨ ur alle ε > 0 gibt es ein n0 , so dass |an | ≤ 1/ε f¨ ur alle n ≥ n0 gilt.“ ” charakterisiert? 2.2.5 Man beweise folgende Aussagen u ¨ ber Teilfolgen: (a) Aus limn→∞ a2n = a und limn→∞ a2n+1 = a folgt limn→∞ an = a. (b) Sei a ∈ R . Besitzt jede Teilfolge (ank ) von (an ) eine Teilfolge (genauer: Teilteilfolge) (ankl ), die gegen a konvergiert, so konvergiert (an ) selbst gegen a. 2.2.6 Es sei (xn ) eine Folge reeller Zahlen und an :=
1 n
n
xk k=1
die Folge der Mittelwerte. (a) Zeigen Sie, dass die Mittelwerte (an ) konvergieren, falls die (xn ) konvergieren. (Wogegen n¨ amlich?) (b) Die Umkehrung gilt nicht: Es gibt eine Folge (xn ), so dass (an ) konvergiert, (xn ) jedoch nicht. ankt ist? (c) Folgt aus der Konvergenz der (an ), dass die Folge der (xn ) beschr¨ Zu Abschnitt 2.3 2.3.1 F¨ ur M ⊂ R versteht man unter rM , r ∈ R , die Menge {rx ∈ R | x ∈ M }; weiter sei −M die Menge (−1)M . Man beweise oder widerlege: (a) sup(−A) = − inf(A), inf(−A) = − sup(A), falls A = ∅ eine beschr¨ ankte Teilmenge von R ist. ur i = 1, . . . , m, j = 1, . . . , n reelle Zahlen. Dann gilt (b) Es seien aij f¨ sup
inf (aij ) = inf
1≤i≤m 1≤j≤n
sup (aij ).
1≤j≤n 1≤i≤m
KAPITEL 2. FOLGEN UND REIHEN
164 (c) Die aij seien wie in (b). Dann gilt sup
sup (aij ) = sup
1≤i≤m 1≤j≤n
sup (aij ).
1≤j≤n 1≤i≤m
ur alle i in einer Indexmenge M , so ist sup ai ≤ sup bi . (d) Ist ai ≤ bi f¨ √ ¨ 2.3.2 Es sei K der K¨ orper Q + Q 2 (vgl. Ubung 1.4.3) mit der gew¨ ohnlichen von R geerbten Ordnung. Zeigen Sie, dass nicht jede Cauchy-Folge in K konvergiert. 1 f¨ ur n ∈ N . 2.3.3 Sei a0 = 1, an+1 = 1 + an (a) Zeigen Sie, dass (an ) eine Cauchy-Folge ist. ur n ∈ N stets zwischen an und an+1 Tipp: Man zeige zun¨ achst, dass an+2 f¨ liegt, und dann, dass |an − an+1 | → 0 f¨ ur n → ∞. (Warum ist (an ) dann eine Cauchy-Folge?) (b) Zeigen Sie, dass (an ) gegen die positive L¨ osung der Gleichung x2 + x = 1 konvergiert. Bemerkung: Man berechnet damit den Wert der so genannten Kettenbruchentwicklung f¨ ur den goldenen Schnitt: 1 1+ . 1 + 1+ 1 1 1+···
2.3.4 F¨ ur die geordnete Menge (M, ≺) und die Teilmenge A bestimme man sup(A) und inf(A), falls diese existieren: (a) A = {4, 8, 10}, wobei M = N , a ≺ b :⇔ a|b. (b) A = {3, 6, 9, 12, . . .}, (M, ≺) wie in (a). (c) A = x x2 < 2 , wobei M = R , a ≺ b :⇔ a ≤ b. (d) A = ] x, y [ −1 < x ≤ − 12 ,
1 2
< y ≤ 2 , wobei M = P(R ), a ≺ b :⇔ a ⊂ b.
2.3.5 Sei (an )n∈N eine Folge in K mit
∀ |a
n
− an+1 | ≤ q n ;
n∈N
dabei ist 0 ≤ q < 1. Dann ist (an )n∈N eine Cauchy-Folge. 2.3.6 Sei M eine Menge. Man beweise, dass im geordneten Raum (P(M ), ⊂) f¨ ur A ∈ P(M ), A = ∅ gilt: A, inf A = A. sup A = Zu Abschnitt 2.4 2.4.1 F¨ ur welche x ∈ R konvergiert, f¨ ur welche divergiert die Reihe
∞ n=1
xn /n?
allt und gegen Null konver2.4.2 Sei (an ) eine Folge positiver Zahlen, die monoton f¨ giert. (a) Zeigen Sie, dass existiert.
∞ n=1
an genau dann existiert, wenn die Reihe
∞ k=1
2k a2k
Tipp: Erinnern Sie sich daran, wie die Divergenz der harmonischen Reihe gezeigt wurde.
¨ 2.7. UBUNGSAUFGABEN
165
(b) Man nutze Teil (a), um zu zeigen, dass die Reihe ∞ n=1
1 ns
f¨ ur s > 1 konvergent ist35) . 2.4.3 Die Summe der alternierend harmonischen Reihe sei mit a bezeichnet k−1 /k). Man zeige (d. h. a := ∞ k=1 (−1) (a) a ≥ 1/2 und beweise folgendes Konvergenzverhalten zweier spezieller Umordnungen: 1 1 1 1 1 (b) 1 + − − + + − − + + . . . = a. 3 2 4 5 7 1 1 1 1 1 1 1 3 1 − + + − + + − · · · = a. (c) 1 + − + + − + + 3 2 5 7 4 9 11 6 2 Hinweis:
3 a 2
= a + 12 a.
L¨ asst sich allgemein etwas u ¨ ber die Umordnungen aussagen, bei denen auf p (bzw. 2p) positive Summanden immer p negative folgen? 2.4.4 Hier soll gezeigt werden, dass es unendlich viele Primzahlen gibt. Dazu wird die Annahme, die Menge der Primzahlen sei {p1 , p2 , . . . , pr } (wobei p1 < p2 < · · · < pr ) f¨ ur ein r ∈ N wie folgt zum Widerspruch gef¨ uhrt: (a) Man zeigt, dass
∞ n=1
1 = n
0≤k1 ,k2 ,...,kr 1 sind auf dem Km neben · 1 , · 2 und · ∞ noch weitere Normen von Bedeutung. Die Wahl einer geeigneten Norm ist vom Zusammenhang abh¨angig, und auch in diesem Fall kann an Ihre außermathematische Erfahrung angekn¨ upft werden: Sind zwei Situationen durch die m-Tupel (x1 , . . . , xm ) und (y1 , . . . , ym ) charakterisiert, so wird die Entscheidung, welche als die bessere“ einzustufen ” ist, vom speziellen Sachverhalt abh¨angen. Konkret: Bedeuten etwa (x1 , . . . , xm ) die erreichten Punktzahlen eines Sch¨ ulers in m F¨achern, so wird f¨ ur die Gesamtbeurteilung (x1 , . . . , xm )1 heranzuziehen sein. Geht es aber darum, besonders begabte Sch¨ uler f¨ ur eine intensive F¨orderung zu Leistungskursen zusammenzufassen, so ist (x1 , . . . , xm )∞ relevant. 3. Es ist bei allen mit Metriken zusammenh¨angenden Aussagen zu pr¨ azisieren, welche Metrik gemeint ist. Das gilt insbesondere dann, wenn eine Menge verschiedene h¨ aufig gebrauchte Metriken zul¨asst (wie etwa der Km f¨ ur m > 1). Im Zweifelsfall ist immer vom nat¨ urlichsten“ Kandidaten auszugehen, so ist etwa ” R hat die Eigenschaft . . .“ als R , versehen mit der Betragsmetrik, hat die ” ” Eigenschaft . . .“ zu interpretieren. 4. Wir begeben uns zur Erholung kurz in den nichtmathematischen Erfahrungsbereich. M bezeichne die mit dem Auto erreichbaren Punkte in der Stadt X, und f¨ ur je zwei dieser Punkte P, Q definieren wir: d(P, Q) := Die Zeit in Minuten, um von P nach Q mit dem Auto zu gelangen. Ist das dann eine Metrik? Wenn nein, wo k¨onnen Schwierigkeiten auftreten? Ein weiteres Beispiel: In der Stadt X seien alle Telefonnummern siebenstellig, M bezeichne die Menge dieser Telefonnummern (d.h. M ⊂ R7 ). Wir versehen M mit der durch · 1 induzierten Metrik. Wieviele P ∈ M gibt es dann mit d(P0 , P ) ≤ 1 (wobei P0 eine feste Nummer ist)? Was f¨ ur Konsequenzen ergeben sich f¨ ur P , wenn P nahe bei“ P0 liegt und P0 eine stark gefragte Telefonnummer ” ist?
?
?
Als Erstes u ¨ bertragen wir einige Begriffe aus Kapitel 2 vom Spezialfall der reellen oder komplexen Zahlen auf allgemeine metrische R¨ aume. Das ist formal nicht schwierig, trotzdem ist verst¨arkte Aufmerksamkeit angesagt, denn einige vertraute Ergebnisse gelten nun pl¨otzlich nicht mehr. Definition 3.1.3. Sei (M, d) ein metrischer Raum und (xn )n∈N eine Folge in M. (i) F¨ ur x0 ∈ M heißt (xn )n∈N konvergent gegen x0 , wenn gilt:
∀ ∃ ∀ d(x , x ) ≤ ε. 0
ε>0 n0 ∈N n∈N n≥n0
n
konvergent
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
172
Man schreibt dann lim xn = x0 oder xn → x0 , und x0 wird Limes der Folge (xn )n∈N genannt. (ii) Die Folge (xn ) heißt konvergent, wenn es ein x0 ∈ M mit xn → x0 gibt. Cauchy-Folge
(iii) (xn )n∈N heißt Cauchy-Folge, wenn
∀∃ ∀
d(xn , xm ) ≤ ε.
ε>0 n0 ∈N n,m∈N n,m≥n0
Beispiele: 1. Durch die Betragsmetrik werden R und C zu metrischen R¨ aumen. Deswegen k¨onnen hier alle Beispiele konvergenter Folgen aus dem vorigen Kapitel angef¨ uhrt werden. Weitere Beispiele sind leicht dadurch zu gewinnen, dass man zu Teilmengen u ¨ bergeht: Ist (xn ) eine in R konvergente Folge und A ⊂ R eine Teilmenge, die die Folge und den Grenzwert enth¨ alt, so ist diese Folge auch in A konvergent, wenn man die Metrik auf A durch Einschr¨ ankung der Betragsmetrik definiert. Doch Achtung: Ist A ⊂ R und (xn ) eine Folge in A, die in R konvergent ist, so muss sie nicht auch in A konvergent sein. Es k¨ onnte n¨ amlich sein, dass lim xn – der existiert ja nach Voraussetzung – gar nicht in A liegt. (So ist etwa (1/n) im metrischen Raum {x | 0 < x ≤ 1} nicht konvergent, wohl aber in {x | 0 ≤ x ≤ 1}.)
?
2. Sei (xn ) eine Folge in M , die von einer Stelle an konstant ist: Es soll also ein n ˜ ∈ N und ein x0 ∈ M geben, so dass xn = x0 f¨ ur alle n ≥ n ˜ gilt3) . Dann gilt sicher xn → x0 . Das kann als Verallgemeinerung des trivialen Beispiels einer Nullfolge auf Seite 106 aufgefasst werden. Bemerkenswerterweise gibt es metrische R¨ aume, in denen auch die Umkehrung gilt: Versuchen Sie zu begr¨ unden, dass in der diskreten Metrik4) die einzigen konvergenten Folgen die fastkonstanten Folgen sind. Satz 3.1.4. Es gilt: (i) Konvergente Folgen haben h¨ochstens einen Limes, d.h. aus xn → x0 und xn → y0 folgt x0 = y0 . (ii) Jede konvergente Folge ist eine Cauchy-Folge, die Umkehrung gilt im Allgemeinen aber nicht. Beweis: (i) Wir kopieren einfach den Beweis zu 2.2.10(iv): W¨ are x0 = y0 , so w¨are d(x0 , y0 ) > 0 (man beachte 3.1.1(i)). Andererseits gibt es, wenn man ˜ 0 ∈ N mit ε := d(x0 , y0 )/3 > 0 setzt, nach der Konvergenzdefinition n0 , n
3) Solche 4) Vgl.
n ≥ n0
⇒ d(xn , x0 ) ≤ ε,
n≥n ˜0
⇒ d(xn , y0 ) ≤ ε.
Folgen heißen u ¨brigens fastkonstant. Bemerkung 3 auf Seite 168.
¨ 3.1. METRISCHE RAUME
173
˜ 0 ist, so erh¨ alt W¨ahlt man nun ein n ∈ N , das gleichzeitig gr¨oßer als n0 und n man 3ε = d(x0 , y0 ) ≤ d(x0 , xn ) + d(xn , y0 ) ≤ ε + ε = 2ε im Widerspruch zu ε > 0. (ii) Hier ist der Beweis zu Satz 2.3.2(i) zu u ahle zu vorgegebe¨ bertragen: Man w¨ nem ε > 0 ein n0 , so dass d(xn , x0 ) ≤ ε/2 f¨ ur n ≥ n0 . F¨ ur beliebige n, m ≥ n0 ist dann d(xn , xm )
≤ d(xn , x0 ) + d(xm , x0 ) ε ε + ≤ 2 2 = ε.
Um einzusehen, dass die Umkehrung nicht gilt, ist nur noch einmal an die Folge (1/n) im metrischen Raum A := {x | 0 < x ≤ 1} (Betragsmetrik) zu erinnern: Die ist offensichtlich eine Cauchy-Folge (das folgt sofort aus dem Archimedesaxiom), sie ist aber in A nicht konvergent. Bemerkungen: 1. Wenn man es ganz genau nimmt, ist eigentlich erst nach dem Beweisteil (i) die Schreibweise lim xn = x0“ gerechtfertigt. ” 2. F¨ ur metrische R¨ aume, in denen jede Cauchy-Folge konvergent ist, gibt es eine eigene Bezeichnung, sie werden vollst¨andig genannt. Wir wissen schon, dass R und C vollst¨ andig sind, und mit {x | 0 < x < 1} wurde auch schon ein nicht vollst¨andiger Raum angegeben.
vollst¨ andig
Sei (M, d) ein metrischer Raum. Zwei Arten von Teilmengen von M spielen eine ausgezeichnete Rolle, n¨amlich: • Offene Teilmengen: Das sind Teilmengen, die mit jedem Punkt x auch all das enthalten, was gen¨ ugend nahe“ bei x liegt (die pr¨ azise Definition ” wird gleich nachgeliefert). • Abgeschlossene Teilmengen: Hier handelt es sich um Teilmengen, die mit jeder konvergenten Folge auch deren Limes enthalten. Am einfachsten lassen sich beide Begriffe mit Hilfe von Kugeln“ definieren: ” Definition 3.1.5. Sei (M, d) ein metrischer Raum, x0 ∈ M und r ≥ 0. Unter der Kugel um x0 mit dem Radius r verstehen wir dann die Menge Kr (x0 ) := {x | x ∈ M, d(x, x0 ) ≤ r}, also die Menge derjenigen x, f¨ ur die der Abstand zu x0 h¨ochstens gleich r ist.
Kugel
174
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Die Bezeichnung Kugel“ ist am normierten Raum (R3 , · 2 ) motiviert: ” Dort sind die Kr (x0 ) ganz gew¨ohnliche Kugeln. In anderen metrischen R¨ aumen dagegen k¨onnen sie ziemlich ungew¨ ohnlich aussehen: Beispiele: 1. In (R , | · |) ist die Kugel um 0 mit dem Radius 1 das Intervall von −1 bis 1, also die Menge {x | −1 ≤ x ≤ 1}:
−2
K1 (0)
−1
0
1
2
R
Bild 3.1: K1 (0) in R 2. Im normierten Raum (R2 , · 1 ) sieht die Kugel um (0, 0) mit dem Radius 1 so aus: R2
1
K1 (0, 0)
(0,0) −1
1 −1
Bild 3.2: K1 (0, 0) in (R2 , · 1 ) 3. Und hier ist die Kugel um (0, 0) mit dem Radius 1 in (R2 , · ∞ ): R2 1
K1 (0, 0)
(0,0) −1
1 −1
Bild 3.3: K1 (0, 0) in (R2 , · ∞ )
?
4. Hier noch einige Beispiele f¨ ur ungew¨ ohnliche Kugeln, die Sie selber finden sollen. Wie sehen die Kr (x0 ) in den folgenden F¨ allen aus (es kann nicht v¨ ollig ausgeschlossen werden, dass eine kleine Falle eingebaut ist)?
¨ 3.1. METRISCHE RAUME
175
a) (M, d) = die Menge {x | 0 < x < 10} mit der durch R induzierten Metrik, x0 = 0.5, r = 3. b) x0 ist ein beliebiges Element einer mit der diskreten Metrik versehenen Menge. Wie sieht hier die Kugel um x0 mit dem Radius 0.2 aus, wie die mit dem Radius 222222222 ? c) Wir sind in R mit der Betragsmetrik, und es geht um x0 = i und r = 2. d) Wie kann man sich immer die Kugel K0 (x0 ) vorstellen? e) Wie sehen Kugeln aus, wenn M die leere Menge ist? f) F¨ ur welche metrischen R¨aume sind alle Kugeln gleich? g) Sei (rn )n∈N eine monoton fallende Folge mit Grenzwert r. Machen Sie sich klar, dass der Schnitt der Krn (x) gleich Kr (x) ist. Dabei sei x ein beliebiges Element irgendeines metrischen Raumes. Nach diesen Vorbereitungen k¨onnen nun die f¨ ur die Analysis wichtigsten Teilmengen metrischer R¨aume definiert werden: Definition 3.1.6. Sei (M, d) ein metrischer Raum und A ⊂ M . (i) A heißt offen (in M ), wenn gilt: F¨ ur jedes x0 ∈ A gibt es ein ε > 0 mit Kε (x0 ) ⊂ A. Als Formel:
offen
∀ ∃ K (x ) ⊂ A. 0
ε
x0 ∈A ε>0
(ii) A heißt abgeschlossen (in M ), wenn M \ A := {x ∈ M | x ∈ A} offen ist (d.h. f¨ ur x0 ∈ M mit x0 ∈ A gibt es ε > 0 mit A ∩ Kε (x0 ) = ∅). Mit Quantoren liest sich das so:
∀ ∃ K (x ) ∩ A = ∅. ε
0
ε>0 x0 ∈A /
A
ε x0 Kε (x0 )
Bild 3.4: Eine offene Menge A ⊂ M
M
abgeschlossen
176
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
A
M
ε x0 Kε (x0 )
Bild 3.5: Eine abgeschlossene Menge A ⊂ M Zum Kennenlernen dieser Definition behandeln wir einige Beispiele: 1. F¨ ur jedes r ≥ 0 ist Kr (x0 ) abgeschlossen, insbesondere sind einpunktige Mengen {x0 } stets abgeschlossen. (Man beachte, dass K0 (x0 ) = {x0 }.) Beweis dazu: Sei y0 ∈ M , y0 ∈ Kr (x0 ). Es ist ein ε > 0 zu finden, so dass Kε (y0 ) ∩ Kr (x0 ) = ∅. Die Skizze
r x0
ε y0
Kε (y0 )
Kr (x0 ) Bild 3.6: Die Kugeln Kr (x0 ) sind abgeschlossen legt den Versuch ε := d(x0 , y0 ) − r /2 nahe. Das muss nat¨ urlich bewiesen werden. Zun¨ achst ist zu bemerken, dass wirklich ε > 0 gilt, denn es ist nach Voraussetzung d(x0 , y0 ) > r. Sei nun x ∈ Kε (y0 ); es ist zu zeigen, dass x ∈ Kr (x0 ). Zun¨ achst ist doch wegen der Dreiecksungleichung: d(x0 , y0 ) ≤ d(x, x0 ) + d(x, y0 ) ≤ d(x, x0 ) + ε, und daraus folgt wegen d(x0 , y0 ) = 2ε + r: d(x, x0 ) ≥ ε + r > r. Folglich gilt wirklich x ∈ Kr (x0 ).
2. F¨ ur jedes r > 0 ist A := {x | d(x, x0 ) < r} offen. Diese Menge wird die offene Kugel um x0 mit Radius r genannt.
¨ 3.1. METRISCHE RAUME
177
Das zeigt man ¨ ahnlich wie im vorstehenden Beispiel: F¨ ur y0 ∈ A kommt man anhand der Skizze
Kε (y0 )
ε y0 r
x0
A
Bild 3.7: Offene Kugeln sind offen zu der Idee, es mit ε := r − d(x0 , y0 ) /2 zu versuchen, und f¨ ur dieses ε ist wirklich Kε (y0 ) ⊂ A.
3. F¨ ur (M, d ) = (R , | · |) spielen folgende Teilmengen, die so genannten Intervalle, eine wichtige Rolle; dabei seien a, b ∈ R mit a ≤ b : • [ a, b ] := {x | x ∈ R , a ≤ x ≤ b} (das abgeschlossene Intervall zwischen a und b), • ] a, b [ := {x | x ∈ R , a < x < b} (das offene Intervall zwischen a und b), • [ a, +∞ [ := {x | x ∈ R , a ≤ x}, • ] a, +∞ [ := {x | x ∈ R , a < x}, • ] −∞, a ] := {x | x ∈ R , x ≤ a}, • ] −∞, a [ := {x | x ∈ R , x < a}, • [ a, b [ := {x | x ∈ R , a ≤ x < b}, • ] a, b ] := {x | x ∈ R , a < x ≤ b}. (Die Zeichen +∞“ und −∞“ haben vorl¨aufig keine inhaltliche Bedeutung, auf der ” ” rechten Seite des Definitionszeichens tauchen sie ja auch nicht auf. Mehr dazu wird am Ende von Abschnitt 3.2 gesagt werden.) Die Intervalle [ a, b ], [ a, +∞ [ und ] −∞, a ] sind abgeschlossen, die Intervalle ] a, b [, ] −∞, a [ und ] a, +∞ [ sind offen. Hier zwei typische Beweise dazu: Warum ist zum Beispiel [ a, +∞ [ abgeschlossen? Weil f¨ ur ein y0 , das nicht ur die zu dieser Menge geh¨ ort, notwendig y0 < a gelten muss und dann f¨ Zahl ε := (a − y0 )/2 die Kugel Kε (y0 ) die Menge [ a, +∞ [ nicht schneidet. Und warum ist ] a, +∞ [ offen? Weil ε := (x0 − a)/2 f¨ ur jedes x0 in dieser Menge positiv ist und die Eigenschaft Kε (x0 ) ⊂ ] a, +∞ [ hat.
Intervall
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
178
?
Der Beweis der noch fehlenden Aussagen verl¨ auft analog, die F¨ alle ] a, b [ und [ a, b ] sind sogar schon erledigt, wenn man die vorstehenden Beispiele 1 und 2 auf den vorliegenden Spezialfall anwendet (warum eigentlich?). Dagegen sind [ a, b [ und ] a, b ] weder offen noch abgeschlossen5). K¨ onnen Sie auch das begr¨ unden?
?
4. Machen Sie sich klar, dass in einem metrischen Raum (M, d) die Mengen M und ∅ stets gleichzeitig offen und abgeschlossen sind6) und dass in (M, diskrete Metrik) jede Teilmenge von M offen und abgeschlossen ist.
?
5. Offen“ und abgeschlossen“ sind Begriffe, die nur relativ zum betrachteten ” ” Raum sinnvoll sind. So ist die Frage
?
Ist ] 0, 1 ] abgeschlossen?“ ” sinnlos. Je nachdem, welchen metrischen Raum M man zu Grunde legt, wird die Antwort verschieden ausfallen. Zum Beispiel ist ] 0, 1 ] nicht abgeschlossen in R , wohl aber in ] 0, +∞ [ und in ] 0, 1 ]. Warum?
?
6. Zeigen Sie unter Ausnutzung des Dichtheitssatzes 1.7.4(ii) und der Tatsache, dass irrationale Zahlen existieren, dass Q in R weder offen noch abgeschlossen ist. Nach dem ersten Kennenlernen der Begriffe offen“ und abgeschlossen“ geht ” ” es in diesem Abschnitt so weiter: • Wir zeigen, dass sich abgeschlossene Teilmengen dadurch charakterisieren lassen, dass sie mit jeder konvergenten Folge auch den Grenzwert enthalten. Dieses Ergebnis wird sp¨ ater aus dem folgenden Grund wichtig sein: Hat man ein x0 besser und besser durch gewisse xn approximiert und haben alle xn eine gewisse Eigenschaft E, so wird auch x0 diese Eigenschaft haben, falls man vorher die Abgeschlossenheit der Menge {x | x hat E} gezeigt hat. Zum Beispiel folgt aus der Abgeschlossenheit von [ 0, +∞ [: Ist (xn ) eine reelle Folge mit xn ≥ 0 f¨ ur alle n, so gilt auch lim xn ≥ 0.
Man beachte auch: Nach Definition sind offene Mengen die Komplement¨ armengen abgeschlossener Mengen, jede Charakterisierung von abgeschlos” sen“ liefert damit auch eine f¨ ur offen“. ” • Wie kann man aus offenen (bzw. abgeschlossenen) Mengen neue Mengen des gleichen Typs gewinnen? • Im Allgemeinen ist eine vorgegebene Teilmenge A eines metrischen Raumes weder offen noch abgeschlossen. Man kann sich jedoch eine – in gewisser Weise bestm¨ogliche“ – offene Teilmenge von A verschaffen, und ” ebenso eine optimale“ abgeschlossene Obermenge. ” 5) Diese
Intervalle werden halboffen genannt. ist es dazu hilfreich, vorher noch einmal den Kasten auf Seite 127 zu lesen.
6) Vielleicht
¨ 3.1. METRISCHE RAUME
179
• Zum Ende des Abschnitts wird noch ein weiterer Begriff eingef¨ uhrt: dichte Teilmengen. Das sind Teilmengen von M , deren Elemente jedem beliebi” gen Element von M beliebig nahe kommen“. Wir beginnen mit dem folgenden wichtigen Charakterisierungssatz: Satz 3.1.7. Sei (M, d) ein metrischer Raum und A ⊂ M . Dann sind ¨ aquivalent: (i) A ist abgeschlossen. ur die es ein x0 ∈ M mit xn → x0 gibt, (ii) Ist (xn )n∈N eine Folge in A, f¨ so ist x0 ∈ A. In Worten: Folgen in A, die in M konvergent sind, sind bereits in A konvergent.
x0
A
M
Bild 3.8: Charakterisierung abgeschlossener Mengen durch Folgen Beweis: (i)⇒(ii): Sei A abgeschlossen und (xn )n∈N eine konvergente Folge. Es ussen zeigen, dass x0 gibt also irgendwo in M ein x0 mit xn → x0 , und wir m¨ zu A geh¨ ort. Wir zeigen das durch einen indirekten Beweis. W¨are n¨ amlich x0 ∈ A, so g¨ abe es nach Definition der Abgeschlossenheit ein ε > 0 mit Kε (x0 ) ∩ A = ∅, insur alle n ∈ N . Das widerspricht offensichtlich besondere gilt also d(xn , x0 ) > ε f¨ der Voraussetzung xn → x0 . Damit ist (ii) bewiesen. (ii)⇒(i): F¨ ur den Beweis der Umkehrung ist unter Voraussetzung von (ii) zu zeigen, dass es f¨ ur jedes x0 , das nicht in A liegt, ein positives ε mit Kε (x0 )∩A = ∅ gibt. Wir gehen wieder indirekt vor, nehmen also an, dass
∃ ∀ K (x ) ∩ A = ∅ ε
0
x0 ∈M ε>0 x0 ∈A
gilt und hoffen auf einen Widerspruch (vgl. Bild 3.9). Angenommen also, es g¨abe ein derartiges x0 . Insbesondere ist dann f¨ ur jedes n ∈ N auch K1/n (x0 ) ∩ A = ∅, und wir w¨ahlen ein xn ∈ K1/n (x0 ) ∩ A. Auf diese Weise erhalten wir eine Folge (xn ) mit d(xn , x0 ) ≤ 1/n, es gilt also xn → x0 . Das widerspricht aber (ii), denn x0 liegt ja nicht in A. Hier haben wir erstmals eine Voraussetzung der Form ∀ε > 0 gibt es . . .“ ” durch spezielle Anwendung auf die ε = 1/n, n ∈ N , zur Konstruktion einer Folge mit geeigneten Eigenschaften verwendet. Dieses Verfahren wird uns noch h¨ aufiger begegnen.
180
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Damit ist der Charakterisierungssatz vollst¨ andig bewiesen.
M
1 n
xn x0
K n1 (x0 )
A
Bild 3.9: Skizze zum Beweis von Satz 3.1.7
Nun zeigen wir einen Permanenzsatz: Wie gewinnt man aus abgeschlossenen (bzw. offenen) Teilmengen weitere Teilmengen des gleichen Typs? Satz 3.1.8. Es sei (M, d) ein metrischer Raum. (i) Sind A1 , A2 ⊂ M abgeschlossene Teilmengen, so ist auch A1 ∪ A2 abgeschlossen. (ii) Allgemeiner gilt: A1 ∪ · · · ∪ An ist abgeschlossen, falls A1 , . . . , An abgeschlossene Teilmengen von M sind. (iii) Sei A eine Teilmengeder Potenzmenge von M . Sind alle Elemente von A abgeschlossen, so ist A abgeschlossen 7) . (iv) Sind O1 , . . . , On offene Teilmengen von M , so ist auch O1 ∩· · ·∩On offen. (v) Sei O eine Teilmenge der Potenzmenge von M mit der Eigenschaft, dass " jedes Element von O eine offene Teilmenge von M ist. Dann ist O offen8) . (vi) Die vorstehenden Aussagen sind bestm¨oglich im folgenden Sinn: Es ist nicht richtig, dass in allen metrischen R¨aumen beliebige Vereinigungen abgeschlossener Mengen wieder abgeschlossen oder beliebige Schnitte offener Mengen wieder offen sind. 7) Zur Erinnerung: A – der Durchschnitt ¨ uber das Mengensystem A – besteht nach Definition aus allen x ∈ M , die in allen A ∈ A enthalten sind. Diese Definition wurde schon in Abschnitt 1.5 ben¨ otigt, um die Menge N der nat¨ urlichen Zahlen ohne P¨ unktchen einf¨ uhren zu k¨ onnen. 8) O – die Vereinigung u ¨ber das Mengensystem O – besteht nach Definition aus allen x ∈ M , die in mindestens einem O ∈ O enthalten sind.
¨ 3.1. METRISCHE RAUME
181
(In Kurzfassung besagt der Satz also: Die Vereinigung von endlich vielen und der Durchschnitt von beliebig vielen – also ausdr¨ ucklich auch von unendlich vielen – abgeschlossenen Mengen ist abgeschlossen, und endliche Schnitte und beliebige Vereinigungen offener Mengen sind offen.) Noch einmal: Standard-Induktion In sehr vielen F¨allen, in denen man eine Aussage f¨ ur endlich viele Objekte zeigen m¨ochte, reicht es, sich auf den Fall von zwei Objekten ¨ zu konzentrieren. Das geht immer dann, wenn der Ubergang von n zu n + 1 auf den Fall zweier Elemente zur¨ uckgef¨ uhrt werden kann, dabei spielt fast immer eine Definition durch vollst¨ andige Induktion eine Rolle. Ein Beispiel: Mal angenommen, f¨ ur irgendeine Eigenschaft E von Mengen sei schon gezeigt, dass mit A und B auch A ∪ B diese Eigenschaft hat. Dann u ¨ bertr¨agt sich E auch auf endliche Vereinigungen. Begr¨ undung: Beim Beweis durch vollst¨andige Induktion ist im Induktionsschritt von A1 ∪ · · · ∪ An hat E“ auszugehen und dann ” A1 ∪ · · · ∪ An+1 zu untersuchen. Und nun muss man nur noch bemerken, dass A1 ∪ · · · ∪ An+1 = (A1 ∪ · · · ∪ An ) ∪ An+1 gilt und der Fall zweier Mengen schon erledigt ist. Mit einem analogen Argument kann man schließen, dass endliche Durchschnitte E haben, wenn man es schon f¨ ur den Durchschnitt zweier Mengen weiß. Als weiteres Beispiel betrachten wir die Aussage: Sind xi , yi reelle Zahlen und gilt xi ≤ yi f¨ ur alle i, so gilt auch x1 + · · · + xn ≤ y1 + · · · + yn ; hier wird beim Beweis wichtig, dass man Ungleichungen addieren darf (Satz 1.4.3(ii),(ix)) und dass gilt: x1 + · · · + xn+1 = (x1 + · · · + xn ) + xn+1 . Beweis: (i) Sei x0 ein Element von M , das nicht in A1 ∪ A2 enthalten ist. Dann gibt es positive ε1 , ε2 , so dass Kε1 (x0 ) (bzw. Kε2 (x0 )) nicht in A1 (bzw. A2 ) hineinschneidet. Definiert man dann ε als die kleinere der Zahlen ε1 , ε2 , so gilt (A1 ∪ A2 ) ∩ Kε (x0 ) = ∅. Das zeigt die Abgeschlossenheit von A1 ∪ A2 . (ii) Diese Aussage folgt leicht durch vollst¨andige Induktion nach n. Es handelt sich um einen Spezialfall der im vorstehenden grauen K¨ astchen beschriebenen allgemeinen Situation: / A0 vor und m¨ ussen ein ε > 0 so (iii) Man setze A0 := A. Wir geben ein x0 ∈ finden, dass Kε (x0 ) ∩ A0 = ∅.
182
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Nun bedeutet x0 ∈ / A0 nach Definition des Durchschnitts, dass es ein A ∈ A mit x0 ∈ / A gibt. Da alle Elemente von A abgeschlossen sind, k¨ onnen wir daraus auf die Existenz eines ε > 0 mit Kε (x0 ) ∩ A = ∅ schließen: Kein x ∈ A liegt ε-nahe bei x0 . Es folgt Kε (x0 ) ∩ A0 = ∅, denn nach Definition des Durchschnitts ist A0 ⊂ A. (iv) Dieser Beweis ist ein erstes Beispiel daf¨ ur, wie man aus Aussagen u ¨ ber abgeschlossene Mengen Ergebnisse f¨ ur offene Mengen (oder auch umgekehrt) gewinnt. Faustregel: Man ersetze in den Aussagen abgeschlossen“ durch offen“, ” ” Durchschnitt“ durch Vereinigung“ und Vereinigung“ durch Durchschnitt“. ” ” ” ” Grund f¨ ur diese Dualit¨at sind einerseits die de Morganschen Regeln der Mengenlehre (das Komplement des Durchschnitts ist die Vereinigung der Komplemente usw.) und andererseits die Tatsache, dass abgeschlossene Mengen als Komplemente offener Mengen definiert sind. Nun zum eigentlichen Beweis: Sind O1 , . . . , On offen, so sind die Komplement¨armengen Ai := M \ Oi abgeschlossen. Damit wissen wir nach Teil (ii), dass A1 ∪ · · · ∪ An ebenfalls abgeschlossen ist. Nun ist aber A1 ∪ · · · ∪ An = M \ (O1 ∩ · · · ∩ On ), und deswegen muss die Komplement¨ armenge von A1 ∪· · ·∪An , also O1 ∩· · ·∩On , offen sein. (v) Dieser Beweis kann ebenfalls durch Umsteigen“ auf abgeschlossene Mengen ” gef¨ uhrt werden: Man betrachte A := {M \ O | O ∈ O} und wende darauf (iii) an. Dann ist nur noch zu beachten, dass % O = M \ A. (vi) Am einfachsten lassen sich Beispiele im metrischen Raum R (Betragsme' & trik) finden. Definiert man zum Beispiel An als das offene Intervall −∞, n1 f¨ ur n ∈ N , so sind zwar alle An offen, doch der Durchschnitt – er ist aufgrund des Archimedesaxioms gleich der Menge ] −∞, 0 ] – ist nicht offen. ' ' ¨ Durch Ubergang zu den Komplementen erh¨ alt man die Mengenfolge n1 , +∞ , die aus abgeschlossenen Mengen besteht, deren Vereinigung, das ist das Intervall ] 0, +∞ [, aber nicht abgeschlossen ist. Man beachte, dass (vi) nicht ausschließt, dass manchmal auch unendliche Schnitte abgeschlossener Mengen abgeschlossen sein k¨ onnen. Das ist zum Beispiel in allen mit der diskreten Metrik versehenen R¨ aumen der Fall, denn da sind alle Teilmengen abgeschlossen (und offen).
Damit ist der Satz vollst¨andig bewiesen.
Bemerkung: In h¨oheren Semestern werden Sie erfahren, dass der Ansatz, die intuitive Vorstellung von ist nahe bei . . .“ durch die Axiome des metrischen ”
¨ 3.1. METRISCHE RAUME
183
Raumes zu pr¨ azisieren, manchmal nicht ausreicht. Der heute u ¨bliche allgemeinere Zugang ist der Begriff des topologischen Raums. Ein topologischer Raum ist eine Menge T zusammen mit einer Teilmenge T der Potenzmenge von T , f¨ ur die die folgenden Eigenschaften erf¨ ullt sind: - T und ∅ geh¨ oren zu T . - T enth¨ alt mit je endlich vielen Mengen auch deren Durchschnitt und zu beliebig vielen Mengen auch deren Vereinigung. Das System T wird in diesem Fall auch eine Topologie auf T genannt. Unser Satz besagt dann unter anderem, dass jeder metrische Raum insbesondere ein topologischer Raum ist, wenn man T als das System der offenen Mengen definiert. (Einzelheiten lernt man in der Vorlesung Topologie“.) ” Im Allgemeinen ist eine Teilmenge eines metrischen Raumes weder offen noch abgeschlossen. Durch Weglassen st¨orender“ (bzw. durch Hinzunahme feh” lender) Punkte kann man jedoch eine offene (bzw. abgeschlossene) Teilmenge konstruieren: Definition 3.1.9. Sei A Teilmenge eines metrischen Raumes (M, d). (i) Der offene Kern (auch: das Innere) von A ist die Menge # ◦ A := x x ∈ M, Kε (x) ⊂ A .
A◦ , A−
∃
ε>0
Die Menge A◦ wird auch kurz als A Null“ bezeichnet. ” (ii) Unter dem Abschluss von A (auch abgeschlossene H¨ ulle) verstehen wir die Menge # − Kε (x) ∩ A = ∅ . A := x x ∈ M,
∀
ε>0
Gesprochen wird das als A quer“. ” ◦ Was ist zum Beispiel [ 0, 1 [ in R ? Behauptung: Es ist das Intervall ] 0, 1 [. Um das zu zeigen, sind zwei Beweise zu f¨ uhren: Erstens ist ] 0, 1 [ ⊂ [ 0, 1 [ ◦ , denn um alle Punkte von ] 0, 1 [ lassen sich Kugeln legen, die ganz in [ 0, 1 [ liegen. Und zweitens geh¨ oren Zahlen, die nicht ◦ in ] 0, 1 [ liegen, sicher nicht zu [ 0, 1 [ , dazu muss man die x ≤ 0 und die x ≥ 1 gesondert diskutieren. Ist etwa x ≥ 1, so enth¨alt jede Kugel um x mit positivem Radius ein Element, das gr¨oßer als 1 ist. Solche Kugeln liegen also nicht in [ 0, 1 [, ◦ und damit liegen diese x nicht in [ 0, 1 [ . − ¨ Zeigen Sie zur Ubung, dass [ 0, 1 [ = [ 0, 1 ] und bestimmen Sie Q ◦ und Q − .
?
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
184
Satz 3.1.10. Sei (M, d) ein metrischer Raum und A ⊂ M . Dann gilt: (i) A− ist die kleinste abgeschlossene Menge, die A enth¨alt, d.h. (a) A ⊂ B ⊂ M , B abgeschlossen ⇒ A− ⊂ B. (b) A− ist abgeschlossen, und A ⊂ A− . (ii) A◦ ist die gr¨oßte offene Menge, die in A enthalten ist, d.h. (a) B ⊂ A ⊂ M , B offen ⇒ B ⊂ A◦ . (b) A◦ ist offen, und A◦ ⊂ A. (iii) A ist genau dann abgeschlossen, wenn A = A− . (iv) A ist genau dann offen, wenn A = A◦ . (v) A− = {x0 ∈ M | es gibt eine Folge (xn ) in A mit xn → x0 }. Beweis: (i), Teil (a): Sei A ⊂ B ⊂ M und B abgeschlossen. F¨ ur x0 ∈ M mit x0 ∈ B gibt es ein ε > 0 mit Kε (x0 ) ∩ B = ∅ (Definition 3.1.6(ii)). Dann ist erst recht Kε (x0 ) ∩ A = ∅, d.h. x0 ∈ A− .
B M
Kε (x0 )
ε x0
A
Bild 3.10: Skizze zu 3.1.10(i)a Damit ist A− ⊂ B bewiesen. (i), Teil (b): Sei x0 ∈ M , x0 ∈ A− . Es ist zu zeigen, dass es ein ε > 0 mit Kε (x0 ) ∩ A− = ∅ gibt. Aufgrund der Definition von A− gibt es ein ε0 > 0 mit unschten Eigenschaften Kε0 (x0 ) ∩ A = ∅. Wir behaupten, dass ε := ε0 /2 die gew¨ hat, dass also Kε0 /2 (x0 ) ∩ A− = ∅ (vgl. Bild 3.11). Dazu ist zu verifizieren, dass alle x ∈ Kε (x0 ) nicht in A− liegen. Das ist gezeigt, wenn wir f¨ ur derartige x nachweisen k¨ onnen, dass Kε (x) ∩ A = ∅ ist. Der Nachweis ist mit Hilfe der Dreiecksungleichung leicht zu f¨ uhren: F¨ ur y ∈ A und x ∈ Kε (x0 ) ist: ε0 < d(y, x0 ) ≤ d(y, x) + d(x, x0 ) ≤ d(y, x) + ε = d(y, x) +
ε0 , 2
¨ 3.1. METRISCHE RAUME
185
d.h. d(y, x0 ) > ε0 /2 = ε und folglich y ∈ Kε0 /2 (x0 ). Die Inklusion A ⊂ A− ist offensichtlich.
M
ε0 x0 Kε0 (x0 ) K ε20 (x0 )
Bild 3.11: Skizze zu 3.1.10(i)b (ii), Teil (a): Sei B offen und B ⊂ A. F¨ ur x0 ∈ B gibt es wegen der vorausgesetzten Offenheit von B ein ε > 0 mit Kε (x0 ) ⊂ B, d.h. insbesondere Kε (x0 ) ⊂ A und folglich x0 ∈ A◦ . (ii), Teil (b): Sei x0 ∈ A◦ , d.h. Kε0 (x0 ) ⊂ A f¨ ur ein geeignetes ε0 > 0. Mit ε := ε0 /2 ist dann Kε (x0 ) ⊂ A◦ , was wie im Beweis von (i)b sofort aus der Dreiecksungleichung folgt. (iii) Ist A = A− , so ist A wegen (i)b abgeschlossen. Umgekehrt: Ist A abgeschlossen, so folgt A− ⊂ A aus (i)a, und A ⊂ A− gilt stets. (iv) Das folgt aus (ii) genau so, wie sich vorstehend (iii) aus (i) ergeben hat. (v) Ist (xn )n∈N eine Folge in A, die in M konvergent ist, so ist (xn )n∈N insbesondere eine Folge in A− . Satz 3.1.7 und (i)b garantieren dann lim xn ∈ A− , und das zeigt ⊃“. ” Umgekehrt: Ist x0 ∈ A− , so sind insbesondere zu ε = 1/n Elemente xn ∈ A mit d(xn , x0 ) ≤ 1/n w¨ahlbar (da ja A ∩ Kε (x0 ) = ∅ f¨ ur alle ε > 0). Es ist klar, dass dann xn → x0 , und das zeigt gerade ⊂“. (Der Beweis zu Satz 3.1.7 war ” u ahnlich.) ¨ brigens ganz ¨ Durch die folgende Definition werden Teilmengen eines metrischen Raumes (M, d) beschrieben, die u ¨berall in M“ zu finden sind: ” Definition 3.1.11. Sei (M, d) ein metrischer Raum. Dann heißt eine Teilmenge D von M dicht in M , falls D− = M . Es ist nicht schwer, Beispiele f¨ ur dichte Teilmengen zu finden: Stets ist M dicht in M , das Intervall [ a, b [ ist dicht im Intervall [ a, b ], Q ist dicht in R usw.
dicht
186
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Satz 3.1.12. Die folgenden Aussagen sind f¨ ur eine Teilmenge D eines metrischen Raumes ¨aquivalent: (i) D liegt dicht in M . (ii) Zu jedem x0 ∈ M und jedem ε > 0 gibt es ein x ∈ D mit d(x, x0 ) ≤ ε. (iii) Zu jedem x0 ∈ M gibt es eine Folge (xn ) in D mit xn → x0 . ¨ Beweis: (i) und (iii) sind wegen Satz 3.1.10(v) ¨ aquivalent, die Aquivalenz von (i) und (ii) folgt aus der Definition des Abschlusses. separabel
Wenn M eine dichte Teilmenge D enth¨ alt, die sogar abz¨ ahlbar ist, so heißt M separabel . Fasst man dann die Elemente von D als Folgenglieder einer Folge auf und interpretiert man diese Folge als Spaziergang, so bedeutet Separabilit¨ at gerade: Man kann in M einen Spaziergang so machen, dass man jedem x0 ∈ M beliebig nahe kommt. Separable metrische R¨aume sind in gewisser Weise nicht zu groß“. Das liegt ” daran, dass man dann mit etwas Gl¨ uck Konstruktionen, die ganz M betreffen, nur f¨ ur die Elemente einer Folge durchf¨ uhren muss und deswegen vielleicht ur die Analysis induktive Verfahren zur Verf¨ ugung stehen9) . So gut wie alle f¨ wichtigen metrischen R¨aume sind separabel. Zum Beispiel folgt aus dem Dichtheitssatz (Satz 1.7.4) in Verbindung mit der Abz¨ ahlbarbeit von Q (Satz 1.10.3) sofort, dass R ein separabler metrischer Raum ist. Der Vollst¨andigkeit halber ist noch auf eine Definition hinzuweisen, die in der Analysis erst sp¨ater von Bedeutung sein wird: Definition 3.1.13. Sei (M, d) ein metrischer Raum und A ⊂ M . Dann heißt die Menge ∂A := A− \ A◦ (= {x | x ∈ A− , x ∈ A◦ }) der Rand von A.
?
Es ist dann klar, dass der Rand gem¨ aß der vorstehenden Definition f¨ ur einfache Figuren der Ebene (Kreise, Rechtecke, . . . ) mit dem u ¨bereinstimmt, was man auch naiv als Rand“ bezeichnet h¨ atte. Nun kann man aber allen Teil” mengen einen Rand zuordnen, der wird allerdings manchmal sehr merkw¨ urdig aussehen. (Was ist der Rand der leeren Menge? Wie sieht der Rand von Q in R aus?)
9) F¨ ur ein Beispiel m¨ ussen Sie sich bis zum Beweis des Satzes von Arzel`a-Ascoli in Kapitel 5 des zweiten Bandes gedulden. Da wird es eine wichtige Rolle spielen, dass kompakte metrische R¨ aume – die lernen wir gleich anschließend kennen – separabel sind.
3.2. KOMPAKTHEIT
3.2
187
Kompaktheit
In diesem Abschnitt behandeln wir kompakte Teilmengen metrischer R¨aume, das sind Teilmengen, die in gewisser Weise nicht zu groß“ sind. Sie erfreuen ” sich großer Beliebtheit, denn einerseits gibt es in vielen F¨ allen einfache M¨ oglichkeiten, Kompaktheit auch wirklich nachzuweisen, und andererseits stehen f¨ ur solche Mengen eine Reihe tief liegender Existenzaussagen zur Verf¨ ugung. Zun¨ achst geht es um die Definition, zur Motivation m¨ ochte ich Sie mit einem Spiel bekannt machen. Es wird vorausgesetzt, dass sich die Spieler ganz gut mit metrischen R¨ aumen, Folgen, Teilfolgen10) und Konvergenz auskennen: Das Kompaktheitsspiel: Zwei Spieler, genannt S1 und S2 , d¨ urfen mitspielen. Als Spielmaterial wird ein metrischer Raum (M, d) ben¨otigt (Anf¨ angern empfehle ich R ). Das Spiel beginnt mit der Vorgabe einer Teilmenge A von M , die Spielregeln sind einfach: S1 w¨ahlt eine Folge (xn )n∈N in A, und S2 muss versuchen, ein x0 ∈ A und eine Teilfolge der (xn )n∈N so zu finden, dass diese Teilfolge gegen x0 konvergiert. Schafft S2 das, verliert S1 , andernfalls hat S1 gewonnen. Stellen Sie sich z.B. vor, dass (M, d) der metrische Raum R ist und A das Intervall [ −1, 1 ]. Erste Spielerfahrungen legen den Verdacht nahe, dass S2 immer gewinnen wird. Legt S1 z.B. (−1, 1, −1, 1, . . .) vor, so antwortet S2 mit x0 = 1 und der Teilfolge (1, 1, 1, . . .). Die S1 -Wahl (−1, 0, 1, −1, . . .) wird mit x0 = 0 und (0, 0, . . .) beantwortet, die Vorgabe einer sogar konvergenten Folge macht erst recht keine Schwierigkeiten usw. Wirklich, wenn S2 sich geschickt anstellt, wird S1 stets verlieren und bald deprimiert sein11) . In der zweiten Spielrunde wird A = R in R vorgelegt. Zun¨ achst versucht es S1 mit (1, 0, 2, 0, . . .) und verliert prompt, denn S2 kontert mit x0 = 0 und ¨ der Teilfolge (0, 0, . . .). Nach l¨angerem Uberlegen gibt S1 in der n¨ achsten Runde (1, 2, 3, . . .) vor, und nun streckt S2 die Waffen. Diese Folge hat wirklich keine konvergente Teilfolge. (Und zwar nicht, weil S2 ein zu unerfahrener Spieler ist, es ist eine beweisbare Tatsache: Jede Teilfolge dieser Folge ist unbeschr¨ ankt, kann also wegen Lemma 2.2.11 nicht konvergent sein.) Wollen Sie mitspielen? Wie k¨onnten Sie als Spieler S2 gewinnen, wenn A eine endliche Teilmenge ist? Warum werden Sie verlieren, wenn in R die Menge A = Q vorgegeben wird und sich S1 geschickt anstellt?
?
Wir kehren vom Spieltisch zur¨ uck zur Mathematik und definieren: Definition 3.2.1. Sei (M, d) ein metrischer Raum und K ⊂ M . K heißt kompakt, wenn jede Folge in K eine in K konvergente Teilfolge besitzt 12) . 10) Zur
Erinnerung: Der Begriff Teilfolge einer Folge“ wurde in Definition 2.1.2 eingef¨ uhrt. ” wird aus Satz 3.2.3 folgen. 12) Wir schließen uns ab hier der allgemein ublichen Schreibweise f¨ ur Teilfolgen an, schreiben ¨ also (xnk )k∈N statt (xϕ(n) )n∈N . k → nk ist also gerade die Abbildung ϕ aus Definition 2.1.2. 11) Das
kompakt
188
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Bemerkungen und Beispiele: 1. Achtung, die fragliche Teilfolge muss in K konvergent sein. Wenn man also die Teilmenge K := ] 0, 1 ] in R vorgibt und S1 darin die Folge (1/n) w¨ ahlt, so kann S2 durch keine Teilfolgenwahl gewinnen. Zwar ist die 0 ein aussichtsreicher Limes-Kandidat, doch liegt der nicht in K. 2. Aus der Sicht der Spieler S1 , S2 sind kompakte Teilmengen also gerade die, bei denen S2 mit Sicherheit gewinnen kann, wenn er sich geschickt anstellt. 3. Nach den vorstehenden Spielen haben wir den Verdacht, dass [ −1, 1 ] kompakt ist (ein Beweis daf¨ ur folgt gleich), und wir sind sicher, dass R nicht kompakt ist. 4. Im Gegensatz zu A ist offen in M“ und A ist abgeschlossen in M“ ist K ” ” ” ist kompakt in M“ eine nur von der Metrik und der Teilmenge selbst abh¨ angige Eigenschaft, denn alle f¨ ur K ist kompakt“ relevanten Aussagen k¨ onnen allein ” in K nachgepr¨ uft werden. Weiß man also, dass irgendein K ⊂ R kompakt ist, so ist K auch kompakt, wenn man K als Teilmenge von C auffasst. Interne und externe Eigenschaften Werden Teilmengen A metrischer R¨ aume M untersucht, so ist es manchmal m¨oglich, das Vorliegen einer gewissen Eigenschaft allein durch die Kenntnis von A zu entscheiden: Beispiele sind A enth¨ alt ” mindestens drei Elemente“, aber auch A ist kompakt“, wie aufgrund ” der Definition unmittelbar klar ist. Solche Eigenschaften heißen intern. Oft ist es aber so, dass die Lage von A in M eine wichtige Rolle spielt, wie etwa bei A ist offen in M“. Dann nennt man die Eigenschaft ” extern, man darf dann den Zusatz . . . in M“ nicht vergessen, sonst ” ist unklar, was gemeint ist. 5. Da alle Eigenschaften, die mit f¨ ur alle . . .“ anfangen, von der leeren Menge ” erf¨ ullt werden, gilt: Die leere Menge ist kompakt in jedem metrischen Raum. 6. In jedem metrischen Raum (M, d) sind die endlichen Teilmengen kompakt: Ist K = {a1 , a2 , . . . , an0 } ⊂ M und (xn )n∈N eine Folge in K, so muss es ein i ∈ {1, 2, . . . , n0 } geben, f¨ ur das N i := {n ∈ N | xn = ai } unendlich ist. W¨ahlt man die Elemente von N i als Indizes einer Teilfolge der (xn )n∈N , so ist diese Teilfolge als konstante Folge gegen ai ∈ K konvergent. 7. Sei M eine Menge, versehen mit der diskreten Metrik. Wir haben schon bemerkt, dass eine Folge (xn )n∈N in diesem Raum genau dann konvergent ist, wenn sie fastkonstant ist, d.h. wenn es ein n ˆ ∈ N mit xnˆ = xnˆ +1 = · · · gibt. Es folgt leicht, dass kompakte Teilmengen von M endlich sein m¨ ussen: Gibt es unendlich viele Punkte in einer Teilmenge A, so kann man darin eine Folge aus lauter verschiedenen Elementen vorgeben. Aufgrund der Vorbemerkung kann diese keine konvergente Teilfolge enthalten.
3.2. KOMPAKTHEIT
189
¨ Das weitere Vorgehen hat eine große formale Ahnlichkeit mit dem im Kapitel u ¨ ber Nullfolgen und Konvergenz. Wir werden n¨amlich zeigen: • Man kann aus schon bekannten kompakten R¨aumen leicht eine Vielzahl weiterer kompakter R¨aume gewinnen. • Es gibt einen nichttrivialen kompakten Raum (die endlichen Mengen, bisher unsere einzigen Beispiele, sind leider nicht sehr eindrucksvoll). Durch Kombination beider Resultate werden wir dann in der Lage sein, die f¨ ur die Analysis wichtigen kompakten R¨aume zu charakterisieren. Damit ist allerdings die Frage noch nicht beantwortet, warum ein so großes Interesse an kompakten R¨aumen besteht. F¨ ur die Antwort m¨ ussen Sie sich noch bis zum Ende des Abschnitts 3.3 gedulden. Satz 3.2.2. Sei (M, d) ein metrischer Raum und K, K1 , K2 ⊂ M . (i) Ist K kompakt, so ist K abgeschlossen. (ii) Kompakte Teilmengen sind beschr¨ankt: Falls K kompakt ist, so gibt es f¨ ur jedes x0 ∈ M ein R ≥ 0 mit d(x, x0 ) ≤ R f¨ ur alle x ∈ K. (iii) Sind K1 und K2 kompakt, so auch K1 ∪ K2 . (Durch vollst¨andige Induktion folgt daraus sofort, dass die Vereinigung endlich vieler kompakter Mengen wieder kompakt ist.) (iv) Ist K kompakt, so ist auch jede abgeschlossene Teilmenge A von K kompakt. Beweis: (i) Wir zeigen, dass die Bedingung aus Satz 3.1.7 erf¨ ullt ist. Sei dazu (xn )n∈N eine Folge in K und x0 ∈ M , so dass xn → x0 . Es ist zu beweisen, dass ort. x0 zu K geh¨ Nun gibt es wegen der Kompaktheit von K ein y0 ∈ K und eine Teilfolge (xnk )k∈N mit xnk → y0 . Da andererseits auch xnk → x0 gilt13) und konvergente Folgen h¨ ochstens einen Limes haben (Satz 3.1.4(i)), muss notwendig x0 = y0 sein, d.h. insbesondere ist x0 ∈ K. (ii) Sei x0 ∈ M vorgegeben. G¨abe es kein R ≥ 0 mit
∀ d(x, x ) ≤ R, 0
x∈K
so g¨ abe es insbesondere f¨ ur jedes n ∈ N ein xn ∈ K mit d(x0 , xn ) > n. Wir behaupten nun, dass (xn )n∈N keine konvergente Teilfolge enthalten kann. F¨ ur jedes y0 ∈ K (sogar f¨ ur y0 ∈ M ) ist n¨amlich n < d(xn , x0 ) ≤ d(xn , y0 ) + d(y0 , x0 ), 13) Teilfolgen
konvergenter Folgen konvergieren gegen denselben Limes: Das wurde in Satz 2.2.12(viii) gezeigt.
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
190
d.h., es gilt d(xn , y0 ) > n − d(x0 , y0 ). Ist n0 ∈ N so gew¨ ahlt, dass n0 gr¨ oßer als d(x0 , y0 ) + 1 ist (zum x-ten Mal verwenden wir hier das Archimedesaxiom), so gilt f¨ ur n ≥ n0 die Ungleichung d(xn , y0 ) ≥ 1, und damit kann y0 nicht Limes einer Teilfolge der (xn ) sein. Man h¨ atte Beschr¨ anktheit u onnen, dass ¨ brigens auch dadurch definieren k¨ man f¨ ur irgendein x0 ∈ M die Existenz eines R mit x ∈ K ⇒ d(x, x0 ) ≤ R fordert. Mit Hilfe der Dreiecksungleichung l¨ asst sich aber leicht einsehen, dass dadurch die gleichen Mengen als beschr¨ ankt definiert sind14) .
(iii) Sei (xn )n∈N eine Folge in K1 ∪ K2 . Notwendig ist dann eine der Mengen {n | xn ∈ K1 }, {n | xn ∈ K2 } unendlich, und daher muss es eine Teilfolge geben, die ganz in K1 oder in K2 liegt. Eine Teilfolge dieser Teilfolge ist nach Voraussetzung konvergent, und damit ist alles bewiesen: Der Limes liegt in K1 ∪ K2 , und eine Teilfolge einer Teilfolge von (xn ) ist wieder eine Teilfolge. (iv) Sei (xn )n∈N eine Folge in A. Das ist dann auch eine Folge in K, folglich gibt es ein x0 ∈ K und eine Teilfolge (xnk )k∈N mit xnk → x0 . Wegen Satz 3.1.7 geh¨ort x0 zu A, und das beweist die Behauptung. Es folgen die angek¨ undigten ersten nichttrivialen Beispiele f¨ ur kompakte R¨ aume: Satz 3.2.3. Sei K eine Teilmenge von R . K ist genau dann kompakt, wenn K beschr¨ankt und abgeschlossen ist. Insbesondere sind alle Intervalle [ a, b ] (mit a, b ∈ R ) kompakt. Beweis: Wegen Satz 3.2.2(i) und (ii) sind kompakte Mengen stets abgeschlossen und beschr¨ankt. F¨ ur den Beweis der Umkehrung geben wir K ⊂ R vor, wobei K beschr¨ ankt und abgeschlossen ist. Sei (xn )n∈N eine beliebige Folge in K, wir haben die Existenz einer (in K!) konvergenten Teilfolge zu zeigen. K −R
x1
x4
x3
x2
R
R
Bild 3.12: Die Menge K und eine Folge in K 14) Wenn man es ganz, ganz genau nimmt, stimmt das nicht: K = ∅ in M = ∅ ist nach der ersten Definition beschr¨ ankt, nach der zweiten nicht. Das ist aber auch schon das einzige Gegenbeispiel, auch sehr gr¨ undliche Mathematiker k¨ onnten diesen Einwand als spitzfindig bezeichnen.
3.2. KOMPAKTHEIT
191
Zun¨ achst gibt es ein R ≥ 0 mit K ⊂ [ −R, R ]. Wir teilen [ −R, R ] auf in [ −R, 0 ]∪[ 0, R ] und bezeichnen mit [ a1 , b1 ] irgendeines dieser beiden Intervalle, in dem unendlich viele xn liegen. n1 sei ein Index mit xn1 ∈ [ a1 , b1 ], dieses xn1 wird das erste Element der zu konstruierenden 'Teilfolge sein. & ' a1 +b1 & 1 Im n¨ achsten Schritt zerlegen wir [ a1 , b1 ] in a1 , a1 +b ∪ 2 2 , b1 . Unter [ a2 , b2 ] wollen wir wiederum eines dieser beiden Intervalle verstehen, das unendlich viele xn enth¨alt. Außerdem w¨ahlen wir ein n2 > n1 mit xn2 ∈ [ a2 , b2 ]. a1 a2
b1
R
b2 b3 b4
a3 a4 .. .
Bild 3.13: Konstruktion einer konvergenten Teilfolge Diese Konstruktion setzen wir induktiv fort. Wir erhalten so eine Teilfolge (xnk )k∈N von (xn )n∈N mit xnk ∈ [ ak , bk ], die eine Cauchy-Folge in R bildet. F¨ ur k ≥ l ist n¨amlich xnk ∈ [al , bl ], und somit gilt f¨ ur k, r ≥ l: |xnk − xnr | ≤ bl − al = (2R) · 2−l . −−→ 0. Nun ist nur noch zu beachten, dass 2−l −− l→∞ Wegen der Vollst¨ andigkeit von R gibt es ein x0 ∈ R mit xnk → x0 , und das liegt – da K nach Voraussetzung abgeschlossen ist – wegen Satz 3.1.7 in K. Bemerkungen: 1. Den wesentlichen Teil des Beweises bildete die Aussage: Jede beschr¨ ankte ” Folge in R besitzt eine konvergente Teilfolge.“ Dieses Ergebnis heißt auch der Satz von Bolzano-Weierstraß. 2. Unser Verdacht hat sich nun best¨atigt: Spieler S2 kann im Fall A = [ −1, 1 ] stets gewinnen. Der vorstehende Beweis liefert ihm sogar eine Gewinnstrategie ahlt werden kann). (wie n¨ amlich aus (xn )n∈N eine konvergente Teilfolge ausgew¨ 3. Wegen Satz 3.2.3 sind Teilmengen von R sehr leicht auf Kompaktheit zu u ufen. Versuchen Sie sich an R , Q , [ 0, 1 ] ∪ {3}, { n1 | n ∈ N } ∪ {0} und N . ¨ berpr¨ Das Kompaktheitskriterium f¨ ur R aus Satz 3.2.3 soll nun auf den Km u ¨ ber15) tragen werden . Als Vorbereitung ben¨otigen wir das
15) Ausnahmsweise verwenden wir in der Formulierung und im Beweis eine etwas ver¨ anderte Schreibweise: Die Elemente des Kn werden mit x usw. bezeichnet, damit man nicht Folgenindizes mit Komponenten eines Vektors verwechselt.
?
192
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Lemma 3.2.4. Sei m ∈ N und Km versehen mit der durch · ∞ induzierten m Metrik 16) . F¨ ur jedes n ∈ N sei xn = (x1n , . . . , xm vorgelegt. n)∈K ur alle i ∈ {1, . . . , m} (i) ( xn )n∈N ist genau dann konvergent, wenn (xin )n∈N f¨ konvergiert. (ii) Gibt es ein R ≥ 0 mit xn ∞ ≤ R f¨ ur alle n ∈ N , so besitzt ( xn )n∈N eine konvergente Teilfolge. m Beweis: (i) x0 := (x10 , . . . , xm sei ein beliebiger Vektor. F¨ ur jedes i in 0 ) ∈ K {1, . . . , m} ist dann i x0 − xin ≤ max xj − xjn = x0 − xn , 0 ∞ j=1,...,m
ur jedes i ∈ {1, . . . , m}. und das zeigt: xn → x0 impliziert xin → xi0 f¨ Umgekehrt gilt: m i x − xi . x0 − xn ∞ = max xi0 − xin ≤ 0 n i=1,...,m
i=1
(xin )n∈N
Ist also die Folge f¨ ur jedes i = 1, . . . , m gegen xi0 konvergent, so m i i folgt i=1 x0 − xn → 0, denn die Summe von m Nullfolgen ist nach Satz 2.2.12 wieder eine Nullfolge. Dann aber ist x0 − xn ∞ → 0, und das zeigt
xn → x0 . (ii) Die Beweisidee kann schon am Fall m = 1 und K = C verdeutlicht werden. Wir konzentrieren uns also zun¨achst auf diesen Spezialfall. Dazu sei (zn )n∈N eine Folge in C mit
∃ ∀ |z | ≤ R. n
R≥0 n∈N
Wir schreiben zn f¨ ur n ∈ N als zn = xn + iyn (mit xn , yn ∈ R ) und beachten, dass |xn | ≤ R, |yn | ≤ R f¨ ur alle n ∈ N gilt. ankte Folge in R erkannt ist, garantiert uns Da (xn )n∈N somit als beschr¨ Satz 3.2.3 in der Bolzano-Weierstraß-Fassung der Bemerkung 1 die Existenz einer konvergenten Teilfolge (xnk )k∈N . Achtung, nun kommt die entscheidende Stelle: Wir betrachten die y, aber nicht die ganze Folge (yn )n∈N , sondern nur die Teilfolge (ynk )k∈N (die nat¨ urlich nicht notwendig konvergent sein muss). Von dieser Teilfolge wissen wir, dass sie beschr¨ankt ist, eine nochmalige Anwendung von Satz 3.2.3 liefert uns die Existenz einer konvergenten Teilfolge dieser Teilfolge. Das st¨ urzt uns leider in a. schreiben, schreischreibtechnische Komplikationen, wir m¨ ussten (ynkl )l∈N o.¨ ben aber der Einfachheit halber nur (ynl )l∈N . Es ist dann (znl )l∈N eine konvergente Teilfolge der Ausgangsfolge, denn die (ynl )l∈N sind konvergent nach Konstruktion, und die Konvergenz von (xnl )l∈N – das ist eine Teilfolge von (xnk ) – ergibt sich aus der Tatsache, dass Teilfolgen konvergenter Folgen wieder konvergent sind. 16) Vgl.
die Beispiele zu Definition 3.1.2 auf Seite 170.
3.2. KOMPAKTHEIT
193
Im z
R
C
iyn
zn = xn + iyn Re z xn
Bild 3.14: Eine beschr¨ankte Folge in C Da das ziemlich kompliziert war, folgt hier der Versuch, die Beweisstruktur zu veranschaulichen. Es sind die Indizes skizziert, die f¨ ur die jeweils betrachtete Folge verwendet werden: So sehen die Indizes der Ausgangsfolge aus: ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗ ⊗··· Nun betrachten wir die x-Komponenten und w¨ ahlen daraus eine konvergente Teilfolge aus: ⊗
⊗
⊗
⊗⊗
⊗
⊗···
Von dieser Folge werden die zugeh¨ origen y-Komponenten untersucht, daraus wird eine konvergente Teilfolge gew¨ ahlt: ⊗
⊗
⊗
⊗···
Hier ein konkretes Beispiel: (zn ) = (1, i, −1, −i, 1, i, −1, −i, . . .). Die Folahlen als Teilfolge (0, 0, . . .), ge der (xn ) lautet hier: (1, 0, −1, 0, . . .). Wir w¨ lassen also jedes zweite Folgenglied weg. Die (ynk ) sind dann die (1, −1, . . .), uhrt. Insgesamt erh¨ alt man also die was uns – z.B. – zu (ynl ) = (1, 1, . . .) f¨ Teilfolge (znl ) = (xnl + iynl ) = (i, i, . . .) der Ausgangsfolge.
Damit wissen wir sowohl f¨ ur K = R als auch f¨ ur K = C : Jede beschr¨ ankte ¨ Folge in K enth¨ alt eine konvergente Teilfolge. Die Ubertragung auf den Km ist ¨ nun ganz ¨ ahnlich wie der vorstehend behandelte Ubergang von R zu C . Um die Idee nicht durch zu viel Technik zu versch¨ utten, beweisen wir mit P¨ unktchen“ statt durch vollst¨andige Induktion. ” Wir beginnen mit einer Folge (xn )n∈N des Km . Diese Folge soll beschr¨ ankt ur alle n ∈ N . sein, es soll also ein R > 0 so geben, dass xn ∞ ≤ R f¨
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
194
1 • 1. Schritt: Wir betrachten 1 die Folge (xn )n∈N der ersten Komponenten. Es handelt sich wegen xn ≤ xn ∞ um eine beschr¨ ankte Folge in K , sie enth¨alt also eine konvergente Teilfolge (x1nk1 )k1 ∈N .
• 2. Schritt: Nun wird die Folge (x2nk1 )k1 ∈N der zweiten Komponenten zu diesen Indizes untersucht: Sie ist beschr¨ ankt, man kann also eine konvergente Teilfolge (x2nk2 )k2 ∈N ausw¨ ahlen. • ... Verwendet man nun die Indizes der im m-ten Schritt erhaltenen Teilfolge zur Konstruktion einer Teilfolge ( xnkm )km ∈N von ( xn )n∈N , so sind wirklich alle Komponentenfolgen (also (x1nkm ), (x2nkm ), . . . ) konvergent als Teilfolgen konvergenter Folgen. alt wirklich eine konvergente Teilfolge. Zusammen mit (i) folgt: ( xn )n∈N enth¨ Satz 3.2.5 (Kompaktheit im Km ). Eine Teilmenge K des (Km , · ∞ ) ist genau dann kompakt, wenn sie beschr¨ankt und abgeschlossen ist. Beweis: Wegen Satz 3.2.2(i) und (ii) ist klar, dass kompakte Mengen beschr¨ ankt und abgeschlossen sind. Ist umgekehrt K beschr¨ankt und abgeschlossen, so folgt die Kompaktheit leicht aus Lemma 3.2.4 und Satz 3.1.7: Ist ( xn )n∈N eine Folge in K, so gibt es wegen 3.2.4(ii) ein x0 ∈ Km und eine Teilfolge ( xnk )k∈N mit xnk → x0 . Wegen Satz 3.1.7 muss x0 in K liegen. Das beweist die Kompaktheit von K. Bemerkungen: 1. Achtung: Dieses wichtige Kriterium f¨ ur Kompaktheit gilt nicht allgemein f¨ ur metrische R¨aume. So ist z.B. M in M mit der diskreten Metrik stets beschr¨ ankt und abgeschlossen, M ist jedoch nur im Falle endlicher M kompakt. 2. Aufmerksamen Lesern wird aufgefallen sein, dass wir uns auf dem Km mit der Betrachtung einer einzigen Norm (n¨ amlich · ∞ ) begn¨ ugt haben. Es ist aber ¨ eine leichte Ubungsaufgabe zu zeigen, dass die konvergenten Folgen in allen uns ur ( xn )n∈N , x0 ∈ Km gilt bekannten Normen des Km u ¨ bereinstimmen, d.h. f¨ xn − x0 ∞ → 0 ⇐⇒ xn − x0 1 → 0 ⇐⇒ xn − x0 2 → 0. Das liegt an einfachen Eigenschaften konvergenter Folgen: 1 m Sind (a1n ), . . . ,(am n ) Folgen positiver Zahlen, so geht (an + · · · + an )n∈N genau dann gegen Null, wenn die Folgen (a1n ), . . . ,(am n ) Nullfolgen sind. Und das ist genau dann der Fall, wenn die Folge max{a1n , . . . , am n } gegen Null geht. ¨ Das ist im Wesentlichen schon der Beweis f¨ ur die Aquivalenz der Konvergenz in || · ||1 und || · ||∞ .
Folglich f¨ uhren alle diese Normen zu den gleichen kompakten Mengen. Man kann sogar zeigen, dass alle Normen des Km zu den gleichen konvergenten Folgen f¨ uhren, so dass in allen Normen die gleichen Mengen kompakt sind17) ; vgl. Abschnitt 8.1 in Band 2. 17) Das gilt nur im Km , auf unendlich-dimensionalen R¨ aumen gibt es viele wirklich verschiedene Normen.
3.2. KOMPAKTHEIT
195
Da auch die beschr¨ankten Mengen f¨ ur alle Normen u ¨bereinstimmen, ergibt sich: Ist · irgendeine Norm auf dem Km , so ist K ⊂ Km in (Km , · ) genau dann kompakt, wenn K beschr¨ankt und abgeschlossen ist. Damit ist das Thema Kompaktheit“ f¨ urs Erste beendet. Es gibt aber noch ” zwei Erg¨anzungen. Erstens soll gezeigt werden, wie man durch Hinzunahme geeigneter Punkte und die richtige“ Definition von Konvergenz die Menge R ” der reellen Zahlen zu einem Raum erg¨anzen kann, der sich wie ein kompakter Raum verh¨ alt. Und zweitens wird noch ein alternativer Zugang erl¨ autert, der f¨ ur die Analysis nur eine untergeordnete Rolle spielt, an dem man aber nicht vorbeikommt, wenn man auch in sp¨ateren Semestern Kompaktheitsargumente verwenden m¨ ochte. Die Kompaktifizierung der reellen Zahlen Das Unendliche!“ Es durchzuckte T¨ orleß wie mit einem Schlage, dass ” an diesem Wort etwas furchtbar Beunruhigendes hafte. Etwas u ¨ber den Verstand Gehendes, Wildes, Vernichtendes schien durch die Arbeit irgendwelcher Erfinder eingeschl¨ afert worden zu sein und war nun pl¨ otzlich aufgewacht. (aus: Die Verwirrungen des Z¨ oglings T¨ orleß“ von Robert Musil.) ”
Schon bei einfachen theoretischen Untersuchungen zur L¨ angen- oder Fl¨ achenmessung ergibt sich das Problem, dass gewisse L¨angen (z.B. die L¨ ange von ” R“) oder Fl¨ achen (etwa die Fl¨ache des R2“) sinnvollerweise nur als unendlich ” ” groß“ bezeichnet werden k¨onnen. Um derartige Fragen pr¨ azise behandeln zu k¨ onnen, gehen wir wie folgt vor: Wir w¨ ahlen zwei Elemente +∞ und −∞, die voneinander verschieden sind und nicht zu R geh¨oren; anschließend definieren wir:
±∞
ˆ := {−∞} ∪ R ∪ {+∞} R ˆ (gesprochen R Dach“) heißt die Zweipunktkompaktifizierung von R ” ˆ R , wir stellen uns R vor als −∞
R
+∞
ˆ als Zahlenstrahl“ Bild 3.15: Skizze von R ” ˆ Es ist dann m¨ oglich, Teile der von R bekannten Strukturen auf R fortzusetzen: ˆ definiere man • Die Ordnung: F¨ ur x, y ∈ R ⎧ ⎨ x, y ∈ R und x ≤ y Definition oder x = −∞ x ≤ y ⇐⇒ ⎩ oder y = +∞.
ˆ R
196
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT ˆ , und diese Ordnung ≤“ ist dann wirklich eine Ordnungsrelation18) auf R ” stimmt nach Definition auf R mit der dort definierten Ordnung u ¨ berein. (Beispiele: Es ist 30000 ≤ +∞, −∞ ≤ +∞, und −3 ≤ −2 gilt nach wie vor.)
• Die algebraische Struktur: +“ und ·“ k¨ onnen nicht sinnvoll zu inneren ” ” ˆ fortgesetzt Kompositionen f¨ ur R werden. Wir definieren nur: ◦ x + (+∞) := (+∞) + x := +∞ f¨ ur alle x ∈ R , ◦ x + (−∞) := (−∞) + x := −∞ f¨ ur alle x ∈ R , ◦ (+∞) + (+∞) := +∞, ◦ (−∞) + (−∞) := −∞, ◦ x · (+∞) := (+∞) · x := +∞ f¨ ur x ∈ R , x > 0, ◦ x · (+∞) := (+∞) · x := −∞ f¨ ur x ∈ R , x < 0, ◦ x · (−∞) := (−∞) · x := −∞ f¨ ur x ∈ R , x > 0, ◦ x · (−∞) := (−∞) · x := +∞ f¨ ur x ∈ R , x < 0, ◦ (+∞) · (+∞) := (−∞) · (−∞) := +∞, ◦ (+∞) · (−∞) := (−∞) · (+∞) := −∞. ˆ ×R ˆ definiert sind, Beachten Sie also, dass weder +“ noch ·“ auf ganz R ” ” ˆ zum Beispiel ist nicht festgelegt, was 0 · (+∞) sein soll. Die Frage, ob R ein K¨orper ist, ist folglich sinnlos. Man kann die Definitionen nicht einmal so erg¨ anzen, dass ein K¨ orper entsteht. In K¨ orpern darf man n¨ amlich k¨ urzen, und sicher geht das mit +∞ nicht: Es ist 2 · (+∞) = 3 · (+∞), aber man darf daraus nicht auf 2 = 3 schließen.
ˆ und a ∈ R , so definieren wir • Konvergenz: Ist (an )n∈N eine Folge in R an → a
⇐⇒ Def.
∀ ∃ ∀ a ∈ R und |a ∀ ∃ ∀ a ≥ R, ∀ ∃ ∀ a ≤ R. n
n
− a| ≤ ε,
ε>0 n0 ∈N n≥n0
an → +∞
⇐⇒ Def.
n
R∈R n0 ∈N n≥n0
an → −∞
⇐⇒ Def.
n
R∈R n0 ∈N n≥n0
Alle mit Konvergenz“ zusammenh¨ angenden Schreibweisen werden eben” falls
u ¨ bernommen (so bedeutet etwa lim an = a das Gleiche wie an → a, ∞ und n=1 an = a heißt, dass alle Partialsummen definiert sind und gegen a konvergieren). 18) Vgl. die Definition auf Seite 124. Der Nachweis der entsprechenden Eigenschaften ist Routine.
3.2. KOMPAKTHEIT
197
1 Hier einige Beispiele: Die Aussage ∞ n=1 n = +∞ folgt aus der Divergenz der harmonischen Reihe; lim n = +∞ ist nichts weiter als eine Umformulierung des Archimedesaxioms; die Folge (+∞, +∞, 1, 12 , 13 , . . .) konˆ vergiert gegen Null und ihre Reihensumme ist gleich +∞; (−n)n ist in R nicht konvergent, . . . Was heißt divergent“? ” Eine Folge oder Reihe heißt bekanntlich divergent, wenn sie nicht konvergent ist. Da wir mittlerweile verschiedene Konvergenzbegriffe kennen gelernt haben, sind Missverst¨andnisse nicht ausgeschlossen. So ist zum Beispiel die harmonische Reihe 1+
1 1 1 + + + ··· 2 3 4
ˆ ist sie aber konvergent, die Reihensumme ist in R divergent, in R ˆ konvergent“ sagen manche Autoren u +∞. Statt in R ¨ brigens un” eigentlich konvergent. Es ist nun nicht schwer zu zeigen, dass viele der aus R bekannten Resultate ˆ u auf R ¨ bertragen werden k¨onnen. Z.B. folgt aus an → a und bn → b, dass an + bn → a + b, falls alle auftretenden Summen definiert sind. ˆ nur Ans¨atze einer algebraischen Struktur tr¨ Der Nachteil, dass R agt, wird durch die Verbesserung von Ordnungs- und Konvergenzstruktur ausgeglichen: ˆ gilt: Satz 3.2.6. In R (i) Jede Teilmenge hat ein Supremum und ein Infimum. (ii) Jede Folge enth¨alt eine konvergente Teilfolge. ˆ , wir beweisen die Existenz von sup A. Beweis: (i) Sei A eine Teilmenge von R (F¨ ur das Infimum ist der Beweis dann analog.) Ist A = ∅, so sind wir schnell fertig, denn dann ist sup A = −∞ (falls das nicht klar ist, sollten Sie zum Kasten auf Seite 127 und die anschließende Diskussion von sup ∅ zur¨ uckbl¨attern). Wir nehmen nun an, dass A nicht leer ist und betrachten die folgenden F¨alle: • A = {−∞}. • A enth¨ alt Elemente aus R , und es gibt ein R ∈ R mit der Eigenschaft: x ≤ R f¨ ur alle x ∈ A. • Es gibt kein R ∈ R mit x ≤ R (alle x ∈ A). Im ersten Fall ist wieder sup A = −∞. Im zweiten ist Satz 2.3.6 heranzuziehen, nach dem jede nicht leere, nach oben beschr¨ankte Teilmenge von R ein Supremum hat: Wir wenden ihn auf die Menge A ∩ R an und m¨ ussen nur noch nachrechnen, dass im vorliegenden Fall sup A = sup (A ∩ R ) gilt. Im letzten Fall ist sicher sup A = +∞, da +∞ die einzige obere Schranke ist.
198
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
(ii) Auch dieser Beweis wird durch Fallunterscheidung gef¨ uhrt. Ist (xn ) eine ˆ , so betrachten wir die folgenden F¨ Folge in R alle: ur unendlich viele n ist • F¨ ur unendlich viele Indizes n ist xn = −∞, oder f¨ xn = +∞. • Von einem n0 an sind alle xn in R , und diese xn liegen in einem Intervall [ −R, R ]. • Die xn liegen in R f¨ ur n ≥ n0 , und die xn sind nach oben unbeschr¨ ankt. • Wie vorstehend, aber die xn sind nach unten unbeschr¨ ankt. Im ersten Fall gibt es eine Teilfolge, die sogar konstant ist und gegen −∞ (oder gegen +∞) konvergiert. Im zweiten Fall findet man eine konvergente Teilfolge aufgrund der Kompaktheit von [ −R, R ]. Im dritten liefert die Unbeschr¨ anktheit nach oben eine Teilfolge mit Limes +∞, und im letzten Fall schließlich k¨ onnen wir die Existenz einer Teilfolge garantieren, die gegen −∞ konvergiert. ∞, +∞ oder −∞ In diesem Buch wurde versucht, zwischen dem Symbol ∞ und den verallgemeinerten Zahlen ±∞ zu unterscheiden. 1. Das Zeichen ∞“ wird ohne jegliche inhaltliche Bedeutung ver” wendet, es ist eigentlich entbehrlich. Im Fall (an )n=1,...,∞“ soll ” nur ausgedr¨ uckt werden, dass die Indizes n beliebig groß werden k¨onnen, ganz genauso k¨ onnte man ∞“ in Ausdr¨ ucken der
” ∞ an“ einfach weglassen. Form limn→∞ an = a“ oder n=1 ” ” Auch in der Definition f ist unendlich oft differenzierbar, falls . . .“ ” ist das unendlich“ nur eine Abk¨ urzung: F¨ ur alle n existiert die n-te ” Ableitung. 2. Im Gegensatz dazu bedeuten die Zeichen +∞ und −∞ wirklich etwas. Es sind verallgemeinerte Zahlen, mit denen man fast genauso rechnen darf wie mit reellen Zahlen. Ein alternativer Zugang zur Kompaktheit Es wurde schon betont, dass Beweistechniken, die die Kompaktheit einer Menge ausnutzen, eine ganz wesentliche Rolle spielen werden und dass es dazu vom n¨achsten Abschnitt an immer wieder Beispiele geben wird. Der Vollst¨ andigkeit halber soll hier noch angemerkt werden, dass unser“ Kompaktheitsbegriff ” nur den Spezialfall einer allgemeineren Definition darstellt. Er ist f¨ ur die Behandlung metrischer R¨aume v¨ollig ausreichend, doch werden in weiterf¨ uhrenden Vorlesungen auch andere Konzepte von N¨ ahe“ ben¨ otigt. Auf Einzelheiten, die ” Gegenstand der Vorlesung Topologie sind, soll hier nicht eingegangen werden. Nur soviel: Dort wird Kompaktheit statt mit Eigenschaften von Folgen mit Eigenschaften offener Mengen eingef¨ uhrt. Dass das im Fall metrischer R¨ aume zum gleichen Ergebnis f¨ uhrt, ist die Aussage des folgenden Satzes, dessen Beweis wir den Kollegen aus der Topologie u ¨ berlassen:
3.3. STETIGKEIT
199
Satz 3.2.7. Sei (M, d) ein metrischer Raum und K ⊂ M . Dann ist K genau dann kompakt, wenn gilt: ¨ Ist O ⊂"P(M ) eine offene Uberdeckung von K (d.h. jedes O ∈ O ist offen und es ist O ⊃ K), so existieren O1 , . . . , On ∈ O mit K ⊂ O1 ∪ · · · ∪ On . Aus ¨ jeder offenen Uberdeckung von K l¨asst sich also eine endliche Teil¨ uberdeckung ausw¨ahlen.
3.3
Stetigkeit Die Philosophie steht in diesem großen Buch geschrieben, dem Universum, das unserem Blick st¨ andig offen liegt. Aber das Buch ist nicht zu verstehen, wenn man nicht zuvor die Sprache erlernt und sich mit den Buchstaben vertraut gemacht hat, in denen es geschrieben ist. Es ist in der Sprache der Mathematik geschrieben, und deren Buchstaben sind Kreise, Dreiecke und andere geometrische Figuren, ohne die es dem Menschen unm¨ oglich ist, ein einziges Wort davon zu verstehen; ohne diese irrt man in einem dunklen Labyrinth herum. (Galileo Galilei, Il Saggiatore“, 1623) ”
Zun¨ achst diskutieren wir die Frage, wie Mathematik angewendet wird: Mathematik und Realit¨ at Wie wird Mathematik angewendet? Die Grundidee ist uns allen aus vielen Lebensbereichen vertraut, es handelt sich n¨ amlich um die ¨ Ubersetzung in eine dem Problem angemessene Sprache. Das kennt jeder: Wenn ich in Paris auf dem Flughafen ankomme und wissen m¨ ochte, wo die Taxis sind, u ¨ bersetze ich das Problem einem Einheimischen ins Franz¨osische. Der kann es hoffentlich l¨ osen, und bald bin ich in meinem Hotel. Mit den Anwendungen von Mathematik verh¨alt es sich genauso. Da gibt es ein Problem der realen Welt, das wird in die Sprache der Mathematik u uck¨ ubersetzung der ¨ bersetzt, dort gel¨ost, und die R¨ mathematischen L¨osung ist dann hoffentlich von Nutzen. Das wird auch schon in der Schule ausgiebig behandelt, da heißt es Textauf” gaben“, und die sind – eigentlich zu Unrecht – ziemlich unbeliebt. Schematisch kann man sich das so vorstellen nichtmathematischer Bereich mathematischer Bereich
P
u ¨ bertragen
osen l¨
P
L
r¨ uck¨ ubertragen
L
Bild 3.16: Skizze: L¨osung eines nichtmathematischen Problems
200
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Es ist klar, dass in diesem Schema nicht alle Aspekte des Themas wiedergegeben sein k¨onnen. Deswegen gibt es noch einige Kommentare: 1. Der Schritt vom Ausgangsproblem zum mathematischen Problem ist besonders heikel. Erstens muss man viele Feinheiten weglassen, entweder, weil man es so genau gar nicht wissen will, oder auch um sp¨ ater u ¨ berhaupt eine Chance zu haben, eine mathematische L¨osung anbieten zu k¨ onnen. (Also: keine sph¨ arische Trigonometrie zur Vermessung eines Schrebergartens!) Das beinhaltet schon – teilweise unbewusste – Vorentscheidungen: Welche Aspekte des Problems sind wichtig, welche vernachl¨assigbar? ¨ Zweitens ist es mit einer bloßen Ubersetzung in mathematische Termini nicht getan, es muss immer noch eine Theorie ¨ uber die Welt dazu kommen. Wenn man ¨ zum Beispiel den Fall einer Kugel beschreiben will, landet man beim Ubersetzen bei einer Funktion der Zeit (f (t) := zur¨ uckgelegter Weg nach t Zeiteinheiten). Erst durch Hinzunahme der Newtonschen Gesetze wird daraus wirklich ein mathematisches Problem: Was l¨asst sich u ¨ ber eine Funktion aussagen, deren zweite Ableitung konstant ist? 2. Zum Schritt Vom mathematischen Problem zur L¨ osung“ ist inhaltlich be” liebig viel zu sagen, das ist das, was man im Mathematikstudium lernt. Alles M¨ogliche kann zum Einsatz kommen: Lineare Algebra, um Gleichungssysteme zu l¨osen, Theorie der Differentialgleichungen, Wahrscheinlichkeitstheorie, . . . Im Grunde kann jedes mathematische Ergebnis bei diesem Schritt irgendwann einmal eine Rolle spielen. Zu beachten ist auch, dass numerische Methoden und der Einsatz von Computern eine große Rolle spielen, besonders dann, wenn exakte Verfahren wegen der Komplexit¨ at des Problems nicht eingesetzt werden k¨onnen. 3. Um die mathematische L¨osung zur¨ uckzu¨ ubersetzen, muss man nur das Lexikon aus dem ersten Schritt r¨ uckw¨ arts lesen. Es ist dann aber u ¨berhaupt nicht selbstverst¨andlich, dass man das Ausgangsproblem wirklich gel¨ ost hat. Vielleicht waren die Vereinfachungen doch zu grob, vielleicht stimmte die Theorie, die zur uhrt hat, auch einfach nicht. mathematischen Pr¨azisierung gef¨ Dann heißt es: Noch einmal von vorn mit einem verbesserten Ansatz und/oder einer modifizierten Theorie u ¨ber die Welt. 4. Warum klappt das? Dass es funktioniert, ist offensichtlich, die Erfolge des mathematischen Ansatzes sind u altigend. Aber warum? Viele philosophi¨ berw¨ sche Theorien haben eine Erkl¨arung versucht, der Rationalismus, der Positivismus und etliche andere -ismen. An dieser Stelle kann darauf nicht eingegangen werden, Interessenten finden eine ausf¨ uhrliche Diskussion im Buch What is ” Mathematics, Really“ von Reuben Hersh (Oxford University Press, 1999). ¨ Die vorstehenden Uberlegungen haben eine wichtige Konsequenz: Ist man daran interessiert, Analysis unter Ber¨ ucksichtigung der Bed¨ urfnisse der Anwendungen zu betreiben, so muss man sich besonders um diejenigen mathematischen ¨ Objekte bem¨ uhen, die h¨aufig beim Ubergang P → P auftreten.
3.3. STETIGKEIT
201
Funktionen spielen dabei offenbar eine wichtige Rolle: • Die Bewegung eines Massenpunktes kann durch eine Funktion x : R → R3 beschrieben werden, wo x(t) := der Ort des Teilchens, beschrieben in einem geeigneten festen Koordinatensystem, zum Zeitpunkt t ist. • Die Temperaturverteilung in einem K¨orper K gibt Anlass zu einer Funktion T : K × R → R , wo T ( k, t) := Temperatur in k zur Zeit t. • ... Nach diesen Vorbemerkungen beginnen wir nun mit der Untersuchung stetiger Funktionen. Das sind – grob gesagt – Funktionen f : M → N , f¨ ur die f (m) azise nahe bei“ f (m0 ) liegt, wenn nur m nahe genug bei“ m0 liegt. Eine pr¨ ” ” Formulierung folgt gleich, zun¨achst betrachten wir zur Illustration einige nichtmathematische Beispiele: • Sei R ein Kuchenrezept, f¨ ur das die Zutaten Z1 , . . . , Zn in den Mengen otigt werden. Dann wird Ihr Kuchen unter der Verwendung m1 , . . . , mn ben¨ der Mengen (m1 , . . . , mn ) nicht wesentlich anders schmecken, als wenn Sie die vorgeschriebenen (m1 , . . . , mn ) verwendet h¨ atten, wenn nur die mi nahe bei den mi liegen (Sie also etwa statt 200g Zucker versehentlich nur 199.5g nehmen). Kurz: Der Geschmack eines Kuchens ist eine stetige Funktion der Mengen azise aufgefasst wird. (m1 , . . . , mn ) der Zutaten, wobei stetig“ noch unpr¨ ” • Bei einer Mischbatterie ist die Temperatur des ausfließenden Wassers eine stetige Funktion der Stellungen von Kalt- und Warmwasserhahn. • Betrachten Sie nun eine Ampel und die Funktion f :R t
→ R 0
→ 1
falls die Ampel zur Zeit t Rot“ zeigt, ” sonst.
Konzentrieren Sie sich auf einen Zeitpunkt t0 , zu dem die Ampel auf Rot umschaltet. In diesem Fall kann nun nicht mehr garantiert werden, dass f (t) f¨ ur alle t nahe bei“ f (t0 ) ist, die nahe bei“ t0 sind; das stimmt zwar ” ” ur die t < t0 . f¨ ur die t mit t > t0 , nicht aber f¨ Das zeigt, dass dieses f nicht stetig ist. Versuchen Sie, weitere Situationen aus Ihrem Erfahrungsbereich zu finden, bei ¨ ¨ denen kleine“ Anderungen der Eingangsparameter auch nur kleine“ Anderun” ” gen der Ausgangswerte zur Folge haben. Nun soll Stetigkeit“ definiert werden. Dazu muss man lediglich wissen, was ” Abstand“ ist, und deswegen behandeln wir gleich den Fall beliebiger metrischer ” R¨ aume. Wir gehen von einer Abbildung f : M → N aus, wobei M und N
202
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
metrische R¨aume sind. Da die Metrik von M mit der von N im Allgemeinen nichts zu tun haben wird, k¨onnen wir nicht einfach d“ f¨ ur beide Metriken ” schreiben: Wir werden mit dM die Metrik in M und mit dN die Metrik in N bezeichnen. Definition 3.3.1. (M, dM ) und (N, dN ) seien metrische R¨aume und f von M nach N eine Abbildung. stetig
ur jedes positive ε ein positives (i) F¨ ur x0 ∈ M heißt f stetig bei x0 , wenn f¨ δ existiert, so dass f¨ ur alle x ∈ M mit dM (x, x0 ) ≤ δ die Ungleichung dN (f (x), f (x0 )) ≤ ε gilt. Mit Quantoren: dM (x, x0 ) ≤ δ ⇒ dN f (x), f (x0 ) ≤ ε.
∀∃∀
ε>0 δ>0 x∈M
(ii) f heißt stetig auf M , wenn f stetig bei x0 f¨ ur alle x0 ∈ M ist. Bemerkungen: 1. Das Gegenteil von f ist stetig bei x0“ ist offensichtlich ” dN f (x), f (x0 ) > ε0 .
∃ ∀ ∃
ε0 >0 δ>0
?
x∈M dM (x,x0 )≤δ
Wenn Sie also davon u ¨ berzeugt sind, dass eine konkret gegebene Funktion bei einem x0 nicht stetig ist, so haben Sie ein ε0 > 0 mit den entsprechenden Eigenschaften anzugeben. Um ein derartiges ε0 zu finden, ist – wie im entsprechenden Fall der Aussage (xn )n∈N ist keine Nullfolge“ – eine Skizze h¨ aufig hilfreich. ” Welches ε0 etwa k¨onnen Sie als Versager-ε“ w¨ ahlen, um zu zeigen, dass die ” nachstehend skizzierte Funktion bei x0 = 0 nicht stetig ist? R 2 1 0
R
Bild 3.17: Eine unstetige Funktion 2. Viele zum Konvergenzbegriff gemachte Bemerkungen w¨ aren hier sinngem¨ aß zu wiederholen, etwa • Zum Nachweis der Stetigkeit ist ein aus p folgt q“-Beweis zu f¨ uhren. Sie ” haben also bei vorgelegtem ε > 0 ein δ > 0 mit den gew¨ unschten Eigenschaften anzugeben und d¨ urfen – neben den definierenden Eigenschaften von f – nur die Tatsache ε > 0“ dazu heranziehen. ”
3.3. STETIGKEIT
203
• Falls Ihnen die ε-δ-Definition der Stetigkeit Schwierigkeiten macht, ist f¨ ur den Anfang Auswendiglernen empfehlenswert: f heißt stetig bei x0 , wenn ” . . .“ 3. In Worten (und einigen mathematisch irrelevanten Zus¨ atzen) bedeutet f ” ist stetig bei x0“ gerade: Wie auch immer eine noch so kleine (aber positive) Toleranzgrenze ε um f (x0 ) vorgeschrieben wird, so ist es m¨ oglich, ein δ > 0 zu finden, dass alle x mit dM (x, x0 ) ≤ δ die Bedingung dN f (x), f (x0 ) ≤ ε erf¨ ullen. Je nachdem, wie wir uns M und N vorstellen, gibt es die folgenden M¨ oglichkeiten zur Veranschaulichung der Definition: M N f
δ
Kδ (x0 )
x
f (x)
ε
x0
f (x0 )
Kε (x0 )
Bild 3.18: Stetige Funktion f , Darstellung im Mengendiagramm
N ⊂R
f
ε ε
f (x0 ) f (x)
x x0 δ δ
M ⊂R
Bild 3.19: Stetige Funktion f : Darstellung im Graphen 4. Als Merkregel zur Stetigkeit findet man in manchen Schulb¨ uchern die Cha” rakterisierung“:
204
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT Eine Funktion f : [ a, b ] → R ist stetig, wenn sie sich ohne abzusetzen zeichnen l¨asst.
Das ist ziemlich problematisch, denn erstens ist nicht klar, was das eigentlich genau heißen soll, und zweitens gibt es derart pathologische stetige Funktionen, dass jeder Zeichenversuch in diesen F¨ allen kl¨ aglich scheitern w¨ urde. Trotzdem muss zur Ehrenrettung dieser unter Mathematikern ge¨ achteten Merkregel gesagt werden, dass man durch sie in allen praktisch wichtigen F¨ allen zu einer Vermutung (stetig oder nicht stetig?) gef¨ uhrt wird. Das kann nat¨ urlich einen Beweis nie ersetzen.
Umgebung
?
Lokale und globale Eigenschaften Mal angenommen, es geht um die Eigenschaften eines Punktes x0 in einem metrischen Raum. Manchmal kommt es vor, dass man die fragliche Bedingung schon dann nachpr¨ ufen kann, wenn man nur ur ein beliebig kleines die Informationen f¨ ur die x mit d(x, x0 ) ≤ ε f¨ ε hat. (Ein Beispiel daf¨ ur ist die Eigenschaft: Die Funktion f ist ” stetig bei x0“.) Solche Eigenschaften heißen lokal , alle anderen global (wie zum Beispiel die Eigenschaft bei x0 nimmt f den gr¨ oßten Wert ” an“). Wenn man es etwas unseri¨ os ausdr¨ ucken m¨ ochte: Lokale Aussagen k¨onnen auch von kurzsichtigen Mathematikern untersucht werden. In diesem Zusammenhang soll noch eine neue Vokabel eingef¨ uhrt werden: Ist (M, d) ein metrischer Raum, x0 ∈ M und A ⊂ M , so heißt A eine Umgebung von x0 , wenn es ein ε > 0 so gibt, dass Kε (x0 ) ⊂ A. Lokale Eigenschaften sind also solche, die auf jeder Umgebung nachgepr¨ uft werden k¨onnen. Machen Sie sich auch klar, dass man mit Hilfe dieses neuen Begriffs sagen kann: Eine Teilmenge ist genau dann offen, wenn sie Umgebung jedes ihrer Punkte ist. 5. Wie u onnen auch in der Abteilung Stetigkeit“ ¨berall in der Mathematik, k¨ ” nur sinnvolle Fragen auf wahr“ oder falsch“ hin untersucht werden. ” ” So ist die Aussage x → 1/x ist bei x = 0 unstetig“ ” weder wahr noch falsch, sondern schlicht sinnlos (denn 0 geh¨ ort nicht zum Definitionsbereich dieser Funktion). Richtig ist allerdings: Ist f : R → R irgendeine Funktion mit f (x) = 1/x f¨ ur x = 0, so ist f bei 0 unstetig, egal, wie f (0) definiert wurde. (K¨onnen Sie das beweisen?) Wir kommen nun zu Beispielen f¨ ur stetige Funktionen. Zwei Beispielklassen lassen sich f¨ ur beliebige metrische R¨ aume betrachten, n¨ amlich erstens die konstanten Funktionen und zweitens die identischen Abbildungen. Eine Funktion f : M → N heißt konstant , wenn f f¨ ur ein geeignetes y0 ∈ N die Form x → y0 hat. Es ist leicht zu sehen, dass derartige
3.3. STETIGKEIT
205
Funktionen stetig sind, zu vorgelegtem ε > 0 kann man z.B. δ := 1 oder irgendeine andere positive Zahl w¨ahlen. Unter der Identit¨at auf dem metrischen Raum (M, d) versteht man die Abbildung f : M → M , x → x. Auch diese Abbildung ist stetig, man kann zu vorgegebenem ε > 0 als δ die Zahl ε w¨ ahlen. (Bemerkenswerterweise gibt es metrische R¨aume, f¨ ur die damit schon alle stetigen Abbildungen von M nach M beschrieben sind: Es gibt dort die Identit¨at und die konstanten Abbildungen, aber keine weiteren stetigen Funktionen. Das ist klar f¨ ur einpunktige R¨ aume, es gibt aber auch ziemlich komplizierte kompakte unendliche Teilmengen von R2 mit dieser Eigenschaft.) Wesentlich interessantere Beispiele werden durch die n¨ achste Definition beschrieben (die u ¨brigens die beiden eben betrachteten Klassen als Spezialfall enth¨ alt): Definition 3.3.2. Eine Funktion f : M → N heißt Lipschitzabbildung, falls es ein L ≥ 0 gibt, so dass dN f (x), f (y) ≤ L · dM (x, y).
∀
x,y∈M
Ein solches L heißt eine Lipschitzkonstante f¨ ur f 19) . In R bedeutet die Lipschitzbedingung, dass f (x) − f (y) ≤L x−y gilt, dass also der Betrag der Sekantensteigungen durch L beschr¨ ankt ist. Deswegen kann man sich in diesem Fall das Erf¨ ulltsein der Lipschitzbedingung so veranschaulichen: Ge rad e
de
rS tei gu n
e rad Ge
g− L
x
de
r
n igu Ste
y
L g+
R
Bild 3.20: Lipschitzbedingung in R : |f (x) − f (y)| ≤ L|x − y| 19) Achtung:
Eine Lipschitzabbildung hat viele Lipschitzkonstanten, mit jedem L ist auch L Lipschitzkonstante, falls L ≤ L .
Lipschitzabbildung
206
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Satz 3.3.3. Lipschitzabbildungen sind stetig. Beweis: Sei x0 ∈ M und ε > 0. Wir haben ein δ > 0 zu finden, so dass dN f (x), f (x0 ) ≤ ε f¨ ur alle x mit dM (x, x0 ) ≤ δ. Als Vor¨ uberlegung schreiben wir die Lipschitzbedingung noch einmal auf: dN f (x), f (x0 ) ≤ L dM (x, x0 ). Die linke Seite soll ≤ ε werden, falls dM (x, x0 ) ≤ δ ist, und das legt den Versuch δ := ε/L nahe. Um im Fall L = 0 keine Probleme zu bekommen, versuchen wir es mit δ := ε/(L + 1).
Man w¨ahle δ := ε/(L + 1). F¨ ur x ∈ M mit dM (x, x0 ) ≤ δ ist dann wirklich: ε ≤ ε. dN f (x), f (x0 ) ≤ LdM (x, x0 ) ≤ L L+1 Viele der schon fr¨ uher aufgetretenen Abbildungen sind Lipschitzabbildungen und somit stetig: • Versieht man den Km mit · ∞ , so ist pi : K m → K (x1 , . . . , xm ) → xi f¨ ur jedes i ∈ {1, . . . , m} stetig. pi ist diejenige Abbildung, die einem Vektor x = (x1 , . . . , xm ) die i-te Komponente zuordnet. Die Stetigkeit ergibt sich so: Wegen |pi (x) − pi (y)| = |xi − yi | ≤ x − y∞ ist pi eine Lipschitzabbildung mit Lipschitzkonstante 1 und daher nach dem vorstehenden Satz stetig. (Genauso ergibt sich die Stetigkeit der pi , wenn man den Km mit · 1 oder · 2 versieht.) • Ist (X, · ) irgendein normierter Raum, so gilt f¨ ur x, y ∈ X stets: x y
= =
x − y + y ≤ x − y + y y − x + x ≤ y − x + x
und folglich wegen y − x = x − y : x − y ≤ x − y. Das aber bedeutet gerade, dass · : X → R eine Lipschitzabbildung (mit Lipschitzkonstante 1) und als solche stetig ist20) . 20) Allgemeiner gilt: Ist (M, d) ein metrischer Raum und x ∈ M , so ist die Abstandsfunk0 tion x → d(x, x0 ) eine Lipschitzabbildung mit Lipschitzkonstante 1 und folglich stetig. Die Ungleichung |d(x, x0 ) − d(y, x0 )| ≤ d(x, y) beweist man wie im vorstehenden Beispiel normierter R¨ aume, sie ergibt sich durch Umstellen der Dreiecksungleichungen d(x, x0 ) ≤ d(x, y) + d(y, x0 ) und d(y, x0 ) ≤ d(y, x) + d(x, x0 ).
3.3. STETIGKEIT
207
• Es seien x, y > 0, und L > 0 sei so gew¨ahlt, dass x, y ≥ 4/L2 gilt. Aus der Gleichung √ √ √ √ ( x − y)( x + y) = x − y folgt dann die Absch¨atzung
√ x − √y = √ 1 √ |x − y| ≤ L|x − y|, x + y √ und 'damit ist x' → x eine Lipschitzabbildung mit Lipschitzkonstante L auf 4/L2 , +∞ . Da f¨ ur den Nachweis der Stetigkeit bei x0 > 0 nur die Werte der Funktion auf irgendeinem Intervall eine Rolle spielen, das x0 im Inneren enth¨ alt, √ ist. (Sie ist zeigt das, dass x → x im Bereich x > 0 eine stetige Funktion √ auch bei 0 stetig: Das zeigt man genauso, wie man lim 1/ n = 0 beweist.) Nachdem nun hoffentlich hinl¨anglich klar ist, was Stetigkeit bedeutet und warum wir an diesem Begriff interessiert sind, soll die Struktur des weiteren Vorgehens erl¨ autert werden. Als Erstes werden wir Kriterien kennen lernen, die zur Stetigkeit ¨ aquivalent sind. Von besonderer Bedeutung f¨ ur die weiteren Untersuchungen wird dabei eine Charakterisierung sein, die Stetigkeit auf Eigenschaften konvergenter Folgen zur¨ uckf¨ uhrt. Dadurch werden die Ergebnisse aus Kapitel 2 verf¨ ugbar sein. Danach beweisen wir Permanenzeigenschaften. Es wird sich zeigen, dass bei allen uns bekannten Verkn¨ upfungen von Funktionen (die u ¨ berhaupt sinnvoll definiert werden k¨onnen) aus stetigen Funktionen wieder stetige Funktionen entstehen. Schließlich untersuchen wir Eigenschaften stetiger Funktionen f¨ ur wichtige Spezialf¨alle. Ist etwa N = R , so impliziert die Stetigkeit von f im Falle M = [ a, b ] bzw. im allgemeineren Fall kompakter M sehr h¨ aufig anzuwendende Existenzaussagen (Zwischenwertsatz, Satz vom Maximum, . . . ). F¨ ur die Formulierung des n¨achsten Satzes ben¨otigen wir noch eine Bezeichnung aus der Mengenlehre. Ist f := M → N eine Abbildung und A ⊂ N , so heißt f −1 (A) := {x | x ∈ M, f (x) ∈ A} die Urbildmenge von A unter f . (Sei etwa f : Z → Z durch x → x2 definiert. Dann ist f −1 ({4}) = {−2, 2}, f −1 (N ) = Z \ {0} und f −1 ({2, 3}) = ∅.) Satz 3.3.4 (Charakterisierungssatz). (M, dM ) und (N, dN ) seien metrische R¨aume und f : M → N eine Abbildung. (i) F¨ ur x0 ∈ M ist f bei x0 genau dann stetig, wenn gilt: Ist (xn )n∈N eine Folge in M mit lim xn = x0 , so gilt lim f (xn ) = f (x0 ). Damit ist f genau dann stetig auf M , wenn lim f (xn ) = f lim xn n→∞
n→∞
f¨ ur alle in M konvergenten Folgen (xn )n∈N gilt.
Urbildmenge
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
208
(ii) Die folgenden Aussagen sind ¨aquivalent: (a) f ist stetig auf M . (b) F¨ ur jede abgeschlossene Teilmenge A von N ist f −1 (A) abgeschlossen in M . (c) F¨ ur jedes offene O ⊂ N ist f −1 (O) offen in M . Beweis: (i) Sei zun¨achst f stetig bei x0 und (xn )n∈N eine Folge in M mit xn → x0 . Wir haben zu zeigen, dass f (xn )→ f (x0 ). Dazu sei ε > 0 vorgegeben, wir m¨ ussen ein n0 ∈ N so finden, dass dN f (xn ), f (x0 ) ≤ ε f¨ ur n ≥ n0 . M N
ε
δ
f x0
f (x0 )
Kδ (x0 ) Kε (x0 ) Bild 3.21: Stetigkeit f : M → N mit Folgen in M und N Wir w¨ahlen δ > 0 gem¨aß Voraussetzung, also dM (x, x0 ) ≤ δ ⇒ dN f (x), f (x0 ) ≤ ε. gibt es ein n0 mit dM (xn , x0 ) ≤ δ Da die Folge (xn )n∈N gegen x0 konvergiert, ur alle n ≥ n0 , und das f¨ ur n ≥ n0 . Insgesamt heißt das: dN f (x0 ), f (xn ) ≤ ε f¨ zeigt f (xn ) → f (x0 ). Wir beweisen nun die Umkehrung, der Beweis wird durch logische Kontraposition gef¨ uhrt. Dazu nehmen wir an, dass f bei x0 nicht stetig ist und behaupten, dass dann auch die Folgenbedingung nicht erf¨ ullt sein kann. (Wir zeigen also statt p ⇒ q“ gleichwertig nicht q ⇒ nicht p“.) f ist nicht stetig bei x0“ ” ” ” bedeutet: dN f (x), f (x0 ) > ε0 .
∃ ∀ ∃
ε0 >0 δ>0
x∈M dM (x,x0 )≤δ
ahlen, f¨ ur das Insbesondere k¨onnen wir zu δ = 1/n ein Element xn ∈ M w¨ dM (xn , x0 ) ≤ 1/n und dN f (x0 ), f (xn ) > ε0 gilt. Offensichtlich ist dann xn → x0 , aber die Folge (f (xn ))n∈N konvergiert nicht gegen f (x0 ), d.h. die Folgenbedingung ist nicht erf¨ ullt. (ii) Wir beweisen die Gleichwertigkeit der drei Aussagen durch einen Ringschluss, zeigen also, dass die drei Implikationen (a)⇒(b)“, (b)⇒(c)“ und ” ” (c)⇒(a)“ gelten. ”
3.3. STETIGKEIT
209
(a)⇒(b)“: f sei stetig auf M , wir zeigen (b) unter Verwendung von Satz 3.1.7. ” Dazu sei A eine abgeschlossene Teilmenge von N und (xn )n∈N eine konvergente Folge in M mit xn ∈ f −1 (A) f¨ ur alle n ∈ N . Mit x0 := lim xn gilt einerseits wegen (i): lim f (xn ) = f (x0 ). Andererseits ist f (xn ) ∈ A nach Definition und damit f (x0 ) ∈ A aufgrund von Satz 3.1.7. Es folgt x0 ∈ f −1 (A), und Satz 3.1.7 impliziert, dass f −1 (A) abgeschlossen ist. (b)⇒(c)“: Ist O offen in N , so ist N \ O abgeschlossen. Wegen (b) ist also ” f −1 (N \ O) abgeschlossen in M . Nun ist aber f −1 (N \ O) = M \ f −1 (O), und das zeigt, dass f −1 (O) offen in M ist. Die eben benutzte Identit¨ at f −1 (N \ O) = M \ f −1 (O) ist eine unmittelbare Konsequenz der Definition, die Inklusion ⊂“ sieht ” man zum Beispiel so ein: Ist x in f −1 (N \ O), so liegt f (x) in N \ O, also nicht in O. Damit liegt x auch nicht in f −1 (O). ¨ Ahnlich leicht sind andere n¨ utzliche Gleichungen zu beweisen, zum Beispiel f −1 (A ∩ B) = f −1 (A) ∩ f −1 (B), f −1 (A ∪ B) = f −1 (A) ∪ f −1 (B).
ussen ein δ > 0 finden, (c)⇒(a)“: x0 ∈ M und ε > 0 seien vorgegeben. Wir m¨ ” so dass dM (x, x0 ) ≤ δ ⇒ dN f (x), f (x0 ) ≤ ε. Dazu betrachten wir O := {y | y ∈ N, dN y, f (x0 ) < ε}. M f −1 (O)
N
ε
δ
f x0
f (x0 )
Kδ (x0 ) O
Bild 3.22: Stetigkeit durch offene Mengen O ist offen21) , nach Voraussetzung ist auch f −1 (O) offen. Nun ist x0 nach Definition offensichtlich Element von f −1 (O), es muss also ein δ > 0 so geben, dass 21) Das
wurde auf Seite 176 nachgewiesen.
210
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Kδ (x0 ) ⊂ f −1 (O). Das aber bedeutet gerade, dass dN f (x), f (x0 ) ≤ ε (sogar < ε) f¨ ur alle x ∈ M mit dM (x, x0 ) ≤ δ gilt. Stetigkeit ist eine robuste Eigenschaft, egal, wie man stetige Funktionen zu neuen Funktionen zusammensetzt, immer wieder ergeben sich stetige Funktionen: Satz 3.3.5 (Permanenzsatz). (i) Komposita: F¨ ur i = 1, 2, 3 seien metrische R¨aume (Mi , di ) gegeben, ferner seien f : M1 → M2 und g : M2 → M3 Abbildungen. F¨ ur x0 ∈ M1 gilt dann: Ist f stetig bei x0 und g stetig bei f (x0 ), so ist g ◦ f stetig bei x0 . Als Folgerung ergibt sich, dass g ◦ f stetig ist, falls f und g stetige Funktionen sind. (ii) Algebraische Verkn¨ upfungen: (M, d) sei ein metrischer Raum und f, g stetige Funktionen von M nach K . Erkl¨art man f + g, f · g, αf (α ∈ K ) und f /g punktweise 22) , so sind diese Funktionen stetig bei x0 (bzw. stetig auf M ), wenn f und g beide diese Eigenschaft haben. (iii) Ordnungstheoretische Verkn¨ upfungen: (M, d) sei ein metrischer Raum, f, g : M → R . Definiert man min{f, g} bzw. max{f, g} durch x → min{f (x), g(x)}, x → max{f (x), g(x)}, so sind diese Funktionen im Fall stetiger f, g ebenfalls stetig. Beweis: (i) Wir wenden Satz 3.3.4(i) an: Um die Stetigkeit von g ◦ f bei x0 zu zeigen, muss aus xn → x0 gefolgert werden, dass (g ◦ f )(xn ) → (g ◦ f )(x0 ). Nun impliziert xn → x0 wegen Satz 3.3.4, dass f (xn ) → f (x0 ), denn f ist nach Voraussetzung stetig. Eine nochmalige Anwendung dieses Satzes, diesmal f¨ ur die Folge (f (xn ))n∈N und die Funktion g, liefert g(f (xn )) → g(f (x0 )), und das ist aufgrund der Definition von ◦“ gerade die Behauptung. ” (ii) Es ist nur Satz 3.3.4 mit den entsprechenden Ergebnissen u ¨ber konvergente Folgen zu kombinieren. Als Beispiel beweisen wir die Stetigkeit von f + g bei x0 , wenn f und g bei x0 stetig sind: Gilt xn → x0 , so kann man aus der Stetigkeit von f und g schließen, dass f (xn ) → f (x0 ) und g(xn ) → g(x0 ). Da konvergente Folgen nach Satz 2.2.12 addiert werden d¨ urfen, ergibt sich daraus f (xn ) + g(xn ) → f (x0 ) + g(x0 ), und wenn man sich jetzt noch daran erinnert, dass die Summe zweier Abbildungen punktweise definiert ist, kann man das als (f +g)(xn ) → (f +g)(x0 ) umschreiben. 22) So ist etwa f + g : M → K die Abbildung x → f (x) + g(x). Es ist zu beachten, dass f /g nat¨ urlich nur dann definiert werden kann, wenn g(x) = 0 f¨ ur alle x ∈ M ist.
3.3. STETIGKEIT
211
(iii) Vorbereitend bemerken wir, dass f¨ ur a, b ∈ R die Gleichungen max{a, b} = min{a, b} =
1 (a + b + |b − a|) 2 1 (a + b − |b − a|) 2
gelten. Das beweist man durch Fallunterscheidung. (Ist zum Beispiel a ≤ b, so 1 ist sowohl max{a, b} als auch (a + b + |b − a|) gleich b.) 2 1 Folglich ist max{f, g} = (f + g + |g − f |), und die rechte Seite ist stetig 2 aufgrund der vorstehend bewiesenen Ergebnisse. (F¨ ur die Stetigkeit von |g − f | beachte man, dass diese Abbildung Komposition der stetigen Funktionen x → g(x) − f (x) und a → |a| ist.) Die Stetigkeit des Minimums wird analog gezeigt. Aufgrund dieses Satzes sind alle Funktionen stetig, die als geschlossene Ausdr¨ ucke unter Verwendung stetiger Bausteine“ mit Hilfe von ◦, +, ·, :, | · |, · , ” max{ · , · } und min{ · , · } geschrieben werden k¨onnen. Der intelligente Weg zu offen“ und abgeschlossen“ ” ” Teil (ii) des vorstehenden Satzes liefert ein h¨ aufig gebrauchtes bequemes Hilfsmittel, konkret gegebene Mengen als offen bzw. abgeschlossen zu erkennen. Soll z.B. nachgewiesen werden, dass irgendein B ⊂ Rm offen bzw. abgeschlossen ist, so kann man versuchen, B als f −1 (A) zu schreiben, wo f : Rm → R eine stetige Funktion und A ⊂ R eine einfache“ offene bzw. abgeschlossene Teilmenge (etwa ” ein Intervall) ist. F¨ ur Teilmengen des Rm ist noch zu beachten, dass die Komponentenabbildungen (x1 , . . . , xm ) → xi stetig sind. Alle Funktionen, die auf Teilmengen des Rm definiert und geschlossen“ darstellbar sind, ” sind also stetig. Beispiele dazu: 1. B := {x ∈ R | x4 + x − 10 ≥ 0} ist abgeschlossen in R . Man betrachte dazu f : R → R , x → x4 + x − 10. Dann ist f nach dem Permanenzsatz stetig, und B ist das Urbild unter f des abgeschlossenen Intervalls A := [ 0, +∞ [. 2. B := {z ∈ C | |z − 1| > |z|} ist offen in C . Hier definiere man f : C → R , z → |z − 1| − |z|. f ist stetig, die Behauptung folgt damit aus B = f −1 ( ] 0, +∞ [ ) unter Beachtung der Tatsache, dass ] 0, +∞ [ offen ist. 3. Wir schreiben die Vektoren des R4 als (x, y, z, w). Dann ist f : (x, y, z, w) →
x2 + y 3 + w4 + z 5 1 + x6
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
212
stetig, und obwohl man sich f nicht gut veranschaulichen kann, weiß man doch sofort, dass zum Beispiel f −1 ( ] 3, 8 [ ) eine offene und f −1 ( [ 4, +∞ [ ) eine abgeschlossene Teilmenge des R4 ist. 4. B := {(p, q) | p, q ∈ R und x2 + px + q = 0 hat zwei verschiedene L¨ osungen} ist offen in R2 . Das sieht man leicht so ein: B ist gerade die Menge aller (p, q) 2 mit p4 − q = 0, ist also schreibbar als f −1 (R \ {0}), wo f die stetige Abbildung 2
(p, q) → p4 − q bezeichnet; beachte noch, dass R \ {0} als Komplement der abgeschlossenen Menge {0} offen ist. 5. Wir fassen die Menge aller 3 × 3-Matrizen als R9 auf und bezeichnen mit ϕdet die Abbildung A → det A, die einer Matrix die Determinante zuordnet. Es handelt sich dabei um eine stetige Abbildung von R9 nach R , das folgt sofort aus der Leibnizformel f¨ ur die Determinante, nach der det A aus den Eintr¨ agen von A durch Multiplizieren und Addieren entsteht. Folglich ist die Menge aller invertierbaren 3 × 3-Matrizen als Urbild der offenen Menge R \ {0} unter der stetigen Abbildung ϕdet eine offene Teilmenge des R9 . Aus den vorstehenden Beispielen k¨ onnen Sie die Faustregel ableiten, dass Teilmengen des Rm dann offen (bzw. abgeschlossen) sind, wenn in der Definition neben algebraischen Zeichen und stetigen Funktionen nur die Symbole =, (bzw. =, ≤, ≥) vorkommen. Sp¨ater werden wir die Funktionen sin x, cos x, ex , . . . einf¨ uhren und die Stetigkeit nachweisen. Die damit gebildeten Ausdr¨ ucke sind dann ebenfalls stetig, etwa x → sin (x2 + 1) als Verkn¨ upfung der stetigen Funktionen x → x2 + 1, y → sin y. Aus der Stetigkeit von x → x ergibt sich u ¨brigens unter Verwendung von (ii) sofort die Stetigkeit aller Polynome auf K (das sind Funktionen P : K → K der Form x → an xn + · · · + a1 x + a0 mit an , . . . , a0 ∈ K ) und aller rationalen Funktionen (das sind Quotienten von Polynomen) auf ihrem Definitionsbereich. Die Betrachtung von ε und δ bei Stetigkeitsbeweisen wird von nun an nur noch selten eine Rolle spielen. Wir kommen nun zu einer Gruppe von vier S¨atzen, die zu den wichtigsten S¨atzen der Analysis z¨ahlen. Der erste Satz (der Zwischenwertsatz) betrifft einen sehr speziellen Fall, n¨amlich stetige Funktionen f : [ a, b ] → R . Die darauf folgenden drei S¨atze sind der Grund f¨ ur die Bedeutung des Begriffs Kompakt” heit“, bei ihnen geht es um stetige Funktionen, die auf kompakten metrischen R¨ aumen definiert sind.
3.3. STETIGKEIT
213
Satz 3.3.6 (Zwischenwertsatz). Sei f : [ a, b ] → R eine stetige Funktion mit f (a) < f (b). R f (b) η f (a)
a
x0
R b
Bild 3.23: Skizze zum Zwischenwertsatz Dann gibt es f¨ ur jedes η mit f (a) < η < f (b) ein x0 ∈ [ a, b ] mit f (x0 ) = η. Beweis: Hier eine Skizze zum Beweis:
R a1 a2 a3
b1 b2 b3 a4 b4 a5 b5 .. .
Bild 3.24: Konstruktionsskizze zum Beweis des Zwischenwertsatzes Wir k¨ onnen der Einfachheit halber annehmen, dass η = 0 ist (indem wir n¨ amlich f − η anstelle von f betrachten). Induktiv konstruieren wir Folgen (an ), (bn ) mit an ≤ an+1 ≤ bn+1 ≤ bn , bn − an → 0 und f (an ) ≤ 0 ≤ f (bn ). Dazu verfahren wir ¨ ahnlich wie im Beweis von Satz 3.2.3: • n = 1: Wir definieren a1 := a und b1 := b. • n → n + 1: Sind an , bn schon konstruiert, so betrachte man x ˆ := (an + bn )/2. Ist f (ˆ x) ≥ 0 so definiere an+1 := an und bn+1 := xˆ, andernfalls setze an+1 := xˆ und bn+1 := bn . Auf diese Weise erhalten wir eine Intervallschachtelung, folglich sind die (an )n∈N und die (bn )n∈N gegen ein x0 konvergent (vgl. Satz 2.3.6(iv)).
Zwischenwertsatz
214
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Wir behaupten, dass f (x0 ) = 0 gilt. Wegen f (an ) ≤ 0 f¨ ur alle n und der Stetigkeit von f folgt f (x0 ) = lim f (an ) ≤ 0, analog ergibt sich auch f (x0 ) = lim f (bn ) ≥ 0, zusammen also f (x0 ) = 0. Kommentar: Hier spielte also wieder ein ordnungstheoretisches Argument eine Rolle, = 0“ wurde durch den Nachweis von ≥ 0 und ≤ 0“ gezeigt. ” ” Der zweite Beweisbaustein, dass n¨ amlich aus yn ≥ 0 auf lim yn ≥ 0 geschlossen werden darf, folgt einerseits aus Satz 2.2.12, kann aber andererseits auch aus der Abgeschlossenheit von [ 0, +∞ [ in Verbindung mit dem Charakterisierungssatz 3.1.7 geschlossen werden.
Damit ist der Zwischenwertsatz vollst¨ andig bewiesen.
?
Bemerkung: Machen Sie sich klar, dass es m¨ oglicherweise mehrere x0 mit f (x0 ) = η geben kann und dass der Satz f¨ ur nicht stetige Funktionen nicht notwendig richtig ist. Als typisches Anwendungsbeispiel zeigen wir die Existenz von n-ten Wurzeln. (Erinnern Sie sich noch, welcher Aufwand in Abschnitt 2.2 erforderlich war, um auch nur die Existenz von Quadratwurzeln zu garantieren?)
√ n
a, a1/n
n Korollar 3.3.7. Sei n ∈ N . F¨ ur a ≥ 0 gibt es √ genau ein b ≥ 0 mit b = a. b wird die n-te Wurzel aus a (Schreibweise n a oder a1/n ) genannt.
Beweis: Zun¨achst bemerken wir, dass x → xn eine streng monoton steigende Funktion auf [ 0, 1 ] ist: Aus x < y folgt xn < y n . Das impliziert sofort, dass es h¨ochstens ein derartiges b gibt23) . Die Existenz zeigen wir zun¨achst f¨ ur den Fall 0 ≤ a ≤ 1. Dazu betrachten wir die offensichtlich stetige Funktion x → xn auf dem Intervall [ 0, 1 ]. Da 0n gleich 0 und 1n gleich 1 ist, muss es nach dem Zwischenwertsatz ein b geben, f¨ ur das bn gleich dem Zwischenwert“ a ist. Fertig! ” R f : x → xn 1 √ n
b =: a
R b Bild 3.25: Existenz von 23) Sind
√ n
1
· mit Hilfe des Zwischenwertsatzes
n¨ amlich b1 und b2 zwei verschiedene positive Zahlen, so gilt b1 < b2 oder b2 < b1 . n n n n n Im ersten Fall w¨ are bn 1 < b2 , im zweiten b2 < b1 , es kann also bestimmt nicht b1 = b2 = a gelten.
3.3. STETIGKEIT
215
F¨ ur den Fall a > 1 gehen wir zu 1/a u ¨ ber, diese Zahl liegt in [ 0, 1 ]. Nach dem ur ersten Beweisteil gibt es ein c mit cn = 1/a, und die u ¨ blichen Rechengesetze f¨ Potenzen f¨ uhren dann zu bn = a, wenn wir b := 1/c definieren. Definitionen: pragmatisch oder plausibel? Als Sch¨ uler hat man sich an die Definition der Potenz an gew¨ ohnt: n a bedeutet a mal a mal . . . , solange, bis n Faktoren abgearbeitet ” sind“. Aber warum schreibt man nun die n-te Wurzel als a1/n ? Es kann ja wohl nicht a mit sich selbst malgenommen, bis 1/n von a ” verbraucht ist“ bedeuten. Der Grund f¨ ur diese Schreibweise ist ein pragmatischer: Nur mit dieser Schreibweise ist es m¨oglich, die bekannten Potenz-Rechengesetze ur Zahlen r zu formulieren, die (etwa (a · b)r = ar br ) einheitlich f¨ nicht notwendig in N liegen m¨ ussen. Es gibt viele vergleichbare Situationen, rund um die Potenzrechnung ist noch an a−n := 1/an und a0 := 1 zu erinnern. Auch die Definitionen 0! := 1 und 3 · (+∞) := +∞ w¨aren hier zu erw¨ ahnen: Die erste braucht man, um Fallunterscheidungen beim Arbeiten mit dem Summenzeichen zu vermeiden, die zweite erlaubt einem, die Rechenˆ zu erweitern. regeln f¨ ur den Limes von R auf R In einigen F¨ allen ist die Konvention vom gerade relevanten Teilgebiet abh¨ angig. Hier in der Analysis haben wir zum Beispiel vermieden, uns auf eine Definition von 0 · (+∞) festzulegen. (Der Grund: Es gibt keine allgemeing¨ ultige Formel f¨ ur lim an bn , wenn an → 0 und bn → +∞.) In der Wahrscheinlichkeitstheorie ist es dagegen sinnvoll und u ¨ blich, 0 · (+∞) := 0 zu setzen. Aus dem Zwischenwertsatz folgt auch leicht die Stetigkeit von inversen Abbildungen: Satz 3.3.8. Sei f : [ a, b ] → R eine stetige und streng monoton steigende Funktion. (i) Die Bildmenge {f (x) | a ≤ x ≤ b} stimmt mit dem Intervall I := [ f (a), f (b) ] ¨ uberein, und f : [ a, b ] → I ist bijektiv. (ii) Die inverse Abbildung f −1 : I → [ a, b ] ist stetig. Eine entsprechende Aussage gilt f¨ ur streng monoton fallende Funktionen. √ Bemerkung: Insbesondere ist die Funktion x → n x eine stetige Funktion von [ 0, +∞ [ nach [ 0, +∞ [. Beweis: (i) Die Injektivit¨at folgt aus der (strengen) Monotonie, und die Surjektivit¨ at ergibt sich sofort aus dem Zwischenwertsatz. (ii) Sei x0 ∈ [ a, b ] gegeben, wir zeigen die Stetigkeit von f −1 bei f (x0 ). Sei dazu (yn ) eine Folge in I mit yn → f (x0 ) =: y0 . Wir schreiben yn als f (xn ), das ist wegen der Bijektivit¨ at m¨oglich.
216
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
Es ist zu zeigen, dass die (f −1 (yn )), also die (xn ), gegen x0 konvergieren. W¨are das nicht der Fall, so g¨abe es ein ε > 0, so dass f¨ ur unendlich viele n die Ungleichung xn ≤ x0 −ε (oder f¨ ur unendlich viele n die Ungleichung xn ≥ x0 +ε) gelten w¨ urde. Dann aber w¨are – wegen der Monotonie von f – auch yn = f (xn ) ≤ f (x0 − ε) < f (x0 ) = y0 (bzw. yn ≥ f (x0 + ε) > f (x0 ) = y0 ) f¨ ur unendlich viele Indizes, und das w¨ urde der vorausgesetzten Konvergenz yn → y0 widersprechen. Ich darf nun um Ihre besondere Aufmerksamkeit f¨ ur eine wichtige Gruppe von drei S¨atzen bitten. Sie spielen immer dann eine Rolle, wenn Stetigkeit“ ” und Kompaktheit“ bei einer Problemstellung gleichzeitig vorliegen. ” Satz 3.3.9 (Stetige Bilder kompakter R¨ aume sind wieder kompakt). Sei f : M → N eine stetige Funktion (wobei (M, dM ) und (N, dN ) metrische R¨aume sind). F¨ ur jede kompakte Teilmenge A von M ist dann auch f (A) := {f (x) | x ∈ A} kompakt; insbesondere ist f (A) dann abgeschlossen. Beweis: Sei (yn )n∈N eine Folge in f (A). Wir w¨ ahlen xn ∈ A mit f (xn ) = yn und betrachten die Folge (xn )n∈N . Wegen der Kompaktheit von A gibt es ein x0 ∈ A und eine Teilfolge (xnk )k∈N mit xnk → x0 . Aufgrund der Stetigkeit von f gilt dann f (xnk ) = ynk → y0 := f (x0 ) ∈ f (A), d.h (yn )n∈N besitzt eine in f (A) konvergente Teilfolge. Die Abgeschlossenheit von f (A) folgt aus Satz 3.2.2. Der intelligente Weg zur Kompaktheit Wegen des vorstehenden Satzes reicht es f¨ ur Kompaktheitsnachweise, die zu untersuchende Menge als stetiges Bild einer schon bekannten kompakten Menge darzustellen. Als einfaches Beispiel betrachte man den Parabelbogen P := t + it2 −1 ≤ t ≤ 1 in C . P ist kompakt, denn mit f (t) := t + it2 ist P = f ([−1, 1]), die Funktion f ist stetig und [−1, 1] ist kompakt. Dieser Satz wird h¨aufig auch dann angewandt, wenn lediglich die Abgeschlossenheit einer Menge gezeigt werden soll: Man beweist einfach etwas mehr (die Kompaktheit der Menge), daf¨ ur gibt es ja vielleicht ein elegantes Ein-Zeilen-Argument. Als wichtige Folgerung f¨ ur inverse Abbildungen erhalten wir:
3.3. STETIGKEIT
217
Korollar 3.3.10. (M, dM ) und (N, dN ) seien kompakt, und f : M → N sei eine bijektive stetige Abbildung. Dann ist f −1 : N → M stetig. Beweis: Sei A abgeschlossen in M , aufgrund von Satz 3.2.2 reicht es zu zeigen, −1 −1 dass f −1 (A) abgeschlossen ist. Nun ist aber f −1 (A) = f (A), und diese Menge ist nach dem vorstehenden Satz kompakt, da A nach Satz 3.2.2(iv) kompakt ist. Aufgrund des gleichen Satzes, diesmal wegen Teil (i), ist f (A) dann auch abgeschlossen, und das beweist die Behauptung. Satz 3.3.11 (Satz vom Maximum und Minimum). Sei (M, d) ein kompakter metrischer Raum und f : M → R eine stetige Funktion. Ist dann M = ∅, so gibt es Elemente x0 und y0 in M , so dass
∀ f (x ) ≤ f (x) ≤ f (y ). 0
0
x∈M
ur f kleinstm¨ogliche bzw. gr¨oßtm¨ogliche Wert angeBei x0 bzw. y0 wird der f¨ nommen, und f (x0 ) (bzw. f (y0 )) heißt das Minimum (bzw. das Maximum) der Funktion f auf M .
a
y0
x0
M = [a, b] b
Bild 3.26: Der Satz vom Maximum und Minimum f¨ ur M = [a, b] Beweis: Wir weisen die Existenz eines y0 ∈ M mit
∀ f (x) ≤ f (y ) 0
x∈M
nach. Die Existenz von x0 ergibt sich dann leicht durch Betrachtung von −f . Wegen der Kompaktheit von M und Satz 3.3.9 ist die Menge K := f (M ) = {f (x) | x ∈ M } in R kompakt. Es reicht folglich zu zeigen: Ist K ⊂ R kompakt und nicht leer, so gibt es ein k0 ∈ K mit k ≤ k0 f¨ ur alle k ∈ K (also ein k0 , dass besonders weit rechts“ liegt). ” Zum Beweis dieser Behauptung definieren wir k0 := sup K; die Existenz von k0 ist durch Satz 2.3.6 garantiert24) . 24) Genau
genommen ist noch daran zu erinnern, dass kompakte Mengen beschr¨ ankt sind.
Satz vom Maximum
218
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT K k0 −
1 n
kn
k0
Bild 3.27: Kompakte Menge K ⊂ R mit Supremum k0 Um k0 ∈ K einzusehen, betrachten wir f¨ ur n ∈ N die Zahl k0 − n1 . Wegen 1 1 k0 − n < k0 ist k0 − n nicht obere Schranke von K, d.h. es existiert kn ∈ K mit kn > k0 − n1 . Die Ungleichungen k0 −
1 < kn ≤ k0 n
garantieren, dass kn gegen k0 konvergiert, und daraus folgt mit Satz 3.1.7 und Satz 3.2.2(i), dass k0 zu K geh¨ort. Unser Beweis zeigt sogar etwas mehr, n¨ amlich: Ist A eine nicht leere, abgeschlossene und nach oben beschr¨ ankte Teilmenge von R , so geh¨ort sup A zu A. Auch wurde gezeigt, dass es eine Folge (xn )n∈N in A mit xn → sup A gibt. Nach Definition von K heißt das, dass wir ein y0 mit f (y0 ) = k0 finden k¨ onnen, und da k0 gr¨oßtm¨oglich unter allen k ∈ K ist, muss f (y0 ) eine obere Schranke der f (x) sein.
?
Wir diskutieren nun einige einfache typische Anwendungsbeispiele des vorigen Satzes. Vorher sollten Sie sich klar machen, dass die Voraussetzungen wesentlich sind, d.h. der Satz wird falsch, wenn man eine der Voraussetzungen M ist kompakt“ oder f ist stetig“ wegl¨ asst. ” ” 1. Ist K eine nicht leere kompakte Teilmenge eines metrischen Raumes (M, d) und x0 ∈ M , so gibt es in K einen Punkt mit k¨ urzestm¨ oglichem“ Abstand zu ” ur alle x ∈ K. x0 , d.h. ein y0 ∈ K mit d(x0 , y0 ) ≤ d(x, x0 ) f¨
M
K
y0
x0
Bild 3.28: Zu x0 ∈ M hat ein Punkt y0 ∈ K kleinsten Abstand.
3.3. STETIGKEIT
219
Beweis dazu: Man kombiniere die Stetigkeit von x → d(x, x0 ) (vgl. die Beispiele zu 3.3.2) mit Satz 3.3.11. 2. Ist M ein nicht leerer kompakter Raum und f : M → R stetig, so gilt: Ist f (x) > 0 f¨ ur alle x ∈ M , so gibt es ein η > 0 mit f (x) ≥ η f¨ ur alle x ∈ M . R f
η a
R M = [a, b]
b
Bild 3.29: Illustration am Beispiel M = [ a, b ] Beweis dazu: Man setze η := f (x0 ), wo x0 gem¨ aß Satz 3.3.11 zu bestimmen ist. Vor dem n¨ achsten Satz soll noch einmal an die Stetigkeitsdefinition erinnert werden: f : M → N heißt stetig auf M , wenn dN f (x), f (x0 ) ≤ ε.
∀ ∀∃ ∀
ε>0 x0 ∈M δ>0
x∈M dM (x,x0 )≤δ
Da der Quantor ∀x0 ∈ M“ vor dem Quantor ∃ δ > 0“ steht, bedeutet das, ” ” dass bei vorgegebenem ε > 0 das δ in der Regel f¨ ur verschiedene x0 verschieden gew¨ ahlt werden muss. Ist es m¨oglich, δ > 0 unabh¨ angig von x0 zu w¨ ahlen (wenn also die Quantoren ∀“ und ∃“ die Pl¨atze tauschen d¨ urfen), so soll f ” ” gleichm¨aßig stetig genannt werden: Definition 3.3.12. (M, dM ) und (N, dN ) seien metrische R¨aume. Eine Funktion f : M → N heißt gleichm¨aßig stetig, wenn dN f (x), f (x0 ) ≤ ε.
∀∃∀
ε>0 δ>0 x0 ∈M
∀
x∈M dM (x,x0 )≤δ
Es ist klar, dass jede gleichm¨aßig stetige Abbildung stetig ist25) und dass jede Lipschitzabbildung gleichm¨aßig stetig ist: Da kann das δ zu ε > 0 als ε/(L + 1) gew¨ ahlt werden, und dieser Ausdruck h¨angt nicht von x0 ab (vgl. Seite 205). Interpretiert man das Stetigkeits-δ zu ε bei x0 ist klein“ als die Funktion ist ” ” steil bei x0“, so bedeutet f ist nicht gleichm¨aßig stetig“, dass f beliebig steil“ ” ” 25) Das
liegt daran, dass ∃ ∀“ die Aussage ∀ ∃“impliziert. ” ”
gleichm¨ aßig stetig
220
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
wird. Folglich sollten z.B. x → x2 (von R nach R ) oder x → 1/x (von ] 0, 1 ] nach R ) nicht gleichm¨aßig stetig sein. Das kann man auch streng beweisen, als Beispiel zeigen wir: Behauptung: f : ] 0, 1 ] → R , x → 1/x ist nicht gleichm¨ aßig stetig. Beweis: Wir m¨ ussen zeigen, dass gilt: 1 − 1 ≥ ε0 . x x0 ε0 >0 δ>0 x,x0 ∈
∃ ∀ ∃
|x−x0 |≤δ
Wir beweisen das f¨ ur ε0 = 1, wir geben irgendein δ > 0 vor. Dann sind x := δ und x0 := δ/2 Punkte in ] 0, 1 ] mit |x − x0 | ≤ δ, und 1 − 1 = 1 ≥ 1 = ε0 . x x0 δ (Dabei haben wir unterstellt, dass δ ≤ 1 gilt. Sollte das nicht der Fall sein, w¨ ahlen wir x := 1, x0 := 1/2.) Vielleicht ist Ihnen aufgefallen, dass die Definitionsbereiche (R bzw. ] 0, 1 ]) der gerade betrachteten stetigen, aber nicht gleichm¨ aßig stetigen Funktionen (x → x2 bzw. x → 1/x) nicht kompakt waren. Der folgende Satz zeigt, dass das kein Zufall war: Satz 3.3.13 (Kompaktheit impliziert gleichm¨ aßige Stetigkeit). (M, dM ) und (N, dN ) seien metrische R¨aume. Ist M kompakt, so ist jede stetige Funktion f : M → N sogar gleichm¨aßig stetig. Beweis: f : M → N sei stetig. Wir haben dN f (x), f (x0 ) ≤ ε
∀∃ ∀
ε>0 δ>0
x,x0 ∈M dM (x,x0 )≤δ
zu zeigen. Der Beweis wird indirekt gef¨ uhrt. Wir nehmen also an, dass dN f (x), f (x0 ) > ε0
∃ ∀ ∃
ε0 >0 δ>0
(3.1)
x,x0 ∈M dM (x,x0 )≤δ
ist, das m¨ ussen wir zu einem Widerspruch f¨ uhren. Dazu nutzen wir (3.1) insbesondere f¨ ur die δ = 1/n aus und erhalten Elemente xn , yn ∈ M mit dM (xn , yn ) ≤
1 und dN f (xn ), f (yn ) > ε0 . n
Aufgrund der Kompaktheit von M finden wir ein x0 ∈ M und eine Teilfolge (xnk )k∈N mit xnk → x0 . Wegen d(xnk , ynk ) ≤ 1/nk ist dann auch ynk → x0 . Außerdem gilt wegen der Stetigkeit von f : f (xnk ) → f (x0 ), f (ynk ) → f (x0 ).
3.3. STETIGKEIT
221
F¨ ur gen¨ ugend große k ist insbesondere ε0 ε0 dN f (xnk ), f (x0 ) ≤ , dN f (ynk ), f (x0 ) ≤ , 2 2 und mit der Dreiecksungleichung folgt der Widerspruch ε0 < dN f (xnk ), f (ynk ) ≤ dN f (xnk ), f (x0 ) + dN f (ynk ), f (x0 ) ≤ ε0 .
Schlussbemerkungen: 1. Die souver¨ ane Beherrschung des Zwischenwertsatzes und der hier bewiesenen S¨ atze u ¨ ber stetige Funktionen auf kompakten R¨aumen wird bei jedem die Analysis anwendenden Mathematiker vorausgesetzt. Die Bedeutung dieser Ergebnisse motiviert auch Teile des weiteren Vorgehens, n¨amlich z.B.: • Man zeige, dass die f¨ ur mathematische Modellbildungen wichtigen Funktionen (wie sin x, ex , . . . ) stetig sind. • Man finde Kriterien, um die Kompaktheit von Teilmengen konkreter metrischer R¨ aume nachzuweisen. 2. Die S¨ atze 3.3.6, 3.3.9, 3.3.11 und 3.3.13 lassen sich als Existenzs¨ atze interpretieren. Satz 3.3.11 und Satz 3.3.13 zeigen, wie Kompaktheit globale Aussagen (Maximalwerte, gleichm¨aßige Stetigkeit) bei Voraussetzung lokaler Eigenschaften (Stetigkeit) impliziert. 3. Als Nachtrag zum Thema gleichm¨aßige Stetigkeit“ sollte betont werden, ” dass es sich um eine Eigenschaft handelt, die nur in Bezug auf einen Definitionsbereich sinnvoll betrachtet werden kann. Z.B. ist die Aussage Die Funktion ” x → x2 ist nicht gleichm¨aßig stetig“ sinnlos. Richtig ist allerdings, dass sie nicht gleichm¨ aßig stetig ist, wenn man sie als Funktion von R nach R auffasst. Dagegen ist die Einschr¨ankung auf jedes kompakte Intervall wegen Satz 3.3.13 gleichm¨ aßig stetig. 4. Schließlich ist noch darauf hinzuweisen, dass die hier vorgestellte Analysis Aussagen geliefert hat, die mit den Erwartungen u ¨bereinstimmen. So ist es leicht, zahlreiche Beispiele aus dem t¨aglichen Leben zu finden, die an den Zwischenwertsatz bzw. den Satz vom Maximum und Minimum erinnern: • Ist Ihnen die Dusche bei Stellung S1 des Warmwasserhahns zu kalt, bei ahlenden Stellung S2 aber zu heiß, so erwarten Sie bei einer geeignet zu w¨ Stellung S zwischen S1 und S2 eine angenehme Dusch-Temperatur. • Falls Sie ein neues Rezept ausprobieren und es beim ersten Zubereiten fade (Sie hatten 5g Salz hinzugegeben) beim zweiten Mal (diesmal waren es 20g Salz) aber versalzen schmeckt, so sind Sie fest davon u ¨ berzeugt: Die richtige Salzmenge wird irgendwo zwischen 5g und 20g liegen.
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
222
• Es ist plausibel anzunehmen, dass zu irgendeinem Zeitpunkt des Jahres die am meteorologischen Institut gemessene Temperatur die h¨ ochstm¨ ogliche dieses Jahres war. Niemand wird allerdings die Erwartung haben, dass es ochstm¨ ogliche einen Zeitpunkt t0 geben muss, zu dem die Temperatur die h¨ u ¨berhaupt (d.h. seit Bestehen des Instituts bis in alle Zukunft) sein muss. Es w¨are u ¨ brigens verfehlt anzunehmen, dass diese Erwartungen aus den von uns bewiesenen S¨atzen in irgendeinem logisch strengen Sinn hergeleitet werden k¨onnen. Unsere Beobachtungen sind nur ein Indiz daf¨ ur, dass die bisher entwickelten Konzepte – wie Kompaktheit“, Stetigkeit“ – gut geeignet sind, zur ” ” Mathematisierung nicht-mathematischer Sachverhalte herangezogen zu werden.
3.4
Verst¨ andnisfragen
Zu 3.1 Sachfragen S1: Was ist ein metrischer Raum? S2: Was versteht man unter der diskreten Metrik auf einer Menge M ? S3: Was ist eine Norm? Inwiefern induziert jeder normierte Raum einen metrischen Raum? S4: Nennen Sie Beispiele f¨ ur Normen auf dem Km . S5: Wie definiert man konvergent“ bzw. Cauchy-Folge“ in der Thorie der metrischen ” ” R¨ aume? S6: Was bedeutet A ist offen“ bzw. A ist abgeschlossen“ f¨ ur eine Teilmenge A eines ” ” metrischen Raumes? S7: Wie l¨ asst sich Abgeschlossenheit durch Folgen charakterisieren? S8: Was versteht man unter dem Inneren bzw. dem Abschluss einer Menge? Methodenfragen M1: Nachweisen k¨ onnen, dass eine konkret gegebene Abbildung d : M × M → R eine Metrik ist. Zum Beispiel: 1. Welche der folgenden Abbildungen definieren Metriken? • d1 (x, y) := x − y f¨ ur x, y ∈ R . • d2 (x, y) := a|x − y| f¨ ur x, y ∈ R , dabei ist a ∈ R fest. ur x, y ∈ R . • d3 (x, y) := (x − y)2 f¨ 2. Sei (an )n∈N eine Folge in R . Man finde Bedingungen an diese Folge, dass d (xn )n∈N , (yn )n∈N := sup an |xn − yn | n∈N
eine Metrik auf ∞ definiert.
¨ 3.4. VERSTANDNISFRAGEN
223
3. Sei M eine Menge, d1 , d2 Metriken auf M , a, b > 0. Ist dann auch d(x, y) := a · d1 (x, y) + b · d2 (x, y) eine Metrik auf M ? M2: Normeigenschaften nachpr¨ ufen k¨ onnen. Zum Beispiel: 1. a1 , . . . , am ∈ C seien vorgegeben. Ist dann m
(x1 , . . . , xm ) :=
ai |xi | i=1
eine Norm auf dem Km ? 2. I sei eine nicht leere Teilmenge von R , x0 ∈ I. Man betrachte den K Vektorraum Abb(I, K ) aller Abbildungen von I nach K (punktweise Operationen) und darauf die Abbildung f := |f (x0 )|. Unter welchen Bedingungen an I ist das eine Norm? M3: Konvergenzbeweise in metrischen R¨ aumen f¨ uhren k¨ onnen. Zum Beispiel: 1. Sei M eine Menge, d die diskrete Metrik auf M , man beschreibe die konvergenten Folgen (bzw. die Cauchy-Folgen) auf M . 2. (xn )n∈N sei eine Folge im Km . Zeigen Sie, dass sie genau dann · 1 konvergent ist, wenn sie · ∞ -konvergent ist. 3. (xn )n∈N sei konvergent in (M, d), y0 ∈ M , R ≥ 0. Gilt dann die ur alle n ∈ N , so ist auch Ungleichung d(xn , y0 ) ≤ R f¨ d lim xn , y0 ≤ R. n→∞
M4: F¨ ur konkrete Situationen A ist offen“ bzw. A ist abgeschlossen“ nachpr¨ ufen ” ” k¨ onnen. Zum Beispiel: 1. Sei A := {x ∈ Q | x ≥ 0}. Zeigen Sie: A ist abgeschlossen in Q , aber weder offen noch abgeschlossen in R . 2. Sei A ⊂ R offen und abgeschlossen, dann ist A = ∅ oder A = R . o
onnen. M5: A und A− berechnen k¨ Zum Beispiel: 1. Sei A := {x ∈ Q | 1 < x ≤ 2}. Man bestimme A− und Ao in Q sowie in [ 1, 2 ] und in R . 2. Man berechne R − und R o in C .
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
224
3. Bestimmen Sie T o und T − in R , wo T die Menge der transzendenten Zahlen bezeichnet. (Dabei darf vorausgesetzt werden, dass es transzendente Zahlen gibt.) 4. Zeigen Sie: {x + iy | x, y ∈ Q } =: Q + iQ liegt dicht in C . Zu 3.2 Sachfragen S1: Was ist eine kompakte Teilmenge eines metrischen Raumes? S2: Was besagt der Satz von Bolzano-Weierstraß? (Beweisidee?) S3: F¨ ur K ⊂ Km gilt: K kompakt ⇐⇒ ? (Gilt dieses Kriterium auch in beliebigen metrischen R¨ aumen?) S4: Welche Teilmengen eines kompakten Raumes sind stets wieder kompakt. S5: Inwiefern ist Kompaktheit eine interne Eigenschaft? S6: Was versteht man unter der Zweipunktkompaktifizierung von R ? Wie wird dort Konvergenz“ definiert? Wie wird die Ordnung erkl¨ art? Warum sind +“ und ·“ keine ” ” ” ˆ? inneren Kompositionen auf R Methodenfragen M1: Kompaktheit vorgegebener Teilmengen nachweisen k¨ onnen, insbesondere im Km . Zum Beispiel: 1. Man teste die folgenden Mengen auf Kompaktheit: [ 0, 6 ], Q ∩ [ 0, 1 ], n + n1 | n ∈ N , {z ∈ C | Re(z) ≤ −1}. (Dabei ist Re(z) = x, falls z = x + iy mit x, y ∈ R .) 2. F¨ ur welche a ∈ R ist Ma := {(x, y) | x2 + ay 2 = 1} kompakt? 3. Man begr¨ unde, dass R und ] 0, 1 ] nicht kompakt sind, und zwar • unter Verwendung der Folgendefinition f¨ ur Kompaktheit, ¨ • unter Verwendung der Uberdeckungscharakterisierung. ˆ. M2: Beherrschung der Ordnungs- und der Konvergenzstruktur in R Zum Beispiel: ˆ f¨ 1. Bestimmen Sie (mit Beweis!) sup A und inf A in R ur • A = Z ∪ [ 0, +∞ [ ˆ • A=R • A = {(−n)n | n ∈ N }. ˆ ist: − sup A = inf(−A), dabei ist −A die 2. Man zeige : F¨ ur A ⊂ R Menge {−a | a ∈ A}. ˆ von: 3. Man untersuche die Konvergenz in R (a) (n2 )n∈N (b) (−1)n+1 · n2
n∈N
¨ 3.4. VERSTANDNISFRAGEN
225
(c) (an )n∈N mit an = (d) (e) (f)
n + 1/2 +∞
n ungerade n gerade
∞ n=0 n! ∞ n n=1 (+∞) ∞ n n=1 (−∞) .
Zu 3.3 Sachfragen ur f : M → N ). S1: Was bedeutet f ist stetig bei x0 ∈ M“ bzw. f ist stetig auf M“ (f¨ ” ” Wie kann man sich diese Begriffe veranschaulichen, z.B. f¨ ur f : R → R ? S2: Was ist eine Lipschitzabbildung? Beispiele? Beweis f¨ ur: Jede Lipschitzabbildung ist gleichm¨ aßig stetig. S3: Welche Charakterisierungen und Permanenzs¨ atze f¨ ur stetige Funktionen kennen Sie? S4: Inwiefern kann man stetige Funktionen zum Nachweis daf¨ ur einsetzen, dass konkret gegebene Mengen offen bzw. abgeschlossen sind? S5: Was besagt der Zwischenwertsatz, welche S¨ atze gelten f¨ ur stetige Funktionen auf kompakten R¨ aumen? (Beweisideen?) S6: Was bedeutet gleichm¨ aßige Stetigkeit? Kennen Sie ein Beispiel f¨ ur eine stetige, nicht gleichm¨ aßig stetige Funktion (mit Beweis)? Methodenfragen M1: Abbildungen als stetig erkennen k¨ onnen, und zwar sowohl direkt (ε-δ-Definition), als auch unter geschickter Anwendung der Permanenzs¨ atze. Zum Beispiel: 1. Man zeige: x → x2 ist eine stetige Abbildung auf R (das soll mit einem direkten ε-δ-Beweis gezeigt werden). 2. Unter Verwendung der Stetigkeit von x → sin x begr¨ unde man, dass x → sin(1 + sin2 x) stetig ist. 3. Jede Abbildung f : N → R ist stetig (ε-δ-Beweis), ist jedes derartige f auch gleichm¨ aßig stetig? 4. Ist f : R → R stetig, so auch f 2 (ε-δ-Beweis). Gilt das auch, wenn man stetig“ durch Lipschitz-Abbildung“ oder gleichm¨ aßig stetig“ ” ” ” ersetzt? M2: Nachweisen k¨ onnen, dass eine vorgelegte Abbildung gleichm¨ aßig stetig ist (und zwar sowohl direkt als auch unter Verwendung der S¨ atze u ¨ ber stetige Funktionen). Zum Beispiel: 1. f, g : R → R seien gleichm¨ aßig stetig, α ∈ R . Sind dann auch f · g bzw. αf gleichm¨ aßig stetig?
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
226
2. x → 1/x ist gleichm¨ aßig stetig auf [ 1, +∞ [. aßig stetig auf ] −3, 712 ]. 3. p : x → x19 − 3x6 + 1 ist gleichm¨ 4. Ist die Aussage x → x2 ist nicht gleichm¨ aßig stetig“ sinnvoll? ” M3: Nachweis topologischer Eigenschaften (offen, kompakt, abgeschlossen) unter Verwendung stetiger Funktionen. Zum Beispiel: 1. Die Menge {(x, y, z) | x2 + y 2 + z 2 = 1} ist kompakt im R3 . 2. B ⊂ Km sei beschr¨ ankt und abgeschlossen, weiter sei A ⊂ B eine abgeschlossene Teilmenge und f : A → R stetig. Dann ist f (A) kompakt. 3. Kann es eine surjektive stetige Abbildung f : [ 0, 1 ] → R geben? M4: Zwischenwertsatz und Satz vom Maximum anwenden k¨ onnen. Zum Beispiel: 1. Sei P ein Polynom ungeraden Grades mit reellen Koeffizienten. Dann gibt es ein x0 ∈ R mit P (x0 ) = 0. 2. f : R → R sei stetig mit 0 ∈ f (R ). Dann ist f (x)f (y) > 0 f¨ ur alle x, y ∈ R . 3. f und g seien stetige Funktionen von [ 0, 1 ] nach R . Gilt dann f (x) < g(x) f¨ ur alle x, so gibt es ein ε > 0, so dass sogar stets f (x) + ε ≤ g(x) ist.
3.5
¨ Ubungsaufgaben
Zu Abschnitt 3.1 3.1.1 Bestimmen Sie den Abschluss, den offenen Kern und den Rand folgender Teilmengen von R bzw. R2 : 1 1 (a) A = 1, , , . . . . 2 3 (b) B = {x ∈ R | x ist irrational}. (c) C = {(x, y) ∈ R2 | x = y}. (d) D = {(x, y) ∈ R2 | y > 0}. 3.1.2 Sei (X, · ) ein normierter Raum. Zeigen Sie, dass f¨ ur den Rand der Einheitskugel B = x ∈ X x ≤ 1 gilt: ∂B = x ∈ X x = 1 . 3.1.3 Man u ufe auf Abgeschlossenheit, Offenheit und Kompaktheit: ¨ berpr¨ (a) A = {2, 4, 6, 8, . . .} ⊂ R ,
¨ 3.5. UBUNGSAUFGABEN (b) B = z ∈ C
227
|z|2 ≥ 1, |z|3 ≤ 3 ⊂ C .
3.1.4 Welche der folgenden Mengen sind offen, abgeschlossen bzw. weder offen noch abgeschlossen in R bez¨ uglich der u ¨blichen Metrik? (a) A = [ −1, 3 ] ∪ [ 4, 10 ] (b) B = ] −5, 2 [ ∪ ] 7, 22 [ ∩ ] −3, 15 [ (c) C = {1, 12 , 13 , 14 , . . .} (d) D = {0, 1, 12 , 13 , 14 , . . .}. 3.1.5 F¨ ur welche a ≥ 1 ist ] 0, 1 [ abgeschlossen in ] 0, a [? 3.1.6 Die Menge
(a, b, c, d)
Das Gleichungssystem ax + by = 1 cx + dy = 2 ist eindeutig l¨ osbar.
ist offen im K4 . Zu Abschnitt 3.2 3.2.1 Sei (M, d) ein metrischer Raum, in dem jede Teilmenge abgeschlossen ist. Was l¨ asst sich dann u ¨ ber die kompakten Teilmengen von M aussagen? 3.2.2 Bestimmen Sie die kompakten Teilmengen des Raumes {0} ∪ { n1 | n ∈ N }, der mit der von R geerbten Metrik versehen sei. 3.2.3 Kann es einen unendlichen Raum geben, in dem jede Teilmenge kompakt ist? ˆ mit limn→∞ an = +∞, so gilt 3.2.4 Man beweise: Ist (an )n∈N eine Folge in R ur jede Folge (bn )n∈N mit inf n∈N bn > 0. limn→∞ an bn = +∞ f¨ 3.2.5 Zeigen Sie: {en | n ∈ N } ist nicht kompakt in ∞ bzgl. · ∞ . Dabei ist en die Folge (0, 0, . . . , 0, 1, 0 . . .), die 1 steht an der n-ten Stelle. Zu Abschnitt 3.3 3.3.1 Es sei f : [ 0, 1 ] → R eine stetige Funktion mit f (0) = f (1). Zeigen Sie, dass dann ein c ∈ 0, 12 existiert mit f (c) = f (c + 12 ). 3.3.2 Zeigen Sie: 1. f : R \ {3} → R , f (x) = 2. g : R \ [2, 4] → R , g(x) =
1 x−3
ist nicht gleichm¨ aßig stetig.
1 x−3
ist eine Lipschitzabbildung.
3.3.3 Es sei f : [ 0, 1 ] → [ 0, 1 ] eine stetige Funktion. Zeigen Sie, dass f dann einen Fixpunkt besitzt. D.h., es gibt ein x ∈ [ 0, 1 ] mit f (x) = x. √ 3.3.4 Ist f : [ 0, 1 [ → R , f (x) = 5 x 1. gleichm¨ aßig stetig, 2. sogar eine Lipschitzabbildung? 3.3.5 Eine Teilmenge I von R ist genau dann ein Intervall, wenn daf¨ ur der Zwischenwertsatz richtig ist, wenn also gilt: Ist f : I → R stetig und x, y ∈ I, so tritt jedes c zwischen f (x) und f (y) als Bildwert auf.
228
¨ KAPITEL 3. METRISCHE RAUME UND STETIGKEIT
3.3.6 F¨ ur eine Teilmenge K von R sind ¨ aquivalent: • K ist kompakt. • Jede stetige reellwertige Funktion auf K ist beschr¨ ankt. Ist K ein Intervall, so sind diese beiden Aussagen auch ¨ aquivalent dazu, dass jede stetige Funktion auf K gleichm¨ aßig stetig ist. 3.3.7 F¨ ur eine Teilmenge K von R sind ¨ aquivalent: • K ist kompakt. • Jede stetige reellwertige Funktion nimmt Maximum und Minimum an. • F¨ ur jede auf K definierte stetige Funktion f ist f (K) kompakt. 3.3.8 f : R → R sei differenzierbar. Ist dann f beschr¨ ankt, so ist f gleichm¨ aßig ankt? stetig. Gilt auch: Ist f differenzierbar und gleichm¨ aßig stetig, so ist f beschr¨
Kapitel 4
Differentiation (eine Ver¨ anderliche) Ein Blick auf die lange Geschichte der Anwendungen von Mathematik zeigt, dass dort gewisse ausgezeichnete Funktionen (Exponentialfunktion, trigonometrische Funktionen, . . . ) immer und immer wieder vorkommen. Es ist eines der Ziele dieses Kapitels, die f¨ ur die Behandlung dieser speziellen“ Funktionen not” wendigen Begriffe bereitzustellen. Als wichtige Vorbereitung werden wir in Abschnitt 4.1 definieren, was eine differenzierbare Funktion ist. Das ist – naiv ausgedr¨ uckt – eine Funktion, die sich ohne Knick“ zeichnen l¨asst, also eine, die bei gen¨ ugend hoher Vergr¨ oße” rung lokal wie eine Gerade aussieht. Wie Stetigkeit ist auch Differenzierbarkeit ¨ eine Eigenschaft, die beim Ubergang zu zusammengesetzten Funktionen erhalten bleibt. Summen, Produkte usw. sind wieder differenzierbar, und man kann einfache Formeln f¨ ur die Steigungen finden, die sich dabei ergeben. Abschnitt 4.2 ist der Behandlung der Mittelwerts¨atze gewidmet. Durch diese S¨ atze lassen sich Informationen u ¨ ber die Ableitung einer Funktion zur Herleitung von Eigenschaften der Funktion selber verwenden. (Ein typisches Beispiel ist das Ergebnis, dass eine Funktion monoton steigend sein muss, wenn die Ableitung nicht negativ ist.) Der Abschnitt enth¨alt außerdem einige typische Anwendungsbeispiele, u.a. den Nachweis der l’Hˆ opitalschen Regeln 1) . In Abschnitt 4.3 wird der Satz von Taylor bewiesen. Dadurch ist es m¨ oglich zu entscheiden, inwieweit eine vorgegebene Funktion n¨ aherungsweise durch eine einfache Funktion (ein Polynom) beschrieben werden kann. Es wird danach nicht schwer sein, die f¨ ur die Behandlung von Extremwertaufgaben wichtigsten Resultate zu erhalten. Aufgrund des Satzes
∞ von Taylor ist zu erwarten, dass ”gutartige“ Funktionen die Form x → n=0 an (x − x0 )n haben. Diese – berechtigte – Erwartung 1) In manchen B¨ uchern heißt es u opital“, in beiden F¨ allen ¨brigens l’Hospital“ statt l’Hˆ ” ” sollte man diesen franz¨ osischen Namen als loppitall“ (mit der Betonung auf der letzten ” Silbe) aussprechen.
230
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
motiviert unsere ausf¨ uhrliche Besch¨ aftigung mit Potenzreihen in Abschnitt 4.4. Danach sind wir in Abschnitt 4.5 in der Lage, einige der wichtigsten Funktionen der Analysis einzuf¨ uhren und zu untersuchen: Exponentialfunktion, Logarithmus, Sinus, Cosinus, . . . Bei dieser Gelegenheit werden auch zwei wichtige Zahlen eingehend studiert, n¨amlich die Zahl e und die Zahl π. Das Kapitel schließt in Abschnitt 4.6 mit einigen f¨ ur konkrete Anwendungen n¨ utzlichen Ergebnissen. Wir werden zun¨ achst den Fundamentalsatz der Algebra beweisen. Dieser Satz besagt, dass jedes Polynom P (z) als Produkt von Ausdr¨ ucken der Form z−z0 dargestellt werden kann. Warum das wichtig ist, sollte dann bei der Zusammenstellung einiger Ergebnisse aus der Theorie der gew¨ohnlichen Differentialgleichungen deutlich werden. (Eine gew¨ohnliche Differentialgleichung ist eine Gleichung, in der eine Funktion, die unabh¨angige Ver¨anderliche, die erste und/oder auch h¨ ohere Ableitungen vorkommen. Typisches Beispiel: Bestimme eine Funktion f , f¨ ur die stets f (x) = xf (x) − 2f (x) gilt.)
4.1
Differenzierbare Funktionen
Erinnern Sie sich bitte zun¨achst an die ε-δ-Definition der Stetigkeit. Stark vereinfacht l¨asst sich doch sagen: Ist f stetig bei x0 , so verh¨ alt sich f in der N¨ ahe von x0 wie die konstante Funktion x → f (x0 ). R
f
f (x0 )
x0
R
Bild 4.1: Approximation durch eine konstante Funktion Ganz ¨ahnlich kann man sich dem Differenzierbarkeitsbegriff n¨ ahern, der den meisten Lesern bereits aus der Schule bekannt sein d¨ urfte. Wir werden (pr¨ azise Definitionen folgen!) f bei x0 differenzierbar nennen, wenn f in der N¨ ahe“ von ” x0 sehr gut“ durch eine Gerade approximiert werden kann (das ist nat¨ urlich ” die Tangente aus der Schulmathematik):
4.1. DIFFERENZIERBARE FUNKTIONEN R
231 f
bei ente g n Ta
0) x ( f x 0,
x0
R
Bild 4.2: Approximation durch eine Gerade Nun haben Geraden g die Form x → α · x + β, wobei α die Steigung ist. Daraus folgt: Geht g durch den Punkt (x0 , y0 ), so muss y0 = αx0 + β gelten, und daraus ergibt sich durch Einsetzen von x = x0 + h die Formel g(x0 + h) = y0 + h · α. F¨ ur unsere Zwecke heißt das, dass Differenzierbarkeit die Existenz einer Zahl α bedeutet (die der Steigung der Tangente entspricht), so dass f¨ ur kleine“ h stets ” f (x0 + h) ≈ f (x0 ) + αh ist. Schon dieser naive Ansatz macht klar, dass wir uns – anders als im Abschnitt Stetigkeit – auf die Untersuchung von Funktionen beschr¨ anken m¨ ussen, f¨ ur die in Urbild- und Bildbereich nicht nur ein Abstandskonzept, sondern auch algebraische Strukturen vorgegeben sind. Anders als in Kapitel 3 geht es also hier nicht um beliebige metrische R¨aume, wir werden in diesem Abschnitt lediglich Funktionen zwischen Teilmengen von K betrachten, wobei wie u ¨ blich K = R oder K = C ist2) . Wir betrachten noch einmal den Ausdruck f (x0 + h) ≈ f (x0 ) + αh. Den kann man doch auch dazu verwenden, das noch unbekannte α zu finden: Wenn die Approximation f¨ ur sehr kleine h“ wirklich sehr gut ist, muss doch α n¨ ahe” rungsweise den Wert f (x0 + h) − f (x0 ) h haben. Dieser Ausdruck heißt der Differenzenquotient und ist gleich der Steigung der Sekante zwischen den Punkten x0 , f (x0 ) und x0 + h, f (x0 + h) des Graphen von f : 2) Das Thema wird am Ende von Band 2 der Analysis“ noch einmal aufgegriffen werden, ” dann sollen Funktionen behandelt werden, die auf Teilmengen des Rm definiert sind, die also von mehreren Ver¨ anderlichen abh¨ angen.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
232
R
x0 , f (x0 )
x0 + h, f (x0 + h) ⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ f (x0 + h) − f (x0 ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
h = (x0 + h) − x0
f R
x0
x0 + h
Bild 4.3: Der Differenzenquotient Damit sind die n¨achsten Schritte vorgezeichnet: Wir werden zun¨ achst sagen, was f (x0 + h) − f (x0 ) lim h→0 h h=0
oder, gleichwertig, lim
x→x0 x=x0
f (x) − f (x0 ) x − x0
bedeutet, um dann mit Hilfe dieser Definition den Begriff Differenzierbarkeit ” aren zu k¨ onnen. bei x0“ (d.h., dieser Limes existiert) erkl¨ Wir beginnen also mit einem allgemeinen Exkurs u lim : ¨ber x→x 0
x=x0
Definition 4.1.1. Es sei M ein beliebiges Intervall in R oder eine offene Teilmenge von C . Weiter sei x0 ein beliebiger Punkt aus M . (Man beachte, dass es dann Folgen in M \ {x0 } gibt, die gegen x0 konvergieren.) Ist dann g : M \ {x0 } → K eine Funktion und α ∈ K , so sagen wir, dass lim g(x) = α
x→x0 x=x0
gilt 3) , falls die Folge g(xn ) f¨ ur alle Folgen (xn )n∈N in M \ {x0 } mit xn → x0 gegen α konvergent ist. 3) In
Worten: Der Limes von g(x) f¨ ur x gegen x0 , x ungleich x0 , ist gleich α.“ ”
4.1. DIFFERENZIERBARE FUNKTIONEN R
233 g
⎫ ⎪ ⎪ ⎪ ⎪ ⎪ ⎬ ⎪ ⎪ ⎪ ⎪ ⎪ ⎭
α
x0 Bild 4.4:
lim
x→x0 , x=x0
R
g(x) = α anschaulich
Bemerkungen und Beispiele: 1. x→x lim g(x) = α bedeutet gerade: Es ist m¨oglich, die Definition von g durch 0
x=x0
g(x0 ) := α so auf ganz M zu erweitern, dass g bei x0 stetig wird (das folgt sofort aus Satz 3.3.4(i)). Man sagt daher auch, dass g bei x0 stetig erg¨anzt werden kann, falls x→x lim g(x) existiert. 0
x=x0
Wegen Satz 3.3.4(i) gilt auch: x→x lim g(x) existiert und ist gleich α genau dann, 0
x=x0
wenn es zu jedem ε > 0 ein δ > 0 so gibt, dass |g(x) − α| ≤ ε f¨ ur alle x ∈ M mit 0 < |x − x0 | ≤ δ. 2. Da konvergente Folgen nur einen Limes haben, ist das α in Definition 4.1.1 eindeutig bestimmt, falls es existiert. 3. In der Definition hatten wir gefordert, dass es eine Zahl α so geben soll, dass g(xn ) → α f¨ ur alle gegen x0 konvergenten Folgen (xn ) gilt, f¨ ur die xn = x0 f¨ ur ¨ alle n ist. Uberraschenderweise ist das a quivalent dazu, dass f¨ u r solche Folgen ¨ (xn ) die Folge g(xn ) n∈N irgendwohin“ konvergent ist. Man fordert also nicht, ” dass f¨ ur alle (xn ) die Limites der g(xn ) n∈N gleich sind. Dass das gleichwertig ist, sieht man so ein: Wir w¨ ahlen irgendeine Folge xn in M \ {x0 } mit xn → x0 und definieren α := lim g(xn ); dieser Limes soll ja nach Voraussetzung existieren. Nun sei (yn ) eine weitere derartige Folge. Wir wissen, dass β := lim g(yn ) existiert, und wir behaupten, dass α = β gilt. Das kann man durch Betrachtung der Mischfolge“ (x1 , y1 , x2 , y2 , . . .) ein” sehen. Sie liegt in M \ {x0 } und konvergiert gegen x0 , damit muss der Limes von g(x1 ), g(y1 ), g(x2 ), g(y2 ), . . . existieren (wir wollen ihn mit γ bezeichnen). Die Folgen g(xn ) und g(yn ) sind Teilfolgen der Folge g(x1 ), g(y1 ), g(x2 ), g(y2 ), . . . , auch sie gehen also gegen γ. Folglich gilt α = γ = β, und damit ist die Behauptung bewiesen.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
234
In diesem Fall liegt also eine der seltenen Situationen vor, in denen doch einmal aus ∀ ∃ die Aussage ∃ ∀ folgt4) .
4. Es folgen einige einfache Beispiele: • Man definiere g : R \ {0} → R durch x → xx . Dann ist offensichtlich lim g(x) = 1,
x→0 x=0
denn konstante Folgen sind konvergent. (Man kann zwar g nicht direkt bei 0 definieren – was sollte denn 0/0 bedeuten –, aber eigentlich“ ist g die konstante Funktion 1.) ” Ganz analog ergibt sich lim g(z) = 1, wenn wir g : C \ {0} → C durch z →
z→0 z=0
z z
definieren.
• Wieder betrachten wir ein g : R \ {0} → R , diesmal soll g durch die Vorschrift g(x) := −1 f¨ ur x < 0 und durch g(x) := 1 f¨ ur x > 0 definiert sein. In diesem Fall existiert lim g(x) nicht , denn man kann eine gegen 0 x→0 x=0
konvergente Folge mit abwechselnd positiven und negativen Folgengliedern w¨ahlen, und als Bildfolge unter g entsteht dann die Folge (1, −1, 1, −1, . . .), die nicht konvergent ist. 5. Es gibt einige verwandte Definitionen, die nicht ausf¨ uhrlich erl¨ autert zu werden brauchen, etwa: • lim+ g(x) = α bedeutet: F¨ ur xn → x0 (alle xn > x0 ) ist lim g(xn ) = α. x→x0
Als Beispiel f¨ ur einen einseitigen Limes betrachten wir M = [ 0, +∞ [ und x0 = 0. Ist dann g : ] 0, +∞ [ → R durch g(x) := x2 /x definiert, so geht es in Wirklichkeit um die Abbildung x → x. Deswegen sollte klar sein, dass lim g(x) = 0 gilt. x→0 x=0
•
lim g(x) = α bedeutet: F¨ ur jede reelle Folge (xn ) mit xn → +∞ ist
x→+∞
lim g(xn ) = α. Analog sind Ausdr¨ ucke wie lim− g(x) und lim g(x) zu interpretieren. x→−∞
x→x0
anzung einfach so fin6. Falls g auf M \ {x0 } stetig ist, kann man die stetige Erg¨ den: Man suche ein stetiges G : M → K , das auf M \ {x0 } mit g u ¨ bereinstimmt. Aus Satz 3.3.4 folgt dann, dass x→x lim g(x) = G(x0 ) gelten muss5) . 0
x=x0 4) Die
umgekehrte Implikation gilt ja stets. einfach geht es leider nicht immer. Wir werden aber in Abschnitt 4.2 eine weitere Technik zur Bestimmung von x→x lim kennen lernen, die l’Hˆ opitalschen Regeln. 5) So
0
x=x0
4.1. DIFFERENZIERBARE FUNKTIONEN
235
Beispiele dazu: • lim
x→0 x=0
x = 1 (betrachte G = 1, das entspricht unserem ersten Beispiel), x
x2 − 1 = 2 (setze G : x → x + 1), x→1 x − 1
• lim
x=1
2wz + z 2 = 2w (betrachte G : z → 2w + z). z→0 z
• lim
z=0
Wir sind nun in der Lage, den Begriff Differenzierbarkeit“ einzuf¨ uhren. Da ” gr¨ oßtm¨ ogliche Allgemeinheit nicht angestrebt ist – sie w¨ urde eher verwirren, und die interessanteren Ergebnisse u ¨ ber differenzierbare Funktionen gelten sowieso nur in Spezialf¨ allen – beschr¨anken wir uns in der folgenden Definition auf die Betrachtung sch¨ oner“ Definitionsbereiche: ” Definition 4.1.2. Es sei K = R oder K = C und M eine nicht leere Teilmenge von K . Im Fall K = C soll M eine offene Teilmenge, im Fall K = R ein beliebiges Intervall sein. Weiter sei f : M → K eine Funktion und x0 ∈ M . (i) f heißt bei x0 differenzierbar, falls
differenzierbar
f (x0 + h) − f (x0 ) h→0 h lim
h=0
existiert, dieser Limes soll dann mit f (x0 ) bezeichnet werden. f (x0 ) (gesprochen f Strich von x0“) heißt die Ableitung von f bei x0 . ” (ii) Ist f bei allen x ∈ M differenzierbar, so heißt f auf M differenzierbar. Unter f : M → K wollen wir dann die Funktion x → f (x) (die Ableitung von f ) verstehen. Diese f¨ ur die Analysis sehr wichtige Definition soll nun ausf¨ uhrlich erl¨ autert werden: Bemerkungen und Beispiele: 1. f ist also bei x0 differenzierbar, und zwar mit Ableitung f (x0 ), falls f¨ ur jede Folge (xn )n∈N in M mit xn = x0 (f¨ ur alle n) und xn → x0 die Folge f (xn ) − f (x0 ) xn − x0 n∈N gegen f (x0 ) konvergiert. Um das einzusehen, muss man nur von x-Werten, die nahe bei x0 liegen, durch h := x − x0 zu h-Werten u ahe ¨bergehen, die in der N¨ der Null liegen.
f (x0 )
Ableitung von f
236
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Folglich ist f bei x0 nicht differenzierbar, falls es mindestens eine Folge f (xn ) − f (x0 ) (xn )n∈N gibt, so dass nicht konvergiert. xn − x0 n∈N Als Beispiel betrachte man x → |x| bei x0 = 0. W¨ ahlt man xn = (−1)n /n, f (xn ) − f (x0 ) = (−1)n und diese Folge ist nicht konvergent. Also ist so ist xn − x0 x → |x| bei x = 0 nicht differenzierbar. 2. Differenzierbarkeit bei x0 bedeutet doch nach Bemerkung 1 auf Seite 233: f (x0 + h) − f (x0 ) − f (x0 ) ≤ ε. h f (x ) ε>0 δ>0 h∈K
∃ ∀∃ ∀ 0
|h|≤δ x0 +h∈M
Die letzte Ungleichung kann man nach Multiplikation mit h als f (x0 + h) = f (x0 ) + hf (x0 ) + Fehler schreiben, wo der Betrag des Fehlers durch ε|h| abgesch¨ atzt werden kann. In diesem Sinne ist Differenzierbarkeit als Approximierbarkeit durch lineare Abbildungen zu verstehen. Man beachte den Unterschied zur Stetigkeit: • Ist f stetig bei x0 , so kann man garantieren, dass f (x0 + h) f¨ ur kleine“ h bis auf einen Fehler ≤ ε mit f (x0 ) u ¨ bereinstimmt. ” • Differenzierbarkeit bedeutet viel mehr. Auch da kann man sich ein ε > 0 w¨ unschen, doch dann weiß man sogar, dass der Unterschied ur gen¨ ugend kleine“ h zwischen f (x0 + h) und f (x0 ) + hf (x0 ) f¨ ” h¨ ochstens ε|h| ist.
3. Man betrachte die konstante Abbildung f : z → w0 , wobei w0 ∈ K eine beliebige Zahl ist. F¨ ur jedes z0 ∈ K und jede Folge hn → 0 (alle hn = 0) ist dann w0 − w0 f (z0 + hn ) − f (z0 ) = = 0. hn hn Folglich ist f (z0 ) = 0 f¨ ur jedes z0 ∈ K . ¨ Ahnlich leicht ergibt sich: Ist f (z) = az (wo a ∈ K fest), so ist f (z0 ) = a f¨ ur jedes z0 ∈ K . Etwas mehr aber muss man schon im Fall der Abbildung z → f (z) := z 2 u ¨ berlegen. Hier ist f (z0 + hn ) − f (z0 ) (z0 + hn )2 − z02 = = 2z0 + hn , hn hn und dieser Ausdruck konvergiert f¨ ur hn → 0 offensichtlich gegen 2z0 . Damit ist f¨ ur jedes z0 ∈ K gezeigt, dass f (z0 ) = 2z0 gilt.
4.1. DIFFERENZIERBARE FUNKTIONEN
237
In Kurzschreibweise liest sich das so: (w0 ) (az)
= =
0 a
(z 2 )
=
2z.
Unendlich kleine Gr¨ oßen Wir versetzen uns nun einmal um etwas mehr als 300 Jahre zur¨ uck, da wurde die Analysis von Newton6) und Leibniz entwickelt. Sie wurde damals Infinitesimalrechnung genannt, man muss wohl davon ausgehen, dass sich die Gr¨ underv¨ater wirklich so etwas wie unend” lich kleine Gr¨ oßen“ beim Arbeiten vorgestellt haben. F¨ ur Leibniz etwa war die Steigung der Tangente die Steigung der Hypotenuse in einem unendlich kleinen Dreieck, dasjenige, das sich im Grenzfall aus den Sekantendreiecken der vorstehenden Skizzen ergibt. Sie sind in guter Gesellschaft, wenn Sie mit dieser Interpretation Probleme haben, heute kann man kaum glauben, dass unendlich kleine Gr¨ oßen bis in die Zeit von Cauchy und Weierstrass7) , also bis in die Mitte des 19. Jahrhunderts, zum Handwerkszeug der Mathematiker geh¨orten. Aus der Anfangszeit der Analysis hat noch eine Schreibweise u ¨ berlebt, der Differentialquotient: Fr¨ uher schrieb man f¨ ur Funktionen ur die Ableitung – statt f meist y (etwa y = x3 − 2x + 1), und f¨ dy die wir y nennen w¨ verwendet. Verurden – wurde das Symbol dx mutlich hat sich Leibniz die Steigung einer Funktion in einem Punkt wirklich als den Quotienten aus Gegenkathete (= dy) und Ankathete = dx) vorgestellt, wobei dy und dx unendlich klein sind. dy Sie sollten als gleichwertig zur Ableitung auffassen und niemals dx (!) die Ausdr¨ ucke dy und dx als eigenst¨andige Gr¨ oßen verwenden. (Jedenfalls so lange, bis beim Thema Integration durch Substituti” on“ eine praktische Faustregel erl¨autert wird, die vom Differentialquotienten Gebrauch macht. In der Theorie der Differentialformen ist es m¨ oglich, f¨ ur dy und dx eine sinnvolle Interpretation anzugeben. Die hat mit unendlich kleinen Gr¨oßen allerdings u ¨ berhaupt nichts zu tun.) 6) Es gibt nur wenige Werke, die einen derartigen Einfluss hatten wie Newtons Principia ” mathematica“ von 1687. Darin wurde u ¨berzeugend nachgewiesen, dass man wichtige Aspekte der Welt durch mathematische Modelle quantitativ beschreiben kann. Um dieses Programm konkretisieren zu k¨ onnen, entwickelte Newton – unabh¨ angig von Leibniz – eine Differentialund Integralrechnung. 7) Weierstraß arbeitete zun¨ achst als Lehrer, erst sp¨ at wurde er Professor an der Berliner Universit¨ at. Er ver¨ offentlichte wichtige Beitr¨ age in verschiedenen mathematischen Teilgebieten.
238
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Es wird Sie nicht weiter u ¨ berraschen: Das weitere Vorgehen gleicht dem der vorhergehenden Kapitel, wann immer wir einen neuen wichtigen Begriff (Konvergenz, Stetigkeit, Kompaktheit, . . . ) eingef¨ uhrt haben. Zum einen m¨ ussen wir uns darum k¨ ummern, m¨oglichst viele konkrete Funktionen als differenzierbar zu erkennen. Das wird auf sp¨atere Abschnitte vertagt; bis dahin ist unsere Beispielsammlung wirklich recht mager. Dar¨ uber hinaus haben wir zu untersuchen, inwieweit sich aus differenzierbaren Funktionen durch Zusammensetzen neue differenzierbare Funktionen gewinnen lassen. Ein derartiger Permanenzsatz“ soll als N¨ achstes in Angriff genom” men werden. Er besagt, dass so gut wie alle Operationen zul¨ assig sind. (Einzige Ausnahme: Aus f differenzierbar“ folgt nicht notwendig |f | : x → |f (x)| dif” ” ferenzierbar“.) Ist also zum Beispiel die Differenzierbarkeit von x → x2 , x → x3 √ und x → x bereits gezeigt, so ergibt sich sofort die Differenzierbarkeit von x3 + 1 x → √ . 2 + x2
Isaac Newton 1643 – 1727
Allgemeiner k¨onnen Sie sich schon auf die praktische Faustregel freuen, dass alles, was man geschlossen als Formel hinschreiben kann, eine differenzierbare Funktion darstellt. (Aber Achtung: In dieser Formel d¨ urfen keine Betragsstriche vorkommen.) Als erstes Ergebnis zeigen wir, dass differenzierbare Funktionen spezielle Beispiele f¨ ur stetige Funktionen sind. Satz 4.1.3. M und f seien wie in Definition 4.1.2. Ist dann f bei x0 ∈ M differenzierbar, so ist f bei x0 stetig. Bemerkung: Die Umkehrung gilt nicht, stetige Funktionen sind im Allgemeinen nicht differenzierbar. Es reicht, auf die Funktion x → |x| hinzuweisen, die bei 0 zwar stetig, aber dort nicht differenzierbar ist. Die ganze Wahrheit ist dramatischer: Es gibt stetige Funktionen f auf R , die an keiner Stelle differenzierbar sind. So ein f kann man sich schwer vorstellen. Weierstrass hat als erster ein Beispiel angegeben: Die Funktion
Karl Theodor Weierstrass 1815 – 1897
∞
f (x) := n=0
cos(an πx) bn
hat die geforderten Eigenschaften, falls b > 1 und a/b > 1 + 3π/2 gilt. (Das ist nicht offensichtlich, der ziemlich schwierige Beweis soll hier nicht gef¨ uhrt werden.)
Beweis: Wir wollen zeigen, dass aus xn → x0 stets f (xn ) → f (x0 ) folgt (womit wegen Satz 3.3.4(i) alles bewiesen ist). Es reicht offensichtlich, das f¨ ur solche ur die zus¨ atzlich xn = x0 (alle n ∈ N ) gilt8) . Folgen (xn )n∈N in M zu zeigen, f¨ 8) Das ist deswegen plausibel, weil die x mit x = x f¨ → ? f (x0 ) unn n 0 ur die Frage f (xn ) − problematisch sind. Wenn Ihnen das zu unpr¨ azise sein sollte: Der Beweis von 3.3.4(i) zeigt sogar, dass – mit den Bezeichnungen dieses Satzes – f bei x0 genau dann stetig ist, wenn ur alle (xn )n∈N in M mit xn → x0 und xn = x0 (alle n ∈ N ) gilt. f (xn ) → f (x0 ) f¨
4.1. DIFFERENZIERBARE FUNKTIONEN
239
Ist aber (xn )n∈N eine derartige Folge, so haben wir nur die konvergenten Folgen f (xn ) − f (x0 ) xn − x0 xn − x0
→ f (x0 ) → 0
miteinander zu multiplizieren, um mit Satz 2.2.12 die Aussage f (xn )−f (x0 ) → 0 zu erhalten. Satz 4.1.4 (Permanenzsatz). M , M1 und M2 seien wie in Definition 4.1.2 gegeben. Dann gilt: (i) Sind f und g Abbildungen von M nach K , die beide bei x0 ∈ M differenzierbar sind, so ist auch f + g bei x0 differenzierbar. Es gilt (f + g) (x0 ) = f (x0 ) + g (x0 ). (ii) Aus der Differenzierbarkeit von f : M → K bei x0 ∈ M folgt, dass auch af bei x0 differenzierbar ist (f¨ ur alle a ∈ K ). Es gilt (af ) (x0 ) = a · f (x0 ). (iii) Sind f, g : M → K bei x0 ∈ M differenzierbar, so auch f · g. F¨ ur die Ableitung gilt die Produktregel:
Produktregel
(f · g) (x0 ) = f (x0 )g(x0 ) + f (x0 )g (x0 ). (iv) f : M1 → M2 sei bei x0 ∈ M1 und g : M2 → K bei f (x0 ) differenzierbar. Dann ist auch g ◦ f : M1 → K bei x0 differenzierbar, und es gilt die Kettenregel: (g ◦ f ) (x0 ) = g f (x0 ) · f (x0 ). (v) f, g : M → K seien bei x0 ∈ M differenzierbar, und es gelte g(x) = 0 f¨ ur alle x ∈ M . Dann ist f /g : M → K bei x0 differenzierbar, und die Ableitung l¨asst sich nach der Quotientenregel berechnen: f f (x0 )g(x0 ) − f (x0 )g (x0 ) (x0 ) = . ' &2 g g(x0 ) (vi) Ist K = R , M ⊂ R ein offenes Intervall und f : M → R streng monoton steigend 9) , so gilt f¨ ur die inverse Funktion 10) f −1 : Falls f bei x0 ∈ M differenzierbar ist mit f (x0 ) = 0, so ist f −1 bei f (x0 ) differenzierbar. Es gilt dann 1 . (f −1 ) f (x0 ) = f (x0 ) Die gleiche Aussage gilt f¨ ur streng monoton fallende Abbildungen. 9) D.h., f¨ ur alle x1 , x2 ∈ M mit x1 < x2 ist f (x1 ) < f (x2 ). Streng monoton fallend“ ist ” dadurch definiert, dass aus x1 < x2 stets f (x1 ) > f (x2 ) folgt. 10) Zur Erinnerung: f −1 ist diejenige Funktion, f¨ −1 ur die (f ◦ f )(x) = x und (f −1 ◦ f )(x) = x (f¨ ur alle x)√gilt. F¨ ur f (x) = xn etwa, aufgefasst als Funktion von ] 0, +∞ [ nach ] 0, +∞ [, ist f −1 (x) = n x.
Kettenregel
Quotientenregel
Ableitung von Inversen
240
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Beweis: (i) Sei (xn )n∈N eine Folge in M mit xn → x0 (sowie xn = x0 f¨ ur alle n ∈ N ). Es ist zu zeigen, dass (f + g)(xn ) − (f + g)(x0 ) → f (x0 ) + g (x0 ). xn − x0 Nun gilt aber g(xn ) − g(x0 ) f (xn ) − f (x0 ) → f (x0 ) und → g (x0 ) xn − x0 xn − x0 nach Voraussetzung, und daraus folgt die Behauptung sofort unter Beachtung von Satz 2.2.12 (Rechenregel f¨ ur konvergente Folgen) und der Gleichung (f + g)(xn ) − (f + g)(x0 ) f (xn ) − f (x0 ) g(xn ) − g(x0 ) = + . xn − x0 xn − x0 xn − x0 (ii) Das folgt wie in (i) aus bekannten Resultaten u ¨ber konvergente Folgen. Man beachte hier, dass (af )(xn ) − (af )(x0 ) f (xn ) − f (x0 ) =a· . xn − x0 xn − x0 (iii) Wir m¨ ussen die Differenzenquotienten der Funktion f · g untersuchen, f¨ ur xn → x0 sollen sie gegen f (x0 )g(x0 ) + f (x0 )g (x0 ) konvergieren. Es ist aber (f · g)(xn ) − (f · g)(x0 ) xn − x0
(f · g)(xn ) − f (xn )g(x0 ) + xn − x0 f (xn )g(x0 ) − (f · g)(x0 ) + xn − x0 g(xn ) − g(x0 ) f (xn ) − f (x0 ) = f (xn ) + g(x0 ) , xn − x0 xn − x0 =
und diese Folge konvergiert gegen f (x0 )g(x0 ) + f (x0 )g (x0 ). Hier wurde Satz 4.1.3 angewandt, nach diesem Satz ist f bei x0 stetig, und deswegen konvergiert die Folge f (xn ) n∈N gegen f (x0 ). (iv) Wieder ist von einer Folge (xn )n∈N mit xn → x0 und xn = x0 f¨ ur alle n auszugehen. Es soll g f (xn ) − g f (x0 ) → g f (x0 ) · f (x0 ) xn − x0 gezeigt werden. Die Idee dazu ist einfach. Man schreibt (versuchsweise) g f (xn ) − g f (x0 ) g f (xn ) − g f (x0 ) f (xn ) − f (x0 ) · = , xn − x0 f (xn ) − f (x0 ) xn − x0
(4.1)
4.1. DIFFERENZIERBARE FUNKTIONEN
241
und dann ist man wegen f (xn ) → f (x0 ) – das folgt wieder aus Satz 4.1.3 – fertig. Doch leider ist diese Argumentation l¨ uckenhaft, denn es muss nicht notwendig f (xn ) = f (x0 ) sein, so dass man vielleicht gar nicht durch f (xn ) − f (x0 ) teilen d¨ urfte. Der nun folgende Beweis besteht darin, diese L¨ ucke durch einen kleinen Umweg zu schließen: Wir definieren eine neue Funktion Φg : M2 → K durch ⎧ ⎨ g(y) − g(f (x0 )) y = f (x ) 0 y − f(x0 ) Φg (y) := ⎩ g f (x0 ) y = f (x0 ). ur jedes x ∈ M1 ist Φg ist stetig bei f (x0 ) nach Voraussetzung, und f¨ (g ◦ f )(x) − (g ◦ f )(x0 ) = f (x) − f (x0 ) · (Φg ◦ f )(x). (Das zeigt man durch Fallunterscheidung nach f (x) = f (x0 ) bzw. = f (x0 ) durch Nachrechnen. Der zweite Fall entspricht Gleichung (4.1).) Folglich ist g f (xn ) − g f (x0 ) f (xn ) − f (x0 ) = · Φg f (xn ) , xn − x0 xn − x0 und die rechte Seite konvergiert f¨ ur n → ∞ gegen g f (x0 ) f (x0 ). Man beachte dabei, dass wegen Satz 4.1.3 und Satz 3.3.5 mit Φg auch Φg ◦ f stetig ist. (v) Wir behandeln zun¨achst den Spezialfall f = 1. Es ist (1/g)(xn ) − (1/g)(x0 ) g(xn ) − g(x0 ) 1 · − = , xn − x0 g(xn )g(x0 ) xn − x0 und die rechte Seite konvergiert mit xn → x0 gegen g (x0 ) − 2 . g(x0 ) Zum Beweis der Behauptung f¨ ur beliebige f schreiben wir f /g als f · (1/g) und wenden (iii) an: f 1 g (x0 ) (x0 ) = f (x0 ) · (x0 ) − f (x0 ) · 2 g g g(x0 ) f (x0 )g(x0 ) − f (x0 )g (x0 ) = , 2 g(x0 ) und das war gerade die Behauptung. (vi) Sei etwa f streng monoton steigend.
242
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) R
f
f (x)
y
f −1 (y)
x
R
Bild 4.5: Eine streng monoton steigende Funktion f Wir gehen von einer Folge (yn )n∈N im Bildbereich von f mit yn → f (x0 ) aus, so dass alle yn von f (x0 ) verschieden sind. Es ist f −1 (yn ) − f −1 f (x0 ) 1 → yn − f (x0 ) f (x0 ) ur geeignete xn ∈ M . Wegen zu zeigen. Dazu schreiben wir yn als yn = f (xn ) f¨ yn = f (x0 ) gilt xn = x0 f¨ ur alle n ∈ N . Wenn wir beweisen k¨ onnten, dass xn → x0 gilt, w¨are wie folgt weiterzuschließen: ( f −1 (yn ) − f −1 f (x0 ) xn − x0 f (xn ) − f (x0 ) = =1 , yn − f (x0 ) f (xn ) − f (x0 ) xn − x0 und die rechte Seite konvergiert wegen der Differenzierbarkeit von f gegen 1/f (x0 ). Wir m¨ ussen also nur noch zeigen, dass limn→∞ xn = x0 gilt. W¨are das nicht der Fall, so g¨abe es ein ε > 0 und unendlich viele Indizes n mit xn ≤ x0 − ε (oder unendlich viele Indizes n mit xn ≥ x0 + ε). Dann aber w¨ are f¨ ur diese n wegen der Monotonie von f auch yn = f (xn ) ≤ f (x0 − ε) < f (x0 ) bzw. yn ≥ f (x0 + ε) > f (x0 ) im Widerspruch dazu, dass wir yn → f (x0 ) vorausgesetzt hatten.
Bemerkungen: 1. Wenn wir die Produktregel (Satz 4.1.4(iii)) mit der schon bewiesenen Aussage x = 1 kombinieren, so erhalten wir (x2 ) = x · x + x · x = 2x, und daraus ergibt sich (x3 ) = (x · x2 ) = x · x2 + x · (x2 ) = 3x2 .
4.1. DIFFERENZIERBARE FUNKTIONEN
243
Durch vollst¨ andige Induktion kann mit diesem Verfahren leicht die allgemeine Regel (xn ) = nxn−1 hergeleitet werden, das einzige, was zum Beweis noch fehlt, ist der Induktionsschritt: (xn+1 ) = (x · xn ) = x · xn + x · (xn ) = xn + x · n · xn−1 = (n + 1)xn . Verwendet man dieses Ergebnis zusammen mit Satz 4.1.4(i),(ii), so lassen sich sofort die Ableitungen beliebiger Polynome11) berechnen. Zum Beispiel gilt: (3 − 6x + 2x4 )
= −6 + 8x3
1001
(3x − 200x 9
= 27x8 − 200200x1000.
)
2. Hier sind die Formeln aus Satz 4.1.4 noch einmal in Kurzform zusammengestellt: (f + g) (af ) (f · g) (g ◦ f ) f g −1 (f ) f (x)
= f + g = af = f g + f g
(Produktregel)
= (g ◦ f ) · f
(Kettenregel)
= =
f g − fg g2 1 f (x)
(Quotientenregel) (Inverse)
In Verbindung mit schon bekannten oder sp¨ater zu beweisenden Formeln f¨ ur die Ableitung spezieller Funktionen erm¨oglichen die Regeln dieser Tabelle die Berechnung von f f¨ ur alle f , die in geschlossener Form“ aus einfachen ” Bausteinen“ zusammengesetzt werden k¨onnen. ” 3. Die Formel f¨ ur (f −1 ) in (vi) brauchen Sie nicht auswendig zu lernen. Man erh¨ alt sie, wenn man unter Anwendung der Kettenregel die Identit¨ at (f −1 ◦ f )(x) = x differenziert: Die rechte Seite ergibt als Ableitung die 1, die linke wird zu (f −1 ) f (x) · f (x), und dann muss nur noch durch f (x) geteilt werden. Diese Beobachtung h¨atte uns den Beweis von (vi) jedoch nicht erspart, denn die Kettenregel ist ja erst anwendbar, wenn die Differenzierbarkeit von f −1 gesichert ist. 11) Zur Erinnerung: Das sind Funktionen der Form a + a x + · · · + a n−1 + a xn , wobei n 0 1 n−1 x die a0 , . . . , an beliebige Elemente aus K sind.
244
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
4. Die Aussage in (vi) muss in der Regel noch umgeschrieben werden, um zu einer f¨ ur die Anwendungen bequemen Form zu f¨ uhren. Als Beispiel betrachten √ wir f (x) := xn (definiert f¨ ur x > 0). f −1 ist hier die Funktion y → g(y) := n y. Aufgrund von (vi) wissen wir, dass 1 nxn−1 √ gilt, doch liefert das noch keine Formel f¨ ur ( n x) . Dr¨ uckt man aber xn−1 durch n x aus, so wird daraus 1 g (xn ) = n−1 , n(xn ) n g (xn ) =
und wenn man noch den Variablennamen dadurch ab¨ andert, dass man xn durch y ersetzt, so folgt 1 g (y) = 1 . 1− ny n In Kurzform (und jetzt schreiben wir wieder x statt y): √ 1 1 1 ( n x) = (x n ) = · x n −1 . n (Kombiniert man dieses Ergebnis mit der Regel (xm ) = mxm−1 f¨ ur nat¨ urliche Zahlen m, so folgt daraus mit der Kettenregel sofort (xm/n ) =
m (m/n)−1 ·x . n
Auch der Fall negativer m kann so behandelt werden, insgesamt ist damit die Ableitungsregel (xr ) = r · xr−1 f¨ ur alle rationalen Zahlen r bewiesen. Mehr zu diesem Thema finden Sie in Korollar 4.5.8.)
Ableitungen inverser Funktionen Das eben beschriebene Verfahren l¨ asst sich immer anwenden, um eine Formel f¨ ur die Ableitung von f −1 zu finden: 1. Schritt: Berechne 1/f (x). 2. Schritt: Schreibe diese Funktion von x als Funktion von y := f (x). Jedes x ist also durch den Ausdruck f −1 (y) zu ersetzen. Vereinfache so weit wie m¨oglich. Damit ist (f −1 ) f (x) = (f −1 ) (y) als Funktion von y bekannt. 3. Schritt: Ersetze noch alle y durch x. Hier ein weiteres Beispiel dazu: In Abschnitt 4.5 werden wir die trigonometrischen Funktionen einf¨ uhren. Bezeichnet man mit arcsin die inverse Funktion zur Sinusfunktion sin x, so folgt aus (sin x) = cos x mit (vi): arcsin (sin x) =
1 . cos x
¨ 4.2. MITTELWERTSATZE
245
Beachtet man nun noch, dass cos x =
1 − sin2 x, so ergibt sich die Formel:
1 . (arcsin x) = √ 1 − x2
4.2
Mittelwerts¨ atze
Stellen Sie sich vor, dass Sie mit Ihrem Wagen einen Tagesausflug in eine sehr gebirgige Gegend machen. Ist dann der Zielort genauso hoch u ¨ ber dem Meeresspiegel wie der Ausgangsort, so kann es nicht immer nur bergauf“ oder immer ” ” nur bergab“ gehen, mindestens einmal wird Ihr Wagen genau waagerecht stehen. Der folgende Satz kann als abstrakte Formulierung dieser Erfahrungstatsache angesehen werden. (Wobei Bemerkung 3 am Ende von Kapitel 3 sinngem¨ aß zu wiederholen ist: Die G¨ ultigkeit dieses Satzes zeigt einmal mehr, dass wir einen im Hinblick auf die Anwendungen sinnvollen Weg der Axiomatisierung gew¨ ahlt haben.) Satz 4.2.1 (Satz von Rolle12) ). Sei f : [ a, b ] → R eine Funktion. Gilt dann • f ist differenzierbar auf ] a, b [, • f ist stetig auf [ a, b ], • f (a) = f (b), so gibt es ein x0 ∈ ] a, b [ mit f (x0 ) = 0. R
f
a
x0
R b
Bild 4.6: Skizze zum Satz von Rolle Beweis: Die Beweisidee kann an der vorstehenden Skizze leicht erl¨ autert werden: Man hat die Erwartung, dass ein x0 dann geeignet sein wird, wenn f dort so groß wie m¨ oglich“ ist (bzw. so klein wie m¨oglich“). Es ist ja auch im vor” ” stehend beschriebenen Gebirgsfahrtbeispiel klar“, dass Ihr Wagen waagerecht ” 12) Der Herr war Franzose. Wer es also mit der Aussprache ganz genau nehmen m¨ ochte, sollte Roll“ sagen. ”
Satz von Rolle
246
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
stehen wird, wenn Sie den h¨ochsten bzw. den niedrigsten Punkt Ihres Ausflugs erreicht haben. Dann ist noch zu u ¨berlegen, ob diese Erwartung berechtigt ist und ob man ein derartiges x0 auch wirklich finden kann. So wird sich der Beweis auch f¨ uhren lassen, doch sind einige Sonderf¨ alle zu ber¨ ucksichtigen: Fall 1: Es gibt ein x1 mit f (x1 ) > f (a). R
f
R
a x1
b
Bild 4.7: Fall 1: x1 mit f (x1 ) > f (a) Wir w¨ahlen dann ein x0 ∈ [ a, b ], so dass f (x) ≤ f (x0 ) f¨ ur alle x ∈ [ a, b ] gilt. Ein derartiges x0 existiert nach Satz 3.3.11, denn f ist nach Voraussetzung stetig und [ a, b ] ist kompakt. Es wird gleich wichtig sein zu wissen, dass x0 sogar im Innern des Intervalls liegt: Zur Begr¨ undung ist nur zu bemerken, dass f (x0 ) ≥ f (x1 ) > f (a) = f (b) gilt, und deswegen kann x0 = a oder x0 = b ausgeschlossen werden. Es bleibt f (x0 ) = 0 zu zeigen. Dazu w¨ ahlen wir Folgen (xn )n∈N , (yn )n∈N in [ a, b ] mit xn < x0 < yn f¨ ur alle n ∈ N und lim xn = lim yn = x0 . (Hier ist es wichtig zu wissen, dass x0 im Innern liegt, andernfalls k¨ onnten wir eventuell nur von einer Seite approximieren.) Nach Voraussetzung gilt: f (yn ) − f (x0 ) f (xn ) − f (x0 ) → f (x0 ) und → f (x0 ); xn − x0 yn − x0 dabei ist wegen f (x0 ) ≥ f (xn ) und f (x0 ) ≥ f (yn ) f¨ ur alle n ∈ N auch f (xn ) − f (x0 ) f (yn ) − f (x0 ) ≥ 0 und ≤ 0. xn − x0 yn − x0 Erinnert man sich nun noch daran, dass f¨ ur eine konvergente Folge (an ) reeller Zahlen notwendig lim an ≥ 0 (bzw. lim an ≤ 0) gilt, falls an ≥ 0 (bzw. an ≤ 0) f¨ ur alle n (Satz 2.2.12), so erhalten wir f (x0 ) ≥ 0 und gleichzeitig f (x0 ) ≤ 0. Also muss f (x0 ) = 0 sein.
¨ 4.2. MITTELWERTSATZE
247
Fall 2: f ist die konstante Funktion x → f (a). Dann ist f die konstante Funktion x → 0, und jedes x0 ∈ ] a, b [ hat die geforderte Eigenschaft. Falls nun f¨ ur f weder Fall 1 noch Fall 2 vorliegt, bleibt nur noch Fall 3: Es gibt ein x1 mit f (x1 ) < f (a). R
f
a x1
R b
Bild 4.8: Fall 3: x1 mit f (x1 ) < f (a) Man k¨ onnte nun analog zu Fall 1 weitermachen, wobei man sich diesmal auf einen Minimalwert konzentrieren w¨ urde. Leichter ist es jedoch, −f statt f zu betrachten. F¨ ur −f sind alle Voraussetzungen erf¨ ullt, und f¨ ur −f kann Fall 1 angewendet werden. Es gibt also ein x0 ∈ ] a, b [ mit (−f ) (x0 ) = 0, und wegen (−f ) (x0 ) = −f (x0 ) ist alles gezeigt. Bemerkungen: 1. Auf zwei Feinheiten im Beweis des Satzes von Rolle soll besonders hingewiesen werden. Erstens haben wir erstmals den Satz aus Abschnitt 3.3 verwendet, dass zu stetigen Funktionen auf kompakten metrischen R¨ aumen ein Punkt gefunden werden kann, an dem die Funktion gr¨oßtm¨ oglich wird. Und zweitens sollte man beachten, dass wir die Aussage f (x0 ) = 0 am Ende durch ein ordnungstheoretisches Argument bewiesen haben. F¨ ur komplexwertige Funktionen w¨ are dieser Beweis also nicht zu u ¨ bertragen. ¨ Da ist der Satz im Ubrigen auch falsch. Wenn man im Vorgriff schon einmal die Exponentialfunktion im Komplexen benutzt, die wir erst am Ende dieses Kapitels kennen lernen werden, ist ein Gegenbeispiel leicht anzugeben: Man betrachte einfach die durch x → exp (ix) definierte Funktion f : [ 0, 2π ] → C . Sie ist differenzierbar, es gilt f (0) = f (2π) = 1, und trotzdem existiert kein x0 mit f (x0 ) = 0, da f (x) = i exp(ix) gilt und die Exponentialfunktion nirgendwo verschwindet.
2. Da die Funktion f nach Voraussetzung auf ] a, b [ differenzierbar sein soll, ist sie da auch stetig. Die geforderte Stetigkeit von f auf [ a, b ] betrifft damit in Wirklichkeit nur die Stetigkeit bei a und bei b.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
248
H¨atte man allerdings die ersten beiden Voraussetzungen durch f ist diffe” renzierbar auf [ a, b ]“ ersetzt, so h¨ atte man den G¨ ultigkeitsbereich des Satzes unn¨otig eingeschr¨ankt. (Er w¨are dann nicht mehr f¨ ur Funktionen anwendbar, die – wie z.B. ein Kreisbogen – am Rand des Intervalls zwar stetig sind, aber dort keine Ableitung besitzen.)
?
3. Machen Sie sich klar, dass alle Voraussetzungen wesentlich sind. Finden Sie Beispiele f¨ ur f : [ a, b ] → R , f ist differenzierbar auf ] a, b [, es gilt f (a) = f (b), doch f¨ ur kein x0 ∈ ] a, b [ ist f (x0 ) = 0. f : [ a, b ] → R ist differenzierbar, doch f¨ ur kein x0 ∈ ] a, b [ gilt f (x0 ) = 0. f : [ a, b ] → R ist stetig, es gilt f (a) = f (b), aber f¨ ur kein x0 ist f (x0 ) = 0. Es ist nicht schwer, zwei scheinbar weit allgemeinere Resultate auf den Satz von Rolle zur¨ uckzuf¨ uhren:
Mittelwerts¨ atze
Satz 4.2.2 (Mittelwerts¨atze). (i) Sei f : [ a, b ] → R stetig und auf ] a, b [ differenzierbar. Dann gibt es ein x0 ∈ ] a, b [ mit f (b) − f (a) = f (x0 ) b−a
(erster Mittelwertsatz).
(ii) Ist f wie in (i) und g : [ a, b ] → R eine stetige und auf ] a, b [ differenzierbare Funktion mit g (x) = 0 f¨ ur alle x ∈ ] a, b [, so gibt es ein x0 ∈ ] a, b [ mit f (x0 ) f (b) − f (a) = (zweiter Mittelwertsatz). g(b) − g(a) g (x0 ) Beweis: (i) Wir betrachten statt f die heruntergeklappte Funktion“ ” h : x → f (x) − cx. Dabei muss c so geschickt gew¨ahlt werden, dass f¨ ur die neue Funktion h die Voraussetzungen des Satzes von Rolle erf¨ ullt sind. R
f
R x → f (x) − cx
a
R b Bild 4.9: Die Funktion f
a
R b Bild 4.10: Die Funktion h
¨ 4.2. MITTELWERTSATZE
249
Mit f ist auch h f¨ ur beliebiges c ∈ R auf [ a, b ] stetig und auf ] a, b [ differenzierbar, so dass nur f (a) − ca = h(a) = h(b) = f (b) − cb sichergestellt werden muss. Das f¨ uhrt auf c = f (b) − f (a) /(b − a). Zusammen also: Wir wenden den Satz von Rolle auf x → h(x) := f (x) −
f (b) − f (a) ·x b−a
an und erhalten dadurch ein x0 ∈ ] a, b [ mit h (x0 ) = 0. Nun ist h (x) =
f (b) − f (a) f (b) − f (a) f (x) − · x = f (x) − , b−a b−a
und folglich ist h (x0 ) = 0 ¨aquivalent zur Behauptung. (ii) Wendet man den ersten Mittelwertsatz auf die Funktion g an, so folgt g(b) − g(a) = g (x0 ) = 0 f¨ ur ein geeignetes x0 , es muss also insbesondere b−a g(b) = g(a) sein . Nach dieser notwendigen Vorbereitung (erst jetzt ist die Aussage von (ii) sinnvoll) verl¨auft der Beweis analog zum Beweis von (i): Man wende den Satz von Rolle auf die Funktion h : x → h(x) := f (x) −
f (b) − f (a) · g(x) g(b) − g(a)
an. Es ist didaktisch fragw¨ urdig, aber die Versuchung ist groß: Ich m¨ ochte Ihnen noch einen falschen Beweis zum zweiten Mittelwertsatz anbieten. Bei diesem Beweis“ wird der erste Mittelwertsatz zweimal angewendet. ” Zun¨ achst f¨ ur f , das liefert ein x0 mit f (x0 ) =
f (b) − f (a) . b−a
Und nun ein zweites Mal, diesmal f¨ ur g: Wir erhalten das x0 nun mit der Eigenschaft g(b) − g(a) g (x0 ) = . b−a Teilt man noch beide Gleichungen durcheinander, so steht die Behauptung da. Und wo, bitte, sollte sich da ein Fehler versteckt haben?!
Bemerkung: Der erste Mittelwertsatz besagt anschaulich, dass die Sekantensteigung zwischen den Funktionswerten bei a und b mindestens einmal als Tangentensteigung auftritt:
?
250
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) R f
a
x0
R b
Bild 4.11: Skizze zum ersten Mittelwertsatz Leider ist es im Allgemeinen v¨ollig unbekannt, wo das x0 denn nun genau liegt, und deswegen wird der Satz auch in fast allen F¨ allen nur f¨ ur Absch¨ atzungen verwendet: Ist bekannt, dass f¨ ur eine Zahl R die Absch¨ atzung |f (x0 )| ≤ R f¨ ur alle x0 ∈ ] a, b [ gilt, so erm¨oglicht der Mittelwertsatz die Aussage |f (b) − f (a)| ≤ R|b − a|. Oder umgekehrt gelesen: Ist |f (b) − f (a)| > R|b − a|, so muss f¨ ur irgendein x0 die Absch¨atzung |f (x0 )| > R gelten. (Vgl. auch Teil (vi) des nachstehenden Korollars.) Die Polizei und der erste Mittelwertsatz Stellen Sie sich eine 100 km lange Autobahn vor, auf der als H¨ ochstgeschwindigkeit 100 Stundenkilometer erlaubt sind. Am Anfang der Strecke bekommt man an einem Abfertigungsschalter so etwas wie eine Eintrittskarte, am Ende ist wieder ein Schalter, an dem dann 10 Euro f¨allig werden. Beim Eintritt wird auch die Zeit vermerkt. Wenn nun jemand am Ausgang um 9 Uhr 50 seine Karte vorlegt, auf der Beginn der Fahrt: ” 9.00 Uhr“ vermerkt ist, so ist das offensichtlich ein Fall f¨ ur die Polizei, denn es muss irgendwo unterwegs eine Geschwindigkeits¨ ubertretung gegeben haben. (Niemand kann allerdings aus diesen Informationen schließen, wo genau zu schnell gefahren wurde.) Dass das etwas mit dem ersten Mittelwertsatz zu tun hat, sieht man so ein: Wenn man auf dem Intervall von 9.00 bis 9.50 eine Funktion f dadurch definiert, dass sie jeweils die zur¨ uckgelegte Strecke angibt, so ist die Steigung an einer Stelle die momentane Geschwindigkeit und die Sekantensteigung zwischen den Intervallenden die Durchschnittsgeschwindigkeit. Im Folgenden sind einige einfache Folgerungen aus dem ersten Mittelwertsatz zusammengestellt. Es handelt sich dabei um Aussagen, durch die aus lokalen Forderungen an die Funktion (n¨ amlich Eigenschaften der Ableitung) R¨ uckschl¨ usse auf das globale Verhalten gezogen werden.
¨ 4.2. MITTELWERTSATZE
251
Korollar 4.2.3. f : [ a, b ] → R sei eine differenzierbare Funktion. (i) Ist f (x) = 0 f¨ ur alle x, so ist f konstant. ur alle x, so ist f monoton steigend. (ii) Ist f (x) ≥ 0 f¨ (iii) Ist f (x) ≤ 0 f¨ ur alle x, so ist f monoton fallend. (iv) Ist f (x) > 0 f¨ ur alle x, so ist f streng monoton steigend. ur alle x, so ist f streng monoton fallend. (v) Ist f (x) < 0 f¨ (vi) Ist |f | durch eine Konstante R beschr¨ankt, so ist f eine Lipschitzabbildung 13) mit Lipschitzkonstante R. Beweis: (i) x ∈ ] a, b ] sei beliebig. Die Anwendung des ersten Mittelwertsatzes auf die Einschr¨ ankung von f auf das Intervall [ a, x ] – daf¨ ur schreibt man u ¨brif (x) − f (a) gens f |[ a,x ] – liefert ein x0 zwischen a und x, so dass f (x0 ) = . Da x−a f (x0 ) nach Voraussetzung gleich Null ist, gilt f (a) = f (x), und deswegen hat f u ¨ berall den Wert f (a). (ii) F¨ ur x, y ∈ [ a, b ] mit x < y wenden wir den ersten Mittelwertsatz auf f (x) − f (y) = f (x0 ) f¨ die Funktion f |[ x,y ] : [ x, y ] → R an. Es folgt ur ein x−y geeignetes x0 ∈ ] x, y [. Da f (x0 ) ≥ 0 ist, impliziert das f (x) ≤ f (y). Analog folgen (iii), (iv) und (v). ur alle x ∈ [ a, b ]. Man betrachte beliebige x, y ∈ [ a, b ] (vi) Es sei |f (x)| ≤ R f¨ mit x = y, wir wollen x < y annehmen. (Der Fall y < x wird v¨ ollig analog behandelt14) .) Wegen des ersten Mittelwertsatzes gilt dann mit einem geeigneten x0 ∈ ] x, y [ f (x) − f (y) = |f (x0 )|, x−y und daraus folgt |f (x) − f (y)| = |x − y| · |f (x0 )| ≤ R · |x − y|. Also ist f Lipschitzabbildung mit Lipschitzkonstante R.
Bemerkungen: 1. Bei den ersten f¨ unf Aussagen des Korollars handelt es sich u ¨ brigens um Tatsachen, die auch Nichtmathematikern plausibel sind. Die erste zum Beispiel kann so u ¨ bersetzt werden: Wenn jemand eine Radtour macht und die Strecke w¨ ahrend des gesamten Ausflugs waagerecht ist, so wird am Ende die H¨ ohe u ¨ ber dem Meeresspiegel die gleiche sein wie am Anfang. 13) Zur 14) Um
Definition vgl. 3.3.2. sich solche Zus¨ atze zu ersparen, sagt man auch kurz: Ohne Einschr¨ ankung ist x < y.“ ”
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
252
2. Die Aussage in Teil (vi) ist insbesondere dann anwendbar, wenn f eine stetige Funktion ist. Dann ist n¨amlich auch x → |f (x)| als Komposition der stetigen Funktionen f und | · | stetig, und stetige Funktionen auf kompaken Intervallen sind nach Satz 3.3.11 beschr¨ankt. 3. Wie sieht es mit der Umkehrung der Implikationen aus? Offensichtlich ist die Ableitung f einer Funktion gleich Null, wenn f eine konstante Funktion ist. Man kann auch leicht einsehen, dass f ≥ 0 sein muss, wenn f monoton steigt, f (x0 ) − f (xn ) nicht negativ, f¨ ur den denn dann sind alle Differenzenquotienten x0 − xn Limes f (x0 ) muss also f (x0 ) ≥ 0 gelten. Mit einem analogen Argument zeigt man, dass die Umkehrung von (iii) gilt, ¨ doch nun gibt es eine kleine Uberraschung: (iv) und (v) lassen sich nicht umkehren. Die einfachsten Gegenbeispiele sind die Funktionen x → x3 und x → −x3 . Sie sind streng monoton steigend bzw. fallend, trotzdem verschwindet die Ableitung bei Null. Es bleibt noch die Aussage (vi), die l¨ asst sich wieder umkehren: Wenn f eine differenzierbare Lipschitzfunktion mit Lipschitzkonstante R ist, so sind die Betr¨age der Differenzenquotienten durch R beschr¨ ankt. Da diese Beschr¨ anktheit ur alle x0 . im Limes erhalten bleibt, erh¨alt man wirklich |f (x0 )| ≤ R f¨
ˆ pital Guillaume l’Ho 1661 – 1704
Wir wollen uns nun einer etwas anspruchsvolleren Folgerung aus den Mittelachst soll an den Anwerts¨atzen zuwenden, den l’Hˆ opitalschen Regeln 15) . Zun¨ fang von Abschnitt 4.2 erinnert werden, dort hatten wir als Vorbereitung der Definition Differenzierbarkeit“ Limites der Form ” lim g(x) , lim+ g(x) oder lim− g(x) x→x 0
x=x0
x→x0
x→x0
untersucht. Manchmal war es m¨ oglich, diesen Limes durch Angabe einer auch bei x0 definierten, stetigen Funktion leicht zu berechnen (siehe Bemerkung 6 auf Seite 234), doch in manchen F¨ allen f¨ uhrt dieser Ansatz nicht zum Ziel. Wir werden eine etwas allgemeinere Situation als vorher betrachten, Konvergenz wird n¨amlich f¨ ur den Rest dieses Abschnitts als Konvergenz in der Zweiˆ aufgefasst (vgl. das Ende von Abschnitt 3.2). Damit punktkompaktifizierung R ist es m¨oglich, f¨ ur x0 und α in Definition 4.1.1 auch die Werte +∞ und −∞ ur zuzulassen. So soll etwa limx→+∞ g(x) = −∞ bedeuten, dass g(xn ) → −∞ f¨ jede reelle Folge (xn ) mit xn → +∞ gilt. Hier einige einfache Beispiele: lim x2 = +∞,
x→+∞
lim x3 = −∞, lim
x→−∞
x→0 x=0
1 = +∞, x2
aber lim 1/x existiert nicht. x→0 x=0
15) L’Hˆ opital war ein beg¨ uterter Adliger, der sich die Mathematik im Wesentlichen selbst beibrachte, weil er von dem Gebiet fasziniert war. Nach ihm sind die l’Hˆ opitalschen Regeln benannt, die, wenn man es genau nimmt, eigentlich von Johann Bernoulli bewiesen wurden. L’Hˆ opital schrieb auch das erste Lehrbuch der Analysis: Analyse des infiniments petits“, ” 1696.
¨ 4.2. MITTELWERTSATZE
253
Wir betrachten nun den Spezialfall, dass die Funktion g(x) der Quotient von zwei Funktionen ist, wir gehen also von g(x) zu f (x)/g(x) u ¨ ber. Dabei setzen wir voraus, dass die Nennerfunktion g f¨ ur alle x positiv16) ist und dass man lim g(x) leicht berechnen kann. lim f (x) und x→x x→x 0
0
x=x0
x=x0
lim g(x) = 7. Nehmen wir zum Beispiel an, dass x→x lim f (x) = 3 und x→x 0
0
x=x0
x=x0
Aus den Rechenregeln f¨ ur konvergente Folgen ergibt sich dann sofort, dass lim f (x)/g(x) = 3/7. x→x 0
x=x0
Geht n¨ amlich (xn ) gegen x0 , so gilt nach Voraussetzung f (xn ) → 3 und g(xn ) → 7. Also geht f (xn )/g(xn ) gegen 3/7. Und das zeigt, dass lim f (x)/g(x) = 3/7. x→x 0
x=x0
¨ lim g(x) = +∞: Aus an → 3 Ahnlich einfach ist es im Fall x→x lim f (x) = 3 und x→x 0
0
x=x0
x=x0
und bn → +∞ folgt doch an /bn → 0, und deswegen muss x→x lim f (x)/g(x) = 0 0
x=x0
gelten. Auch der Fall x→x lim f (x) = +∞, x→x lim g(x) = 7 macht keine Schwierig0
0
x=x0
x=x0
keiten, denn offensichtlich ist dann x→x lim f (x)/g(x) = +∞. 0
x=x0
Fassen wir zusammen: ˆ . Dann Es sei x→x lim f (x) = a und x→x lim g(x) = b, wobei a, b ∈ R 0
0
x=x0
x=x0
folgt direkt aus den Rechenregeln f¨ ur den Limes von Quotienten von ˆ: Folgen in R • Ist b = 0 und a ∈ / {−∞, +∞}, so ist x→x lim f (x)/g(x) = a/b. 0
x=x0
• Ist b = 0 und a > 0 (bzw. < 0), so ist x→x lim f (x)/g(x) = +∞ 0
(bzw. = −∞).
x=x0
V¨ ollig offen ist es allerdings, was passiert, wenn a = b = +∞ oder a = b = 0 gilt. Im ersten Fall wird es davon abh¨angen, wie schnell f und g gegen +∞ gehen: • Beide k¨ onnen etwa gleich schnell“ gegen Unendlich gehen, dann wird im ” Fall der Konvergenz als Limes eine Zahl herauskommen, die von 0 und ±∞ verschieden ist. Beispiel: limx→+∞ (1 + 6x)/(3 + 2x) = 3. 16) F¨ ur
negative g gelten nat¨ urlich analoge Ergebnisse.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
254
• f kann schneller als g gegen plus oder minus Unendlich gehen, dann wird lim f (x)/g(x) = +∞ (oder gleich −∞) sein. x→x 0
x=x0
Beispiel: limx→+∞ x3 /(13 + x) = +∞. • Wenn g schneller gegen Unendlich geht, so ist x→x lim f (x)/g(x) = 0 zu 0
x=x0
erwarten. Beispiel: limx→+∞ (1 + 2x + 5x4 )/(3 + x12 ) = 0. Um zu entscheiden, welche dieser M¨ oglichkeiten im konkreten Einzelfall vorliegt, lassen sich fast immer die l’Hˆ opitalschen Regeln verwenden. Wir formulieren sie f¨ ur den Fall einseitiger Limites, beidseitige k¨ onnen damit auch behandelt werden, indem man sowohl links- als auch rechtsseitige Konvergenz untersucht. l’Hˆ opital 0/0
Satz 4.2.4 (Die l’Hˆ opitalschen Regeln, der Fall 0/0). Es seien a, b ∈ R und a < b. ur alle x ∈ [ a, b [ (i) f, g : [ a, b [ → R seien differenzierbar. Es gelte g (x) = 0 f¨ sowie lim f (x) = lim g(x) = 0. x→b−
x→b−
f (x) f (x) Falls dann lim existiert, so auch lim , und es gilt − − x→b g (x) x→b g(x) lim
x→b−
f (x) f (x) = lim . g(x) x→b− g (x)
(i)’ Analog f¨ ur Funktionen f, g : ] a, b ] → R und den rechtsseitigen Limes limx→a+ f (x)/g(x). (ii) f, g : [ a, +∞ [ → R seien differenzierbar. Es gelte g (x) = 0 f¨ ur alle x in [ a, +∞ [ sowie lim f (x) = lim g(x) = 0. x→+∞
x→+∞
f (x) Falls dann lim existiert, so auch x→+∞ g (x)
lim
x→+∞
f (x) , und es gilt g(x)
f (x) f (x) = lim . x→+∞ g(x) x→+∞ g (x) lim
(ii)’ Analog f¨ ur Funktionen f, g : ] −∞, b ] → R und limx→−∞ f (x)/g(x). Beweis: (i) Durch f (b) := g(b) := 0 setzen wir f und g zu Funktionen auf [ a, b ] fort. Man beachte, dass beide Funktionen bei b stetig sind. Sei nun (xn )n∈N eine Folge in [ a, b [ mit xn → b. Eine Anwendung des zweiten Mittelwertsatzes auf f, g : [ xn , b ] → R verschafft uns ξn ∈ ] xn , b [ mit f (b) − f (xn ) f (xn ) f (ξn ) = = . g (ξn ) g(b) − g(xn ) g(xn )
¨ 4.2. MITTELWERTSATZE
255
Wegen |ξn − b| ≤ |xn − b| → 0 ist lim ξn = b. Also gilt f (x) f (ξn ) − − − − → , lim n→∞ g (ξn ) x→b− g (x) und damit ist schon alles gezeigt. Der Beweis von (i)’ verl¨auft v¨ollig analog zu dem von (i). ¨ (ii) Die Aussage soll durch Ubergang zu den beiden Funktionen x → f ( x1 ) 1 und x → g( x ) auf (i) zur¨ uckgef¨ uhrt werden. Wir setzen c := max{1, a} und definieren f˜, g˜ : ] 0, 1/c ] → R durch f˜(x) := f ( x1 ) und g˜(x) := g( x1 ). F¨ ur xn → 0 mit xn > 0 geht dann 1/xn gegen +∞; also gilt lim f˜(x) = lim f (x) und lim g˜(x) = lim g(x),
x→0+
und limx→0+
x→+∞
)
f ( x1 )
x→0+
x→+∞
g ( x1 )
existiert. Nun ist wegen der Kettenregel 1 1 1 1 f˜ (x) = − 2 f und g˜ (x) = − 2 g , x x x x
und damit ergibt sich f˜ (xn ) f (x) → lim . x→+∞ g (x) g˜ (xn ) Folglich sind f¨ ur f˜ und g˜ die Voraussetzungen von (i)’ erf¨ ullt, und wir erhalten f (x) f˜(x) f˜ (x) lim = lim = lim . x→+∞ g (x) ˜(x) ˜ (x) x→0+ g x→0+ g Da f¨ ur eine Folge (xn )n∈N in ] a, +∞ [ genau dann xn → +∞ gilt, wenn (1/xn ) eine Nullfolge ist, wissen wir auch, dass lim
x→0+
f (x) f˜(x) = lim , x→+∞ g(x) g˜(x)
und damit ist (ii) bewiesen.
(ii)’ kann analog zu (ii) gezeigt werden. Satz 4.2.5 (Die l’Hˆ opitalschen Regeln, der Fall ∞/∞). Es seien a und b reelle Zahlen, a < b.
(i) f, g : [ a, b [ → R seien differenzierbar. Es gelte g (x) = 0 f¨ ur alle x ∈ [ a, b [ sowie lim f (x) = lim g(x) = +∞. x→b−
x→b−
Falls dann lim
x→b−
f (x) f (x) existiert, so auch lim , und es gilt g (x) x→b− g(x) lim−
x→b
f (x) f (x) = lim− . g(x) x→b g (x)
l’Hˆ opital ∞/∞
256
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
(ii) Analoge Aussagen erh¨alt man – wie im Fall der l’Hˆ opitalschen Regeln im Fall 0/0 – f¨ ur Limites von Funktionen, die auf ] a, b ], [ a, +∞ [ oder ] −∞, b ] definiert sind. Beweis: (i) Wegen f (x) → +∞ und g(x) → +∞ f¨ ur x → b− d¨ urfen wir ¨ annehmen, dass f und g strikt positiv sind. (Das ist durch Ubergang zu einem ur die Berechnung der Limites Intervall [ a , b [ mit a ≤ a < b leicht zu erreichen, f¨ reicht es, die Funktionen bei den x mit x ≥ a zu betrachten.) Wir setzen α := lim
x→b−
f (x) , g (x)
gehen von einer Folge (xn )n∈N in [ a, b [ mit xn → b aus und haben zu zeigen, dass f (xn )/g(xn ) → α. Vorbereitend zeigen wir, dass α nicht negativ sein kann: Zun¨achst beweisen wir, dass g (x) > 0 f¨ ur alle x gilt. Angenommen, es g¨abe ein x1 < b mit g (x1 ) < 0. F¨ ur gen¨ ugend kleine positive h ist dann g(x1 + h) < g(x1 ), wir w¨ ahlen irgendein c ∈ ] x1 , b [ mit g(c) < g(x1 ). Da wir vorausgesetzt hatten, dass limx→b− g(x) = +∞, muss es ein d ∈ [ c, b [ geben, f¨ ur das g(d) > g(x1 ) ist. Nun wenden wir den Zwischenwertsatz an, der garantiert uns die Existenz eines x2 zwischen c und d, so dass g(x2 ) = g(x1 ). Und jetzt kann endlich ein Widerspruch hergeleitet werden: Durch den Satz von Rolle, angewandt auf die Einschr¨ ankung von g auf das Intervall [x1 , x2 ], erhalten wir ein x0 mit g (x0 ) = 0, und das widerspricht der Voraussetzung, dass g (x) u ¨ berall von Null verschieden sein soll. Angenommen nun, es w¨are α < 0. Dann w¨ are, f¨ ur eine geeignete Zahl δ > 0, der Quotient f (x)/g (x) f¨ ur alle x in ] b − δ, b [ negativ. Da wir schon g (x) > 0 bewiesen haben, folgt daraus, dass f (x) f¨ ur diese x negativ sein muss. f ist also aufgrund von Teil (v) des vorstehenden Korollars auf [ b − δ, b [ monoton fallend, und deswegen gilt bestimmt nicht limx→b− f (x) = +∞. Dieser Widerspruch zu unserer Voraussetzung beweist, dass α ≥ 0 sein muss. Wir kommen nun zum eigentlichen Beweis, es werden zwei F¨ alle unterschieden: Fall 1: α = +∞ ussen ein Sei (xn ) eine Folge in [ a, b [ mit xn → b und K > 0 beliebig. Wir m¨ n0 finden, so dass |f (xn )/g(xn )| ≥ K f¨ ur alle n mit n ≥ n0 gilt. Wegen f (x)/g (x) → +∞ gibt es ein δ > 0 mit x≥b−δ ⇒
f (x) ≥ 2K; g (x)
die Begr¨ undung wurde in Bemerkung 1 auf Seite 233 gegeben. Man w¨ ahle irgendein n1 mit xn1 ≥ b − δ. F¨ ur alle xn , die gr¨ oßer als xn1 sind (d.h. f¨ ur alle xn von einem geeigneten Index n2 an) l¨ asst sich der zweite Mittelwertsatz auf die
¨ 4.2. MITTELWERTSATZE
257
Einschr¨ ankungen von f und g auf das Intervall [xn1 , xn ] anwenden. Wir erhalten so ξn mit xn1 < ξn < xn und f (xn ) − f (xn1 ) f (ξn ) = . g(xn ) − g(xn1 ) g (ξn ) Insbesondere ist
⎛ f (ξn ) f (xn ) − f (xn1 ) f (xn ) ⎝ 1 − 2K ≤ = = · g (ξn ) g(xn ) − g(xn1 ) g(xn ) 1−
f (xn1 ) f (xn ) g(xn1 ) g(xn )
⎞ ⎠.
Nun beachten wir, dass f (xn ), g(xn ) → +∞. Deswegen gilt g(xn1 ) f (xn1 ) → 0, →0 f (xn ) g(xn ) mit n → ∞, und daher gibt es ein n0 ∈ N , so dass f (xn ) ≥ K f¨ ur alle n ≥ n0 g(xn ) ist17) . Das zeigt f (xn )/g(xn ) → α = +∞. Fall 2: α ∈ [ 0, +∞ [ Wieder sei (xn )n∈N eine Folge in [ a, b [ mit xn → b. Diesmal m¨ ussen wir f¨ ur ur vorgegebenes ε > 0 ein n0 finden, so dass α − ε ≤ f (xn )/g(xn ) ≤ α + ε f¨ n ≥ n0 . Nun l¨ asst sich wegen limx→b− f (x)/g (x) = α ein δ > 0 angeben, so dass f (x) α−ε≤ ≤α+ε g (x) f¨ ur b − δ ≤ x < b gilt (vgl. wieder Bemerkung 1 auf Seite 233). W¨ ahlt man nun irgendein xn1 mit xn1 ≥ b − δ, so ergibt sich wie in Fall 1: α−ε≤
f (xn ) − f (xn1 ) ≤α+ε g(xn ) − g(xn1 )
f¨ ur alle xn > xn1 . Schreibt man noch wie eben ⎛ f (xn ) − f (xn1 ) f (xn ) ⎝ 1 − = · g(xn ) − g(xn1 ) g(xn ) 1−
f (xn1 ) f (xn ) g(xn1 ) g(xn )
(4.2)
⎞ ⎠,
so folgt mit (4.2) aus f (xn ), g(xn ) → +∞ die Existenz eines n0 ∈ N mit α − 2ε ≤
f (xn ) ≤ α + 2ε f¨ ur alle n ≥ n0 . g(xn ) f (xn )
17) Es
reicht, daf¨ ur zu sorgen, dass
1− f (x 1) n
g(xn )
1− g(x 1) n
≤ 2 ist.
258
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Man muss die n nur so groß werden lassen, dass ⎞ ⎛ ⎛ g(x ) 1− 1 − g(xnn1) ⎠ , (α + ε) ⎝ α − 2ε ≤ (α − ε) ⎝ f (xn1 ) 1 − f (xn ) 1−
g(xn1 ) g(xn ) f (xn1 ) f (xn )
⎞ ⎠ ≤ α + 2ε
gilt. Dass es so ein n0 gibt, folgt aus ⎛ ⎞ g(x ) 1 − g(xnn1) ⎝ ⎠ → 1. f (x ) 1 − f (xnn1) Damit ist limx→b− f (x)/g(x) = α gezeigt, und der Beweis von (i) ist vollst¨ andig gef¨ uhrt. ¨ (ii) Diese Aussagen werden analog bzw. durch Ubergang zu den Funktionen x → f (1/x), x → g(1/x) bewiesen. (Vgl. den entsprechenden Beweis zu Satz 4.2.4.) Bemerkungen und Beispiele: 1. Vor einem allzu mechanischen Anwenden der l’Hˆ opitalschen Regeln muss dringend gewarnt werden. Formales Ableiten in lim f (x)/g(x) kann leicht zu Fehlern f¨ uhren. So ist etwa limx→0+ (1 + x)/x = +∞, aber eine reflexartige l’Hˆopital-Anwendung h¨atte wegen limx→0+ (1 + x) = limx→0+ x = 1 zu limx→0+ (1 + x) /x = 1 gef¨ uhrt. Wichtig ist also, sich stets zu vergewissern, dass tats¨achlich einer der F¨alle 0/0 oder ∞/∞ vorliegt. 2. Durch mehrfache Anwendung der l’Hˆ opitalschen Regeln kann der G¨ ultigkeitsbereich leicht erweitert werden. So ist etwa lim
f (x) f (x) = lim , g(x) g (x)
falls f¨ ur lim f (x)/g (x) die l’Hˆ opitalschen Regeln ebenfalls anwendbar sind; dabei steht f f¨ ur (f ) . Ein Beispiel dazu folgt gleich. Außerdem kann man die F¨alle −∞/ + ∞ usw. mit den Regeln genauso behandeln, man muss im Beweis nur f durch −f (und/oder g durch −g) ersetzen. 3. Limites der Form lim f (x)g(x) k¨ onnen ebenfalls mit Satz 4.2.4 und Satz 4.2.5 berechnet werden, falls lim f (x) = 0, lim g(x) = +∞. Man schreibe nur f (x)g(x) =
f (x) 1/g(x)
(s.u., das letzte Beispiel). 4. Wirklich interessante Beispiele k¨ onnen eigentlich erst nach Behandlung der speziellen Funktionen in Abschnitt 4.5 diskutiert werden. Wir werden sie hier im Vorgriff benutzen.
¨ 4.2. MITTELWERTSATZE
259
sin x =? x Mit f (x) = sin x und g(x) = x sind die Voraussetzungen von Satz 4.2.4(i’) erf¨ ullt. Wir erhalten so
• lim+ x→0
lim
x→0+
sin x cos x = lim+ = 1. x 1 x→0
(Der rechts stehende Limes ist deswegen gleich 1, weil die Cosinusfunktion bei 0 stetig ist und dort den Wert 1 hat.) sin ax = ? (Mit a, b ∈ R , b = 0.) sin bx Das f¨ uhrt wieder auf den Fall 0/0. Es ergibt sich mit Satz 4.2.4:
• lim
x→0+
lim+
x→0
•
a sin ax a cos ax = lim+ = . sin bx b x→0 b cos bx
2x3 + 2x2 =? x2 − 4 Es liegt der Fall ∞/∞ vor, doch f¨ uhrt eine einmalige Anwendung der l’Hˆ opitalschen Regeln nicht zum Ziel, da die Limites der Ableitungen im Z¨ ahler und im Nenner wieder unendlich sind. Es muss noch einmal abgeleitet werden, man erh¨alt lim
x→+∞
lim
x→+∞
2x3 + 2x2 6x2 + 4x 12x + 4 = lim = lim = +∞. 2 x→+∞ x→+∞ x −4 2x 2
Ganz analog kann man die Limites beliebiger Quotienten von Polynomen f¨ ur x → +∞ und x → −∞ behandeln. ex − e−x =? x x→0 Das ist wieder eine 0/0-Situation, einmaliges Ableiten f¨ uhrt zum Ziel:
• lim+
lim+
x→0
•
ex − e−x ex + e−x = lim+ = 2. x 1 x→0
ex =? x→+∞ x Diesmal liegt der Fall ∞/∞ vor. Man erh¨alt mit Satz 4.2.5: lim
ex ex = lim = +∞. x→+∞ x x→+∞ 1 lim
•
ex =? x→+∞ x2 lim
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
260
Wieder sind wir im ∞/∞-Fall, Satz 4.2.5 ist allerdings zweimal anzuwenden: ex (ex ) ex lim 2 = lim = +∞. = lim 2 x→+∞ x x→+∞ (x ) x→+∞ 2 Das Ergebnis bedeutet: ex geht f¨ ur x → +∞ st¨ arker gegen Unendlich als arker gegen x2 . Ganz analog kann man auch einsehen, dass ex sogar st¨ Unendlich geht als xn f¨ ur beliebig großes n. • lim+ x log x = ? x→0
(Auch die Logarithmusfunktion log benutzen wir hier im Vorgriff, sie wird erst in Abschnitt 4.5 eingef¨ uhrt.) Schreibt man das Produkt als log x/(1/x), so liegt der Fall −∞/+∞ vor. Folglich ist lim x log x = lim+
x→0+
x→0
1/x = 0. −1/x2
x geht also f¨ ur x → 0 st¨arker gegen 0 als der Logarithmus log x gegen −∞ geht.
4.3
Taylorpolynome
Polynome tauchten in den vergangenen Abschnitten schon mehrfach auf. Zur Erinnerung: Ein Polynom ist eine Funktion P von R nach R , die die Form P (x) = a0 + a1 x + · · · + an−1 xn−1 + an xn
?
hat. Dabei ist n ∈ {0, 1, 2, . . .}, und die a0 , . . . , an , die Koeffizienten des Polynoms, sind irgendwelche reellen Zahlen, wobei man u ¨ blicherweise verlangt, dass an = 0 gilt. Dann nennt man n den Grad von P . (Da man auch die Nullfunktion als Polynom auffassen m¨ochte, muss man daf¨ ur eine Sonderregelung vereinbaren: F¨ ur dieses Polynom soll der Grad gleich −∞ sein.) Die Funktionen −3 + x, 0, 0.3x9 − 3x222 sind also Polynome, 1/x jedoch nicht. (Warum eigentlich?) Ersetzt man u alt man komplexe Poly¨ berall reell“ durch komplex“, so erh¨ ” ” nome, diese Verallgemeinerung wird aber in diesem Abschnitt keine Rolle spielen. Es ist leicht zu sehen, dass Vielfache, Summen und Produkte von Polynomen wieder Polynome sind, und f¨ ur die Vielfachen λP und die Produkte P Q kann man auch leicht den Grad berechnen, wenn die Grade von P und Q bekannt sind18) . Ist P ein Polynom und x0 ∈ R , so ist auch P (x − x0 ) = a0 + a1 (x − x0 ) + · · · + an−1 (x − x0 )n−1 + an (x − x0 )n 18) Der Grad des Produktes P · Q ist die Summe der Grade von P und Q. Damit diese Formel auch dann gilt, wenn P oder Q das Nullpolynom ist, musste der zugeh¨ orige Grad als −∞ definiert werden.
4.3. TAYLORPOLYNOME
261
ein Polynom, wie man leicht durch Ausrechnen der (x − x0 )n , (x − x0 )n−1 , . . . nachpr¨ ufen kann. Umgekehrt gilt das auch, man kann f¨ ur jedes Polynom P und jedes x0 ein Polynom Q finden, so dass P (x) = Q(x − x0 ) f¨ ur alle x gilt. Beweis: Man schreibe P (x) als P (x0 +(x−x0)) und sortiere nach Potenzen von x − x0 . Ein Beispiel: P (x) = −1 + 2x + x2 und x0 = 5. Es ist P (x) = P (5+(x−5)) = −1+2(5+(x−5))+(5+(x−5))2 = 34+12(x−5)+(x−5)2 . F¨ ur Q(y) := 34 + 12y + y 2 gilt also P (x) = Q(x − 5). (Eine weitere M¨ oglichkeit, P auf diese Weise umzuschreiben, werden wir weiter unten kennen lernen, vgl. Seite 263.)
Diese Bemerkung ist dann wichtig, wenn man an den Werten des Polynoms in ” der N¨ahe“ einer Stelle x0 interessiert ist. In der Darstellung in Potenzen von x − x0 werden dann n¨amlich nur sehr kleine“ Werte auftreten. ” Polynome waren unsere ersten Beispiele f¨ ur stetige und auch f¨ ur differenzierbare Funktionen. Sie sind sogar beliebig oft differenzierbar, und alle Ableitungen sind leicht berechenbar. Polynome sind schließlich dadurch bemerkenswert, dass man außer Addieren und Multiplizieren nichts k¨onnen muss, um sie zu berechnen, das zeichnet sie vor den komplizierteren Funktionen (Wurzelfunktion, Sinus, Cosinus, Exponentialfunktion, . . . ) aus. Sie eignen sich damit hervorragend dazu, auf Computern schnell berechnet zu werden. In diesem Abschnitt sollen die Mittelwerts¨atze angewendet werden, um differenzierbare Funktionen so gut wie m¨oglich“ durch Polynome zu beschreiben. ” Dabei werden wir uns auf Funktionen beschr¨anken, die auf R oder einem Teilintervall definiert sind und deren Werte in R liegen19) . Die genauere Formulierung des Problems lautet: Eine Funktion f : [ a, b ] → ahe“ von x0 R und ein x0 ∈ [ a, b ] seien vorgegeben. Man versuche, f in der N¨ ” m¨ oglichst gut durch ein Polynom zu approximieren. Diese Aufgabe kann als Verallgemeinerung der in der Einleitung zu Abschnitt 4.1 behandelten Problemstellung aufgefasst werden: ochstens • Stetigkeit: f ist bei x0 durch eine Konstante (= ein Polynom h¨ nullten Grades) approximierbar. ochs• Differenzierbarkeit: f ist bei x0 durch eine Gerade (= ein Polynom h¨ tens ersten Grades) approximierbar. • Hier geht es um Approximationen bei x0 durch Polynome beliebigen Grades. 19) Diese Einschr¨ ankung ist notwendig, denn f¨ ur allgemeinere Situationen, z.B. f¨ ur komplexwertige Funktionen, stehen keine Mittelwerts¨ atze zur Verf¨ ugung.
262
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Dabei kann man erwarten, dass die Beschreibung der vorgelegten Funktion mit wachsendem Grad der zugelassenen Polynome besser und besser wird. Diese Erwartung wird jedoch nur teilweise erf¨ ullt: Es ist zwar richtig, dass jede stetige Funktion auf einem kompakten Intervall beliebig genau durch Polynome approximierbar ist20) . Der in diesem Abschnitt behandelte Weg f¨ uhrt aber nicht notwendig zu einer Folge von Polynomen, die ein vorgelegtes f besser und besser ann¨ahert. Bevor wir das Approximationsproblem weiter behandeln, treffen wir eine Vereinbarung: Ist eine Funktion f auf einer Menge M differenzierbar und ist die Ableitung f ebenfalls eine differenzierbare Funktion, so werden wir f (lies: zweite Ableitung von f“, f Zweistrich“) statt (f ) schrei” ” ben. In diesem Fall heißt f zweimal differenzierbar . Es d¨ urfte dann klar sein, was z.B. eine viermal differenzierbare Funktion ist und was ur man meist f (4) schreibt) bedeutet. Sollten sogar alle f (n) f (wof¨ (f¨ ur n ∈ N ) existieren, so heißt f beliebig oft (oder: unendlich oft) differenzierbar. Sei nun f : [ a, b ] → R eine Funktion und x0 ∈ [ a, b ]. Um f in der N¨ ahe von ur die x mit x0 durch ein Polynom n-ten Grades zu beschreiben, d.h. um f (x) f¨ x ≈ x0 n¨aherungsweise durch n
ai (x − x0 )i = a0 + a1 (x − x0 ) + · · · + an (x − x0 )n
i=0
zu ersetzen, verfahren wir in zwei Schritten: 1. Wir suchen einen nahe liegenden Kandidaten f¨ ur ein approximierendes Polynom (das f¨ uhrt uns zur Definition des n-ten Taylorpolynoms). 2. Wir pr¨ ufen, wie gut die Approximation durch das Taylorpolynom ist (dazu werden wir eine so genannte Restgliedformel beweisen). ur die die ApSei also n ∈ N vorgelegt. Um zu Zahlen a0 , . . . , an zu kommen, f¨ proximation f (x) ≈ a0 + a1 (x − x0 ) + · · · + an (x − x0 )n
m¨ oglichst gut ist, ersetzen wir versuchsweise f (x) durch ni=0 ai (x − x0 )i und haben nun allein aus den Funktionswerten von f die a0 , . . . , an zu ermitteln. Es stellt sich also das Problem: Die Werte P (x) = a0 + a1 (x − x0 ) + · · · + an (x − x0 )n seien f¨ ur alle x (oder wenigstens f¨ ur die x in einer Umgebung von x0 ) bekannt. Man bestimme die Koeffizienten a0 , . . . , an . 20) Das ist der Approximationssatz von Weierstraß, die genaue Formulierung lautet: Ist [a, b] ein kompaktes Intervall, f : [a, b] → R eine stetige Funktion und ε > 0, so gibt es ein reelles Polynom P , so dass |f (x) − P (x)| ≤ ε f¨ ur alle x gilt. Wir werden diesen Satz erst in Abschnitt 7.1 im zweiten Band beweisen k¨ onnen.
4.3. TAYLORPOLYNOME
263
alt man die ana0 ist leicht zu berechnen, n¨amlich als P (x0 ). Ganz analog erh¨ deren Koeffizienten, man beachte nur, dass P (x) P (x)
P (n) (x)
= a1 + 2a2 (x − x0 )1 + 3a3 (x − x0 )2 + . . . + nan (x − x0 )n−1 = 2a2 + 2 · 3a3 (x − x0 )1 + . . . + n(n − 1)an (x − x0 )n−2 .. . = n! an .
Folglich ist P (k) (x0 ) = k! ak , d.h. ak = P (k) (x0 )/k! (f¨ ur k = 0, . . . , n)21) . Nach dieser Vor¨ uberlegung haben wir einen nahe liegenden Kandidaten f¨ ur das die Funktion f approximierende Polynom22) : Definition 4.3.1. f : [ a, b ] → R sei n-mal differenzierbar, x0 ∈ [ a, b ]. Unter dem n-ten Taylorpolynom bei x0 verstehen wir dann das Polynom Pn (x) =
n k=0
f (k) (x0 ) f (x0 ) f (n) (x0 ) (x−x0 )k = f (x0 )+ (x−x0 )+· · ·+ (x−x0 )n . k! 1! n!
Bemerkungen und Beispiele: 1. Es gibt also ein nulltes Taylorpolynom (die konstante Funktion f (x0 )), ein erstes Taylorpolynom (die Gerade x → f (x0 ) + f (x0 )(x − x0 ), das ist die Tangente bei x0 ) usw. Man beachte, dass das n-te Taylorpolynom nicht notwendig den Grad n haben muss, das gilt nur dann, wenn f (n) bei x0 nicht verschwindet. 2. Man bestimme das zweite Taylorpolynom zu f (x) = x2 + 1 bei x0 = 1: Das geht am u ¨bersichtlichsten mit einer kleinen Tabelle: k 0 1 2
f (k) f (k) (1) x2 + 1 2 2x 2 2 2
Damit ist P2 (x) = 2 +
21) Damit
2 2 (x − 1) + (x − 1)2 = 2 + 2(x − 1) + (x − 1)2 . 1! 2!
diese Formel auch f¨ ur k = 0 gilt, muss man f (0) := f und 0! := 1 definieren. Definition stammt aus der Fr¨ uhzeit der modernen Analysis. Die von Taylor 1712 gefundene Taylorreihe spielt eine fundamentale Rolle bei der konkreten numerischen Berechnung vorgegebener Funktionen. 22) Diese
Brook Taylor 1685 – 1731
Taylorpolynom
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
264
Taylorpolynome von Polyomen Es ist u ¨ brigens P2 = f . Allgemeiner ist Pn = f , falls f ein Polynom h¨ochstens n-ten Grades ist, das folgt aus der Restgliedformel, die wir gleich beweisen werden. Damit haben wir eine weitere M¨ oglichkeit zur Verf¨ ugung, vorlegte Polynome a0 + a1 x + · · · + an xn als b0 + b1 (x − x0 ) + · · · + bn (x − x0 )n umzuschreiben. 3. Wie sieht P4 f¨ ur f (x) = x6 − x bei x0 = −1 aus?: f (k) f (k) (−1) 6 x −x 2 5 6x − 1 −7 30x4 30 120x3 −120 360x2 360
k 0 1 2 3 4 Also ist P4 (x)
= =
30 −7 −120 360 (x + 1) + (x + 1)2 + (x + 1)3 + (x + 1)4 1! 2! 3! 4! 2 − 7(x + 1) + 15(x + 1)2 − 20(x + 1)3 + 15(x + 1)4 . 2+
4. Man bestimme P2 f¨ ur f (x) = k 0 1 2
√ 1 + x bei x0 = 0: f (k) √ 1+x
√1 2 1+x − √ 1 3 4 (1+x)
f (k) (0) 1 1/2 −1/4
Daraus folgt: 1 1 P2 (x) = 1 + x − x2 . 2 8 Achtung: Naiv h¨ atte man doch hoffen k¨ onnen, dass die Taylorpolynome Pn die Funktion f mit wachsendem n auf dem ganzen Definitionsbereich besser und besser beschreiben. Die nachstehende Abbildung zeigt, dass die Approximation in der Regel wirklich nur in der N¨ ahe von x0 (hier also nahe bei 0) zu befriedigenden Ergebnissen f¨ uhrt.
4.3. TAYLORPOLYNOME
265
R P1 √ x → 1 + x
P3
3 2
P0
1
P2 −2
−1
1
Bild 4.12: Die Funktion x →
2
3 P4
4
5
R 6
√ 1 + x und ihre Taylorapproximationen
Wir kommen nun zum zweiten Schritt. Dazu definieren wir – mit den Bezeichnungen der vorstehenden Definition 4.3.1 – Rn (x) := f (x) − Pn (x). Rn (x) misst also den Fehler, der bei der Approximation von f durch Pn gemacht wird, nach Definition gilt f (x0 ) f (n) (x0 ) (x − x0 ) + · · · + (x − x0 )n + Rn (x). 1! n! Die Funktion Rn (x) heißt das n-te Restglied (oder das Restglied n-ter Ordnung). Beachten Sie bitte, dass unsere bisherigen Definitionen (von Pn und Rn ) absolut keine Aussagen u ¨ ber die Approximierbarkeit von f durch Pn implizieren, im Allgemeinen l¨ asst sich dazu auch nichts sagen. Der Ansatz wird sich erst dann onnen, wenn wir also aus als sinnvoll erweisen, wenn wir Rn weiter behandeln k¨ Informationen u urfen, dass Rn (x) klein“ ¨ ber f und die Ableitungen folgern d¨ ” ist. Daf¨ ur gibt es mehrere M¨oglichkeiten, eine davon wird im nachstehenden Satz vorgestellt23) : f (x) = f (x0 ) +
Satz 4.3.2 (Satz von Taylor, Restgliedformel). Die Funktion f : [ x0 , x ] → R sei (n + 1)-mal differenzierbar. Dann gibt es ein ξ ∈ ] x0 , x [ mit f (n+1) (ξ) (x − x0 )n+1 , Rn (x) = (n + 1)! d.h. dann gilt: f (x) = f (x0 ) +
f (x0 ) f (n) (x0 ) f (n+1) (ξ) (x − x0 ) + · · · + (x − x0 )n + (x − x0 )n+1 . 1! n! (n + 1)!
23) Genau genommen ist es die Restgliedformel nach Lagrange. Eine weitere Formel werden wir sp¨ ater auf Seite 289 kennen lernen.
Restglied
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
266
Beweis: Der Beweis ist leider recht unanschaulich. Wir fixieren x und definieren zwei neue Funktionen F, G : [ x0 , x ] → R durch
F (y) :=
n f (k) (y) k=0
G(y)
k!
(x − y)k = f (y) +
f (n) (y) f (y) (x − y) + · · · + (x − y)n 1! n!
:= (x − y)n+1 .
(Beachten Sie, insbesondere beim Differenzieren, dass x und x0 fest sind und y die Ver¨anderliche ist.) Es macht keine M¨ uhe einzusehen, dass f¨ ur F und G die Voraussetzungen des zweiten Mittelwertsatzes erf¨ ullt sind. Es gibt also ein ξ ∈ ] x0 , x [ mit F (ξ) F (x) − F (x0 ) = . G(x) − G(x0 ) G (ξ) Das ist (¨ uberraschenderweise) schon die behauptete Formel. Man muss nur etwas rechnen: F (x) = F (x0 ) = G(x)
=
f (x) Pn (x) 0
G(x0 ) =
(x − x0 )n+1
F (ξ)
=
G (ξ)
=
f (n+1) (ξ) (x − ξ)n n! −(n + 1)(x − ξ)n .
(Um zu den letzten beiden Formeln zu kommen, muss man die Funktionen F und G nach y ableiten und dann y = ξ einsetzen. Es ist zu beachten, dass x in diesem Beweis ein fester Wert ist. Bei der Berechnung von F muss man Produkt- und Kettenregel anwenden, bemerkenswerterweise heben sich dadurch fast alle Summanden weg.) Man erh¨alt den Ausdruck f (n+1) (ξ)(x−ξ)n
f (x) − Pn (x) n! = , −(x − x0 )n+1 −(n + 1)(x − ξ)n den man leicht zu f (x) = Pn (x) +
f (n+1) (ξ) (x − x0 )n+1 (n + 1)!
umsortieren kann. Und genau das war zu zeigen.
Bemerkungen, Anwendungen der Restgliedformel: 1. Wenn man die Formel f¨ ur das n-te Taylorpolynom verstanden hat, kann man sich dadurch auch leicht die Restgliedformel merken: Man muss nur den
4.3. TAYLORPOLYNOME
267
¨ n¨ achsten Summanden – den mit n+1 – hinschreiben, und als einzige Anderung (n+1) nicht bei x0 , sondern bei einer Zwischenstelle ξ die Auswertung von f zwischen x0 und x vornehmen. 2. Angenommen, n ist ziemlich groß“ und x − x0 ist sehr klein“. Dann sind die ” ” letzten beiden der drei Bausteine f (n+1) (ξ), 1/(n+1)!, (x−x0 )n+1 , aus denen das Restglied aufgebaut ist, sehr klein“. Anders ausgedr¨ uckt: Außer, wenn f (n+1) ” zwischen x0 und x sehr groß werden kann, wird Rn (x) voraussichtlich sehr ” klein“ sein. 3. Falls x < x0 ist, erh¨alt man die gleiche Formel f¨ ur Funktionen f : [ x, x0 ] → R . 4. Nun k¨ onnen wir die Behauptung beweisen, die in Beispiel 1 zu Definition 4.3.1 aufgestellt wurde, dass n¨amlich f¨ ur Polynome f h¨ ochstens n-ten Grades stets f = Pn ist. In diesem Fall ist n¨amlich f (n+1) = 0, und deswegen muss das Restglied verschwinden. ¨ Diese Uberlegung l¨asst sich auch umkehren. Ist n¨ amlich f : [ a, b ] → R eine Funktion, f¨ ur die f (n+1) existiert und auf ganz [a, b] verschwindet, so ist f notwendig ein Polynom h¨ochstens n-ten Grades, da dann f mit dem n-ten Taylorpolynom, z.B. dem bei x0 = 0, u ¨ bereinstimmen muss. 5. Die Restgliedformel liefert bei vorgegebenen f, x0 , n Aussagen der folgenden Gestalt: Ersetzt man f (x) f¨ ur |x − x0 | ≤ δ durch Pn (x), so ist der Fehler h¨ ochstens soundso groß. Dazu ist lediglich Rn (x) mit Satz 4.3.2 f¨ ur die x mit |x − x0 | ≤ atzen. δ abzusch¨ Da u ur f (n+1) (ξ) nur recht grobe ¨ber das ξ nichts bekannt ist, wird man f¨ Absch¨ atzungen erhalten. √ Beispiel: Wir betrachten f (x) = 1 + x; wie gut ist die erste Taylorapproximation f¨ ur |x| ≤ 0.01? Das erste Taylorpolynom kennen wir schon, es lautet 1 + x2 . Die zweite Ab leitung ist gleich f (x) = −1/ 4 (1 + x)3 , und deswegen ist der Approximati onsfehler f (ξ)(x−x0 )2 /2! hier gleich −x2 / 8 (1 + ξ)3 . Dabei liegt ξ zwischen 0 und x. Wie groß kann das schlimmstenfalls werden, wenn |x|≤ 0.01 ist? Der Ausdruck 1 + ξ ist mindestens 0.99, also kann 1/ 8 (1 + ξ)3 durch den Ausdruck √ 1/ 8 0.993 ≈ 0.127 nach oben abgesch¨atzt werden. Es folgt: Im Bereich |x|√≤ 0.01 ist der Fehler von der Gr¨ oßenordnung 10−5 , unften Stelle ein Unterschied zwischen 1 + x und 1 + x2 tritt also erst in der f¨ nach dem Komma auf. √ Zum Vergleich: Es ist 1.01 = 1.0049876 . . ., die Approximation liefert 1.005. F¨ ur x = −0.006 ist der exakte Wert 0.9969954 . . ., unsere N¨ aherungsl¨ osung lautet 1 − 0.006/2 = 0.997.
268
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
6. Falls f (n+1) im Intervall zwischen x0 und x das Vorzeichen nicht wechselt, so kann angegeben werden, ob Pn (x) den Wert von f (x) ¨ bertrifft bzw. unter√ u schreitet. So ist z.B. klar, dass die N¨ aherung P1 (x) f¨ ur 1 + x im vorstehenden Beispiel stets zu groß ausf¨allt, denn x2 ·
−x2 f (ξ) = 2! 8 (1 + ξ)3
ist negativ. Newtonverfahren
7. Als weitere einfache Anwendung skizzieren wir hier kurz das f¨ ur die Numerik wichtige Newtonverfahren. Gegeben sei eine zweimal differenzierbare Funktion f : [ a, b ] → R mit der Eigenschaft f (a) < 0 < f (b), und es soll ein x0 mit f (x0 ) = 0 gefunden werden. So ein x existiert nach dem Zwischenwertsatz 3.3.6. Dabei gehen wir davon aus, dass wir schon (z.B. durch eine grobe Skizze) ur das |f (x1 )| klein“ ist. Die Idee besteht nun darin, ein x1 gefunden haben, f¨ ” statt f diejenige Gerade zu betrachten, die f bei x1 approximiert. Das ist gerade das erste Taylorpolynom P1 von f bei x1 , also die Tangente von f im Punkt (x1 , f (x1 )): f
R
x0
x2
x1
R
Bild 4.13: Erster Schritt des Newtonverfahrens Es ist zu hoffen, dass die Nullstelle von P1 eine weitaus bessere N¨ aherung f¨ ur eine Nullstelle von f als die grobe Sch¨ atzung x1 ist. Um nachzupr¨ ufen, ob diese Hoffnung berechtigt ist, berechnen wir P1 : P1 (x) = f (x1 ) + f (x1 )(x − x1 ). Falls f (x1 ) = 0 gilt (das wollen wir hier voraussetzen), hat P1 genau eine Nullstelle. Wir finden sie durch Aufl¨ osen der Gleichung P1 (x) = 0 nach x, die eindeutig bestimmte L¨osung soll x2 heißen: x2 = x1 −
f (x1 ) . f (x1 )
4.3. TAYLORPOLYNOME
269
ur eine bessere Nullstellenn¨aherung. Aufgrund der Restx2 ist unser Kandidat f¨ gliedformel gilt (mit einem geeigneten ξ zwischen x1 und x2 ): f (x2 ) =
= =
f (ξ) (x2 − x1 )2 f (x1 ) + f (x1 )(x2 − x1 ) + 2! =0 2 −f (x1 ) f (ξ) · 2 f (x1 ) 2 f (x1 ) f (ξ) · , 2 f (x1 )
und daraus l¨ asst sich – wenn Absch¨atzungen f¨ ur f und f bekannt sind – ermitteln, inwiefern x2 eine bessere N¨aherung an die Nullstelle ist als es x1 war. Qualitativ sieht man: Ist f nicht zu klein“ und f nicht zu groß“, so wird ” ” f (x2 ) doppelt so viele Nullen nach dem Komma haben wie f (x1 ). Einzelheiten hierzu werden in der Vorlesung Numerische Mathematik“ besprochen. Hier soll ” ¨ nur darauf hingewiesen werden, wie man durch die vorstehenden Uberlegungen ein induktives Verfahren gewinnt, durch das die gesuchte Nullstelle sehr schnell ermittelt werden kann: • W¨ ahle x1 so, dass |f (x1 )| klein“ ist. ” f (xn ) f¨ ur n ∈ N . • Definiere xn+1 := xn − f (xn ) √ Als Beispiel diskutieren wir die Berechnung von a f¨ ur a > 0. √ 2 a ist Nullstelle von f (x) = x − a, das Newtonverfahren wird hier so angewendet. Zun¨achst wird x1 grob geraten, es soll nur x21 ≈ a sein. Die Rekursionsvorschrift lautet hier xn+1 = xn −
a x2n − a x2 + a xn + = n = . 2xn 2xn 2 2xn
Ist etwa a = 2 und beginnt man mit x1 = 1.5, so erh¨ alt man x2 x3
= =
x4
=
1.416666667 1.414215686
1.414213562, √ und x4 stimmt schon auf 8 Stellen mit 2 u ¨ berein.
Zum Abschluss wollen wir uns kurz damit besch¨aftigen, welche Folgerungen man aus Satz 4.3.2 f¨ ur Extremwertaufgaben ziehen kann. Gegeben sei eine Funktion f : [ a, b ] → R (oder f : R → R ). Die Formel, durch die f definiert ist, wird in der Regel nicht ausreichend sein, um die f¨ ur f
270
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
wesentlichen Gesichtspunkte zu ermitteln (Maxima, Minima, Nullstellen, Intervalle, auf denen f monoton steigt, . . . ). Unter Kurvendiskussion versteht man die Bestimmung derartiger f¨ ur f charakteristischer Werte bzw. Intervalle (vgl. dazu Korollar 4.2.3). Eine ersch¨opfende Behandlung wird hier nicht angestrebt. Wir beschr¨anken uns auf die Charakterisierung von Extremwerten. Satz 4.3.3. f : [ a, b ] → R sei differenzierbar. ur (i) Ist x0 ∈ ] a, b [ ein lokales Maximum (d.h. gibt es ein δ > 0,so dass f¨ |x − x0 | ≤ δ stets f (x) ≤ f (x0 ) gilt), so ist f (x0 ) = 0. Ebenso ist f (x0 ) = 0, falls x0 ∈ ] a, b [ ein lokales Minimum ist. (ii) Sei x0 ∈ ] a, b [ mit f (x0 ) = 0 vorgelegt, x0 ist dann nicht notwendig ein Extremwert (d.h. lokales Maximum oder Minimum). Falls f gen¨ ugend oft differenzierbar ist, lassen sich aber hinreichende Bedingungen angeben: Angenommen, f ist auf [ a, b ] eine (n+1)-mal differenzierbare Funktion, und f (n+1) ist stetig bei x0 . Wir setzen voraus, dass f (x0 ) = f (x0 ) = · · · = f (n) (x0 ) = 0, f (n+1) (x0 ) = 0. Ist dabei n ungerade (und damit n + 1 gerade), so ist x0 ein lokales Extremum, und zwar ein lokales Maximum f¨ ur f (n+1) (x0 ) < 0 und ein lokales (n+1) Minimum im Fall f (x0 ) > 0. Ist n gerade, so ist x0 weder ein lokales Maximum noch ein lokales Minimum 24) . Beweis: (i) Das ist im Beweis des Satzes von Rolle (Satz 4.2.1) (im Wesentlichen) schon einmal gezeigt worden: Man w¨ ahle xn , yn in ] a, b [ mit xn < x0 < yn sowie xn → x0 , yn → x0 . Dann ist, falls zum Beispiel x0 lokales Minimum ist, f (xn ) − f (x0 ) f (yn ) − f (x0 ) ≤ 0 und ≥0 xn − x0 yn − x0 f¨ ur gen¨ ugend große n, und beide Ausdr¨ ucke konvergieren gegen f (x0 ). Es ist also notwendig f (x0 ) ≥ 0 und f (x0 ) ≤ 0, also f (x0 ) = 0. (ii) Sei zun¨achst n ungerade, wir betrachten den Fall f (n+1) (x0 ) < 0. Aufgrund der Stetigkeit von f (n+1) gibt es dann ein δ > 0 mit ur x ∈ ] x0 − δ, x0 + δ [. f (n+1) (x) < 0 f¨ F¨ ur jedes x ∈ ] x0 − δ, x0 + δ [ gilt dann mit geeignetem ξ zwischen x und x0 : f (x) =
n f (k) (x0 ) k=0
k!
(x − x0 )k +
f (n+1) (ξ) (x − x0 )n+1 . (n + 1)!
24) x heißt dann ein Sattelpunkt: Die Tangente ist zwar waagerecht, aber es gibt f¨ ur jedes 0 ε > 0 Punkte x, y mit |x − x0 |, |y − x0 | ≤ ε und f (x) < f (x0 ) < f (y).
4.3. TAYLORPOLYNOME
271
Da nach Voraussetzung f (x0 ) = · · · = f (n) (x0 ) = 0 gilt, folgt f (x)
= f (x0 ) +
f (n+1) (ξ) (x − x0 )n+1 (n + 1)!
≤ f (x0 ). Im Fall x = x0 gilt sogar 0 bei ungeradem n ein lokales Minimum ist, ist ganz ¨ahnlich. Es bleibt nur noch, den Fall zu diskutieren, dass n gerade ist, die erste nichtverschwindende Ableitung also bei einer ungeraden Ableitungsordnung auftritt. Wieder ist f (x) = f (x0 ) + f (n+1) (ξ)(x − x0 )n+1 /(n + 1)!, aber nun ist n + 1 ungerade. Folglich ist (x − x0 )n+1 positiv f¨ ur x > x0 und negativ f¨ ur x < x0 . Ist also f (n+1) (x0 ) > 0, so wird f (x) f¨ ur die x ∈ ] x0 , x0 + δ ] gr¨ oßer als f (x0 ) und f¨ ur die x ∈ [ x0 − δ, x0 [ kleiner als f (x0 ) sein25) . Folglich ist x0 weder lokales Maximum noch lokales Minimum. Bemerkungen: 1. Eine Standardanwendung des Satzes sieht so aus: 2 Man betrachte f (x) := x3 − 2x + 1 auf R . Es ist f (x) = 3x − 2, die Nullstellen dieser Funktion, also die Zahlen x := 2/3 und 1 x2 := − 2/3, sind also Kandidaten f¨ ur ein lokales Extremum. Nun ist f (x) = 6x, und diese Funktion ist bei x1 positiv und bei x2 negativ. Folglich ist x1 ein lokales Minimum und x2 ein lokales Maximum. (Das sieht man im Fall dieser einfachen Funktion auch an einer groben Skizze.)
2. Alle M¨ oglichkeiten, die vorkommen k¨onnen, lassen sich an den Funktionen ±xm , m = 2, 3, . . . und x0 = 0 veranschaulichen: – Ist m gerade, so ist 0 ein lokales Minimum (bzw. Maximum) der Funktion xm (bzw. −xm ). Die erste bei Null nicht verschwindende Ableitung ist die m-te Ableitung, der vorstehende Satz ist mit n = m − 1 anwendbar. – F¨ ur ungerade m ist 0 ein Sattelpunkt, auch das folgt aus Satz 4.3.3. 3. Teil (i) des Satzes ist – obwohl nicht gerade besonders tief liegend – von kaum zu u atzender Wichtigkeit f¨ ur die Anwendungen. Dort kommt es n¨ amlich ¨bersch¨ h¨ aufig vor, dass f¨ ur eine Funktion f : [ a, b ] → R der Wert supa≤x≤b f (x) von Interesse ist. Wegen 4.3.3(i) kann man im Fall differenzierbarer f so vorgehen: a) Man bestimme alle x ∈ ] a, b [ mit f (x) = 0. In der Regel werden das nur endlich viele Werte x1 , . . . , xn sein. 25) Im
Fall f (n+1) (x0 ) < 0 ist es genau umgekehrt.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
272
b) Man bestimme dann die gr¨oßte der Zahlen f (x1 ), . . . , f (xn ), f (a), f (b). Diese Zahl ist dann der Maximalwert26), denn er muss ja wegen Satz 3.3.11 bei einem x0 ∈ [ a, b ] angenommen werden. Der Fall x0 ∈ {a, b} ist durch Ber¨ ucksichtigung der f (a) und f (b) erledigt, und im Falle x0 ∈ ] a, b [ ist x0 eine der Stellen x1 , . . . , xn . Kurz: Das Problem, die gr¨oßte unter den unendlich vielen Zahlen f (x) mit x ∈ [ a, b ], zu finden, kann wegen (i) h¨ aufig auf die Bestimmung der Nullstellen einer Funktion (n¨amlich f ) und die Berechnung endlich vieler Funktionswerte zur¨ uckgef¨ uhrt werden. 4. Die vorstehend beschriebene Strategie f¨ uhrt nur dann mit Sicherheit zum Ziel, wenn es sich wirkich um ein kompaktes Intervall handelt: Im nichtkompakten Fall muss es gar keine lokalen, geschweige denn globale Extremwerte geben. 5. In den allermeisten F¨allen treten bei der Anwendung des Satzes Situationen auf, bei denen man f¨ ur ein x0 mit f (x0 ) = 0 den Extremwerttest des vorstehenden Satzes bereits mit n = 1 durchf¨ uhren kann, da schon f (x0 ) von Null verschieden ist. Man muss sich nur merken: • Ist f (x0 ) positiv , so liegt ein lokales Minimum vor. • Ist dagegen f (x0 ) negativ , so handelt es sich um ein lokales Maximum. (Das ist, wohlgemerkt, nicht immer erf¨ ullt. Sollte f (x0 ) = 0 sein, so muss man so lange die Zahlen f (x0 ), f (4) (x0 ) ausrechnen, bis – hoffentlich – einmal eine von Null verschiedene Zahl auftritt. Erst dann kann man den Satz anwenden.)
4.4
Potenzreihen
Dieser Abschnitt ist wie folgt aufgebaut. Zun¨ achst wird motiviert, warum Potenzreihen u ¨ berhaupt betrachtet werden. Nach der Definition wird dann recht schnell klar, dass der nat¨ urliche Definitionsbereich derartiger Funktionen im Wesentlichen ein Kreis (im Fall der komplexen Zahlen) bzw. ein Intervall (im Fall reeller Zahlen) ist. Dann ist ein kleiner Exkurs u oße ¨ ber die wesentliche Gr¨ ” reeller Folgen“ f¨allig, wir werden uns um den Limes superior k¨ ummern. Mit dieser Definition kann dann leicht unter Verwendung des Wurzelkriteriums eine Formel f¨ ur die Gr¨oße des Definitionsbereichs hergeleitet werden. Am Ende soll gezeigt werden, dass Potenzreihen zu den analytisch gutartigsten Funktionen u ¨ berhaupt geh¨oren – man kann fast so wie mit Polynomen rechnen. Um Potenzreihen zu motivieren, betrachten wir eine beliebig oft differenzierbare Funktion f : [ a, b ] → R . Wegen Satz 4.3.2 gilt dann f¨ ur x0 , x ∈ ] a, b [ und n ∈ N: n f (k) (x0 ) f (n+1) (ξ) (x − x0 )k + (x − x0 )n+1 . f (x) = k! (n + 1)! k=0
26) Manchmal
sind auch Minimalwerte von Interesse, die erh¨ alt man ganz ¨ ahnlich. Unter einem Extremwert von f versteht man einen Maximalwert oder einen Minimalwert.
4.4. POTENZREIHEN
273
ur unterschiedliche n kann es verschiedene Dabei liegt ξ zwischen x0 und x, f¨ ξ-Werte geben. Falls nun gezeigt werden kann, dass f (n+1) (ξ) −−→ 0, (x − x0 )n+1 −− n→∞ (n + 1)! so ist nach Definition der Reihenkonvergenz f (x) =
∞ f (n) (x0 ) (x − x0 )n . n! n=0
Diese Vorbemerkung sollte hinreichend motivieren, warum wir uns in diesem Abschnitt auf die folgenden beiden Ziele konzentrieren wollen: • Was l¨ asst sich u ur geeignete Zahlen a0 , a1 , . . . ¨ ber Funktionen aussagen, die f¨ von der Form x → a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · sind? • Welche konkreten Funktionen lassen sich so darstellen? Obwohl die vorstehende Motivation nur den Fall reeller Funktionen betraf, werden wir wieder K = C und K = R zulassen. Auch werden wir uns im Folgenden, um die Schreibweise u ¨bersichtlich zu halten, fast ausschließlich auf den Spezialfall x0 = 0 beschr¨anken. Bei beliebigem x0 f¨ uhrt die Variablentransformation x → x − x0 auf den Spezialfall x0 = 0. Wir beginnen mit einer grundlegenden Definition: Was ist eine Potenzreihe? urzen die Folge Dazu sind v¨ ollig beliebige Zahlen a0 , a1 , . . . vorgegeben, wir k¨ (a0 , a1 , . . .) aus schreibtechnischen Gr¨ unden durch das Symbol a ab. Man kann a zur Definition einer durch eine Reihe zu berechnenden Funktion verwenden: Definition 4.4.1. Sei a = (a0 , a1 , . . .) eine Folge in K . Wir setzen ∞ . / Da := z z ∈ K , an z n konvergiert in K . n=0
Diese Menge ist der nahe liegende Definitionsbereich der Funktion fa : Da z
→ K ∞
→ an z n = a0 + a1 z + a2 z 2 + · · · , n=0
fa heißt die zu a geh¨orige Potenzreihe.
∞ n n=0 an z , wo immer in K sich das sinnvoll definieren
Kurz: Es ist fa (z) = l¨asst.
Potenzreihe
274
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Beispiele: 1. Ist a = (a0 , . . . , an , 0, 0, . . .) eine abbrechende Folge, so ist offenbar Da = K , und fa ist das Polynom a0 + a1 z + · · · + an z n . 2. Auch im Fall unendlich vieler nicht verschwindender an kann Da = K sein. Hier eine qualitative Vor¨ uberlegung: Damit an z n konvergiert, muss doch die Folge (an z n ) gen¨ ugend schnell gegen Null gehen. Und damit das auch f¨ ur z-Werte mit beliebig großem |z| garantiert werden kann, muss die Folge (an ) selbst sehr, sehr schnell“ gegen Null konvergieren. ” Genau das leistet das jetzt folgende Beispiel.
Man betrachte a := (1/n!)n∈N 0 , es geht also um die Potenzreihe ∞ z2 z3 zn =1+z+ + + ··· . n! 2! 3! n=0
(Um die rechts stehende Reihe u ¨ bersichtlicher mit dem Summenzeichen schreiben zu k¨ onnen, m¨ ussen wir 0! := 1 definieren. Und da nicht ausgeschlossen werden soll dass wir z = 0 einsetzen, muss 00 := 1 gesetzt werden, damit die Formel auch in diesem Fall stimmt.)
F¨ ur jedes beliebige z ∈ K \ {0} kann dann so argumentiert Der
werden: Betrag des Quotienten zweier aufeinander folgender Terme in an z n ist gleich ) |z n+1 | (n + 1)! |an+1 z n+1 | |z| ) = . = |an z n | n+1 |z n | n! W¨ahlt man ein n0 mit n0 ≥ |z|, so kann man diese Absch¨ atzung f¨ ur die n ≥ n0 durch |z| |z| ≤ =: q < 1 n+1 n0 + 1 fortsetzen, nach dem Quotientenkriterium liegt also Konvergenz vor. 3. Es kann auch passieren, dass Da nur die Null enth¨ alt (die ist nat¨ urlich stets ein Element von Da ). Hier f¨ uhrt eine qualitative Vor¨ uberlegung darauf, dass das Ph¨ anomen bei solchen (an ) auftreten wird, die sehr, sehr schnell gegen Unendlich“ ge” hen. Und wirklich:
Wir setzen (an )n∈N 0 := (n!)n∈N 0 . F¨ ur noch so kleines“ von Null ver (aber ” schiedenes) z ist der Quotient zweier Reihenglieder in an z n gleich (n + 1)z. F¨ ur gen¨ ugend große n wird der Betrag dieses Quotienten also gr¨ oßer als 1 sein, von da ab wachsen also die Betr¨ age. Insbesondere kann (an z n ) keine Nullfolge sein, die Reihe ist also bestimmt nicht konvergent. Folglich liegt z nicht in Da .
∞ n 4. Sei a = (1, 1, . . .). Da n=0 z genau dann konvergent ist, wenn |z| < 1 27) gilt , ist Da = {z | |z| < 1}. Außerdem ist fa (z) = 1/(1 − z) f¨ ur z ∈ Da , denn es handelt sich gerade um die geometrische Reihe. 27) Zur Begr¨ undung kann man sowohl das Quotientenkriterium als auch das Wurzelkriterium heranziehen; s. Satz 2.4.3.
4.4. POTENZREIHEN
275
5. Im Falle a = (0, 1, 12 , 13 , . . .) ist das Konvergenzverhalten von ∞ z2 z3 zn =z+ + + ··· n 2 3 n=1
zu untersuchen. Diese Reihe • konvergiert f¨ ur |z| < 1 (nach dem Quotientenkriterium), • divergiert f¨ ur |z| > 1 (dann ist (z n /n) nicht einmal eine Nullfolge), • konvergiert f¨ ur z = −1 (nach dem Leibnizkriterium),
∞ • divergiert f¨ ur z = 1 (da n=1 1/n = +∞). Also gilt {z | |z| < 1} ∪ {−1} ⊂ Da ⊂ {z | |z| ≤ 1} \ {1}. Damit ist Da im Fall K = R charakterisiert: Da = [ −1, 1 [. Im komplexen Fall wissen wir nur, dass Da zwischen der offenen und der abgeschlossenen Kreisscheibe mit Mittelpunkt 0 und Radius 1 liegt. Der n¨ achste Satz zeigt, dass die Menge Da wie in den Beispielen immer gleich K oder im Wesentlichen“ eine Kreisscheibe ist. Zur Vorbereitung ben¨ otigen wir ” das Lemma 4.4.2. Ist z ∈ Da und |w| < |z|, so ist auch w ∈ Da . Die Reihe
∞ n n=0 an w ist sogar absolut konvergent.
n n Beweis: Da ∞ ahlen ein M ∈ R n=0 an z konvergent ist, gilt an z → 0. Wir w¨ n mit |an z | ≤ M f¨ ur alle n ∈ N (das ist wegen Lemma 2.2.11 m¨ oglich). Weiter ist q := |w/z| < 1, und daraus ergibt sich wegen w n |an wn | = |an z n | · ≤ M q n z
∞ die absolute Konvergenz von n=0 an wn mit Hilfe von Satz 2.4.2.
Satz 4.4.3. Sei a = (a0 , a1 , . . .) vorgelegt. Dann gibt es zwei M¨oglichkeiten: • Entweder ist Da = K , dann definieren wir die Zahl Ra durch Ra := +∞. • Oder es gibt ein eindeutig bestimmtes Ra ∈ [ 0, +∞ [ mit {z | |z| < Ra } ⊂ Da ⊂ {z | |z| ≤ Ra }. Ra heißt der Konvergenzradius der Potenzreihe fa .
Konvergenzradius
276
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Bemerkung: Es ist im Fall Ra < +∞ ein schwieriges Problem, Aussagen u ¨ ber das Konvergenzverhalten bei den z mit |z| = Ra zu machen. Es kann alles M¨ogliche passieren: Konvergenz f¨ ur kein derartiges z, Konvergenz f¨ ur alle z mit |z| = Ra . In der Regel wird nur ein Teil des Randes der Kreisscheibe mit dem Radius Ra zu Da geh¨oren. Beweis: Sei Da = K . Wir haben ein Ra ∈ [ 0, +∞ [ mit den Eigenschaften z |z| < Ra ⊂ Da ⊂ z |z| ≤ Ra anzugeben; dass Ra dann eindeutig bestimmt ist, ist klar. Dazu w¨ahlen wir ein z0 ∈ K , z0 ∈ Da . Aufgrund des vorstehenden Lemmas ist dann |z| ≤ |z0 | f¨ ur z ∈ Da , denn im Fall |z| > |z0 | w¨ urde der Widerspruch z0 ∈ Da folgen. Damit k¨onnen wir Ra := supz∈Da |z| definieren. (Man beachte, dass stets 0 ∈ Da , d.h. das Supremum wird wirklich u ¨ber eine nach oben beschr¨ankte, nicht leere Teilmenge von R gebildet.) Nach Definition ist dann Da ⊂ z |z| ≤ Ra , das ist schon die H¨alfte der Behauptung. Ist andererseits z1 ∈ K mit |z1 | < Ra vorgegeben, so gibt es nach Definition von Ra ein z2 ∈ Da mit |z2 | > |z1 | (s. Kasten). Lemma 4.4.2 impliziert dann z1 ∈ Da .
∞ Bemerkung: Der Beweis zeigt, dass die Reihe n=1 an z n f¨ ur die z mit |z| < Ra sogar absolut konvergent ist. Das Supremum: Die wichtigsten Fakten Immer wieder werden in diesem Buch Supremumstechniken eine Rolle spielen. Deswegen stellen wir die wichtigsten drei Punkte (die alle im vorstehenden Beweis eine Rolle spielten) noch einmal zusammen. Ist A eine nicht leere Teilmenge von R , die nach oben beschr¨ankt ist, so gilt: • sup A existiert. • F¨ ur a ∈ A gilt a ≤ sup A. • Ist b < sup A, so muss es ein a ∈ A mit b < a geben.
?
K¨onnen Sie diese drei Aussagen begr¨ unden?
Wenn Da bekannt ist, ist Ra leicht zu ermitteln (z.B. ist Ra = +∞ in den vorstehenden Beispielen 1 und 2, es gilt Ra = 0 in Beispiel 3 und Ra = 1 in den beiden anderen Beispielen). Wir werden nun eine M¨oglichkeit herleiten, Ra direkt aus den a0 , a1 , . . . zu ermitteln. Dazu erinnern wir noch einmal an das Wurzelkriterium der Reihenkonvergenz (Satz 2.4.3): Ist (bn )n∈N eine Folge in K mit n
|bn | ≤ q < 1 (alle bn mit (4.3) ∞ n ≥ n0 , n0 geeignet), so existiert n=1 bn .
4.4. POTENZREIHEN
277
Umgekehrt gilt wegen Satz 2.4.2(v): Ist (bn )n∈N eine in K mit |bn | ≥ 1 f¨ ur unendlich viele
Folge ∞ n, so existiert n=1 bn nicht. Das ist hier mit bn = an z n anzuwenden, d.h.: Es ist z ∈ Da , falls |z| n |an | ≤ q < 1 (alle n ≥ n0 , wo n0 geeignet). Es ist z ∈ Da , falls |z| n |an | ≥ 1 f¨ ur unendlich viele n.
(4.4)
(4.3) (4.4)
Daraus k¨ onnen wir f¨ ur die Zahl Ra zweierlei ableiten: 1. Ist α eine positive Zahl mit der Eigenschaft n |an | ≤ α − ε,
∃∃ ∀
ε>0 n0 ∈N n≥n0
so ist n |an |/α ≤ 1 − ε/α. Wegen (4.3) gilt dann 1/α ∈ Da und folglich ist 1/α ≤ Ra . 2. Sei α eine positive Zahl mit der Eigenschaft: Es gibt unendlich viele n mit
n |an | ≥ α.
Dann ist n |an |/α ≥ 1 f¨ ur unendlich viele n, und (4.4) impliziert, dass 1/α ∈ Da . Folglich ist 1/Ra ≥ α. Diese Rechnungen zeigen, dass es um so etwas wie die wesentliche Gr¨ oße“ √ ” der Folge ( n an ) geht. Zu dieser Frage gibt es den folgenden Exkurs: Der Limes superior einer Folge Sei b = (bn ) irgendeine Folge in R . Wie kann man pr¨ azise fassen, was die ” wesentliche Gr¨ oße“ von (bn ) ist? Um auch ±∞ zur Verf¨ ugung zu haben, werden ˆ arbeiten (vgl. Abschnitt 3.3). wir in R Die in der folgenden Definition eingef¨ uhrte Zahl lim sup bn hat sich als geeignetes Maß erwiesen:
lim sup
Definition 4.4.4. ˆ heißt ein H¨aufungspunkt von (bn ), wenn t Limes einer (i) Eine Zahl t ∈ R geeignet gew¨ahlten Teilfolge (bnk ) ist. Wir bezeichnen mit ∆b die Menge aller H¨aufungspunkte von (bn ). Man beachte, dass ∆b nicht leer ist, denn nach Satz 3.2.6 hat jede Folge ˆ eine konvergente Teilfolge. in R
H¨ aufungspunkt
278
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
(ii) Der Limes superior von (bn ) wird als ˆ lim sup bn := sup ∆b ∈ R definiert 28) . M¨ochte man hervorheben, wie die Folgenindizes heißen, schreibt man lim supn→∞ bn . lim inf
(iii) Der Vollst¨andigkeit halber definieren wir noch: Der Limes inferior von (bn ) ist die Zahl 29) ˆ. lim inf bn := inf ∆b ∈ R Bemerkungen und Beispiele:
?
1. Gleichberechtigt zu lim sup“ bzw. lim inf“ werden in der Literatur die Be” ” zeichnungen lim“ und lim“ verwendet. ” ” 2. Wir betrachten zun¨achst die Folge (bn ) := (0, 1, 0, 1, 0, 1, . . .). Offensichtlich sind die Zahlen 0 und 1 H¨aufungspunkte, und weitere kann es nicht geben (warum eigentlich?). Deswegen ist in diesem Fall ∆b = {0, 1} und folglich lim sup bn = 1, lim inf bn = 0. ˆ konvergente Folge, so ist jede Teilfolge gegen den gleichen 3. Ist (bn ) eine in R amlich lim bn – Limes konvergent. D.h., dass ∆b nur ein einziges Element – n¨ enth¨alt, und deswegen muss lim sup bn = lim inf bn = lim bn gelten. (Auch die Umkehrung ist richtig: Vgl. Satz 4.4.5, er wird gleich anschließend bewiesen werden.) 4. In der Regel ist es nicht schwer, lim sup bn und lim inf bn zu finden. Stellen Sie sich das Problem am besten als Spiel vor: Derjenige gewinnt, der eine konvergente Teilfolge mit einem m¨oglichst großen (bzw. m¨ oglichst kleinen) Limes findet, dieser optimale Limes ist dann der Limes superior bzw. der Limes inferior30) . Mit dieser Bemerkung sollte klar sein: • F¨ ur (bn ) = (1, 0, 2, 0, 3, 0, 4, 0, . . .) ist lim sup bn = +∞, lim inf bn = 0. • lim sup −n = lim inf −n = −∞. 28) Hier ist ein weiteres Mal an Satz 3.2.6 zu erinnern, danach hat jede Teilmenge von R ˆ ein Supremum. 29) Auch ±∞ sollen hier als Zahlen“ bezeichnet werden, eigentlich sind es ja verallgemei” ” nerte“ oder uneigentliche“ Zahlen. ” 30) Grundlage f¨ ur diese Faustregel ist die Tatsache, dass lim sup bn zu ∆b geh¨ ort. Das wird gleich in Satz 4.4.5 gezeigt werden.
4.4. POTENZREIHEN
279
• (bn ) sei irgendeine Aufz¨ahlung aller rationalen Zahlen in [ 0, 1 ]. Dann gilt lim sup bn = 1, lim inf bn = 0. Begr¨ undung: Wir behaupten, dass in diesem Fall ∆b = [ 0, 1 ] gilt; daraus ergibt sich dann die Behauptung unmittelbar. Die Inklusion ⊂“ folgt aus der Abgeschlossenheit von [ 0, 1 ]: F¨ ur konvergente ” Teilfolgen von (bn ) kann der Limes nicht außerhalb liegen. Ist umgekehrt eine Zahl x0 ∈ [ 0, 1 ] vorgegeben, so w¨ ahle man zu k ∈ N ein bnk mit |x0 − bnk | ≤ ullen, 1/k. Außerdem soll n1 < n2 < · · · gelten. Beide Forderungen sind zu erf¨ denn in dem Intervall {x | 0 ≤ x ≤ 1, |x − x0 | ≤ ε} liegen nach dem Dichtheitssatz 1.7.4 unendlich viele rationale Zahlen31) , die alle irgendwo in der Folge (bn ) vorkommen.
5. Warum haben wir uns hier eigentlich auf reelle Folgen beschr¨ ankt? Warum traten keine komplexen Folgen oder Folgen in einem beliebigen metrischen Raum auf? Im folgenden Satz steht alles, was wir u ussen: ¨ ber den Limes superior wissen m¨ Satz 4.4.5. (bn ) sei eine reelle Folge. (i) lim sup bn geh¨ort zu ∆b , d.h., es gibt eine Teilfolge von (bn ), die gegen den Limes superior konvergiert. Anders ausgedr¨ uckt: lim sup bn ist der gr¨oßte H¨aufungspunkt der Folge (bn ). (ii) Wir definieren c := lim sup bn und nehmen an, dass c ∈ R . Dann gilt: F¨ ur jedes ε > 0 gibt es nur endlich viele Indizes n mit bn ≥ c + ε, aber f¨ ur unendlich viele Indizes n ist bn ≥ c − ε. (iii) Es sei lim sup bn = +∞. F¨ ur jedes reelle R sind dann unendlich viele bn gr¨oßer oder gleich R. ur jedes reelle R – nur endlich viele bn (iv) Ist lim sup bn = −∞, so sind – f¨ gr¨oßer oder gleich R. (v) Die vorstehenden Aussagen charakterisieren den Limes superior: Hat eine reelle Zahl c die in (ii) beschriebenen Eigenschaften, so ist c = lim sup bn . Entsprechend gelten die Umkehrungen von (iii) und (iv). ˆ genau dann konvergent, wenn lim sup bn = lim inf bn (vi) Eine Folge (bn ) ist in R gilt. Zu (i) bis (v) analoge Charakterisierungen gibt es f¨ ur den Limes inferior. 31) Genau genommen, garantiert der Satz nur die Existenz von einer rationalen Zahl in diesem Intervall. Man muss ihn wiederholt anwenden, um nach und nach unendlich viele zu produzieren.
?
280
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Beweis: (i) Sei zun¨achst c := lim sup bn ∈ R . Wir setzen ε1 := 1 und betrachten c − ε1 . Diese Zahl ist kleiner als c, und deswegen muss es nach Definition des Supremums ein d ∈ ∆b mit c ≥ d > c − ε1 geben. Es existiert also eine Teilfolge bnk von (bn ), die gegen d konvergent ist, wegen d > c − ε1 und d < c + ε1 gibt es Elemente dieser Teilfolge, die gr¨oßer als c − ε1 und gleichzeitig kleiner als c + ε1 sind. Sei bm1 so ein Element. (m1 ist also ein nk , f¨ ur das nk gen¨ ugend groß“ ” ist.) ur die vorstehenden Als N¨achstes setzen wir ε2 := 1/2 und wiederholen daf¨ ¨ Uberlegungen. Als einzige Modifikation sorgen wir daf¨ ur, dass f¨ ur das bm2 mit c − ε2 < bm2 < c + ε2 , das wir auf diese Weise finden, die Bedingung m2 > m1 erf¨ ullt ist. Das ist leicht zu schaffen, da wir ja unendlich viele b zur Auswahl haben. Es sollte klar sein, wie es weitergeht: Wir betrachten ε3 := 1/3, ε4 := 1/4 usw. Auf diese Weise erh¨alt man Indizes mit m1 < m2 < · · · und c−
1 1 < b mr < c + r r
f¨ ur alle r ∈ N . Nach Konstruktion geht diese Teilfolge (bm1 , bm2 , . . .) gegen c, und das bedeutet c ∈ ∆b . Falls c = +∞ ist, wird ganz ¨ahnlich argumentiert. Wir beginnen mit R1 := 1 und suchen ein R ∈ ∆b mit R > R1 . (Es kann sein, dass man nur R = +∞ w¨ ahlen kann.) Eine Teilfolge konvergiert gegen R, es gibt also ein Folgenelement bm1 mit bm1 > R1 . Es geht dann weiter wie im ersten Teil dieses Beweises: Man wiederhole die Konstruktion mit R2 := 2, R3 := 3, . . . , schließlich erh¨ alt man eine Teilfolge (bm1 , bm2 , . . .) mit bmr > r f¨ ur alle r ∈ N . Das bedeutet aber bmr → +∞, also +∞ ∈ ∆b . Sollte schließlich c = −∞ sein, f¨ uhrt folgende Abwandlung des Arguments zum Ziel. Wir betrachten zun¨achst R1 := −1. Wir behaupten, dass nur endlich onnen: Andernfalls g¨ abe es eine Teilfolge der viele bn gr¨oßer oder gleich R1 sein k¨ Folge (bn ) in [ R1 , +∞ ], und da dieses Intervall nach Satz 3.2.6 als abgeschlosˆ kompakt ist, l¨ sene Teilmenge von R asst sich sogar eine konvergente Teilfolge abe es einen Punkt aus ∆b , was sicher der finden. Zusammen: In [ R1 , +∞ ] g¨ vorausgesetzten Gleichung sup ∆b = −∞ widerspricht. ur Insbesondere gibt es mindestens ein bn mit bn < R1 , wir nennen es bm1 . F¨ R2 = −2, R3 = −3, . . . geht alles ganz genauso, man hat nur daf¨ ur zu sorgen, dass f¨ ur die bmr mit bmr < Rr , die man so findet, die Beziehung m1 < m2 < · · · gilt. Das ist aber wieder kein Problem, da man die Wahl zwischen unendlich vielen Folgengliedern hat. Wir haben auf diese Weise eine Teilfolge mit Limes −∞ konstruiert, und das heißt −∞ ∈ ∆b . (ii) Wieder geht es um einfache Supremumseigenschaften, die zus¨ atzlich erforderlichen Techniken haben wir im vorigen Beweis schon kennen gelernt. ˆ) Sei also ε > 0. Mal angenommen, es w¨ aren unendlich viele bn in dem (in R kompakten Intervall [ c + ε, +∞ ]. Dann h¨ atten wir auch eine in diesem Intervall
4.4. POTENZREIHEN
281
konvergente Teilfolge, d.h., dort l¨age ein Element von ∆b . Das kann aber nicht sein, da c obere Schranke von ∆b ist. Umgekehrt: L¨ agen nur endlich viele bn rechts von c − ε, so k¨ onnte keine konvergente Teilfolge einen Limes haben, der gr¨oßer als c − ε w¨ are. Damit w¨ are c − ε eine obere Schranke von ∆b im Widerspruch dazu, dass c die beste obere Schranke sein sollte. (iii) und (iv) werden ganz a¨hnlich bewiesen. (v) Sei c mit den entsprechenden Eigenschaften gegeben, wir zeigen die Aussage f¨ ur den Fall c ∈ R . (F¨ ur c = ±∞ sind die Beweise analog.) F¨ ur c gilt doch: F¨ ur jedes ε > 0 gibt es ein d ∈ ∆b mit c − ε < d, und c + ε ist eine obere Schranke von ∆b . (Wie das aus unendlich viele bn sind gr¨ oßer ” als c − ε“ und nur endlich viele bn sind gr¨oßer als c + ε“ folgt, ist ” in den vorigen Beweisteilen gezeigt worden.) Die erste Eigenschaft impliziert, dass kein c − ε obere Schranke von ∆b ist, d.h., es muss c ≤ sup ∆b gelten. Und wegen der zweiten sind alle c + ε obere Schranken, und daraus k¨onnen wir sup ∆b ≤ c schließen. Zusammen heißt das: c = sup ∆b = lim sup bn . (vi) Ist (bn ) konvergent mit Limes c, so konvergiert auch jede Teilfolge gegen c. Also ist ∆b = {c}, und wir erhalten lim sup bn = lim inf bn = c. Umgekehrt: Gilt lim sup bn = lim inf bn =: c, so liegen aufgrund der vorstehend bewiesenen Resultate32) f¨ ur jedes positive ε nur jeweils endlich viele bn links von c − ε bzw. rechts von c + ε. Also l¨asst sich ein n0 angeben, so dass |c − bn | ≤ ε f¨ ur n ≥ n0 . (Ende des Exkurses zum Limes superior) Nun wenden wir uns wieder Potenzreihen zu. Angesichts der zur Definition des Limes superior f¨ uhrenden Vor¨ uberlegungen ist der erste Teil des nachstehenden Satzes nicht u ¨berraschend. Zum zweiten Teil gelangt man in analoger Weise, wenn man anstelle des Wurzelkriteriums das Quotientenkriterium zur
∞ Diskussion des Konvergenzverhaltens von n=0 an z n ausnutzt. Satz 4.4.6. a := (a0 , a1 , . . .) sei eine Folge in K , fa die zugeh¨orige Potenzreihe und Ra deren Konvergenzradius. (i) Es ist Ra =
1 . lim sup n |an |
Wir vereinbaren dabei: 1/0 := +∞ und 1/+∞ := 0. 32) Wir brauchen nat¨ urlich ein entsprechendes Ergebnis f¨ ur den Limes inferior. Außerdem gilt der Beweis nur f¨ ur c ∈ R , es sollte klar sein, wie im Fall c = ±∞ zu argumentieren ist.
282
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
ˆ , so ist (ii) Sind alle an = 0 und existiert limn→∞ |an /an+1 | in R an . Ra = lim n→∞ an+1 Beweis: Zun¨achst bemerken wir, dass aufgrund der Definition des Konvergenzradius Ra diejenige Zahl R ist, f¨ ur die gilt
∞ (a) |z| < R ⇒ n=0 an z n ist konvergent.
∞ (b) |z| > R ⇒ n=0 an z n ist divergent. (Wobei im Falle R = 0 nur (b) und im Fall R = +∞ nur (a) zu zeigen ist.) (i) Aufgrund der Vorbemerkung sind zwei Beweise zu f¨ uhren. Wir beginnen mit n der Vorgabe einer Zahl z mit |z| < 1/lim sup |a |. Zu zeigen ist die Konvergenz n
n wir ohne Einschr¨ a nkung z = 0 annehmen d¨ urfen. Es ist von ∞ n=0 an z , wobei dann |1/z| > lim sup n |an |. Wir w¨ ahlen uns ein positives ε, so dass auch noch 1 − ε > lim sup n |an |. z Satz 4.4.5(ii) garantiert die Existenz eines n0 ∈ N , so dass f¨ ur n ≥ n0 stets n |an | ≤ |1/z| − ε ist. Es folgt |z| n |an | = n |an z n | ≤ 1 − ε|z| < 1,
∞ d.h. n=0 an z n ist wegen des Wurzelkriteriums (sogar absolut) konvergent. < lim sup n |an |, und wegen Nun sei |z| > 1/lim sup n |an |. Damit gilt |1/z| ur diese n ist Satz 4.4.5 muss es unendlich viele n mit 1/|z| ≤ n |an | geben. F¨
∞ n dann aber |an z | ≥ 1, d.h. n=0 an z n kann nicht konvergent sein. (ii) Wieder sind zwei Beweise erforderlich, sei zun¨ achst ein z mit an |z| < lim n→∞ an+1 gegeben. Wir w¨ahlen M1 , M2 mit
an |z| < M1 < M2 < lim n→∞ an+1
und anschließend ein n0 ∈ N , so dass |an /an+1 | ≥ M2 f¨ ur alle n ≥ n0 ist. F¨ ur diese n gilt dann: an+1 z n+1 = an+1 |z| an z n an an+1 M 1 ≤ an ≤
M1 < 1, M2
4.4. POTENZREIHEN
283
d.h. die des Quotientenkriteriums sind erf¨ ullt. Folglich ist die
Voraussetzungen ∞ Reihe n=0 an z n konvergent. Schließlich sei |z| > lim |an /an+1 |. Dann gibt es ein n0 ∈ N , so dass f¨ ur |a /a | ≤ |z| gilt. F¨ u r diese n ist dann auch alle n ≥ n0 die Ungleichung n n+1 |an z n | ≤ an+1 z n+1 , insbesondere sind die an z n durch die positive Zahl |an0 z n0 | nach unten beschr¨ ankt und k¨onnen damit nicht gegen Null konvergieren. Es folgt: F¨ ur solche z ist die Potenzreihe nicht konvergent. Bemerkungen und Beispiele: 1. Es ist hervorzuheben, dass die Formel f¨ ur Ra in (i) stets anwendbar ist, wogegen (ii) nur unter besonderen Voraussetzungen an die Folge (an ) herangezogen werden darf (die allerdings f¨ ur so gut wie alle wichtigen Potenzreihen erf¨ ullt sind). 2. Hier zwei Beispiele, bei denen der Konvergenzradius mit Teil (i) des Satzes berechnet wird: Sei c = 0. F¨ ur a = (cn ), also f¨ ur die Potenzreihe 1 + cx + c2 x2 + · · · , n |an | = |c|, und der Limes superior der konstanten Folge (|c|) ist ist nat¨ urlich gleich |c|. Es folgt Ra = 1/|c| (womit insbesondere klar wird, dass alle positiven Zahlen als Konvergenzradius vorkommen k¨ onnen). ort die Man betrachte die Folge (an ) = (nn ) = (1, 1, 4, 27, . . .), dazu geh¨ Potenzreihe 1 + z + 4z 2 + 27z 3 + . . . Diesmal ist n |an | = n, das Inverse des Limes superior dieser Folge ist Null. Die zu a geh¨ orige Potenzreihe konvergiert also nur f¨ ur z = 0. 3. Meist geht es mit Teil (ii) des Satzes einfacher: Beim ersten der vorstehenden Beispiele, also bei der Folge a = (cn ), ist |an /an+1 | = 1/|c|. Wir erhalten noch einmal Ra = 1/|c|.
Sei a = (1/n), diesmal lassen wir in der Reihe an z n das n von 1 bis Unendlich laufen. Wegen lim |an /an+1 | = lim(1+ n1 ) = 1 ist Ra = 1.
Im Fall a = (1/n!) ist lim |an /an+1 | = lim(n+1) = +∞, die Reihe z n /n! ist also f¨ ur alle z konvergent . 4. Aus den zwei M¨ oglichkeiten zur Berechnung von Ra lassen sich manchmal interessante Folgerungen ziehen. Als Beispiel betrachten wir die Potenzreihe
n nz . Mit Teil (ii) des Satzes √ folgt sofort, dass der Konvergenzradius gleich 1 ist, deswegen muss lim sup n n = 1/Ra ebenfalls gleich 1 sein. Und daraus folgt die bemerkenswerte Gleichung √ lim n n = 1 (die in Kapitel 2 schon einmal bewiesen wurde).
284
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Wir zeigen nun, dass Potenzreihen besonders gutartige Funktionen sind: Potenzreihen d¨ urfen beliebig oft differenziert werden, man darf sogar gliedweise ableiten, und die Ableitung ist wieder eine Potenzreihe mit dem gleichen Konvergenzradius. Dabei verstehen wir unter gliedweise ableiten“ die Aussage, dass ” die folgende Rechnung (die wir bisher nur f¨ ur Polynome bewiesen haben) f¨ ur Potenzreihen legitim ist: (4.5) a0 + a1 z + a2 z 2 + a3 z 3 + · · · = a1 + 2a2 z + 3a3 z 2 + · · · . Als Vorbereitung zeigen wir im nachstehenden Lemma, dass die rechte Seite in (4.5) sinnvoll ist: Lemma 4.4.7. Es gilt: √ (i) n n → 1. ˆ und (αn )n∈N eine gegen 1 konvergente reelle (ii) Ist (bn )n∈N eine Folge in R Folge, so ist lim sup αn bn = lim sup bn . n→∞
n→∞
(iii) Die Konvergenzradien der Potenzreihen sind gleich.
∞ n=0
an z n und
∞ n=0
nan z n−1
Beweis: (i) Das haben wir eben in Bemerkung 4 bewiesen, eine elementare Begr¨ undung gab es auch schon in Abschnitt 2.2 (s. Seite 119). (ii) Wegen αn → 1 sind die Limites der Teilfolgen von (αn bn ) die gleichen wie die von (bn ). Das beweist die Behauptung, denn der Limes superior ist das Supremum dieser Limites.
∞ (iii) Der Konvergenzradius von n=0 an z n ist 1/lim sup n |an |, und wegen (i) und (ii) gilt 1 1 = = . √ n n n lim sup |an | lim sup n |an | lim sup n |nan | 1
Die nach Satz 4.4.6 gerade der Konvergenzradius von
∞ rechte nSeite ist aber
∞
∞ n n−1 na z , der wegen na z = z mit dem Konvergenzn
n n=0 n=0 n=0 nan z ∞ n−1 u radius von n=0 nan z ¨bereinstimmt. Satz 4.4.8. fa (z) = a0 + a1 z + a2 z 2 + · · · sei eine Potenzreihe mit positivem Konvergenzradius Ra . Dann ist fa bei allen z mit |z| < Ra (also im Innern des Konvergenzkreises) differenzierbar mit fa (z) = a1 + 2a2 z + 3a3 z 2 + · · · . Insbesondere ist fa ebenfalls eine Potenzreihe mit Konvergenzradius Ra , und eine mehrfache Anwendung dieses Ergebnisses zeigt, dass fa in {z | |z| < Ra } beliebig oft differenzierbar ist.
4.4. POTENZREIHEN
285
Bemerkung: Obwohl die Konvergenzradien gleich sind, k¨ onnen die Definitionsamlich bereiche der beiden Potenzreihen fa und fa verschieden sein. Es kann n¨ sein, dass f¨ ur gewisse z ∈ Da mit |z| orige Reihe
∞= Rna die zur Ableitung geh¨ nicht konvergiert. Z.B. ist fa (z) = n=1 z /n bei z = −1 nach dem Leibnizkriterium konvergent, die Ableitung 1 + z + z 2 + · · · divergiert aber an dieser Stelle. Beweis: Sei |z0 | < Ra und (zk )k∈N eine Folge im Definitionsbereich von fa mit ur alle k. Wir haben zu zeigen, dass zk → z0 , zk = z0 f¨ ∞ fa (zk ) − fa (z0 ) = nan z0n−1 k→∞ zk − z0 n=1
lim
bzw. – nach Ausrechnen und Sortieren – n ∞ zk − z0n n−1 an − nz0 ≤ε zk − z0 ε>0 k ∈N k≥k n=1
∀∃ ∀ 0
0
gilt. Sei also ε > 0 vorgegeben. Die Strategie des Beweises ist wie folgt: (i) Wir w¨ ahlen ein n0 ∈ N , so dass f¨ ur alle k gilt: n ∞ n an zk − z0 − nz n−1 ≤ ε . 0 2 zk − z0 n=n +1 0
(ii) Wir suchen ein k0 ∈ N , so dass n n0 n an zk − z0 − nz n−1 ≤ ε 0 2 z − z k 0 n=1 f¨ ur k ≥ k0 . Damit w¨ are alles gezeigt, denn f¨ ur k ≥ k0 w¨are dann wirklich n ∞ zk − z0n n−1 an − nz0 ≤ ε. zk − z0 n=1
∞
∞ Man beachte dabei, dass f¨ ur beliebige Reihen | n=1 bn | ≤ n=1 |bn | gilt. Es fehlt noch der Nachweis von (i) und (ii). (i) Da wir nur am Konvergenzverhalten f¨ ur k → ∞ interessiert sind, d¨ urfen wir ohne Einschr¨ ankung annehmen, dass f¨ ur alle k |zk | ≤ β :=
|z0 | + Ra (β := |z0 | + 1, falls Ra = +∞) 2
gilt. Die zk konvergieren ja gegen z0 , und die geforderte Ungleichung gilt, wenn |z − z0 | ≤ (Ra − z0 )/2. F¨ ur |z| ≤ β ist aber n z − z0n n−1 n−1 − nz . 0 ≤ 2nβ z − z0
286
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Im Fall z0 = 0 ist das klar. Falls z0 = 0 gilt, nutzen wir die Formel 1 + q + · · · + qn = aus (s.S. 134). Wir rechnen so: n z − z0n n−1 z − z0 − nz0
=
= ≤ ≤ ≤
1 − q n+1 1−q
n−1 ( zz0 )n − 1 z · − n 0 z z0 − 1 n−1 n−1 z ν z · − n 0 z 0 ν=0 ! n−1 |z| ν n−1 · z +n 0 |z0 | ν=0 ! n−1 β ν n−1 · z +n 0 |z0 | ν=0 n−1 ! n−1 · 2n β z 0 |z0 |
= 2nβ n−1 . Nun liegt β nach Definition im Innern Konvergenzkreises von fa , und da nach
des n−1 den gleichen Konvergenzradius wie Lemma 4.4.7(iii) an nz Potenzreihe
∞ die fa hat, ist n=1 2nan β n−1 konvergent. Es gibt also wegen Satz 2.2.12(vii) ein n0 ∈ N mit ∞ 2nan β n−1 ≤ ε , 2 n=n +1 0
und daher ist f¨ ur dieses n0 auch n ∞ n an zk − z0 − nz n−1 ≤ ε 0 2 zk − z0 n=n +1 0
f¨ ur alle k ∈ N . (ii) Wegen (z n ) = nz n−1 gilt zkn − z0n −−→ 0 − nz0n−1 −− k→∞ zk − z0 f¨ ur alle n ∈ N . Folglich gilt auch n n0 n an zk − z0 − nz n−1 −− −−→ 0, 0 k→∞ zk − z0 n=1 denn eine Summe endlich vieler Nullfolgen ist wieder Nullfolge. Damit kann ein k0 mit den geforderten Eigenschaften gefunden werden.
4.4. POTENZREIHEN
287
Beispiele:
n 1. Wir betrachten zun¨achst die Potenzreihe ∞ n=0 z /n!. Diese Reihe hat einen unendlichen Konvergenzradius, und f¨ ur alle z gilt z3 z2 z2 z3 z1 z2 + + ··· = 1 + 2 + 3 + ··· = 1+ z + + + ··· . 1+z+ 2! 3! 2! 3! 2! 3! F¨ ur die Funktion fa gilt also die bemerkenswerte Identit¨ at fa = fa . 2. F¨ ur |z| < 1 ist
∞
! z
n
=
n=1
∞
nz n−1 .
n=1
n Wegen ∞ asst sich die Ableitung auch direkt berechnen, und n=1 z = 1/(1 − z) l¨ wir erhalten eine neue Summenformel: F¨ ur |z| < 1 ist
∞
nz n−1 =
n=1
1 . (1 − z)2
Welche Formel ergibt sich, wenn man noch einmal ableitet?
?
Es folgen einige direkte Anwendungen von Satz 4.4.8: Identit¨ atssatz
Korollar 4.4.9.
∞ n (i) Ist fa (z) = = a0 + a1 z + a2 z 2 + · · · eine Potenzreihe mit n=0 an z positivem Konvergenzradius, so lassen sich die Koeffizienten a0 , a1 , . . . aus der Funktion z → fa (z) ermitteln: Es gilt (n)
an =
fa (0) n!
f¨ ur alle n ∈ N . (ii) Sind fa , fb Potenzreihen mit positivem Konvergenzradius, so gilt: Gibt es eine Nullfolge (zk ), so dass zk = 0 und fa (zk ) = fb (zk ) f¨ ur alle k gilt, so ur alle n. (Wir setzen dabei nat¨ urlich voraus, dass alle fa (zk ), ist an = bn f¨ fb (zk ) definiert sind.) Insbesondere gilt:
Ist f¨ ur irgendein positives ε, das kleiner als Ra und
an z n = bn z n f¨ ur alle z mit |z| ≤ ε, so ist an = bn kleiner als Rb ist, f¨ ur alle n. (Identit¨atssatz f¨ ur Potenzreihen 33) )
∞ (iii) fa (z) = n=0 an z n sei eine Potenzreihe mit positivem Konvergenzradius. Dann ist fa symmetrisch (bzw. schiefsymmetrisch), genau dann, wenn a1 = a3 = · · · = 0 (bzw. a0 = a2 = · · · = 0). Dabei heißt eine Funktion f 33) Machen Sie sich klar, dass damit f¨ ur noch so winzige ε alle Informationen u ¨ber fa durch die Werte von fa auf {z | |z| ≤ ε} determiniert sind.
288
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) symmetrisch (bzw. schiefsymmetrisch) auf einer Menge ∆, wenn ∆ eine Teilmenge des Definitionsbereichs von f ist, mit z ∈ ∆ stets auch −z ∈ ∆ gilt und die Gleichung f (−z) = f (z) (bzw. f (−z) = −f (z)) f¨ ur alle z ∈ ∆ erf¨ ullt ist. (n)
Beweis: (i) Die Potenzreihe fa
beginnt offensichtlich mit
n!an + [(n + 1)n · · · 2]z + [(n + 2)(n + 1)n · · · 3]z 2 + · · · . Wenn man z = 0 einsetzt, erh¨alt man den Wert n!an . (ii) Wir geben zun¨achst einen kurzen direkten Beweis des Zusatzes: Stimmen ussen f¨ ur fa und fb alle Ableitungen fa und fb auf {z | |z| ≤ ε} u ¨ berein, so m¨ bei Null identisch sein. Wegen Teil (i) bedeutet das, dass alle Koeffizienten u ussen. ¨ bereinstimmen m¨ ¨ Es folgt der Beweis f¨ ur den allgemeinen Fall, da wird nur die Ubereinstimmung auf einer Nullfolge vorausgesetzt. fa und fb sind – als differenzierbare Funktionen – stetig bei 0. Aus fa (zk ) = fb (zk ) f¨ ur alle k folgt also fa (0) = fb (0), d.h. a0 = b0 . Daher gilt auch a1 zk + a2 zk2 + · · · = b1 zk + b2 zk2 + · · · urfen wir durch zk teilen und f¨ ur alle k, und da die zk von 0 verschieden sind, d¨ daraus a1 + a2 zk + a3 zk2 + · · · = b1 + b2 zk + b3 zk2 + · · · schließen (f¨ ur alle zk ). Da diese Potenzreihen den gleichen – insbesondere einen positiven – Konvergenzradius haben wie die Ausgangsreihen, sichert die Stetigkeit bei 0 die uhrt zu Identit¨at a1 = b1 , und die nahe liegende Fortsetzung dieses Verfahrens f¨ ur alle n. an = bn f¨ (iii) fa sei symmetrisch (bzw. schiefsymmetrisch). Dann verschwindet die Potenzreihe fa (z) − fa(−z) = 2a1 z + 2a3z 3 + · · · (bzw. die Reihe fa (z) + fa(−z) = 2a0 + 2a2 z 2 + · · · ) auf ihrem Definitionsbereich, alle Koeffizienten m¨ ussen demnach aufgrund des Identit¨atssatzes gleich Null sein. Wir kommen nun zum Ausgangspunkt dieses Abschnitts zur¨ uck, n¨ amlich zu der Frage, inwieweit eine vorgelegte, beliebig oft differenzierbare Funktion als Potenzreihe geschrieben werden kann. Definition 4.4.10. Sei M ⊂ K und z0 ∈ M ; M sei offen oder (im Fall K = R ) ein Intervall. Eine beliebig oft differenzierbare Funktion f : M → K heißt bei z0 lokal entwickelbar, wenn es ein δ > 0 und eine Potenzreihe
∞ in eine Potenzreihe n n=0 an (z − z0 ) gibt, so dass Ra > δ ist und f wie folgt dargestellt werden kann: ∞ an (z − z0 )n f¨ ur alle z mit |z − z0 | ≤ δ. f (z) = n=0
4.4. POTENZREIHEN
289
Bemerkungen, Beispiele und eine Warnung: 1. Falls f bei z0 lokal in eine Potenzreihe entwickelbar ist, sind die an leicht bestimmbar. Wegen 4.4.9(i) gilt n¨amlich an =
f (n) (z0 ) . n!
n 2. F¨ ur |z| < 1 ist doch 1/(1 − z) = ∞ n=0 z . Also ist z → 1/(1 − z) (definiert auf C \ {1}) bei z0 = 0 lokal in eine Potenzreihe entwickelbar. 3. Als etwas schwierigeres Beispiel betrachten wir f : ] −1, +∞ [ → R ,
x →
√ 1+x
bei x0 = 0. f ist beliebig oft differenzierbar, und ein nahe liegender Kandidat f¨ ur eine Potenzreihenentwicklung von f bei x0 liegt ebenfalls vor: f (x) =
∞ f (n) (0) n x n! n=0
(die so genannte Taylorreihe von f ; wegen Bemerkung 1 ist dies der einzig sinnvolle Ansatz). Wir werden zeigen, dass diese Reihe f¨ ur |x| < 1 gegen f (x) konvergent ist, d.h., dass f¨ ur diese x das Restglied in der Taylorentwicklung f¨ ur n → ∞ gegen 0 geht. Sei also |x| < 1 und Rn (x) durch f (x) =
n f (k) (0) k=0
k!
xk + Rn (x)
definiert. Die in Satz 4.3.2 beschriebene Form von Rn (x) f¨ uhrt hier nicht zum Ziel. Analog zum Beweis von Satz 4.3.2 l¨asst sich jedoch eine alternative Form des Restglieds herleiten, die f¨ ur diesen speziellen Fall g¨ unstiger ist. Wenn man diesmal nicht G(ξ) = (x − ξ)n+1 sondern G(ξ) = x − ξ betrachtet, so folgt: Es gibt ein ξ zwischen x und x0 (hier also zwischen x und 0) mit Rn (x) = F¨ ur f (x) =
√
f (n+1) (ξ) (x − x0 )(x − ξ)n . n!
1
1 + x = (1 + x) 2 ergibt sich
f (n+1) (ξ) = (−1)n ·
2n+1 1 · 3 · 5 · · · (2n − 1) (1 + ξ)− 2 2n+1
Taylorreihe
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
290 und folglich
|Rn (x)|
n |x − ξ| 1 · 3 · 5 · · · (2n − 1) |x| √ · · n! · 2n+1 |1 + ξ| 1+ξ n |x − ξ| 2 · 4 · 6 · · · 2n |x| · · n! · 2n+1 |1 + ξ| 1 − |x| n |x − ξ| 2n n! |x| · · n! · 2n+1 |1 + ξ| 1 − |x| n |x − ξ| |x| · . |1 + ξ| 2 1 − |x|
= ≤ ≤ =
Damit ist Rn (x) → 0 gezeigt, denn es ist x − ξ ur alle ξ zwischen 0 und x), 1 + ξ ≤ |x| (f¨ und nach Voraussetzung ist |x| < 1. √ Zusammen: 1 + x ist f¨ ur |x| < 1 in eine Potenzreihe entwickelbar, es gilt: √ 1 1+x=1+ ·x+ 2
1 2
· (− 12 ) 2 ·x + 2!
1 2
· (− 12 ) · (− 32 ) 3 ·x + ··· . 3!
Ganz analog zeigt man u ur k ∈ N und |x| < 1 ist ¨ brigens: F¨ √ 1 k 1+x=1+ ·x+ k
1 k
· ( k1 − 1) 2 ·x + 2!
1 k
· ( k1 − 1) · ( k1 − 2) 3 ·x + ··· . 3!
4. Warnung: Es ist nicht richtig, dass jede beliebig oft differenzierbare Funktion lokal in eine Potenzreihe entwickelbar ist. Von dem franz¨ osischen Mathematiker Augustin-Louis Cauchy (1789-1857) stammt das folgende ber¨ uhmte Gegenbeispiel. Die Idee ist leicht zu verstehen: R f : x → e− x2 1
1 −4
−3
−2
−1
R 1
2
3
4
Bild 4.14: Das Gegenbeispiel Man w¨ahlt eine Funktion f , die bei 0 so schnell gegen Null geht, dass alle Ableitungen bei 0 verschwinden: f (0) = f (0) = f (0) = · · · = 0. Wenn dann f in jeder Umgebung von 0 von Null verschiedene Werte annimmt, kann f bei 0
4.4. POTENZREIHEN
291
nicht lokal in eine Potenzreihe entwickelbar sein (im Falle der Entwickelbarkeit ∞ f (n) (0) n x = 0 in einer Umgebung von 0). ist n¨ amlich f (x) = n! n=0 Hier ist eine Funktion f : R → R , die das Gew¨ unschte leistet: 0 x=0 f (x) := 2 e−1/x x = 0 (dabei benutzen wir die Exponentialfunktion im Vorgriff). Es ist dann nicht besonders schwierig nachzuweisen, dass f beliebig oft differenzierbar ist und dass ¨ ur alle n ∈ N gilt (vgl. Ubung 4.4.2). Das liegt im Wesentlichen f (n) (0) = 0 f¨ daran, dass limx→∞ xk e−x = 0 f¨ ur alle k, ein Ergebnis, das wir in Abschnitt 4.2 schon kennen gelernt haben (s. Seite 259). Da f in keiner Umgebung der Null gleich der Nullfunktion ist, erf¨ ullt f die geforderten Bedingungen. Wo bleibt das Positive? Es steht im folgenden Satz 4.4.11. Es sei ] a, b [ ein Intervall in R , und eine beliebig oft differenzierbare Funktion f : ] a, b [ → R sei vorgegeben. Weiter sei x0 ∈ ] a, b [. (i) Falls es positive K und δ gibt, so dass f (n) (ξ) ≤ K f¨ ur alle n und alle ξ mit |ξ − x0 | ≤ δ, so ist f ist bei x0 lokal in eine Potenzreihe entwickelbar, f¨ ur die der Konvergenzradius ≥ δ ist. Kurz: Gleichm¨aßig beschr¨ankte Ableitungen garantieren Entwickelbarkeit. (ii) Es gebe ein r, so dass f (r) = f . Dann ist f bei x0 lokal in eine Potenzreihe entwickelbar. (iii) Allgemeiner gilt: Es gebe ein r ∈ N und reelle Zahlen a0 , . . . , ar−1 , so dass f (r) = a0 f + a1 f + · · · + ar−1 f (r−1) . Auch dann ist f lokal bei x0 in eine Potenzreihe entwickelbar. Beweis: (i) F¨ ur das Restglied in der Taylorentwicklung gilt f¨ ur |x − x0 | ≤ δ: (n+1) f (ξ) |Rn (x)| = (x − x0 )n+1 (n + 1)! δ n+1 . ≤ K· (n + 1)!
∞ Dabei gilt δ n /n! → 0, denn die Reihe n=0 δ n /n! ist konvergent34). (ii) Aufgrund der Voraussetzung ist es egal, ob man alle Ableitungen f, f , f , . . . oder nur die endlich vielen Ableitungen f, f , . . . , f (r−1) untersucht; zum Beispiel ist f (r+3) = f . Man braucht nun nur noch ein kompaktes Intervall 34) Das folgt zum Beispiel daraus, dass die Potenzreihe genzradius hat.
z n /n! einen unendlichen Konver-
292
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
[ x0 − δ, x0 + δ ] in ] a, b [ zu w¨ahlen und sich daran zu erinnern, dass stetige Funktionen auf kompakten Intervallen nach Satz 3.3.11 beschr¨ ankt sind. (Dieses Ergebnis wenden wir hier auf die Funktionen f, f , . . . , f (r−1) an.) (iii) Eine Modifikation des vorigen Beweises f¨ uhrt zum Ziel. Wir w¨ ahlen wieder ein kompaktes Intervall I := [ x0 − δ, x0 + δ ] und betrachten darauf die Funkankt, es gibt also ein tionen f, f , . . . , f (r−1) . Diese r Funktionen sind beschr¨ M ≥ 1 mit der Eigenschaft: (j) ur j = 0, . . . , r−1, x ∈ I. f (x) ≤ M f¨ Sei noch A eine Zahl, so dass A ≥ 1 und A ≥ |a0 |, . . . , |ar−1 |, wir behaupten, dass (j) ur alle j und alle x ∈ I. (4.6) f (x) ≤ (r · A · M )j+1 f¨ (j) Das ist f¨ ur j = 0, . . . , r−1 klar, denn dann ist f (x) ≤ M ≤ (r ·A·M )j+1 (die zweite Ungleichung gilt, weil wir A ≥ 1 und M ≥ 1 vorausgesetzt haben). F¨ ur die gr¨oßeren j beweisen wir (4.6) durch vollst¨ andige Induktion, der Beweis des Induktionsschritts f¨ ur j ≥ r beginnt damit, dass wir die vorausgesetzte Identit¨ at ugend oft, n¨ amlich j − r mal ableiten: f (r) = a0 f + a1 f + · · · + ar−1 f (r−1) gen¨ f (j) = a0 f (j−r) (x) + a1 f (j−r+1) + · · · + ar−1 f (j−1) . f¨ ur x ∈ I wie folgt absch¨ atzen: a0 f (j−r) (x) + a1 f (j−r+1) (x) + · · · + ar−1 f (j−1) (x) ≤ a0 f (j−r) (x) + a1 f (j−r+1) (x) + · · · + ar−1 f (j−1) (x)
Wir k¨onnen dann (j) f (x) =
≤ ≤
A(rAM )j−r+1 + A(rAM )j−r+2 + · · · + A(rAM )j A(rAM )j + A(rAM )j + · · · + A(rAM )j
= ≤
rA(rAM )j (rAM )(rAM )j
=
(rAM )j+1 .
Wegen (4.6) l¨asst sich das Restglied durch (n+1) f (ξ) n+1 (x − x0 ) |Rn (x)| = (n + 1)! n+1 δ ≤ (rAM )n+2 · (n + 1)! (rAM δ)n+1 = (rAM ) · (n + 1)! absch¨atzen, und aus (rAM δ)n+1 /(n + 1)! → 0 folgt die Behauptung.
Bemerkung: Der Satz garantiert zum Beispiel, dass die sp¨ ater zu besprechenden Funktionen sin x, cos x und ex entwickelbar sind.
4.5. SPEZIELLE FUNKTIONEN
4.5
293
Spezielle Funktionen
Bisher kennen wir erst wenige konkrete Funktionen (Polynome, Wurzelfunktionen, . . . ), in diesem Abschnitt wird es darum gehen, weitere wichtige Klassen zu behandeln. Der Aufbau ist wie folgt: • Zun¨ achst gibt es eine Motivation: Es wird gezeigt, wie ein einfaches Wachstumsmodell und die mathematische Modellierung eines schwingenden Massenpunktes zu der Notwendigkeit f¨ uhren, Funktionen zu finden, f¨ ur die ganz bestimmte Beziehungen zwischen der Funktion und den Ableitungen erf¨ ullt sind. • Das erste der beiden Probleme wird durch die Exponentialfunktion gel¨ ost, wir zeigen Existenz und Eindeutigkeit. Mit schon bekannten S¨ atzen ist es dann leicht, Aussagen u ¨ ber die inverse Funktion, die Logarithmusfunktion, zu erhalten. • Wir werden dann mit Hilfe der Exponentialfunktion Potenzen zu beliebigen Exponenten definieren. Bis jetzt wissen wir zwar, was 37 und 31/5 ist, aber √ 2 nicht, was z.B. 3 bedeutet. Das wird in diesem Unterabschnitt erkl¨ art werden. • Dann wird es um die trigonometrischen Funktionen gehen, die sich bei der L¨ osung des Schwingungsproblems ergeben. Existenz und Eindeutigkeit sind leicht zu beweisen. F¨ ur eine detaillierte Diskussion ist es jedoch erforderlich, sich erst einmal um die Kreiszahl π zu k¨ ummern, die hier allerdings nicht geometrisch, sondern u at von Sinus und ¨ ber die Periodizit¨ Cosinus eingef¨ uhrt wird. • Da die Exponentialfunktion, Sinus und Cosinus eine Potenzreihenentwicklung haben, kann man sie auch als Funktionen von C nach C auffassen. Das f¨ uhrt uns erstens zu einer neuen, manchmal sehr n¨ utzlichen Darstellung von komplexen Zahlen (Polardarstellung) und zweitens zu einer bemerkenswerten, fast schon mysteri¨osen Formel: 0 = 1 + eπi .
Motivation Zur Motivation des weiteren Vorgehens betrachten wir zwei Probleme aus den Anwendungen. 1. P (t) beschreibe f¨ ur t ≥ 0 die Anzahl der Mitglieder einer Population zur Zeit t: Anzahl der Menschen in Europa, Anzahl der Makrelen im Mittelmeer, Anzahl der Bakterien in einer N¨ahrl¨osung, . . . Dann ist P eine Funktion, die eigentlich von einem Intervall nach N geht und jedesmal springt, wenn sich die Anzahl ver¨andert. Wir gl¨atten sie aber ein bisschen, um zu einer differenzierbaren Funktion mit Werten in R zu kommen.
294
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) Wir wollen eine plausible Eigenschaft von P herleiten, dazu betrachten wir die Werte von P bei zwei Zeitpunkten t und t + h mit kleinem“ positiven ” h. Dann ist P (t + h) − P (t) die Ver¨ anderung der Bev¨ olkerung zwischen den Zeitpunkten t und t + h. Es ist nahe liegend anzunehmen, dass diese Ver¨anderung proportional zu zwei Einflussgr¨ oßen ist, n¨ amlich erstens zu h (viel Zeit verstrichen ⇒ viele Nachkommen) und zweitens zu P (t) (viele vermehrungswillige und -f¨ ahige Bev¨ olkerungsmitglieder bedeuten viel Nachwuchs). Anders ausgedr¨ uckt: In guter N¨ aherung sollte, wenigstens f¨ ur kleine h, P (t + h) − P (t) = c · h · P (t) sein, wobei die Konstante c so etwas wie die Netto-Fruchtbarkeitsrate pro ¨ Zeiteinheit ist. (Ubersteigt die Anzahl der Geburten die Anzahl der Sterbef¨alle, sollte c positiv sein, negative c werden bei Situationen auftreten, wo es umgekehrt ist.) Wenn man diese Gleichung durch h teilt und zum Grenzwert h → 0 u ¨ bergeht, erh¨alt man folgende analytische Bedingung f¨ ur P : P (t) = c · P (t), wobei die Konstante c und die Zahl P (0) (die Anzahl der Individuen bei Beginn der Messung) als bekannt vorausgesetzt werden d¨ urfen. Im allereinfachsten Fall, wenn c = P (0) = 1 gilt, ergibt sich das folgende Problem: Man bestimme eine differenzierbare Funktion f : R → R mit f = f und f (0) = 1. Bisher kennen wir keine derartige Funktion, gibt es u ¨ berhaupt eine? Eine positive Antwort wird gleich gegeben werden. Gibt es halbe Bakterien? Manchen wird die Herleitung der vorstehenden Differentialgleichung etwas unseri¨ os vorkommen, da wir eine N -wertige Funktion recht gewaltsam in eine differenzierbare Funktion verwandelt haben. Das Vorgehen ist aber typisch: In fast allen F¨allen, in denen man die Wirklichkeit beschreibt, muss man die tats¨achliche Situation idealisieren und vereinfachen, um Mathematik anwenden zu k¨ onnen. Die Rechtfertigung besteht im Erfolg: Mit dem so hergeleiteten Bev¨olkerungsmodell kann man Prognosen berechnen, die mit den dann sp¨ater gez¨ ahlten Menschen-, Makrelenund Bakterienanzahlen recht gut u ¨bereinstimmen.
2. x(t) beschreibe die Auslenkung eines Massenpunktes aus der Ruhelage zur Zeit t. (Diese Notation ist in der Physik u ur Mathematiker ist sie ¨ blich, f¨ etwas gew¨ohnungsbed¨ urftig.)
4.5. SPEZIELLE FUNKTIONEN
295
Ruhelage ⎫ ⎪ ⎬ ⎪ ⎭
x(t)
Bild 4.15: Masse an einer Feder Es wird angenommen, dass die r¨ ucktreibende Kraft proportional zur Auslenkung ist (man denke etwa an eine Feder). Aufgrund des Newtonschen Gesetzes (Kraft = Masse mal Beschleunigung) f¨ uhrt das auf m · x (t) = −γ · x(t), wo m die Masse ist und γ eine Konstante (die Federkonstante) bezeichnet. Nimmt man an, dass x(0) und x (0) bekannt sind, so f¨ uhrt die physikalische Situation auf das folgende mathematische Problem: Man bestimme t → x(t) so, dass m · x (t) = −γ · x, x(0) = x0 , x (0) = x1 . Dabei sind x0 und x1 vorgegebene Gr¨oßen, sie entsprechen der Auslenkung und der Geschwindigkeit bei Beginn der Messung. Sinnvollerweise wird man sich zun¨achst mit einfachen Spezialf¨ allen auseinander setzen, und das f¨ uhrt uns zum zweiten Problem: Man bestimme Funktionen s, c : R → R , die zweimal differenzierbar sind und f¨ ur die gilt: s + s = 0, s(0) = 0, s (0) = 1, c + c = 0, c(0) = 1, c (0) = 0. Die Funktion s wird dann gebraucht werden, wenn sich der Massenpunkt zur Zeit t = 0 in der Ruhelage befindet und sich mit Geschwindigkeit 1 in positiver Richtung bewegt, c tritt auf, wenn er bei t = 0 ausgelenkt ist und zu diesem Zeitpunkt ruht. Wir werden diese Probleme nun in Angriff nehmen und als L¨ osungen die Exponentialfunktion bzw. Sinus und Cosinus erhalten. Damit ist die Bedeutung dieser Funktionen klar: Sie treten als L¨osung besonders einfacher und typischer Differentialgleichungsprobleme auf, n¨amlich als L¨osung einer Wachstumsgleichung und einer Schwingungsgleichung.
296
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Exponentialfunktion und Logarithmus Hier behandeln wir das Wachstumsproblem: Gibt es eine differenzierbare Funktion f : R → R mit f = f und f (0) = 1? Satz 4.5.1. Es gibt genau eine Funktion f mit den geforderten Eigenschaften. Sie ist beliebig oft differenzierbar und bei 0 in eine Potenzreihe mit unendlichem Konvergenzradius entwickelbar. Es gilt f (x) =
∞ x2 x3 xn =1+x+ + + ··· . n! 2! 3! n=0
Beweis: Zum Nachweis der Existenz definieren wir einfach f0 (x) := 1 + x +
x2 + ··· . 2!
Das ist eine Potenzreihe mit unendlichem Konvergenzradius (vgl. Seite 283). Sie ist wegen Satz 4.4.8 beliebig oft differenzierbar, und dass f0 = f0 gilt, l¨ asst sich durch gliedweises Differenzieren sofort nachweisen35) . Um zu zeigen, dass die gesuchte Funktion eindeutig bestimmt ist, gehen wir von einem f : R → R mit f = f und f (0) = 1 aus. Diese Bedingungen implizieren, dass f sogar beliebig oft differenzierbar ist und dass alle f (n) (0) gleich 1 sind. Wegen Satz 4.4.11 ist f in eine Potenzreihe mit unendlichem Konvergenzradius entwickelbar, und da der n-te Koeffizient der Taylorentwicklung um Null gleich f (n) (0) 1 = n! n! osung des Problems. ist, stimmt f mit f0 u ¨ berein. f0 ist also die einzige L¨ Der Satz f¨ uhrt zu exp(x)
Definition 4.5.2. Die wegen Satz 4.5.1 eindeutig bestimmte Funktion f mit f = f und f (0) = 1 wird mit exp (Exponentialfunktion) bezeichnet. Wir stellen nun die wichtigsten Eigenschaften der Funktion exp zusammen. ¨ Uberraschenderweise ist es viel erfolgreicher, direkt mit den Eigenschaften exp = exp exp(0) = 1
(4.7)
zu arbeiten, als die konkrete Darstellung als Potenzreihe auszunutzen. Beim Beweisen werden wir h¨aufig von Korollar 4.2.3 Gebrauch machen: Ist g : R → R ur alle x. differenzierbar mit g = 0, so ist g(x) = g(0) f¨ Exponentialfunktion
Satz 4.5.3. F¨ ur die Exponentialfunktion exp : R → R gilt: (i) exp(x) exp(−x) = 1 f¨ ur alle x. 35) Diese
Rechnung wurde auf Seite 287 auch schon durchgef¨ uhrt.
4.5. SPEZIELLE FUNKTIONEN
297
(ii) exp(x) = 0 f¨ ur alle x. (iii) exp(x) > 0 f¨ ur alle x. (iv) exp(x + y) = exp(x) · exp(y) f¨ ur alle x, y. (v) exp ist streng monoton steigend (und folglich injektiv), und f¨ ur jedes y > 0 gibt es ein x ∈ R mit exp(x) = y (d.h., exp ist eine surjektive Abbildung von R nach ] 0, +∞ [ ). Damit ist exp : R → ] 0, +∞ [ eine bijektive Abbildung 36) . Beweis: (i) Wir definieren g(x) := exp(x) exp(−x). g ist offensichtlich differenzierbar, mit Produkt- und Kettenregel folgt leicht, dass g = 0 gilt. Folglich ist g(x) = g(0) = 1 f¨ ur alle x (vgl. Korollar 4.2.3(i)). (ii) Das folgt aus (i). (iii) G¨ abe es ein x0 mit exp(x0 ) < 0, so m¨ usste es wegen exp(0) = 1 > 0 nach dem Zwischenwertsatz (Satz 3.3.6) auch ein x mit exp(x) = 0 geben. Das aber widerspr¨ ache (ii). (iv) Sei y ∈ R fest gew¨ahlt. Man betrachte die Funktion g : x →
exp(x + y) . exp(y)
g ist differenzierbar mit g = g, außerdem ist g(0) = 1. Nach Satz 4.5.1 muss dann g(x) = exp(x) f¨ ur alle x sein. (v) exp = exp ist strikt positiv, damit folgt aus Korollar 4.2.3 der erste Teil der Behauptung. Sei nun y ∈ ] 0, +∞ [. Wir setzen e := exp(1) und w¨ ahlen n so groß, dass e−n ≤ y ≤ en . Um einzusehen, dass das geht, zeigen wir als Erstes , dass e gr¨ oßer als 1 ist: Nach dem Mittelwertsatz k¨ onnen wir ein ξ mit e−1=
exp(1) − exp(0) = exp (ξ) > 0 1−0
w¨ ahlen, und das impliziert schon e > 1. Nun beachten wir, dass f¨ ur alle n die Formel exp(±n) = e±n gilt, das folgt aus (i) und (iv) durch vollst¨ andige Induktion. Kombiniert man diese Ergebnisse, so folgt exp(n) = en → +∞ sowie exp(−n) = e−n → 0. Egal, wie groß oder klein das y also ist, die Bedingung e−n ≤ y ≤ en ist f¨ ur große n immer zu erf¨ ullen. 36) Fasst man R , versehen mit der Addition, und ] 0, +∞ [, versehen mit der Multiplikation, als kommutative Gruppen auf, so bedeutet das wegen (iv) gerade: exp ist ein bijektiver Gruppenhomomorphismus zwischen diesen Gruppen, also ein Gruppenisomorphismus. Insbesondere folgt, dass diese beiden Gruppen im Rahmen der Gruppentheorie nicht unterscheidbar sind.
298
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Nun wenden wir noch den Zwischenwertsatz f¨ ur die Einschr¨ ankung der Funktion exp auf das Intervall [ −n, n ] an. Dieser Satz verschafft uns ein x mit exp(x) = y, und damit ist die Surjektivit¨at gezeigt. Da exp : R → ] 0, ∞ [ bijektiv ist, besitzt exp eine Umkehrabbildung. Definition 4.5.4. Die Umkehrabbildung zu exp bezeichnen wir mit log : ] 0, +∞ [ → R log x Logarithmus
(Logarithmus). Nach Definition ist also – f¨ ur y > 0 – die Zahl log y das eindeutig bestimmte x, f¨ ur das exp(x) = y gilt 37) . Korollar 4.5.5. F¨ ur die Logarithmusfunktion log gilt: (i) log(a · b) = log(a) + log(b) f¨ ur alle a, b > 0. (ii) log ist differenzierbar, und es gilt log (x) = 1/x f¨ ur alle x > 0. Beweis: (i) Positive a und b seien vorgegeben. Wir w¨ ahlen reelle x, y mit exp(x) = a und exp(y) = b, es ist also log a = x und log b = y. Wir erhalten exp(x + y) = exp(x) exp(y) = ab, die Zahl log(ab) muss also mit x + y u ¨bereinstimmen. (ii) Aus Satz 4.1.4(vi) folgt, dass log differenzierbar ist. Durch Differentiation der Gleichung x = exp(log x) ergibt sich 1 = exp(log x) · (log x) = x · (log x) und folglich (log x) = 1/x.
Bemerkungen: 1. Aufgrund der bisherigen Ergebnisse lassen sich exp und log bereits gut skizzieren. R 3 exp 2 1 −3
−2
−1
R 1
2
Bild 4.16: Die Exponentialfunktion 37) So
ist zum Beispiel log 1 = 0, log(1/e) = −1, log(e12 ) = 12.
3
4.5. SPEZIELLE FUNKTIONEN
299
R log
2 1
R 1
2
3
4
5
6
−1 −2 −3 Bild 4.17: Die Logarithmusfunktion Man beachte, dass f¨ ur x > 0 stets (log x) = 1/x > 0 ist, und deswegen ist log eine streng monoton steigende Funktion. Weiter folgt, dass log beliebig oft differenzierbar ist. 2. Mit den bisher bewiesenen Ergebnissen kann man schon das Geheimnis der Logarithmenrechnung verstehen. Die war f¨ ur vorige Generationen ein fast unerl¨ assliches Hilfsmittel beim Rechnen. Heute, wo sich jeder einen Computer leisten kann, ist die Bedeutung stark zur¨ uckgegangen. Die Wichtigkeit beruht auf der Tatsache, dass Addieren leichter als Multiplizieren ist und man deswegen einen Vorteil hat, wenn man ein multiplikatives Problem in ein additives u ¨ bersetzen kann. Stellen Sie sich zum Beispiel vor, Sie sollten das Produkt y = 3.01 · 4.12 berechnen. Leider haben Sie von Multiplikation u ¨ berhaupt keine Ahnung, Sie k¨onnen aber trotzdem mit Hilfe der Logarithmenrechnung zum Ziel kommen. y kennen Sie zwar nicht, Sie wissen aber, dass log y = log(3.01 · 4.12) = log 3.01 + log 4.12 gilt. Die Zahlen log 3.01 = 1.101940 . . . und log 4.12 = 1.415853 . . . entnehmen Sie einer Logarithmentafel, nun kennen Sie schon log y = 1.101940 . . . + 1.415853 . . . = 2.517793 . . . Ein weiterer Blick in die Logarithmentafel – sie muss jetzt von rechts nach links gelesen werden – verschafft Ihnen den Wert von y, er ist gleich exp(log y) = exp(2.517793 . . .) = 12.401197 . . . Das ist zwar nicht ganz exakt (der genaue Wert ist 12.4012), aber der Fehler ist so winzig, dass es niemand merken wird.
300
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) Mal angenommen, irgendwo im fernen Weltall g¨ abe es eine Spezies, die sehr gut im Multiplizieren ist, aber gewaltige Schwierigkeiten beim Addieren hat. Die k¨ onnen sich mit einem ¨ ahnlichen Trick helfen, sie brauchen statt einer Logarithmentafel eine Exponentialtafel . Will da jemand s = 5 + 9 ausrechnen, so muss die Identit¨ at exp(s) = exp(5) exp(9) ausgenutzt werden: exp(s)
=
(148.41 . . .) · (8103.08 . . .)
=
1202578.1 . . .
Vom Endergebnis muss nun nur noch der Logarithmus nachgeschlagen werden: 13.9999 . . . Das ist doch gar nicht so schlecht!
Die allgemeine Potenz Zun¨achst wollen wir zusammenfassen, was wir u ¨ ber das Potenzieren schon wissen: a) F¨ ur beliebige a ∈ K und beliebige n ∈ N wurde an als das n-fache Produkt von a mit sich selber erkl¨art. Das ist nat¨ urlich ein Fall f¨ ur eine Definition durch vollst¨andige Induktion, wenn man es pr¨ azise machen m¨ ochte. b) Dann beweist man ohne große M¨ uhe – durch P¨ unktchenbeweise oder durch Induktion – dass die aus der Schule vertrauten Rechenregeln gelten: an+m (an )m
= =
an am anm
(ab)n
=
an b n
f¨ ur alle a, b > 0 und alle n, m ∈ N . c) Ab hier soll a von Null verschieden sein, wir wollen auch 1/an als Potenz schreiben. Man definiert 1 a−n := n a f¨ ur n ∈ N , so ist zum Beispiel 10−3 = 1/1000. Damit ist am f¨ ur alle ganzen Zahlen m = 0 definiert. Und bemerkenswerterweise hat man dann wieder die gleichen Rechenregeln wie vorher. Wenn man die beweisen m¨ ochte, st¨ oßt man allerdings auf die Schwierigkeit, dass man mit Ausdr¨ ucken der Form a0 noch nichts anfangen kann, dass man aber zu den u ¨ blichen Regeln kommt, wenn man a0 := 1 setzt. Achtung: Dass a0 = 1 ist, kann niemand beweisen. Es ist eine Definition, die deswegen sinnvoll ist, weil dann die gewohnten PotenzRechengesetze f¨ ur beliebige ganzzahlige Exponenten richtig sind. (Hier ein Gest¨ andnis des Autors: W¨ ahrend der Schulzeit bewies“ er a0 = 1 so: ” Die Zahl a0 ist, bei beliebigem a = 0, doch als a1−1 schreibbar, und das stimmt nach 1 −1 den Potenzgesetzen mit a · a , also mit a · (1/a) = 1 u ¨ berein. Das ist leider eine recht
4.5. SPEZIELLE FUNKTIONEN
301
fragw¨ urdige Argumentation, umgekehrt ist es richtig: Nur wenn man a0 := 1 setzt, gilt das Gesetz an+m = an am auch im Fall m = −n.)
c) Sp¨ater haben wir f¨ ur die n-te Wurzel aus a auch a1/n geschrieben (dabei sollte a eine positive Zahl sein), und etwas allgemeiner kann man f¨ ur n ∈ N und m ∈ Z die Zahl am/n als (a1/n )m festsetzen38) . Damit ist wirklich ar f¨ ur beliebige rationale r erkl¨art, und immer noch gelten alle Potenz-Rechengesetze. Das ist der Grund, warum es sinnvoll ist, f¨ ur die n-te Wurzel a1/n zu schreiben. √
d) Und mehr k¨ onnen wir zurzeit noch nicht, z.B. ist a 2 noch nicht definiert. x Man k¨ onnte a f¨ ur beliebige reelle x durch ein Stetigkeitsargument festsetzen: Sei (xn ) eine Folge rationaler Zahlen, die gegen x konvergiert. Man setzt dann ax := lim axn . Das geht wirklich, allerdings m¨ usste man recht m¨ uhsam nachweisen, dass die Folge (axn ) wirklich konvergent ist und dass ax dadurch wohldefiniert ist: Wenn sich zwei Mathematiker verschiedene Folgen (xn ) und (yn ) rationaler Zahlen mit lim xn = lim yn = x aussuchen, so sollte doch lim axn = lim ayn gelten. Ist diese Schwierigkeit u ¨ berwunden, muss man noch eine Menge Arbeit investieren, um die Stetigkeit und die Differenzierbarkeit der Funktion x → ax zu beweisen. Diesen schwerf¨ alligen Weg k¨onnen wir durch den nachstehend beschriebenen Zugang vermeiden. Definition 4.5.6. Es sei x ∈ R und a > 0. Wir setzen ax := exp(x · log a). Es stellt sich sofort die Frage, ob man das so machen darf. Nach der vorstehenden Definition gibt es n¨amlich zwei M¨oglichkeiten, den Ausdruck ar im Fall √ m n a und rationaler Zahlen r = m/n zu interpretieren, n¨amlich erstens als zweitens als exp(r log a). Wenn das nicht die gleiche Zahl ergibt, weiß keiner, was mit ar eigentlich gemeint ist. Nach dem n¨ achsten Satz kann aber eine Entwarnung gegeben werden, denn die neue Definition ist mit der alten vertr¨aglich39): Satz 4.5.7. Es sei a > 0, n ∈ N und m ∈ Z. Dann gilt m √ m exp log a = n a . n Anders ausgedr¨ uckt: Beide Definitionsm¨oglichkeiten f¨ ur am/n f¨ uhren zum gleichen Ergebnis. 38) Wer es hier ganz genau nimmt, sollte sich die Wohldefiniertheit uberlegen: Warum ist, ¨ z.B., a3/4 = a30/40 ? Das folgt nat¨ urlich aus den Gesetzen f¨ ur das Wurzelziehen und das Rechnen mit ganzzahligen Potenzen. 39) Dieses Problem begegnet einem ubrigens ofter. Immer, wenn eine Definition auf einen ¨ ¨ neuen Bereich erweitert wird, ist zu begr¨ unden, dass der neue Ansatz im Spezialfall zum schon bekannten Ergebnis f¨ uhrt. So war es zum Beispiel bei der Definition von an → 0“. Das ” bedeutete ja zun¨ achst auch zweierlei, n¨ amlich einerseits (an ) ist Nullfolge“ und andererseits ” allen so schnell wie hier zu sehen, dass man (an − 0) ist Nullfolge“. Leider ist nicht in allen F¨ ” nichts falsch gemacht hat.
ax
302
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Beweis: Sei zun¨achst m eine nat¨ urliche Zahl. Dann ist am (gem¨aß 4.5.6)
= =
exp(m · log a) exp(log a + log a + · · · + log a) m-mal
4.5.3(iv)
=
(exp log a)(exp log a) · · · (exp log a)
=
a · a · · · a.
Kurz: F¨ ur am ist es egal, ob wir naiv a m-mal mit sich selbst multiplizieren oder die Potenz mit Definition 4.5.6 ausrechnen. Wegen exp(0) = 1 und exp(−x) = 1/ exp(x) erhalten wir das gleiche Ergebnis auch f¨ ur beliebige m ∈ Z. Nun zu Wurzeln. F¨ ur beliebiges reelles x und n ∈ N ist n n (a1/n ) (gem¨aß 4.5.6) = exp((1/n) log a) 4.5.3(iv)
= =
exp(n · (1/n) log a) exp log a
=
a,
und deswegen muss a1/n auch nach der neuen Definition gleich
√ n a sein.
Zusammen erhalten wir: am/n gem¨ aß Definition 4.5.6 ist gleich m m 1 exp log a = exp( log a) n n m n = exp(log a) √ m n = a .
Vor dem n¨achsten Satz gibt es noch eine kleine Erg¨anzung zur Logarithmusdefinition. Manchmal wird der hier eingef¨ uhrte Logarithmus der Logarithmus naturalis genannt (und mit ln x bezeichnet), um ihn von anderen Logarithmen zu unterscheiden. Man kann n¨ amlich das, was wir hier f¨ ur die Funktion ex gemacht haben, genauso gut f¨ ur alle Funktionen ax wiederholen, falls a eine positive und von 1 verschiedene Zahl ist. Dann ist n¨ amlich x → ax wieder eine bijektive Abbildung von R nach ] 0, +∞ [, die Umkehrabbildung wird Logarithmusfunktion zur Basis a genannt. F¨ ur den Wert dieser Funktion an einer Stelle y > 0 schreibt man loga y, diese Zahl ist also nach Definition das eindeutig bestimmte x ∈ R mit ax = y. Hier einige Beispiele: log1001 1001 = 1, log10 1/100000 = −5, log0.5 4 = −2, log0.3332 1 = 0. Wegen ax = ex log a gilt (loga y)(log a) = log y, es ist also loga y = log y/ log a. Deswegen muss man auch keine neuen S¨ atze beweisen. Alles, was wir f¨ ur den Spezialfall a = e gezeigt haben, l¨asst sich leicht u ¨ bertragen.
4.5. SPEZIELLE FUNKTIONEN
303
Andere Basen als a = e spielen praktisch keine Rolle, wenn man von den zwei F¨ allen a = 10 und a = 2 vielleicht einmal absieht. Logarithmen zur Basis 10 (auch: dekadische Logarithmen) werden manchmal in der Schule betrachtet, und die Bedeutung der Basis 2 folgt daraus, dass Computer im Dualsystem rechnen. Aus den schon bewiesenen Eigenschaften von exp und log ergeben sich sofort die bekannten Rechenregeln f¨ ur die allgemeine Potenz: Korollar 4.5.8. F¨ ur a, b > 0 und x, y ∈ R gilt: (i) ax+y = ax · ay . (ii) (ab)x = ax · bx . (iii) Die Funktion x → ax ist differenzierbar, und es gilt (ax ) = log a · ax . (iv) Sei c ∈ R . Dann ist die Funktion x → xc differenzierbar, und es gilt (xc ) = c · xc−1 . (v) F¨ ur positives a, a = 1, ist loga x differenzierbar. Es gilt (loga x) =
1 . x log a
Beweis: (i) Es ist 4.5.3(iv) ax+y = exp (x + y) · log a = exp(x log a) · exp(y log a) = ax · ay . (ii) Es gilt (ab)x
= exp x · log(ab) = exp x(log a + log b) = exp(x log a) · exp(x log b) = ax · b x .
(iii) Es ist ax = exp(x log a) nach Definition. Differentiation liefert (ax ) = exp(x log a) = log a · exp(x log a) = log a · ax . (iv) Nach Definition gilt xc = exp(c · log x), man erh¨alt (xc ) = exp(c · log x) · c ·
xc 1 (i) = · c = c · xc−1 . x x
(v) Das folgt durch Differenzieren aus loga x = log x/ log a.
Auf einen wichtigen Spezialfall ist besonders hinzuweisen. Wir hatten schon e := exp(1) definiert, es ist also ex = exp(x log e) = exp(x)
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
304
f¨ ur alle x. Die Zahl e spielt eine wichtige Rolle in der Mathematik, wegen Satz 4.5.1 ist ∞ 1 1 1 e= = 1 + 1 + + + ··· . n! 2 3! n=0 e
Die ersten Ziffern der Dezimalbruchentwicklung lauten e ≈ 2.7182818 . . . Man kann zeigen, dass e eine transzendente Zahl ist, d.h. e ist nicht Nullstelle eines Polynoms mit ganzzahligen Koeffizienten40) . Wir zeigen hier nur die schw¨achere Aussage Satz 4.5.9. e ist irrational. Beweis: Angenommen, es w¨are e ∈ Q , also e = m/n mit m ∈ Z, n ∈ N . Ohne Einschr¨ankung darf angenommen werden, dass n > 2 ist (das l¨ asst sich durch Erweitern von m/n leicht erreichen). Nach Satz 4.3.2 (Restgliedformel, abe es dann ein ξ ∈ ] 0, 1 [ mit angewandt auf exp mit x0 = 0 und x = 1) g¨ m n
=
e
=
exp(1) n exp(k) (0) k exp(n+1) (ξ) n+1 1 + 1 k! (n + 1)!
= =
k=0 n k=0
exp(ξ) 1 + , k! (n + 1)!
durch Multiplikation mit n! w¨ urde dann n! exp(ξ) m · n! = + n k! n+1 n
k=0
und daraus
n! exp(ξ) = m · (n − 1)! − n+1 k! n
k=0
folgen. Damit m¨ usste exp(ξ)/(n + 1) eine ganze Zahl sein, denn auf der rechten Seite treten nur Summen und Differenzen nat¨ urlicher Zahlen auf. Das ist aber wegen 0 < exp ξ ≤ exp 1 < 3 und n + 1 ≥ 3 nicht m¨oglich, denn zwischen 0 und 1 gibt es keine ganze Zahl. Also ist e ∈ Q .
40) Dieser
Beweis soll in Abschnitt 7.5 in Band 2 gef¨ uhrt werden.
4.5. SPEZIELLE FUNKTIONEN
305
Sinus und Cosinus Und er machte das Meer, ..., zehn Ellen weit rundherum, und eine ” Schnur von dreißig Ellen war das Maß ringsherum.“ (1. K¨ onige, Vers 7.23)
In der Schule haben Sie gelernt: Der Sinus eines Winkels ist das Verh¨ altnis ” von Gegenkathete zu Hypotenuse“, viel sp¨ater wurde der Sinus als Funktion eingef¨ uhrt. In der Analysis geht man umgekehrt vor, man beginnt mit der Funktion, und erst einige Abschnitte sp¨ater wird nach und nach klar, dass der Funktionszugang gleichwertig zum geometrischen Weg ist. Der Grund liegt darin, dass man die geometrischen Konzepte in der Analysis nicht zur Verf¨ ugung hat, was soll z.B. ein Winkel sein, warum h¨angt das fragliche Verh¨ altnis nicht von der Gr¨ oße der betrachteten Dreiecke ab? In diesem Unterabschnitt werden wir Sinus und Cosinus u ¨ ber das Differentialgleichungsproblem einf¨ uhren, das sich aus der Modellierung von Schwingungen ergeben hat: Man bestimme zweimal differenzierbare Funktionen s, c : R → R mit s + s = 0, s(0) = 0, s (0) = 1, und c + c = 0, c(0) = 1, c (0) = 0. Satz 4.5.10. Es gibt genau eine Funktion s und genau eine Funktion c, die das Problem l¨osen. Beide Funktionen sind bei 0 in eine Potenzreihe mit unendlichem Konvergenzradius entwickelbar, und f¨ ur alle x ∈ R ist s(x) c(x)
= =
∞
(−1)n
n=0 ∞
(−1)n
n=0
x2n+1 (2n + 1)!
=
x−
x3 x5 + − +··· , 3! 5!
x2n (2n)!
=
1−
x2 x4 + − +··· . 2! 4!
Beweis: Zur Existenz: Definiert man s und c durch die im Satz angegebenen Potenzreihen, so sind diese Funktionen offensichtlich L¨ osungen des Problems: Man muss nur x = 0 einsetzen bzw. zweimal gliedweise ableiten. Außerdem ist der Konvergenzradius nach dem Quotientenkriterium gleich unendlich. Zur Eindeutigkeit: Um die Eindeutigkeit von s zu zeigen, m¨ ussen wir von einer zweimal differenzierbaren Funktion f mit f = −f , f (0) = 0 und f (0) = 1 ausgehen und zeigen, dass f = s gilt. Aus diesen Voraussetzungen folgt sofort, dass f beliebig oft differenzierbar ist, zum Beispiel ist f = −f . Außerdem k¨onnen wir die Werte aller Ableitungen bei Null berechnen: 0, 1, 0, −1, 0, 1, . . .: Es ist zum Beispiel f (0) = −1, weil f = −f ist und f (0) = 1 gilt. Wieder wird Satz 4.4.11 wichtig, danach hat f eine u ¨ berall konvergente Taylorentwicklung. Und da wir die f (n) (0) kennen, kann man f rekonstruieren: Es
306
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
muss f (x) =
∞ f (n) (0) n x5 x3 x =x− + ± ··· n! 3! 5! n=0
sein, d.h. f muss mit s u ¨ bereinstimmen. Der Beweis f¨ ur die Eindeutigkeit der Funktion c verl¨ auft analog.
Aufgrund der Bemerkungen zu Beginn dieses Unterabschnitts kommt die folgende Definition nicht u ur die ¨berraschend. Die Bezeichnungen s“ und c“ f¨ ” ” hier wichtigen Funktionen waren nicht ohne Hintergedanken gew¨ ahlt: sin, cos
Definition 4.5.11. Die eindeutig bestimmten L¨osungen s und c des Problems der Schwingungs-Differentialgleichung bezeichnen wir mit sin (Sinus) und cos (Cosinus). In Analogie zum Vorgehen bei der Exponentialfunktion werden wir nun nach und nach f¨ ur sin und cos die wichtigsten Eigenschaften nachweisen. Wieder wird die Potenzreihenentwicklung nur eine untergeordnete Rolle spielen, die meisten Beweise gelingen leichter unter Verwendung der zugeh¨ origen Differentialgleichungen. Satz 4.5.12. F¨ ur alle x, y ∈ R gilt: (i) sin x = cos x, cos x = − sin x. (ii) sin2 x + cos2 x = 1. (iii) sin(−x) = − sin x, cos(−x) = cos x. (iv) sin(x + y) = sin x cos y + cos x sin y, cos(x + y) = cos x cos y − sin x sin y. Beweis: (i) Diese Aussage ergibt sich durch gliedweises Ableiten der Potenzreihen f¨ ur Sinus und Cosinus aus Satz 4.5.10. Eleganter ist die folgende Beweisvariante: Definiert man Funktionen s˜ und c˜ durch c˜ := sin und s˜ := − cos , so sind diese Funktionen L¨osung des Differentialgleichungsproblems: s˜ = −˜ s usw. Wegen der Eindeutigkeit der L¨osung (Satz 4.5.10) folgt daraus die Behauptung. (ii) Wir betrachten die Funktion ϕ(x) := sin2 x + cos2 x. Diese Funktion ist bei 0 gleich 1, und f¨ ur die Ableitung gilt aufgrund der Produktregel: ϕ (x)
=
2 · (sin x) · (sin x) + 2 · (cos x) · (cos x)
= =
2 · (sin x) · (cos x) + 2 · (cos x) · (− sin x) 0.
Damit ist ϕ nach Korollar 4.2.3(i) gleich der konstanten Funktion 1, und das beweist die Behauptung. (iii) Wieder haben wir die Wahl zwischen zwei Beweisen. Zum einen sieht man das Ergebnis direkt aus der Potenzreihendarstellung von Sinus und Cosinus, denn beim Sinus kommen nur ungerade, beim Cosinus nur gerade Potenzen vor.
4.5. SPEZIELLE FUNKTIONEN
307
Eleganter ist das folgende Argument: Die Funktionen s˜(x) := − sin(−x) und c˜(x) := cos(−x) l¨osen das Differentialgleichungsproblem, und nach dem Eindeutigkeitssatz muss s˜(x) = sin x und c˜(x) = cos x gelten. (iv) Wir fixieren ein y ∈ R und definieren zwei Funktion f und g durch f (x)
:=
sin x · cos(x + y) − cos x · sin(x + y),
g(x)
:=
cos x · cos(x + y) + sin x · sin(x + y).
Aus den schon bewiesenen Eigenschaften von sin und cos folgt dann sofort, dass f und g die Ableitung 0 haben und folglich mit ihrem Wert bei 0 u ¨ bereinstimmen m¨ ussen. Das bedeutet, da f (0) = − sin y und g(0) = cos y ist, dass sin x · cos(x + y) − cos x · sin(x + y) =
− sin y,
cos x · cos(x + y) + sin x · sin(x + y) =
cos y
f¨ ur alle x gilt. L¨ ost man dieses Gleichungssystem nach sin(x + y), cos(x + y) auf (das ist m¨ oglich, da die Determinante gleich sin2 x + cos2 x = 1 ist), so erh¨ alt man die Behauptung. Um sin und cos besser kennen zu lernen, werden wir eine Zahl untersuchen, die f¨ ur diese Funktionen eine besondere Rolle spielt: Es geht um die Kreiszahl π. Sie wird hier allerdings nicht geometrisch, sondern durch eine Eigenschaft der Sinusfunktion eingef¨ uhrt. Dass wir wirklich die Zahl π aus der Schulmathematik erhalten, kann erst dann begr¨ undet werden, wenn wir Fl¨ achen und Bogenl¨ angen messen k¨ onnen. Bis dahin – also bis nach Behandlung des Themas Integration“ ” in Band 2 – m¨ ussen Sie das einfach glauben. Satz 4.5.13. Es gibt eine kleinste positive reelle Zahl γ0 mit sin γ0 = 1. Beweis: Es reicht zu zeigen, dass es u ¨berhaupt ein γ > 0 mit sin γ = 1 gibt. Dann n¨ amlich k¨ onnen wir γ0 := inf{γ > 0 | sin γ = 1} setzen, und aus Stetigkeitsgr¨ unden ist sin γ0 = 1. Etwas genauer: Sei ∆ die Menge der positiven γ mit sin γ = 1, wir setzen schon voraus, dass ∆ nicht leer ist. Also ist ∆ eine nach unten beschr¨ ankte nicht leere Teilmenge von R , wir k¨ onnen γ0 daher wirklich definieren. oßer als γ0 ist, F¨ ur n ∈ N betrachten wir die Zahl γ0 + n1 . Da sie gr¨ kann sie keine untere Schranke von ∆ sein, es muss also ein γn ∈ ∆ mit γn < γ0 + 1/n geben. γ0 ist aber eine untere Schranke, wir haben damit insgesamt die Ungleichungen 1 γ0 ≤ γn < γ 0 + . n
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
308
Wenn man γn f¨ ur alle n konstruiert hat, hat man eine Folge (γn ) in ∆ mit γn → γ0 erhalten, und nun kommt die Stetigkeit der Sinusfunktion ins Spiel: sin γ0 = sin lim γn = lim sin γn = lim 1 = 1. onnen wir Hier war nat¨ urlich auch wichtig, dass die γn in ∆ liegen. So k¨ schließen, dass sin γn = 1 gilt.
In einem ersten Schritt beweisen wir, dass es ein γ > 0 mit sin2 γ = 1 gibt. Wegen sin2 x + cos2 x = 1 ist das gleichbedeutend mit der Existenz eines γ > 0 mit cos γ = 0. Aufgrund des Zwischenwertsatzes g¨ abe es ein solches γ, wenn cos auf ] 0, +∞ [ irgendwo negativ wird (man beachte, dass cos 0 = 1 > 0). Nun ist aber 24 26 22 24 1 22 + − + −··· < 1 − + = − < 0. cos 2 = 1 − 2! 4! 6! 2! 4! 3 Hier wurde ausgenutzt, dass die Vorzeichen alternieren und die Betr¨ age vom zweiten Summanden an immer kleiner werden. Damit ist die Existenz eines γ ∈ ] 0, 2 [ mit sin2 γ = 1 bewiesen, f¨ ur dieses γ ist also sin γ = 1 oder sin γ = −1. Nun zum zweiten Schritt. Wir wissen schon, dass es ein γ mit sin γ ∈ {−1, 1} gibt. Falls sin γ gleich 1 ist, sind wir fertig, wir m¨ ussen noch den Fall sin γ = −1 behandeln. 1
R
γ 1
γ1
2
3
4
R 5
−1 Bild 4.18: Lage von γ und γ1 Wir w¨ahlen ein γ1 in [ 0, γ ], f¨ ur das sin γ1 maximal wird, also sin γ1 = max sin x. x∈[ 0,γ ]
Das geht wegen der Kompaktheit dieses Intervalls und der Stetigkeit der Sinusfunktion. Da sin 0 = cos 0 = 1 > 0 gilt, gibt es rechts von der Null x-Werte mit sin x > 0, und deswegen kann das fragliche γ1 nicht gleich 0 sein. Vielmehr muss es im Innern des Intervalls [ 0, γ ] liegen, und deswegen muss die Ableitung von sin an dieser Stelle verschwinden: cos γ1 = 0 (vgl. Satz 4.3.3). Ein Blick auf die Beziehung sin2 x + cos2 x = 1 f¨ uhrt zu sin γ1 = 1, denn sin γ1 ist eine positive Zahl mit Quadrat 1. Damit ist der Beweis vollst¨ andig gef¨ uhrt.
4.5. SPEZIELLE FUNKTIONEN
309
Definition 4.5.14. Es sei c0 die kleinste positive Zahl mit sin c0 = 1 (vgl. Bild 4.19). Wir definieren π := 2c0 . π hat ungef¨ahr den Wert 3.14 . . ., eine etwas genauere Approximation findet man am Beginn von Kapitel 2. π: Ein Kurzportr¨ at Die Zahl π wurde hier u uhrt. Es handelt ¨ber die Sinusfunktion eingef¨ sich nat¨ urlich um die gleiche Zahl, die jeder in der Schule im Zusammenhang mit der Kreisberechnung kennen gelernt hat: Umfang der Kreislinie = 2 mal π mal Radius, Fl¨ache des Kreises = π mal Radius zum Quadrat. Da die Konzepte L¨ange einer Kurve“ und ” Fl¨ ache“ hier noch nicht zur Verf¨ ugung stehen, kann das erst sp¨ ater ” in Band 2 diskutiert werden. Man sollte wissen: • N¨ aherungswerte f¨ ur π wurden schon vor mehreren Jahrtausen¨ den vorgeschlagen. Die Agypter rechneten mit π = 22/7, in der Bibel findet sich eine Stelle, aus der man auf π = 3 schließen kann. Im ersten Buch der K¨ onige, Vers 7.23, heißt es bei der Beschreibung des Weihwasserbeckens im Tempel Salomons n¨ amlich: Und er machte das Meer, ..., zehn Ellen weit ” rundherum, und eine Schnur von dreißig Ellen war das Maß ringsherum.“
• Heute ist π bis auf viele Milliarden (!) Stellen bekannt, f¨ ur so gut wie alle praktischen Anwendungen reichen allerdings die ersten acht Stellen nach dem Komma, wie sie in jedem Taschenrechner zur Verf¨ ugung stehen: π = 3.14159265.... • π ist Kult: Es gibt ein π-Parfum (von Givenchy), einen π-Film, π-Fanklubs, . . . . • Es ist immer noch ein offenes Problem, ob die Ziffern in der Dezimalbruchentwicklung von π wirklich so zuf¨ allig sind wie es aussieht. Haben sie alle Eigenschaften einer zuf¨ alligen Zahlenfolge? Hat der liebe Gott gew¨ urfelt, als er π erschuf? • F¨ ur alle, die sich f¨ ur weitere Einzelheiten interessieren, kann das Buch von J. Arndt und Ch. Haenel mit dem schlichten Titel π“ (Springer Verlag, 1998) empfohlen werden. ” • Im Internet ist der Besuch der Seite http://www.cecm.sfu.ca/pi/ f¨ ur alle π-Fans empfehlenswert.
π
310
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE) R 1
1
π 2
R
3π
2
Bild 4.19: Lage von π/2 Aus dem vorstehenden Existenzbeweis f¨ ur π ergeben sich wichtige Folgerungen f¨ ur die Struktur von sin und cos: Korollar 4.5.15. Es gilt cos(π/2) = 0 sowie cos π = −1 und sin π = 0. Außerdem ist f¨ ur alle x ∈ R : (i) sin(π + x) = − sin x, sin(2π + x) = sin x, (ii) cos(π + x) = − cos x, cos(2π + x) = cos x, (iii) sin(π/2 + x) = cos x, cos(π/2 + x) = − sin x. Bemerkung: sin und cos sind also 2π-periodische Funktionen und gehen durch Verschieben um π/2 auseinander hervor41): R
sin
1
cos
π 2
1
2
π 3
3π 2
4
R
2π 5
6
7
−1 Bild 4.20: Sinus- und Cosinusfunktion Beweis: Es ist sin2 (π/2) + cos2 (π/2) = 1, und aus sin(π/2) = 1 folgt die erste Behauptung. Nun wenden wir die Additionstheoreme (Satz 4.5.12(iv)) an: π π π π + sin π = sin = 2 sin cos = 2 · 1 · 0 = 0, 2 2 2 2 π π π π cos π = cos + = cos2 − sin2 = −1. 2 2 2 2 41) Das sollte man sich allgemein klar gemacht haben: Ist f : R → R eine Funktion und a eine positive Zahl, so hat die Funktion x → f (x + a) im Wesentlichen den gleichen Graphen wie f . Man muss den Graphen von f nur um a Einheiten nach links verschieben.
4.5. SPEZIELLE FUNKTIONEN
311
Mit der gleichen Idee geht es weiter: (i) sin(π + x) = sin π cos x + cos π sin x = − sin x, durch zweimalige Anwendung folgt sin(2π + x) = sin x. (ii) Es ist cos(π + x) = cos π cos x − sin π sin x = − cos x, zweimal angewendet ergibt das cos(2π + x) = cos x. (iii) Das folgt leicht aus Satz 4.5.12: π π π + x = sin cos x + cos sin x = − sin x. sin 2 2 2
Die Rechnung f¨ ur den Cosinus verl¨auft analog.
Es ist noch v¨ ollig offen, was die Funktionen sin und cos mit Sinus“ und Cosi” ” nus“ der Schulmathematik zu tun haben, wo es also Zusammenh¨ange zur Winkelmessung gibt. Wie schon gesagt, werden wir dieses Problem nach Behandlung der Integralrechnung in Abschnitt 7.3 wieder aufgreifen. Hier k¨ ummern wir uns nur um die Tatsache, dass man mit den Tupeln (cos x, sin x) alle Punkte des Einheitskreises42) darstellen kann. R 1 R
−1
1 −1
Bild 4.21: Der Einheitskreis {(a, b) | a, b ∈ R , a2 + b2 = 1} Eine Richtung ist klar: Wegen sin2 x + cos2 x = 1 liegen alle Tupel (cos x, sin x) auf dem Einheitskreis. Es gilt aber mehr, alle Punkte des Einheitskreises entstehen auf diese Weise: Satz 4.5.16. Zu jedem Punkt (a, b) auf dem Einheitskreis existiert genau ein x ∈ [ 0, 2π [ mit a = cos x, b = sin x, d.h.
∀
∃
a = cos x, b = sin x.
a,b∈R x∈[ 0,2π [ a2 +b2 =1
Beweis: Seien zun¨ achst a, b ∈ [ 0, 1 ] mit a2 + b2 = 1 vorgelegt. Wir w¨ ahlen nach dem Zwischenwertsatz ein x ∈ [ 0, π/2 ] mit sin x = b: 42) Das ist nach Definition die Menge aller (a, b) mit reellen a, b, f¨ ur die a2 + b2 = 1 gilt, also die Menge derjenigen Punkte des R2 , f¨ ur die der Abstand zum Nullpunkt in der euklidischen Metrik genau gleich 1 ist.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
312
R 1
b
x
1
π 2
R
Bild 4.22: Lage von b und x Notwendig ist dann cos x ≥ 0. (Denn cos x < 0 w¨ urde mit dem Zwischenwertsatz zu einem x1 ∈ [ 0, x ] mit cos x1 = 0 f¨ uhren. Es folgte sin x1 = 1 im Widerspruch dazu, dass π/2 kleinstm¨oglich gew¨ ahlt war.) Es ist also √ a = 1 − b2 = 1 − sin2 x = cos2 x = cos x. Alle anderen M¨oglichkeiten f¨ ur die Vorzeichen von a und b k¨ onnen darauf zur¨ uckgef¨ uhrt werden. Man beachte nur: Ist a, b ∈ [ 0, 1 ] und x ∈ [ 0, π/2 ] mit (cos x, sin x) = (a, b) gew¨ahlt, so ist cos(2π − x), sin(2π − x) = (a, −b) cos(π + x), sin(π + x) = (−a, −b) cos(π − x), sin(π − x) = (−a, b). Die Eindeutigkeit ergibt sich durch ein Monotonieargument, als Beispiel betrachten wir a, b mit a, b > 0. Nur auf dem Teilintervall [ 0, π/2 ] sind sowohl Sinus als auch Cosinus positiv, wir brauchen das x also nur dort zu suchen. Nun ist aber der Cosinus im Innern dieses Intervalls strikt positiv, also hat der Sinus dort eine positive Ableitung und ist – nach dem Mittelwertsatz – folglich streng monoton steigend und damit injektiv. Anders ausgedr¨ uckt: Das x vom Beginn des Beweises ist eindeutig bestimmt. Neben sin und cos spielen noch weitere daraus abgeleitete Funktionen eine Rolle. Besonders hinzuweisen ist auf
4.5. SPEZIELLE FUNKTIONEN
313
Definition 4.5.17. Die Tangens-Funktion tan cot und die Cotangens-Funktion sind definiert durch tan : {x | x ∈ R , cos x = 0} → R sin x x → , cos x cot : {x | x ∈ R , sin x = 0} → R cos x . x → sin x Aus den schon bewiesenen Eigenschaften f¨ ur Sinus und Cosinus l¨ asst sich alles, was man u ¨ber diese Funktionen wissen muss, leicht herleiten, zum Beispiel: • Tangens und Cotangens sind auf ihrem Definitionsbereich beliebig oft differenzierbar. • Es ist (tan x) =
cos2 x + sin2 x 1 cos x sin x − sin x cos x = = . 2 cos x cos2 x cos2 x
Die Ableitung ist also u ¨ berall da, wo tan x definiert ist, positiv, und deswegen ist der Tangens auf jedem Teilintervall des Definitionsbereichs eine streng monoton steigende Funktion. allt auf jedem • Analog zeigt man (cot x) = −1/ sin2 x: Der Cotangens f¨ Teilintervall des Definitionsbereichs. • usw. Am Ende dieses Unterabschnitts ist noch auf die Arcusfunktionen hinzuweisen, darunter versteht man die Umkehrfunktionen der trigonometrischen Funktionen. Als Beispiel betrachten wir die arcsin-Funktion. Zun¨ achst fixieren wir ein Intervall, auf dem die Sinusfunktion streng monoton steigt, etwa das Intervall ] −π/2, π/2 [. Die Einschr¨ankung der Sinusfunktion ist wegen Satz 3.3.8 eine bijektive Abbildung von ] −π/2, π/2 [ nach ] −1, 1 [, und die inverse Funktion – sie wird die Arcussinus-Funktion genannt und mit arcsin abgek¨ urzt – ist sogar stetig. F¨ ur −1 < y < 1 ist arcsin y damit die eindeutig bestimmte Zahl x ∈ ] −π/2, ur die sin x = y gilt. Zum Beispiel ist arcsin 0 = 0, √ π/2 [, f¨ arcsin(1/ 2) = π/4 usw. Wir wissen sogar mehr: Da die Sinusfunktion differenzierbar ist, ist auch der Arcussinus eine differenzierbare Funktion. Wie man die Ableitung konkret ausrechnet, wurde auf Seite 244 vorgemacht. Wir fassen zusammen, die fehlenden Rechnungen verlaufen analog:
tan, cot
314
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
• Die inverse Funktion zum Sinus ist die Arcussinus-Funktion arcsin. Sie ist eine bijektive differenzierbare Abbildung von ] −1, 1 [ nach ] −π/2, π/2 [, es gilt 1 (arcsin x) = √ . 1 − x2 • Die inverse Funktion zum Cosinus ist die Arcuscosinus-Funktion arccos. Sie ist eine bijektive differenzierbare Abbildung von ] −1, 1 [ nach ] 0, π [, es gilt 1 . (arccos x) = − √ 1 − x2 • Die inverse Funktion zum Tangens ist die Arcustangens-Funktion arctan. Sie ist eine bijektive differenzierbare Abbildung von R nach ] −π/2, π/2 [, es gilt 1 (arctan x) = . 1 + x2
exp, sin und cos im Komplexen Wir haben die Funktionen exp, sin und cos als Funktionen von R nach R eingef¨ uhrt. Aufgrund der bekannten Potenzreihenentwicklung gibt es jedoch nahe liegende Kandidaten f¨ ur die Erweiterung zu Funktionen von C nach C : Definition 4.5.18. Wir definieren f¨ ur z ∈ C : exp z
:=
sin z
:=
cos z
:=
∞ z2 z3 zn =1+z+ + + ··· , n! 2! 3! n=0 ∞
(−1)n
n=0 ∞
(−1)n
n=0
z3 z5 z 2n+1 =z− + − +··· , (2n + 1)! 3! 5! z2 z4 z 2n =1− + ∓ ··· . (2n)! 2! 4!
Diese Funktionen sind dann wirklich auf ganz C definiert, denn die jeweiligen Konvergenzradien sind gleich +∞. Offensichtlich stimmen sie auf R mit den schon bekannten Funktionen u ¨ berein. Da wir Potenzen der Form ax f¨ ur a > 0 und x ∈ R durch die Exponentialfunktion eingef¨ uhrt haben, liegt es nahe, auch diese Definition ins Komplexe zu erweitern: Definition 4.5.19. Es sei a > 0 und z ∈ C . Dann soll az durch az := exp(z log a) definiert sein.
4.5. SPEZIELLE FUNKTIONEN
315
Fast alles, was wir im reellen Fall hergeleitet haben, gilt nun auch im Komplexen. ¨ Zus¨ atzlich gibt es Uberraschungen: Satz 4.5.20. F¨ ur alle z, w ∈ C gilt: (i) exp z = exp z, sin z = − sin z, und cos z = − cos z, die Funktionen exp, sin und cos gen¨ ugen also den gleichen Differentialgleichungen wie im Fall reeller Skalare. (ii) exp(z + w) = exp z · exp w. (iii) exp iz = cos z + i sin z (Eulersche Formel). (iv) exp(z + 2πi) = exp z f¨ ur jedes z ∈ C . (v) z kann z = |z|eix mit einem x ∈ [ 0, 2π [ geschrieben werden. Ist z = 0, so ist dieses x eindeutig bestimmt 43) . (vi) F¨ ur die Potenz im Komplexen gelten die folgenden Rechenregeln (dabei sind a und b positive Zahlen): (ab)z = az bz , az aw = az+w . Beweis: (i) Diese Gleichungen sind eine unmittelbare Konsequenz aus den Potenzreihenentwicklungen und der Tatsache, dass Potenzreihen gliedweise abgeleitet werden d¨ urfen. (ii) Der Beweis dieses Ergebnisses ist eine der wichtigsten Anwendungen des Multiplikationssatzes f¨ ur absolut konvergente Reihen (Satz 2.4.6), nach dem wie bei endlichen Summen ausmultipliziert werden darf. Die Voraussetzungen sind wirklich erf¨ ullt, denn die auftretenden Reihen sind (als Potenzreihen im Innern des Konvergenzkreises) absolut konvergent. Wir erhalten: ! ! ∞ ∞ zn wn · exp z · exp w = n! n! n=0 n=0 2 3 z z w2 w3 = 1+z+ + + ··· 1+w+ + + ··· 2! 3! 2! 3! 1 2 2.4.6 = 1 + (z + w) + (z + 2wz + w2 ) + · · · 2! (z + w)2 + ··· = 1 + (z + w) + 2! = exp(z + w). Dabei haben wir ausgenutzt, dass sich die Terme der Potenzsumme n wirklich zu (z + w)n /n! summieren, dass also f¨ ur alle n ∈ N stets n wk (z + w)n z n−k · = (n − k)! k! n! k=0 43) F¨ ur
z = 0 ist Eindeutigkeit nat¨ urlich nicht zu erwarten, man darf alle x einsetzen.
Eulersche Formel
316
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
¨ ist. Das folgt aber aus der binomischen Formel f¨ ur (a + b)n (s. Ubungsaufgabe 1.5.7). (iii) Auch hier ist es g¨ unstig, die Funktionen durch Potenzreihen darzustellen, man muss nur an der richtigen Stelle i2 durch −1 ersetzen: exp(iz) = = = =
(iz)2 (iz)3 + + ··· 2! 3! z2 z3 z4 1 + iz − −i + ± ··· 2! 3! 4! z4 z3 z2 1− + ∓ ··· + i z − ± ··· 2! 4! 3! cos z + i sin z. 1 + iz +
(iv) Das folgt aus den beiden vorigen Beweisteilen, wenn man cos 2π = 1 und sin 2π = 0 beachtet. (v) Sei zun¨achst |z| = 1. Wir schreiben z = a + ib mit a, b ∈ R . 2 Wegen a2 + b2 = |z| = 1 gibt es nach Satz 4.5.16 ein eindeutig bestimmtes x ∈ [ 0, 2π [ mit a + ib = cos x + i sin x = eix . Die Aussage ist im Fall z = 0 klar, und der allgemeine Fall z = 0 kann durch Betrachtung von z/|z| auf den Fall |z| = 1 zur¨ uckgef¨ uhrt werden. (vi) Das ist wegen der schon bewiesenen Formeln leicht: (ab)z
= exp(z log ab) = exp z(log a + log b) = exp(z log a) exp(z log b) = az b z .
Die andere Gleichung ergibt sich genauso.
Bemerkungen: 1. Man beachte, dass nach dieser Definition auch im Komplexen exp z = ez gilt. 2. Die Formeln k¨onnen eingesetzt werden, wenn man die Additionstheoreme f¨ ur Sinus und Cosinus vergessen hat, sich aber noch an die Potenzgesetze erinnert. Wir betrachten als Beispiel zwei reelle x, y und rechnen die Zahl exp i(x + y) auf zwei verschiedene Weisen aus. Einerseits ist diese Zahl doch gleich cos(x + y) + i sin(x + y), andererseits ist exp i(x + y) = exp ix exp iy = (cos x + i sin x)(cos y + i sin y) = (cos x cos y − sin x sin y) + i(cos x sin y + sin x cos y). Vergleicht man Real- und Imagin¨ arteil dieser zwei Darstellungen, so folgt cos(x + y) = sin(x + y) =
cos x cos y − sin x sin y, cos x sin y + sin x cos y.
4.5. SPEZIELLE FUNKTIONEN
317
Die gleiche Idee kann man auch verwenden, um kompliziertere Additionstheoreme herzuleiten. Mal angenommen, man braucht eine Formel f¨ ur cos 3x. Dann startet man mit exp(3ix) = cos 3x + i sin 3x und rechnet das als cos 3x + i sin 3x =
exp(3ix)
= =
(exp ix)3 (cos x + i sin x)3
=
(cos3 x − 3 cos x sin2 x) + i(3 cos2 x sin x − sin3 x)
aus. Es folgen die Formeln cos 3x = cos3 x − 3 cos x sin2 x, sin 3x = sin3 x + 3 cos2 x sin x, die man unter Ausnutzung von cos2 x + sin2 x = 1 noch zu cos 3x = 4 cos3 x − 3 cos x, sin 3x = 3 sin x − 4 sin3 x vereinfachen kann. 3. Wieder ist exp z · exp(−z) = exp(z + (−z)) = exp 0 = 1, insbesondere ist also exp z f¨ ur alle komplexen z von Null verschieden. 4. Im Fall reeller x folgt aus eix = cos x + i sin x, dass eix eine Zahl mit Betrag 1 sein muss, denn cos2 x + sin2 x = 1. Wenn man insbesondere x = π einsetzt, erh¨alt man wegen cos π = −1 und sin π = 0 die folgende, erstmals von Euler44) bewiesene Formel: 0 = 1 + eiπ Das ist sehr bemerkenswert, denn die wichtigsten Zahlen der Analysis (0, 1, e, i und π) scheinen auf eine fast schon mysteri¨ ose Weise zusammenzuh¨angen. Niemand h¨atte doch zum Beispiel erwartet, dass man irgendwann einmal auf eine Verbindung zwischen e – der f¨ ur Wachstumsprozesse wichtigen Zahl – und π – der Zahl, die man bei Schwingungen braucht – stoßen w¨ urde. Es ist daher nicht verwunderlich, dass diese Formel vor einigen Jahren bei einer Umfrage unter Mathematikern zur sch¨onsten Formel gek¨ urt wurde. w 5. Haben Sie bei den Potenzregeln die Formel az = azw vermisst? Die kann hier nicht sinnvoll formuliert werden, da wir az nur f¨ ur reelle und positive a erkl¨ art haben, in der Formel aber mit az eine komplexe Basis auftreten w¨ urde. Der Abschnitt schließt damit, dass wir die im vorigen Satz nachgewiesene Darstellungsm¨ oglichkeit f¨ ur komplexe Zahlen zum Wurzelziehen ausnutzen. 44) Euler war einer der produktivsten Mathematiker aller Zeiten, er wirkte haupts¨ achlich in Berlin und St. Petersburg. Von ihm gibt es wichtige Beitr¨ age zur Analysis, zur mathematischen Physik, zur Zahlentheorie und anderen Gebieten. Neben den Ergebnissen verdankt ihm die Mathematik viele noch heute verwendete Symbole: e, f (x), , . . .
Leonhard Euler 1707 – 1783
318
Polardarstellung
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Definition 4.5.21. Sei z ∈ C , die nach Satz 4.5.20(v) existierende Darstellung z = |z|eix mit x ∈ [ 0, 2π [ wird die Polardarstellung von z genannt. Dabei heißt die Zahl x das Argument von z. Bemerkungen und Beispiele: 1. Es wird gleich wichtig werden, dass wir f¨ ur konkrete z die Polardarstellung finden. Das muss man nur f¨ ur Zahlen mit Betrag 1 k¨ onnen, da man ja z nur als z = |z| · (z/|z|) schreiben und sich dann um z/|z| k¨ ummern muss. Die heimliche Faustregel: Ist w mit |w| = 1 vorgelegt, so ist das gesuchte x mit eix = w der Winkel im Bogenmaß45), den w mit der positiven Richtung der x-Achse einschließt. • Ist w = 1, so ist dieser Winkel 0. Damit hat 1 die Darstellung 1 = e0i . • Bei −1 kommen wir auf 180 Grad, also π im Bogenmaß. Das bedeutet: −1 = eiπ . √ • Wir betrachten nun z = 1 + i. Es ist |z| = 2, und z schließt einen Winkel von 45 Grad (= π/4 im Bogenmaß) mit der x-Achse ein. Es folgt f¨ ur die Polardarstellung: √ iπ/4 . 1 + i = 2e 2. Mit Hilfe der Polardarstellung komplexer Zahlen ist es leicht m¨ oglich, einfache algebraische Gleichungen in C zu l¨ osen. Sollen etwa alle z ∈ C mit z n = z0 bestimmt werden (bei vorgegebenen achst die Polardarstellung von z0 : n ∈ N , z0 ∈ C ), berechne man zun¨ z0 = |z0 |eix0 . Die fraglichen z erh¨alt man unter Beachtung von Satz 4.5.20(iv) als z = n |z0 | · ei(x0 +2kπ)/n , k = 0, 1, . . . , n − 1. √ Ein Beispiel: Es ist 1 + i = 2eiπ/4 . Folglich sind die z mit z 4 = 1 +i gerade √ √ √ √ 8 8 8 8 z1 = 2eiπ/16 , z2 = 2e9iπ/16 , z3 = 2e17iπ/16 , z4 = 2e25iπ/16 . 3. Man sollte sich merken: F¨ ur additive Probleme ist es g¨ unstig, wenn man komplexe Zahlen als a + ib mit reellen a, b darstellt, f¨ ur multiplikative Probleme ist dagegen die Polardarstellung geeigneter. Weiß man zum Beispiel, dass z die Polardarstellung r1 eiϕ1 und w die Darstellung r2 eiϕ2 hat, so hat z · w die Darstellung zw = r1 eiϕ1 r2 eiϕ2 = r1 r2 ei(ϕ1 +ϕ2 ) . 45) Das bedeutet: 360 Grad entsprechen 2π. So ist zum Beispiel ein Winkel von π/4 nichts anderes als ein Winkel von 45 Grad.
4.5. SPEZIELLE FUNKTIONEN
319
Das Problem bestimmt die g¨ unstigste Darstellung Die eben zur Polardarstellung gemachte Bemerkung ist ein spezieller Fall eines oft anzutreffenden Sachverhalts: Die Frage, ob eine bestimmte Darstellung einer mathematischen Situation g¨ unstig“ ist, ” h¨ angt von der Problemstellung ab. Nehmen wir als Beispiel die verschiedenen M¨ oglichkeiten, eine nat¨ urliche Zahl darzustellen, etwa die Zahl 1001. In der u ¨ blichen Darstellung, also im Zehnersystem, sieht man sofort, dass sie nicht durch 10 teilbar ist. F¨ ur die Frage der Teilbarkeit durch 17 dagegen m¨ usste man anfangen zu rechnen. Diese Probleme g¨ abe es nicht, wenn man 1001 als Primzahlprodukt angegeben h¨ atte, also als 1001 = 7 · 11 · 13. Dann ist sofort klar: 17 ist kein Teiler. F¨ ur andere Fragen k¨onnte eine Dartellung im Dualsystem, im 27erSystem oder noch etwas ganz anderes optimal sein. Das gilt f¨ ur so gut wie alle mathematischen Bereiche. In der Linearen Algebra versucht man, lineare Abbildungen auf Hauptachsen zu transformieren, in der Analysis sucht man ein Koordinatensystem, das die Symmetrien eines Problems so gut wie m¨ oglich widerspiegelt usw. Kurz: Es ist wie im Leben, auch da h¨angt es ja vom richtigen Blickwinkel ab, ob man das Wesentliche einer Situation schnell erkennen kann. Aus Bemerkung 2 ergibt sich insbesondere das Korollar 4.5.22. F¨ ur jedes z ∈ C und jedes n ∈ N gibt es ein w ∈ C mit wn = z. Wir werden diese Tatsache im n¨achsten Abschnitt ausnutzen, um die L¨ osbarkeit beliebiger algebraischer Gleichungen in C zu zeigen. Schlussbemerkung: Im Gegensatz zu den reellen Zahlen sind im Komplexen alle Wurzeln gleichberechtigt: Wir haben keine M¨oglichkeit, eine bestimmte n46) te Wurzel als die n-te Wurzel auszuzeichnen . Deswegen finden Sie hier auch √ keine Diskussion einer Funktion“ z → n z, eine derartige Abbildung kann nicht ” so einfach definiert werden. Man hilft sich, indem man entweder mehrdeutige Funktionen betrachtet oder sich mit einer lokalen Definition begn¨ ugt, wobei die n-te Wurzel dann nur auf einer echten Teilmenge von C definiert wird. Beides soll hier vorl¨ aufig nicht weiter verfolgt werden (vgl. das Ende von Abschnitt 8.6 in Band 2). Eine ¨ ahnliche Schwierigkeit gibt es mit dem Logarithmus. Wir betrachten zum Beispiel die Zahl i, die die Darstellung i = eiπ/2 hat. Dann k¨ onnte man ¨ doch in nahe liegender Ubertragung des reellen Falls sagen, dass log i := iπ/2 46) Zur Erinnerung: In R konnten wir Eindeutigkeit dadurch garantieren, dass wir die eindeutig bestimmte positive Wurzel betrachtet haben. In C steht aber keine entsprechende Definitionsm¨ oglichkeit zur Verf¨ ugung.
320
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
sein soll. Leider geht das nicht, denn mit gleichem Recht istdoch i = ei((π/2)+2π) , denn e2πi = 1. Ist der Logarithmus von i nun iπ/2 oder i (π/2) + 2π ? (Es ist sogar noch schlimmer, alle i (π/2)+2kπ mit k ∈ Z sind im Rennen.) Auch hier kommt man an – sogar unendlich – mehrdeutigen Funktionen nicht vorbei. Als Notl¨osung kann man wieder Funktionen betrachten, die nur auf einer echten Teilmenge von C definiert sind. Es ist g¨ unstig, dass wir den Logarithmus im Komplexen nicht ben¨otigen werden.
4.6
Fundamentalsatz der Algebra, elementar zu l¨ osende Differentialgleichungsprobleme
Im vorigen Abschnitt haben wir bewiesen, dass in C beliebige n-te Wurzeln existieren. Das l¨asst sich so umformulieren, dass jedes Polynom der Form z → z n − w eine Nullstelle in C besitzt47) . Bemerkenswerterweise reicht diese Tatsache aus, um ein viel weitergehendes Ergebnis zu beweisen, den Fundamentalsatz der Algebra. Dieser Satz besagt, dass nichtkonstante Polynome u ¨ber C in Linearfaktoren zerfallen, er ist das erste Hauptergebnis dieses Abschnitts. Er wird im zweiten Teil gleich ausgenutzt werden, da werden wir uns um einige elementar zu l¨osende Differentialgleichungen k¨ ummern.
Der Fundamentalsatz der Algebra Satz 4.6.1. Sei P (z) =
n
ak z k = a0 + a1 z + · · · + an z n
k=0
ein nicht konstantes Polynom n-ten Grades (d.h. n ≥ 1 und an = 0) mit an , . . . , a0 ∈ C . Dann gibt es z1 , . . . , zn ∈ C mit P (z) = an (z − z1 ) · · · (z − zn ). Die z1 , . . . , zn sind gerade die Nullstellen von P : Es ist P (zj ) = 0 f¨ ur j = 1, . . . , n, und ist eine Zahl z von allen zj verschieden, so ist P (z) = 0. Dieser Satz (den wir nach einigen Vorbereitungen gleich beweisen werden) spielt eine wichtige Rolle bei vielen Existenzbeweisen der (Linearen) Algebra und der h¨oheren Analysis. Der erste Beweis stammt von Gauß (1777-1855), die Untersuchung von Spezialf¨allen dieses Satzes l¨ asst sich bis weit in die Geschichte der Mathematik zur¨ uckverfolgen. Es hat mehrere Jahrhunderte gedauert, bis 47) Wir haben im Fall w = 0 sogar n verschiedene Nullstellen angegeben. Beachten Sie auch, dass ein entsprechendes Resultat in R nicht gilt. Es gibt z.B. kein reelles x mit x2 + 1 = 0, denn x2 + 1 ist immer ≥ 1 und damit von Null verschieden.
4.6. FUNDAMENTALSATZ, DIFFERENTIALGLEICHUNGEN
321
man eingesehen hat, dass man komplexe Zahlen betrachten muss, um zu einer befriedigenden L¨ osungstheorie f¨ ur Polynome zu kommen. Und auch als Berufsmathematiker muss man sich zu Beginn des Studiums daran gew¨ ohnen, dass die Zahlen in C genauso gut behandelt werden k¨onnen wie die aus der Schule weit besser bekannten reellen Zahlen. Nun zum Beweis des Fundamentalsatzes. Wie schon gesagt wurde, wird die Behandlung des Polynoms P (z) = an z n + · · · + a0 = 0 auf die Behandlung von uckgef¨ uhrt werden. Der Beweisaufbau ist wie folgt: z n − z0 = 0 zur¨ 1. Wir zeigen, dass es reicht nachzuweisen: Ist P (z) wie in Satz 4.6.1 vorgelegt, so gibt es ein z0 ∈ C mit P (z0 ) = 0. (Also: Jedes nichtkonstante Polynom u ¨ ber C hat eine Nullstelle in C .)
(4.8)
2. Sei P (z) wie in Satz 4.6.1. Dann gibt es ein z0 ∈ C mit |P (z0 )| = inf |P (z)|. z∈C
Der Betrag eines Polynoms nimmt also das Minimum an. 3. Mit P (z) wie in Satz 4.6.1 gilt: Ist |P (z0 )| > 0 f¨ ur ein z0 ∈ C , so gibt es ein w0 mit |P (w0 )| < |P (z0 )| (d.h. |P (z)| nimmt immer noch kleinere ” Werte“ an, wenn das u ¨berhaupt m¨oglich ist).
Nach Behandlung von 1., 2. und 3. kann der Beweis des Fundamentalsatzes leicht gef¨ uhrt werden: aß 2.“. P (z0 ) muss Man w¨ ahle – bei vorgegebenem P – ein z0 gem¨ ” aufgrund von 3.“ gleich Null sein, und damit ist eine Nullstelle ” gefunden. Folglich ist (4.8) verifiziert, und wegen 1.“ reicht das f¨ ur ” den Beweis aus.
Wir m¨ ussen also nur“ noch 1., 2. und 3. beweisen: ” Beweis von 1.: Sei P (z) = a0 +· · ·+an z n vorgelegt (n ≥ 1, an = 0). Wir setzen die G¨ ultigkeit von (4.8) voraus und haben P in Linearfaktoren zu zerlegen. Zun¨ achst wenden wir (4.8) auf P selbst an. Wir erhalten ein z1 ∈ C mit P (z1 ) = 0 und ersetzen in P (z) den Wert von z durch (z − z1 ) + z1 . Dann hat P (z) nach Ausrechnen die Form P (z) = b0 + b1 (z − z1 ) + · · · + bn−1 (z − z1 )n−1 + an (z − z1 )n mit geeigneten b0 , . . . , bn−1 ∈ C , und es ist b0 = P (z1 ) = 0.
322
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
Folglich ist P (z) = an (z − z1 )P1 (z), wobei P1 (z) ein Polynom (n − 1)-ten Grades ist: P1 (z) = (z − z1 )n−1 + · · · + b1 = z n−1 + · · · . Man wende nun (4.8) auf P1 (z) an. Wie vorstehend folgt: Es ist P1 (z) = (z − z2 )P2 (z), wo P2 (z) ein Polynom (n − 2)-ten Grades ist, insgesamt also P (z) = an (z − z1 )(z − z2 )P2 (z). Durch vollst¨andige Induktion folgt nach n−2 weiteren Schritten, dass P in Linearfaktoren zerf¨allt. Beweis von 2.: Das ergibt sich mit einem Kompaktheitsschluss f¨ ur die Funktion z → |P (z)|; dabei wird nur zu beachten sein, dass es reicht, zur Bestimmung von inf z∈C |P (z)| die z in einer gen¨ ugend großen Kreisscheibe zu ber¨ ucksichtigen. Genauer: W¨ahlt man R ∈ [ 1, +∞ [ so groß, dass ai R ≥ 2n · f¨ ur i = 0, . . . , n−1, an so ist f¨ ur jedes z ∈ C mit |z| ≥ R: |P (z)|
=
= |a + b| ≥ |a| − |b|
≥
R ≥ 1, |z| ≥ R
≥
Wahl von R
≥
n k ak z k=0 n−1 ak n |an z | · 1 + an z n−k k=0 ! n−1 ak n |an z | · 1 − an z n−k k=0 ! n−1 ak n |an z | · 1 − an R k=0 ! n−1 1 n |an z | · 1 − 2n k=0
=
|an | n |z |. 2
ur |z| ≥ R0 : Insbesondere ist mit R0 := max{R, 2|a0 |/|an |} f¨ |P (z)|
≥ |z| ≥ R0 ≥ R ≥ 1
≥
≥ ≥ =
|an | n |z| 2 |an | |z| 2 |an | 2|a0 | 2 |an | |a0 | |P (0)|,
4.6. FUNDAMENTALSATZ, DIFFERENTIALGLEICHUNGEN
323
also inf z∈C |P (z)| = inf |z|≤R0 |P (z)|. Da aber z → |P (z)| stetig auf z |z| ≤ R0 und diese Menge kompakt ist, gibt es ein z0 mit |z0 | ≤ R0 , so dass |P (z0 )| = inf |P (z)| = inf |P (z)|, |z|≤R0
z∈C
und das wurde in 2.“ behauptet. ” Beweis von 3.: Die Idee ist einfach, die technischen Einzelheiten sind allerdings etwas verwickelt. Zur Motivation betrachten wir zun¨achst das Polynom 1 − z 2 in der N¨ ahe der 0. Das ist bei 0 gleich 1, und in der N¨ahe sind die Funktionswerte f¨ ur reelle z echt kleiner. Beim Polynom 1 + z 2 sollten wir Punkte der Form ti mit reellem t einsetzen, um zu Werten zu kommen, die kleiner als der Wert bei Null sind. Allgemeiner betrachten wir P (z) = 1 + ak z k mit ak = 0 und z0 = 0. W¨ ahlt man z in Richtung einer n-ten Wurzel von −1/ak (es gilt also z k = −t/ak f¨ ur ein kleines“ t > 0), so ist ” |P (z)| = |1 − t| < 1 = |P (0)|. Wir werden nur noch den allgemeinen Fall darauf zur¨ uckzuf¨ uhren haben. Wir tun dies in vier Schritten: (i) Es ist 1 − λk + Kλk+1 < 1.
∀∃ ∀
K>0 ε>0 λ 0 0 mit 1 − λk + λk+1 f (λ) < 1.
∀
λ∈] 0,ε ]
Beweis: Sei etwa |f (λ)| ≤ K f¨ ur alle λ. W¨ahlt man ε gem¨ aß (i), so ist 1 − λk + λk+1 f (λ) ≤ 1 − λk + λk+1 K < 1 f¨ ur 0 < λ ≤ ε. (iii) Sei P (z) = a0 + · · · + an z n ein nichtkonstantes Polynom u ¨ber C . Wir schreiben P (z) = a0 + ak z k + · · · + an z n , wobei k der erste Index nach dem Index 0 ist, f¨ ur den ak von Null verschieden ist48) . Ist dann a0 = 0, so gibt es ein z0 ∈ C und ein ε > 0 mit
∀
|P (λz0 )| < |a0 | = |P (0)|.
0 0. Analog ergeben sich bei Betrachtung von y < 0 L¨ osungen der Form −ceG(x) mit positivem c. Da auch y = 0 L¨ osung ist, haben wir so die L¨ osungsschar ceG(x) mit c ∈ R erhalten.
330
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
c1 y1 + · · · + cm ym eine L¨osung ist, wobei c1 , . . . , cm ∈ R beliebige Konstanten sein d¨ urfen. Interessanter ist 1.“. Da versucht man zun¨ achst, L¨ osungen der Form ” y(x) = eλx (λ geeignet) zu finden. (Exponentialansatz). Man erh¨alt durch Einsetzen: 0
= =
(n)
a0 (eλx ) + a1 (eλx ) + · · · + an (eλx ) eλx · (a0 + a1 λ + · · · + an λn ).
Da die e-Funktion nirgendwo verschwindet, bedeutet das a0 + a1 λ + · · · + an λn = 0. Kurz: Diejenigen λ, f¨ ur die eλx L¨ osung ist, sind genau die Nullstellen des Polynoms P (λ) = a0 + · · · + an λn (des so genannten charakteristischen Polynoms der Differentialgleichung). Es sind noch zwei Zusatz¨ uberlegungen erforderlich: • Erstens: Im Falle komplexer λ ist eλx keine Funktion von R nach R . Dieses Problem kann mit den Ergebnissen von Abschnitt 4.5 leicht gel¨ ost werden. Sei etwa λ = µ + iν eine komplexe Nullstelle von P (mit µ, ν ∈ R , ν = 0). Zun¨achst bemerken wir, dass dann auch λ = µ − iν Nullstelle von P ist, denn n n k ak λ = ak λk = 0 = 0 P (λ) = k=0
k=0
(hier geht wesentlich ein, dass alle ai reell sind und folglich ai = ai gilt). Damit sind eλx und eλx L¨osung der Differentialgleichung, also auch 1 λx 1 λx e + eλx und e − eλx . 2 2i Durch Ausrechnen ergibt sich, dass diese beiden L¨ osungen reell sind. Es handelt sich n¨amlich wegen der Eulerschen Formel (Satz 4.5.20(iii)) gerade um die Funktionen eµx · cos νx und eµx · sin νx. Zusammen also: Jede komplexe Nullstelle λ = µ + iν von P gibt Anlass zu den L¨osungen eµx cos νx und eµx sin νx.
4.6. FUNDAMENTALSATZ, DIFFERENTIALGLEICHUNGEN
331
• Zweitens: Ist λ mehrfache Nullstelle von P (etwa k-fache Nullstelle51) ), so osung der Differentialgleisind neben eλx auch xeλx , x2 eλx , . . . , xk−1 eλx L¨ chung. Im Falle komplexer λ (wir schreiben λ als λ = µ + iν mit reellen µ, ν) sind neben eµx cos νx und eµx sin νx die L¨osungen xeµx cos νx, xeµx sin νx, x2 eµx cos νx, x2 eµx sin νx,. . . xk−1 eµx cos νx, xk−1 eµx sin νx zu betrachten. Zusammenfassung: Um L¨osungen von a0 y + · · · + an y (n) = 0 zu ermitteln, verf¨ ahrt man wie folgt: 1. Man betrachtet das charakteristische Polynom P (λ) = a0 + a1 λ + · · · + an λn . Das entsteht aus der Differentialgleichung, indem man stets y (k) durch λk ersetzt. Die Nullstellen von P seien
λr+1
λ1 k1 -fach .. . λr kr -fach = µr+1 + iνr+1 kr+1 -fach .. . λs = µs + iνs ks -fach
(λ1 ∈ R ) (λr ∈ R ) (µr+1 , νr+1 ∈ R , νr+1 = 0) (µs , νs ∈ R , νs = 0).
Verzichtet man auf die Aufz¨ahlung konjugiert komplexer Nullstellen, so ist aufgrund des Fundamentalsatzes der Algebra (Satz 4.6.1) k1 + · · · + kr + 2(kr+1 + · · · + ks ) = n. 2. Als L¨ osungen besonders einfacher Bauart erhalten wir die n Funktionen eλ1 x , xeλ1 x , . . . , xk1 −1 eλ1 x .. . eλr x , xeλr x , . . . , xkr −1 eλr x eµr+1 x cos νr+1 x, eµr+1 x sin νr+1 x, . . . , xkr+1 −1 eµr+1 x cos νr+1 x, xkr+1 −1 eµr+1 x sin νr+1 x .. . eµs x cos νs x, eµs x sin νs x, . . . , xks −1 eµs x cos νs x, xks −1 eµs x sin νs x. 51) D.h. dass nicht nur P (λ) = 0 ist, sondern auch P (λ) = · · · = P (k−1) (λ) = 0 gilt. Gleichwertig dazu ist, dass in der Zerlegung von P in Linearfaktoren der Faktor (z − λ) nicht nur einmal, sondern k-fach vorkommt.
332
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
3. Bezeichnet man die vorstehend aufgef¨ uhrten n L¨ osungen mit y1 , . . . , yn , so ist auch y = c1 y 1 + · · · + c n y n f¨ ur beliebige c1 , . . . , cn ∈ R L¨ osung. Man kann zeigen, dass sich jede L¨ osung der vorgelegten Differentialgleichung auf diese Weise ergibt. Erg¨anzung: Sind L¨osungen mit Zusatzeigenschaften gefordert, so muss das durch geeignete Wahl der c1 , . . . , cn erreicht werden. Im Allgemeinen hat man n W¨ unsche frei, man erh¨ alt ein Gleichungssystem von n Gleichungen uck auch l¨ osen kann52) . f¨ ur die c1 , . . . , cn , das man mit etwas Gl¨ Beispiele: 1. Das charakterische Polynom P habe die Nullstellen 0, 1, 2, 1 + 2i und 1 − 2i. Das f¨ uhrt dann zu den L¨osungen e0x (= 1), ex , e2x , ex cos 2x, ex sin 2x. 2. Die Nullstellen von P seien 0, 0, 1, 1, 1, 2 + i, 2 − i, 2 + i und 2 − i. Diese 9 Nullstellen verschaffen uns 9 einfache L¨ osungsfunktionen, n¨ amlich 1, x, ex , xex , x2 ex , e2x cos x, e2x sin x, xe2x cos x und xe2x sin x. 3. Gesucht ist y mit y − y = 0, y(0) = 0 und y (0) = 1. Die Nullstellen des charakteristischen Polynoms λ2 − 1 sind 1 und −1, die allgemeine L¨osung lautet also y = c1 ex + c2 e−x . Die Bedingungen y(0) = 0, y (0) = 1 besagen gerade, dass 0 = y(0) = 1 = y (0) =
c1 + c2 c1 − c2
(man beachte: y (x) = c1 ex − c2 e−x ).
Es folgt c1 = −c2 = 1/2; die gesuchte Funktion lautet also y(x) = (ex − e−x )/2. 4. Zu bestimmen ist y mit y − 2y + y = 0, y(0) = 1 und y(1) = 2. Zun¨achst wird die allgemeine L¨ osung ermittelt. Es ist P (λ) = λ2 − 2λ + 1, und P hat eine doppelte Nullstelle bei 1. Die allgemeine L¨ osung lautet also y(x) = c1 ex + c2 xex . c1 , c2 sind so zu bestimmen, dass y(0) = 1 und y(1) = 2 gilt. Das f¨ uhrt auf 1 = y(0) =
c1 e0 + c2 · 0e0 = c1
2 = y(1) =
c1 e1 + c2 · 1e1 = (c1 + c2 ) · e
52) In der Regel hat man wirklich n W¨ unsche frei, es gibt aber auch F¨ alle, f¨ ur die keine L¨ osung existiert. Ein einfaches Gegenbeispiel ist die Differentialgleichung y = 0. Die Zusatzbedingung ullbar, da y = 0. Etwas genauer muss man schon hinsehen, y (4) = 2 ist da sicher nicht erf¨ bis einem klar wird, dass y − y = 0, y(0) = 0, y(2π) = 1 nicht l¨ osbar ist. Die allgemeine L¨ osung der Differentialgleichung lautet da n¨ amlich c1 cos x + c2 sin x mit reellen c1 , c2 , und alle diese Funktionen sind 2π-periodisch.
¨ 4.7. VERSTANDNISFRAGEN
333
Notwendig ist c1 = 1 und c2 = 2/e − 1, d.h. 2 − 1 · xex y(x) = ex + e hat die geforderten Eigenschaften.
4.7
Verst¨ andnisfragen
Zu 4.1 Sachfragen S1: Was bedeutet x→x lim g(x) = α? 0
x=x0
S2: Sei f : M → K , x0 ∈ M . Wann heißt f bei x0 (bzw. auf M ) differenzierbar? Inwiefern kann Differenzierbarkeit als Approximierbarkeit durch eine Gerade interpretiert werden? S3: Wie lauten die wichtigsten Differentiationsregeln, was ist (f + g) , (f · g) , (λf ) , (f /g) , (f ◦ g) und (f −1 ) ? Methodenfragen M1: Differentiationsregeln anwenden k¨ onnen. Zum Beispiel bestimme man 1. (3x4 − 12x2 + 1) ,
x−1 x−2
2.
x−3 +
3.
esin x · cos (x2 ) ,
4.
,
3
1 + log2 x ,
5. (arctan x) . M2: Einfache Beweise zum Begriff Differenzierbarkeit“ f¨ uhren k¨ onnen. ” Zum Beispiel: 1. Beweisen Sie, dass (f + g) = f + g . 2. Man zeige (z 2 ) = 2z. Zu 4.2 Sachfragen S1: Was besagen der Satz von Rolle und der erste bzw. zweite Mittelwertsatz? S2: Wie sind die Beweisideen zu diesen S¨ atzen?
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
334
S3: Was besagen die l’Hˆ opitalschen Regeln? Unter welchen Voraussetzungen an f f (x) bestimmen? und g l¨ asst sich mit ihnen lim x→0 g(x) x=0
S4: Die Funktion f sei auf einem Intervall definiert. Aus f = 0 folgt, dass f konstant ist. Methodenfragen M1: Einfache Folgerungen aus den Mittelwerts¨ atzen ziehen k¨ onnen. Zum Beispiel: 1. Es sei f : [ a, b ] → R differenzierbar mit |f (x)| ≤ 1 f¨ ur alle x. Dann ist |f (x) − f (y)| ≤ |x − y| f¨ ur alle x, y ∈ [ a, b ]. 2. f : [ a, b ] → R sei stetig differenzierbar53) . Dann ist f eine Lipschitzabbildung. M2: L’Hˆ opitalsche Regeln anwenden k¨ onnen. Man bestimme: sin x 1. lim x→π x − π ex/1000 x ex 3. lim x→−∞ 1/x 2x 4. lim x→1 x − 1 2.
lim
x→+∞
5. lim
x→3
x2 − 9 . x−3
Achtung: Pr¨ ufen Sie in jedem Fall vorher nach, ob die l’Hˆ opitalschen Regeln u ¨ berhaupt anwendbar sind. Zu 4.3 Sachfragen S1: Wie ist das n-te Taylorpolynom einer vorgelegten Funktion f bei x0 definiert? S2: Was versteht man unter dem Restglied, was besagt die Restgliedformel? S3: Wie kann man mit dem Newtonverfahren die Nullstelle einer Funktion bestimmen? S4: Zur Kurvendiskussion: Wie stellen Sie fest • wo f (streng) monoton steigt bzw. f¨ allt, 53) Eine
Funktion f heißt stetig differenzierbar, wenn sie differenzierbar ist und die Ableitung f stetig ist.
¨ 4.7. VERSTANDNISFRAGEN
335
• wo die Extremwerte liegen, • welche dieser Extremwerte lokale Maxima oder Minima sind, • wie groß das Maximum bzw. Minimum ist? Methodenfragen M1: Taylorpolynome bestimmen k¨ onnen. Zum Beispiel: 1. Wie lautet das dritte Taylorpolynom von x4 − 2x + 1 bei x0 = 1? 2. Wie lautet das zweite Taylorpolynom von esin x bei x0 = 0? M2: Restgliedformel anwenden k¨ onnen. Zum Beispiel: 1. Man beweise: Ist f (n+1) = 0, so ist f ein Polynom h¨ ochstens n-ten Grades. √ 2. Wie groß ist der Fehler f¨ ur x mit |x| ≤ 0.01, wenn 3 1 + x durch 1 + x/3 ersetzt wird? M3: Newtonverfahren anwenden k¨ onnen. Zum Beispiel: 1. Entwickeln Sie ein Verfahren zur Bestimmung von
√ 3
a f¨ ur a > 0.
2. Bestimmen Sie mit dem Newtonverfahren ein x > 0 mit sin x = x/2. Zu 4.4 Sachfragen S1: Sei a = (an )n∈N 0 vorgegeben. Wie sind dann Da , fa und Ra definiert? Wie wird Da durch Ra beschrieben? ˆ ? Was folgt aus S2: Was ist der Limes superior (Limes inferior) einer Folge (bn ) in R lim sup bn = lim inf bn ? S3: Was versteht man unter einem H¨ aufungspunkt einer Folge? S4: Man gebe zwei Formeln f¨ ur den Konvergenzradius an. S5: F¨ ur welche z d¨ urfen Potenzreihen differenziert werden? Wie erh¨ alt man die Ableitung? S6: Was besagt der Identit¨ atssatz f¨ ur Potenzreihen? S7: Wann sagt man, dass eine Funktion f bei x0 lokal in eine Potenzreihe entwickelbar ist? S8: Nennen Sie hinreichende Bedingungen f¨ ur die lokale Entwickelbarkeit. Reicht es, dass die Funktion beliebig oft differenzierbar ist? Methodenfragen M1: lim inf und lim sup bestimmen k¨ onnen.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
336
Zum Beispiel: 1. lim sup (−1 + 1/n)n , 2. lim inf en . M2: Konvergenzradien bestimmen k¨ onnen. Zum Beispiel f¨ ur ∞
1.
n2 z n ,
n=0 ∞
2.
cn z n f¨ ur c ∈ K ,
n=0 ∞
3. n=0
zn . (2n)!
M3: Ableitungen von Potenzreihen berechnen k¨ onnen. Zum Beispiel: 1. Bestimmen Sie eine Potenzreihe fa mit ∞
fa (x) =
(−1)n+1
n=1
xn x2 x3 =x− + ∓ ··· n 2 3
2. Man finde durch zweimaliges Ableiten von ∞
1 xn = 1−x n=0 eine Summenformel. M4: Taylorreihe von Funktionen berechnen k¨ onnen, die lokal in eine Potenzreihe entwickelbar sind. Zum Beispiel: 1. Wie lautet die Taylorreihe von
√ 3
1 + x bei 0?
2. Bestimmen Sie die Taylorreihe von sin(2x) bei 0. Zu 4.5 Sachfragen S1: Durch welche Potenzreihen sind exp, sin und cos definiert? Wie lauten die zugeh¨ origen Differentialgleichungsprobleme? S2: Wie ist log erkl¨ art? S3: Inwiefern lassen sich exp und log als Gruppenhomomorphismen auffassen? S4: Wozu ist Logarithmenrechnung n¨ utzlich? ur x ∈ K und a > 0? S5: Was ist ax f¨ S6: Wie ist π definiert?
¨ 4.7. VERSTANDNISFRAGEN
337
S7: Was ist sin2 x + cos2 x, sin(−x), cos(−x), sin (x + y) und cos (x + y)? S8: Wie sind exp, sin und cos im Komplexen erkl¨ art? S9: Was versteht man unter der Polardarstellung einer komplexen Zahl? Methodenfragen M1: Sichere Beherrschung der Ableitungsregeln und Funktionalgleichungen f¨ ur exp, sin, cos und log. Zum Beispiel: 1. Beweisen Sie, dass (xa ) = axa−1 . 2. Man berechne (xx ) . 3. Man finde Formeln f¨ ur sin (3x) und cos (3x). 4. Was ist (tan x) ? M2: Arbeiten mit der Polardarstellung komplexer Zahlen. Zum Beispiel: 1. Man finde alle z mit z 4 = 1. 2. Bestimmen Sie alle z mit z 2 − z − 2 = 0.
Zu 4.6 Sachfragen S1: Was besagt der Fundamentalsatz der Algebra? Beweisidee? S2: Was ist eine Differentialgleichung? S3: Wie l¨ ost man Differentialgleichungen der Form • y = g(x) · y, • y = g(x)h(y), • a0 y + a1 y + · · · + an y (n) = 0? Methodenfragen M1: Einfache Differentialgleichungen l¨ osen k¨ onnen. Zum Beispiel: 1. Finden Sie alle y mit y + y = 0. 2. Man finde alle y mit y(1) = 1 und y = xy. 3. Sei n ∈ N . Bestimmen Sie alle y mit y (n) = 0.
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
338
4.8
¨ Ubungsaufgaben
Zu Abschnitt 4.1 ur 4.1.1 Eine Funktion f : R → R sei als Nullfunktion f¨ ur x ≤ 0 und als x → x2 f¨ x ≥ 0 definiert. Beweisen Sie, dass f einmal, aber nicht zweimal differenzierbar ist. Finden Sie allgemeiner f¨ ur beliebiges vorgegebenes k eine Funktion, die k-mal, aber nicht (k+1)-mal differenzierbar ist. 4.1.2 f : R → R sei Null auf den irrationalen Zahlen, f¨ ur (gek¨ urzte) rationale Zahlen p/q (mit p ∈ Z und q ∈ N ) soll der Wert 1/q 2 zugeordnet werden. Gibt es Punkte, an denen f differenzierbar ist? Sie d¨ urfen ausnutzen, dass es zu jeder irrationalen Zahl x eine rationale Zahl p/q so gibt, dass |x − p/q| ≤ 1/q 2 . 4.1.3 Finden Sie eine differenzierbare Funktion von R nach R , f¨ ur die f nicht stetig ist. Zu Abschnitt 4.2 4.2.1 f und g seien auf R definierte differenzierbare Funktionen. Wenn dann f = g ist, so unterscheiden sich f und g nur durch eine Funktion der Form a + bx. 4.2.2 Finden Sie selbst Beispiele, um die l’Hˆopitalschen Regeln anzuwenden. Zu Abschnitt 4.3 4.3.1 Berechnen Sie das dritte Taylorpolynom der Funktion f bei x0 , wenn (a) f (x) = ln x und x0 = 2, (b) f (x) = 1/x und x0 = 1, und geben Sie eine Absch¨ atzung des Fehlers, wenn man f (x) f¨ ur |x − x0 | < 0.1 durch den Wert dieses Taylorpolynoms an der Stelle x ersetzt. Berechnen Sie weiter die Taylorpolynome 2. Grades bei x0 von √ ur x0 = 0 und (c) x → 3 1 − x f¨ (d) x → exp(1/x) f¨ ur x0 = 1. 4.3.2 Entwickeln Sie das Polynom 1 + 2x − 3x3 an der Stelle x0 = −1. Zu Abschnitt 4.4 4.4.1 Bestimmen Sie die Konvergenzradien von ∞
(a) n=1
n3 + n n x , n2
∞
(b) n=0
2n n x n
∞
(c)
2
an xn , a ∈ R .
n=0
4.4.2 Man zeige, dass die Funktion f : R → R mit f (x) =
e−1/x 0
2
f¨ ur x = 0 f¨ ur x = 0
unendlich oft differenzierbar ist und alle ihre Ableitungen im Nullpunkt verschwinden.
¨ 4.8. UBUNGSAUFGABEN
339
Tipp: Zun¨ achst sollte man zeigen, dass f¨ ur x = 0 f (n) (x) = pn
1 x
e−1/x
2
gilt, wobei pn ein geeignetes Polynom ist. ˆ . Man beweise, dass 4.4.3 Sei (an ) eine Folge in R lim sup an = inf sup an . m n≥m
Zu Abschnitt 4.5 4.5.1 Berechnen Sie die komplexen L¨ osungen der Gleichung z 6 = 1 (man nennt sie die sechsten Einheitswurzeln) und zeigen Sie, dass sie die Ecken eines regul¨ aren Sechsecks bilden. 4.5.2 Beweisen Sie das Additionstheorem f¨ ur die Tangensfunktion: Wann immer tan α, tan β und tan(α + β) definiert sind, gilt tan(α + β) =
tan α + tan β . 1 − tan α tan β
4.5.3 Man finde alle komplexen Zahlen z mit (a) z 2 − z + 1 = 0, (b) z 7 = 5, (c) z 15 = −z 6 . 4.5.4 Man zeige: (a) F¨ ur f : R → C , f (x) = eix gilt die Aussage des Satzes von Rolle auf [ 0, 2π ] nicht. (b) Die l’Hˆ opitalschen Regeln gelten f¨ ur komplexwertige Funktionen nicht: Als Beispiel setze man f : ] 0, 1 ] → C , f (x) = x, g : ] 0, 1 ] → C , g(x) = x + x2 exp(i/x2 ) und berechne unter Beachtung von limx→0 f (x) = limx→0 g(x) = 0 die Grenzwerte f (x) f (x) , lim . lim x→0 g(x) x→0 g (x) x=0
x=0
Zu Abschnitt 4.6 4.6.1 Man zeige: n
cos(kx) = k=0 ix
Tipp: cos x = (e
−ix
+e
cos(nx/2) sin (n + 1)x/2 . sin(x/2)
)/2, sin x = (eix − e−ix )/2i.
4.6.2 Sei l > 0 gegeben. F¨ ur welche Zahlen k > 0 besitzt y + k2 y = 0 eine nicht triviale L¨ osung mit den Randwerten y(0) = 0,
y (l) = 0 ?
(Das kleinste derartige k bestimmt die so genannte Eulersche Knicklast. Bei dieser kann ein einseitig eingespannter Stab der L¨ ange l ausknicken.)
340
¨ KAPITEL 4. DIFFERENTIATION (EINE VERANDERLICHE)
4.6.3 Man zeige: (a) Ist x = 0 eine algebraische Zahl, so auch 1/x und x + q f¨ ur alle q ∈ Q . √ √ (b) 2 + 5 ist algebraisch. (Allgemein kann man zeigen, dass die Menge der algebraischen Zahlen ein K¨ orper ist.) 4.6.4 z0 ∈ C heißt n-fache Nullstelle des Polynoms P , wenn es ein Polynom Q mit P (z) = (z − z0 )n Q(z) gibt. (a) z0 ist genau dann n-fache Nullstelle von P , wenn gilt: P (z0 ) = P (z0 ) = . . . = P (n−1) (z0 ) = 0. (b) P habe reelle Koeffizienten. Dann gilt f¨ ur z0 ∈ C : P (z0 ) = 0 ⇐⇒ P (z0 ) = 0. (c) Ein Polynom = 0 mit reellen Koeffizienten zerf¨ allt in ein Produkt aus Polynomen (¨ uber R ) vom Grad ≤ 2: P (x) = an (x − x1 ) · · · (x − xr )(x2 + A1 x + B1 ) · · · (x2 + As x + Bs ) (alle xi , Ai , Bi ∈ R ). 4.6.5 Man betrachte das Anfangswertproblem (AWP) y = y,
y(0) = y0 .
(a) Was kann man (ohne die Differentialgleichung zu l¨ osen!) qualitativ u ¨ ber den Verlauf von y in der N¨ ahe von (0, y0 ) sagen, wenn y0 gleich 1, 0 bzw. −1 ist? (b) Man l¨ ose das AWP f¨ ur allgemeines y0 . 4.6.6 Finden Sie alle y mit y = x3 y 4 .
Anh¨ ange
¨ ANHANGE
342
Computeralgebra Erinnern Sie sich an Ihre Grundschulzeit: Sie mussten erst das kleine, dann das große Einmaleins lernen und dann ziemlich komplizierte Aufgaben mit Papier und Bleistift rechnen: Das Produkt 3341 · 212, den Quotienten 3526771 : 44 usw. Sp¨ ater haben Sie das eigentlich kaum noch gebraucht, weil Sie f¨ ur derartige Aufgaben einen Taschenrechner verwenden durften. ¨ Trotzdem ist es nach allgemeiner Uberzeugung wichtig, dass Sie irgendwann einmal das Handwerk des Multiplizierens und Differenzierens gelernt haben, mindestens sind Sie dann ein bisschen davor gesch¨ utzt, unsinnige Ergebnisse Ihres Rechners (die sich z.B. durch Vertippen bei der Eingabe ergeben k¨onnen) kritiklos zu akzeptieren. Sie sind nun viel weiter, auf dem jetzt erreichten h¨oheren Niveau sieht es ganz ahnlich aus. Bei Bedarf kann man auf die Hilfe von leistungsf¨ahigen Computer¨ algebra-Programmen zur¨ uckgreifen, die – anders, als der Name vermuten l¨asst – nicht nur f¨ ur die Algebra interessant sind. Im zurzeit verf¨ ugbaren Angebot (Maple, Mathematica, MuPad, Derive, Matlab, . . . ) findet man Hilfestellungen f¨ ur so gut wie alle Bereiche. Sie werden im Verlauf Ihres Studiums sicher einige davon kennen lernen. Nun sind wir – das m¨ ussen wir ehrlicherweise zugeben – keine Spezialisten f¨ ur Computeralgebra, und auch aus Platzgr¨ unden kann es hier keine ausf¨ uhrliche Einf¨ uhrung geben. Deswegen begn¨ ugen wir uns mit dem Hinweis auf einige Situationen, in denen der Einsatz derartiger Programme f¨ ur die in diesem Analysisbuch behandelten Probleme sinnvoll sein kann. Diese Anregungen motivieren Sie vielleicht dazu, es einmal selbst auszuprobieren. Als Beispiele – die wirklich nur einen Bruchteil des Angebots darstellen – betrachten wir einige von Maple angebotene L¨osungen: • Induktion: Mal angenommen, man sucht eine Summenformel f¨ ur den Ausdruck 1 + 2 + · · · + n. Das ist f¨ ur Maple noch keine Herausforderung, auf die Eingabe sum(’k’,’k’=0..n); n(n + 1) . Das h¨atten wir auch noch gekonnt, erfolgt prompt die Antwort 2 diese Formel war ja auch ein Beispiel f¨ ur Beweise durch vollst¨andige Induktion. Wie sieht es aber mit 15 + 25 + · · · + n5 aus? Da m¨ usste man doch etwas u ¨berlegen, Maple dagegen bietet nach Eingabe von sum(’k^5’,’k’=0..n); sofort die Formel 1 2(n + 1)6 − 6(n + 1)5 + 5(n + 1)4 − (n + 1)3 12
¨ ANHANGE
343
an. Auch die Summen u ohere Potenzen machen keine Schwie¨ber viel h¨ rigkeiten, und genauso leicht werden geschlossene Ausdr¨ ucke f¨ ur andere Summen gefunden. • Konvergenz: Auch Untersuchungen zur Konvergenz von Folgen sind vorn ? Maple muss man so fragen: bereitet. Was ist zum Beispiel lim 2 n→∞ n − 5 limit(n/(n^2-5), n=infinity); Die korrekte Antwort 0“ wird ohne Z¨ ogern gegeben. ” • Reihen: Testen wir Maple mit der Reihe 1+2q+3q 2 +· · · , die in Abschnitt 4.5 ben¨ otigt wurde. Man muss nur sum(’n*q^(n-1)’,’n’=0..infinity); eingeben, um das richtige Ergebnis 1/(1 − q)2 zu erhalten. • l’Hˆ opital: Wir legen Maple den Grenzwert lim ex /x vor. Gibt man x→∞
limit(exp(x)/x, x=infinity); ein, so wird umgehend der richtige Wert ∞“ angezeigt. ” • Ableitungen: Maple kann alle Differentiationsregeln, diff(x^4,x); zum Beispiel berechnet die Ableitung von x4 , also 4x3 . Auch h¨ohere Ableitungen k¨ onnen ermittelt werden, z.B. f¨ uhrt die Eingabe diff(sin(x*x),x$3); zur dritten Ableitung von sin(x2 ), also zu −8x3 cos(x2 ) − 12x sin(x2 ). • Taylor-Entwicklung: Hier hat man drei W¨ unsche frei: Die Funktion, die Entwicklungsstelle und die Ordnung des Taylorpolynoms; f¨ ur die Ordnung n muss dabei n + 1 vorgegeben werden. Gibt man z.B. series(sqrt(1+x),x=0, 5); √ ein, so wird das vierte Taylorpolynom von 1 + x bei x = 0 ausgerechnet54) : 1 1 1 5 4 x . 1 + x − x2 + x3 − 2 8 16 128 • usw. Bei aller Hochachtung vor den Leistungen dieser Programme sollte man allerdings nicht vergessen, dass ihre Leistungen nur eher technische Aspekte betreffen. Computer k¨ onnen nicht beweisen, dass kompakte Teilmengen beschr¨ankt sind, dass jedes Polynom eine Nullstelle hat usw. Insbesondere k¨onnen sie Ihnen nicht das Verstehen abnehmen, Sie selber m¨ ussen die wesentlichen Konzepte der Analysis verinnerlichen. 54) F¨ ur diejenigen, die noch wenig Erfahrung mit Programmiersprachen haben: sqrt“ ist die ” g¨ angige Abk¨ urzung f¨ ur die squareroot“, die Quadratwurzel. ”
¨ ANHANGE
344
Mathematik und neue Medien Jemand, der mit Feder und Tinte schreibt, ist nicht mehr zeitgem¨aß. Genauso ist heute jeder im besten Fall r¨ uhrend altmodisch, der nicht in der Lage ist, die M¨ oglichkeiten auszunutzen, die sich durch die rasanten Entwicklungen im Bereich der neuen Medien er¨ offnen. • Kommunikation: Es wird von Ihnen heute erwartet, dass Sie einen email-Anschluss haben. Es gibt wirklich nichts Praktischeres, um kurze Informationen auszutauschen und sich – auch fast beliebig große – Dateien zu schicken. • Information: Wollen Sie wissen, was der Mathematiker XXX zum Thema YYY geschrieben hat? Brauchen Sie pl¨otzlich ganz dringend die Definition einer quasizyklischen Hypergruppe? Nichts leichter als das, eine gute Suchmaschine im Internet wird Ihnen das Gew¨ unschte in (Bruchteilen von) Sekunden liefern. Der Autor hat sehr gute Erfahrungen mit Google gemacht. Nat¨ urlich k¨ onnte man zu diesem Thema noch viel mehr sagen: Im Internet findet man Formelsammlungen, Manuals, mathematische Konstanten, Facharbeiten, allgemeine Informationen und und und. Vielleicht schauen Sie auch hin und wieder in www.mathematik.de vorbei – eine Internetseite, die vom Autor dieses Buches betreut wird –, um sich auf allgemeinverst¨ andlichem Niveau u ¨ ber aktuelle Entwicklungen in der Mathematik zu informieren, sich Buchtipps geben zu lassen, zu interessanten Links rund um die Mathematik weiter vermittelt zu werden usw. • Pr¨ asentation: Ja, es stimmt: Es gab einmal eine Zeit, in der es ausreichte, sich mit einem St¨ uck Kreide an eine Tafel zu stellen und dann einen Vortrag zu halten. Auch heute ist das f¨ ur viele Vorlesungen noch die optimale Art der Pr¨ asentation. F¨ ur Einzelvortr¨age in Seminaren und auf Konferenzen wird das im Laufe der Zeit immer mehr zu den Ausnahmen z¨ ahlen, schon heute geh¨ ort es zunehmend zum Standard, dass man auch in der Darstellung seiner Ergebnisse auf der H¨ohe der Zeit ist. Der Grund liegt darin, dass man von der Qualit¨at des Angebots in Fernsehen, Kino und Werbung so verw¨ ohnt ist, dass man sich bei Fachvortr¨agen nur schwer an ein deutlich niedrigeres Niveau gew¨ohnen kann. Und das heißt: Verwenden Sie in Seminaren und bei sp¨ateren Gelegenheiten gut geschriebene Folien, eventuell auch aufw¨andigere Pr¨asentationsm¨ oglichkeiten (z.B. Powerpoint), setzen Sie Computersimulationen ein, geben Sie Hinweise auf weiterf¨ uhrende Links im Internet usw. Ich empfehle Ihnen, sich so schnell wie m¨oglich mit den aktuellen M¨oglichkeiten vertraut zu machen und sie einzusetzen. Je fr¨ uher Sie LATEX (zum ¨ Schreiben mathematischer Texte), Maple (oder etwas Ahnliches, als Rechenhilfe), Powerpoint (oder etwas Vergleichbares, zur Pr¨asentation) lernen, umso besser.
¨ ANHANGE
345
Die Internetseite zum Buch Hier wollen wir kurz vorstellen, was Sie von der speziell zu diesem Buch eingerichteten Internetseite http://www.math.fu-berlin.de/~behrends/analysis erwarten k¨ onnen. Die wichtigsten Unterseiten werden die folgenden sein: • Antworten auf die Verst¨andnisfragen: F¨ ur die Antworten auf die Sachfragen brauchen Sie ja nur dieses Buch aufmerksam zu lesen. ¨ • L¨ osungen der Ubungsaufgaben: Wir wollen einige Musterl¨osungen zu den verschiedenen, hier behandelten Themen vorbereiten. Das wird gerade am Anfang sinnvoll sein, wenn Sie noch nicht absch¨atzen k¨onnen, ob Ihre eigene L¨ osung des Problems wirklich eine ist. • Es soll auch eine Gelegenheit geben, mit uns Kontakt aufzunehmen: Haben Sie einen Tippfehler gefunden, ist vielleicht sogar Ihrer Meinung nach ein Beweis nicht korrekt? Fehlt etwas, haben Sie ein Verst¨andnisproblem? Dann schicken Sie uns doch einfach eine e-Mail. • Schließlich wollen wir uns noch kurz vorstellen. Damit Sie wissen, wer sich f¨ ur die Herausgabe eines f¨ ur Anf¨ anger hoffentlich wirklich geeigneten Lehrbuchs zur Analysis intensiv engagiert hat.
¨ ANHANGE
346
Griechische Symbole In der Mathematik werden fast alle griechischen Buchstaben ben¨otigt, mit den 26 Buchstaben unseres eigenen Alphabets kommt man nicht aus. Manche ha¨ ben nach einer stillschweigenden Ubereinkunft eine besondere Bedeutung, das erm¨ oglicht oft ein schnelleres Erfassen einer Aussage. In diesem Buch wurde zum Beispiel das ε“ nur in einem ganz speziellen Zusammenhang verwendet, ” niemand k¨ ame auf die Idee, damit etwa eine nat¨ urliche Zahl zu bezeichnen. Nachstehend finden Sie eine vollst¨andige Tabelle: Alpha Beta Gamma Delta Epsilon Zeta Eta Theta Iota Kappa Lambda My Ny Xi Omikron Pi Rho Sigma Tau Ypsilon Phi Chi Psi Omega
A B Γ ∆ E Z H Θ I K Λ M N Ξ O Π P Σ T Y Φ X Ψ Ω
α β γ δ ε ζ η ϑ ι κ λ µ ν ξ o π ρ σ τ υ φ χ ψ ω
¨ ANHANGE
347
L¨ osungen zu den ?“ ” Zum ?“ von Seite 10 : Weil die Zahl 1 der links stehenden Menge nicht zur rechten ” geh¨ ort. Zum ?“ von Seite 12 : ” {Bundesligaspieler} ∩ {deutsche Staatsb¨ urger} {Studenten an der HU} ∪ {Studenten an der FU} {Nachname M¨ uller} \ {Vorname Klaus} Zum ?“ von Seite 15 : Nur Bild 4 geh¨ ort zu einer Abbildungsrelation. ” Zum ?“ von Seite 15 : Falls jede senkrechte Gerade R genau einmal schneidet, ” handelt es sich um eine Abbildungsrelation. Zum ?“ von Seite 17 : Z.B. ist 3 ∈ N und 4 ∈ N , aber 3−4 geh¨ ort nicht zu N . ” Zum ?“ von Seite 18 : Diese Kompositionen haben die folgenden Eigenschaften ” • ◦ : (x, y) → 0 auf Znaiv : – Es existiert kein neutrales Element, denn z.B. f¨ ur 1 ∈ Znaiv existiert kein ur alle x ∈ Znaiv . Daher k¨ onnen auch x ∈ Znaiv mit 1 ◦ x = 1, da 1 ◦ x = 0 f¨ keine inversen Elemente existieren. – ◦ ist kommutativ, da x ◦ y = 0 = y ◦ x f¨ ur alle x, y ∈ Znaiv gilt. – ◦ ist assoziativ, da (x ◦ y) ◦ z = 0 = x ◦ (y ◦ z) f¨ ur alle x, y, z ∈ Znaiv gilt. • (x, y) → x − y auf Znaiv : – Es existiert kein neutrales Element, denn falls eins existieren sollte, so m¨ usste wegen x − e = x folgen: e = 0. Es ist aber e − x = 0 − x = −x = x f¨ ur alle x ∈ Znaiv \ {0}. Daher existiert kein neutrales Element, und dementsprechend gibt es auch keine Inversen. – Die Komposition ist nicht kommutativ, denn es ist z.B. 2 − 1 = 1 = −1 = 1 − 2. – Assoziativit¨ at liegt ebenfalls nicht vor, denn es ist z.B. (3 − 2) − 1 = 0 = 2 = 3 − (2 − 1). • (m, n) → mn auf Nnaiv : ur alle m ∈ Nnaiv und somit – W¨ are e neutral, so m¨ usste gelten: me = m f¨ m ur alle m = 1. e = 1. Es ist aber e = 1m = m f¨ Somit gibt es kein neutrales Element und auch keine Inversen. – Dass Kommutativ- und Assoziativgesetz ebenfalls nicht gelten, kann durch Gegenbeispiele leicht begr¨ undet werden: 3 21 = 2 = 1 = 12 , und (21 )3 = 8 = 2 = 2(1 ) .
¨ ANHANGE
348 Zum ?“ von Seite 18 : Seien A, B, C ∈ P(M ). ” • Wir rechnen so: (A ∪ B) ∪ C
somit ist ∪ assoziativ
=
{x ∈ M | x ∈ A ∨ x ∈ B} ∪ {x ∈ M | x ∈ C}
=
{x ∈ M | x ∈ A ∨ x ∈ B ∨ x ∈ C}
=
{x ∈ M | x ∈ A} ∪ {x ∈ M | x ∈ B ∨ x ∈ C}
=
A ∪ (B ∪ C);
55)
, Kommutativit¨ at ist genauso leicht zu begr¨ unden.
• A ∪ ∅ = {x ∈ M | x ∈ A ∨ x ∈ ∅} = {x ∈ M | x ∈ A} = A ∅ ∪ A = {x ∈ M | x ∈ ∅ ∨ x ∈ A} = {x ∈ M | x ∈ A} = A. Folglich ist ∅ neutrales Element. • ∅ ist invers zu sich selbst, da ∅ ∪ ∅ = ∅. Kein anderes Element der Potenzmenge hat aber ein Inverses, denn f¨ ur eine nicht leere Menge kann die Vereinigung mit einer anderen niemals die leere Menge ergeben. Zum ?“ von Seite 19 : Seien A, B, C ∈ P(M ). ” • Kommutativit¨ at und Assoziativit¨ at von ∩“ ergeben sich wie im vorstehenden ” Fall der Vereinigung. • Wegen A ∩ M = A = M ∩ A ist M neutrales Element. • M ist invers zu sich selbst. Gibt es echte Teilmengen N von M , so k¨ onnen die wegen N ∩ K ⊂ N = M kein inverses Element K haben. Zum ?“ von Seite 20 : Seien f, g, h ∈ Abb(M, M ): ” • Zum Assoziativgesetz: (f ◦ g) ◦ h (x) = (f ◦ g) h(x) = f g(h(x)) = f (g ◦ h)(x) = f ◦ (g ◦ h) (x). • Die so genannte identische Abbildung I : M → M, x → x ist Einheit, denn (I ◦ f )(x) = I f (x) = f (x) = f I(x) = (f ◦ I)(x). • Enth¨ alt M mindestens zwei Elemente a und b, so ist ◦ nicht kommutativ. Als Gegenbeispiel betrachten wir die konstanten Abbildungen f : x → a, g : x → b. Es ist dann f ◦ g (bzw. g ◦ f ) die konstante Abbildung a (bzw. die konstante Abbildung b). Folglich ist f ◦ g = g ◦ f . • M enthalte wieder mindestens zwei Elemente, f sei wie vorstehend definiert. Ist dann h eine beliebige Abbildung von M nach M , so ist f ◦ h = f = I. Also hat f kein Inverses. Zum ?“ von Seite 27 : Aus 1 + 1 = 0 folgt, dass 1 zu sich selbst invers ist. Also ” darf man in diesem K¨ orper 1 = −1 schreiben. Und 5 ist die Abk¨ urzung f¨ ur 1+1+1+1+1, wegen 1+1 = 0 stimmt 5 mit 3 := 1+1+1 u ¨ berein. 55) Wir haben dabei stillschweigend von der Tatsache Gebrauch gemacht, dass f¨ ur das logische oder“ das Assoziativgesetz gilt. Streng begr¨ unden kann man das erst nach dem logischen ” Exkurs, der etwas sp¨ ater in diesem Abschnitt folgt. Der Nachweis ist dann aber mit Wahrheitstafeln leicht zu f¨ uhren. F¨ ur die Kommutativit¨ at von ∪“ wird die Kommutativit¨ at des logischen oder“ ben¨ otigt. ” ”
¨ ANHANGE
349
Zum ?“ von Seite 31 : (−x)(−y) = (−1)x(−1)y = (−1)(−1)xy = xy. ” Zum ?“ von Seite 33 : ” • P = ∅ im K¨ orper {0, 1} ist kein Positivbereich, denn f¨ ur x = 1 gilt x ∈ / P und −x ∈ / P. • P = {1} in {0, 1} ist kein Positivbereich, denn 1 und −1 = 1 sind in P . • P = {x | x ≥ 1} in Q naiv ist kein Positivbereich, denn z.B. f¨ ur x = 1/2 gilt: x∈ / P und −x ∈ / P. ur x = 1/2, • P = {x | x < 1} in Q naiv ist kein Positivbereich, denn es gilt z.B. f¨ dass x ∈ P und −x ∈ P . ur x = 1 gilt x ∈ P und • P = Q naiv in Q naiv ist kein Positivbereich, denn z.B. f¨ −x ∈ P . Zum ?“ von Seite 36 : Sei p Primzahl. Dann gilt −1 = p − 1 im Restklassenk¨ orper ” modulo p. Also ist −1 die Summe von p − 1 Quadraten: −1 = 12 + 12 + . . . + 12 . Zum ?“ von Seite 38 : M = {0}. ” Zum ?“ von Seite 38 : M = ∅. ” Zum ?“ von Seite 38 : (Beispiele zu induktiven Teilmengen) ” • {x | x ≥ 1} enth¨ alt die 1 und zu jedem x auch x+1. Die Menge ist also induktiv. • Z naiv ist ebenfalls induktiv, da 1 eine ganze Zahl ist und die Addition von 1 aus uhrt. Z naiv nicht heraus f¨ • {1} : 1 ∈ {1}, aber 2 = 1 + 1 ∈ / {1}. Also ist {1} nicht induktiv. • { 12 + n | n ∈ N naiv } ist ebenfalls nicht induktiv. Diesmal ist die erste Bedingung nicht erf¨ ullt. Zum ?“ von Seite 40 : Man sollte das Produkt so definieren: ” n dann n+1 k=1 xk := ( k=1 xk ) · xn+1 .
1 k=1
xk := x1 , und
Zum ?“ von Seite 92 : ” Alle diese Folgen sind Teilfolgen von (1, 1, −1, −1, 1, 1, −1, −1, . . .). Zum ?“ von Seite 96 : Am einfachsten ist der erste Fall: Man muss nur beachten, ” dass Produkte positiver Elemente positiv sind und dass f¨ ur positive Zahlen a die Gleichung a = |a| gilt. Bei den Gleichungen 2 und 3 spielt noch die Identit¨ at (−x)y = −xy eine Rolle, die im vorigen Abschnitt bewiesen wurde. Zum ?“ von Seite 107 : Sei x vorgegeben. Ist x ≤ 0, so wird x durch 1 majorisiert, es ” bleibt, den Fall x > 0 zu behandeln. Dann ist aber 1/x > 0, wegen der vorausgesetzten Konvergenz 1/n → 0 gibt es also ein n mit 1/n ≤ 1/x, und das kann man als x ≤ n umschreiben. Zum ?“ von Seite 109 : ” • 1/2n → 0. Zum Beweis w¨ ahle man ein n0 mit 2/ε < n0 . √ alt so 1/n20 ≤ ε. • 1/n2 → 0. Man startet mit 1/ ε < n0 und erh¨
¨ ANHANGE
350
Zum ?“ von Seite 110 : Man w¨ ahle ε = 1/1001. ” Zum ?“ von Seite 110 : Die Folgen, die von einem Index an Null werden. ” Zum ?“ von Seite 119 : Der Fall n = 1 ist klar. Ist die Ungleichung schon f¨ ur n ” gezeigt, gilt also die Ungleichung (1 + x)n ≥ 1 + nx, so nehme man diese Ungleichung mit (1 + x) mal. Die Ungleichung bleibt erhalten, da 1 + x ≥ 0. Auf der linken Seite ergibt sich (1 + x)n+1 , auf der rechten (1 + nx)(1 + x), und das ist ≥ 1 + (n + 1)x. Zum ?“ von Seite 125 : Genau dann, wenn M h¨ ochstens ein Element hat. (Wenn ” es zwei verschiedene Elemente x, y gibt, ist die zweite Bedingung verletzt.) Zum ?“ von Seite 126 : Man zeige : B ∪ C ist Supremum von A. ” 1. B ⊂ B ∪ C, C ⊂ B ∪ C ⇒ B ∪ C ist obere Schranke von A. 2. Falls D eine obere Schranke von A ist, gilt B ⊂ D und C ⊂ D. Somit ist auch B ∪ C ⊂ D. Es folgt: B ∪ C ist Supremum von A. F¨ ur das Infimum kann die Begr¨ undung analog gegeben werden. Zum ?“ von Seite 128 : Wegen des Archimedesaxioms. ” Zum ?“ von Seite 134 : Sei an = (1, −1, 1, −1, . . .). ” Dann gilt f¨ ur die Partialsummen: n
ak k=0
=
1 0
falls n gerade falls n ungerade.
Diese Folge ist nicht konvergent, und deswegen existiert
∞ k=0
ak nicht.
Zum ?“ von Seite 142 : Mal angenommen, die Partialsummen der negativen Rei” henglieder sind beschr¨ ankt und die der positiven unbeschr¨ ankt. Dann werden die Partialsummen der Ausgangsreihe beliebig groß, Konvergenz kann also nicht vorliegen. Zum ?“ von Seite 152 : F¨ ur jedes ∆ ist m∈∆ am ≤ m∈∆ bm . Diese Ungleichung ” ¨ gilt dann auch, wenn das Supremum u ¨ber alle ∆ gebildet wird; vgl. Ubungsaufgabe 2.3.1(d). Zum ?“ von Seite 155 : Nahe liegender Kandidat zum Nachweis der ersten Be” hauptung ist die Folge (1/n). Dass das eine Nullfolge ist, setzt das Archimedesaxiom voraus. F¨ ur die zweite Behauptung betrachte man die Folge (n). Wieder kommt das Archimedesaxiom ins Spiel, denn wie soll man sonst nachweisen, dass sie nicht beschr¨ ankt ist? Zum ?“ von Seite 156 : F¨ ur die echte Inklusion ist an die harmonische Reihe zu ” erinnern, die Linearit¨ at der Summation steht in Satz 2.4.2(i), (ii). Zum ?“ von Seite 169 : Die ersten beiden Bedingungen sind offensichtlich erf¨ ullt. ” F¨ ur die dritte beachte man, dass es nur dann Schwierigkeiten geben kann, wenn die rechte Seite Null ist (sonst ist sie immer ≥ 1). In diesem Fall aber muss x = y und y = z gelten, d.h. x = z. Die Ungleichung ist also auch dann erf¨ ullt. Zum ?“ von Seite 171 : Sicherlich gilt d(P, Q) ≥ 0, und d(P, Q) = 0 stimmt genau ” dann, wenn P = Q. Es muss aber d(P, Q) = d(Q, P ) nicht unbedingt erf¨ ullt sein, man denke an Einbahnstraßen oder Staus in nur einer Richtung.
¨ ANHANGE
351
Zum ?“ von Seite 171 : F¨ ur alle Telefonnummern P , die sich nur bei einer Zahl, ” und da um genau eins unterscheiden, gilt d(P0 , P ) = 1. Die Konsequenz: Es werden ahlen. sich viele verw¨ ahlen und P statt P0 w¨ Zum ?“ von Seite 172 : Sei (xn )n∈N eine Folge mit Grenzwert x0 und d die diskrete ” Metrik. Man w¨ ahle ε = 1/2. Da (xn ) konvergent ist, gilt: ∃n0 ∈ N ∀n ≥ n0 d(x0 , xn ) ≤ 1/2. F¨ ur die n ≥ n0 ist dann xn = x0 , denn in der diskreten Metrik folgt aus d(x, y) < 1, dass x = y ist. Zum ?“ von Seite 174 : Die L¨ osungen: ” • K3 (0.5) = {x ∈ R | 0 < x ≤ 3.5}. • K0.2 (x0 ) = {x0 }, K222222222 (x0 ) = M . • Da i ∈ R , ergibt die Kugel um i keinen Sinn. • K0 (x0 ) = {x0 }. • In der leeren Menge gibt es keine Kugeln (da keine Mittelpunkte zu finden sind). • Das stimmt genau dann, wenn die Menge einelementig ist. • Der Grund: F¨ ur eine Zahl a ist genau dann a ≤ rn f¨ ur alle n, wenn a ≤ r gilt. b−a b−a und x0 = ist ] a, b [ die offene Kugel Zum ?“ von Seite 178 : F¨ ur r = ” 2 2 um x0 mit dem Radius r und somit offen. [ a, b ] ist die abgeschlossene Kugel Kr (x0 ). Zum ?“ von Seite 178 : ] a, b ] ist nicht offen, denn es existiert kein r > 0 mit ” Kr (b) ⊂ ] a, b ]. Das Intervall ] a, b ] ist auch nicht abgeschlossen, da es kein r > 0 mit Kr (a) ⊂ R \ ] a, b ] gibt. Bei [ a, b [ verf¨ ahrt man analog. Zum ?“ von Seite 178 : Die leere Menge ist offen, denn man muss eine f¨ ur alle ” ” gilt“-Aussage beweisen, die f¨ ur die leere Menge bekanntlich immer wahr ist. Damit ist auch klar, dass M = M \ ∅ abgeschlossen ist. ur alle m ∈ M . Es folgt auch, dass M ist offen, denn f¨ ur ε > 0 ist Kε (m) ⊂ M f¨ ∅ = M \ M abgeschlossen ist. Sei A ⊂ M (versehen mit der diskreten Metrik). Dann gilt f¨ ur ε = 1/2, dass Kε (a) (das ist die Menge {a} ⊂ A) f¨ ur alle a ∈ A ist. Somit ist A offen. F¨ ur B = M \ A gilt das Gleiche, und folglich ist A abgeschlossen. Zum ?“ von Seite 178 : ] 0, +∞ [ \ ] 0, 1 ] = ] 1, +∞ [ ist offen, und daher ist ] 0, 1 ] ” abgeschlossen in ] 0, +∞ [. In ] 0, 1 ] ist ] 0, 1 ] die gesamte Menge und daher offen. Zum ?“ von Seite 178 : Da zwischen je zwei reellen Zahlen eine rationale Zahl ” liegt und es irrationale Zahlen gibt, kann R \ Q nicht offen sein. Daher ist Q nicht abgeschlossen. Und da zwischen je zwei rationalen Zahlen eine irrationale Zahl liegt, ist Q auch nicht offen. (Also: Keine Kugel mit positivem Radius liegt ganz in R \ Q oder in Q .) Zum ?“ von Seite 183 : Es ist [ 0, 1 [− = [ 0, 1 ]: Das Intervall [ 0, 1 ] ist abgeschlossen, ” und 1 muss auch zum Abschluss geh¨ oren, da jede ε-Kugel in [ 0, 1 [ hineinschneidet. Es ist Q ◦ = ∅, da zwischen je zwei rationalen Zahlen eine irrationale liegt. Dass Q − = R ist, folgt sofort aus dem Dichtheitssatz.
¨ ANHANGE
352
Zum ?“ von Seite 186 : Der Rand der leeren Menge ist die leere Menge, und der ” Rand von Q ist gleich R (wegen Q − = R und der Tatsache, dass R offen ist). Zum ?“ von Seite 187 : Da bei einer Folge in einer endlichen Menge ein Element ” unendlich oft vorkommen muss, braucht S2 nur diese Wiederholungen als Teilfolge zu nehmen. F¨ ur das Q -Beispiel kann er etwa die Folge (n) w¨ ahlen. Zum ?“ von Seite 191 : R, Q und N sind nicht kompakt, da sie insbesondere nicht ” beschr¨ ankt sind. Die Mengen [ 0, 1 ] ∪ {3} und {1/n | n ∈ N} ∪ {0} sind dagegen kompakt, da sie beschr¨ ankt und abgeschlossen sind. Zum ?“ von Seite 202 : Mit ε = 1/2 klappt es. ” Zum ?“ von Seite 204 : Sei f (0) als a definiert. Wir geben ε := 1 vor und betrachten ” ein δ > 0. F¨ ur geeigente x mit |x| < δ ist dann |a−1/x| > ε: Man braucht nur 0 < x < δ mit x < 1/(|a| + 1) zu w¨ ahlen. Also ist f nicht stetig bei 0. Zum ?“ von Seite 214 : Ein extremes Beispiel sind konstante Funktionen, da gibt ” es besonders viele x0 -Werte. Und Stetigkeit ist wesentlich: Ist f bei a gleich −1 und sonst u ur die Annahme der Zwischenwerte. ¨ berall gleich +1, so fehlen x-Werte f¨ Zum ?“ von Seite 218 : F¨ ur die konstante Funktionen gibt es viele Maxima und ” Minima. Und die identische Abbildung auf R hat weder Maxima noch Minima. Zum ?“ von Seite 248 : Man betrachte die folgenden, auf [ 0, 1 ] definierten Funk” tionen: a) f (x) = x f¨ ur x < 1 und f (1) = 0. b) f (x) = x f¨ ur alle x. c) f (x) = x f¨ ur x ≤ 1/2 und f (x) = 1 − x f¨ ur x ≥ 1/2. Zum ?“ von Seite 249 : Bei zweimaliger Anwendung des ersten Mittelwertsatzes ” ur g und f das gleiche ist nicht garantiert, dass das vom Mittelwertsatz produzierte x0 f¨ ist. Zum ?“ von Seite 260 : Da die Funktion 1/x, egal, wie man sie bei 0 erg¨ anzt, auf ” [ −1, 1 ] unbeschr¨ ankt ist. Polynome haben aber aus Stetigkeitsgr¨ unden diese Eigenschaft. Zum ?“ von Seite 276 : Das Supremum existiert, da R vollst¨ andig ist. Die zweite ” Bedingung folgt daraus, dass das Supremum insbesondere eine obere Schranke ist. Die dritte wird indirekt bewiesen: W¨ are die Aussage falsch, w¨ are b eine bessere Schranke als sup A. Zum ?“ von Seite 278 : Da bei Folgen, in denen nur endlich viele Elemente vor” kommen, auch nur diese als H¨ aufungspunkte in Frage kommen. Zum ?“ von Seite 279 : Da bei dieser Definition die Ordnung eine wesentliche ” Rolle spielte. Zum ?“ von Seite 287 : ” ∞
zn
∞
=
n=1
nz n−1
∞
n=1
1 1−z
=
n(n − 1)z n−2 .
= n=1
1 (1 − z)2
=
2 . (1 − z)3
¨ ANHANGE
353
Man erh¨ alt so die Formel ∞ n=1
n(n − 1)z n−2 =
2 . (1 − z)3
355
Register N naiv 4 Z naiv 4 Q naiv 4 R naiv 4 {..} 7 {.. | ...} 8 ∅ 9, 127 ∈9 ∈ /9 ∪9 ∩ 10 ⊂ 10 \ 10 = (f¨ ur Mengen) 10 ⊆ 11 11 P(M ) 11 M × N 11 → 13 → 13 ∧ (logisches und) 21 ∨ (logisches oder) 21 ¬ (Negation) 22 ⇒ (folgt) 22 ¨ ⇔ (Aquivalenz) 23 25 0 25 1 25 −x 25 x−1 25 {0, 1} (als K¨ orper) 26 P (Positivbereich) 33 x < y 33 x ≤ y 33 x > y 34 x ≥ y 34 N 37, 38 37 n! 39 xn 39 39 40 Z 48
Q 49 R 58 C 58 i 60 Re z 60 Im z 60 z 61 f −1 63 card(M ) 65 ¨ π (Aquivalenzrelation) 69 π (Zahl) 87, 309 (an ) 89 Abb(R , R ) 90 |x| 94 √ a 101 |z| 103 K 105 ∀ 106 ∃ 106 lim an 107, 111 ∞ 107 ≺ 124 | (teilt) 124 sup, inf 126 ggT, kgV 126 ∞ n=0 133 m∈M 152 s 154 c00 154 c0 154 c 154 ∞ 154 1 155 C - lim 157 d(x, y) 168 (M, d) 168 || · || 169 Km 170 || · ||1 170 || · ||2 170 || · ||∞ 170 max 170 Kr (x0 ) 173
REGISTER
356 [ a, b ] usw. 177 [ a, +∞ [ usw. 177 O 180 A 180 A◦ 183 A− 183 ∂A 186 (xnk ) 187 +∞ 195 −∞ 195 ˆ 195 R f −1 (A) 207 √ n a 214 a1/n 214 f (A) 216 lim g(x) 232 x→x 0
x=x0 f (x0 )
235 f 235 dy/dx 237 f | |[ a,c ] 251 0/0 254 ∞/∞ 255 f 262 f (n) 262 Pn (x) 263 Rn (x) 265 Da 273 fa 273 0! = 00 = 1 274 Ra 275 lim sup, lim inf 278 lim, lim 278 exp 296 log 298 ax 301 ln 302 loga 302 e 297, 304 sin, cos 306 π 309 tan 313 cot 313 arcsin 314 arccos 314 arctan 314 0 = 1 + eiπ 317
Abbildung 13 – identische 204 – inverse 63 – lineare 155 – Lipschitz- 205 Abbildungsrelation 15 Abbildungsverkn¨ upfung 19 abbrechende Folge 133, 106, 154 abgeschlossen 175 abgeschlossene H¨ ulle 183 Ableitung 235 – inverser Funktionen 244 Abschluss 183 absolut konvergent 142 abz¨ ahlbar 65 ¨ Aquivalenz 23 ¨ Aquivalenzrelation 69 algebraische Zahl 324 angeordneter K¨ orper 33 antisymmetrisch 124 Approximationssatz 262 Archimedesaxiom 53 archimedisch geordnet 53 Arcus-Funktionen 314 assoziativ 17 Axiom 4 Bernoulli-Ungleichung 118 beschr¨ ankt 114 Betrag 94, 103 Beweis 18 – indirekter 22 bijektiv 63 Bolzano-Weierstraß 191 Cantor 6 Cantorsche Diagonalverfahren 67, 68 Cauchy 120 Cauchy-Folge 120, 172 Cauchy-Kriterium 136 Ces` aro-Limes 158 charakteristisches Polynom 330 Cosinus 306 Cotangens 313 Dedekind 56 Dedekindscher Schnitt 56 dekadischer Logarithmus 303 Dezimalentwicklung 148 Diagonalverfahren 67 dicht 185
REGISTER Dichtheitssatz 55 Differentialgleichung 325 – mit getrennten Ver¨ anderlichen 328 – lineare 329 Differentialquotient 237 Differenzenquotient 231 differenzierbar 235 – stetig d. 334 disjunkt 10, 69 disjunkte Vereinigung 10 diskrete Metrik 169 Distributivgesetz 25 divergent 110, 133, 197 Dreiecksungleichung 95, 103, 168 Dualentwicklung 152 Durchschnitt 10, 37 Dvoretzky-Rogers 145 Einheit 17 Element 9 endlich 66 Entwickelbarkeit 288 Epsilon 54 Eudoxos 53 Euler 317 Eulersche Formel 315 Exponentialansatz 330 Exponentialfunktion 296 externe Eigenschaft 188 Extremwert 270 fastkonstant 172 Folge 89 – abbrechende 106, 133, 154 – beschr¨ ankte 114 – fastkonstante 172 folgt 22 Fundamentalsatz 320 Funktion 13 ganze Zahlen 48 Gauß 62 genau dann 23 geometrische Reihe 134 geordneter Raum 124 geordnetes Paar 11 ggT 126 Gleichheit 72 gleichm¨ achtig 65 gleichm¨ aßig stetig 219
357 globale Eigenschaft 204 Grad eines Polynoms 260 H¨ aufungspunkt 277 halboffen 178 harmonische Reihe 135 hinreichend 23 l’Hˆ opital 252 l’Hˆ opitalsche Regeln 254, 255 Ideal 156 Identit¨ atssatz 287 Imagin¨ arteil 60 Implikation 22 indirekter Beweis 22 Induktion, vollst¨ andige 39 Induktionsanfang 41 Induktionsschluss 41 Induktionsvoraussetzung 41 induktiv 38 induzierte Metrik 168 Infimum 125 injektiv 63 innere Komposition 16 Inneres einer Menge 183 interne Eigenschaft 188 Intervall 129, 177 Intervallschachtelung 129 invers 17 inverse Abbildung 63 irrational 50 isomorph 72 Isomorphismus 72 Kardinalzahl 65, 66 kartesisches Produkt 11 Kettenregel 239 kgV 126 Koeffizient 260 K¨ orper 25 – angeordneter 33 kommutativ 17 kompakt 187 Kompaktheitsspiel 187 Komplement 10 Komplement¨ armenge 10 komplexe Zahlen 58 Komposition, innere 16 konjugiert komplexe Zahl 61 konstruktiver Weg 69
REGISTER
358 Kontraposition 22 konvergent 110, 171 – absolut 142 – unbedingt 144 – uneigentlich 197 Konvergenzkriterien 148 Konvergenzradius 275 Kugel 173 leere Menge 9, 127 Leibniz 138 Leibniz-Kriterium 138 Limes 107 – inferior 278 – superior 278 – verallgemeinerter 157 lineare Abbildung 155 Lipschitzabbildung 205 Logarithmus 298 – dekadischer 303 – nat¨ urlicher 302 Logik 20 lokale Eigenschaft 204 lokal entwickelbar 288 lokales Maximum 270 lokales Minimum 270 Majorantenkriterium 115, 119 Maximum, Satz vom 217 Menge 6 – leere 9, 127 Mengenklammern 7 Metrik 168 – diskrete 169 – induzierte 168 metrischer Raum 168 Minimum 217 Mittelwertsatz 248 – erster 248 – zweiter 248 modulo 27 monoton 92 – fallend 132 – steigend 132 Multiplikationssatz 145 nat¨ urliche Zahlen 37, 38 neutral 17 Newton 238 Newtonverfahren 268
nicht, logisches 22 nonstandard Analysis 76 Norm 169 – euklidische 170 notwendig 23 Nullfolge 105 nullteilerfrei 28 obere Schranke 125 oder, logisches 21 offen 175 offener Kern 183 Ordnungsrelation 124 Paar (geordnetes) 11 Partialsumme 133 Peano 69 Peano-Axiome 69 Pi 87, 309 Polardarstellung 318 Polynom 212, 260 positiv 33 Positivbereich 33 Potenz 39 – allgemeine 300 Potenzmenge 11 Potenzreihe 273 Produkt(menge) 11 Produktregel 239 Produktzeichen 40 Quantoren 106 Quotientenkriterium 138 Quotientenregel 239 Rand 186 rationale Funktion 212 rationale Zahlen 49 Realteil 60 reelle Zahlen 58 reflexiv 69, 124 Reihe 133 – geometrische 134 – harmonische 135 Relation 15 Restglied 265 Restgliedformel 265 Restklassenk¨ orper 27 Ring 71 Ringschluss 136 Rolle 245
REGISTER Russell 75 Sattelpunkt 270 Satz vom Maximum 217 Satz von Rolle 245 Satz von Taylor 265 schiefsymmetrisch 287 Schnittzahl 56 Schranke 125 – obere 125 – untere 125 Schr¨ oder-Bernstein 67 separabel 186 Sinus 306 Stammfunktion 327 stetig 202 – differenzierbar 334 – erg¨ anzbar 233 – gleichm¨ aßig st. 219 Summenzeichen 39 Supremum 125, 276 surjektiv 63 symmetrisch 69, 287 Tangens 313 taufen 32 Taylor 263 Taylorpolynom 263 Taylorreihe 289 Teilfolge 92 Topologie 183 topologischer Raum 183 transitiv 69, 124 Translationsinvarianz 157 transzendente Zahlen 325 trivial 106 u ahlbar 65 ¨ berabz¨
359 Umgebung 204 Umordnung 93 unbedingt konvergent 144 und, logisches 21 uneigentlich konvergent 197 Unendlich 107, 177, 195 unendlich klein 237 ungeordnete Summation 152 untere Schranke 125 Urbildmenge 207 Vektorraum 153 verallgemeinerter Limes 157 Vereinigung 9 Vergleichskriterium 115, 136 vollst¨ andig 58, 129, 173 vollst¨ andige Induktion 39 Weierstraß 238 Widerspruchsfreiheit 74 wohldefiniert 14 wohlgeordnet 48 Wohlordnung 48 Wurzel 98, 101 Wurzelkriterium 138 Zahlen – algebraische 324 – ganze 48 – irrationale 50 – komplexe 58 – konjugiert komplexe 61 – nat¨ urliche 37, 38 – rationale 49 – reelle 58 – transzendente 325 Zweipunktkompaktifizierung 195 Zwischenwertsatz 213