This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
, 0 partiell differenzierbar und es gilt
dr
x·
-Cl (x) = _(') Xi rx
für x = (Xl, .. . ,xn )
# O.
Dies folgt daraus, dass die Funktion einer Variablen
~~ Jxi+ ... +~2+ ... +x~ differenzierbar ist. Mit der Kettenregel für Funktionen einer Veränderlichen erhält man (Xl, . . . , Xi-I, Xi+ 1, . .. ,Xn sind dabei als Konstanten zu betrachten)
dr _ ~
2
2
2 1/2
Clx, - Clx, (Xl+ ···+Xi+···+X;;)
_ !(Xl2 + ... + x;2 + ... + X;;2)-1/2. 2x,. -_
-
2
~. r
(5.3) Sei 1 : )R,+ ---+ )R eine beliebige differenzierbare Funktion. Dann ist die
§ 5 Partiel1e Ableitungen
55
zusammengesetzte Funktion x t-+ f(r(x)), die meist kurz mit f(r) bezeichnet wird, auf R" -, 0 definiert und dort partiell differenzierbar. Aus der Kettenregel für Funktionen einer Veränderlichen folgt
aaXi f(r) = I(r) aarXi =/(r):!.. r (5.4) Sei n
F(x)
~
=
2. Wir betrachten die wie folgt definierte Funktion F : IRn
{
->
IR
XlX2.. .. ·Xn für ~ 0 r(x)n x,
o für x = o. In IRn -, 0 ist F partiell differenzierbar, wie aus dem vorigen Beispiel und der Produktregel für Funktionen einer Veränderlichen folgt. Für die partielle Ableitung nach Xl berechnet man aF(x) _ -a-~ =
X2· .·· ·Xn ~
~
x2· · · · ·Xn r"
a (r-n)
+XIX2· ·· · ·Xn -a xIX2·. .. ·Xn -n rn+2
Die partiel1e Ableitung in i-ter Koordinatenrichtung ergibt sich daraus durch Vertauschen der Rollen von Xl und xi, da F völlig symmetrisch von Xl, .. . ,Xn abhängt. Die Funktion F ist aber auch an der Stelle X = 0 partiell differenzierbar mit
aF (0) = lim F(hei) - F(O) = 0 aXi
h->O
h
'
da F (hei) = 0 für alle h E IR. Daraus folgt, dass F in ganz IRn partiell differenzierbar ist. F ist aber im Nullpunkt nicht stetig. Betrachten wir etwa die Werte von F auf der gegen 0 konvergierenden Punktfolge
ak:=G, ...
,i),
k~1.
Es gilt r(ak) = Vii/k, also
F(a ) = (l/k)n =n-n/2 (unabhängigvonk). k (Vii/k)n Da limk->=F(ak)
= n-n/2 undF(O) = 0, istF im Nullpunkt nicht stetig.
I. Differentialrechnung im )Rn
56
Für Funktionen mehrerer Veränderlichen folgt also, im Gegensatz zum Fall n = 1, aus der partiellen Differenzierbarkeit nicht die Stetigkeit.
Bemerkung. Wir werden im nächsten Paragraphen eine Verallgemeinerung des Differenzierbarkeitsbegriffs auf Funktionen mehrerer Veränderlichen kennen lernen, welche die Stetigkeit nach sich zieht. Insbesondere wird sich ergeben (§ 6, Corollar zu Satz 2): Eine stetig partiell differenzierbare Funktion ist auch stetig.
Definition (Gradient). Sei U C )Rn offen und f zierbare Funktion. Dann heißt der Vektor gradf(x) =
: U -+ )R eine partiell differen-
af (x),.. ., aXaf (x)) (aXI n
der Gradient von f im Punkt x E U. Beispiele (5.5) Für die in Beispiel (5.2) definierte Funktion r gilt fiir x E )Rn X
gradr= - . r Der Vektor ~ hat den Betrag 1 und die Richtung x. Mit den Bezeichnungen von (5.3) gilt gradf(r) =
I
(r) ~,
zR
(5.6) Seien f,g: U -->)R zwei partiell differenzierbare Funktionen. Dann gilt die Produktregel grad(Jg) =g' gradf + f ·gradg. Dies folgt aus der Produktregel fiir Funktionen einer Veränderlichen, denn
a
er
ag
-a (Jg)=-a g+f - . ax, x, Xi Schreibweise. Statt gradf schreibt man auch Vf, gesprochen Nabla f. Man hat V als vektorwertigen Differentialoperator aufzufassen,
V=
(a:1,...,a:J·
57
§ 5 Partie11e Ableitungen
Definition. Sei U c Rn eine offene Teilmenge von Rn. Unter einem Vektorfeld auf U versteht man eine Abbildung
Jedem Punkt x E U wird also ein Vektor v(x) E Rn zugeordnet. Der Gradient VI einer partie11 differenzierbaren Funktion spezielles Vektorfeld. Definition (Divergenz). Sei U
v=
(VI,'''' V n)
I : U ---. R
ist ein
c Rn eine offene Menge und
: U -----+ Rn
ein partiell differenzierbares Vektorfeld (d.h. alle Komponenten seien partiell differenzierbar). Dann heißt die Funktion
Vi :
U ---. R
diIVV:= k ~ JaVii=1 aXi
die Divergenz 1 des Vektorfeldes v, Bemerkung. Formal kann man die Divergenz von V als Skalarprodukt des Differentialoperators V mit dem Vektor v schreiben,
divv = (V, v) =
n a L -a Vi· i=1 Xi
Die Produktregelliefert für die Divergenz die folgende Rechenregel: Auf einer offenen Menge U C JRn sei I : U ---. JR eine differenzierbare Funktion und
ein partiell differenzierbares Vektorfeld. Dann gilt
a
-(lVi) aXi
al
aVi
aXi
aXi
= -'Vi+ f--.
Summation über i ergibt div(/v)
=
(gradj", v) + Idivv.
1dies ist natürlich etwas ganz anderes als der Begriff Divergenz im Sinne von NichtKonvergenz
I. Differentialrechnung im JRn
58
Mit Hilfe des Nabla-Operators schreibt sich diese Formel folgendermaßen:
(V,fv) = (VT. v) + f(V, v) . (5.7) Beispiel. Wir betrachten das Vektorfeld F : JRn,O ~ JRn, Da divx =
f
~=
i=! ~I
F(x):=~,
n und (x,x) =
r=
Ilxll.
,:z, folgt mit (5.5)
x ) + -':= n -rn-l ' div x-,:= JR eine zweimal stetig differenzierbare Funktion. Wir betrachten die Wirkung des Laplace-Operators auf die rotationssymmetrische Funktion X t-t
Nach (5.5) gilt gradf(r) = I(r)~,
f(r),
r=
Ilxll.
§ 5 Partiel1e Ableitungen
63
also nach der Produktregel und (5.7)
/1f(r) = divgradf(r) =
div(/(r)~)
= (gradj" (r),~) +I (r) div~ =
(/'(r)~,~)+/(r)n-;l,
d.h.
/1f(r) = I'(r) + n -; l/(r). Daraus ergibt sich z.B,
1 / 1 -2 =0. ,.nInsbesondere für n = 3 ist also
~ eine Lösung der Potentialgleichung in IR3 ,,0.
Dies ist bis auf einen konstanten Faktor das sog. Newton-Potential mit einer Singularität im Nullpunkt, welches das Gravitationsfeld eines im Nullpunkt befindlichen Massenpunktes darstellt (und ebenso das elektrostatische Feld einer Punktladung im Nullpunkt). Speziell für n = 2 ergibt sich noch
Alog» = 0 in IR2 ,,0. Die Funktion logr ist das zweidimensionale Analogon des Newton-Potentials.
(5.10) Wir wollen zeigen, dass die Funktion F: (IR 3 ,,0) x IR ----> IR,
F( x,t ) ..= cos(r - ct ) , r
r =1111 x,
eine Lösung der Wellengleichung 2
at2 )
1 ( ( /1- c2
F(x,t)
=0
im dreidimensionalen Raum ist. (Natürlich gibt es noch viele andere Lösungen.) Nach der Formel in (5.9) gilt AF =
(~+ ~~) ar2
rar
cos(r-ct).
r
I. Differentialrechnung im )Rn
64 Nun ist
a cos(r -
a
2
a~
ct)
sin(r - ct)
cos(r - Cf)
r
~
r
~
cos(r - ct) _ r
cos(r - ct)
--
r
+
2 sin(r - ct) ~
+
2 cos(r - ct) ,.J ,
also d cos(r-ct) = _ cos(r-ct) .
r
r
Andrerseits ist
()2 cos(r - Cf) 2 cos(r - ct) at2 r = -c r ' woraus die Behauptung folgt.
Bemerkung. Genauso zeigt man, dass die Funktion sin(r - ct) der Wellengleir chung genügt. Wegen ei lp = coso-l- isincp kann man beide Funktionen zusammenfassen zu einer komplexwertigen Lösung der Wellengleichung :
(
d _ ~~) c2 at2
el{r-ct) = r
0.
Die komplexe Form lässt sich auch leicht direkt nachrechnen. AUFGABEN
5.1. Man untersuche, an welchen Stellen die Funktion f : R2
---.
R2 ,
(x,y)
f-+
yJ2x2
+r,
(einmal) partiell differenzierbar ist und berechne dort ihre partiellen Ableitungen. 5.2. Die Funktion F:)R2
---. )R
x2-1
F(x,y) := XJ'2----::2 x +y F(O,O) := 0.
sei definiert durch für (x,y)
-I (0,0),
Man zeige, dass F überall zweimal partiell differenzierbar ist, dass aber
65
§ 5 Partiel1e Ableitungen
5.3. Sei U C IR3 offen und v: U ---+ IR3 ein zweimal stetig partiell differenzierbares Vektorfeld. Man zeige, dass divrotv = O. 5.4. Sei U C IR3 offen und seien f,g: U ---+ IR zweimal stetig partiell differenzierbare Funktionen. Man beweise die Formel
!1(fg) =g!1f + 2(Vf, Vg) + fAg. 5.5. Man zeige : Die Funktion
F: IRn xIR~ ---+IR,
F(x,t):= t-n/2e-llxI12/4t,
ist eine Lösung der Wärmeleitungsgleichung AJ:'_ <M'
5.6. Sei c (J)
aF - 0
at - .
> 0, k E IRn und
:=
Ilkllc.
Weiter sei f: IR ---+ IR eine beliebige, zweimal stetig differenzierbare Funktion, Man zeige: Die Funktion
F : IRn x IR ---+ IR,
F(x, t) := f( (k,x) - rot)
ist eine Lösung der Wellengleichung
I a2F f1F- 2 - 2 =0. c at
66
§ 6 Totale Differenzierbarkeit In diesem Paragraphen definieren wir die totale Differenzierbarkeit von Abbildungen einer offenen Teilmenge des lR" in den R m als gewisse Approximierbarkeit durch lineare Abbildungen. Im Gegensatz zur partiellen Differenzierbarkeit braucht man sich dabei nicht auf die einzelnen Koordinaten zu beziehen; auch ist eine total differenzierbare Abbildung von selbst stetig. Ganz einfach aus der Definition lässt sich die Kettenregel für differenzierbare Abbildungen ableiten.
Definition. Sei U c JRn eine offene Menge und f: U --+ JRm eine Abbildung. heißt im Punkt x E U total differenzierbar (oder differenzierbar schlechthin)
f
falls es eine lineare Abbildung A : JRn -----> JRm
gibt, so dass in einer Umgebung von x gilt f(x+~) =f(x)+A~+cp(~),
wobei cp eine in einer Umgebung von 0 E JRn definierte Funktion mit Werten in JRm ist mit
.
cp(~)
~~m=O. Mit dem in An. 1, § 12, eingeführten Landau-Symbol 0 (das sich in naheli gender Weise auf die hier vorliegende höherdimensionale Situation überträgt), lässt sich die letzte Bedingung auch schreiben als cp(~)
= o(II~II)·
Bemerkungen. a) Für n = m = 1 liefert dies die übliche Definition der Differenzierbarkeit von Funktionen einer Veränderlichen (An. 1, § 15, Satz 1). b) Die lineare Abbildung A:JRn --+ JRm kann bzgl. der kanonischen Basen von JRn bzw. JRm durch eine m x n-Matrix
(aij) E M(m x n,JR),
(1 ~ i ~ m, 1 ~ j ~ n)
beschrieben werden. Fassen wir die Elemente von JRn bzw. JRm als Spaltenvektoren auf, so wird die Abbildung einfach durch Matrizen-Multiplikation von O. Forster, Analysis 2, DOI 10.1007/978-3-8348-8103-8_6, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
67
§ 6 Totale Differenzierbarkeit links gegeben, a ll
A~=
:
(
amI
Im Folgenden identifizieren wir die lineare Abbildung zt.R" _IRm mit der sie beschreibenden Matrix. Seien
die Komponenten-Darstellungen von chung (*) ausführlich als
f
n
und q>. Dann schreibt sich die Glei-
.fi(x+~) =.fi(x) + Lajj~j+q>j(~) ,
j=I
i= 1, .. . ,m.
Daran sieht man auch, dass die Abbildung f: U _IRm genau dann im Punkt x differenzierbar ist, wenn alle .fi: U -IR in x differenzierbar sind. (6.1) Beispiel. Sei C
= (Cjj)
E M(n x n,IR) eine symmetrische n x n-Matrix
und
f(x) := (x,Cx) =
n
L
j,j=I
CjjXjXj
die zugehörige quadratische Form f: IRn -IR. Für x, ~ E IRn gilt f(x+~)
=
(x+~,Cx+C~)
= (x,Cx) + (~,Cx) + (x,C~) + (~,C~) = (x,Cx) +2(Cx,~) + (~,C~) = f(x) + (a,~) +q>@. mit a := 2Cx und q>(~) = (~, C~). Da
11q>(~)11 gilt
:;;; II~II'IIC~II :;;; IICII'II~112,
~~ ~~~~ = O. Dies zeigt, dass f
in x differenzierbar ist.
68
I. Differentialrechnung im )Rn
Satz 1. Sei U C )Rn offen und f: U ---+ )Rm eine Abbildung, die im Punkt x E U differenzierbar ist, und zwar gelte f(x+~) = f(x) +A~+o(II~11)
mit der Matrix A = (aij) E M(m x n, JR). Dann gilt: a) f ist im Punkt x stetig. b) Alle Komponenten fi: U ---+ JR, I ~ i ~ m, von f sind in x partiell differenzierbarmit
afi -a'Xj
=aij'
Bemerkung. Aus b) folgt insbesondere, dass die Matrix A durch die differenzierbare Abbildung f eindeutig bestimmt ist. Man nennt A das Differential oder die Funktional-Matrix (oder auch Jacobi-Matrix) von f im Punkte x, Schreibweisen:
Die i-te Zeile der Funktional-Matrix ist der Gradient der Funktion fi : afi afi) ( aXt (x), ... , aX (x) n
= gradfi(x)
Für eine skalarwertige differenzierbare Funktion f: U ---+ JR ist also die Funktional-Matrix einfach der Gradient.
Beweis. a) Da limA~ = 0 und lim o(II~11) = 0, folgt l;--+O l;--+O limf(x+~) = f(x) ,
l;--+o
was zeigt, dass f in x stetig ist. b)Füri= l, . .. ,mist n
fi(x+~) =fi(x) + Laij~j+ 0, so dass
Ilcp(s) 11 ~ 111;11 für alle I; mit Ilsll < Ö. Wegen "'(Tl) = o(IITlII) gilt "'(Tl) = IITlII"'I(Tl) mit 11--->0 lim (Tl) = O.
"'1
Daraus folgt
II",(AS +cp(S)) 11 ~ (11All + l)llsll·II"'I(AS+cp(s))ll, also
. ",(AI; + cp(I;))
t~
111;11
= 0,
d.h.
x(l;) = 0(111;11),
q.e.d.
Corollar. SeienU C Rn undV C Rm offeneMengen, f :V -+ IR, x ~ f(x), eine
differenzierbare Funktion sowie
I. Differentialrechnung im )Rn
72
eine differenzierbare Abbildungmit IR die Komponenten vonf. Wir betrachten die Funktionen gi : [0, 1]
-----+
IR,
§ 6 Totale Differenzierbarkeit
75
Es gilt
.fi(x+~) =
.fi(x) =gi(l) -gi(O)
=
l ~(t)dt
a.fi 10 i.(x+t~)~j)dt= L( 10o (L-a 'X; 1
n
n
j=1
j=1
1
0
a.fi ~(x+t~)dt)~j . X;
Da Df die Matrix mit den Koeffizienten dXj oft ist, folgt die Behauptung.
Corollar. Die Bezeichnungen von Satz 5 seien beibehalten. Es sei M := sup IIDf(x+t~)II. 0:0;;;1:0;;;1
Damit gilt Ilf(x+~) - f(x) 11 ~ MII~II ·
(Die Norm einer Matrix wurde in § 2 definiert.) Beweis. Nach Satz 5 ist
Ilf(x+~) -
f(x) 11 = 1110
1
(Df(x+t~)~) -l
~ IoIIIDf(x+t~)II'II~lldt ~ MII~II · Dabei wurde folgender Hilfssatz benutzt: Hilfssatz. Sei v: [a,b] ---+ JRm eine stetige vektorwertige Funktion auf dem Intervall [a, b] c IR. Dann gilt
Ill
b
v(t)dtll
~
l
b
Ilv(t) Ildt.
Beweis. Wir setzen u := J:v(t)dt E JRm undK:= lIull . Dann ist K 2 = (u, u)
(lb ~ lb
=
v(t)dt, u)
=
Ilv(t) 11·llull dt
lb
(v(t) ,u)dt
=K
Kürzung durch K liefert die Behauptung.
lb
Ilv(t) 11 dt,
I. Differentialrechnung im JRn
76 AUFGABEN
6.1. Man berechne die Jacobi-Matrix der Abbildung F: JR3
--+
JR3,
F(r,'Ö,ep):= (r sinü coso, r sin sintp, r cos ö). ö
6.2. (Darstellung des Laplace-Operators bzgI. ebener Polarkoordinaten) Es sei p die wie folgt definierte Abbildung p:JR~ x JR --+ JR2,
p(r, ep) := (r coso, r sine).
Man zeige: Ist u: G --+ JR eine auf der offenen Menge G C JR2 zweimal stetig differenzierbare Funktion, so gilt auf der Menge p-I (G) die Gleichung
A ) _ iP(uop) (LlU 0 P CJr2
! CJ(uop)
+r
CJr
~ CJ2(u op)
+ r2
CJcp2
6.3. Sei U C JRn eine offene Kugel und f: U --+ JRm eine stetig differenzierbare Abbildung mit beschränktem Differential, d.h. es gebe eine Konstante K E JR+, so dass
IIDf(x) II ~ K
für alle x EU.
Man zeige, dass f in U gleichmäßig stetig ist. 6.4. Sei U C JRn offen und f: U --+ JR eine stetig differenzierbare Funktion. Sei xE U und f(x) =: c. Man zeige, dass der Gradient gradf(x) auf der Niveaufläche
Nf(C) = {z E U:f(z) = c} senkrecht steht, d.h. folgendes gilt: Ist
ep:]-e,e[ -----+ JRn,
(e » 0),
eine beliebige stetig differenzierbare Kurve mit
ep(O)=x und ep(]-e,e[)cNf(c), so folgt
(ep'(O),gradf(x)) = O.
77
§ 7 Taylor-Formel. Lokale Extrema Das Differential einer differenzierbaren Funktion f liefert eine Approximation von f durch eine affin-lineare Funktion. Die Taylor-Fonnel gibt in Verallgemeinerung davon (falls f genügend oft differenzierbar ist) eine Approximation von f bis zu beliebig hoher Ordnung. Mithilfe der Approximation bis zur zweiten Ordnung werden wir in diesem Paragraphen außerdem die lokalen Extrema von Funktionen mehrerer Veränderlichen untersuchen. Bezeichnungen. Für den Differentialkalkül mehrerer Veränderlichen sind folgende Abkürzungen nützlich: Für ein n-tupel a = (al, ... ,an) E Nn sei lai := a! +a2+ .. ·+ a n , a! := al!a2! ' . .. ·an ! Ist f eine Ial-mal stetig differenzierbare Funktion, so setzt man
Dll'fDllf .'-- DlllDa2 I 2' . . n -
a1a1f aXI'" al a an xn
wobei D~=DjDj . .. D,
'-v-"
aj-mal
Für x = (XI, ... ,xn ) E lRn sei
xll :=XflX~2 .... . x::". Satz 1. Sei U C lRn offen und f : U --4 lR eine k-mal stetig differenzierbare Funktion. Sei x E U und ~ E lRn ein Vektor derart, dass die Strecke x + t~ o:: ;,; t :::;,; 1, ganz in U liegt. Dann ist die Funktion g : [0,1] ----4 lR,
g(t):= f(x + t~),
k-mal stetig differenzierbar und es gilt dkg
L
k'
-dk(t) = ---'r(Daj)(x+t~)~a. t lal=ka. O. Forster, Analysis 2, DOI 10.1007/978-3-8348-8103-8_7, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
I. Differentialrechnung im JRn
78 Beweis.
a) Wir zeigen zunächst durch Induktion über k, dass
dkg n -d k(t) = L Dik ···DiJ(X+t~)~il· ··~ik· t il,...,ik=1 Für k = 1 ergibt sich aus der Kettenregel
d
~
n
-d (t) = -d f(xi +t~I, .. . ,Xn+t~n) = LDif(x+tS)~i' t t i=1 Induktionsschritt k - 1 -> k. dkg d ( dtk(t) = dt .
n
L
11,••·,lk- l = 1
=
~ n, (.
}=I
t
Dik_l .. · DiJ(X + t~) ~il " · ~ik_l Dik_l . ..
11,.•. ,lk- l = 1
)
DiJ(X+t~)~il " '~ik_l) ~j
n
L Dik· .. DiJ(X+t~)~il·"~ik· il,···,ik=1 b) Kommt unter den Indizes (il, ... ,ik) der Index 1 genau (Xl-mal, der Index 2 genau (X2-mal, ... , der Index k genau (Xk-mal vor, so ist nach § 5, Corollar zu Satz 1
Dik· . . DiJ(X + t~) ~il .. . ~ik =
Dfl ... D~n f(x + t~) ~fl ... ~~ .
k! k-tupel (il, ... ,ik) von Zahlen 1 ~ t« ~ n gibt, bei denen (XI!.·· an! der Index v genau (Xv-mal vorkommt (v = 1, ... , n, (XI +...+ (Xn = k), folgt
Da es aber
dkg dtk(t)
=
n
L
il ,...,ik= 1
Dik···DiJ(X+t~)~il···~ik
Satz 2 (Taylorsche Formel). Sei U C JRn offen, x E U ein Punkt und ~ E lRn ein Vektor derart, dass die Strecke x + tl;, 0 ~ t ~ 1, ganz in U liegt. Weiter sei
79
§ 7 Taylor-Formel . Lokale Extrema
f :U ---+ JR eine (k+ I)-mal stetig differenzierbare Funktion. Dann existiert ein 9 E [0,1], so dass
L
f(x+l;) =
IlXl:;;;k
DlX~(X) I;lX+
L
IlXl=k+!
0..
DlXf(x ~91;) I;lX. 0. .
Beweis. Wir betrachten die Funktion
t - g(t):= f(x + tl;).
g: [0,1] - t JR,
Nach Satz I ist g eine (k+ l j-mal stetig differenzierbare Funktion und nach der Taylor-Formel fiir Funktionen einer Veränderlichen (An. I, § 22, Satz 2) existiert ein 9 E [0, I], so dass
10 ~+ g(m)(0)
k
g(I)=
g(k+t) (9) (k+l)! .
Nach Satz 1 ist fiir m = 1, ... ,k
g(m)(o) m! und
L
=
DlXf(x) I;lX
lal=m
0.1
g(k+!) (9) DlXf(x+91;) lX (k + 1)1 = ,I; , . IlXl=k+! 0..
L
woraus die Behauptung folgt. Corollar 1. Sei U c JRn offen und
f:U-tJR
eine k-mal stetig differenzierbare Funktion. Dann giltfür j edes x E U f(x+l;) =
L
IlXl:;;;k
DlX~(X) I;lX+o(lll;llk)
fiirl;
---+
O.
0..
Beweis. Da U offen ist, gibt es ein B > 0, so dass BS(x) es zu jedem I; E JRn mit 111;11< Bein 9 E [0,1] mit
f(x+l;) =
L
lal:;;;k-t
c
U. Nach Satz 2 gibt
Da~(X) I;lX+ L DlXf(x~91;) I;lX 0..
IlXl=k
0. .
80
I. Differentialrechnung im JRn
wobei
ra@= Daf(x+e~) -Daf(x). a!
Wegen der Stetigkeit von Da f gilt 1im ra@ = 0. Da ~->o
folgt
L
lal=k
ra(~)~a = o(II~llk),
q.e.d .
Bemerkung. Mit den obigen Bezeichnungen sei
Pm(~):=
L
lal=m
Da ~(x)
a.
~a.
Dann ist Pm(~) ein homogenes Polynom m-ten Grades in ~ = (~l,'" ,~) und es gilt
f(x+~)
k
=
L Pm(~) +o(II~llk).
m=O
Wir wollen die Polynome Pm :für die Fälle m = 0, 1,2 genauer betrachten. a) m = 0. Da es nur ein n-tupel gilt
a E Nn mit lai =
°
gibt, nämlich
a = (0, . .. ,0),
Po(~) = DOf(x) ~o = f(x). o!
Po ist also eine Konstante, nämlich der Funktionswert von f im Entwicklungspunktx.
b) m = 1. Die einzigen n-tupel ej
= (0, ... ,0,1,0, . .. ,0) ~
i-te Stelle
a E Nn mit lai = 1 sind die n Einheitsvektoren
§ 7 Taylor-Fonnel. Lokale Extrema
81
Es gilt Dei = D, und eil = 1 sowie ~ei = ~i, also n
P1(~) = LDi/(x)~i = (gradf(x),~) . i=1
Für einmal stetig differenzierbare Funktionen lautet also die Formel von Corollar 1 f(x+~) = f(x)
+ (gradf(x),~) +o(II~II),
was genau die Approximierbarkeit von f durch eine lineare Funktion in der Definition der Differenzierbarkeit darstellt. c) m = 2. Es gibt zwei Arten von n-tupeln a E Nn mit [o] = 2. Erstens die Vektoren 2ei = (0, .. . ,0,2,0, ... ,0),
1 ~ i ~ n,
wobei die 2 an i-ter Stelle steht. Zweitens die Vektoren ei+ej = (0,... ,1, ... ,1, ... ,0)
1 ~ i <j ~ n,
mit Einsen an den Stellen i und j. Es gilt D2etf=DU, Dei+eif=DiDjf,
(2el)! =2, (ei+ej)! = I
füri#j.
Daraus folgt
P2(~) = ~ ±DU(x)~T+ LDiDjf(X)~i~j. 1=1
i-cj
Da DiD jf = DjDi/, gilt für die zweite Summe
LDIDjf(x)~i~j = ~ LDiDjf(x)~I~j loh
i<j
und man erhält insgesamt
I
n
P2(~) = 2: L DiDjf(x)~I~j, l,j=l
wobei jetzt i und j unabhängig voneinander von I bis n laufen. (Dies kann man auch direkt aus Teil a) des Beweises von Satz I sehen.)
P2 ist also eine quadratische Form mit der Matrix (~DiDjf(x)). Man nimmt dies zum Anlass für folgende Definition.
82
I. Differentialrechnung im )Rn
Definition (Hessesche Matrix). Sei U C )Rn offen und f : U -+ )R eine zweimal stetig differenzierbare Funktion. Unter der Hesseseben Matrix von f im Punkt xE U versteht man die n x n-Matrix
(Hessj)(x):= (DiDjf(x))
1~1~.
l~j~n
Die Hessesehe Matrix ist symmetrisch, da DiD jf = DjD;f. Wegen der obigen Bemerkungen ist das Folgende ein Spezialfall von Corollar 1:
CoroUar 2 (Approximation zweiter Ordnung). Sei U c)Rn offen, x EU und f : U -+ )R eine zweimal stetig differenzierbare Funktion. Dann gilt
f(x+~) =
c+ (a,~) + !(~,A~) +0(11~112),
wobei
c:= f(x) ,
a:= gradf(x) ,
A:= (Hessj) (x).
Lokale Extrema Sei U C )Rn eine offene Menge und f: U -+ )R eine Funktion. Ein Punkt x E U heißt lokales Maximum. bzw. lokales Minimum. von f, falls eine Umgebung V C U von x existiert, so dass
f(x)
~
f(y)
(bzw. f(x) :;;; f(y))
für alle y E V.
Tritt in dieser Definition der Fall f(x) = f(y) nur für x = y ein, so spricht man von einem strikten lokalen Maximum oder Minimum. Ein lokales Extremum.ist ein lokales Maximum oder Minimum. Satz 3 (notwendige Bedingung für lokales Extremum). Sei U c)Rn offen und f: U -+ )R einepartiell differenzierbareFunktion. Besitzt f in x E U ein lokales
Extremum, so gilt gradf(x) = O.
Beweis. Für i = 1, ... ,n betrachten wir die Funktionen
§ 7 Taylor-Fonnel. Lokale Extrema
83
Die Funktion gi ist auf einem gewissen Intervall] -e,e] c R, e > 0, definiert und dort differenzierbar. Hat f in x ein lokales Extremum, so hat gi in 0 ein lokales Extremum, also gilt (An .1, § 16, Satz 1)
&(0) = O. Da~(O) =
DiJ(x), folgt
gradf(x) = (D1f(x), ... ,Dnf (x)) = 0,
q.e.d.
Um neben dieser notwendigen Bedingung auch hinreichende Bedingungen für die Existenz von lokalen Extrema einer Funktion herleiten zu können, müssen wir die Hessesehe Matrix von f genauer betrachten. Dazu erinnern wir zunächst an folgende Definition aus der Theorie der quadratischen Formen,
Definition. Sei A E M(n x n,R) eine symmetrische n x n-Matrix. a) Die Matrix A heißt positiv definit, falls
>0
(~,A~)
für alle ~ E Rn 0
(~,A~)
und
(Tl,ATl)
< o.
Bemerkung. Bekanntlich gibt es zu jeder symmetrischen n x n-Matrix A E M(n x n, R) eine Orthononnalbasis VI, .. . , V n E Rn von Eigenvektoren: AVi
= cxjVj,
(Vi,Vj)=Öij
Die Eigenwerte CXi sind alle reell. Entwickelt man einen Vektor ~ E Rn bezüglich dieser Orthogonalbasis, n
~ = LAiVi i=1
so wird
(~,A~)
n
=
L CXiAf·
i=1
I. Differentialrechnung im JRn
84
Damit erkennt man : A ist genau dann positiv (negativ) definit, falls alle Eigenwerte von A positiv (negativ) sind. A ist genau dann positiv (negativ) semidefinit, wenn al1e Eigenwerte ~ 0 (bzw. ::;; 0) sind. A ist genau dann indefinit, wenn A mindestens einen positiven und einen negativen Eigenwert besitzt. Falls die Eigenwerte bekannt sind, ist es also einfach zu entscheiden, ob die Matrix positiv definit (bzw. negativ definit, usw.) ist. Für n ~ 3 ist es aber im Allgemeinen schwierig, die Eigenwerte einer n-reihigen Matrix zu berechnen . Wir geben deshalb ohne Beweis noch ein einfaches Kriterium von JacobiJHurwitz für die positive Definitheit einer symmetrischen Matrix an. (Ein Beweis findet sich z.B. in [1], Abschnitt 5.7.7) Satz (Determinanten-Kriterium für Definitheit). Sei a ll
A=: (
.. .
anl
aln)
:
a nn
eine reelle symmetrische n fiir k = I, .. . , n gilt a ll
EM(nxn,JR)
.. .
det: ( akl
x n-Matrix. A ist genau dann positiv definit, wenn
alk) : > O. akk
Beispielsweise ist die 3 x 3-Matrix
A:=
(~: ~~ ~~) Cl
C2
c3
genau dann positiv definit, wenn folgende drei Bedingungen erfüllt sind: (i)
al
> 0,
(ii)
al b2 -
a2bl
> 0,
(iii) detA
> o.
Satz 4 (hinreichende Bedingung für lokales Extremum), Sei U C JRn offen, f: U ---7 JR eine zweimal stetig differenzierbare Funktion und x E U ein Punkt mit gradf(x) = O. a) Ist (Hess f) (x) positiv definit, so besitzt f in x ein striktes lokales Minimum.
b) Ist (Hess f) (x) negativ definit, so besitzt f in x ein striktes lokales Maximum.
§ 7 Taylor-Fonnel. Lokale Extrema
85
c) Ist (Hess f) (x) indefinit, so besitzt f in x kein lokales Extremum.
Beweis. Sei A := (Hessf) (x). Nach Corollar 2 zu Satz 2 gilt in einer Umgebungvonx f(x+~) =f(x)+!(~,A~)+cp(~)
(1)
mit cp(~) = 0(11~112). Es gibt also zu jedem E> 0 ein Ö > 0, so dass
Icp@1 ~ EII~112
für II~II
< Ö.
a) Sei jetzt vorausgesetzt, dass A = (Hessf) (x) positiv definit ist. Sei
S:= gERn : II~II = I} die Sphäre vom Radius 1. Da S kompakt ist, nimmt die stetige Funktion ~ ...... (~,A~)
auf S ihr Minimum an. Da (~,A~)
> 0 für alle ~ E S, ist
a := min{ (~,A~) : ~ E S} > O. Behauptung.
(~,A~) ;::: all~112
für alle ~ E Rn
(2)
Für II~II = 1 ist das trivial. Der allgemeine Fall wird darauf zurückgeführt, indem man den Vektor ~ schreibt als
~ = A1;*
mit A. = II~II und II~* 1
= 1.
Wir wählen jetzt Ö > 0 so klein, dass
Icp(~) 1~ ~ 11~112
für
II~II < Ö.
Dann folgt aus (1) und (2)
f(x+~) ;::: f(x) + ~ 11~112, also f(x +~) Minimum.
> f(x) für 0
0, so dass Icp(t~)1 ~ f(x+t~)
> f(x)
für
Ebenso zeigt man: Ist 1'] genügend kleine t "# 0
f(x+t1']) < f(x) ,
%t
2
für [r]
< ö, also
0< Itl < ö.
E )Rn
,,0 ein Vektor mit (1'],A1'])
< 0,
so gilt für
q.e.d.
Beispiele Wir geben einige typische Beispiele für das Auftreten bzw. Nichtauftreten von lokalen Extrema. Dabei betrachten wir Funktionen
f:)R2
-----7)R,
(x,y) ~ f(x,y)
zweier Veränderlichen, die wir, um Indizes zu sparen, mit (x,y) statt (X\,X2) bezeichnen. (7.1) Sei f(x,y) := c+x2 +y.
Die Funktion hat im Nullpunkt ein striktes lokales Minimum, da gradf(x) = (0,0) und die Hessesehe Matrix Hessf=
G~)
positiv definit ist. (Die Funktion f hat im Nullpunkt sogar ein globales Minimum, wie man direkt sieht.) Der Graph von f,
rf= {(x,y,z)
E)R3
:z=c+~+y}
ist ein nach oben geöffnetes Paraboloid, wenn man sich die z-Achse nach oben gerichtet denkt (Bild 7.1).
(7.2) Seig(x,y):= c-x2 -y.
87
§ 7 Taylor-Fonnel. Lokale Extrema z
z
x
Bild 7.1 Paraboloid
Bild 7.2 Sattelfiäche
Hier liegt im Nullpunkt ein striktes Maximum vor; die Hessesehe Matrix Hessg=
(-~ _~)
ist negativ definit. Der Graph von g,
r g = {(x,y,z) E 1R3 :z= c-:l- -y} ist ein nach unten geöffnetes Paraboloid. (7.3) Sei h(x,y) := c+:l-
-y.
Der Gradient von h, gradh = (2x, -2y)
0 -n·
verschwindet im Nullpunkt. Es ist Hessh=
Die Hessesehe Matrix ist also indefinit, es liegt deshalb weder ein lokales Maximum noch Minimum vor. Der Graph von h, rh
= {(x,y,z) E 1R3 :z = c+:l- -y}
88
I. Differentialrechnung im JRn
ist eine sog. Sattelfläche (Bild 7.2). Längs der x-Achse (y = 0) steigen die Werte von h vom Nullpunkt aus an, längs der y-Achse (x = 0) fallen sie ab. (7.4) Ist die Hessesehe Matrix in einer Nullstelle des Gradienten semidefinit, so lassen sich keine allgemeinen Aussagen machen, wie folgende Beispiele zeigen:
fi(x,y) := ~+y4, h(x,y) :=~ , h(x,y) := ~+y. Für alle drei Funktionen verschwindet der Gradient im Nullpunkt und es gilt (Hess/k)(O) =
G~) ,
k= 1,2 ,3 ,
die Hessesehe Matrix ist also positiv semidefinit. Die drei Funktionen zeigen aber verschiedenes Verhalten: a) Die Funktion I1 hat im Nullpunkt ein striktes lokales Minimum. b) Die Funktion h hat im Nullpunkt ein lokales Minimum, das aber nicht strikt ist (denn in allen Punkten der y-Achse hat h denselben Wert wie im Nullpunkt). c) Die Funktion h hat im Nullpunkt weder ein lokales Minimum noch ein lokales Maximum. AUFGABEN 7.1. Man bestimme die Taylor-Entwicklung der Funktion
I: JR~ x JR~ ----> JR,
x-y I(x,y):= - - , x+y
im Punkt (1, 1) bis einschließlich den Gliedern 2. Ordnung 7.2. Man bestimme die lokalen Extrema der Funktion
I:JR2---->JR,
l(x,y):=(4~+y2)e-x2-4Y .
7.3. Sei P: JRn ----> JR das folgende homogene Polynom k-ten Grades: P(x) = caxa, <x'=(<x'I, ... ,<X.n)ENn, x= (XI, . ..,Xn ) EJRn.
L
lal=k
Man beweise:
§ 7 Taylor-Fonnel. Lokale Extrema
89
a) Ist ß E Nn ein n-tupel mit IßI = k, so gilt Dßp(x) = ß!cß. b) Gilt P(x) = 0 für alle x aus einer gewissen Umgebung des Nullpunkts, so folgt Ca = 0 für alle a E N n mit lai = k. c) Es giltP(x) = o(llxll m ) für alle m < k. d) GiltP(x) = o(llxll k), so folgtP(x) = 0 für alle x E JRn. 7.4. Sei U c JRn offen, f :U -> JR eine Funktion und xE U ein Punkt. In einer Umgebung von x gelte
f(x+~) =
L
ca~a+cp(~)
L
ca~a + cj>@
lal=S;;k
und
f(x +~) =
lal=S;;k
mit cp(~) = o(II~llk) und ijl(~) = o(II~llk). Man zeige, dass Ca = Ca für alle a E Nn mit lai::;; k.
7.5. Sei U eine offene Teilmenge des JRn und ct(U) die Menge aller k-mal stetig differenzierbaren Funktionen f: U -> JR, für die Daf beschränkt in U ist für alle a E Nn mit lai::;; k. Für f E ct(U) werde definiert Ilfllk:=
I -sup{IDaf(x)1 :XEU}. al lal=S;;k
L
Man beweise: a) Die Abbildung II Ilk: ct(U) -> JR,
ff-> Ilfllk,
ist eine Norm auf dem Vektorraum ct(U). b) Für f,g E ct(U) gilt Ilfgllk::;; Ilfllkllgllk. c) Der normierte Vektorraum ct(U) ist vollständig.
90
§ 8 Implizite Funktionen Auf einer Teilmenge U C R2 sei eine Funktion F:U -+ R, (x,y) >-+ F(x,y), gegeben. Unter gewissen Voraussetzungen gibt es zu jedem x-Wert aus einem geeigneten Intervalll c R genau ein y, so dass (x,y) E U und F(x,y) = O. Dadurch wird dann eine Funktion y = g(x) bestimmt, für die F(x,g(x)) = 0 für alle x E I. Man sagt in diesem Fall, die Funktion g werde durch die Gleichung F(x,y) = 0 implizit definiert. In diesem Paragraphen beschäftigen wir uns genauer mit den Bedingungen für die Existenz und Differenzierbarkeit impliziter Funktionen. Als Anwendung davon untersuchen wir die Umkehrung von differenzierbaren Abbildungen.
Eine Anwendung der Kettenregel Die Kettenregel für die Differentiation von Funktionen mehrerer Veränderlichen kann dazu dienen, in manchen Fällen die Ableitung einer Funktion einer Veränderlichen einfach auszurechnen. Betrachten wir etwa die folgende Situation: Sei U C IR2 offen und
F:U ----+ IR,
(x,y) ~ F(x,y)
eine differenzierbare Funktion. Außerdem sei eine differenzierbare Funktion einer Veränderlichen
g:l----+ IR,
x ~ g(x),
auf einem Intervall I C IR vorgegeben. Der Graph von g sei in U enthalten und es gelte
F(x,g(x)) = 0 fiir alle x EI. Differenzieren wir diese Gleichung nach x mit Hilfe der Kettenregel, so ergibt sich
D1F(X,g(X)) + D2F(x,g(x))g(x) = O. Unter der Voraussetzung, dass D2F(x,g(x)) i- 0, gilt also
g(x) =
D1 F(X,g(x)) D2F(x,g(x))
O. Forster, Analysis 2, DOI 10.1007/978-3-8348-8103-8_8, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
§ 8 Implizite Funktionen
91
Beispiele (8.1) Auf dem Intervall -a < x < a betrachten wir die Funktion
g(x):=
Va 2 - x2 .
Es gilt g(x) 2 = a2 -xl, also
xl+g(x? _a2 = 0 Mit den obigen Bezeichnungen ist also hier F(x,y) = tiation von (*) nach x ergibt
x2
+ 1-
(*) a2 •
Differen-
2x+2g(x)g(x) = 0, d.h.
x -x g(x) = - g(x) = ~ .
(8.2) Es sei g : ]0, 1[ --> IR die Funktion
g(x) := arcsin Vl-x3 . Setzen wir zur Abkürzungy = g(x), so ergibt sich siny=
Vl-x 3
und weiter
sin2y+x3 -1 = O. Durch Differentiation nach x erhält man 2 (siny)(cosy)y' +3~
= O.
Da aus 0 <x< 1 folgt 0 < Vl-x 3 < 1, gilt 0 (fk) folgt durch Grenzübergang k -> 00 f* = cI>(f*),
q.e.d.
Zum Beweis des nächsten Satzes werden wir den Banachsehen Fixpunktsatz anwenden auf den Vektorraum CI, (U, )Rm) aller beschränkten stetigen Funktio-
§ 8 Implizite Funktionen
93
nen I:V ---+ JRm auf einer Teilmenge V C JRk, versehen mit der SupremumsNorm IIIII := sup{ll/(x)II : x E V}. Eine Cauchyfolge bzgl. dieser Norm konvergiert gleichmäßig auf V . Nach §2, Satz 10, ist die Grenzfunktion wieder stetig, besitzt also einen Limes in Cb(V,JRm). Daher ist Cb(V,JRm) ein Banachraum. Satz 2 (über implizite Funktionen) . Seien VI C JRk und V2 C JRm offene Teilmengen und F: VI x V2 ~ JRm, (x,y) H F(x,y), eine stetig differenzierbare Abbildung. Sei (a,b) E VI
X
V2 ein Punkt mit
F(a,b) = O. Die m
x m-Matrix CJF CJ(FI, CJy := O(YI ,
,Fm) Ym) :=
(
~~
~~J
CJFm CJYI
CJFm dym
sei im Punkt (a,b) invertierbar. Dann gibt es eine offene Vmgebung VI C VI von a, eine Umgebung V2 C V2 von b sowie eine stetig differenzierbare Abbildung g: VI ---+ V2 C JRm mit g( a) = b, so dass F(x,g(x)) Ist (x,y) E VI
X
=0
für alle x E VI.
V2 ein Punkt mit F(x,y)
= 0, so folgt y = g(x).
Bemerkungen 1) Der einfachste (aber schon nicht-triviale) Fall istk= m = 1. Dann ist ~ die gewöhnliche partielle Ableitung. Der Leserin sei empfohlen , beim ersten Studium des Satzes an diesen Fall zu denken. 2) Man sagt, die Abbildung g entstehe durch Auflösen der Gleichung F(x,y) =0
nach y. Für die Gültigkeit des Satzes ist wesentlich, dass VI und V2 verkleinert werden; in ganz VI x V2 könnte es zu einem gegebenen x meh-
94
I. Differentialrechnung im JRn rere y-Werte (oder auch gar keinen) geben, die der Gleichung F(x,y) genügen, vgl. Bild 8.1
Bild 8.1
=0
Y
VI X V2
b -- --------- ----
x
a 3) Ist
~ invertierbar im Punkt (a,b), so ist es auch invertierbar in einer ge-
wissen Umgebung von (a, b). Dies sieht man so: Die Funktion
ö(x,y) := det
(~ (X,y))
ist stetig in Ul x U2, da sie ein Polynom in den stetigen Funktionen aFf/aYj ist. Da ö(a,b) =I 0, gilt auch ö(x,y) =I 0 für alle (x,y), die nahe genug bei (a,b) liegen. 4) Differenziert man die i-te Komponente der Gleichung F(x,g(x)) = 0 partiell nach Xj, so erhält man mit der Kettenregel (§ 6, Corollar zu Satz 3)
i.==- l , ( J - 1, oder in Matrizen-Schreibweise
aF aF ag ax (x,g(x)) + ay (x,g(x)) ax (x) = 0 mit den Abkürzungen
aF a(Fl, ax = a(Xl,
,Fm )
aF a(Fl, ay = a(Yl,
,Fm )
,Xk)
,Ym)
= =
('OFf) aXj
('OFf) aYIl
\~~~~'
f~~':.'
,m) , ,k
§ 8 Implizite Funktionen
og O(gl' ox = O(XI, Ist die Matrix
95
,gm) (Ogp) ,Xk) = OXj \~~k
~ im Punkt (x,g(x)) invertierbar, erhält man für die Funk-
tional-Matrix der Abbildung g
og OX (x) = -
(
oF oy (x,g(x)) )
- 1
oF ox (x,g(x)).
Beweis von Satz 2. Wir gehen in mehreren Schritten vor. a) Vorbereitungen. O.B.d.A. sei (a,b) = (0,0). Wir setzen
oF B:= oy (0,0) E GL(m,lR) und definieren die Abbildung G: UI x U2
-->
lRm durch
G(x,y) :=y-B-1F(x,y) (1) 1 Da ~(x,y) = 11. -B- ~(x,y), wobei 11. diem-reihige Einheitsmatrix bezeichnet, folgt
oG oy (0,0) = O. Da alle Komponenten der Matrix ~; stetige Funktionen sind, gibt es Nullumgebungen WI C UI und W2 c U2, so dass 11
~~ (x,y) ~ ~
für alle (x,y)
11
E
WI
X
W2
(2)
Wir wählen ein r > 0, so dass
V2:= {y E lRm
:
Ilyll ~ r} C W2·
Da G(O, 0) = 0, gibt es eine offene Nullumgebung VI c WI, so dass
sUPIIG(x,O)11 =:E~ ~
XEVi
Aus der Definition (1) folgt
F(x,y) = 0
~
y = G(x,y),
(3)
96
I. Differentialrechnung im JRn
wir haben also die Lösung der Gleichung F(x,y) = 0 in ein Fixpunkt-Problem verwandelt. Aus der Abschätzung (2) folgt für alle x E VI und y,,, E ~
IIG(x,y) - G(x,,,) II ~ !lly-,,11
(4)
Setzt man " = 0, so ergibt sich zusammen mit (3) fiir alle x E VI Ilyll ~ r
===>
(5)
IIG(x,y)11 ~ r
b) Für jedes feste x E Vi ist die Abbildung V2 3 Y f-t G(x,y) E JRm
wegen (5) eine Abbildung der abgeschlossenen Kugel V2 C JRm in sich, die nach (4) eine Kontraktionist, also nach dem BanachsehenFixpunktsatzgenau einen Fixpunkt hat. Es gibt also zu jedem x E VI genau ein y = g(x) E V2, so dass G(x,y) = y, d.h. F(x,g(x)) = O. c) Wir zeigenjetzt, dass die in b) konstruierteAbbildungg: VI - t V2 sogar stetig ist. Dazu wenden wir den Banachsehen Fixpunktsatz auf den Banachraum Q,(VI,JRm) aller stetigen und beschränktenAbbildungen lp: VI - t JRm an. Falls Illpll := sup{lllp(x)II :x E VI} ~ r, so gilt fiir die durch VI
x f-t 'II(x) := G(x, lp(x))
JRm definierte stetige Abbildung '11: VI - t IRm nach (5) ebenfalls 11'1111 ~ r, die Zuordnung lp f-t '11 liefert also eine Abbildung der abgeschlossenenTeilmenge 3
E
A:= {lp E Cb(VI,lRm ) : Illpll ~ r} = {lp E Cb(VI,lRm ) : lp(VI)
c V2}
in sich. Aus (4) folgt fiir lpl,lp2 E A II(lpl) - ( lp2) II = sup II G(x, lpl(x)) - G(x, lp2(x))ll xE VI
~ ! SUp Illpt(x) -lp2(x)11 =! IIlpl -lp2I1 , xE VI
die Abbildung :A - t A ist also eine Kontraktion und besitzt deshalb genau einen Fixpunktg EA C Cb(Vt,JRm). Diese stetige Abbildungg: VI - t V2 erfiillt G(x,g(x)) = g(x), d.h.
F(x,g(x)) = 0 fiir alle x E VI und stimmt natürlich wegen der Eindeutigkeit mit der in b) konstruiertenAbbildung überein.
§ 8 Implizite Funktionen
97
d) Nach evtl. Verkleinerung von VI können wir annehmen, dass die Matrix ~ in jedem Punkt (x,g(x)), x E VI, invertierbar ist. Wir zeigen jetzt, dass die Abbildung g : VI ---+ IRm differenzierbar ist. An der in Bemerkung 4) angegebenen Formel fiir die Funktionalmatrix von g sieht man dann, dass g sogar stetig differenzierbar ist.
°
Es genügt, den Beweis der Differenzierbarkeit von g im Nullpunkt E VI C IRk durchzuführen (fiir die anderen Punkte geht der Beweis analog). Wir setzen
oF A := ox(O,O)EM(mxk,IR), oF
B:= oy (0,0) E GL(m, IR). Aus der Definition der Differenzierbarkeit von F im Punkt (0, 0) folgt
F(x,y) = Ax+By+q>(x,y) mitq>(x,y) = 0(11 (x,y) 11)· Es giltF(x,g(x)) =
°
fiir alle x E VI, d.h.
g(x) = -B-1Ax-B-Iq>(x,g(x))
(6)
Für die Differenzierbarkeit von g im Nullpunkt ist also nur zu beweisen, dass
",(x) := -B-Iq>(x,g(x)) = o(llxll) Dazu zeigen wir zunächst: Es gibt eine Umgebung V{ C VI von Konstante K > 0, so dass Ilg(x)II :;:;Kllxll
(7)
°
und eine
fiirallexE V{
(8)
Beweis hierfür. Wir setzen
CI := IIB-IAII,
C2:=
IIB-III·
Wegen q>(x,y) = 0(11 (x,y)ll) gibt es zu E := 2~2 eine Umgebung V' C VI von (0,0), so dass
1
11q>(x,y) II :;:; Eil (x,y) II :;:; -2 (Ilxii + Ilyll) C2
X
V2
fiir alle (x,y) E V'.
Wegen der Stetigkeit von g gibt es eine Nullumgebung V{ C VI , so dass der Graph von g I V{ ganz in V' enthalten ist. Dann gilt fiir alle x E V{
1
II q>(x,g(x)) II :;:; -2 (Ilxii + Ilg(x)11) C2
98
I. Differentialrechnung im JRn
Die Gleichung (6) liefert nun
Ilg(x)II ~ clllxli +c211 Vo bijektiv mit der Umkehrung g, q.e.d,
Bezeichnung. Sind U, V C IRn offene Mengen und
I:U -> V eine bijektive stetig differenzierbare Abbildung, so dass die Umkehrabbildung
g:=rl:v->U ebenfalls stetig differenzierbar ist, so nennen wir I Cr-invettietber. Ist I sogar 2-mal stetig differenzierbar, so folgt aus der Formel
(Dg)(y) = ((Df) (g(y))) -I, dass alle Koeffizienten der Matrix Dg stetig differenzierbar sind, also g ebenfalls 2-mal stetig differenzierbar ist. Durch Induktion beweist man: Ist die e 1_ invertierbare Abbildung s-mal stetig differenzierbar (s ~ I), so auch ihre Umkehrabbildung. Eine solche Abbildung heißt eS-invertierbar. Dabei kann auch s = 00 sein, falls I und damit I-I beliebig oft stetig differenzierbar sind. Eine eS-invertierbare Abbildung f: U -> V nennt man auch Ditfeomorphismus der Klasse
es.
(8.4) Beispiel (ebene Polarkoordinaten). Wir betrachten die Abbildung
f: IR~ x IR -> IR2 ,
(r,q» ....... (rcosq>,rsinq».
Die Funktional-Matrix dieser Abbildung ist
D/(r ) = "iJ(ft,f2) = ,q> "iJ(rq» ,
Da det(DItr. q»)
(~ ~) iJh iJh iJr
= r > 0, ist DI(r, q»
iJcp
= (cosq> sinqi
-rSinq»
rcoso
.
in allen Punkten (r, q» E IR~ x IR inver-
I. Differentialrechnung im IRn
102
tierbar, die Abbildung f also lokal umkehrbar. Es gilt -rsincp) -1 = ( coscp sincp) (Df (r.,cp))-1 = (C?SCP -~ smcp rcoscp r r ~
Setzt man f(r,cp)
r=
.
= (x,y), so ist
vx2 +y2,
:: = r
coscp,
~ = sincp. r
Daher folgt
(Df(r,cp))-l =
(V;~:: ~;) =Dg(x,y),
wobei g eine lokale Umkehrung von f ist. In unserem Fall kann man eine solche Umkehrung explizit angeben. Sei etwa -1t/2 < cp < 1t/2. Dann folgt x > O. Setzt man
V:=
IR~ x ] -~, ~ [
und
V' =
IR~ x JR,
so sind V bzw. V, offene Umgebungen von (r, cp) bzw. (x,y) und die Abbildung f: V -> V' ist bijektiv mit der Umkehrung g : V' -> V,
g(~,ll) = (J~2+1l2,arctan~). Durch Berechnung der partiellen Ableitungen der beiden Komponenten von g kann man die oben abgeleitete Formel für die Funktional-Matrix von g direkt bestätigen.
___ _ "-, (x,y) ~=-
-,
-,
-, -,
\
rsincp
\
\
\
\
\
Bild 8.3 Ebene Polarkoordinaten
r
rcoscp
Die Abbildung j bildet R'[ x JR aufJR2 ,0 ab, sie ist aber nicht global injektiv,
103
§ 8 Implizite Funktionen da f(r, cp) = f(r, cp + 2krc) für alle k E Z. Ist f(r, cp) = (x,y), d.h,
x = rcoscp,
y = rsincp,
so heißen (r, cp) die Polarkoordinaten des Punktes (x,y). Dabei ist r = Jx 2 +y2 gleich dem Abstand des Punktes (x,y) vom Nullpunkt und cp der (bis auf ganzzahlige Vielfache von 2n eindeutig bestimmte) Winkel zwischen der x-Achse und dem Ortsvektor von (x,y), siehe Bild 8.3. AUFGABEN 8.1. Es sei F: lR2 ---+ lR2 die durch
F(x,y) := (x2 -y,2xy) definierte Abbildung. Man berechne die Funktional-Matrix von F und, wo sie existiert, ihre Inverse. Man zeige, dass F surjektiv ist und dass jeder Punkt (x,y) E lR2 , (x,y) =1= (0,0), genau zwei Urbildpunkte besitzt. 8.2. Man diskutiere die Höhenlinien der Funktion y F : lR+ x lR+ ---+ R, (x,y) f-+ xye-x und untersuche insbesondere, in welchen Rechtecken I x J Mengen
c lR+ ---+ lRsich die
{(x,y) ElxJ:F(x,y) =c} sich in der Form
((x,y)
E
I x J: y = cp(x)}
((x,y)
E
I x J: x = ",(y)}
bzw.
mit differenzierbaren Funktionen cp: I ---+ J bzw. "': J ---+ I darstellen lassen. 8.3. Sei F : lR3 ---+ lRdie Funktion
F(x,y,z) :=} +2xy-4xz+2y-1. Man zeige, dass durchF(x,y,z) = 0 in einer Umgebung U von (x,y) = (1,1) eine differenzierbare Funktion z = cp(x,y) mit cp( 1,1) = 1 implizit definiert ist und berechne die partiellen Ableitungen ~ und ~ im Punkt (1, 1).
104
§ 9 Untermannigfaltigkeiten In der Differentialrechnung mehrerer Veränderlichen sind die k-dimensionalen Untennannigfaltigkeiten des IR" das krummlinige Analogon der k-dimensionalen affinen Unterräume in der Linearen Algebra. Lokal kann eine k-dimensionale Untermannigfaltigkeit im Rn entweder durch eine Parameterdarstellung mit k reellen Parametern beschrieben werden oder als Nullstellengebilde von n - k unabhängigen differenzierbaren Funktionen. In diesem Paragraphen besprechen wir auch Tangential- und Normalen-Vektoren an Untermannigfaltigkeiten und leiten die Methode der Lagrangesehen Multiplikatoren zur Bestimmung von Extrema unter Nebenbedingungen her.
Definition (Immersion). Sei T C IRk eine offene Teilmenge . Eine stetig differenzierbare Abbildung
cp: T _IRn ,
(tI, ... ,tk) - CP(t1 , .. . ,tk),
heißt Immersion, wenn der Rang der Funktional-Matrix
Dcp= a(CP1 '''',CPn) '= (aCPi) = a(t1, ... , tk)' atj :~5~t
(
~ ~ ~ ~
:
~
atl
iJ:= (CP,Ht, . .. ,cp,,). Da ij>: V --t U bijektiv ist, ist auch cp: V --t cp(V) C U x IR ,,-k bijektiv und sogar ein Homöomorphismus, denn es besitzt die stetige Umkehrabbildung
\jf: cp(V) -
V,
\jf(XI, ... ,Xk, ...x,,) := \jI(XI, ... ,Xk).
Damit ist Satz I bewiesen. Definition (Untermannigfaltigkeit). Eine Teihnenge Me IR" heißt k-dimensionale Untermannigfaltigkeit von IR", wenn es zu jedem Punkt a E Meine offene Umgebung U C IR" gibt, sowie eine offene Teihnenge T C IRk und eine Immersion
cp: T _IR", so dass cp die Menge T homöomorph auf cp( T) = Mn U abbildet, siehe Bild 9.1. Rn
Bild 9.1 Man nennt dann
cp:T-Mnu
u
§ 9 Untennannigfaltigkeiten
107
eine Parameterdarstellung oder lokales Koordinatensystem der Untermannigfaltigkeit M in einer Umgebung von a. Ist (tl, . .. ,tk) E T und p :=
q>(tl, ... ,tk),
so heißen tl , . .. ,tk die lokalen Koordinaten des Punktes pE M (bzgl. q». Die Zahl n - k heißt die Codimension der Untennannigfaltigkeit. Untermannigfaltigkeiten der Codimension 1 nennt man auch Hyperfiächen . Beispiel (9.1) Rotationsflächen. Sei I C R ein offenes Intervall und
u : I ---+ R 2 ,
t f-+ a(t) = (a) (t),a2(t))
eine stetig differenzierbare ebene Kurve, die wir uns in der (x,z)-Ebene des R3 mit Koordinaten x,y,z vorstellen, d.h. x(t) = a) (t), z(t) = a2(t). Wir setzen außerdem voraus, dass die Kurve regulär ist, d.h. a'(t) =I (0,0) für alle t e I . Wird die Kurve um die z-Achse rotiert, so entsteht eine Fläche mit der Parameterdarstellung
Für die Funktionalmatrix von F ergibt sich
DF(t,q» =
a(F F F) (a~ (t) coso -al (t) sino ;( 2\ 3 = a~(t)sinq> al (t) cosq> t,q> a~(t) 0
.
Es ist leicht nachzuprüfen, dass DF(t,q» genau dann den Rang 2 hat, falls al (t) =I O. Falls also die gegebene Kurve a die z-Achse nicht schneidet, ist F eine Immersion und liefert eine Parameterdarstellung der Rotationsfläche . Wir geben zwei Beispiele. a) Die Sphäre vom Radius r
> 0 imR3.
Sie entsteht durch Rotation der Kreislinie R3t'tf-+
(x(t't)) = (rsint't) z(t't) r cos t't
I. Differentialrechnung im IRn
108
um die z-Achse. Die zugehörige Parameterdarstellung der Rotationsfläche ist
(~:::~::) .
('Ö,cp) f-tF('Ö,cp) =
rcos'Ö
Damit DF den Rang 2 hat, beschränken wir den Parameter 'Ö auf den Bereich 0< 'Ö< 1t. Dadurch wird nur der 'Nordpol' (O,O,r) und der 'Südpol' (0,0, -r) der Sphäre (die zu 'Ö = bzw. 'Ö = 1t gehören würden) ausgeschlossen. ('Ö,cp) sind die Polarkoordinaten auf der Sphäre. Der Parameter 'Ö heißt Poldistanz, der Parameter cp ist die 'geographische Länge' . Die 'geographische Breite' ß steht zu 'Öin der Beziehung ß= 1t/2 - 'Ö.
°
b) Der Torus. Sei R > r > 0. Der Torus mit Radien r,R entsteht durch Rotation der Kreislinie
IR:;) t f-t (x(t)) = z(t)
(R+~cost) rsmt
um die z-Achse. Da dieser Kreis die z-Achse nicht schneidet, ist
F :RxR-tR3 ,
(t,s)f-tF(t,s)=
COSS)
(R + rcost) (R+rc~st)sins ( rsmt
eine Immersion; das Bild F(R x R) ist der Torus. Natürlich ist F periodisch in beiden Variablen mit der Periode 21t. Man kann Untermannigfaltigkeiten des Rn auch aufandere Weise als durch Parameterdarstellungen beschreiben. Der folgende Satz beschreibt einige andere nützliche Möglichkeiten.
Satz 2. Eine Teilmenge M C Rn ist genau dann eine k-dimensionale Untermannigfaltigkeit, wenn eine der folgenden äquivalenten Bedingungen erfüllt ist: a) (Beschreibung durch Gleichungen) Zu jedem Punkt a E M gibt es eine offene Umgebung U C Rn und n - k stetig differenzierbareFunktionen
Jj : U - t R,
j
= 1, ... , n -
k,
so dass
Mnu = {x E U :f1(x) = .. . = fn-k(x) = O}
§ 9 Untennannigfaltigkeiten
109
und
a(JI,'" ,f n- k) ( ) ) x =n-k fUralle xEMnU. xl, ... ,xn
Rang a(
b) (Darstellung als Graph) Zu jedem Punkt a E M gibt es nach evtl. Umnumerierung der Koordinaten offene Umgehungen U I C ]Rk von d := (al, .. . ,ak) und U II C ]Rn-k von c" := (ak+l, '" ,an) und eine stetig differenzierbare Abbildung g : U I -----+ U II C ]Rn- k
so dass Mn (U' x UII ) = {(x ,xlI ) E tr X tr
: XII = g(x)}.
c) (Transformation in Ebene) Zujedem Punkt a E M gibt es eine offene Umgebung U C ]Rn, eine offene Menge V C ]Rn und eine Cl-in vertierbare Abbildung : U - V, so dass (MnU) =EknV. Dabei bezeichnet Ek C ]Rn die k-dimensionale Ebene Ek:= {x= (Xl, ... Xn) E]Rn :Xk+l = ... =Xn = O}.
Beweis. Wir bezeichnen mit (P) die Bedingung aus der Definition einer kdimensionalen Untennannigfaltigkeit: Zu jedem Punkt a E M existiert eine offene Umgebung U C ]Rn, sowie eine offene Teilmenge T C ]Rk und eine Immersion
(c) Nach Umnumerierung der Koordinaten können wir annehmen, dass det o(fI, . .. ,fn-k) (a) ~ O.
O(Xk+b'",xn)
Dann ist auch die Funktionalmatrix
O(XI,'" ,xk,fI,··· ,fn-k) O(Xb '" ,xk,xk+I, . .. ,xn)
§ 9 Untennannigfaltigkeiten
111
in einer Umgebung von a invertierbar, also bildet
:= (XI, .. . ,xk,/l, . .. ,fn-k) eine Umgebung von a CI-invertierbar auf eine offene Menge in ]Rn ab. Das Nullstellengebilde von /l, ,fn-k wird dabei auf die Ebene
{(XI,.. . ,xn) : Xk+ I =
= Xn = O}
abgebildet. (c)
=> (P) Sei '11 : V - U die Umkehrabbildung von : U - V. Dann liefert (tl, . .. ,tk) t--+ CP(tl, . .. ,tk) := 'P(t), . . . ,tk, 0, ... ,0)
eine Parameter-Darstellung von M in einer Umgebung von a.
Tangential- und Normalenvektoren Unter einem Tangentialvektor an eine Untermannigfaltigkeit versteht man einen Tangentialvektor einer in der Untermannigfaltigkeit verlaufenden Kurve ; ein Normalenvektor ist ein Vektor, der auf der Untermannigfaltigkeit senkrecht steht. Dies lässt sich so präzisieren:
Definition. Sei M C ]Rn eine Untermannigfaltigkeit und a E M. Ein Vektor v E ]Rn heißt Tangentialvektor an M im Punkt a, wenn es eine stetig differenzierbare Kurve
a:]-E,E[ --+Mc]Rn,
(E>O)
gibt mit
a(O) = a und
a'(O)
= v,
siehe Bild 9.2. Die Gesamtheit aller Tangentialvektoren an M in a werde mit T a(M) bezeichnet. Ein Normalenvektor von M in a ist ein Vektor w E ]Rn, der auf allen Tangentialvektoren v E Ta(M) senkrecht steht (bzgl. der kanonischen euklidischen Metrik von R"). Die Menge aller Normalenvektoren von M in a werde mit Na(M) bezeichnet.
Satz 3. Sei M C ]Rn eine k-dimensionale Untermannigfaltigkeit und a E Mein Punkt. Dann gilt:
I. Differentialrechnung im !Rn
112
M
Bild 9.2 Tangentialvektor a) Ta(M) ist ein k-dimensionaler Vektorraum. Eine Basis von Ta(M) lässt sich so erhalten: Sei
ep : V
-----+
M C Rn
ein lokales Koordinatensystem von M in der Umgebung von a, d.h. V C Rk offen und ep eine Immersion, die V homöomorph auf Mn U abbildet, wobei U C Rn eine offene Umgebung von a ist. Sei t; E V der Punkt mit ep(t.) = a. Dann bilden die Vektoren
oep
oep
atl
atk
-=;- (t. ),. .. , -=;- (t. ) eine Basis von Ta(M).
b) Na(M) ist ein (n - k)-dimensionaler Vektorraum. Eine Basis von Na(M) lässt sich so erhalten: Seien I1 ,... ,fn-k : U -----+ R stetig differenzierbare Funktionen in einer offenen Umgebung U C Rn von a mit Mnu = {x EU: fi(x) = ... = In-k(x) = O}
und Rang
o(fi,··· ,fn-k) (a) = n - k. O(XI, ... ,xn )
Dann bilden die Vektoren gradjj(a),
j= 1,oo.,n-k,
eine Basis von Na(M).
§ 9 Untennannigfaltigkeiten
113
Beweis. Wir bezeichnen mit V den Vektorraum, der von den Vektoren
Clcp Clcp -Cl(t*),oo., -Cl(t*) tl
tk
aufgespannt wird und mit W den Vektorraum, der von den Vektoren gradf;(a),
j= 1,oo.,n-k,
aufgespannt wird und zeigen (a)
V C Ta(M),
(b)
W c Na(M).
Aus Dimensionsgründen folgt dann in (a) und (b) sogar Gleichheit. (a) Sei v E V, also v=
k
Clcp
L ci-Clti (t*) i=1
mit
Ci E lR.
Wir definieren die Kurve
a:] -e,e[ ---t Me lRn durch a(s) := cp(t* + (Cl, ... ,Ck)S), Dies ist definiert für [s] < e, wenn e > 0 genügend klein gewählt worden ist. Mit der Kettenregel folgt
da k Clcp -d (0) = LCi- (t*) = v E Ta(M). Clti S i=1 (b) Aufgrund seiner Definition ist Na(M) ein Vektorraum. Es genügt also zu beweisen, dass gradf;(a) E Na(M) für alle j. Dazu müssen wir zeigen, dass gradf;(a) aufjedem Tangentialvektor senkrecht steht. Sei also v E Ta(M) beliebig. Dann ist v = a'(0) mit einer ganz in M verlaufenden stetig differenzierbarenKurve a:] -e,e[ ---t M
mita(O)
= a.
Es giltf;(a(t)) = 0 für alle t E ]-e,e[. Differenziert man diese Beziehung nach
I. Differentialrechnung im IRn
114
t, erhält man n aJ:o = ~ a~ (a)ex;(O) = (grad/;(a) ,ex'(O)) = (grad/;(a), v)
also sind grad/;(a) und v orthogonal, q.e.d. Extrema mit Nebenbedingungen Satz 4. Sei U C IRn offen und M C U eine r-codimensionale Untermannigfaltigkett, M
= {x
EU: gl (x)
= ... = gr(x) = O},
mit stetig differenzierbaren Funktionen gj : U -> IR und
R; jur a11ex EM. Rang a(gI, ... ,gr) (x ) -r a(XI," ., xn )
Weiter sei F : U -> IR eine stetig differenzierbare Funktion, so dass F I M in einem Punkt a E M ein lokales Maximum (Minimum) besitzt, d.h . es gibt eine Umgebung V C U von a mit F(x) :;;; F(a)
(bzw. F(x) ~ F(a)) jUr alle x E Mn V.
Dann ist gradF(a) ein Normalenvektor von M in a, d.h. es existieren Konstanten 1..1, ... ,1..r E JR, so dass r
gradF(a) =
L 1..jgradgj(a).
j=1
Man sagt, der Punkt a sei ein lokales Extremum von F unter der Nebenbedingung {gI = ... = gr = O}. Die 1..j werden Lagrangesche Multiplikatoren genannt.
Beweis. Ist
c : ]-e,e[
--+
Me IRn
eine stetig differenzierbare Kurve in M mit ex(0) t~F(ex(t))
= a, so hat die Funktion
§ 9 Untennannigfaltigkeiten
115
bei t = 0 eine lokales Extremum, also gilt
d
n
fJF
0= dl(a(t))lt=o = ~ fJxi (a)a:(O) = (gradF(a),a'(O)), d.h, gradF( a) steht senkrecht auf allen Tangentialvektoren von M in a, q.e.d.
(9.2) Beispiel. Sei A = (aij) E M(n x n,IR) eine symmetrische n x n-Matrix und F: IRn -IR die zugehörige quadratische Form, d.h .
F(x) = (x,Ax) = 'LaijXiXj. i,j Wir wollen die Extrema von F unter der Nebenbedingung IIxll chen. Dazu setzen wir
= 1 untersu-
g(x) := (x,x) -1 = 'LxT -1, i
M:= {x E IRn : g(x) = O} = {x E IRn : Ilxll = 1} und wenden Satz 4 an. Da fJgjfJxk = 2xk, gilt gradg(x) = 2x =1= 0
für alle x E M.
da a/ci = aik. Das bedeutet
gradF(x) = 2Ax. Daher lautet die notwendige Bedingung aus Satz 4 für die Existenz eines lokalen Extremums von F auf M im Punkt a E M
Aa=M
für ein geeignetes
A. E IR,
d.h. a ist ein Eigenvektor von A und der Lagrangesche Multiplikator ist der zugehörige Eigenwert. Andrerseits wissen wir, da M kompakt ist, dass die ste-
I. Differentialrechnung im IRn
116
tige Funktion F aufM ihr Maximum in einem gewissen Punkt a E Mannimmt. Dieses a muss nach dem gerade Gesagten ein Eigenvektor von A sein. Da
F(a) = (a,Aa) = (a,M) = 1.., ist der Funktionswert an dieser Stelle gleich dem Eigenwert von a. Damit folgt also, dass die Funktion F auf M ihr absolutes Maximum in einem Eigenvektor zum größten Eigenwert annimmt. (Analoges gilt für das absolute Minimum.) Gleichzeitig ist damit bewiesen, dass jede reelle symmetrische Matrix mindestens einen rellen Eigenvektor mit einem reellen Eigenwert besitzt. (Daraus kann man dann durch Induktion schließen, dass alle Eigenwerte reell sind.) AUFGABEN 9.1. Die Funktionen f,g: IR3
-t
IRseien definiert durch
f(x,y,z) :=~+xy-y-z,
g(x,y,z) :=al+3xy-2y-3z.
Man zeige, dass
C := {(x,y,z) E IR3 : f(x ,y,z) = g(x,y,z) = O} eine eindimensionale Untermannigfaltigkeit des lR3 ist, und dass 0
§ 10 Integrale, die von einem Parameter abhängen
123
ein stetig differenzierbares Vektorfeld in U. Wir suchen eine stetig differenzierbare Funktion f: U
~
gradf = v,
lR mit
d.h.
af
-aXj =Vj
fiiri= 1,. . . ,n.
Falls eine solche Funktion f existiert, ist sie zweimal stetig differenzierbar und nach dem Satz von Schwarz (§5, Satz 1) gilt 2
a f = dlf aXjaXj aXjaXj
fiir alle i ;e j
aVj _ av j
=}
aXj - aXj
.
Eine notwendige Bedingung fiir die Lösbarkeit der Gleichung gradf = v ist also avi/aXj = aVj/aXj fiir alle i;e j . Wir zeigen nun, dass diese Bedingung auch hinreichend ist. Dazu definieren wir die Funktion f : U ~ R durch n
r
1=1
0
l
f(x) := 'L(}o vj(tx)dt)xj . Behauptung. Es gilt aaf = Vj fiir j = 1, ... .n. 'Xj
Beweis. Nach der Produktregel und Satz 2 ist
af(x) -a-. 'X)
=
a 10 1 vj(tx)dt ) Xj+ 'L (li vi(tx)dt )-a ax' 'L ( -a. 0 0
=
~(101 tDjVi(tx)dt)Xi+
i
'X)
I
=
10
1
11 j
vAtx)dt
(t'LDjVi(tX)Xj + vAtx))dt. I
Nun ist (bei festem x E U):
d d dt (tvAtx)) = vAtx) + t d/Atx)
= vAtx) + t'LDiVj(tX)Xi j
= Vj(tx) +t'LDjVi(tX)Xi, j
I.
'X)
I. Differentialrechnung im IRn
124 also
af(x) = -aXj
1 1
0
d (tvAtx))dt = tvAtx) -d t
1 =1
1
1=0
= Vj(x),
q.e.d.
Damit ist insbesondere gezeigt: Dafür, dass ein aufeiner offenen Kugel U C IR 3 stetig differenzierbares Vektorfeld v: U --+ IR3 sich als Gradient einer stetig differenzierbaren Funktion f: U --+ IR darstellen lässt , ist notwendig und hinreichend, dass rotv = O.
Doppelintegrale Seien [a,b]
c IR und [c,d] c IR kompakte Intervalle und
f : [a ,bj x [c, d] -----+ IR eine stetige Funktion. Nach Satz 1 ist die Funktion
F(y) :=
la
b
f(x,y)dx
stetig auf [a ,bj, kann also wieder integriert werden. Man bezeichnet
i
d
F(y)dy =
i
d
(lab f(x,y)dX) dy
als Doppelintegral. Man kann die Funktion f jedoch auch erst bzgl. y und dann bzgl. x integrieren. Der folgende Satz sagt, dass sich dabei derselbe Wert ergibt.
Satz 3. Mit den obigen Bezeichnungen gilt
Beweis. Wir definieren eine Funktion ep: [c,d]
ep(y) :=
l (l b
Y
--+
IR durch
f(x,t)dt)dx.
Es gilt ep( c) = 0 und nach Satz 2 ist ep differenzierbar mit
ep'(y) =
l ~ (l b
Y
f(x,t)dt)dx =
la
b
f(x,y)dx.
§ 10 Integrale, die von einem Parameter abhängen Daraus folgt
l (l d
b
f(x,y )dx) dy =
l
d
125
cp' (y)dy = cp( d) =
l (l b
d
f(x,y)dY) dx,
was zu beweisen war.
Bemerkung. Ein analoger Satz gilt natürlich auch für n-fache Integrale stetiger Funktionen, die auf einem Quader h x . .. x In C Rn definiert sind. Geometrische Interpretation. Anschaulich bedeutet das Doppelintegral
V:=
!cd!ab f(x,y)dxdy
über eine nicht-negative Funktion f : [a, b] x [c, d] ~ R das Volumen des Körpers unter dem Graphen von f, d.h. der Menge
K := {(x,y,z) E [a,b] x [c,d] x R: 0 :::; z:::; f(x,y)} . Die systematische Theorie der Volumenmessung wird erst im 3. Band der Analysis [6] dargestellt. Wir bringen hier nur ein einfaches Beispiel. (10.3) Wir wollen das Volumen der Kugel vom Radius r > 0 im R 3 berechnen. Dazu betrachten wir die folgende stetige Funktion
2 f(x,y):= {Jr2-x _ y2
f: [-r,r] x [-r,r] -+R,
o
fürx2+;:::;?, sonst.
Der Körper unter dem Graphen von f ist dann (bis auf einen Teil der Höhe 0) die obere Hälfte der Kugel
K(r)
= {(x,y,z)
E R 3 : x2
+; +? :::; ?}.
Daher ist
V:= l:rl:/(x,y)dXdy gleich der Hälfte des Volumens von K(r). Für festes y E [-r, r] sei p = p(y) := Jr 2 - y2. Damit ist
F(y)
= /:/(x,y)dx=
= p2
j
I:
p
1t cos2tdt = p2_ 2 -rt/2 rt/ 2
[Subst.x = p sinr]
Vp2-x2dx= 1t
= (~-;)-2
I. Differentialrechnung im IRn
126 und
v=
r F(y)dy = '!!.jr (,-2 - y)dy = '!!.(2? - 2r3/3) = ~31t? 2 2
L,
-r
Es folgt also für das Volumen der dreidimensionalen Kugel vom Radius r die wohlbekannte Formel
Vol(K(r)) = 2V =
~?
Eulersche Differentialgleichungen der Variationsrechnung Wir betrachten folgende Situation: Sei 1:= [a,b] c IR ein kompaktes Intervall und
L: I x IR x IR - . IR,
(t,y,p) - L(t,y,p)
eine zweimal stetig partiell differenzierbare Funktion. Wir bezeichnen mit C2 [a,b] den Vektorraum aller zweimal stetig differenzierbaren Funktionen f : [a,b] - t IR und mit x.. die Teihnenge
x..:= {cp E C2[a,b] : cp(a) =
Ci,
cp(b) =
C2} ,
wobei Cl,C2 E IR vorgegebene Konstanten sind. Wir definieren jetzt ein Funktional (d.h. eine Abbildung) S:x..-.IR,
cp-S(cp):= lbL(t,cp(t), cp'(t)) dt.
Das Problem der Variationsrechnung besteht nun darin, S( cp) zu minimieren, d.h. ein cp E x.. zu finden, so dass S(cp) = inf{S('II) : '11 E
x..}.
Satz 4. Mit den obigenBezeichnungen gilt: Eine notwendigeBedingungdafür, dass S(cp) = inf'l'E~:S('II) ist das Bestehen der Eu1erschen Differentialgleichung
~ ~~ (t, cp(t), cp'(t)) - ~~ (t, cp(t) , cp'(t)) = O.
§ 10 Integrale, die von einem Parameter abhängen
127
Beweis. Sei cp E 1( eine Funktion mit S( cp) ::;; S('!') 2[a,b]
undg E C
für alle qrE 1(
eine beliebige Funktion mit
g(a) =g(b) = O. Für jedes e E R ist dann cp + eg E 1( und damit S(cp)::;; S(cp+eg). Wir definieren jetzt die Funktion F: R ---+ R durch
F(e) :=S(cp+eg). Diese Funktion F besitzt für e = 0 ein Minimum, also gilt
dF (0) = O.
de Mit Satz 2 erhält man
dF
de (e) =
=
b a Jar al(t,cp(t) +eg(t),cp'(t) + eg'(t))dt
l (~~ b
(.. .)g(t) +
~~ (...)g'(t)) dt,
Dabei stehen die Pünktchen (...) für (t, cp(t) + eg(t), cp'(t) + eg'(t)). Partielle Integration liefert
baL aL b daL b daL - { g(t)-(-)dt=- { g(t)-(-)dt. Ja( -g'(t)dt=-·g(t) ap ap Ja dt ap Ja dt ap b
Ia
Damit erhält man schließlich
0= dF de (0) =
=
aL (t,cp,cp')g'(t) ) dt Jar (aL ay (t, cp, cp')g(t) + ap b
l
b
(~~ (t,cp,cp') - ~ ~~ (t,cp,cp'))g(t)dt.
(Zur Vereinfachung haben wir nur cp, cp' statt cp(t), cp'(t) geschrieben.) Mit dem
I. Differentialrechnung im IRn
128
anschließend bewiesenen Hilfssatz 3 folgt daraus
oy
op
oL( t ,cp,cp') - dt d oL( t ,cp,cp') = 0,
q.e.d.
Hilfssatz 3. Sei a,b E IR, a < b, und
f : [a ,b]-IR
eine stetige Funktion. Fürjede zweimal stetig differenzierbare Funktion g: [a,b] -
IR mitg(a) =g(b) = 0
gelte
fab f(t)g(t)dt = O. Dann gilt f(t) = Ofür alle tE [a,b]. Beweis. Wegen der Stetigkeit von f genügt es zu zeigen, dass f auf dem offenen Intervall ]a,b[ identisch verschwindet. Angenommen, es sei f(t) =1= 0 für ein t E ]a,b[. Ohne Beschränkung der Allgemeinheit ist f (t ) = : e > O. Dann existiert ein 8 > 0, so dass
[t-8,t+8] c ]a,b[ und
f(x) ~ ~
für alle xE [t- 8,t - 8].
Man kann nun eine zweimal stetig differenzierbare nicht-negative Funktion g: [a, b] ---7lR konstruieren mit
g(t) > 0 und g(x) = 0 für alle x ~ [t - 8,t + 8], vgl. Bild 10.1
-]g(") • I
b
x
Bild 10.1
§ 10 Integrale, die von einem Parameter abhängen Nun folgt
0=
l
b
a
f(x)g(x) dx =
129
11+lI f(x)g(x) dx -2e It+lI g(x)dx> 0, ~
I-li
I-li
Widerspruch! Also ist dochf(t) = 0 für alle tE Ja,b[. (10.4) Beispiel. Seien a, b, Cl, C2 E R, a < b, und
.'K: = {cp E C : cp(a) =
CI,
cp(b) =
C2}'
Mit S(cp) werde die Bogenlänge der Kurve
[a,b]-----+ lR,
t t--+ (t,cp(t)),
d.h. des Graphen von cp, bezeichnet, siehe Bild 10.2.
Y C2 - - - - - - - - - - - - - - - - - - - -V
V
Cl ------
~
y=cp(t)
a
b
Bild 10.2
Nach § 4, Satz 1, gilt
S(cp) =
l VI b
+cp'(t)2dt.
Wir wollen S(cp) minimieren, suchen also die kürzeste Verbindungslinie zwischen den Punkten (a,Cl) und (b,C2). Man kann Satz 4 anwenden, wobei hier die Funktion L eine besonders einfache Gestalt hat:
L(t,y,p)
= Jl + p2.
L hängt also gar nicht explizit von t und y ab, es gilt
dL=O
~1J
OJ
,und
tu. '5l(t,y,p) = op
p J1+P2' 1 +p2
I. Differentialrechnung im IRn
130
Die Eu1ersche Differentialgleichung lautet daher
~ dt
cp'(t)
VI + cp'(t)2
d.h.
cp'(t)
VI +cp'(t)2
= 0
'
= const.
Dies ist aber gleichbedeutend mit cp' (t) = const. Die Funktion cp muss also ein Polynom 1. Grades sein:
cp(t) = a+ßt, wobei die Konstanten c, ß E IR noch so zu bestimmen sind, dass die Randbedingungen cp(a) = CI und cp( b) = C2 erfüllt sind. Das bedeutet: Wenn unser Problem überhaupt eine Lösung besitzt, wird es durch die Verbindungsgerade der Punkte (a,CI) und (b,C2) gelöst. Dass die geradlinige Verbindung tatsächlich minimale Bogenlänge aufweist, kann hier durch einfache geometrische Betrachtungen gezeigt werden. Im Allgemeinen ist es bei Variationsproblemen aber schwierig zu zeigen, dass das Minimum tatsächlich angenommen wird. Bemerkung. Satz 4 lässt sich leicht wie folgt auf höhere Dimensionen verallgemeinern: Gegeben sei eine zweimal stetig differenzierbare Funktion
L: [a ,b] x IRn x IRn (t,YI, ... ,Yn,PI,... ,Pn)
----> f-4
IR,
L(t,Yl,· ··,Yn,PI, .. · ,Pn).
Mit 'l( sei die Menge aller zweimal stetig differenzierbaren vektorwertigen Funktionen cp = (CPI, ... , CPn) : [a, b]
---->
IRn
mit cp(a) = Cl und cp(b) = C2 bezeichnet, wobei C)'C2 E IRn vorgegebene Vektoren sind. Ein reelles Funktional S: 'l( -+ IR werde definiert durch S(cp):=
!ab L(t,CPI(t), ... ,CPn(t),cp;(t), ... ,cp~(t))dt.
Ist dann cp E 'l( eine Funktion mit S(cp) = inf{S(",) : '" E 'l(},
§ 10 Integrale, die von einem Parameter abhängen
131
so gelten die Eulerschen Differentialgleichungen
d ~L (t,q>(t) ,1
11.3. Man bestimme eine Lösung der Differentialgleichung
x-y y' = x+y'
(x+y > 0),
durch den Punkt (XO,yo)
= (0,1) .
149
§ 12 Existenz- und Eindeutigkeitssatz Nachdem wir im vorigen Paragraphen die Lösungen einiger einfacher spezieller Differentialgleichungen studiert haben, beweisen wir jetzt einen allgemeinen Existenzund Eindeutigkeitssatz. Dabei behandeln wir sogleich Systeme gewöhnlicher Differentialgleichungen 1. Ordnung. Dies liefert gleichzeitig einen Existenz- und Eindeutigkeitssatz für Differentialgleichungen höherer Ordnung, da sich diese auf Systeme von Differentialgleichungen I. Ordnung zurückführen lassen.
Definition. Sei G C IR x IRn eine Teilmenge und
f : G ~ IR n,
(x,y) - f(x,y)
eine stetige Funktion. Dann nennt man
y' = f(x,y)
(1)
ein System von n Differentialgleichungen erster Ordnung. Unter einer Lösung von (1) versteht man eine auf einem Intervall 1 C IR differenzierbare vektorwertige Funktion 0, so dass 0, so dass [XI ,XI + ö] C I. Da cp und ljI stetig sind, gilt CP(XI) = ljI(XI ). Nach a) gibt es ein e > 0 mit
cp(x) =ljI(x) fürallexElnBe(XI) . Dies steht aber im Widerspruch zur Definition von XI. Daher gilt cp(x) für alle X EI mit X ;;;: xo. c) Analog zeigt man cp(x)
= ljI(x)
= ljI(x)
für alle X E I mit X ~ xo.
(12.1) Beispiel. Wir geben ein Beispiel einer Differentialgleichung an, für die
der Eindeutigkeitssatz nicht gilt:
y' =1/3
(definiert in lRx R).
Eine spezielle Lösung ist CPo(x) := 0 für alle X E R. Da die Differentialgleichung eine mit getrennten Variablen ist, lassen sich die Lösungen im Bereich y i= 0 mit § 11, Satz I, bestimmen. Man sieht aber leicht direkt, dass für belie biges a E lRdie Funktion
'IIa: R ---+ R,
X f-t 'IIa(x) := -b(x-a)3
die Differentialgleichung erfüllt, denn 'lIa(x)
cpo(a) = 'IIa(a) = 0,
= !(x -
af = ljIa(xf/3. Da
154
11. Gewöhnliche Differentialgleichungen
ist der Eindeutigkeitssatz verletzt. Es gibt aber noch unendlich viele andere Lösungen 'IjI:R ----> R mit 'IjI(a) = O. Seien b,c beliebige reelle Konstanten mit b~a~cund
'IjIb(X) 'IjI(x):=
{
0
'IjIc(x)
für x ~ b, für b <x< c, für x ~ c,
siehe Bild 12.1. Die Funktion ur ist auf ganz R differenzierbar, erfüllt die Differentialgleichung ur' = '1j12/3, und es gilt 'IjI(a) = O.
Bild 12.1 Nach Satz 3 kann also die Funktion f(x,y) = y2/3 nicht überall einer Lipschitzbedingung genügen. Zwar ist f für y =I- 0 partiell nach y differenzierbar mit
~ _ ~ -1/3 ayf(x,y) - 3Y , und nach Satz 2 genügt deshalb f in R x R* lokal einer Lipschitz-Bedingung. Jedoch erfiillt f in keiner Umgebung eines Punktes (a, 0) eine Lipschitz-Bedingung.
Satz 4 (Existenzsatz von Picard-Lindelöf). Sei GeR x Rn offen und f: G----> Rn eine stetige Funktion. die lokal einer Lipschitz-Bedingung genügt. Dann
gibt es zu jedem (a, c) E G ein e > 0 und eine Lösung k + 1. Es gilt
CJlk+2(X) - CJlk+1 (x) =
l
x
xo
(/(t, CJlk+1 (t)) - f(t, CJlk(t))) dt.
Dies liefert die Abschätzung IICJlk+2(X) - CJlk+1 (x) 11 :s;; L
s:
k+11
",KL
11~ IICJlk+1 (t) - CJlk(t) 11dt I
{X It-xol
Jxo
k!
Damit ist (3) bewiesen. Wir setzen r:= sup{lx-xol : x EJ} < 00.
k
1_
dt -K
k+1 Lk+1Ix-xol (k+l)!
.
168
11. Gewöhnliche Differentialgleichungen 00
Es folgt, dass die unendliche Reihe Reihe
L
k=O
(CPHl -CPk) aufJ durch die konvergente
KI, Lkyk =Ktfr k=O
k!
majorisiert wird, also dort gleichmäßig konvergiert . Daher ist die Funktion 00
cp:= limcpk=cpo+ I,(CPk+l-CPk) k-+oo
k=O
aufganz I stetig und die Konvergenz ist aufjedem kompakten Teilintervall von I gleichmäßig. Für die Limes-Funktion gilt daher die Intergralgleichung
i:
cp(x)=c+ rxf(t,cp(t))dt
für alle x EI,
d.h. cP ist eine Lösung der gegebenen Differentialgleichung mit der Anfangsbedingung cp(xo) = c, q.e.d.
Homogene Gleichungen Wie bei linearen Gleichungssystemen ist es auch bei linearen Differentialgleichungen zweckmäßig, sich zunächst mit den Lösungen der homogenen Gleichung zu beschäftigen. Satz 2. Sei I C lR ein nicht-triviales Intervall und A :I
-+
M(n x n,J[{)
eine stetige matrixwertige Funktion. Wir bezeichnen mit LH die Menge aller Lösungen der homogenen linearen Differentialgleichung
y' =A(x)y. Dann ist LH ein n-dimensionaler Vektorraum über K Für ein k-tupel von Lösungen CPl, ... ,CPk E LH sindfolgende Aussagen gleichbedeutend:
i) Die Funktionen CPl, . . . ,CPk sind linear unabhängig über K ii) Es existiert ein Xo E I, so dass die Vektoren CPl (xo), ... , CPk(XO) E J[{n linear unabhängig sind.
§ 13 Lineare Differentialgleichungen
169
iii) Für jedes Xo E I sind die Vektoren CPI (Xo) , .•. ,CPk(XO) E IKn linear unabhängig. Beweis. a) Wir beweisen zunächst, dass LH ein Untervektorraum des Vektorraums aBer Abbildungen f :I ---+ IKn ist. Dazu ist dreierlei zu zeigen:
1. Trivialerweise gilt 0 E LH .
2.
Seien cP, 'IjI ELH, also cp' = Acp und '11' = A'IjI. Dann ist auch CP+'IjI differenzierbarmit
(cp + 'IjI)' = cp' +'11' = Acp+A'IjI = A(cp+'IjI), d.h, CP+'IjI E LH. 3. Sei cP E LH und I.. E IK. Dann ist
(Acp)' = ACP' = Mcp = A(Acp), d.h. ACP E LH. b) Wir zeigen jetzt die Äquivalenz der Aussagen i) bis iii) . Die Implikationen iii) => ii) => i) sind trivial. Es ist daher nur noch die Implikation i) => iii) zu beweisen. Seien also CPI, . •. ,CPk E LH linear unabhängig und Xo E I. Angenommen, die Vektoren CPI (xo), ... ,CPk(XO) wären linear abhängig. Dann gäbe es Konstanten AI, ... ,Ak E 1K, die nicht alle gleich null sind, so dass
AI CPI (xo) +...+ AkCPk(xo) = O. Wir betrachten die Lösung
cP := AI CPI + ... + AkCPk E LH· Es gilt cp(xo) = O. Wegen der Eindeutigkeit der Lösung zu gegebener Anfangsbedingung muss cP identisch null sein. Das heißt aber, dass cP I , ... ,CPk linear abhängig sind, Widerspruch! c) Wir zeigen jetzt dimLH
= n.
Seien el, .. •, en die kanonischen Einheitsvektoren des IKn und Xo E I. Nach Satz I gibt es Lösungen CPI, ... , CPn E LH mit cPj{xo) = ej . Diese Lösungen sind linear unabhängig, da sie an der Stelle Xo unabhängig sind. Also gilt dimLH ~
n.
170
11. Gewöhnliche Differentialgleichungen
Andrerseits ist dim L H ~ n, denn sonst gäbe es n + I linear unabhängige Lösungen 'IjI1, . . . , 'IjIn+1 und wegen iii) müssten die Vektoren 'IjI1(xo),
.. .,'IjIn+1 (xo)
E ][{n
linear unabhängig sein, was offensichtlich unmöglich ist. Damit ist Satz 2 vollständig bewiesen. Um alle Elemente eines Vektorraums zu kennen, genügt es, eine Basis des Vektorraums zu kennen . Dies gibt Anlass zu folgender Begriffsbildung.
Definition. Unter einem Lösungs-Fundamentalsystem der Differentialgleichung y' = A (x)y versteht man eine Basis (' = (CP1, "" cp~), AcI> = (Acpl, ... ,Acpn). Also gilt cI>' = AcI>. (13.1) Beispiel. Wir betrachten das Differentialgleichungssystem
Yl = -OOY2, { Yi = IDyI, wobei 00 E IR eine Konstante ist. Dieses System lautet in Matrizenschreibweise
Man sieht unmittelbar, dass folgende Funktionen cP k : IR ~ IR 2 Lösungen sind: cos rox) , CP2(X):= (-sinrox) . CPl (x) : = ( . smrox
cosrox
Die Lösungen sind linear unabhängig, denn für die Matrix (x)
=
cos rox . ( smrox
-Sinrox) cosrox
= 1 für alle x E IR.
Inhomogene Gleichungen Wir kommen jetzt zu den inhomogenen Gleichungen. Der folgende Satz zeigt den Zusammenhang zwischen den Lösungen der inhomogenen Gleichung und der zugeordneten homogenen Gleichung.
Satz 3. Sei I A :I
C
----+
IR ein Intervall und seien
M(n x n,][{)
und
b: I
----+ ][{n
172
11. Gewöhnliche Differentialgleichungen
stetige Abbildungen. Wir bezeichnen mit LH den Vektorraum al/er Lösungen cp: I - t ][{n der homogenen Differentialgleichung
y' =A(x)y und mit LI die Menge al/er Lösungen "': I algleichung
- t ][{n
der inhomogenen Differenti-
y' =A(x)y+b(x) . Dann gilt für beliebiges "'0 E LI LI =
"'0 + LH.
Mit anderen Worten: Man erhält die allgemeine Lösung der inhomogenen Gleichung als Summe einer speziellen Lösung der inhomogenen Gleichung und der allgemeinen Lösung der homogenen Gleichung.
Beweis. a) Wir zeigen zunächst LI C "'0 +LH. Sei", E LI beliebig vorgegeben. Wir setzen cp := '" - "'0, Dann gilt
cp' = "" -% = (A",+b) - (A"'o+b) =A(",-",o) =Acp, d.h. cp E LH. Da", = "'0 + cp, folgt '" E "'0 + LH. b) Wir zeigen jetzt "'0 +LH C LI. Sei", E "'0 + LH, d.h, '" = "'0 + cp mit cp E LH. Dann gilt
"" = %+cp' = (A",o +b) +Acp =A",+b, d.h. '" E LI, q.e.d. Um eine inhomogene lineare Differentialgleichung vollständig zu lösen ist also neben der Lösung der homogenen Gleichung nur die Kenntnis einer einzigen Lösung der inhomogenen Gleichung notwendig. Eine solche kann man sich durch die Methode der Variation der Konstanten beschaffen.
Satz 4 (Variation der Konstanten). Mit den Bezeichnungen von Satz 3 gilt:
Sei = (CPl," ., CPn) ein Lösungs-Fundamentalsystem der homogenen Differentialgleichung
y' =A(x)y.
§ 13 Lineare Differentialgleichungen Dann erhält man eine Lösung "': I chung
---+
173
IKn der inhomogenen Differentialglei-
y' = A(x)y + b(x) durchden Ansatz ",(x) = «I>(x)u(x). Dabei ist u:I ---+ IKn eine differenzierbare Funktion mit «I>(x)u'(x) = b(x). d.h. u(x) =
l
x
xo
«I>(t)-lb(t)dt+const.
Beweis. Aus", = «I>u folgt "" = «I>'u+«I>u', A", + b = Au + b.
Da ' = A, gilt "" = A", + b genau dann, wenn u' = b, q.e.d. (13.2) Beispiel. Wir behandeln das Differentialgleichungssystem
= -Y2 , { ;'i~ =Yt+x,
(*)
oder in Matrizen-Schreibweise
Nach Beispiel (13.1) ist
(x) = (c~sx
-sinx) cosx
smx
ein Lösungs-Fundamentalsystem des homogenen Systems. Die inverse Matrix ist
«I>(X)-l = (
c~sx
-smx
Sinx) cosx '
also
(x)-tb(x) = (
c~sx
-smx
SinX) (0) cosx x
=
(xsinx) .
xcosx
174
11. Gewöhnliche Differentialgleichungen
Damit ergibt sich
U(X)=jX (tsint) dt+const. tcost
o
Nun berechnet man mittels partieller Integration
/ xsinxdx = -xcosx+sinx, / xcosxdx =
xsinx+cosx,
man kann also
u(x) = (-XC?Sx+sinx) xsmx+cosx wählen. Damit ergibt sich eine spezielle Lösung der inhomogenen Gleichung als
\jI(x) = 0).
Dabei ist p ein reeller Parameter. Ihre Lösungen heißen Zylinderfunktionen der Ordnungp. Sie bilden nach der allgemeinen Theorie einen zweidimensionalen Vektorraum . Eine spezielle Basis bildet die sog. Bessel-Funktion p-ter Ordnung Jp zusammen mit der Neumannsehen Funktion p-ter Ordnung Np. Die Funktionen liegen tabelliert vor, vgl. z.B. Jahnke-Emde-Lösch: Tafeln höherer Funktionen, Teubner, Stuttgart. Die Funktionen sind auch in ComputeralgebraSystemen direkt verfügbar, Z.B. in Maple unter den Namen BesselJ(p,x) und BesselY(p, x) . Die Bedeutung der Besselschen Differentialgleichung beruht auf ihrem Zusammenhang mit der Wellengleichung der Raumdimension zwei .
Satz 3. Sei f: JR,+- --4 C eine zweimal stetig differenzierbare Funktion und p eine ganze Zahl. Mittels ebener Polarkoordinaten (r, q». x
= rcoso,
y
= rsinq>
werde eine Funktion u: JR2 -!),
b)
xl(l- x)y" + 2x(2 - x)y' + 2(1 +x)y = xl
(0 < x< 1).
Anleitung. Die zugehörige homogene Gleichung besitzt eine spezielle Lösung der Gestalt y = eCl.>: im Fall a) und y = x ß im Fall b) mit geeigneten Konstanten
c, ß E IR. Eine weitere Lösung der homogenen Gleichung erhält man mit Satz 2. Eine spezielle Lösung der inhomogenen Gleichung bestimme man durch Zurückführung auf ein System 1. Ordnung und Variation der Konstanten. 14.6. Man bestimme ein Lösungs-Fundamentalsystem der Besselschen Differentialgleichung für p =
!,
, I ,+ (1- 4x1)y=o
y' +~y
durch den Ansatz z =
2
Vi y.
14.7. Sei C"(IR:+-) der Vektorraum aller beliebig oft differenzierbaren Funktionen j: IR:+- ---+ IR. Lineare Abbildungen
Tp,Sp,B p: C"(IR~)
---+ C"(lR~)
seien wie folgt definiert:
(Tpf)(x) := /(x)+E j(x) , x (Spf)(x) := -/(x) +E j(x) , x (Bpf)(x) := /'(x) +
~/(x) + (1- ::)j(x).
(Die Besselsche Differentialgleichung lässt sich dann einfach als Bpy = 0 schreiben.) a) Man zeige: Für jedes j E C"(IR:+-) gilt
i)
Tp+1Spj = j -Bpj,
ii)
Sp-lTpj=j-Bpj,
iii)
TpBpj = Bp-lTpj,
198 iv)
11. Gewöhnliche Differentialgleichungen
SpBp!
= Bp+lSpf.
b) Sei Vp := {j E C"'(R+.) : Hp! = O} der Vektorraum aller Zylinderfunktionen der Ordnung p. Man zeige: i)
Tp(Vp) C Vp-l,
Sp(Vp) C Vp+l.
ii) Die Abbildungen
Sp:Vp ---+ Vp+l
Tp+l: Vp+l ---+ Vp
und
sind Isomorphismen und Umkehrungen von einander. c) Man bestimme mittels b) und Aufgabe 14.6 alle Zylinderfunktionen der Ordnungen p = 3/2 und p = 5/2.
14.8. a) Seien e, ß, y,p reelle Konstanten, Lösungen der Differentialgleichung
y"
I 2a ( a +~ y' + (ßyxY-l)2 +
ß > 0, y=f:. O. Man zeige, dass für die
2 p2A.2) ~2r y = 0,
(x> 0),
gilt y(x) = xlXu(ßxY), wobei u eine Lösung der Besselschen Differentialgleichung zum Parameter p ist. b) Man drücke die Lösungen der folgenden Differentialgleichungen mit Hilfe von Zylinderfunktionen aus (a, b, m ER):
i)
y" +a2x"'y = 0
ii)
y"
iii)
(a =f:. O,m =f:. -2),
+ (I - a(ax~ 1))y = a
b2 4x
y" + -y' + -y = 0, x
0,
(b =f:. 0).
c) Man löse die Differentialgleichungen i) und iii) in den Ausnahmefällen m = -2undb=0.
199
§ 15 Lineare Differentialgleichungen mit konstanten Koeffizienten Für lineare Differentialgleichungen n-ter Ordnung mit konstanten Koeffizienten gibt es eine sehr befriedigende Lösungstheorie. Die Lösung einer solchen Differentialgleichung ist äquivalent mit der Bestimmung der Nullstellen eines Polynoms n-ten Grades.
Polynome von DitTerentialoperatoren Wir bezeichnen mit qT] die Menge aller Polynome
P(T) =ao+a1T+ ... +anrn mit komplexen Koeffizienten ak in der Unbestimmten T. Ersetzt man hierin die Unbestimmte T durch D =
Jx, so erhält man einen "Differentialoperator'
P(D) =ao+a1D+ .. .+anDn, d.h. eine Abbildung, die einer auf einem Intervall I differenzierbaren Funktion
f:I--+C,
c
~
definierten, n-mal
x 1-+ f(x) ,
die Funktion
zuordnet. Mit Hilfe dieser Differentialoperatoren schreibt sich eine homogene Differentialgleichung n-ter Ordnung mit konstanten Koeffizienten einfach als
P(D)y= 0, wobei PE qT] ein Polynom n-ten Grades mit höchstem Koeffizienten I ist. Wir wollen jetzt zeigen, dass man mit Polynomen von Differentialoperatoren ganz analog rechnen kann wie mit gewöhnlichen Polynomen. a) Addition. Seien P1 (T),P;,(T) E qT] und
P(T) := P1 (T) + P;,(T). O. Forster, Analysis 2, DOI 10.1007/978-3-8348-8103-8_15, © Vieweg+Teubner Verlag | Springer Fachmedien Wiesbaden GmbH 2011
200
11. Gewöhnliche Differentialgleichungen
Dann gilt für jede genügend oft differenzierbare Funktion f: 1-+ C P(D)f=p\(D)f+P2(D)f· Beweis. Sei n
p\ (T) = L akT k und
m
P],(T) = L bkT k.
~o
~o
Man kann o.B.d.A. annehmen, dass m = n. (FalIs etwa m bm+1 = ... = b n = 0.) Dann ist n
P(T) = L (ak+bk)T
< n ergänze
man
k.
~o
Damit ergibt sich n n n P(D)f = L(ak+bk)Dkf= L akDkf + L bkDkf ~o
~o
~o
= PI(D)f+P2(D)f· b) Multiplikation. Seien PI (T), P2(T) E C [Tl und Q(T) := PI (T)P2(T). Dann gilt für jede genügend oft differenzierbare Funktion f: 1-+ C
Beweis. Ist PI (T)
=
n
L avTv
und
n+m L Ck T k k=O
mit
v=o
P2(T)
=
m
L bpTP, p=o
so folgt Q(T)
=
k
Ck = L avbk-v.
v=o
(Dabei ist av = 0 für v > n und bp = 0 für /l
> m zu setzen.) Damit ergibt sich
Q(D)f= nfCkDkf= nf(±avbk_V)Dkf ~o
~o
v=o
§ 15 Lineare Differentialgleichungen mit konstanten Koeffizienten
20 I
Wir beschäftigen uns jetzt mit der Wirkung von Differentialpolynomen P(D) auf Funktion der speziellen Gestalt fex) = eAx, wobei A. eine reelle oder komplexe Konstante ist.
Hilfssatz 1. Für jedes PolynompeT) E C[T] undjedes A. E C gilt P(D)eAx =P(A.)eAx. Beweis. Sei peT) =
n
L akTk,
k=O
d Da DeAx = _ eAx = A.eAx, folgt DkeAx = A.keAx und dx
P(D)eAx =
n
n
k=O
k=O
L akDkeAx = L akA.keAx = P(A.)eAx ,
q.e.d.
Insbesondere folgt aus Hilfssatz 1: Ist A. eine Nullstelle des Polynoms P, d.h. P(A.) = 0, so ist die Funktion k
da die A.k paarweise von einander verschieden sind. Also sind nach § 13, Satz 5, die Lösungen 0,
a E JR* ,
(3)
beschreibt die Schwingung eines harmonischen Oszillators der Eigenfrequenz COo unter der Wirkung einer periodischen äußeren Kraft a cosrot der Frequenz 0). Zur Vereinfachung betrachten wir wieder die komplexe Differentialgleichung
x+ coöx = aeimt .
(4)
In diesem Fall ist
Um eine spezielle Lösung der inhomogenen Gleichung zu finden, haben wir zwei Fälle zu unterscheiden.
§ 15 Lineare Differentialgleichungen mit konstanten Koeffizienten
211
1. FalI: m=J mo. Man erhält eine Lösung von (4) durch den Ansatz \fI(t) = ceirot • Es ist
P(D)\fI(t) = c(mö - m2)eirot, also ist
\fI(t) =
a
mö- m2
eirot
eine Lösung von (4) und
ot . Einsetzen ergibt
P(D) (cteia>ot) = 2icmoeia>ot. Die Differentialgleichung P(D)x
x = \,r(t) = _a_ teia>ot ,..
2imo
= aeia>ot ist also erfüllt für die Funktion
'
also besitzt (3) im Resonanzfall die Lösung
\fI(t) = Re\fl(t) = 2~ t sinmot. Man sieht, dass die Amplitude der Lösung im Resonanzfall für t ~ 00 unbeschränkt wächst (sog. Resonanzkatastrophe). Dies gilt für jede Lösung der inhomogenen Gleichung, da alle Lösungen der homogenen Gleichung beschränkt sind.
212
11. Gewöhnliche Differentialgleichungen
AUFGABEN
15.1. Man bestimme ein reelles Fundamentalsystem von Lösungen für die folgenden Differentialgleichungen: a)
s" - 4y'+4y =
b)
y'''-2y'' +2y' -y = 0,
c)
y'''-y=O, y(4)+y=0.
d)
0,
15.2. Man bestimme alle Lösungen der folgenden Differentialgleichungen: a)
y" +3y' +2y = 2,
b)
y" - 5y' + 6y = 4xtf - sinx,
c)
y'''-2y'' +y' = I +tfcos2x, y(4) +2y" +y = 25eh.
d)
15.3. Man bestimme alle reellen Lösungen der Differentialgleichung
i+ 2,u.i+ roöx = acosrot,
(COO, ro,p. E IR~,a E IR*),
und untersuche deren asymptotisches Verhalten für t -+
00.
15.4. Gegeben sei die Differentialgleichung
y"
a
b
+ -y' + x-y= 0, 2 X
(x> 0),
wobei a, b E C Konstanten seien. Man zeige: Eine Funktion