Numerische Mathematik 2 (Numerik Partieller Differentialgleichungen) Rolf Rannacher
Institut f¨ ur Angewandte Mathematik Universit¨at Heidelberg
Vorlesungsskriptum SS 2006 5. September 2006
ii
Adresse des Autors: Institut f¨ ur Angewandte Mathematik Universit¨at Heidelberg Im Neuenheimer Feld 293/294 D-69120 Heidelberg, Deutschland
[email protected] http://www.numerik.uni-hd.de
Inhaltsverzeichnis Literaturverzeichnis
vi
0 Einleitung
1
0.1
Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
0.2
Ableitung von partiellen Differentialgleichungen . . . . . . . . . . . . . . . . . . .
4
0.3
Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
0.4
Numerische Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
1 Theorie partieller Differentialgleichungen
9
1.1
Typeneinteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
1.2
Elliptische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
1.2.1
Existenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
1.2.2
Eindeutigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
1.2.3
Stetige Abh¨ angigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.2.4
Regularit¨ at . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
Hilfsmittel aus der Theorie von Funktionenr¨aumen . . . . . . . . . . . . . . . . .
23
1.3.1
Sobolew-R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
1.3.2
Eigenschaften von Lebesgue- und Sobolew-R¨aumen . . . . . . . . . . . . .
26
1.3.3
Elemente der Spektraltheorie elliptischer Operatoren . . . . . . . . . . . .
30
1.4
Parabolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
1.5
Hyperbolische Probleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
38
1.6
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
1.3
2 Differenzen-Verfahren fu ¨ r elliptische Probleme 2.1
2.2
2.3
2.4
45
Allgemeine Differenzenapproximationen . . . . . . . . . . . . . . . . . . . . . . .
45
2.1.1
Konsistenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
Eigenschaften der Differenzengleichungen . . . . . . . . . . . . . . . . . . . . . .
51
2.2.1
Das Konvergenzverhalten von Differenzenverfahren . . . . . . . . . . . . .
55
L¨osungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
2.3.1
Aufwandsanalyse: ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . .
64
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
67
iii
iv
INHALTSVERZEICHNIS
3 Finite-Elemente-Verfahren fu ¨ r elliptische Probleme 3.1
71
Allgemeine Projektionsverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
3.1.1
Beispiele von Galerkin-Ansatzr¨aumen . . . . . . . . . . . . . . . . . . . .
76
3.1.2
Diskretes Maximumprinzip f¨ ur Finite-Elemente-Approximationen . . . . .
81
3.1.3
Approximation krummer R¨ander . . . . . . . . . . . . . . . . . . . . . . .
84
3.2
Allgemeine Finite-Elemente-Ans¨atze . . . . . . . . . . . . . . . . . . . . . . . . .
88
3.3
Interpolation mit finiten Elementen . . . . . . . . . . . . . . . . . . . . . . . . . .
97
3.4
A priori Fehleranalyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 3.4.1
3.5
3.6
3.7
Punktweise Fehlerabsch¨atzung . . . . . . . . . . . . . . . . . . . . . . . . 107
Implementierungsaspekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 3.5.1
Aufbau der Systemmatrizen und Vektoren . . . . . . . . . . . . . . . . . . 115
3.5.2
Konditionierung der Systemmatrix . . . . . . . . . . . . . . . . . . . . . . 117
3.5.3
Aufstellung der Systemmatrizen mit numerischer Integration . . . . . . . 120
A posteriori Fehleranalyse und Gittersteuerung . . . . . . . . . . . . . . . . . . . 129 3.6.1
Allgemeine a posteriori Fehlerabsch¨atzung . . . . . . . . . . . . . . . . . . 129
3.6.2
Spezielle a posteriori Fehlersch¨atzer . . . . . . . . . . . . . . . . . . . . . 133
3.6.3
Strategien zur Gittersteuerung . . . . . . . . . . . . . . . . . . . . . . . . 138
3.6.4
Ein Testbeispiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
4 Iterative L¨ osungsverfahren fu ¨ r FD- und FE-Gleichungen 4.1
4.2
4.3
Krylow-Raum-Methoden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 4.1.1
Verfahren der konjugierten Richtungen (CG-Verfahren) . . . . . . . . . . 155
4.1.2
CG-Verfahren f¨ ur unsymmetrische und indefinite Probleme . . . . . . . . 160
4.1.3
Vorkonditionierung (PCG-Verfahren) . . . . . . . . . . . . . . . . . . . . . 161
Mehrgitterverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 4.2.1
Mehrgitteralgorithmus im Finite-Elemente-Kontext . . . . . . . . . . . . . 165
4.2.2
Konvergenz- und Aufwandsanalyse . . . . . . . . . . . . . . . . . . . . . . 170
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5 Verfahren fu ¨ r parabolische Probleme 5.1
153
179
Differenzenverfahren f¨ ur parabolische Probleme . . . . . . . . . . . . . . . . . . . 183 5.1.1
Zeitschrittverfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
5.1.2
Stabilit¨ at und Konvergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
INHALTSVERZEICHNIS
5.2
v
FE-Galerkin-Verfahren f¨ ur parabolische Probleme . . . . . . . . . . . . . . . . . . 199 5.2.1
A priori Konvergenzabsch¨atzungen . . . . . . . . . . . . . . . . . . . . . . 200
5.2.2
Fehlerkontrolle und Schrittweitensteuerung . . . . . . . . . . . . . . . . . 204
5.3
Verallgemeinerungen und L¨ osungsaspekte . . . . . . . . . . . . . . . . . . . . . . 211
5.4
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
6 Verfahren fu ¨ r hyperbolische Probleme
217
6.1
Differenzenverfahren f¨ ur hyperbolische Probleme . . . . . . . . . . . . . . . . . . 217
6.2
Finite-Elemente-Verfahren f¨ ur hyperbolische Probleme . . . . . . . . . . . . . . . 224
6.3
Verallgemeinerungen und L¨ osungsaspekte . . . . . . . . . . . . . . . . . . . . . . 226
6.4
¨ Ubungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
Index
229
vi
INHALTSVERZEICHNIS
Literaturverzeichnis [1] R. Rannacher: Numerische Mathematik 0 (Einf. in die Numerische Mathematik), Vorlesungsskriptum, Universit¨ at Heidelberg, http://numerik.uni-hd.de/∼lehre/notes/ [2] R. Rannacher: Numerische Mathematik 1 (Numerik Gew. Differentialgleichungen), Vorlesungsskriptum, Universit¨ at Heidelberg, http://numerik.uni-hd.de/∼lehre/notes/ (I) Theorie partieller Differentialgleichungen [3] G. Hellwig: Partielle Differentialgleichungen, B.G. Teubner 1960. [4] A. Friedman: Partial Differential Equations, Holt, Rinehart und Winston 1970. [5] F. John: Partial Differential Equations, Springer 1978. [6] J. Wloka: Partielle Differentialgleichungen, Sobolewr¨ aume und Randwertaufgaben, B.G. Teubner 1982. [7] W. R. Strauss: Partial Differential Equations: An Introduction, John Wiley 1992. [8] M. Renardy, R. Rogers: An Introduction to Partial Differential Equations, Springer 1993. [9] A. Tveito, R. Winther: Introduction to Partial Differential Equations: A Computational Approach, Springer 1998. (II) Numerik partieller Differentialgleichungen [10] R. D. Richtmeyer, K. W. Morton: Difference Methods for Initial Value Problems, Interscience 1967. [11] G. Strang, G. J. Fix: An Analysis of the Finite Element Method, Prentice-Hall 1973. [12] A. R. Mitchell: Computational Methods in Partial Differential Equations, John Wiley 1976. [13] A. R. Mitchell, R. Wait: The Finite Element Method in Partial Differential Equations, John Wiley 1977. [14] P. G. Ciarlet: The Finite Element Method for Elliptic Problems, North-Holland 1978. [15] A. R. Mitchell, D. F. Griffiths: The Finite Difference Method in Partial Differential Equations, John Wiley 1980. vii
viii
LITERATURVERZEICHNIS
[16] O. Axelsson, V. A. Barker: Finite Element Solution of Boundary Value Problems, Theory and Computation, Academic Press 1984. [17] V. Thome: Galerkin Finite Element Methods for Parabolic Problems, Springer 1984. [18] W. Hackbusch: Theorie und Numerik elliptischer Differentialgleichungen, B. G. Teubner 1986. [19] C. Johnson: Numerical Solution of Partial Differential Equations by the Finite Element Method, Cambridge University Press 1987. [20] H. R. Schwarz: Methode der finiten Elemente, B. G. Teubner 1991. [21] W. Hackbusch: Iterative L¨ osung großer schwachbesetzter Gleichungssysteme, B. G. Teubner 1991. [22] F. Brezzi, M. Fortin: Mixed and Hybrid Finite Element Methods, Springer 1991. [23] D. Braess: Einf¨ uhrung in die Methode der Finiten Elemente, Springer 1991. [24] Ch. Großmann, H.-G. Roos: Numerik partieller Differentialgleichungen, B. G. Teubner 1992. [25] H. Goering, H.-G. Roos, L. Tobiska: Finite-Elemente-Methode, Akademie-Verlag 1993. [26] S. C. Brenner, L. R. Scott: The Mathematical Theory of Finite Element Methods, Springer 1994. [27] A. Quarteroni, A. Valli: Numerical Approximation of Partial Differential Equations, Springer 1994. [28] K. Eriksson, D. Estep, P. Hansbo, C. Johnson: Computational Differential Equations, Cambridge University Press 1996. [29] P. Knabner, L. Angermann: Numerik partieller Differentialgleichungen, Springer 2000.
0 Einleitung Gegenstand dieser Vorlesung sind numerische Algorithmen zur n¨aherungsweisen L¨osung von partiellen Differentialgleichungen. In der Regel lassen sich f¨ ur die in der Praxis auftretenden partiellen Differentialgleichungen keine L¨osungen in analytischer Form angeben. Man ist also auf numerische Approximation angewiesen. Dabei wird das kontinuierliche Ausgangsproblem durch ein diskretes“, d.h. endlich dimensionales, ersetzt und dieses dann mit Hilfe des Computers ” gel¨ost.
0.1 Notation Wir stellen zu¨ achst einige der im folgenden verwendeten Begriffe und abk¨ urzenden Bezeichnungen zusammen. i) Unabh¨ angige Variable: Wir betrachten (offene beschr¨ankte) Gebiete Ω ⊂ Rd f¨ ur d = 1, 2, 3 mit Rand ∂Ω. Der ¨ außere Normaleneinheitsvektor zu ∂Ω ist n. Punkte im Rd sind x = T (x1 , ..., xd ) oder im R3 auch (x, y, z)T . Die Zeitvariable ist t. F¨ ur d-dimensionale Vekto1 ren a, b wird das u ¨ bliche euklidische Produkt mit (a, b) oder auch mit a · b bezeichnet. Die euklidische Vektornorm ist kak := (a, a)1/2 und die zugeh¨orige nat¨ urliche Matrizennorm kAk := maxx∈Rd {kAxk, kxk = 1}. ii) Funktionen: Wir betrachten im allgemeinen skalare Funktionen u = u(x) oder u = u(x, t) f¨ ur Argumente x ∈ Rd bzw. t ∈ R. In einigen F¨allen treten auch vektorwertige Funktionen auf u = (u1 , ..., ud )T , die im allgemeinen wie skalare Funktionen bezeichnet werden. Analog werden Skalarprodukte und Normen u ur skalare wie f¨ ur vektorwertige ¨ ber ein Gebiet Ω unterschiedslos f¨ Funktionen verwendet. iii) Ableitungen: F¨ ur Funktionen u(t) , u(x) bzw. u(x, t) werden totale sowie partielle Ableitungen abgek¨ urzt geschrieben als dt u :=
du , dt
∂t u :=
∂u , ∂t
∂x u :=
∂u , ∂x
∂i u :=
∂u , ∂xi
u.s.w.
und analog auch f¨ ur h¨ ohere Ableitungen, z.B.: ∂tp u und ∂xq u . Mit dem Nabla-Operator ∇ werden der Gradient einer skalaren Funktion sowie die Divergenz einer Vektorfunktion geschrieben als grad u = ∇u := (∂1 u, ..., ∂d u)T und div u = ∇ · u := ∂1 u1 + ... + ∂d ud . Zu einem Vektor β ∈ Rd wird die Ableitung in Richtung β mit ∂β u := β · ∇u bezeichnet. Entsprechend ist z.B. ∂n u = n · ∇u die Ableitung in Richtung der ¨außeren Normalen entlang des Gebietsrandes ∂Ω . Kombination von Divergenz- und Gradientenbildung ergibt den sog. Laplace2 -Operator“ ” ∇ · (∇u) = ∆u = ∂12 u + ... + ∂d2 u. Mit dem Symbol ∇m u bezeichnen wir den Tensor aller partiellen Ableitungen der Ordnung m von u ; z.B. in zwei Dimensionen ∇2 u = (∂xi ∂yj u)i+j=2 . 1
Euklid (ca. 355-290 v. Chr.): griechischer Philosoph und Mathematiker; wirkte in Alexandria; sein mehrb¨ andigen Lehrbuch “Die Elemente” faßte die Grundlagen der klassischen Geometrie zusammen; von ihm stammt das klassische mathematische Ausdrucksschema “Voraussetzung - Behauptung - Beweis”. 2 Pierre Simon Marquis de Laplace (1749-1827): franz¨ osischer Mathematiker und Astronom; Prof. in Paris; begr¨ undete u.a. die Wahrscheinlichkeitsrechnung.
1
2
Einleitung
iv) Integrals¨ atze: F¨ ur st¨ uckweise glatt berandete Gebiete Ω ⊂ Rd und hinreichend glatte Funktionen u, v gelten der klassische Integralsatz von Gauß3 Z Z n · u do, (0.1.1) ∇ · u dx = ∂Ω
Ω
sowie als Folgerung die Integralformel von Green4 Z Z Z u∆v dx. u∂n v do − ∇u · ∇v dx =
(0.1.2)
Ω
∂Ω
Ω
v) Funktionenr¨ aume: Auf Punktmengen Ω ∈ Rd verwenden wir die u ¨blichen Vektorr¨aume von stetigen bzw. stetig differenzierbaren Funktionen C(Ω),
C m (Ω),
C0∞ (Ω).
Der Raum C(Ω) ist, versehen mit der Maximumnorm kuk∞;Ω := max |u(x)|, x∈Ω
vollst¨andig, d.h. ein Banach-Raum5 . Weiter ist L2 (Ω) der Raum der auf Ω meßbaren und im Lebesgueschen Sinne quadratintegrablen Funktionen. Versehen mit dem Skalarprodukt und der zugeh¨origen Norm Z u(x)v(x) dx,
(u, v)Ω :=
Ω
1/2
kukΩ = (u, u)Ω ,
ist L2 (Ω) vollst¨ andig, d.h. ein Hilbert-Raum6 . Wenn der Definitionsbereich Ω aus dem Zusammenhang klar ist, wird er in der Bezeichnung von Skalarprodukten und Normen meist weggelassen; z.B.: kuk = kukΩ . Weitere Funktionenr¨aume werden sp¨ater an den Stellen eingef¨ uhrt, wo sie gebraucht werden. vi) Ungleichungen: Wir listen einige der im folgenden h¨aufig verwendeten Ungleichungen f¨ ur Funktionen aus den oben definierten Funktionenr¨aumen. F¨ ur Funktionen u, v ∈ L2 (Ω) gilt die H¨oldersche7 Ungleichung“ ” Z Z 1/2 Z 1/2 |u(x)|2 dx |v(x)|2 dx u(x)v(x) dx ≤ , (0.1.3) Ω
3
Ω
Ω
Carl Friedrich Gauß (1777-1855): bedeutender deutscher Mathematiker, Astronom und Physiker; wirkte in G¨ ottingen. 4 George Green (1793-1841): englischer Mathematiker; Autodidakt und Besitzer einer M¨ uhle; Beitr¨ age zur Potentialtheorie. 5 Stefan Banach (1892-1945): polnischer Mathematiker; Prof. in Lvov; begr¨ undete die Funktionalanalysis. 6 David Hilbert (1862-1943): bedeutender deutscher Mathematiker; wirkte in K¨ onigsberg und G¨ ottingen; begr¨ undete u. a. den axiomatischen Aufbau der Mathematik; zum Wesen der Axiomatik (in der Geometrie) sagte er “Man muß jederzeit anstelle von Punkten, Geraden, Ebenen - Tische, St¨ uhle, Bierseidel sagen k¨ onnen”. 7 Ludwig Otto H¨ older (1859-1937): deutscher Mathematiker; Prof. in T¨ ubingen; Beitr¨ age zun¨ achst zur Theorie der Fourier-Reihen und sp¨ ater vor allem zur Gruppentheorie; fand 1884 die nach ihm benannte Ungleichung.
0.1 Notation
3
bzw. in kompakter Schreibweise: |(u, v)|Ω ≤ kukΩ kvkΩ . F¨ ur Funktionen u ∈ C(Ω) ∩ C 1 (Ω) mit 2 den Eigenschaften u|∂Ω = 0 und |∇u| ∈ L (Ω) gilt die Poincar´esche8 Ungleichung“ ” Z 1/2 Z 1/2 |u(x)|2 dx |∇u(x)|2 dx ≤ dΩ , (0.1.4) Ω
Ω
bzw. in kompakter Schreibweise: kukΩ ≤ dΩ k∇ukΩ , wobei dΩ := diam(Ω) .
8 ´ Jules Henri Poincar´e (1854-1912): franz¨ osischer Mathematiker; Prof. an der Ecole Polytechnique und der Sorbonne in Paris; eins der letzten mathematischen Universalgenies; fundamentale Beitr¨ age zu allen Bereichen der Mathematik, zur Himmelsmechanik, Str¨ omungsmechanik und Wissenschaftsphilosophie.
4
Einleitung
0.2 Ableitung von partiellen Differentialgleichungen
Partielle Differentialgleichungen werden meist als mathematische Modelle zur Beschreibung physikalischer Vorg¨ ange abgeleitet. Ziel ist es, die Eigenschaften dieser Vorg¨ange durch die Gleichungen m¨oglichst vollst¨ andig zu erfassen und davon ausgehend dann ihren Ablauf vorherzusagen. Bei der Konstruktion solcher Gleichungen geht man h¨aufig nach recht formalen Regeln vor und verwendet Analogieschl¨ usse. V¨ ollig unterschiedliche physikalische Prozesse lassen sich h¨aufig durch Gleichungen sehr ¨ ahnlicher Gestalt beschreiben. i) Harmonische (d.h. schwingende“) Ausbreitungsvorg¨ange sind z.B. die Ausbreitung einer Was” serwelle (lokale St¨ orung der Wasseroberfl¨ache) oder eines Ger¨auschs (lokale St¨orung der Luftdichte). Es erscheint sinnvoll, diese im einfachsten Fall durch eine Funktion u = u(x, t) im Ort x und der Zeit t der Form u(x, t) = sin(x) sin(t) zu beschreiben. Diese gen¨ ugt der Differentialgleichung ∂t2 u = ∂x2 u.
(0.2.5)
Es zeigt sich, daß diese sog. Wellengleichung“ tats¨achlich die in der Natur auftretenden Schwin” gungsvorg¨ange beschreibt. Sie ist der Prototyp einer hyperbolischen“ Differentialgleichung. ” ii) Andere Ausbreitungsvorg¨ ange sind dadurch gekennzeichnet, daß lokale St¨orungen nicht schwingend, sondern diffundierend“ und sich abschw¨achend fortgepflanzt werden, z.B.: Temperatur” ausbreitung in einem Leiter (W¨ armeleitung) oder Verteilung einer Dichtekonzentration in einer Fl¨ ussigkeit (Stofftransport). Zur Beschreibung solcher Vorg¨ange dienen Funktionen der Form u(x, t) = sin(x) e−t . Diese gen¨ ugen der Differentialgleichung ∂t u = ∂x2 u.
(0.2.6)
Es zeigt sich, daß diese sog. W¨ armeleitungsgleichung“ tats¨achlich die in der Natur auftreten” den Diffusionsvorg¨ ange beschreibt. Sie ist der Prototyp einer parabolischen“ Differentialglei” chung. In Fall zweier Raumdimensionen, u = u(x, y, t) , lautet die W¨armeleitungsgleichung unter Ber¨ ucksichtigung von externen W¨ armequellen ∂t u = ∂x2 u + ∂y2 u = ∆u + f.
(0.2.7)
iii) Der Grenzzustand f¨ ur t → ∞ eines Diffusionsprozesses u(x, y, t) , z.B. beschrieben durch die W¨armeleitungsgleichung (0.2.7), ist als L¨osung der sog. Poisson9 -Gleichung“ ” −∆u = −∂x2 u − ∂y2 u = f,
(0.2.8)
gegeben. Diese ist der Prototyp einer elliptischen“ Differentialgleichung. ”
9 Sim´eon Denis Poisson (1781-1840): franz¨ osischer Mathematiker und Physiker; Prof. in Paris; Beitr¨ age zur mathematischen Formulierung der Physik, zum Magnetismus, zur Himmelsmechanik und Wahrscheinlichkeitsrechnung; einer der Begr¨ under der Potentialtheorie.
0.3 Beispiele
5
0.3 Beispiele Die folgenden Beispiele aus verschiedenen Wissenschaftsdisziplinen vermitteln einen Eindruck von der Vielf¨ altigkeit der auftretenden Probleme. 1. Erhaltungsgleichungen Die Grundgleichungen der (klassischen) Kontinuumsmechanik basieren auf dem physikalischen Grundprinzip der Erhaltung“, d.h.: Zustandsgr¨oßen wie z.B. Massedichte ρ(x, t), innere Ener” gie bzw. Temperatur T (x, t), Impuls ρ(x, t)~v (x, t), u.s.w., werden als Dichtefunktionen beschrieben, deren Integrale u ¨ber beliebige bewegte Kontrollvolumen“ sich beim Fehlen von ¨außeren ” Einfl¨ ussen nicht ver¨ andern. F¨ ur die zeitliche Ver¨anderung der Masse mV (t) eines solchen mit dem Geschwindigkeitsfeld v = (v1 , v2 , v3 ) bewegten Volumens V (t) gilt (sog. Reynoldsches10 ” Transporttheorem“) Z Z {∂t ρ + ∇ · (ρv)} dx. (0.3.9) ρ(x, t) dx = 0 = dt mV (t) = dt V (t)
V (t)
Da dies f¨ ur beliebige Volumen V (t) gelten soll, ergibt sich f¨ ur stetige Dichtefunktionen die folgende Erhaltungsgleichung 1. Ordnung (sog. Kontinuit¨atsgleichung“): ” ∂t ρ + ∇ · (ρv) = 0.
(0.3.10)
Auf analogem Wege erh¨ alt man aus dem Erhaltungssatz f¨ ur die Temperatur unter Ber¨ ucksichtigung von Quelltermen und W¨ armediffusion in einem ruhenden Medium ( ~v ≡ 0) die folgende Erhaltungsgleichung 2. Ordnung (sog. W¨armeleitungsgleichung“): ” ∂t T − ∇ · (a∇T ) = ∇ · q,
(0.3.11)
Physikalische Anschauung erfordert, daß L¨osungen zu diesen Gleichungen bei physikalisch sinnvollen Anfangs- und Randbedingungen stets positiv sind: ρ > 0, T > 0 . Wir werden sehen, daß dies tats¨achlich der Fall ist. Die entsprechenden Erhaltungss¨atze f¨ ur Impuls und Drehimpuls f¨ uhren unter geeigneten zus¨ atzlichen Annahmen zusammen mit der Kontinuit¨atsgleichung auf die bekannten Navier11 -Stokes12 -Gleichungen“ f¨ ur inkompressible, Newtonsche Fluide mit kon” stanter Dichte und Temperatur ( ρ ≡ konst., T ≡ konst.): ∂t v − ν∆v + v · ∇v + ∇p = f,
∇ · v = 0.
(0.3.12)
Diese werden hier aber nur der Vollst¨ andigkeit halber formuliert und im Laufe dieser Vorlesung nicht n¨aher betrachtet. 10
Osborn Reynolds (1842-1912): englischer Ingenieur und Mathematiker; Prof. in Manchester; Beitr¨ age zur Theorie des Elektro-Magnetismus und der Str¨ omungslehre, Fundamente der Turbulenzbeschreibung und der hydrodynamischen Stabilit¨ at. 11 Claude Louise Marie Henri Navier (1785-1836): franz¨ osischer Bauingenieur und Mathematiker; Prof. an der ´ Ecole Polytechnique in Paris; Beitr¨ age zum Br¨ uckenbau (erste Theorie der H¨ angebr¨ ucke), Elastizit¨ atstheorie und Str¨ omungsmechanik. 12 Sir Georg Gabriel Stokes (1819-1903): englischer Mathematiker und Physiker; Prof. in Cambridge; Beitr¨ age zur Differential- und Integralrechnung, zur Hydrodynamik und zur Theorie des Lichts, Spektralanalyse und Fluoreszenz.
6
Einleitung
2. Variationsgleichungen Die Grundgleichungen der (klassischen) Elastizit¨atstheorie basieren auf dem physikalischen Grundprinzip der Energieminimierung“, d.h.: Der von einem elastischen K¨orper unter statischer ” ¨außerer Belastung eingenommene Zustand ist so betimmt, daß er die potentielle Gesamtenergie des Systems minimiert. Zur Beschreibung eines elastischen Systems werden in der linearen Theorie die folgenden Gr¨ oßen verwendet: der Verschiebungsvektor u , der Verzerrungstensor achenorientierte (symmetrische) Spannungstensor σ und die Voluε(u) := 12 (∇u + ∇uT ) , der fl¨ menkraft f . Die Spannungen σ sind die Reaktionskr¨afte des K¨orpers auf von außen erzwungene Verzerrungen ε(u) und werden idealisierend in einer linearen Beziehung angenommen, dem sog. (elastischen) Materialgesetz“, σ = Aε(u) , mit dem symmetrischen und positiv definiten Elasti” zit¨atstensor A . Die potentielle Gesamtenergie des belasteten, elastischen K¨orpers schreibt sich dann in der Form: Z Z Z Z 1 1 f u dx = f u dx. (0.3.13) σ : ε(u) dx − Aε(u) : ε(u) dx − E(u) = 2 Ω 2 Ω Ω Ω Die sich unter der ¨ außeren Belastung einstellende Verschiebung in einen neuen Gleichgewichtszustand u∗ verleiht dann E(·) einen minimalen Wert unter allen zul¨assigen Verschiebungen, d.h. solchen mit denselben Randwerten. F¨ ur einen solchen optimalen Zustand u∗ gilt dann notwendig d E(u∗ + εϕ)|ε=0 = 0, dε f¨ ur beliebige zul¨ assige“ Variationen ϕ . Auswertung dieser Beziehung liefert die sog. Variati” ” onsgleichung“ (Aε(u), ε(ϕ))Ω = (f, ϕ)Ω
∀ zul¨assigen“ ϕ. ”
(0.3.14)
Dabei bedeutet zul¨ assig“ f¨ ur eine Testfunktion ϕ, daß sie hinreichend glatt ist und entlang des ” Randes ∂Ω verschwindet. Nimmt man an, daß das Minimum u hinreichend glatt ist, so folgt durch partielle Integration (∇ · Aε(u) + f, ϕ)Ω = 0 ∀ zul¨assigen“ ϕ, ” und hieraus das Differentialgleichungssystem 2. Ordnung (in kompakter sowie ausf¨ uhrlicher Schreibweise) −∇ · Aε(u) = f
⇔
−
d d X X
∂i Aijkl εkl (u) = fj
(j = 1, ..., d).
(0.3.15)
i=1 k,l=1
Der wohl einfachste (mehrdimensionale) Spezialfall eines elastisch deformierten K¨orpers ist die eingespannte Membran“ in einem (beschr¨ankten) Gebiet Ω ⊂ R2 (Trommelfell). Hier wird ” eine Belastung nur in vertikaler Richtung zugelassen f~ = (0, 0, f ) und entsprechend auch nur die Auslenkung in vertikaler Richtung ~u = (0, 0, u) ber¨ ucksichtigt. Der Elastizit¨atstensor ist diagonal und wird hier der Einfachheit halber zu A = aI gesetzt. Dann nimmt das obige Funktional der potentiellen Gesamtenergie die Form an E(u) = 12 ak∇uk2Ω − (f, u)Ω ,
(0.3.16)
0.3 Beispiele
7
und die zugeh¨ orige Differentialgleichung ( Poisson-Gleichung“) lautet ” −a∆u = f,
in Ω.
(0.3.17)
Da die Membran am Rand eingespannt sein soll, muß weiter u|∂Ω = 0 sein. In einer elastischen Membran wirken als Gegenkr¨afte zur Belastung reine Federkr¨afte (in vertikaler Richtung) und keine Biegemomente. Dies ist begr¨ undet durch die Vernachl¨assigung der Dicke der Membran. Flache K¨ orper mit (konstanter) positiver, aber geringer Dicke werden als Platten“ bezeichnet. Im Rahmen der linearen Kirchhoffschen Plattentheorie“ werden ” ” zwar Biegemomente ber¨ ucksichtigt, aber nur vertikale Verschiebungen zugelassen ( Kirchhoff” Hypothese“). Im Fall kleiner Verschiebungen (gegen¨ uber der Plattendicke) erh¨alt dann die potentielle Gesamtenergie die Form E(u) = 21 Dk∆uk2Ω + (1 − σ)D (∂12 u, ∂22 u)Ω − k∂1 ∂2 uk2Ω − (f, u)Ω ,
mit Materialparametern σ ∈ (0, 1), D > 0 . Die zul¨assigen Funktionen m¨ ussen in diesem Fall quadratintegrable zweite Ableitungen besitzen. Durch den Variationsansatz wie oben erh¨alt man als notwendige (und hinreichende) Bedingung f¨ ur ein Energieminimum die sog. Plattengleichung“ ” D∆2 u = f.
(0.3.18)
Aus naheliegenden Gr¨ unden wird der Operator 4. Ordnung ∆2 auch biharmonischer Opera” tor“ genannt. Ist die Platte am Gebietsrand eingespannt“, so m¨ ussen die Randbedingungen ” u|∂Ω = 0, ∂n u|∂Ω = 0 erf¨ ullt sein. Wir merken an, daß ein identisches Modell bei der Beschreibung viskoser, inkompressibler Str¨ omungen in zwei Raumdimensionen als Gleichung f¨ ur die sog. Stromfunktion“ ϕ auftritt; das Geschwindigkeitsfeld ergibt sich dabei durch Rotationsbildung ” u := (∂y ϕ, −∂x ϕ)T . 3. Schwingungsgleichungen Wenn der elastische K¨ orper unter Belastung zeitliche Schwingungen ausf¨ uhren kann, so wird die zugeh¨orige Auslenkung eine Funktion des Orts und der Zeit, u(x, t), und gen¨ ugt im Rahmen der linearen Theorie der sog. elastische Schwingungsgleichung“ ” ∂t2 u − ∇ · Aε(u) = f.
(0.3.19)
Die Gleichung f¨ ur die frei schwingende Membran ist die klassische Wellengleichung“ ” ∂t2 u = a∆u.
(0.3.20)
Diese beschreibt allgemein die Ausbreitung von Wellen in schwingf¨ahigen Medien (z.B. Schallwelle in einem Gas, Auslenkung einer elastischen Membran oder die Amplitude eines elektrischen Feldes). Sie wird u ¨ blicherweise zusammen mit Randbedingungen“ u|∂Ω = 0 sowie Anfangsbe” ” dingungen“ u|t=0 = u0 , ∂t u|t=0 = u1 betrachtet.
8
Einleitung
0.4 Numerische Methoden Aus den oben skizzierten Wegen zur Herleitung von partiellen Differentialgleichungen gewinnt man unmittelbar Ans¨ atze zu deren Diskretisierung. 1. Differenzenverfahren Ersetzt man die Ableitungen in den Differentialgleichungen (0.2.5), (0.2.6), (0.2.7) und (0.2.8) durch geeignete Differenzenquotienten bez¨ uglich eines regul¨aren Punktegitters, gewinnt man lineare Gleichungen f¨ ur die zugeh¨ origen diskreten“ Funktionswerte. Dies ist eine sog. Differen” ” zenapproximation“ der Differentialgleichung. Die Eigenschaften solcher Differenzengleichungen, d.h. ihre L¨osbarkeit und Approximationsg¨ ute, werden weiter unten eingehend behandelt. 2. Finite-Volumen-Verfahren Die lokale Erhaltungseigenschaft (0.3.9) f¨ uhrt dadurch auf ein numerisches Verfahren, daß man f¨ ur die L¨osung einen bzgl. einer endlichen Zerlegung des Gebiets Ω in Teilvolumina (z.B. Dreiecke oder Vierecke) st¨ uckweise konstanten Ansatz macht und die G¨ ultigkeit der Erhaltungseigenschaften daf¨ ur auf jedem der sog. Kontrollvolumen fordert. Dies f¨ uhrt auf ein algebrai” ” sches Gleichungssystem f¨ ur die zugeh¨ origen Zellmittelwerte. Dieser Diskretisierungsansatz wird Finite-Volumen-Methode“ genannt. Derartige Methoden finden haupts¨achlich im Bereich der ” numerischen Str¨ omungsmechanik Anwendung. Wegen ihrer eingeschr¨ankten Anwendbarkeit und schwierigen Analysierbarkeit werden wir uns mit dieser Methodenklasse in dieser Vorlesung nicht weiter befassen. 3. Variationsmethoden ( Methode der finiten Elemente“) ” Die Variationsgleichung (0.3.14) f¨ uhrt durch Einschr¨ankung auf einen endlich dimensionalen Teilraum Vh des L¨ osungsraums des kontinuierlichen Variationsproblems auf eine diskrete Variationsaufgabe (Aε(uh ), ε(ϕh ))Ω = (f, ϕh )Ω
∀ zul¨assigen“ ϕh ∈ Vh . ”
(0.4.21)
Dies ist a¨quivalent zu einem linearen (quadratischen) Gleichungssystem f¨ ur die Entwicklungskoeffizienten der diskreten L¨ osung uh bzgl. einer geeignet gew¨ahlten Basis des Ansatzraumes Vh . Sind die Funktionen in Vh st¨ uckweise polynomial bzgl. einer Zerlegung des Gebiets Ω z.B. in Dreiecke oder Vierecke gew¨ ahlt, liegt eine sog. Finite-Elemente-Methode“ vor. Diese Methoden ” werden unten sehr ausf¨ uhrlich behandelt.
1 Theorie partieller Differentialgleichungen In diesem Kapitel wird eine Einf¨ uhrung in die Theorie der partiellen Differentialgleichungen gegeben, soweit sie f¨ ur deren numerische Behandlung relevant ist. Wir betrachten zun¨achst lineare Differentialgleichungen zweiter Ordnung der Form Lu := −
d X
aij ∂i ∂j u +
d X
aj ∂j u + au = f,
(1.0.1)
j=1
i,j=1
mit gegebenen Koeffizientenfunktionen aij , aj , a und rechter Seite f . Wenn diese Funktionen nicht zus¨atzlich von der unbekannten L¨osung u abh¨angen, nennt man die Gleichung linear“. ” Wegen der Vertauschbarkeit der Reihenfolge der Ableitungen kann o.B.d.A. aij = aji angenommen werden. F¨ ur allgemeine nichtlineare Gleichungen F (x, u, ∇u, ∇2 u) = 0
(1.0.2)
gibt es keine einheitliche L¨ osungstheorie. Wir beschr¨anken uns im folgenden daher im wesentlichen auf lineare Probleme. Differentialgleichungen werden in der Regel auf (beschr¨ankten oder halbbeschr¨ankten) Gebieten Ω ⊂ Rd betrachtet. Dazu kommen dann noch Bedingungen entlang des Randes ∂Ω. Die geeignete Wahl dieser Randbedingungen“ ist eine sehr delikate Sache und erfordert eingehende ” Ber¨ ucksichtigung der speziellen Eigenschaften des Differentialoperators. Diesen wird der n¨achste Abschnitt gewidmet sein. Damit eine Differentialgleichung mit den zugeh¨origen Randbedingungen ein sinnvolles Modell eines realen physikalischen Vorgangs ist, sind eine Reihe von Forderungen zu stellen: i) Existenz von L¨ osungen in einem m¨ oglicherweise verallgemeinerten Sinne; unter einer klassi” schen“ L¨osung versteht man eine solche, f¨ ur die alle auftretenden Ableitungen im Gebietsinnern im strengen Sinne definiert sind und die bis an den Rand stetig ist, d.h.: u ∈ C 2 (Ω) ∩ C(Ω). ii) Eindeutigkeit der L¨ osungen m¨ oglicherweise unter Hinzunahme von weiteren physikalisch motivierten Bedingungen. iii) Stetige Abh¨ angigkeit von den Daten wegen der meist inexakten Verf¨ ugbarkeit von Koeffizienten und Randdaten in den physikalischen Modellen; L¨osungen sollten sich unter kleinen Datenst¨orungen auch nur wenig ¨ andern. Eine Aufgabe, welche diesen Minimalforderungen gen¨ ugt, nennt man wohl-gestellt“ (im Sinne ” von Hadamard1 ). Bei Anfangs- oder Randwertaufgaben gew¨ohnlicher Differentialgleichungen war die Regularit¨at der L¨ osung kein besonderes Thema, da sich die Regularit¨at der Daten direkt auf die entsprechende der L¨ osung u agt. Bei partiellen Differentialgleichungen ist dies nicht immer ¨ bertr¨ der Fall und bedarf f¨ ur verschiedene Typen von Differentialgleichungen gesonderter Untersuchung. 1 Jacque Salomon Hadamard (1865-1963): franz¨ osischer Mathematiker; Prof. in Bordeaux und Paris; viele wichtige Beitr¨ age zur komplexen Analysis und speziellen Funktionen, zur analytische Zahlentheorie, zur Variationsrechnung und zu den Differentialgleichungen der mathematischen Physik.
9
10
Theorie partieller Differentialgleichungen
1.1 Typeneinteilung Partielle Differentialgleichungen lassen sich in drei Haupttypen einteilen: die elliptischen“, die ” parabolischen“ und die hyperbolischen“ Gleichungen. Wir werden das dieser Unterteilung ” ” zugrunde liegende Prinzip anhand einer leicht u ¨ berschaubaren Situation erl¨autern. Dies sind die linearen, skalaren Gleichungen 2. Ordnung in zwei Variablen: Lu = a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u + a1 ∂x u + a2 ∂y u + au = f mit konstanten Koeffizienten aij . Dabei sollen nicht alle drei Koeffizienten a11 , a12 , a22 der Ableitungen zweiter Ordnung gleichzeitig Null sein. Diese Gleichung wird auf einem Gebiet Ω ⊂ R2 betrachtet. Ausgangspunkt ist ein direkter L¨ osungsansatz, wie er auch bei gew¨ohnlichen Differentialgleichungen angewendet werden kann. F¨ ur die Anfangswertaufgabe u′ (t) = f (t, u(t)),
t ≥ 0,
u(0) = u0 ,
erh¨alt man aus der Vorgabe u(0) = u0 durch sukzessives Differenzieren von f (t, x) Formeln f¨ ur alle Ableitungen von u : u(i) (0) =
di−1 f (0, u0 ) =: f (i−1) (0, u0 ), dti−1
i = 1, 2, 3, ... .
Wenn die Ableitungen f (i−1) nicht zu schnell wachsen (f¨ ur f (t, x) = sin(x) sind sie z.B. gleichm¨aßig beschr¨ ankt), konvergiert f¨ ur kleine Zeiten 0 ≤ t ≤ T die Taylor2 -Reihe u(t) = u0 +
∞ i X t i=1
i!
f (i−1) (0, u0 )
absolut und stellt die (eindeutige) L¨ osung der Anfangswertaufgabe dar.
y
Ω
n
Γ
x Wir versuchen, diese Konstruktion auf partielle Differentialgleichungen zu u ¨ bertragen. Dazu 2
Brook Taylor (1685-1731): englischer Mathematiker und Sch¨ uler Newtons; die nach ihm benannte Reihenentwicklung war im Kern bereits Gregory, Newton, Leibniz und Johann Bernoulli bekannt.
1.1 Typeneinteilung
11
sei Γ ein Jordan3 -Kurvenst¨ uck in Ω mit beliebig oft differenzierbarer Parametrisierung Γ = {(x(τ ), y(τ )), τ ∈ [0, 1]} . Entlang Γ seien f¨ ur die L¨osung u(x, y) der Differentialgleichung die Funktionswerte u sowie ihre Ableitungen ∂n u in Normalenrichtung n zu Γ vorgegeben. Dies entspricht der Tatsache, daß wir es mit einer Differentialgleichung 2. Ordnung zu tun haben. Mit u und ∂n u ist der ganze Gradient ∇u = (∂x u, ∂y u)T entlang Γ bekannt. Wir wollen versuchen, aus diesen Vorgaben alle weiteren Ableitungen von u entlang Γ zu bestimmen, um damit wieder einen Taylor-Reihenansatz f¨ ur u in einer Umgebung von Γ zu machen. Zu diesem Zweck f¨ uhren wir die Abk¨ urzungen ein: p := ∂x u,
q := ∂y u,
r := ∂x2 u,
s := ∂x ∂y u,
t := ∂y2 u.
Differentiation von p und q entlang Γ , d.h. bzgl. des Parameters τ , ergibt ∂τ p = ∂x p∂τ x + ∂y p∂τ y = r∂τ x + s∂τ y, ∂τ q = ∂x q∂τ x + ∂y q∂τ y = s∂τ x + t∂τ y. mit den bekannten tangentialen Ableitungen ∂τ x und ∂τ y entlang Γ. Zusammen mit der Differentialgleichung Lu = f ergibt dies ein 3 × 3-Gleichungssystem f¨ ur die drei gesuchten Ableitungen r, s, t: a11 r + 2a12 s + a22 t = f − a1 p − a2 q − au ∂τ xr + ∂τ ys
= ∂τ p
∂τ xs + ∂τ yt = ∂τ q mit entlang Γ bekannter rechter Seite. Die Determinante der Koeffizientenmatrix B erh¨alt man durch Entwicklung nach der ersten Zeile zu det B = a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 . Wir unterscheiden jetzt zwei F¨ alle. i) Fall det B 6= 0 entlang ganz Γ: In diesem Fall sind alle zweiten Ableitungen r, s, t von u durch Vorgabe von u, ∂n u entlang Γ (eindeutig) bestimmbar. Durch weitere Differentiation des Gleichungssystems nach x und y erh¨alt man wieder ein System f¨ ur die dritten Ableitungen ∂x r, ∂x s, ∂x t sowie ∂y r, ∂y s, ∂y t jeweils mit derselben Koeffizientenmatrix. Durch weiteres Differenzieren lassen sich so alle h¨oheren Ableitungen von u entlang Γ bestimmen. Durch den Reihenansatz u(x, y) =
X (x − x0 )i (y − y0 )j ∂xi ∂yj u(x0 , y0 ) (i + j)!
i+j≥0
bzgl. eines Punktes (x0 , y0 ) ∈ Γ erh¨ alt man dann in einer Umgebung der Kurve Γ eine L¨osung der Differentialgleichung, die auf Γ die vorgegebenen Werte annimmt. Diese nennt man L¨osung der Cauchyschen4 Anfangswertaufgabe“ der Differentialgleichung bzgl. der Anfangskurve“ Γ. ” ” 3
Marie Ennemond Camille Jordan (1838-1922): franz¨ osischer Mathematiker; Prof. in Paris; Beitr¨ age zur Algebra, Gruppentheorie, Analysis und Topologie. 4 Augustin Louis Cauchy (1789-1857): Ingenieur, Physiker und bedeutendster franz¨ osischer Mathematiker seiner ´ Zeit; wirkte an der Ecole Polytechnique und der Sorbonne in Paris; gilt als Begr¨ under der modernen Analysis und der Funktionentheorie.
12
Theorie partieller Differentialgleichungen
ii) Fall det B = 0 in einem Punkt (x0 , y0 ) ∈ Γ: Die quadratische Gleichung a11 ∂τ y 2 − 2a12 ∂τ x∂τ y + a22 ∂τ x2 = 0 bestimmt gewisse Richtungen ∂τ y/∂τ x = dy/dx bzw. ∂τ x/∂τ y = dx/dy von Kurven (mit Graph y = y(x) oder x = x(y) ) durch den Punkt (x0 , y0 ). Zu deren Bestimmung sei etwa angenommen, daß a11 6= 0 und ∂τ x 6= 0. Dann besitzt die Gleichung dy 2 dx
die L¨osungen
dy dx
+/−
−
=
2a12 dy a22 + =0 a11 dx a11
a12 1 ± a11 a11
q
a212 − a11 a22 .
Diese entsprechen Steigungen von Kurven durch den Punkt (x0 , y0 ) ∈ Γ , entlang welcher die h¨oheren Ableitungen von u sich nicht aus den Vorgaben entlang Γ bestimmen lassen. Entlang dieser kritischen, auch charakteristisch“ genannten Kurven (sog. Charakteristiken“ des Dif” ” ferentialoperators L) l¨ aßt sich also die L¨osung der Differentialgleichung nicht aus den obigen Vorgaben konstruieren. Entlang solcher Kurven k¨onnen Unstetigkeiten in der L¨osung oder ihres Gradienten auftreten. Es ist also sehr wichtig, die Existenz von Charakteristiken und deren Gestalt f¨ ur den zu betrachtenden Differentialoperator vor Ansatz eines numerischen Verfahrens genau zu bestimmen. Offensichtlich h¨angt die Existenz von Charakteristiken allein von den Koeffizienten der h¨ ochsten Ableitungen des Operators L , d.h. seinem sog. Hauptteil“ ” a11 ∂x2 u + 2a12 ∂x ∂y u + a22 ∂y2 u , ab. Diesem wird die quadratische Form q(x, y) := a11 x2 + 2a12 xy + a22 y 2 zugeordnet. Die Gleichung q(x, y) = 0 beschreibt Kegelschnitte in der (x, y)-Ebene: < 0 : 2 a12 − a11 a22 = 0 : >0:
Ellipse, P arabel, Hyperbel.
Von dieser rein formalen Charakterisierung stammen die obigen Bezeichnungen f¨ ur die drei Typen von partiellen Differentialgleichungen. Die Klassifikation eines Differentialoperators als elliptisch“, parabolisch“ oder hyperbolisch“ wird f¨ ur jeden einzelnen Punkt (x0 , y0 ) sepa” ” ” rat vorgenommen. Im Falle variabler Koeffizienten aij = aij (x, y) oder im nichtlinearen Fall aij (u(x, y)) kann der Typ einer Gleichung also im L¨osungsgebiet wechseln. Wir werden im folgenden nur Gleichungen eines einheitlichen Typs betrachten; in vielen Anwendungen spielt aber gerade der Typwechsel eine wichtige Rolle. Als n¨achstes wollen wir die prototypischen Vertreter von (linearen) elliptischen, parabolischen und hyperbolischen Differentialgleichungen ableiten. Dies wird uns erneut auf die obige Typenunterteilung f¨ uhren. Dazu schreiben wir den Hauptteil L0 des Differentialoperators in Matrix-Vektor-Form: !T ! ! ∂ a a ∂ x 11 12 x L0 = a11 ∂x2 + 2a12 ∂x ∂y + a22 ∂y2 = = ∇T A∇ ∂y a21 a22 ∂y
1.1 Typeneinteilung
13
Die symmetrische Matrix A besitzt zwei reelle Eigenwerte λ, µ und ein zugeh¨origes Orthonormalsystem von Eigenvektoren {ξ, η} . Mit der Spaltenmatrix Q := [ξ, η] gilt QQT = I,
QT AQ = D = diag(λ, µ).
Damit k¨onnen wir schreiben: L0 = ∇T QDQT ∇ = (QT ∇)T D(QT ∇) !T ! ! ξ1 ∂x + ξ2 ∂y λ 0 ξ1 ∂x + ξ2 ∂y = 0 µ η1 ∂x + η2 ∂y η1 ∂x + η2 ∂y bzw. L0 = λ(ξ1 ∂x + ξ2 ∂y )2 + µ(η1 ∂x + η2 ∂y )2 , oder mit den Richtungsableitungen ∂ξ = ξ · ∇ und ∂η = η · ∇ : L0 = λ∂ξ2 + µ∂η2 . Die Eigenwerte erh¨ alt man als Nullstellen des charakteristischen Polynoms det(A − zI) = (a11 − z)(a22 − z) − a212 = z 2 − (a11 + a22 )z + a11 a22 − a212 = (z − λ)(z − µ) = z 2 − (λ + µ)z + λµ.
Durch Koeffizientenvergleich findet man ( Vietascher5 Wurzelsatz). ” λ + µ = a11 + a22 ,
λµ = a11 a22 − a212 .
a) Elliptischer“ Fall a212 − a11 a22 < 0 : ” Beide Eigenwerte λ, µ sind ungleich Null und haben dasselbe Vorzeichen. Die L¨osungen der charakteristischen Gleichung sind nicht reell, d.h.: Es existieren keine charakteristischen Kurven durch den Punkt (x0 , y0 ). In diesem Fall ist der Konstruktionsprozeß f¨ ur die h¨oheren Ableitungen von u durchf¨ uhrbar. Die Normalform eines elliptischen Operators L ist im Fall λ = µ = 1 : Lu = ∂ξ2 u + ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u) Der Hauptteil“ dieses Operators ist also gerade der Laplace-Operator“ ∆ , der sich somit als ” ” prototypischer Vertreter elliptischer Differentialoperatoren 2. Ordnung erweist. Wir werden uns daher im Folgenden haupts¨ achlich mit der zugeh¨origen Poisson-Gleichung besch¨aftigen: ∂x2 u + ∂y2 u = f.
(1.1.3)
b) Parabolischer“ Fall: a212 − a11 a22 = 0 ” Einer der Eigenwerte ist Null; der zweite ist dann notwendig ungleich Null. Es existiert genau eine charakteristische Richtung im Punkt (x0 , y0 ) mit der Steigung dy/dx = a12 /a11 . Die
5 Francois Viete, lat. Franciscus Vieta (1540-1603): franz¨ osischer Mathematiker; Arbeiten u ¨ ber algebraische Gleichungen und sph¨ arische Trigonometrie; gab trigonometrische Tafeln heraus und f¨ uhrte die systematische Buchstabenrechnung ein.
14
Theorie partieller Differentialgleichungen
Normalform eines parabolischen Operators L ist im Fall λ = 1, µ = 0 : Lu = ∂ξ2 u + ψ(ξ, η, u, ∂ξ u, ∂η u). Der Hauptteil dieses Operators ist im linearen Fall gerade der sog. W¨armeleitungsoperator“, ” der prototypische Vertreter parabolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der zugeh¨ origen W¨armeleitungsgleichung besch¨aftigen: ∂t u − ∂x2 u = f.
(1.1.4)
c) Hyperbolischer“ Fall: a212 − a11 a22 > 0 ” Beide Eigenwerte sind ungleich Null, haben aber verschiedene Vorzeichen. Es existieren zwei charakteristische Richtungen im Punkt (x0 , y0 ) mit den Steigungen (dy/dx)± = a12 /a11 ± p −1 2 a11 a12 − a11 a22 . Die Normalform eines hyperbolischen Differentialoperators L ist im Fall λ = 1, µ = −1 : Lu = ∂ξ2 u − ∂η2 u + ψ(ξ, η, u, ∂ξ u, ∂η u). Der Hauptteil dieses Operators ist der sog. Wellenoperator“, der prototypische Vertreter hy” perbolischer Differentialoperatoren 2. Ordnung. Wir werden uns daher im folgenden mit der zugeh¨origen Wellengleichung besch¨ aftigen: ∂t2 u − ∂x2 u = f.
(1.1.5)
Wir haben gesehen, daß die Cauchysche Anfangswertaufgabe“ durch Reihenansatz l¨osbar ” ist, wenn die Anfangskurve“ Γ nirgends mit einer Charakteristik des Differentialoperators ” zusammenf¨ allt. Andernfalls kann die Situation eintreten, daß zu beiden Seiten der Kurve Γ eine L¨osung existiert, diese aber nicht auf Γ stetig-differenzierbar fortsetzbar ist. Im folgenden werden wir die f¨ ur die drei Gleichungstypen geeigneten Randbedingungen diskutieren und dabei ganz unterschiedliche Ergebnisse erhalten.
1.2 Elliptische Probleme
15
1.2 Elliptische Probleme Wir haben gesehen, daß f¨ ur (im ganzen L¨osungsgebiet Ω ) elliptische Differentialoperatoren die Cauchysche Anfangswertaufgabe“ f¨ ur jede (analytische) Anfangskurve“ Γ ⊂ Ω l¨osbar ist. Die ” ” Verallgemeinerung dieser Aussage f¨ ur nichtlineare Differentialoperatoren der Art L(u) = ∂x2 u − F (x, y, u, ∂x u, ∂y u, ∂y2 u)
(1.2.6)
ist der ber¨ uhmte Satz von Cauchy-Kovalevskaya6 Dieser sehr allgemeine Existenzsatz f¨ ur elliptische Differentialgleichungen ist aber f¨ ur die Praxis nur von geringer Bedeutung. Die u ¨ber einen lokalen Reihenansatz konstruierte L¨osung u h¨angt n¨amlich i.a. nicht stetig von den vorgegebenen Anfangswerten entlang Γ ab. Dies ist aber eine unverzichtbare Bedingung an ein physikalisch sinnvolles Modell. Beispiel: In der Halbebene Ω = {(x, y) ∈ R2 : x > 0} seien entlang der Randkurve Γ = {(0, y) ∈ R2 } die Randwerte u(0, y) = u00 (y) = 0, ∂x u(0, y) = u10 (y) = 0 gegeben. Die zugeh¨ orige L¨osung der Poisson-Gleichung ∆u = 0 ist u ≡ 0. Mit ε > 0 seien die Randdaten nun gest¨ ort zu u0ε (y) = 0, u1ε (y) = ε sin(y/ε), wobei limε→0 u1ε (y) = 0 . Die zugeh¨ orige gest¨orte L¨osung der Poisson-Gleichung (nachrechnen!) uε (x, y) = ε2 sin(y/ε) sinh(x/ε),
sinh(z) = 12 (ez − e−z ),
konvergiert aber f¨ ur ε → 0 nicht gegen Null. Es zeigt sich, daß in diesem Fall entlang der Anfangskurve Γ nicht gleichzeitig Werte f¨ ur u und ∂n u vorgegeben werden d¨ urfen, wenn man an physikalisch sinnvollen L¨ osungen interessiert ist. Wir haben gesehen, daß man bei der Wahl von Randbedingungen f¨ ur elliptische Operatoren vorsichtig sein muß, wenn das resultierende Randwertproblem wohl-gestellt sein soll. Sei also Ω ⊂ R2 ein beschr¨ anktes Gebiet mit hinreichend glattem Rand ∂Ω. Wir wollen dabei R¨ander mit einer glatten Parametrisierung (mindestens zweimal stetig differenzierbar) oder ein Polygongebiet (mit endlich vielen Ecken) zulassen. Als prototypischen Modellfall betrachten wir die Poisson-Gleichung“ ” −∆u = f
auf Ω.
(1.2.7)
Es gibt drei Typen von Randbedingungen und zugeh¨orige Randwertaufgaben ( RWAn“): ” 7 a) Dirichletsche Randbedingungen ( 1. RWA“): u = g auf ∂Ω . ” 6
Sofia Vasilyevna Kovalevskaya (1850-1891): russische Mathematikerin, eine der ersten Frauen mit Universit¨ atskarriere; 1869 Studium in Heidelberg als “Gasth¨ orerin”, da hier f¨ ur Frauen ein offizielles Universit¨ atsstudium noch nicht m¨ oglich war; ab 1871 Studium in Berlin bei Weierstraß und danach in G¨ ottingen; eine ihrer ersten Ver¨ offentlichungen enth¨ alt den nach ihr benannten “Existenzsatz”; konnte damals als Frau aber keine Universit¨ atsanstellung in Deutschland bekommen, trotz F¨ ursprache von Weierstraß; auf Betreiben Mittag-Lefflers ab 1884 Stelle als “Privatdozent” in Stockholm; leistete Beitr¨ age zur Analysis und zur Theorie von Differentialgleichungen der Physik; Anekdotisches: In ihrer Autobiografie steht, daß sie bereits als 11-J¨ ahrige durch die Lekt¨ ure von Seiten aus Ostrogradskis Vorlesungskriptum u ¨ ber Differential- und Integralrechnung, mit denen ihr Kinderzimmer tapeziert war, mit der Analysis in Ber¨ uhrung gekommen war. 7 Johann Peter Gustav Lejeune Dirichlet (1805-1859) geb. in D¨ uren (damals bei Frankreich): wirkte in Berlin und als Prof. in G¨ ottingen (Nachfolger von Gauß ); wichtige Beitr¨ age zur Zahlentheorie, Analysis und Differentialgleichungen (“Dirichletsches Prinzip”).
16
Theorie partieller Differentialgleichungen
b) Neumannsche8 Randbedingungen ( 2. RWA“): ∂n u = g auf ∂Ω . ” 9 c) Robinsche Randbedingungen ( 3. RWA“): ∂n u + αu = g auf ∂Ω . ” Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese RWAn sind, wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten wohl gestellt.
n
Ω
Ω 1.2.1 Existenz Die Frage nach der Existenz von L¨ osungen der 1. RWA ist wesentlich schwieriger als bei AWAn gew¨ohnlicher Differentialgleichungen. Als Vorbereitung f¨ ur analoge Argumente im Zusammenhang mit den Diskretrisierungsverfahren wollen wir zwei v¨ollig unterschiedliche Zug¨ange zu dieser Frage diskutieren, den klassischen“, potentialtheoretischen und den modernen“, funk” ” tionalanalytischen. Der Einfachheit halber wird nur der Fall homogener“ Randbedingungen ” u|∂Ω = 0 betrachtet. i) Potentialtheoretische Methode: Zun¨achst ist der Begriff einer klassischen“ L¨osung f¨ ur die Dirichletschen Randbedingung zu ” pr¨azisieren. Wir verstehen darunter eine Funktion u ∈ C 2 (Ω) ∩ C 1 (Ω), welche im Innern von Ω der Differentialgleichung und entlang des Randes ∂Ω der Randbedingung gen¨ ugt. Ferner soll ihr Gradient (m¨ oglicherweise im uneigentlichen Riemannschen10 Sinne) quadratintegrabel sein: |∇u| ∈ L2 (Ω). Zur Konstruktion solcher klassischer L¨osungen postulieren wir zun¨achst die Existenz einer Funktion G(x, y) auf Ω × Ω , G ∈ C 2 ({Ω × Ω} \ {x = y}) ∩ C({Ω × Ω} \ {x = y}), mit den Eigenschaften −∆x G(·, y) = 0 in Ω \ {y},
G(·, y) = 0
auf ∂Ω \ {y},
(1.2.8)
8 John von Neumann (1903-1957): US-amerikanischer Mathematiker ungarischer Abstammung; wirkte haupts¨ achlich am Institute for Advanced Studies in Princeton (zus. mit A. Einstein u.a.) und gilt als mathematisches Genie; lieferte fundamentale Beitr¨ age zu den mathematischen Grundlagen der Quantenmechanik, zur Operatortheorie, zur Spieltheorie, zur Gruppentheorie und zur Theorie der partiellen Differentialgleichungen; Pionier der Automatentheorie und theoretischen Informatik. 9 Victor Gustave Robin (1855-1897: franz¨ osischer Mathematiker; lehrte an der Sorbonne in Paris; Beitr¨ age zur Potentialtheorie unf Thermodynamik; hat die nach ihm benannte 3. Randbedingung anscheinend selbst gar nicht benutzt. 10 Bernhard Riemann (1826-1866): deutscher Mathematiker; Professor in G¨ ottingen als Nachfolger Dirichlets; Mitbegr¨ under der Funktionentheorie und der modernen Geometrie; einer der bedeutendsten Mathematiker des 19. Jh.s, von großem Einfluß auch auf die theoretische Physik.
1.2 Elliptische Probleme
17
f¨ ur beliebiges festes y ∈ Ω . F¨ ur x = y habe G(x, y) eine dimensionsabh¨angige Singularit¨at, die so beschaffen ist, daß sich −∆x G(·, y) wie die Dirac-Distribution verh¨alt, d.h.: F¨ ur v ∈ C(Ω) gilt mit den Kugelumgebungen Bε := {y ∈ Ω : |x| ≤ ε} , ε > 0 : Z x ∈ Ω : lim −∆x G(x, y) v(y) dy = v(x), (1.2.9) ε→0 Ω\Bε Z x ∈ ∂Ω : lim ∂n G(x, y) v(y) dy = v(x). (1.2.10) ε→0
∂Ω\Bε
Eine solches G(x, y) wird Greensche Funktion (1. Art)“ genannt. Wir machen damit den ” L¨osungsansatz Z Z ∂n G(x, y)g(y) doy . G(x, y)f (y) dy + u(x) := Ω
∂Ω
Die formulierten Eigenschaften der Greenschen Funktion erlauben es, zu zeigen, daß dieser Ansatz tats¨achlich eine klassische L¨ osung der 1. RWA liefert. Diese Rechnung ist aufwendig und kann z.B. im Buch von Hellwig nachgelesen werden. Die Konstruktion einer Greenschen Funktion f¨ ur allgemeine Gebiete im Rd ist schwer. Im Fall d = 2 folgt ihre Existenz aber mit Hilfe des Riemannschen Abbildungssatzes aus der Theorie komplexer Funktionen (siehe Hellwig). F¨ ur sehr spezielle Konfigurationen, wie z.B. Halbebenen oder Kreise, l¨aßt sich die Greensche Funktion explizit angeben. Beispiel: Auf dem Kreis Ω := {x ∈ R2 : |x| < R} ist durch o R R2 1 n log(|x − y|) + log( ) − log(| 2 x − y|) , 2π |x| |x| n o 1 G(x, y) = − log(|y|) − log(R) , x = 0. 2π
G(x, y) = −
x 6= 0,
(1.2.11) (1.2.12)
eine Greensche Funktion mit den obigen Eigenschaften gegeben.
Die Existenz Greenscher Funktionen l¨aßt sich f¨ ur sehr allgemeine Gebiete Ω nachweisen, auch f¨ ur die anderen RWAn. Das Konzept der klassischen“ L¨osung ist in vielen Anwendungsf¨ allen ” 2 zu restriktiv, z.B. wenn die rechte Seite f nicht regul¨ar genug ist, um eine C -L¨osung zuzulassen. Die Greensche Funktion selbst ist ein Extremfall in dieser Hinsicht. Als n¨achstes werden wir eine Abschw¨ achung dieser Anforderungen kennenlernen, welche mehr Flexibilit¨at bietet und f¨ ur die man vergleichweise leicht die Existenz von L¨osungen garantieren kann. ii) Funktionalanalytische Methode: Wir haben bereits fr¨ uher gesehen, daß eine enge Beziehung zwischen der Poisson-Gleichung und der Minimierung des zugeh¨ origen Energiefunktionals besteht. Dies kann man zum Nachweis der Existenz von L¨ osungen ausnutzen. Wir betrachten das Funktional Z Z 1 2 f v dx |∇v| dx − E(v) := 2 Ω Ω auf dem Vektorraum V˜ der zul¨ assigen“ Funktionen: ” V˜0 := {v : Ω → R : v ∈ C 1 (Ω) ∩ C(Ω), v|∂Ω = 0, |∇v| ∈ L2 (Ω)}.
18
Theorie partieller Differentialgleichungen
Dieser Raum wird mit der nat¨ urlichen Energie-Norm“ ” kvkE := k∇vkΩ ,
v ∈ V˜0 ,
versehen. Daß dies wirklich eine Norm ist, folgt aus den entsprechenden Eigenschaften der L2 Norm k · k = k · kΩ . Aus der Poincar´eschen Ungleichung kvkΩ ≤ dΩ k∇vkΩ ,
v ∈ V˜0 ,
mit dΩ := diam(Ω) folgt weiter, daß diese Norm st¨arker ist als die L2 -Norm. In kompakter Schreibweise ist E(v) = 12 k∇vk2 − (f, v). Wir verwenden jetzt eine Argumentation aus der Variationsrechnung, die dort als die direkte Methode“ bekannt ist. ” i) Wir zeigen zun¨ achst, daß E(·) nach unten beschr¨ankt ist. F¨ ur v ∈ V˜0 folgt mit Hilfe der H¨olderschen und der Poincar´eschen Ungleichung E(v) ≥ 21 k∇vk2 − kf k kvk ≥ 21 k∇vk2 − dΩ kf k k∇vk. Anwendung der Ungleichung ab ≤ 21 a2 + 21 b2 liefert weiter dΩ kf k k∇vk ≤ 12 k∇vk2 + 12 d2Ω kf k2 , und folglich E(v) ≥ − 12 d2Ω kf k2 > −∞,
v ∈ V˜0 .
ii) Sei nun (uk )k∈N ⊂ V˜0 eine Minimalfolge“ des Funktionals E(·) , d.h.: ” E(uk ) → inf E(v) =: d > −∞. v∈V˜
Wir wollen zeigen, daß (uk )k∈N eine Cauchy-Folge bzgl. der Energie-Norm ist. Wichtiges Hilfsmittel dazu ist die sog. Parallelogrammidentit¨at“ ” kv − wk2E + kv + wk2E = 2kvk2E + 2kwk2E , die man durch direktes Nachrechnen verifiziert. F¨ ur beliebige Indizes n, m ∈ N gilt folglich kun − um k2E = 2kun k2E + 2kum k2E − 4k 12 (un + um )k2E
= 4E(un ) + 4(f, un ) + 4E(um ) + 4(f, um ) − 8E( 12 (un + um )) − 8(f, 12 (un + um ))
= 4E(un ) + 4E(um ) − 8E( 21 (un + um )). Wegen lim {E(un ) + E(um )} = 2d,
n,m→∞
E( 21 (un + um )) ≥ d,
folgt damit lim sup kun − um k2E ≤ 0, n,m→∞
d.h.: (un )n∈N ist wie behauptet eine Cauchy-Folge. Die Cauchy-Folge (un )n∈N besitzt i.a. keinen Limes im normierten (unvollst¨andigen) Raum V˜0 . Durch Vervollst¨ andigung von V˜0 erh¨alt man den sog. Sobolew-Raum“ H01 (Ω). Die Ele”
1.2 Elliptische Probleme
19
¨ mente von H01 (Ω) sind zun¨ achst als Aquivalenzklassen von Cauchy-Folgen (analog wie bei der Konstruktion der reelen Zahlen aus den rationalen) definiert; sie lassen sich aber wieder als Funktionen interpretieren. Sie sind L2 -Funktionen, deren erste Ableitungen (im Distributionssinne) wieder in L2 liegen und die in einem abgeschw¨achten Sinn auf ∂Ω verschwinden (siehe die angegebene Literatur zur Theorie partieller Differentialgleichungen). Wir werden unten in Abschnitt 1.3 die Eigenschaften dieser Sobolew11 -R¨aume“ genauer diskutieren. Der Limes u ∈ H01 (Ω) ” der Folge (un )n∈N wird als die schwache“ oder auch variationelle“ L¨osung der 1. RWA des ” ” Laplace-Operators bezeichnet. Als Minimalpunkt des Funktionals E(·) gen¨ ugt sie, wie wir schon fr¨ uher gesehen haben, notwendig der Beziehung (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.2.13)
Umgekehrt gilt f¨ ur eine Funktion u ∈ H01 (Ω) , welcher dieser Variationsgleichung gen¨ ugt, mit jeder anderen Funktion v ∈ H01 (Ω) E(v) − E(u) = 21 k∇vk2 − (f, v) − 21 k∇uk2 + (f, u)
= 12 k∇vk2 − (∇u, ∇v) − 21 k∇uk2 + (∇u, ∇u)
= 12 k∇vk2 − (∇u, ∇v) + 21 k∇uk2 = 12 k∇(v − u)k2 ≥ 0. Folglich ist u automatisch auch Minimum des Energiefunktionals und somit schwache L¨osung. Wenn die schwache L¨ osung u regul¨arer ist, etwa sogar die Regularit¨at einer klassischen L¨osung besitzt, so kann partiell integriert werden, und wir finden (−∆u, ϕ) + (∂n u, ϕ)∂Ω = (f, ϕ)
∀ϕ ∈ H01 (Ω)
bzw. wegen der Randbedingung ϕ|∂Ω = 0 (−∆u − f, ϕ) = 0
∀ϕ ∈ H01 (Ω).
Hieraus folgt mit den u ¨ blichen Argumenten, daß −∆u = f , d.h.: u ist sogar klassische L¨osung ¯ die Variatider RWA. Umgekehrt erf¨ ullt nat¨ urlich jede klassische L¨osung u ∈ C 2 (Ω) ∩ C 1 (Ω) onsgleichung (∇u, ∇ϕ) − (f, ϕ) = (−∆u − f, ϕ) + (∂u , ϕ) ∂Ω = 0 ∀ϕ ∈ H01 (Ω). Damit ist der schwache“ L¨ osungsbegriff vertr¨aglich mit dem urspr¨ unglichen klassischen“. Der ” ” 1 Nachweis h¨ oherer Regularit¨ at der schwachen L¨osung u ∈ H0 (Ω) ist allerdings schwierig und kann im Rahmen dieser Vorlesung nur andiskutiert werden (siehe wieder die empfohlene Literatur). Wir wollen noch kurz diskutieren, wie das obige Argument verwendet werden kann, um die Existenz von schwachen L¨ osungen der 1. RWA auch im Fall inhomogener Randdaten u|∂Ω = g zu sichern. Dazu nehmen wir an, daß die Randfunktion g als Spur“ einer auf ganz Ω definierten ” Funktion gˆ ∈ C 2 (Ω) ∩ C(Ω) gegeben ist, d.h.: g = gˆ|∂Ω . Dann w¨are die Funktion v := u − gˆ 11
Sergei Lvovich Sobolew (1908-1989): russischer Mathematiker; wirkte zun¨ achst in Leningrad (St. Petersburg) und dann am ber¨ uhmten Steklov-Institut f¨ ur Mathematik der Akademie der Wissenschaften in Moskau; fundamentale Beitr¨ age zur Theorie der partiellen Differentialgleichungen, Konzept der verallgemeinerten (distributionellen) L¨ osung, Sobolew-R¨ aume; besch¨ aftigte sich auch mit numerischen Methoden, numerische Quadratur.
20
Theorie partieller Differentialgleichungen
L¨osung der RWA −∆v = f − ∆ˆ g in Ω,
v|∂Ω = 0.
Hierf¨ ur garantiert nun die variationelle Methode die Existenz einer (eindeutigen) schwachen L¨osung v ∈ H01 (Ω) mit der Eigenschaft (∇v, ∇ϕ) = (f, ϕ) + (∇ˆ g , ∇ϕ)
∀ϕ ∈ H01 (Ω).
Die schwache L¨ osung der urspr¨ unglichen RWA ergibt sich dann als u := v + gˆ . 1.2.2 Eindeutigkeit Die Eindeutigkeitsforderung an L¨ osungen dieser RWAn ist leicht zu gew¨ahrleisten. Wir diskutieren hier nur die 1. RWA. Die entsprechenden Argumente f¨ ur die 2. und die 3. RWA seien als ¨ Ubung gestellt. (i) Besonders einfach ist der Beweis f¨ ur die schwachen L¨osungen. Seien also u(1) , u(2) ∈ H01 (Ω) zwei schwache L¨ osungen der 1. RWA, d.h.: (∇u(i) , ∇ϕ) = (f (i) , ϕ)
∀ϕ ∈ H01 (Ω).
Dann gilt f¨ ur die Differenz w := u(1) − u(2) (∇w, ∇ϕ) = 0
∀ϕ ∈ H01 (Ω).
Mit ϕ := w folgt k∇wk = 0 und folglich w ≡ konst. bzw. w ≡ 0 wegen der Randbedingung. (ii) Die Eindeutigkeit von klassischen L¨osungen folgt unmittelbar aus der gerade bewiesenen Eindeutigkeit von schwachen L¨ osungen, da jede klassische L¨osung ja auch schwache L¨osung ist. Eine direktere Argumentation ergibt sich mit Hilfe des sog. Maximumprinzips“ . ” Hilfssatz 1.1 (Maximumprinzip): F¨ ur den elliptischen Operator Lu := −∆u + au mit a ≥ 0 auf einem Gebiet Ω ∈ Rd gilt das sog. Maximumprinzip“, d.h.: Eine Funktion ” u ∈ C 2 (Ω) ∩ C(Ω) mit der Eigenschaft Lu ≤ 0 hat in Ω kein positives Maximum. Dies bedeutet, daß entweder u ≤ 0 auf ganz Ω ist, oder max u ≤ max u. Ω
∂Ω
(1.2.14)
Beweis: Wir f¨ uhren den Beweis nur f¨ ur den Fall, daß a > 0 auf Ω . Der allgemeine Fall a ≥ 0 erfordert eine aufwendigere Argumentation (siehe z.B. das Buch von Hellwig). Ferner sei d = 2. Angenommen, die Funktion u habe im Fall u 6≤ 0 in einem Punkt z ∈ Ω ein positives Maximum, u(z) > 0. Dann ist notwendig ∇u(z) = 0,
∂x2 u(z) ≤ 0, ∂y2 u(z) ≤ 0.
Damit folgt 0 ≥ Lu(z) = −∆u(z)+au(z) ≥ au(z) , was wegen a > 0 den Widerspruch u(z) ≤ 0 erzwingt. Q.E.D.
1.2 Elliptische Probleme
21
Das Maximumprinzip f¨ ur elliptische Operatoren 2. Ordnung ist die nat¨ urliche Verallgemeinerung der simplen Tatsache, daß in einer Raumdimension aus u′′ (x) ≥ 0 die Konvexit¨at von u folgt.
y u"(x) > 0 u(x)
Ω
x
Aussagen vom Typ des obigen Maximumprinzips lassen sich f¨ ur sehr allgemeine (auch nichtlineare) elliptische Operatoren 2. Ordnung herleiten. Wir betonen, daß das Maximumprinzip i.a. f¨ ur elliptische Operatoren h¨ oherer Ordnung (z.B. den biharmonischen Operator“ ∆2 u ) und f¨ ur ” elliptische Systeme (z.B. die Gleichungen der linearen Elastizit¨atstheorie) nicht mehr gilt. Als erste, einfache Anwendung des Maximumprinzips erhalten wir einen alternativen Beweis f¨ ur die Eindeutigkeit (klassischer) L¨ osungen der 1. RWA des Laplace-Operators. Sind u(1) , u(2) zwei L¨osungen, so gilt f¨ ur die Differenz w := u(1) − u(2) wieder −∆w = 0 in Ω,
w = 0 auf ∂Ω.
Anwendung des Maximumprinzips auf w sowie −w impliziert dann, daß notwendig w ≤ 0, −w ≤ 0 , d.h.: w ≡ 0. 1.2.3 Stetige Abh¨ angigkeit (i) Die Frage nach der stetigen Abh¨ angigkeit der L¨osungen der 1. RWA wollen wir wieder sowohl mit Hilfe des klassischen Ansatzes als auch mit der variationellen Methode angehen. Seien zun¨achst u(1) , u(2) zwei L¨ osungen (klassisch oder variationell) der 1. RWA des LaplaceOperators zu unterschiedlichen rechten Seiten f (1) , f (2) . F¨ ur die Differenz w = u(1) − u(2) folgt dann k∇wk2 = (f (1) − f (2) , w) ≤ kf (1) − f (2) kΩ kwk. Unter Ausnutzung der Poincar´eschen Ungleichung folgt daraus k∇wk ≤ dΩ kf (1) − f (2) k, d.h. die Stetigkeit der L¨ osung (in der Energie-Norm) gegen¨ uber St¨orungen der rechten Seite. (ii) Als n¨achstes betrachten wir St¨ orungen der Randdaten. Dazu verwenden wir wieder das Maximumprinzip. Seien dazu u(1) , u(2) zwei L¨osungen zu den Randdaten g(1) , g(2) . F¨ ur die (1) (2) Differenz w := u − u gilt dann −∆w = 0 in Ω,
w = g := g(1) − g(2) auf ∂Ω.
22
Theorie partieller Differentialgleichungen
Mit dem Maximumprinzip erschließen wir hieraus, daß w ≡ 0 (was nat¨ urlich i.a. nicht eintritt) oder max w ≤ max g, max −w ≤ max −g. ∂Ω
Ω
Ω
∂Ω
Dies impliziert maxΩ |w| ≤ max∂Ω |g|. Schließlich ergibt sich mit Hilfe des Maximumprinzips noch, daß eine L¨osung der 1. RWA des Laplace-Operators zu nichtnegativer rechter Seite und ebensolchen Randdaten, −∆u ≥ 0 in Ω,
u ≥ 0 auf ∂Ω,
notwendig u ur die zugeh¨orige Green¨ berall nicht-negativ ist: u ≥ 0 . Dies gilt dann z.B. auch f¨ sche Funktion: g(·, ·) ≥ 0. Durch sch¨ arfere Argumente kann man dar¨ uber hinaus zeigen, daß die Greensche Funktion im Innern des Definitionsgebiets Ω positiv ist. Dies bedeutet u.a., daß bei einem elliptischen Problem lokale St¨ orungen in den Daten die L¨osung im gesamten L¨osungsgebiet ver¨andern. Es liegt also gewissermaßen eine unendliche Ausbreitungsgeschwindigkeit“ von ” Information vor. Dies ist charakteristisch f¨ ur elliptische Randwertaufgaben.
1.2.4 Regularit¨ at Auf glatt berandeten Gebieten Ω besteht, ¨ahnlich wie bei gew¨ohnlichen Differentialgleichungen, f¨ ur (lineare) partielle Differentialgleichungen vom elliptischen Typ die Regel, daß sich die Regularit¨at der Daten (rechte Seite und Randwerte) auf nat¨ urliche Weise auf die L¨osung u agt. ¨ bertr¨ Der Rand ∂Ω sei aus der Klasse C 2 (2-mal stetig differenzierbar parametrisierbar). Dann besitzt at die schwache L¨ osung u ∈ H01 (Ω) im Falle f ∈ L2 (Ω) zweite Ableitungen mit der Regularit¨ 2 2 |∇ u| ∈ L (Ω) , und es gilt die a priori Absch¨atzung 2 X k=0
k∇k uk2
1/2
≤ ckf k.
(1.2.15)
Diese Aussage bleibt g¨ ultig, wenn Ω ein konvexes Polygongebiet oder ein konvexer Polyeder ist. Ist dar¨ uber hinaus f H¨ older-stetig, so ist die schwache L¨osung u ∈ H01 (Ω) sogar klassische L¨osung. H¨ohere Regularit¨ atseigenschaften von ∂Ω und f u ¨ bertragen sich entsprechend auf u . Im Fall von Gebieten mit Ecken, insbesondere einspringenden“ Ecken (Innenwinkel ω > π) ” treten allerdings dort Irregularit¨ aten in der L¨osung auf; z. B. ist die in ebenen Polarkoordinaten (r, θ) ausgedr¨ uckte Funktion 2 u(r, θ) = r 3 sin( 32 θ) auf der gelochten Ebene R2 \ {0} harmonisch, d.h. ∆u ≡ 0 . Auf dem Tortenst¨ uck“ ” Ω := {(x, y) ∈ R2 | 0 < r < 1, 0 < θ < 32 π} mit einer rechtwinkligen einspringenden Ecke ist ∇u ∈ L2 (Ω)2 , und u ist daher (klassische) L¨osung der Poisson-Gleichung ∆u = 0 zu den Randbedingungen u(r, θ) = 0 f¨ ur θ ∈ {0, 23 π},
u(r, θ) = sin( 23 ) f¨ ur r = 1.
Wir sehen an diesem Beispiel, daß klassische“ L¨osungen elliptischer Gleichungen nicht unbe” dingt regul¨ ar bis zum Rand ∂Ω zu sein brauchen. F¨ ur allgemeinen Innenwinkel ω ∈ (0, 2π] (Der
1.3 Hilfsmittel aus der Theorie von Funktionenr¨aumen
23
Fall ω = 2π entpricht einem sog. Schlitzgebiet“.) erh¨alt man analoge klassische L¨osungen in π ” ur ω > π , d.h. f¨ ur eine einspringende“ Ecke hat die L¨osung der Form u(r, θ) = r ω sin( ωπ θ) . F¨ ” bei r = 0 singul¨ are erste Ableitungen. Diese sog. Eckensingularit¨aten“ sind gut analysiert und ” absch¨atzbar. Sie haben einen signifikanten, negativen Einfluß auf die Approximationsg¨ ute von Diskretisierungen und erfordern besondere Vorkehrungen.
1.3 Hilfsmittel aus der Theorie von Funktionenr¨ aumen In diesem Abschnitt stellen wir einige Aussagen u ¨ ber R¨aume verallgemeinert differenzierbarer Funktionen, sog. Sobolew-R¨ aume“, zusammen, soweit sie sp¨ater bei der Analyse von Diskreti” sierungsverfahren ben¨ otigt werden.
1.3.1 Sobolew-R¨ aume Sei Ω ein Gebiet im Rd (d = 2, 3) mit Rand ∂Ω . Der Rand wird als ausreichend“ glatt ange” nommen, was von der betrachteten Situation abh¨angt; diesbez¨ ugliche Einschr¨ankungen werden von Fall zu Fall angegeben. Wir nehmen generell an, daß ∂Ω eine Lipschitz-stetige Parametrisierung besitzt und u ¨ berall bis auf endlich viele Punkte oder Kanten eine wohl-definierte ¨außere Normale n besitzt. Auf einem solchen Gebiet Ω definieren wir zun¨achst f¨ ur Funktionen aus C(Ω) (Vektorraum der stetigen Funktionen auf dem Abschluß Ω ) das sog. L2 -Skalarprodukt und die zugeh¨orige Norm Z Z u(x)v(x) dx,
(u, v)Ω :=
Ω
kuk0;Ω :=
Ω
|u(x)|2 dx
1/2
.
Wenn Verwechslungen ausgeschlossen sind, wird auch die k¨ urzere Notation (·, ·) = (·, ·)Ω sowie k · k = k · k0 = k · k0;Ω verwendet. Die Vervollst¨andigung von C(Ω) bzgl. der Norm k · k0;Ω liefert den Lebesgueschen12 Hilbert-Raum“ L2 (Ω) der auf Ω im Lebesgueschen Sinne meßbaren ” und quadratintegrablen Funktionen. Eine Funktion“ v ∈ L2 (Ω) ist dann dadurch charakte” risiert, daß es eine Folge glatter Funktionen (vk )k∈N ⊂ C(Ω) gibt, welche bzgl. der L2 -Norm Cauchy-Folge ist und fast u ¨ berall“ (im Lebesgueschen Sinne) gegen v konvergiert. Mit einem ” einfachen Approximationsargument l¨ aßt sich zeigen, daß sich L2 (Ω) auch als Vervollst¨andigung des Raumes der Testfunktionen“ (Begriff aus der Distributionen-Theorie) ” C0∞ (Ω) := {v ∈ C ∞ (Ω) : Trg(v) := {x ∈ Ω, v(x) 6= 0} ⊂ Ω kompakt} gewinnen l¨ aßt. Auf analoge Weise gewinnt man f¨ ur 1 ≤ p < ∞ die sog. Lp -R¨aume“ Lp (Ω) als ” Vervollst¨andigung von C(Ω) bzgl. der Norm Z 1/p kvkLp (Ω) := |v(x)|p dx . Ω
Der Fall p = ∞ bedarf einer gesonderten Betrachtung. Der Lebesgue-Raum L∞ (Ω) besteht aus allen auf Ω definierten, im Lebesgueschen Sinne meßbaren und wesentlich beschr¨ankten“ ” 12
Henri L´eon Lebesgue (1875-1941): franz¨ osischer Mathematiker, Professor am Coll`ege de France in Paris, lieferte grundlegende Beitr¨ age zur modernen Integrationstheorie (“Lebesgue-Intgeral”)
24
Theorie partieller Differentialgleichungen
Funktionen; seine Norm ist kvkL∞ (Ω) := ess supx∈Ω |v(x)|. Man beachte, daß sich L∞ (Ω) nicht als Vervollst¨andigung von C(Ω) bzgl. der Norm k·k∞;Ω gewinnen l¨aßt, denn dies ergibt wieder C(Ω) . Wenn Mißverst¨andnisse ausgeschlossen sind, werden die Lp -Normen auch kurz mit k · kp = k · kLp = k · kLp (Ω) bezeichnet. Die funktionalanalytische Methode zum Nachweis der Existenz von schwachen“ L¨osungen ” der Poisson-Gleichung −∆u = f in Ω,
u|∂Ω = 0,
(1.3.16)
bedient sich als nat¨ urlichen L¨ osungsraum“ des Sobolew-Raums H01 (Ω) . Dieser ist Teilraum ” 1 des Sobolew-Raums H (Ω) , welchen man erh¨alt z.B. durch Vervollst¨andigung des Vektorraums C 1 (Ω) bzgl. der sog. H 1 -Norm kvk1 := kvk20 + k∇vk20
1/2
.
Entsprechend ist H01 (Ω) definiert als der Abschluß von C0∞ (Ω) in H 1 (Ω) . Die Definition des Sobolew-Raums H 1 (Ω) als Vervollst¨andigung von C 1 (Ω) besagt zun¨achst, ¨ daß seine Elemente als Aquivalenzklassen von Cauchy-Folgen (vk )k∈N ⊂ C 1 (Ω) bzgl. der H 1 Norm definiert sind. Dies ist ein sehr unhandliches Konzept, mit dem man schlecht arbeiten ¨ kann. Daher werden diesen Aquivalenzklassen Funktionen auf Ω zugeordnet durch folgende Konstruktion: {(vk )k∈N } 7→ v ∈ H 1 (Ω) :
v := lim vk , k→∞
∇v := lim ∇vk , k→∞
wobei die Konvergenz jeweils im L2 -Sinne zu verstehen ist. Umgekehrt existiert dann f¨ ur jede 1 solche Funktion v ∈ H (Ω) eine approximierende Folge glatter“ Funktionen (vk )k∈N mit kv − ” vk k1 → 0 (k → ∞) . Auf diesem Wege, d.h. durch Konstruktion einer solchen approximierenden Folge wird auch f¨ ur eine gegebene Funktion v ∈ L2 (Ω) gegebenenfalls v ∈ H 1 (Ω) gezeigt. Die Limiten ∂i v := limk→∞ ∂i vk werden verallgemeinerte“ (oder auch schwache“) Ableitungen ” ” von v genannt. Sie sind i.a. nicht stetig oder beschr¨ankt und existieren nur im L2 -Sinne, d.h. im Lebesgueschen Sinn fast u ¨ berall“. Zum Nachweis, daß eine in fast allen Punkten x ∈ Ω ” definierte Funktion v in H 1 (Ω) liegt, geht man u ¨ blicherweise wie folgt vor: Zun¨achst wird aus Kenntnis der Struktur von v eine Folge approximierender glatter“ Funktionen (vk )k∈N ⊂ ” ur k → ∞ samt ihrer ersten Ableitungen (fast u C 1 (Ω) konstruiert, welche f¨ ¨berall) punktweise gegen v konvergieren. Kann dann noch gezeigt werde, daß lim kvk k1;Ω < ∞, so folgt (nach dem Satz von der dominierten Konvergenz“ der Maß-Theorie), daß (vk )k∈N eine ” Cauchy-Folge bzgl. der H 1 -Norm ist und den Limes v besitzt; d.h. v ∈ H 1 (Ω) . Beispiel 1.1: (i) L2 -Funktionen: Sei Ω zun¨achst die gepunktete Kreisscheibe Ω0 = {x ∈ R2 : 0 < |x| < 1}. Auf Ω0 ist die Funktion u(x) = ln(|x|) stetig, aber unbeschr¨ankt. Auf der vollen Kreisscheibe Ω = {x ∈ R2 : |x| < 1} ist u(x) = ln(|x|) aber als Funktion in L2 (Ω) erkl¨art. Dies wird klar
1.3 Hilfsmittel aus der Theorie von Funktionenr¨aumen
25
bei Betrachtung der approximierenden, stetigen Funktionen ln(|x|) f¨ ur k−1 < |x| < 1, uk (x) := ln(k−1 ) f¨ ur 0 ≤ |x| ≤ k−1 . Man rechnet leicht nach, daß (uk )k∈N eine Cauchy-Folge bzgl. der L2 -Norm auf Ω ist und in allen Punkten x ∈ Ω (bis auf x = 0 ) uk (x) → u(x) (k → ∞) gilt. Wir betrachten nun die Funktion u(x) := |x|−1 , welche ebenfalls auf Ω0 stetig und unbeschr¨ankt ist. In diesem Fall bilden die approximierenden Funktionen −1 |x| f¨ ur k−1 < |x| < 1, uk (x) := k f¨ ur 0 ≤ |x| ≤ k−1 , wegen kuk k2Ω
= 2π
Z
k −1
2
k r dr + 2π 0
Z
1
r −1 dr = 2π
k −1
1 2
+ ln(k) → ∞
(k → ∞)
keine Cauchy-Folge bzgl. der L2 -Norm, d.h.: Dieses u ist zu singul¨ar, um als L2 -Funktion auf Ω erkl¨art zu sein. Bei der analogen Betrachtung auf der Einheitskugel im R3 ergibt sich dagegen, daß u(x) = |x|−1 in diesem Fall sehr wohl in L2 (Ω) liegt. Die Zugeh¨origkeit von Funktionen mit lokalen Singularit¨ aten zum Lebesgue-Raum L2 (Ω) h¨angt also von der jeweiligen Raumdimension ab. Wir werden denselben Effekt auch beim Sobolew-Raum H 1 (Ω) finden. (ii) H 1 -Funktionen: Wir betrachten wieder die Funktion u(x) = ln(|x|) auf der punktierten Kreisscheibe Ω0 ⊂ R2 . Ihr Gradient ∇u(x) = |x|−2 x verh¨alt sich bei Ann¨aherung an x = 0 wie |∇u(x)| ≈ |x|−1 . Im Hinblick auf das eben diskutierte Beispiel ist ∇u also nicht zu einer L2 Funktion auf die volle Kreisscheibe Ω fortsetzbar. Folglich ist u auch nicht in H 1 (Ω) . Wir sehen, daß insbesondere die Greensche Funktion zum Laplace-Operator in zwei Raumdimensionen nicht im Energie-Raum“ H 1 (Ω) liegt. Man beachte, daß v(x) = ln(x) in drei Raumdimensionen ” aber sehr wohl in H 1 (Ω) liegt; der kritische Grenzfall ist hier die st¨arker singul¨are Funktion u(x) = |x|−1 . Als zweites Beispiel zeigen wir, daß H 1 -Funktionen in mehr als einer Dimension nicht beschr¨ankt sein m¨ ussen. Auf Ω0 sei die Funktion u(x) = ln(ln(|x|−1 ) + 1) betrachtet. Da | ln ln(r −1 )| f¨ ur r → 0 langsamer w¨achst als | ln(r)| , ist u sicherlich zu einer L2 -Funktion auf Ω fortsetzbar. Wir berechnen nun den Gradienten ∇u(x) = −
x |x|2 (ln(|x|−1 )
+ 1)
.
Die zugeh¨origen abgeschnittenen“ Funktionen ” ln(ln(|x|−1 ) + 1) f¨ ur k−1 < |x| < 1, uk (x) := ln(ln(k) + 1) f¨ ur 0 ≤ |x| ≤ k−1 ,
26
Theorie partieller Differentialgleichungen
haben die st¨ uckweise“ definierten Gradienten ” ( x ∇uk (x) :=
|x|2 (ln(|x|−1 )+1)
0
f¨ ur k−1 < |x| < 1,
f¨ ur 0 ≤ |x| ≤ k−1 ,
welche u ¨ berall (bis auf x = 0 ) gegen ∇u konvergieren. Aus der Absch¨atzung Z 1 Z 1 2 1 r dr r dr = 2π k∇uk k2 = 2π 2 −1 −1 2 k −1 r(ln(r ) + 1) k −1 r (ln(r ) + 1) 1 2π 2π = = 2π − ≤ 2π ln(r −1 ) + 1 k−1 ln(k) + 1
(1.3.17) (1.3.18)
ersehen wir ferner, daß (∇uk )k∈N bzgl. der L2 -Norm eine Cauchy-Folge ist. Folglich ist u zu einer Funktion im Sobolew-Raum H 1 (Ω) fortsetzbar. Mit der eben verwendeten Abschneide” technik“ erhalten wir approximierende Funktionen uk , welche i.a. nur st¨ uckweise stetig differenzierbar sind, d.h. nicht im strengen Sinne in C 1 (Ω) liegen und somit nicht direkt in das oben formulierte Approximationskonzept f¨ ur H 1 -Funktionen passen. Dieser Mangel kann behoben werden, in dem man statt abzuschneiden regularisiert, z.B. gem¨aß uk (x) = ln(ln((|x| + k)−1 ) + 1). Diese uk ∈ C 1 (Ω) bilden dann ebenfalls eine approximierende Folge von u bzgl. der H 1 -Norm. Eine ¨ahnliche Modifikation (schon bei der Definition der Sobolew-R¨aume) muß auch vorgenommen werden, um spezielle Gebiete Ω mit schlitz-artigen“ Randeinspr¨ ungen einbeziehen zu ” k¨onnen. Solche Schlitz-Gebiete“ spielen eine wichtige Rolle z.B. in der Baumechanik, wenn die ” Ausbreitung von Rissen in Bauteilen beschrieben werden soll.
Analog zu dem Sobolew-Raum H 1 (Ω) erster Ordnung“ quadrat-integrabler Funktionen ” kann man auch Sobolew-R¨ aume H m,p (Ω) h¨oherer Ordnung m ∈ N , bestehend aus p-integrablen Funktionen (1 ≤ p < ∞) , definieren. Diese erh¨alt man durch Vervollst¨andigung des Raumes C m (Ω) bzgl. der Norm kvkH m,p (Ω) := kvkpLp (Ω) + ... + k∇m vkpLp (Ω)p
1/p
.
Der Fall p = ∞ bedarf wieder einer gesonderten Betrachtung. Die R¨aume H m,∞ (Ω) werden u ¨ber die Gleichsetzung H m,∞ (Ω) := W m,∞ (Ω) als R¨aume sog. verallgemeinert differenzier” barer“ Funktionen mit distributionellen Ableitungen in L∞ (Ω) definiert. Wir wollen auf diese Begiffsbildungen nicht weiter eingehen und verweisen statt dessen auf die einschl¨agige Literatur u aume (z.B.: Wloka (1982)). ¨ber Sobolew-R¨
1.3.2 Eigenschaften von Lebesgue- und Sobolew-R¨ aumen Wir wollen im folgenden einige wichtige Eigenschaften von Lebesgue- und Sobolew-R¨aumen zusammenstellen, welche sp¨ ater bei der Analyse numerischer Verfahren ben¨otigt werden. Sei 1 < p < ∞ und q := p/(p − 1) . Dann gilt f¨ ur Funktionen u ∈ Lp (Ω) und v ∈ Lq (Ω)
1.3 Hilfsmittel aus der Theorie von Funktionenr¨aumen
27
die allgemeine H¨ oldersche Ungleichung“ ” Z Z 1/p Z 1/q p |u(x)| dx |v(x)|q dx , u(x)v(x) dx ≤ Ω
Ω
(1.3.19)
Ω
bzw. in Kurzform |(u, v)Ω | ≤ kukLp (Ω) kvkLq (Ω) . F¨ ur die Grenzf¨alle p = ∞ bzw. q = 1 gilt |(u, v)Ω | ≤ kukL∞ (Ω) kvkL1 (Ω) .
(1.3.20)
Die variationelle Methode zum Nachweis von schwachen“ L¨osungen der Poisson-Gleichung ” basierte auf der Eigenschaft der bilinearen Form (∇u, ∇v)Ω , auf dem Teilraum H01 (Ω) ⊂ H 1 (Ω) ein Skalarprodukt zu sein. Hilfssatz 1.2 (Poincar´ esche Ungleichung): F¨ ur Funktionen v ∈ H01 (Ω) gilt die sog. Poin” car´esche Ungleichung“ kvkΩ ≤ dΩ k∇vkΩ ,
(1.3.21)
mit dem Durchmesser dΩ := diam(Ω) des Gebiets Ω . Beweis: Wir geben den Beweis nur in zwei Raumdimensionen. In h¨oheren Dimensionen verl¨auft die Argumentation ganz analog. Sei Q eine Quadrat der Kantenl¨ange L = dΩ , in welchem das Gebiet Ω enthalten ist. O.B.d.A. sei das Koordinatensystem so verschoben und gedreht, daß Q = (0, L)×(0, L) . F¨ ur irgendein v ∈ H01 (Ω) sei (vk )k∈N ⊂ C0∞ (Ω) eine approximierende Folge. Mit vˆk bezeichnen wir die trivialen Fortsetzungen der vk auf Q : vk (x) f¨ ur x ∈ Ω, vˆk (x) := 0 f¨ ur x ∈ Q \ Ω. Diese sind dann ebenfalls in C0∞ (Q) . Wir setzen nun w := vˆk . Zun¨achst gilt in Punkten (x, y) ∈ Q : Z x ∂ξ w(ξ, y) dξ, w(x, y) = w(0, y) + 0
und folglich, bei Beachtung von w(0, y) = 0 , 2
|w(x, y)| ≤ L
Z
L
0
|∂ξ w(ξ, y)|2 dξ
Integration zun¨ achst u ¨ ber y ∈ (0, L) und danach u ¨ ber x ∈ (0, L) ergibt Z
0
LZ L 0
2
|w(x, y)| dy dx ≤ L
2
Z
0
LZ L 0
|∂ξ w(ξ, y)|2 dξ dy.
Dies bedeutet kwkQ ≤ Lk∇wkQ . und wegen w = vˆk ≡ 0 auf Q \ Ω : kvk kΩ ≤ Lk∇vk kΩ . F¨ ur k → ∞ u agt sich diese Beziehung durch Stetigkeit auf v ∈ H01 (Ω) . ¨ bertr¨
Q.E.D.
28
Theorie partieller Differentialgleichungen
Die variationelle Methode liefert auch die Existenz von L¨osungen der 1. RWA des LaplaceOperators, wenn die Randwertvorgaben inhomogen sind. Im allgemeinen Fall findet man eine schwache L¨ osung v ∈ H 1 (Ω) . Wir haben gesehen, daß H 1 -Funktionen Singularit¨aten haben k¨onnen. Es stellt sich also die Frage, in welchem Sinne die Randwerte von der schwachen“ ” L¨osung u ¨ berhaupt angenommen werden. atzung“ Hilfssatz 1.3 (Spur-Lemma): F¨ ur Funktionen v ∈ C 1 (Ω) gilt die sog. Spur-Absch¨ ” kvkL2 (∂Ω) ≤ c(Ω) kvkH 1 (Ω)
(1.3.22)
mit einer Ω-abh¨angigen Konstante c(Ω) . Beweis: Zuerst betrachten wir den Spezialfall des Einheitsquadrats Ω = (0, 1) × (0, 1) . Sei v ∈ C 1 (Ω) . F¨ ur Punkte (0, y) ∈ ∂Ω gilt Z x ∂ξ v(ξ, y) dξ + v(x, y), x ∈ [0, 1]. v(0, y) = − 0
und folglich 2
|v(0, y)| ≤
Z
0
1
Z 2 |∂ξ v(ξ, y)| dξ + |v(x, y)| ≤ 2
1 0
|∂ξ v(ξ, y)|2 dξ + 2|v(x, y)|2 .
Integration zun¨ achst u ¨ ber y ∈ (0, 1) und dann u ¨ber x ∈ (0, 1) liefert Z 1Z 1 Z 1 Z 1Z 1 2 2 |v(0, y)| dy ≤ 2 |∂ξ v(ξ, y)| dξ dy + 2 |v(x, y)|2 dy dx. 0
0
0
0
0
Dieselbe Argumentation kann auch f¨ ur die drei anderen Randkomponenten von Ω angewendet werden. Zusammenfassung der sich ergebenden Absch¨atzungen ergibt dann kvk2L2 (∂Ω) ≤ 8kuk2H 1 (Ω) . Die gezeigte Argumentation f¨ ur das Einheitsquadrat l¨aßt sich ohne Probleme f¨ ur allgemeine Polygongebiete modifizieren. Im allgemeineren Fall eines krumm berandeten Gebiets Ω erh¨ alt man dasselbe Resultat mit Hilfe lokaler Transformationen, welche krumme Randst¨ ucke lokal gerade transformieren, so daß wieder das obige Argument angewendet werden kann. Q.E.D. Mit Hilfe des Spurlemmas k¨ onnen wir Funktionen v ∈ H 1 (Ω) eine Spur“ v|∂Ω ∈ L2 (∂Ω) ” zuordnen, was die Frage nach der Annahme von Randwerten durch die schwache L¨osung der 1. RWA beantwortet. Sei v ∈ H 1 (Ω) und (vk )k∈N ⊂ C 1 (Ω) eine approximierende Folge. Aufgrund der Spurabsch¨ atzung gilt dann kvk − vl kL2 (∂Ω) ≤ c(Ω) kvk − vl kH 1 (Ω) ,
k, l ∈ N.
Da die Norm auf der rechten Seite f¨ ur k, l → ∞ gegen Null konvergiert, folgt, daß die Spuren vk|∂Ω (k ∈ N) auf ∂Ω eine Cauchy-Folge im Lebesgue-Raum L2 (∂Ω) bilden. Deren Limes v|∂Ω ∈ L2 (∂Ω) wird dann als die Spur“ der Funktion v ∈ H 1 (Ω) bezeichnet. In diesem Sinne ” nehmen schwache H 1 -L¨ osungen vorgegebene Randwerte an. Das Variationsargument liefert zun¨achst nur die Existenz einer schwachen“ L¨osung u ∈ ” H 1 (Ω) der Poisson-Gleichung. Um zu sehen, daß diese im Fall glatter“ Daten auch klassische“ ” ”
1.3 Hilfsmittel aus der Theorie von Funktionenr¨aumen
29
L¨osung ist, zeigt man (mit einigem Aufwand) u ∈ H m (Ω) f¨ ur sukzessive ansteigendes m ≥ 2 . Hieraus kann dann geschlossen werden, daß u auch bis zur gew¨ unschten Stufe klassisch differenzierbar ist. Dazu bedient man sich einer sog. Sobolewschen Ungleichung“. Zur Motivation ” sei zun¨achst der eindimensionale Fall betrachtet. Beispiel 1.2: Wir betrachten das Intervall Ω = (0, 1) ⊂ R1 . F¨ ur eine Funktion u ∈ C 1 (Ω) impliziert der Fundamentalsatz der Differential- und Integralrechnung, daß Z x u′ (ξ) dξ, x, y ∈ Ω. u(x) = u(y) + y
Daraus folgt nach Integration ¨ uber y ∈ [0, 1] : Z Z 1 ′ |u | dξ + sup |u(x)| ≤ x∈Ω
0
1 0
|u| dξ = kukH 1,1 (Ω) ,
mit der Norm des Sobolew-Raums H 1,1 (Ω) . Dies bedeutet, daß in einer Raumdimension eine H 1,1 -Funktion beschr¨ ankt ist. Dar¨ uber hinaus ist sie sogar stetig (genauer im L2 -Sinne ¨ aquivalent zu einer stetigen Funktion), was man mit Hilfe des ¨ ublichen Approximationsarguments erschließt. Hierf¨ ur reicht schon die L1 -Integrabilit¨ at der ersten Ableitung aus. In h¨oheren Dimensionen ist die Situation komplizierter. Wir haben schon am Beispiel der Funktion v(x) = ln(ln(|x|−1 )+1) gesehen, daß Funktionen in H 1 (Ω) (im R2 ) i.a. unbeschr¨ankt sein k¨onnen und man ihnen folglich auch nicht u ¨ berall Punktwerte zuordnen kann. Dies ist aber m¨oglich f¨ ur Funktionen in Sobolew-R¨ aumen h¨oherer Ordnung. Wir pr¨asentieren hier als Beispiel den folgenden Sobolewsche Einbettungssatz“. ” Hilfssatz 1.4 (Sobolewsche Ungleichung): F¨ ur Funktionen v ∈ C 2 (Ω) gilt in zwei Raumdimensionen die Absch¨atzung sup |v(x)| ≤ c(Ω) kvkH 2 (Ω)
(1.3.23)
x∈Ω
mit einer Ω-abh¨angigen Konstante c(Ω) . Beweis: F¨ ur den nicht trivialen Beweis verweisen wir auf die einschl¨agige Literatur u ¨ber SobolewR¨aume (z.B.: Wloka (1982)). Q.E.D.
Analog wie schon vorher bei der Spurabsch¨atzung dient die Sobolewsche Ungleichung (1.3.23) zur Definition von Punktwerten von Funktionen in Sobolew-R¨aumen. F¨ ur ein v ∈ H 2 (Ω) sei wie2 der (vk )k∈N ⊂ C (Ω) eine approximierende Folge. Mit der Sobolewschen Ungleichung (1.3.23) erschließen wir, daß (vk )k∈N auch Cauchy-Folge bzgl. der Maximumnorm ist. Folglich k¨onnen f¨ ur v ∈ H 2 (Ω) Punktwerte definiert werden durch v(x) := lim vk (x), k→∞
x ∈ Ω.
In diesem Sinne besteht also eine ( stetige“) Einbettung H 2 (Ω) ֒→ C(Ω) . Die Absch¨atzung ” (1.3.23) l¨aßt sich (im R2 ) u ¨bertragen auf die Normen der Sobolew-R¨aume H 2,1 (Ω) und H 1,p (Ω)
30
Theorie partieller Differentialgleichungen
f¨ ur p > 2 . Folglich bestehen die stetigen Einbettungen H 2,1 (Ω) ∪ H 1,p (Ω) ֒→ C(Ω),
p > 2, im R2 .
(1.3.24)
Weitere Sobolewsche Ungleichungen f¨ uhren auf die stetigen Einbettungen H 1 (Ω) ֒→ Lp (Ω) (1 ≤ p < ∞) im R2 ,
H 1 (Ω) ֒→ L6 (Ω) im R3 .
Von fundamentaler Bedeutung ist der sog. Rellichsche Auswahlsatz“. Wir formulieren hier nur ” eine einfache Variante, welche weiter unten ben¨otigt wird. Hilfssatz 1.5 (Rellichscher Auswahlsatz): Die nat¨ urliche Einbettung des Sobolew-Raumes 1 2 ankten Folge (vk )k∈N ⊂ H (Ω) in L (Ω) ist kompakt, d.h.: Aus jeder bzgl. der H 1 -Norm beschr¨ H 1 (Ω) ⊂ L2 (Ω) l¨ aßt sich eine Teilfolge ausw¨ahlen, welche in L2 (Ω) gegen einen Limes v konvergiert. Dieser Limes ist dann auch wieder in H 1 (Ω) . Beweis: F¨ ur den Beweis wird auf die Literatur verwiesen; z.B. Wloka (1982).
Q.E.D.
Der Rellichsche Auswahlsatz ist das Sobolew-Raum-Analogon des Auswahlsatzes von Arzel`a-Ascoli f¨ ur gleichgradig stetige“ Folgen stetiger Funktionen (siehe das Vorlesungsskriptum ” Numerische Mathematik I). 1.3.3 Elemente der Spektraltheorie elliptischer Operatoren Eine der wichtigsten Anwendungen des Rellichschen Auswahlsatzes findet sich in der Spektral” Theorie“ elliptischer Differentialoperatoren, speziell des Laplace-Operators. Wir wollen deren Elemente hier kurz entwickeln. Dabei haben wir vor allem deren Anwendung in der L¨osungstheorie f¨ ur parabolische ARWAn im Auge. Ferner werden wir sp¨ater die numerische L¨osung von Eigenwertaufgaben des Laplace-Operators mit Hilfe von Finite-Elemente-Verfahren untersuchen, wobei Resultate der Spektraltheorie ben¨otigt werden. Wir haben gesehen, daß f¨ ur jede rechte Seite f ∈ L2 (Ω) eine eindeutige schwache“ L¨osung ” u ∈ H01 (Ω) der 1. RWA des Laplace-Operators existiert: −∆u = f
in Ω,
u|∂Ω = 0.
(1.3.25)
Diese ist bestimmt durch die variationelle Beziehung (∇u, ∇ϕ) = (f, ϕ) ∀ϕ ∈ H01 (Ω).
(1.3.26)
Die Zuordnung f 7→ Sf := u definiert dann einen linearen Operator S : L2 (Ω) 7→ L2 (Ω) , der in diesem Sinne als die L2 -Inverse“ des Laplace-Operators auf Ω unter Dirichlet-Randbedingungen ” bezeichnet werden kann. Der Beziehung k∇uk20 = (f, u) ≤ kf k0 kuk0 ≤ dΩ kf k0 k∇uk0 entnehmen wir, daß kSf k0 ≤ dΩ k∇Sf k0 ≤ d2Ω kf k0 ,
d.h.: Der L¨ osungsoperator S : L2 (Ω) 7→ L2 (Ω) ist beschr¨ankt und wegen der kompakten Ein1 bettung H (Ω) ֒→ L2 (Ω) sogar kompakt. Wir haben schon gesehen, daß der Laplace-Operator
1.3 Hilfsmittel aus der Theorie von Funktionenr¨aumen
31
als Operator im Hilbert-Raum L2 (Ω) symmetrisch und positiv-definit ist: 2 (−∆u, u) = k∇uk20 ≥ d−2 Ω kuk0 .
(−∆u, v) = (∇u, ∇v) = (u, −∆v),
Dies gilt f¨ ur Funktionen u, v ∈ D(∆) im Definitionsbereich der L2 -Realisierung“ des Laplace” Operators, welcher definiert ist durch D(∆) := v ∈ H01 (Ω) : |(∇v, ∇ϕ)| ≤ c(v)kϕk0 , ϕ ∈ H01 (Ω) ⊂ L2 (Ω).
F¨ ur glatt berandete Gebiete oder konvexe Polygongebiete Ω kann man zeigen, daß D(∆) = H01 (Ω) ∩ H 2 (Ω) . Im Fall einspringender Ecken ist dagegen D(∆) 6⊂ H 2 (Ω) .
Wir haben damit eine Realisierung des Laplace-Operator im Hilbert-Raum L2 (Ω) konstruiert, welche auf ihrem Definitionsbereich D(∆) symmetrisch ist, diesen ein-eindeutig auf ganz L2 (Ω) abbildet, also bijektiv ist und deren Inverse S = (−∆)−1 kompakt ist. Damit ist der Rahmen f¨ ur die Anwendung abstrakter Resultate der Funktionalanalysis kompakter Operatoren geschaffen. F¨ ur das Eigenwertproblem des Laplace-Operators −∆w = λw
in Ω,
w|∂Ω = 0,
(1.3.27)
mit Eigenfunktion w ∈ H01 (Ω) und Eigenwert λ ∈ R gelten die folgenden Aussagen: – Es existieren nur relle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... , welche sich im Endlichen nicht h¨ aufen k¨ onnen. Die zugeh¨origen Eigenr¨aume E(λi ) sind endlich dimensional. – Es existiert ein vollst¨ andiges Orthonormalsystem von Eigenfunktionen {wi )i∈N ⊂ L2 (Ω) , d.h.: F¨ ur jedes u ∈ L2 (Ω) gilt die L2 -konvergente Fourier13 -Entwicklung“ ” ∞ X (u, wi ) wi . (1.3.28) u= i=1
– Mit Hilfe der Eigenwerte λi (ihrer Vielfachheiten entsprechend oft gez¨ahlt) und zugeh¨origen (orthonormierten) Eigenfunktionen wi lassen sich allgemeine Funktionen des LaplaceOperators definieren. Sei Φ(z) eine meromorphe Funktion, so daß die Eigenwerte λi keine Pole sind. Dann wird durch Φ(−∆)u :=
∞ X
Φ(λi )(u, wi ) wi
(1.3.29)
i=1
ein linearer Operator in L2 (Ω) erkl¨art. Wenn Φ(z) beschr¨ankt ist, wird auch Φ(−∆) beschr¨ ankt und ist auf ganz L2 (Ω) erkl¨art. Diese Aussagen zeigen die starke Parallelit¨at zwischen kompakten Operatoren bzw. von (dicht definierten) Operatoren mit kompakter Inverser im Hilbert-Raum und linearen Abbildungen des Rn . 13
Jean-Baptiste Baron de Fourier (1768-1830): franz¨ osischer Mathematiker und Physiker; Mitglied der Pariser ´ ¨ Akademie lehrte an der Ecole Polytechniqe; begleitete Napoleon auf seinem Feldzug nach Agypten; z¨ ahlt zu den bedeutendsten Mathematikern des 19. Jahrhunderts; fand bei seinen Arbeiten zur Theorie der W¨ armeleitung die Darstellbarkeit periodischer Funktionen durch triginometrische Reihen.
32
Theorie partieller Differentialgleichungen
1.4 Parabolische Probleme Die sog. eindimensionale W¨ armeleitungsgleichung“ ” ∂t u = ∂x2 u,
(1.4.30)
oder allgemeiner in h¨ oheren Ortsdimensionen ∂t u − ∆u = f,
(1.4.31)
wird u ¨blicherweise auf Zylindern QT := Ω × I des Orts/Zeit-Raumes betrachtet. Dabei sind Ω ⊂ Rd ein Ortsgebiet und I := (0, T ] ein Zeitintervall. Im o¨rtlich eindimensionalen Fall (d = 1) ist die nat¨ urliche Anfangskurve Γ = {(x, t) ∈ R2 : t = 0} gerade Charakteristik, so daß das zugeh¨ orige Cauchysche Anfangswertproblem i.a. nicht l¨osbar ist. Entlang Γ d¨ urfen, wie wir noch sehen werden, nur Anfangsbedingungen an u selbst gestellt werden: u|t=0 = u0 (x). Entlang eines nicht-charakteristischen ¨ortlichen“ Randes {(x, t) ∈ Rd+1 : x ∈ ∂Ω, t > 0} gilt ” dagegen dasselbe wie im elliptischen Fall, d.h.: Die zugeh¨orige Anfangswertaufgabe ist l¨osbar, doch d¨ urfen nur u oder ∂n u vorgeschrieben werden, wenn man stetige Abh¨angigkeit von den Randdaten gew¨ ahrleisten will. Analog zum elliptischen Fall bieten sich drei verschiedene Typen von Randbedingungen entlang des ¨ ortlichen Randes ∂Ω × I f¨ ur die Anfangs-Randwert-Aufgabe (kurz ARWA“) der ” W¨armeleitungsgleichung an. Zus¨ atzlich zu der Anfangsbedingung u|t=0 = u0
(1.4.32)
wird gefordert: a) Dirichletsche Randbedingungen ( 1. ARWA“): u = g auf ∂Ω × I ; ” b) Neumannsche Randbedingungen ( 2. ARWA“): ∂n u = g auf ∂Ω × I ; ” c) Robinsche Randbedingungen ( 3. ARWA“): ∂n u + αu = g auf ∂Ω × I . ” Die Randfunktionen g werden i.a. als glatt und α ≥ 0 angenommen. Alle diese ARWAn sind, wie wir zum Teil zeigen werden, unter geeigneten Zusatzbedingungen an die Daten ebenfalls wohl ¯ T ) ∩ C 2 (QT ) , gestellt. Unter einer klassischen L¨ osung“ verstehen wir eine Funktion u ∈ C(Q ” ¨ welche der Differentialgleichung sowie den Anfangs- und Randbedingungen gen¨ ugt. Ahnlich wie bei elliptischen Problemen gibt es auch im parabolischen Fall den Begriff der schwachen ” L¨osung“, den wir hier aber wegen seiner Kompliziertheit nicht definieren wollen. Zun¨achst diskutieren wir die Eindeutigkeitsfrage. Seien u(1) , u(2) wieder zwei klassische (analog zum elliptischen Fall definiert) L¨ osungen der 1. ARWA des W¨armeleitungsoperators, f¨ ur die k∇u(i) (t)kΩ existiert und beschr¨ ankt ist. F¨ ur die Differenz w := u(1) − u(2) gilt dann ∂t w − ∆w = 0 in Ω × I,
w|t=0 = 0, w|∂Ω = 0.
Multiplikation mit w , Integration u ¨ ber Ω und anschließende partielle Integration im Ort ergeben analog zum elliptischen Fall 0 = (∂t w, w) − (∆w, w) = 21 dt kwk2 + k∇wk2 . Dies impliziert, daß kw(t)k ≤ kw(0)k = 0 f¨ ur t ≥ 0, und somit die Eindeutigkeit der L¨osung
1.4 Parabolische Probleme
33
und dar¨ uber hinaus deren stetige Abh¨angigkeit von den Anfangsdaten. Die Existenzfrage l¨ aßt sich im Prinzip mit ¨ahnlichen Methoden behandeln wie im elliptischen Fall. Wir wollen das hier aus Zeitgr¨ unden nicht weiter verfolgen. Im ¨ortlich eindimensionalen Spezialfall Ω = (−∞, ∞) und f ≡ 0 l¨aßt sich die L¨osung der Anfangswertaufgabe explizit angeben: Z ∞ 2 √ 1 e−(x−s) /4t u0 (s) ds. (1.4.33) u(x, t) = 4πt −∞
Dies wird durch Nachrechnen verifiziert, wobei speziell auf die Existenz der auftretenden Integralterme zu achten ist. Man beachte, daß durch den Ansatz s(x, t) =
2 √ 1 e−x /4t 4πt
eine spezielle L¨ osung der W¨ armeleitungsgleichung gegeben ist. Im Fall allgemeinerer, beschr¨ ankter Ortsgebiete Ω ⊂ Rd gewinnt man eine zu (1.4.33) korrespondierende L¨ osungsdarstellung mit Hilfe der Methode der Variablenseparation“. Einsetzen ” des L¨osungsansatzes u(x, t) = v(x)ψ(t) in die W¨armeleitungsgleichung ergibt ψ ′ (t)v(x) = ψ(t)∆v(x)
∆v(x) ψ ′ (t) = ≡ konst. , ψ(t) v(x)
⇒
f¨ ur alle Argumente (x, t) ∈ QT . Die Separationsfaktoren v(·) ∈ C(Ω) ∩ C 2 (Ω) , v|∂Ω = 0 , und ψ(·) ∈ C(I) sind also notwendig L¨ osungen der Eigenwertprobleme −∆v(x) = λv(x) , x ∈ Ω ,
−ψ ′ (t) = λψ(t) , t ≥ 0 ,
unter den Nebenbedingungen v|∂Ω = 0 bzw. ψ(0) = 1 , mit Parametern λ ∈ R. Die Eigenwertaufgabe f¨ ur v(x) besitzt, wie schon oben diskutiert, eine abz¨ahlbare Folge von L¨osungen λj > 0 und vj : −∆vj = λj vj (j = 1, 2, 3, ...)..
Die Eigenfunktionen (vj )j∈N bilden ein vollst¨andiges Orthonormal-System im Raum L2 (Ω) der auf Ω Lebesgue-meßbaren und quadratintegrablen Funktionen. Die zugeh¨ origen L¨ osungen f¨ ur ψ(t) sind ψj (t) = e−λj t . Die Anfangsfunktion besitzt die (verallgemeinerte) Fourier-Entwicklung: 0
u (x) =
∞ X
u0j vj (x) ,
u0j
=
j=0
Z
u0 (x)vj (x) dx .
I
Durch Superposition der Einzell¨ osungen f¨ ur j ∈ N , u(x, t) :=
∞ X
u0j vj (x)e−λj t ,
(1.4.34)
j=1
erhalten wir folglich eine L¨ osung der W¨armeleitungsgleichung, welche den Randbedingungen und insbesondere den Anfangsbedingungen gen¨ ugt. (Zum Nachweis u ufe man die Konver¨berpr¨ genz der Reihen der jeweils nach x sowie t abgeleiteten Einzell¨osungen.) Im eindimensionalen
34
Theorie partieller Differentialgleichungen
Spezialfall Ω = (0, 1) ⊂ R1 ist gerade vj (x) = αj sin(jπx) ,
λj = j 2 π 2 ,
Z
αj =
sin2 (jπx) dx I
−1/2
(j ∈ N),
und die L¨osungsdarstellung erh¨ alt die explizite Form u(x, t) =
∞ X
u0j αj sin(jπx)e−aj
2 π2 t
(1.4.35)
j=1
Anhand dieser L¨ osungsdarstellungen lassen sich einige wichtige Eigenschaften der ARWA der W¨armeitungsgleichung ablesen. Wie bei AWAn gew¨ohnlicher Differentialgleichungen entwickelt sich die L¨osung ausgehend vom Anfangswert in der Zeit. Der ad¨aquate numerische Ansatz wird also wieder ein Teilschrittverfahren in der Zeit sein. Im Ort pflanzen sich St¨orungen wie im elliptischen Fall unendlich schnell“ fort. Irregularit¨aten in den Anfangs- oder Randdaten werden ” sofort ausgegl¨ attet, d.h.: im Innern des Zylindergebiets QT := Ω×(0, T ] ist die L¨osung (im Falle glatter rechter Seite f ) stets glatt. Im folgenden wollen wir einige qualitative Eigenschaften von L¨osungen der W¨armeleitungsgleichung diskutieren. Die W¨ armeleitungsgleichung wird u.a. verwendet, um (ihrem Namen entsprechend) W¨ armeausbreitungs- bzw. allgemein instation¨are Diffusionsvorg¨ange zu beschreiben. Es ist daher wichtig, garantieren zu k¨ onnen, daß ihre L¨osungen bei kompatiblen Daten auch stets positiv sind. Dies wird durch ein (dem elliptischen Fall ¨ahnliches) Maximumprinzip geleistet.
t T
Ω x (0, T] Ω x (0, T]
x
Ω x {0}
Satz 1.1 (Parabolisches Maximumprinzip): F¨ ur jede klassische L¨ osung der W¨ armeleitungsUngleichung ∂t u − ∆u ≤ 0
in Ω,
(1.4.36)
gilt das sog. Maximumprinzip“, d.h.: Sie nimmt im (halboffenen) Zylinder QT := Ω × (0, T ] ” kein striktes Maximum an. Beweis: Wir geben den Beweis nur f¨ ur eine Raumdimension. Die Verallgemeinerung f¨ ur h¨ohere Dimensionen ist dann evident. F¨ ur eine L¨osung u der W¨armeleitungs-Ungleichung setzen wir ¯ T ist, nimmt es in einem Punkt vε := u − εt, mit beliebigem ε > 0. Da vε stetig auf Q ¯ (x0 , t0 ) ∈ QT sein Maximum an. Angenommen, (x0 , t0 ) ∈ QT . Dann gilt ∂x2 vε (x0 , t0 ) ≤ 0 , und folglich
1.4 Parabolische Probleme
35
∂t vε (x0 , t0 ) ≤ ∂t vε (x0 , t0 ) − ∂x2 vε (x0 , t0 ) = ∂t u(x0 , t0 ) − ε − ∂x2 u(x0 , t0 ) ≤ −ε.
ur t0 −h ≤ t ≤ t0 , mit einem geeigneten Aus Stetigkeitsgr¨ unden ist dann auch ∂t vε (x0 , t) ≤ − 12 ε f¨ h > 0. Hiermit folgern wir, daß Z t0 ∂t vε (x0 , t) dt ≤ − 12 εh < 0. vε (x0 , t0 ) − vε (x0 , t0 − h) = t0 −h
Dies f¨ uhrt auf den Widerspruch vε (x0 , t0 ) < vε (x0 , t0 − h). Also nimmt vε notwendig sein Maximum f¨ ur t = 0 an. Da ε > 0 beliebig klein gew¨ahlt werden darf, gilt diese Aussage auch f¨ ur den (stetigen) Grenzfall ε = 0 , d.h. f¨ ur die L¨osung u . Q.E.D. Als Konsequenz des parabolischen“ Maximumprinzips sehen wir insbesondere, daß eine L¨osung ” der (homogenen) W¨ armeleitungsgleichung ∂t u − ∆u = 0 in Ω,
u = 0 auf ∂Ω,
(1.4.37)
zu nicht-negativen Anfangsdaten u0 ≥ 0 (u|∂Ω = 0) nicht-negativ bleibt f¨ ur alle t ≥ 0 : u0 ≥ 0
⇒
0 ≤ u(x, t) ≤ maxΩ u0 ,
(x, t) ∈ QT .
(1.4.38)
¯ T ) ∩ C 2 (QT ) eindeutig bestimmt. Ferner sind wieder klassische“ L¨ osungen u ∈ C(Q ” Satz 1.2 (Globale Beschr¨ anktheit): F¨ ur jede L¨osung der inhomogenen W¨ armeleitungsgleichung (1.4.31) gilt die a priori Absch¨ atzung ku(t)k ≤ e−λt ku0 k + λ−1 sup kf k,
(1.4.39)
[0,t]
mit dem kleinsten Eigenwert λ > 0 des elliptischen Operators −∆ auf Ω zu homogenen Dirichlet-Randbedingungen. Beweis: Wir betrachten die beiden Hilfsrobleme ∂t v − ∆v = 0 in QT ,
∂t w − ∆w = f in QT ,
v|∂Ω = 0, v|t=0 = u0 ,
w|∂Ω = 0, w|t=0 = 0.
(1.4.40) (1.4.41)
Offenbar ist dann u = v + w wegen der Linearit¨at des W¨armeleitungsoperators (Superpositionsprinzip). Wir sch¨ atzen nun die beiden L¨osungsanteile v und w separat ab. (i) Multiplikation von (1.4.40) mit v und Integration im Ort ergibt 2 1 2 dt kvk
+ k∇vk2 = 0.
Wir multiplizieren dies mit e2λt und finden 2λt 1 kvk2 + e2λt k∇vk2 − λe2λt kvk2 = 0. 2 dt e Wegen λkvk2 ≤ k∇vk2 impliziert dies dt e2λt kvk2 ≤ 0 , und Integration bzgl. t ergibt e2λt kv(t)k2 ≤ ku0 k2
36
Theorie partieller Differentialgleichungen
bzw. wieder kv(t)k ≤ e−λt ku0 k. (ii) Multiplikation von (1.4.41) mit w und Integration im Ort ergibt 2 1 2 dt kwk
+ k∇wk2 = (f, w) ≤ 12 λkwk2 + 12 λ−1 kf k2 .
Mit Hilfe von λkwk2 ≤ k∇wk2 folgern wir dt kwk2 + k∇wk2 ≤ λ−1 kf k2 . Wir multiplizieren diese Ungleichung nun mit eλt und finden dt eλt kwk2 + eλt k∇wk2 − λeλt kwk2 ≤ λ−1 eλt kf k2 ,
bzw.
Integration bzgl. t ergibt
dt eλt kwk2 ≤ λ−1 eλt kf k2 .
eλt kw(t)k2 ≤ λ−1
Z
t
eλs kf k2 ds, 0 Z t 2 −1 −λt kw(t)k ≤ λ e eλs kf k2 ds. 0
Die Absch¨atzung e−λt
Z
t
0
impliziert dann kw(t)k ≤ behauptete Absch¨ atzung.
λ−1 max
[0,t] kf k .
eλs ds ≤ λ−1 .
Kombination der Resultate f¨ ur v und w liefert die Q.E.D.
Als Folgerung aus diesem Satz ersehen wir insbesondere, daß bei einem parabolischen Problem der Einfluß der Anfangsdaten exponentiell mit der Zeit abklingt. Weiter interessiert das L¨osungsverhalten f¨ ur Anfangsdaten u0 mit minimaler Regularit¨at.
Satz 1.3 (Gl¨ attungseigenschaft): F¨ ur jede L¨ osung der homogenen W¨ armeleitungsgleichung (1.4.31) mit f ≡ 0 gelten die a priori Absch¨ atzungen k∂t u(t)k + k∆u(t)k ≤ k∆u0 k, k∂t u(t)k + k∆u(t)k ≤ t
−1
0
ku k,
t ≥ 0,
t > 0,
(1.4.42) (1.4.43)
vorausgesetzt, der Anfangswert u0 besitzt die erforderliche Regularit¨ at. Beweis: Wir bedienen uns zum Beweis der sog. Spektral-Methode“, welche aber auf symmetri” sche und autonome (d.h. nicht explizit von der Zeit abh¨angige) Operatoren beschr¨ankt ist. Alternative Zug¨ ange sind die Halbgruppen-Methode“, welche nicht die Symmetrie des Operators ” erfordert, sowie die Energie-Methode“, welche im allgemeinen Fall und sogar f¨ ur nichtlineare ” Probleme anwendbar ist. Aus der L¨ osungsdarstellung (1.4.34) mit dem Orthonormalsystem von
1.4 Parabolische Probleme
37
Eigenfunktionen {vj }j∈N des Laplace-Operators, u(x, t) :=
∞ X
u0j vj (x)e−λj t ,
j=1
folgern wir ∂t u(x, t) = ∆u(x, t) := −
∞ X
u0j λj vj (x)e−λj t .
j=1
Aufgrund der (verallgemeinerten) Parsevalschen14 Identit¨at gilt demnach ∞ X (u0j )2 λ2j e−2λj t . k∂t uk = k∆uk = 2
2
j=1
Als erstes Resultat entnehmen wir dieser Beziehung, daß k∂t uk2 = k∆uk2 ≤
∞ X j=1
(u0j )2 λ2j = k∆u0 k2 .
Hieraus folgt wegen xe−x ≤ 1, x ≥ 0, : 2
2
k∂t uk = k∆uk = t
−2
∞ ∞ X X 0 2 2 −2λj t −2 (u0j )2 = t−2 ku0 k2 , (uj ) (λj t) e ≤t j=1
j=1
was den Beweis vervollst¨ andigt.
Q.E.D.
Als Folgerung aus diesem Satz finden wir nochmal best¨atigt, daß die W¨armeleitungsgleichung die Gl¨attungseigenschaft“ besitzt, d.h.: Irregularit¨aten in den Anfangsdaten werden f¨ ur t > 0 ” ausgegl¨attet. Durch Weiterf¨ uhrung der Argumentation im Beweis von Satz 1.3 lassen sich analog beliebig hohe Ableitungen der L¨ osung absch¨atzen: k∂tp u(t)k + k∇2p u(t)k ≤ c(p) k∆p u0 k,
t ≥ 0,
(1.4.44)
t > 0, p ∈ N.
(1.4.45)
sowie k∂tp u(t)k + k∇2p u(t)k ≤ c(p) t−p ku0 k,
14
Mare-Antoine Parseval des Chˆenes (1755-1836): franz¨ osischer Mathematiker; Privatgelehrter; Beitr¨ age zu Reihen, insbesondere Fourier-Reihen.
38
Theorie partieller Differentialgleichungen
1.5 Hyperbolische Probleme Die Wellengleichung ∂t2 u − ∆u = 0
(1.5.46)
wird in der Regel wieder auf einem Zylindergebiet QT := Ω × I mit einem (meist beschr¨ankten) Gebiet Ω ⊂ Rd und einem Intervall I = (0, T ] betrachtet. Die Frage nach der Wohlgestelltheit zugeh¨origer Anfangs-Randwertaufgaben wollen wir nur f¨ ur den ¨ortlich eindimensionalen Fall diskutieren. Die charakteristischen Steigungen der (¨ortlich) eindimensionalen Wellengleichung ∂t2 u = ∂x2 u
(1.5.47)
sind gerade gegeben durch dt/dx = ±1, d.h.: die Charakteristiken sind alle Geraden in der (x, t)Ebene mit der Steigung ±1. Die nat¨ urliche Anfangskurve Γ := {(x, t) : x ∈ Ω, t = 0} ist also keine Charakteristik, so daß gem¨ aß der Theorie die zugeh¨orige Cauchysche Anfangswertaufgabe bei Vorgabe von Werten u(x, 0) = u0 (x) und ∂t u(x, 0) = u1 (x) l¨osbar ist. Diese L¨osung l¨ aßt 1 sich im Fall einer Raumdimension leicht angeben. Wir betrachten den Sonderfall Ω = R .
t t0 (x0, t0) B(x0, t0)
A(x0, t0)
x
x0
Die Koordinatentransformation ξ = x + t, η = x − t u uhrt die Wellengleichung in die ¨berf¨ Form ∂ξ ∂η u = 0. Diese hat die allgemeine L¨ osung u(ξ, η) = F (ξ) + G(η) mit beliebigen, hinreichend glatten Funktionen F (·) und G(·). Die allgemeine L¨osung der Wellengleichung lautet demnach u(x, t) = F (x + t) + G(x − t). Zur Erf¨ ullung der Anfangsvorgaben auf Γ muß nun gelten: F (x) + G(x) = u0 (x),
F ′ (x) − G′ (x) = u1 (x).
1.5 Hyperbolische Probleme
39
Hieraus entnehmen wir, daß F (x + t) + G(x + t) + F (x − t) + G(x − t) = u0 (x + t) + u0 (x − t), Z x+t F (x + t) − G(x + t) − F (x − t) + G(x − t) = u1 (s) ds,
(1.5.48) (1.5.49)
x−t
und folglich, u(x, t) =
1 2
n
u0 (x + t) + u0 (x − t) +
Z
x+t x−t
o u1 (s) ds .
Dies ist die (eindeutige) klassische L¨ osung der Wellengleichung zu den vorgegebenen Anfangsdaten u0 (x), u1 (x) . Eine analoge Konstruktion ist auch in h¨oheren Raumdimensionen m¨oglich. Die Form der L¨ osung u(x, t) zeigt, daß bei einem hyperbolischen Problem die Ausbreitungsgeschwindigkeit von Information endlich ist. Lokale St¨orungen pflanzen sich entlang der Charakteristiken (Geraden mit Steigung ±1 ) fort. Insbesondere erzeugen unstetige Anfangsdaten notwendig auch unstetige L¨ osungen. Dies erfordert im Falle irregul¨arer Anfangs- oder Randdaten einen neuartigen L¨ osungsbegriff, der auch Unstetigkeiten zul¨aßt. F¨ ur jeden Punkt (x0 , t0 ) ∈ QT gibt es demnach einen Abh¨ angigkeitsbereich“ A(x0 , t0 ) sowie einen Bestimmtheitsbereich“ ” ” B(x0 , t0 ) , innerhalb deren sich das Anfangswertproblem unabh¨angig vom restlichen Bereich l¨osen l¨aßt: A(x0 , t0 ) := {x ∈ R : |x − x0 | ≤ t0 },
B(x0 , t0 ) := {(x, t) ∈ R × R+ : |x − x0 | ≤ t}.
Die Eindeutigkeit von L¨ osungen der Wellengleichung erschließt man wieder am leichtesten mit Hilbertraum-Argumenten“. Sei u(x, t) eine klassische L¨osung der ARWA ” ∂t2 u = ∆u in Ω,
u|t=0 = u0 , ∂t u|t=0 = u1 , u|∂Ω = 0,
(1.5.50)
mit endlicher Energie“ (kinetische + potentielle Energie) ” E(t) := k∂t u(t)k2Ω + k∇u(t)k2Ω < ∞. Multiplikation der Differentialgleichung mit ∂t u , Integration u ¨ ber Ω und anschließende partielle Integartion ergibt 0 = (∂t2 u − ∆u, ∂t u) = 21 dt k∂t uk2 + k∇uk2 .
Dies impliziert, daß
k∂t u(t)k2 + k∇u(t)k2 = ku1 k2 + k∇u0 k2 ,
(1.5.51)
d.h. die L¨osung ist eindeutig und h¨ angt bzgl. der nat¨ urlichen Energie-Norm stetig von den Anfangsdaten ab. Ferner bleibt die Gesamtenergie E(t) im System in der Zeit erhalten. Dies entspricht der Vorstellung, daß bei einem Schwingungsprozeß, etwa der Schwingung eines elastischen K¨orpers oder einer Schallwelle, bei Vernachl¨assigung von D¨ampfung im Verlaufe der Zeit keine Energie verloren geht. Ein gutes“ Diskretisierungsverfahren f¨ ur die Wellengleichung sollte ” diese kritische Eigenschaft m¨ oglichst gut wiedergeben. Zum Abschluß bemerken wir noch, daß hyperbolische Probleme h¨aufig auch in Form von Systemen partieller Differentialgleichungen 1. Ordnung auftreten (z.B. die Grundgleichungen der Kontinuumsmechanik). Der Prototyp einer einzelnen hyperbolischen Gleichung ist die sog.
40
Theorie partieller Differentialgleichungen
Erhaltungsgleichung“ ” ∂t ρ + ∇ · (ρv) = 0
(1.5.52)
f¨ ur eine skalare Gr¨ oße ρ(x, t) (z.B. die Massedichte) in einem mit der konstanten Geschwindigkeit v(x) bewegten Medium. Diese Gleichung ergibt sich aus einer Erhaltungsannahme f¨ ur die ¨ Gr¨oße ρ , d.h.: F¨ ur ein beliebiges, festes Volumenelement V ⊂ Ω ist die zeitliche Anderung der in V enthaltenen Menge von ρ gleich der insgesamt durch den Rand einstr¨omenden“ Menge: ” Z Z Z ∇ · (ρv) dx. (1.5.53) ρ v · n do = − ∂t ρ(x, t) dx = − V
∂V
V
Da diese Beziehung f¨ ur beliebiges Volumen V gelten soll, muß notwendig die Differentialgleichung (1.5.52) erf¨ ullt sein. Diese Erhaltungseigenschaft“ sollte bei der Diskretisierung solcher ” Probleme m¨ oglichst gut wiedergegeben werden, damit im Verlaufe der instation¨aren Rechnung kein zu großer Verlust an Energie“ auftritt. Dies ist eine ganz kritische Bedingung an gute“ ” ” numerische L¨ osungsverfahren f¨ ur solche Erhaltungsgleichungen und spielt insbesondere in der numerischen Str¨ omungsmechanik eine zentrale Rolle. Im Rahmen dieser einf¨ uhrenden Vorlesung werden wir aber auf diesen Aspekt nicht n¨aher eingehen.
¨ 1.6 Ubungen
41
¨ 1.6 Ubungen ¨ Ubung 1.1: Gegeben sei die Anfangswertaufgabe (AWA) einer skalaren gew. Differentialgleichung u′ (t) = f (t, u(t)), t ≥ t0 , u(t0 ) = u0 , mit einer analytischen Funktion f (t, x) mit gleichm¨aßig beschr¨ankten Ableitungen sup k∂tj ∂xk f (t, ·)k∞ ≤ K < ∞,
j,k≥0
t ≥ t0 ,
(z.B. die Funktion f (t, x) := sin(x) ). Man zeige, daß man durch den Taylor-Ansatz u(t) = u0 +
∞ X f (k−1) (t0 , u0 ) k=1
k!
(t − t0 )k
mit f (r) (t0 , u0 ) := (d/dt)r f (t, u(t))|t=t0 eine globale (d.h. f¨ ur alle t ≥ t0 existierende) L¨osung der AWA erh¨ alt. ¨ Ubung 1.2: In der Vorlesung wurde die Typeneinteilung von linearen Differentialoperatoren 2. Ordnung mit der Aufgabe motiviert, aus gegebenen Werten u(x0 , y0 ) und ∂n u(x0 , y0 ) entlang einer Kurve Γ die L¨ osung u(x, y) u ¨ ber einen Taylor-Reihenansatz zu bestimmen. Diese Konstruktion wurde allerdings nur bis zu den drei zweiten Ableitungen ∂x2 u(x0 , y0 ) , ∂x ∂y u(x0 , y0 ) und ∂y2 u(x0 , y0 ) durchgef¨ uhrt und hing von der Regularit¨at einer gewissen Matrix A ab. Man zeige, daß nach Bestimmung der zweiten Ableitungen die Konstruktion der vier dritten Ableitungen ∂x3 u(x0 , y0 ) , ∂x2 ∂y u(x0 .y0 ) , ∂x ∂y2 u(x0 , y0 ) und ∂y3 u(x0 , y0 ) auf dieselbe Matrix A f¨ uhrt. Diese Aussage gilt auch f¨ ur die weiteren, h¨oheren Ableitungen. Die Vorgenommene Klassifizierung des Differentialoperators als elliptisch, parabolisch oder hyperbolisch basierend auf der Konstruierbarkeit der L¨ osung aus den Randdaten ist also sinnvoll. ¨ Ubung 1.3: Man bestimme den Typ der Differentialgleichungen a)
∂x ∂y u − ∂x u = 0,
b)
∂x2 u + ∂x ∂y u + y∂y2 u + 4u = 0,
c)
2(∂x + ∂y )2 u + ∂y u = 0.
(Hinweis: Das in der Vorlesung angegebene Kriterium f¨ ur den Typ einer Gleichung kann auch bei variablen Koeffizienten separat in jedem einzelnen Ortspunkt verwendet werden.) ¨ Ubung 1.4: Eine (skalare) lineare partielle Differentialgleichung (PDE) 2. Ordnung der Form a11 ∂12 u + a12 ∂1 ∂2 u + a21 ∂2 ∂1 u + a22 ∂22 u = f l¨aßt sich durch Setzung u1 := ∂1 u, u2 := ∂2 u in ein System von PDE 1. Ordung umformen: ∂2 u1 − ∂1 u2 = 0,
a11 ∂1 u1 + a12 ∂1 u2 + a21 ∂2 u1 + a22 ∂2 u2 = f.
42
Theorie partieller Differentialgleichungen
Man zeige, daß sich die in der Vorlesung f¨ ur (skalare) lineare PDE 2. Ordnung durchgef¨ uhrte Typeneinteilung analog auch f¨ ur Systeme 1. Ordnung der allgemeinen Form b111 ∂1 u1 + b112 ∂1 u2 + b121 ∂2 u1 + b122 ∂2 u2 = f1 , b211 ∂1 u1 + b212 ∂1 u2 + b221 ∂2 u1 + b222 ∂2 u2 = f2 , vornehmen l¨ aßt (mit analogen Resultaten). Ziel ist dabei die Bestimmung von Kurven Γ ⊂ R2 , bei denen die Vorgabe von Anfangswerten f¨ ur u1 und u2 entlang Γ die Konstruktion aller Ableitungen von u1 und u2 , beginnend mit den zweiten Ableitungen ∂12 u1 , ∂1 ∂2 u1 , ∂22 u1 , ur die L¨osung erlaubt. (Bem.: Wenn ∂12 u2 , ∂1 ∂2 u2 , ∂22 u2 und damit einen Taylor-Reihenansatz f¨ die Konstruktion von u1 und u2 auf diesem Wege m¨oglich ist, erh¨alt man f¨ ur die gegebene PDE 2. Ordnung dann durch weitere Vorgabe von u entlang Γ aus der Kenntnis von ∂1 u = u1 und ∂2 u = u2 im ganzen L¨ osungsgebiet dort auch eine L¨osung u durch einfaches Aufintegrieren.) ¨ Ubung 1.5: In der Vorlesung wurde die Poincar´esche Ungleichung Z Z 2 2 k∇u(x)k2 dx, dG := diam(G), |u(x)| dx ≤ dG G
G
nur f¨ ur Funktionen u ∈ V0 (G) formuliert, d.h. welche auf dem ganzen Rand ∂G null sind. Der Beweis funktioniert aber auch f¨ ur Funktionen, die nur entlang eines Teils Γ ⊂ ∂G des Randes mit L¨ange |Γ| = 6 0 null sind, d.h. auf dem Raum V0 (Γ; G) := {v ∈ C 1 (G) ∩ C(G) : ∇v ∈ L2 (G)n , v|Γ = 0}. (i) Man f¨ uhre den Beweis dieser Verallgemeinerung der Poicar´eschen Ungleichung f¨ ur das Ein2 2 heitsquadrat Q = (0, 1) ⊂ R und den Randteil Γ := {x = (x1 , 0) : 0 ≤ x1 ≤ 1} . (ii) Kann die Poincare´sche Ungleichung g¨ ultig bleiben, wenn der Randteil Γ ⊂ ∂G trivial ist, etwa nur aus einem Punkt besteht? Man untersuche diese Frage anhand der in (i) gegebenen Situation mit Γ := {(0, 0)} . Welche Konsequenzen hat die Antwort auf diese Frage f¨ ur die 1. RWA des Laplace-Operators? (Hinweis: Man betrachte die Folge der Funktionen uk (r, θ) = r 1/k .) ¨ Ubung 1.6: Auf einem beschr¨ ankten Gebiet Ω ⊂ Rn mit glattem Rand ∂Ω werden die folgende (a) zweite und (b) dritte Randwertaufgabe betrachtet: (a) (b)
− ∆u + au = f in Ω,
− ∆u + au = f in Ω,
∂n u = g auf ∂Ω, ∂n u + αu = g auf ∂Ω,
mit Konstanten a > 0 und α ≥ 0 . Man zeige, daß diese RWAn jeweils h¨ochstens eine “klassische” L¨osung u ∈ C 2 (Ω) ∩ C 1 (Ω) haben k¨onnen. Welches Problem ergibt sich im Fall a = 0 , d.h. f¨ ur den reinen Laplace-Operator? ¨ Ubung 1.7: F¨ ur die klassische L¨ osung der Randwertaufgabe −∆u = 1 in Ω,
u = 0 auf ∂Ω,
auf einem glatt berandetem Gebiet Ω ⊂ Q1 := {(x, y) ∈ R2 | 0 < x, y < 1} zeige man mit Hilfe des Maximumprinzips die Einschließung 0 ≤ u(x) ≤ 18 . (Hinweis: Man vergleiche u mit der
¨ 1.6 Ubungen
43
quadratischen Funktion v = 14 x(1 − x) + 14 y(1 − y) .) ¨ Ubung 1.8: Der Laplace-Operator ∆ = div grad hat f¨ ur Funktionen u = u(r, θ) in Polarkoordinaten (r, θ) ∈ [0, ∞) × [0, 2π] die folgende Form: ∆u = (∂r2 + r −1 ∂r + r −2 ∂θ2 )u. (i) F¨ ur ein ω ∈ (0, 2π] sei Sω := {(r, θ) : r > 0, θ ∈ (0, ω)} der zugeh¨orige Sektor der (x, y)Ebene. Man zeige, daß die auf dem Gebiet G := Sω ∩ K1 (0) definierte Funktion sω (r, θ) := r π/ω sin(θπ/ω) harmonisch ist, d.h. ∆sω ≡ 0 , und den Randbedingungen sω (r, 0) = sω (r, ω) = 0 sowie sω (1, θ) = sin(θπ/ω) gen¨ ugt. (ii) Man zeige, daß im Fall π < ω ≤ 2π , d.h. im Fall eines stumpfen Innenwinkels, die ersten Ableitungen dieser Funktion zwar unbeschr¨ankt aber noch (uneigentlich) quadrat-integrabel sind, daß ihre zweiten Ableitungen aber nicht mehr quadrat-integrabel sind. Wie sieht das bei spitzen Innenwinkeln, d.h. 0 < ω < π , aus? Dieses Beispiel zeigt, daß klassische L¨ osungen von elliptischen RWAn auch zu glatten Daten am Gebietsrand nicht regul¨ ar zu sein brauchen. ¨ Ubung 1.9: Man untersuche, ob die folgenden Funktionen auf dem Einheitsquadrat Ω = {(x, y) ∈ R2 | 0 < x, y < 1} im Sobolew-Raum H 1 (Ω) liegen: a) u(x, y) = |x − y|1/2 ,
1/2 b) u(x, y) = sin ln(1/r) , r = x2 + y 2 .
(Hinweis: Man untersuche die “uneigentliche” Riemann-Integrabilit¨at der Ableitungen.) ¨ Ubung 1.10: Man zeige, daß f¨ ur Funktionen u ∈ H 1 (Ω) unter der Mittelwertbedingung Z u(x) dx = 0 Ω
ebenfalls die Poincar´esche Ungleichung gilt (mit einer Konstante cΩ ): kukΩ ≤ cΩ k∇ukΩ . (Hinweis: Zum Beweis gibt es zwei alternative Wege: Modifikation des direkten Beweises aus der Vorlesung unter Verwendung von “Randwerten” u|Γ = 0 , oder Widerspruchsargument unter Verwendung des Rellichschen Auswahlsatzes.) ¨ Ubung 1.11: Auf welchem der folgenden Gebiete ist die RWA −∆u = 0 in Ω,
u|∂Ω = 0,
wohl gestellt, d.h. besitzt eine eindeutige schwache L¨osung u ∈ H01 (Ω) (mit Begr¨ undung)?
44
Theorie partieller Differentialgleichungen
a) gepunktete Kreisscheibe Ω = {x ∈ R2 | 0 < |x| < 1} ⊂ R2 ; b) geschlitzte Kreisscheibe Ω = {x ∈ R2 | |x| < 1} \ Γ,
Γ := {x ∈ R2 | −
1 2
≤ x1 ≤ 21 , x2 = 0 } ⊂ R2 .
¨ Ubung 1.12: Man gebe eine variationelle Formulierung der folgenden Randwertaufgabe an: −∆u + u = f in Ω,
∂n u + u|∂Ω = g,
und begr¨ unde, daß deren L¨ osung im Falle ausreichender Glattheit die RWA l¨ost. ¨ Ubung 1.13: Welche von den folgenden Sobolewschen Ungleichungen sind richtig? a) b) c) d)
kukL∞ (Ω) ≤ c kukH 2 (Ω) ,
u ∈ H 2 (Ω), Ω ⊂ R3 ;
kukL∞ (Ω) ≤ c kukH 1 (Ω) ,
u ∈ H 1 (Ω), Ω ⊂ R2 ;
kukL∞ (Ω) ≤ c kukH 1,1 (Ω) , kukL1 (∂Ω) ≤ c kukH 1,1 (Ω) ,
u ∈ H 1,1 (Ω), Ω ⊂ R1 ; u ∈ H 1,1 (Ω), Ω ⊂ R2 .
Man erkl¨are die Bedeutung der verwendeten Funktionenr¨aume und Normen.
2 Differenzen-Verfahren fu ¨ r elliptische Probleme In diesem Kapitel werden wir zun¨ achst die klassischen Differenzenapproximationen zur L¨osung ¨ elliptischer Randwertaufgaben diskutieren. Der Ubersichtlichkeit halber beschr¨anken wir uns dabei auf das Modellproblem der Poisson-Gleichung in zwei Raumdimensionen mit Dirichletschen Randbedingungen, d.h. auf die 1. RWA: Lu := −∆u = f
in Ω,
u = g auf ∂Ω.
(2.0.1)
Das Definitionsgebiet Ω ⊂ R2 wird zun¨achst wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g sind ebenfalls glatt, so daß die im vorigen Kapitel beschriebenen Resultate anwendbar sind. Erweiterungen f¨ ur Probleme mit variablen Koeffizienten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen ber¨ ucksichtigt.
2.1 Allgemeine Differenzenapproximationen Zur Definition einer sog. Differenzenapproximation“ der RWA wird das L¨osungsgebiet Ω durch ” ein endliches (nicht notwendig ¨ aquidistantes oder kartesisches) Punktgitter u ¨ berdeckt. Wir definieren disjunkte Punktmengen Ωh := { innere” Gitterpunkte in Ω}, ” ∂Ωh := { Rand-Gitterpunkte” nahe bei ∂Ω}, ” und setzen Ωh := Ωh ∪ ∂Ωh . Welche Punkte zu ∂Ωh geh¨oren, h¨angt von der Eigenart der gew¨ahlten Differenzenapproximation ab; im folgenden werden verschiedene Beispiele betrachtet. Der Parameter h > 0 beschreibt wie u ¨blich die Feinheit” des Gitters Ωh , d.h. so etwas wie den ” mittleren Abstand benachbarter Gitterpunkte. Die Gitterpunkte in ∂Ωh seien ¨ahnlich dicht verteilt wie die in Ωh . Die Differentialgleichung wird nun in den Punkten in Ωh betrachtet und jede Ableitung durch einen Differenzenquotient ersetzt. Diese Differenzenappoximation greift dabei auch auf Randpunkte in ∂Ωh zur¨ uck. So ergibt sich ein Differenzenschema zur Bestimmung einer diskreten L¨ osung uh : Ωh → R der allgemeinen Gestalt Lh uh (P ) = fh (P ) f¨ u r P ∈ Ωh ,
uh (P ) = gh (P ) f¨ ur P ∈ ∂Ωh ,
(2.1.2)
wobei fh und gh geeignete Approximationen der rechten Seite f bzw. der Randwerte g sind (im einfachsten Fall etwa gh (P ) = g(P ) ). Auf nat¨ urliche Weise verstehen wir die Anwendung des Operators Lh auch auf die kontinuierliche L¨osung u ∈ C(Ω) . Zur Konstruktion konkreter Differenzenoperatoren definieren wir zu jedem Punkt eine Umgebung von (verschiedenen) Punkten N (P ) := {Qi , i = 0, ..., rP } (Konvention: Q0 := P ), auf denen eine Differenzenapproximation des Laplace-Operators definiert ist. Der Differenzenoperator hat dann die Form X Lh uh (P ) = σ(P, Q)uh (Q), (2.1.3) Q∈N (P )
45
46
Differenzen-Verfahren f¨ ur elliptische Probleme
mit gewissen Koeffizienten σ(P, Q). Diese sind so zu bestimmen, daß die folgenden Forderungen erf¨ ullt sind: i) Konsistenz: Das Schema ist konsistent”, d.h.: F¨ ur den Abschneidefehler” ” ” τh (P ) := Lh u(P ) − fh (P ),
P ∈ Ωh ,
gilt max |τh (P )| → 0 (h → 0).
P ∈Ωh
(2.1.4)
W¨ unschenswert w¨ are eine m¨ oglichst hohe Konsistenzordnung“ m ≥ 1 , d.h.: ” max |τh (P )| = O(hm ).
(2.1.5)
P ∈Ωh
¨ Wir werden uns im folgenden u ugen. Aus Okonomiegr¨ unden ¨ blicherweise meist mit m = 2 begn¨ wird man rP von moderater Gr¨ oße w¨ ahlen ( rP ≈ 4 − 24 in zwei Raumdimensionen). ii) Stabilit¨at: Das Differenzenschema ist wohl-gestellt, d.h.: Es bestimmt eindeutige diskrete L¨osungen (uh (P ))P ∈Ωh , welche gleichm¨aßig bzgl. h stetig von den Daten des Problems abh¨angen. Dazu w¨ are z.B. eine Stabilit¨atsabsch¨atzung des folgenden Typs zu beweisen: (2.1.6) max |uh (P )| ≤ cstab max |Lh uh (P )| + max |uh (P )| , P ∈Ωh
P ∈Ωh
P ∈∂Ωh
mit einer von h unabh¨ angigen Konstante cstab > 0 . iii) Vertr¨ aglichkeit: Der Differenzenoperator Lh soll analoge charakteristische Eigenschaften wie der kontinuierliche L besitzen; z.B.: Symmetrie, Definitheit, Maximumprinzip, u.s.w. Das Hauptziel der Konvergenzanalyse von Differenzenschemata ist der Nachweis, daß eine Konsistenzordnung m auch eine (globale) Konvergenzordnung m des Fehlers eh := u − uh impliziert: max |eh (P )| = O(hm ),
(2.1.7)
P ∈Ωh
vorausgesetzt, die L¨ osung u ist ausreichend regul¨ar.
2.1.1 Konsistenz F¨ ur den Fall fh (P ) = f (P ) betrachten wir o.B.d.A. den Punkt P = Q0 = 0 und die Punktumgebung N (P ) = {Qi = (xi , yi ), i = 0, ..., rP } . Taylorentwicklung ergibt: u(Qi ) = u(P ) + xi ∂x u(P ) + yi ∂y u(P ) + 12 x2i ∂x2 u(P ) + xi yi ∂x ∂y u(P ) + 21 yi2 ∂y2 u(P ) + · · · . Wir wollen aus diesem Ansatz die Koeffizienten σi := σ(P, Qi ) im Differenzenoperator so bestimmen, daß eine vorgegebene Konsistenzordnung garantiert ist. Mit dem Ansatz τh (P ) = O(hm ) erh¨alt man durch Koeffizientenvergleich als notwendige und hineichende Bedingung f¨ ur Konsistenz:
2.1 Allgemeine Differenzenapproximationen
47
(B0) Konsistenz: F¨ ur die Koeffizienten des Differenzenschemas gilt: rP X
σi =
i=0
rP X i=0
xi σ i =
rP X
rP X
y i σi =
i=0
1 2
xi yi σi = 0,
rP X
x2i σi =
i=0
i=0
1 2
rP X
yi2 σi = 1.
(2.1.8)
i=0
Aus diesen Beziehungen sind die Koeffizienten σi , i = 0, ..., rP , im Differenzenoperator Lh zu bestimmen. F¨ ur Konsistenz sind also im allgemeinen Fall eines v¨ollig unstrukturierten Gitters mindestens 6 Punkte in N (P ) erforderlich. Die Konsistenz des Differenzenschemas ist offenbar ur quadratische Polynome: ¨aquivalent dazu, daß der Differenzenoperator exakt” ist f¨ ” u ∈ P2 :
Lh u(P ) = Lu(P ),
P ∈ Ωh .
(2.1.9)
Da man in der Regel Diskretisierungen auf Folgen von Gittern mit Gitterweiten h → 0 betrachtet, f¨ uhrt man skalierte Parameter ξi = h−1 xi , ηi = h−1 yi ein, um sich von der h-Abh¨angigkeit in den Koeffizienten zu befreien. Wegen 1 2 2h
rP X
ξi2 σi = 21 h2
i=0
rP X
ηi2 σi = 1,
i=0
ist σi = 0 oder σi ∼ h−2 . Wenn also eine L¨osung f¨ ur (σ0 , . . . , σrP ) existiert, dann ergibt sich f¨ ur den Konsistenzfehler τh (P ) = (Lh u − Lu)(P ) = O(h3 ξi3 σi + . . .) = O(h).
(2.1.10)
Auch bei ganz irregul¨ arer Gitterpunktsanordnung erh¨alt man somit schon mindestens eine Konsistenzordnung m = 1 . Es gibt mehrere M¨oglichkeiten, die Ordnung zu erh¨ohen: – Man nimmt mehr Gitterpunkte in die Menge N (P ) auf. – Man ordnet das Gitter regul¨ ar an, um in der Taylor-Entwicklung des Abschneidefehlers Weghebeffekte zu erzielen. Wir werden uns nun im folgenden mit regul¨aren, speziell ¨aquidistanten, kartesischen Gittern besch¨aftigen. Der Einfachheit halber sollen die Gitterpunkte a¨quidistant entlang von Parallelen zu den Koordinatenachsen angeordnet sein. Dabei bezeichnet R2h das gesamte den R2 u ¨berdeckende Punktgitter. Die Schnittpunkte der Gitterlinien mit dem Rand ∂Ω bilden dabei nat¨ urliche St¨ utzpunkte f¨ ur die Approximation der Randwerte. Die Gitterweite“ h hat auf ” solchen Gittern eine nat¨ urliche Bedeutung.
Ω
Ωh 0
P
✱
Ωh
Pseudo-Randknoten
Ω
Randknoten
h
h
innere Knoten
48
Differenzen-Verfahren f¨ ur elliptische Probleme
Die einfachste Approximation ∆h ≈ ∆ des Laplace-Operators verwendet zentrale Differenzenquotienten 2. Ordnung in jeder der Koordinatenrichtungen. Man erh¨alt den sog. 5-Punkte” Operator“: n o 1 (5) ∆h uh (x, y) := 2 u(x ± h, y) + u(x, y ± h) − 4u(x, y) h f¨ ur innere Gitterpunkte P = (x, y) ∈ Ωh . Wir verwenden hier die Konvention, daß ... ± h” ” abk¨ urzend f¨ ur die Summe der beiden Terme ... + h” und ... − h” steht. Die Konsistenzordnung ” ¨ ” dieser Differenzenapproximation ist wegen der Aquidistanz des Gitters und der symmetrischen Plazierung der St¨ utzpunkte m = 2 : (5)
|∆h u(P ) − ∆u(P )| ≤ 16 M4 (u)h2 ,
(2.1.11)
ultig, wenn das Gitter nur in wobei M4 (u) := maxΩ {|∂xi ∂yj u|, i + j = 4} . Diese Aussage bleibt g¨ jeder einzelnen der Koordinatenrichtungen ¨aquidistant ist. Dagegen ginge die Konsistenzordnung auf m = 1 zur¨ uck, wenn das Gitter zwar kartesisch, aber innerhalb einer Koordinatenrichtung nicht ¨aquidistant w¨ are. H¨ ohere Approximationsordnungen lassen sich z.B. auf einem gleichf¨ormigen Gitter durch Hinzunahme von weiteren Punkten in der Umgebung des Auswertungspunkts (x, y) erzielen: i) Approximation der zweiten Ableitungen im Laplace-Operator durch zentrale Differenzenquotienten auf jeweils 5 Punkten ergibt den gestreckten“ 9-Punkte-Operator: ” n o 1 (9) ∆h uh (x, y) = − u(x ± 2h, y) + 16u(x ± h, y) − u(x, y ± 2h) + 16u(x, y ± h) − 60u(x, y) . 12h2
Dieser Differenzenoperator hat offensichtlich die Konsistenzordnung m = 4 , doch hat die zugeh¨orige Koeffizientenmatrix wegen des Vorzeichenwechsels ung¨ unstige Eigenschaften. ii) Der kompakte“ 9-Punkte-Operator verwendet neben dem Auswertungspunkt (x, y) die 8 ” direkten Nachbarpunkte (x ± h, y), (x ± h, y ± h), (x, y ± h) : n o ¯ (9) uh (x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . ∆ h 6h2
Dieses Schema hat zun¨ achst auch nur die Ordnung m = 2 , doch kann man es durch eine Modifi¨ kation bei der Auswertung der rechten Seite auf die Ordnung m = 4 bringen (Ubungsaufgabe): f (x, y) → f (x, y) +
1 2 (5) 12 h ∆h f (x, y).
(2.1.12)
Approximation entlang des Randes: Bei der Approximation am (m¨oglicherweise gekr¨ ummten) Rand des Gebiets gibt es verschiedene M¨oglichkeiten, die, wie wir sp¨ater sehen werden, durchaus auf unterschiedliche Approximationsordnungen f¨ uhren. Wir betrachten wieder den 5Punkte-Operator und definieren zun¨ achst die folgenden Gitterpunktmengen: [ Ωh := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ωh := N (P ) \ Ωh . P ∈Ωh
i) Konstante Randwertextrapolation: In Punkten von Ωh wird der 5-Punkte-Operator angesetzt, und in Punkten P ∈ ∂Ωh werden die Randwerte uh (P ) = g(P 0 ) verwendet. Dabei ist P 0 der P entlang einer der Koordinatenachsen am n¨achsten gelegene Punkt auf ∂Ω . Dies ergibt entlang des Randes nur eine Approximationsordnung m = 1 .
2.1 Allgemeine Differenzenapproximationen
49
Ω P0
P
ii) Lineare Randwertinterpolation: Jeder Punkt P ∈ ∂Ωh liegt in x- und/oder y-Richtung zwischen zwei Punkten P0 ∈ ∂Ω und P1 ∈ Ωh mit Abst¨anden 0 ≤ αh < h zu P0 und h zu P1 . Man setzt dann (lineare Interpolation): uh (P ) :=
1 g(P0 ) + αuh (P1 ) . 1+α
(2.1.13)
Damit wird eine implizite Kopplung der Randwerte an die inneren“ L¨osungswerte bewirkt. ” Diese Randwertapproximation hat die Ordnung m = 2 .
Ω P0
P
P1
iii) Shortley1 -Weller2 -Approximation: Wir definieren die folgenden Punktmengen: [ N (P ) \ Ωh , Ω0h := {P ∈ R2h | N (P ) ⊂ Ω}, ∂Ω∗h := P ∈Ω0h
Ωh := Ω0h ∪ ∂Ω∗h ,
∂Ωh := {Schnittpunkte der Gitterlinien mit ∂Ω}.
In Punkten P ∈ Ωh wird wieder der normale 5-Punkte-Operator und in den fiktiven“ Rand” punkten P ∈ ∂Ω∗h der modifizierte 5-Punkte-Operator verwendet (siehe die schematische Darstellung): 2 2 2 uh (x, y) − uh (x + h, y) − uh (x − αh, y) α β 1+α α(1 + α) o 2 2 uh (x, y + h) − uh (x, y − βh) = f (x, y) , − 1+β β(1 + β)
−∆∗h uh (x, y) := h−2
n 2
+
gem¨aß −∆∗h uh = f
auf ∂Ω∗h ,
(2.1.14)
mit den Werten uh (P ) := g(P ) auf ∂Ωh . F¨ ur diesen Differenzenoperator gilt |∆∗h u(P ) − ∆u(P )| ≤ 32 M3 (u)h, 1 2
George Shortley (1910-: ???? R. Weller (????-????): ????
(2.1.15)
50
Differenzen-Verfahren f¨ ur elliptische Probleme
wobei M3 (u) := maxΩ {|∂xi ∂yj u|, i + j = 3} . (x, y+h)
h
h Gitterweite αh
(x, y)
(x+2h, y) h
(x- αh, y)
(x+h, y)
(x, y) St¨ utzpunkt 0 < α, β ≤ 1, αβ < 1
βh
(x, y- βh)
Die Verwendung dieser Differenzenapproximationen f¨ uhrt auf Schemata der Form Lh uh = fh
in Ωh ,
Rh uh = gh
auf ∂Ωh ,
(2.1.16)
wobei der Randoperator“ Rh die jeweilige Randwertapproximation beschreibt. Dabei wer” den die echten Randwerte von uh auf ∂Ωh unter Umst¨anden implizit mit Werten im Innern verkoppelt. In diesem Fall sind alle Werte uh (P ), P ∈ Ωh , zu bestimmen. Der Differenzenoperator Lh steht f¨ ur den normalen 5-Punkte-Operator in Ωh und gegebenfalls den modifizierten Shortley-Weller-Operator auf ∂Ω∗h . Im einfachsten Fall der trivialen Randwertapproximation Rh uh = uh k¨ onnen die Randwerte uh (P ) = gh (P ), P ∈ ∂Ωh , direkt eliminiert werden. Wir werden im folgenden nur diesen Fall weiter diskutieren. Bemerkung: Die obigen Differenzenschemata haben nat¨ urliche Analoga in drei Raumdimensionen. Man spricht dann aus naheliegendem Grund vom 7-Punkte-Operator“. Dessen Abschnei” defehler gen¨ ugt der Absch¨ atzung (7)
|∆h u(P ) − ∆u(P )| ≤ 14 M4 (u)h2 .
(2.1.17)
2.2 Eigenschaften der Differenzengleichungen
51
2.2 Eigenschaften der Differenzengleichungen
Ausgangspunkt der folgenden Untersuchungen ist das Differenzenschema der Gestalt X Lh uh (P ) := σ(P, Q)uh (Q) = fh (P ), P ∈ Ωh ,
(2.2.18)
Q∈N (P )
uh (P ) = gh (P ), P ∈ ∂Ωh ,
(2.2.19)
mit geeigneten Approximationen fh (·) zu f und gh (·) zu g . Wir definieren die Koeffizenten σ(P, Q) := 0 f¨ ur Punkte Q 6∈ N (P ). F¨ ur P ∈ Ωh gilt dann X X σ(P, Q)uh (Q) = fh (P ) − σ(P, Q)gh (Q). (2.2.20) Q∈Ωh
Q∈∂Ωh
Bei (beliebiger) Numerierung der Gitterpunkte etwa gem¨aß Ωh = {Pn , n = 1, ..., N } , ∂Ωh = {Pn , n = N + 1, ..., N + M } ergibt sich ein quadratisches Gleichungssystem f¨ ur den Vektor der , U := u (P ) : (inneren) Knotenwerte U = (Un )N n h n n=1 AU = F,
(2.2.21)
N mit A = (Anm )N n,m=1 , F = (Fn )n=1 , wobei
Anm := σ(Pn , Pm ),
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Fn := fh (Pn ) −
NX +M
σ(Pn , Pm )gh (Pm ).
m=N +1
h=
1 m+1
N = m2
Gitterweite innere“ Gitterpunkte ”
h
h
Beispiel ( Modellproblem”): Im Fall des Einheitsquadrats Ω ” 5-Punkte-Operator bei zeilenweiser Durchnumerierung des Gitters d¨ unn-besetzte Matrix der Dimension N = m2 : 4 Bm −Im −1 1 −Im Bm −Im N Bm = A= 2 .. h . −Im Bm .. .. . .
= (0, 1)2 ergibt sich f¨ ur den m+1 Ωh = {Pij }i,j=0 die folgende 4 −1 . m −1 4 .. .. .. . .
−1
52
Differenzen-Verfahren f¨ ur elliptische Probleme
mit der m×m-Einheitsmatrix Im . Die rechte Seite ist F := (f (x11 ), . . . , f (xmm ))T . Die Matrix A ist eine d¨ unn besetzte Bandmatrix mit der Halbbandbreite m , symmetrisch und (irreduzibel) diagonal-dominant. Damit ist sie auch regul¨ar und positiv definit. Bemerkung: In drei Raumdimensionen hat die entsprechende Matrix die Dimension N = m3 und die Halbbandbreite m2 . Ansonsten hat sie dieselben Eigenschaften wie in zwei Dimensionen. Im allgemeinen Fall ist f¨ ur moderates rP die Matrix A d¨ unn besetzt, aber h¨aufig wegen der Randwertapproximation nicht symmetrisch. Dies w¨are ein schwerwiegender Nachteil, etwa bei der Approximation von Eigenwertaufgaben zum Laplace-Operator. Um die Regularit¨at von A bzw. die L¨ osbarkeit der Differenzengleichung garantieren zu k¨onnen, formulieren wir die folgenden Strukturbedingungen in numerierungs-unabh¨angiger Form: (B1) Erweiterte Diagonaldominanz: F¨ ur Punkte P ∈ Ωh gilt: X |σ(P, Q)| ≤ |σ(P, P )| , (i)
(2.2.22)
Q∈Ωh , Q6=P
und f¨ ur Punkte P ∈ Ω∗h := {Q ∈ Ωh : N (Q) ∩ ∂Ωh 6= ∅} : X
(ii)
Q∈Ωh , Q6=P
|σ(P, Q)| < |σ(P, P )| .
(2.2.23)
(B2) Nicht-negativer Typ: F¨ ur Punkte P ∈ Ωh und Q ∈ Ωh \ {P } gilt: σ(P, P ) > 0,
σ(P, Q) ≤ 0 .
(2.2.24)
ur jede (B3) Zusammenhang: Es ist ∂Ωh 6= ∅ , und mit N (P ) := {Q ∈ Ωh , σ(P, Q) 6= 0} gilt f¨ echte Teilmenge Sh ⊂ Ωh : [ N (P ) ∩ (Ωh \ Sh ) 6= ∅ . (2.2.25) P ∈Sh
Die ersten beiden Bedingungen (B1) und (B2) werden von vielen Differenzenschemata, insbesondere solchen h¨ oherer als zweiter Ordnung (z.B.: der gestreckte” 9-Punkte-Operator), nicht ” erf¨ ullt. Die hier betrachteten 5-Punkte-Schemata mit Randapproximation gen¨ ugen ihnen aber. Wir zeigen im folgenden, wie bei den einzelnen Randapproximationen die Bedingung (B1ii) erf¨ ullt ist. i) Konstante Randwertextrapolation: F¨ ur P ∈ Ω∗h gilt X |σ(P, Q)| ≤ 3h−2 = Q∈Ωh , Q6=P
3 4
|σ(P, P )| ,
ii) Lineare Randwertinterpolation: F¨ ur P ∈ Ω∗h gilt X −2 7 −2 α h ≤ 2h ≤ |σ(P, Q)| ≤ 3 + 1+α Q∈Ωh , Q6=P
7 8
|σ(P, P )| ,
2.2 Eigenschaften der Differenzengleichungen
53
iii) Shortley-Weller-Randwertapproximation: F¨ ur P ∈ Ω∗h gilt X
Q∈Ωh , Q6=P
|σ(P, Q)| ≤
2 1+α
+
2 1+β
h−2 ≤
2 α
1 2
+
2 β
h−2 =
1 2
|σ(P, P )| .
Die dritte Bedingung (B3) sichert die Kopplung eines jeden inneren Gitterpunktes P ∈ Ωh mit allen anderen, insbesondere mit den Randpunkten. Die Eigenschaft des kontinuierlichen Problems, daß sich eine kleine St¨ orung in einem Punkt global bemerkbar macht, spiegelt sich hier wider. Die obigen Eigenschaften des Differenzenschemas korrespondieren zu den bereits bekannten der zugeh¨origen Koeffizientenmatrix A . Unabh¨angig von der gew¨ahlten Numerierung der Gitterpunkte implizieren die Bedingungen (B1) und (B3) zun¨achst die einfache Diagonaldominanz von A , dar¨ uber hinaus aber auch die st¨ arkere irreduzible Diagonaldominanz” (analog dem schwa” ” chen Zeilensummenkriterium“ f¨ ur die Konvergenz des Jacobi- oder des Gauß-Seidel-Verfahrens). Die Bedingung (B2) entspricht einer analogen f¨ ur A . Um Existenz und Eindeutigkeit einer L¨osung f¨ ur das allgemeine Differenzenschema garantieren zu k¨onnen, geht man ¨ ahnlich wie im Kontinuierlichen vor und nutzt ein diskretes Analogon des Maximumprinzips”. ” Satz 2.1 (Diskretes Maximumprinzip): Wenn die Bedingungen (B1i), (B2) und (B3) erf¨ ullt sind, gen¨ ugt das zugeh¨ orige Differenzenschema einem diskreten Maximumprinzip“, d.h.: Git” terfunktionen uh mit der Eigenschaft Lh uh (P ) ≤ 0,
P ∈ Ωh ,
(2.2.26)
haben in Ωh kein positives Maximum. Genauer gilt uh ≤ 0 auf Ωh oder max uh ≤ max uh . ∂Ωh
Ωh
(2.2.27)
Beweis: Wir nehmen an, daß (2.2.26) f¨ ur ein uh erf¨ ullt ist, und f¨ uhren den Beweis indirekt. Es gebe also einen Punkt P0 ∈ Ωh , so daß M := uh (P0 ) = max uh > 0, Ωh
max uh < M. ∂Ωh
Ausgehend von Lh uh (P ) ≤ 0 , folgt mit Bedingung (B2): X σ(P ,Q) X σ(P ,Q) 0 0 uh (Q) uh (P0 ) ≤ − u (Q) = h σ(P0 ,P0 ) σ(P0 ,P0 ) Q6=P0
Q6=P0
X σ(P ,Q) X σ(P ,Q) 0 {uh (Q) − uh (P0 )}. 0 uh (P0 ) + = σ(P0 ,P0 ) σ(P0 ,P0 ) Q6=P0
Q6=P0
Weiter gilt wegen Bedingung (B1i)
X σ(P ,Q) 0 ≤ 1, σ(P0 ,P0 )
Q6=P0
54
Differenzen-Verfahren f¨ ur elliptische Probleme
und folglich ( uh (P0 ) = M ) M ≤M+
X
σ(P0 ,Q) {uh (Q) − M }. σ(P0 ,P0 )
Q∈N (P0 )\{P0 }
Da nach Voraussetzung uh (Q) ≤ M ist, muss also uh (Q) = M in allen Punkten Q ∈ N (P0 ) (d.h. solchen mit σ(P0 , Q) 6= 0 ) sein, da sonst ein Widerspruch entsteht. Anwendung derselben Schlußweise f¨ ur alle Punkte in N (P0 ) liefert [ uh (Q) = M, Q ∈ N (P ). P ∈N (P0 )
Mit Hilfe der Bedingung (B3) erschließen wir dann durch sukzessive Fortsetzung dieses Arguments, daß uh ≡ M auf Ωh . Nach Voraussetzung ist ∂Ωh 6= ∅ , so daß es wegen (B3) einen Punkt Q ∈ ∂Ωh ∩ N (P ) mit einem inneren“ Punkt P ∈ Ωh geben muß. F¨ ur diesen folgt dann ” uh (Q) = M , was im Widerspruch zur Annahme max∂Ωh uh < M steht. Q.E.D. Das diskrete Maximumprinzip hat eine Reihe von wichtigen Folgerungen f¨ ur die obigen Differenzenschemata. Korollar 2.1 (Eindeutigkeit): Unter den Voraussetzungen (B1), (B2) und (B3) besitzt das Differenzenschema (2.2.18), (2.2.19) genau eine L¨ osung uh . Im Falle fh ≥ 0 folgt aus gh ≥ 0 auch uh ≥ 0 . ¨ Beweis: i) Wegen der Aquivalenz von (2.2.18), (2.2.19) zu dem Gleichungssystem Ah U = Fh (1) (2) gen¨ ugt es, die Eindeutigkeit zu zeigen. Seien also uh und uh zwei L¨osungen: (i)
Lh uh = fh (1)
in Ωh ,
(i)
uh = gh
auf ∂Ωh .
(2)
F¨ ur die Differenz wh := uh − uh gilt dann Lh wh = 0
in Ωh ,
wh = 0 auf ∂Ωh .
Nun wird das diskrete Maximumprinzip auf Lh wh ≤ 0 sowie auf Lh (−wh ) ≤ 0 angewendet. Ersteres ergibt wh ≤ 0 und letzteres wh ≥ 0 und folglich wh ≡ 0 . ii) Sei nun fh ≥ 0 und gh ≥ 0 . Dann impliziert das diskrete Maximumprinzip angewendet f¨ ur −uh , daß entweder uh ≥ 0 oder minΩh uh = − maxΩh (−uh ) ≥ − max∂Ωh (−gh ) = min∂Ωh gh , was zu beweisen war. Q.E.D. Im n¨achsten Abschnitt werden wir das diskrete Maximumprinzip verwenden, um die stetige Abh¨angigkeit der L¨ osungen von den Problemdaten zu zeigen. Dies wird sich als Nebenprodukt einer sehr viel st¨ arkeren Stabilit¨ atsungleichung ergeben. Korollar 2.2 (Inverse Monotonie): Unter den Voraussetzungen (B1), (B2) und (B3) ist die zum Differenzenoperator Lh bei beliebiger Numerierung der Gitterpunkte geh¨orende Koeffizientenmatrix A eine sog. M-Matrix” (invers-monotone Matrix), d.h.: Ihre Inverse A−1 ist ” elementweise nicht negativ: A−1 ≥ 0.
(2.2.28)
2.2 Eigenschaften der Differenzengleichungen
55
Beweis: Die Matrix A wird wie u ¨blich geschrieben als Summe A = L + D + R einer linken unteren Dreiecksmatrix L , einer Diagonalmatrix D und einer rechten oberen Dreiecksmatrix R . Die Bedingungen (B1), (B2) und (B3) implizieren, wie oben bereits bemerkt, die (irreduzible) Diagonaldominanz von A und damit 1) die Regularit¨at von A und D und 2) die Kontraktivit¨at spr(J) < 1 der Jacobi-Matrix J := −D −1 (L + R) . Dann existiert eine (nat¨ urliche) Matrizennorm k · k , bzgl. derer kJk < 1 ist. Hiermit folgt die Existenz der Reihe (im Sinne der Matrizenkonvergenz) ∞ X J k = (I − J)−1 . k=0
Bedingung (B2) garantiert, daß (elementweise) J = −D −1 (L + R) ≥ 0 und folglich auch A−1 D = (D −1 A)−1 = (I + D −1 (L + R))−1 = (I − J)−1 =
∞ X k=0
Wegen D −1 ≥ 0 impliziert dies A−1 ≥ 0 .
J k ≥ 0. Q.E.D.
Die Matrix A−1 ordnet der rechten Seite fh und den Randwerten gh eindeutig den L¨osungsvektor U der Differenzengleichung zu: A−1 : {fh , gh } → U = A−1 F (fh , gh ). ¨ Damit ist A−1 das algebraische Aquivalent der kontinuierlichen Greenschen Funktion G(·, ·) : Z Z ∂n G(x, y)g(y) dy. G(x, y)f (y) dy − G : {f, g} → u(x) = ∂Ω
Ω
Als Folgerung des Maximumprinzips ist G(x, y) ≥ 0, x 6= y , was analog zur gerade gezeigten Eigenschaft A−1 ≥ 0 ist.
2.2.1 Das Konvergenzverhalten von Differenzenverfahren Die Grundlage der Fehleranalyse f¨ ur die oben eingef¨ uhrten Differenzenschemata ist wie im Fall von Differenzenverfahren f¨ ur gew¨ ohnliche Differentialgleichungen eine asymptotische Stabilit¨atsabsch¨atzung. Wir formulieren diese im folgenden Satz f¨ ur ein allgemeines Differenzenschema L h uh = f h
in Ωh ,
uh = gh
auf ∂Ωh .
(2.2.29)
Wir setzen im folgenden stets voraus, daß dieses Schema konsistent ist.
Satz 2.2 (Stabilit¨ at): Das Differenzenschema (2.2.29) sei konsistent und gen¨ uge den Bedingungen (B1), (B2) und (B3). Dann gilt f¨ ur jede Gitterfunktion uh die Stabilit¨ atsabsch¨ atzung max |uh (P )| ≤ 41 d2Ω max |Lh uh (P )| + max |uh (P )| ,
P ∈Ωh
wobei dΩ := diam(Ω) .
Ωh
P ∈∂Ωh
(2.2.30)
56
Differenzen-Verfahren f¨ ur elliptische Probleme
Beweis: Wir argumentieren im folgenden ¨ahnlich wie auf der kontinuierlichen Ebene. Durch die folgende Vorschrift f¨ ur beliebiges, festes Q ∈ Ωh Lh Gh (·, Q) = h−2 δ(·, Q)
in Ωh ,
Gh (·, Q) = δ(·, Q)
auf ∂Ωh ,
(2.2.31)
wird ein diskretes Analogon Gh (P, Q) : Ωh × Ωh → R zur kontinuierlichen Greenschen Funktion (des Laplace-Operators) definiert. Dabei ist δ(P, Q) das u ¨bliche Kronecker3 -Symbol”. Aus ” dem diskreten Maximumprinzip folgt, daß Gh (P, Q) ≥ 0 . F¨ ur eine Gitterfunktion vh gilt dann die diskrete Greensche Identit¨at” ” X X Gh (P, Q)Lh vh (Q) + Gh (P, Q)vh (Q), P ∈ Ωh . vh (P ) = h2 Q∈Ωh
(2.2.32)
Q∈∂Ωh
Um dies zu sehen, bezeichnen wir die rechte Seite von (2.2.32) mit wh und erhalten mit den Eigenschaften der Greenschen Funktion Lh wh = Lh vh
in Ωh ,
wh = vh
auf ∂Ωh .
Die Eindeutigkeit der L¨ osungen des Diffenzenschemas impliziert dann wh ≡ vh . Aus der diskreten Greenschen Identit¨at folgt f¨ ur jede Gitterfunktion vh X X Gh (P, Q) max |Lh vh | + Gh (P, Q) max |vh |, P ∈ Ωh . |vh (P )| ≤ h2 Q∈Ωh
Ωh
Q∈∂Ωh
∂Ωh
(2.2.33)
i) Wegen der Konsistenz des Schemas gilt f¨ ur die Gitterfunktion wh ≡ 1 notwendig Lh wh ≡ 0 , so daß aus der Greenschen Identit¨ at folgt: X X X 1 = h2 Gh (P, Q)Lh wh (Q) + Gh (P, Q)wh (Q) = Gh (P, Q) . (2.2.34) Q∈Ωh
Q∈∂Ωh
Q∈∂Ωh
Dies impliziert eine Schranke f¨ ur die zweite Summe in (2.2.33). ii) Jeder Punkt P0 ∈ Ωh ist Mittelpunkt eines Ω enthaltenden Kreises mit Radius dΩ . O.b.d.A. sei hier P0 = 0 . F¨ ur die Funktion w(P ) := 14 |P |2 gilt in Punkten P ∈ Ωh : Lh w(P ) = Lh w(P ) + ∆w(P ) − ∆w(P ) = M3 (w)O(h) − ∆w(P ) = −1, da M3 (w) = 0. Wir definieren nun die Gitterfunktion X Gh (P, Q). vh (P ) := h2 Q∈Ωh
Durch elementares Nachrechnen verifiziert man, daß Lh vh = 1
in Ωh ,
vh = 0 auf ∂Ωh ,
Lh (vh + w) = 0
in Ωh ,
vh + w ≤ 41 d2Ω
auf ∂Ωh .
3 Leopold Kronecker (1823-1891): deutscher Mathematiker; wirkte in Berlin als “Privatgelehrter”; betrieb die Arithmetisierung der Mathematik; wichtiger Vertreter des “Konstruktivismus”, welcher die generelle Verwendung des Widerspruchsbeweises und des “aktual Unendlichen” in Form z.B. der allgemeinen reellen Zahlen ablehnt.
2.2 Eigenschaften der Differenzengleichungen
57
Aus dem diskreten Maximumprinzip folgt dann wegen w ≥ 0 notwendig max vh ≤ max (vh + w) ≤ max (vh + w) = max w ≤ 41 d2Ω , Ωh
∂Ωh
∂Ωh
Ωh
und somit h2
X
Q∈Ωh
Gh (P, Q) ≤ 41 d2Ω ,
P ∈ Ωh .
(2.2.35)
Die Absch¨atzungen (2.2.34) und (2.2.35) ergeben zusammen mit (2.2.33) die Behauptung. Q.E.D.
Als unmittelbare Folgerung aus Satz 2.2 erhalten wir (in Analogie zum kontinuierlichen Fall) die stetige Abh¨ angigkeit der L¨ osung von den Daten. Das wichtigste Resultat ist eine a priori Konvergenzabsch¨ atzung f¨ ur das Differenzenschema (2.2.29). Korollar 2.3 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt f¨ ur das Differenzenschema (2.2.29) die a priori Konvergenzabsch¨ atzung max |eh (P )| ≤ 41 d2Ω max |τh (P )| + max |eh (P )|, P ∈Ωh
P ∈Ωh
P ∈∂Ωh
(2.2.36)
mit dem Fehler eh = u − uh und dem Abschneidefehler τh (P ) := Lh u(P ) + ∆u(P ) . Beweis: F¨ ur den Fehler eh gilt die Differenzengleichung Lh eh (P ) = τh (P )
P ∈ Ωh ,
so daß die Stabilit¨ atsungleichung (2.2.30) unmittelbar die Behauptung liefert.
Q.E.D.
Die Absch¨atzung (2.2.36) garantiert wieder, daß f¨ ur ein gutes“ Differenzenschema der globale ” Diskretisierungsfehler mit derselben Ordnung wie der lokale Abschneidefehler konvergiert. Wir wollen diese allgemeinen Resultate f¨ ur die obigen speziellen Diskretisierungen anwenden. Dabei wird wieder die folgende Bezeichnung f¨ ur Normschranken der exakten L¨osung verwendet: Mm (u) := max{|∂xi ∂yj u|, i + j = m}. Ω
Korollar 2.4 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt f¨ ur den Fehler den 5-Punkte-Operator mit konstanter Randwertextrapolation die a priori Fehlerabsch¨ atzung max |eh (P )| ≤
P ∈Ωh
2 1 2 24 dΩ M4 (u)h
+ M1 (u)h.
Beweis: F¨ ur den Abschneidefehler gilt max |τh | ≤ 61 M4 (u)h2 , Ωh
und in Randgitterpunkten max |eh | = max |u(P ) − u(P ⋆ )| ≤ M1 (u)h. ∂Ωh
∂Ωh
(2.2.37)
58
Differenzen-Verfahren f¨ ur elliptische Probleme
Die Stabilit¨ atsabsch¨ atzung (2.2.30) impliziert damit die Behauptung.
Q.E.D.
Der ordnungsreduzierende Effekt der mangelhaften Randwertapproximation kann durch die oben beschriebene lineare Randwertinterpolation“ behoben werden. F¨ ur das so modifizierte ” 5-Punkte-Schema erh¨ alt man ¨ ahnlich wie eben die a priori Fehlerabsch¨atzung max |eh (P )| ≤
P ∈Ωh
2 1 2 12 dΩ M4 (u)h
+ 12 M2 (u)h2 .
(2.2.38)
Korollar 2.5 (Konvergenz): Unter den Voraussetungen von Satz 2.2 gilt f¨ ur den modifizierten 5-Punkte-Operator nach Shortley-Weller die a priori Fehlerabsch¨ atzung max |eh (P )| ≤
P ∈Ωh
2 1 2 24 dΩ M4 (u)h
+ 13 M3 (u)h3 .
(2.2.39)
Beweis: F¨ ur den Fehler eh gelten die Beziehungen −∆h eh = τh in Ωh ,
−∆∗h eh = τh∗ auf ∂Ω∗h ,
eh = 0 auf ∂Ωh .
F¨ ur die Abschneidefehler gilt |τh∗ | ≤ 32 M3 (u)h. max ∗
max |τh | ≤ 61 M4 (u)h2 , Ωh
∂Ωh
In diesem Fall k¨ onnen wir nicht direkt die Stabilit¨atsungleichung (2.2.30) anwenden, da sie nur auf eine reduzierte Konvergenzordnung O(h) f¨ uhren w¨ urde. Statt dessen modifizieren wir in geeigneter Weise den Beweis dieser Absch¨atzung. Mit den Bezeichnungen des Beweises von Satz 2.2 ergibt die Greensche Identit¨ at ( eh = 0 auf ∂Ωh ) X X Gh (P, Q)τh∗ (Q) Gh (P, Q)τh (Q) + h2 eh (P ) = h2 Q∈Ω0h
Q∈∂Ω∗h
und folglich |eh (P )| ≤ h2
X
Q∈Ω0h
Gh (P, Q) max |τh | + h2 Ω0h
X
Q∈∂Ω∗h
|τh∗ | . Gh (P, Q) max ∗ ∂Ωh
Wie im Beweis von Satz 2.2 folgt X X Gh (P, Q) ≤ h2 Gh (P, Q) ≤ 41 d2Ω . h2 Q∈Ω0h
(2.2.40)
(2.2.41)
Q∈Ωh
Wir wollen jetzt zeigen, daß X
Q∈∂Ω∗h
Gh (P, Q) ≤
1 2
.
Dazu definieren wir die Gitterfunktion wh durch wh = 1 in Ωh ,
wh = 0 auf ∂Ωh .
(2.2.42)
2.3 L¨osungsaspekte
59
F¨ ur diese verifiziert man durch Nachrechnen −∆h wh = 0 in Ω0h ,
−∆∗h wh ≥ 2h−2 auf ∂Ω∗h .
Mit Hilfe der Greenschen Identit¨ at folgt damit X X 1 = h2 Gh (P, Q)(−∆∗h )wh (Q) ≥ 2 Gh (P, Q), Q∈∂Ω∗h
Q∈∂Ω∗h
was (2.2.42) impliziert. Dies vervollst¨ andigt den Beweis.
Q.E.D.
Bemerkung: In drei Raumdimensionen gelten Satz 2.2 und Korollar 2.3 mit der Konstanorigen Absch¨atzung (2.1.17) f¨ ur den Konsistenzfehler ergeben te 61 d2Ω . Hiermit und der zugeh¨ sich dann auch die a priori Fehlerabsch¨atzungen der Korollare 2.4 und 2.4 mit der f¨ uhrenden 1 2 dΩ . Konstante 24 Bemerkung: Wir betonen, daß die Konvergenz der betrachteten Differenzenschemata eine vergleichsweise hohe Regularit¨ at der zu approximierenden L¨osung erfordert. Das Shortley-WellerSchema erfordert z.B. f¨ ur seine maximale“ Konvergenzordnung m = 2 , daß u beschr¨ankte ” vierte Ableitungen auf ganz Ω besitzt ( M4 (u) < ∞ ). Dies ist eine sehr einschneidende Forderung, wie wir im vorigen Kapitel gesehen haben. Sie kann i.a. nur f¨ ur glatt berandete Gebiete sowie unter gewissen Zusatzbedingungen f¨ ur spezielle Geometrien wie z.B. Rechtecke garantiert werden. Weiter erfordert sie auch hohe Glattheit der Daten f und g . Auf Gebieten mit einspringenden Ecken oder sonstwie reduzierter Regularit¨at von u k¨onnen diese S¨atze nicht verwendet werden. In solchen realit¨ atsn¨ aheren Situationen werden sich die im n¨achsten Abschnitt behandelten Finite-Elemente-Verfahren“ als flexibler erweisen. ”
2.3 L¨ osungsaspekte Wir diskutieren nun die L¨ osung der durch eine Differenzendiskretisierung entstehenden algebraischen Gleichungssysteme. Zugrunde gelegt wird die Situation des Modellproblems der 1. RWA des Laplace-Operators Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(2.3.43)
auf einem Gebiet Ω ⊂ R2 . Erweiterungen f¨ ur Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen ber¨ ucksichtigt. Die zugeh¨ origen algebraischen Systeme haben die Form Ax = b,
(2.3.44)
N Die Matrix A = (anm )N n,m=1 und der Vektor b = (bn )n=1 haben die Dimension N := Anzahl der inneren Gitterpunkte bzw. Knotenfreiheitsgrade. In der Praxis ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Die Matrix ist extrem d¨ unn besetzt und besitzt abh¨angig von der gew¨ahlten Numerierung der Gitterpunkte bzw. Knoten eine Bandstruktur. F¨ ur die Wahl eines geeigneten (d.h.: m¨oglichst sparsamen) L¨osungsverfahrens ist die zu erwartende Dimension N entscheidend.
Wir orientieren die folgende Diskussion an der Modellsituation der Poisson-Gleichung auf dem Einheitsquadrat Ω = (0, 1)2 und der Diskretisierung mit dem u ¨ blichen 5-Punkte-Schema
60
Differenzen-Verfahren f¨ ur elliptische Probleme
auf einem ¨ aquidistanten, kartesischen Gitter Ωh = Ωh ∪ ∂Ωh der Gitterweite h . Das Gebiet √ Ω = (0, 1)2 hat den Durchmesser dΩ = 2 . Wir w¨ahlen die Funktion u(x, y) = sin(πx) sin(πy) als L¨osung der Randwertaufgabe −∆u = 2π 2 u =: f
in Ω,
u = 0 auf ∂Ω.
(2.3.45)
ur die Shortley-Weller-Approximation Es ist M4 (u) = π 4 . Die a priori Fehlerschranke (2.2.39) f¨ liefert damit die (pessimistische) Fehlersch¨atzung max |u − uh | ≈ Ωh
1 2 4 2 24 dΩ π h
≈ 8h2 .
(2.3.46)
Zur Erreichung garantierter 3-stelliger (relativer) Genauigkeit, TOL = 10−3 , ist in diesem Fall also eine Gitterweite h ≈ 10−2 erforderlich. Dies f¨ uhrt auf ein (symmetrisches) Gleichungssystem der Dimension N ≈ 104 .
Bemerkung 2.1: Die Fehlerabsch¨ atzung (2.3.46) ist in der Tat sehr pessimistisch. Der wirkliche Fehler ist ungef¨ ahr um einen Faktor 10−1 kleiner. Dies zeigt, daß unsere a priori Fehleranalyse selbst f¨ ur ein so einfaches Modellproblem zu unscharf und f¨ ur praktische Zwecke nur bedingt brauchbar ist. √ 2) In drei Raumdimensionen ist dΩ = 3 , und die a priori Fehlerabsch¨atzung (2.3.46) liefert den Wert ≈ 12h2 , so daß hier mindestens auch h = 10−2 und damit N ≈ 106 erforderlich w¨are.
Die Struktur der Matrix A h¨ angt von der gew¨ahlten Numerierung der Gitterpunkte ab. Die g¨angigen Alternativen sind: Zeilenweise Numerierung: Die lexikographische Anordnung der Gitterpunkte, (xi , yj ) ≤ (xp , yq ) , wenn j ≤ q oder j = q, i ≤ p f¨ uhrt auf eine Bandmatrix mit Bandbreite 2m + 1 ≈ h−1 .
21 22
23
24 25
16
17
18
19 20
11
12
13
14 15
6
7
8
9 10
1
2
3
4
5
Diagonale Numerierung: Die sukzessive Numerierung diagonal zu den Koordinatenrichtungen f¨ uhrt auf eine Bandmatrix mit geringem Bandinhalt“ (⇒ Speicherersparnis beim Gaußschen ” Eliminationsverfahren).
2.3 L¨osungsaspekte
61
11 16
20
23 25
17
21 24
7
12
4
8
2
5
9
14 19
1
3
6
10 15
13 18
22
Schachbrett-Numerierung: Die versetzte zeilenweise- sowie spaltenweise Numerierung f¨ uhrt auf eine 2 × 2-Blockmatrix mit diagonalen Hauptbl¨ocken.
11
24
21
9
6
19
7
16
4
17
1
14
2
12
25 13
22 10
23
20
8
5 18 15
3
a) Direkte L¨ osung: Prinzipiell w¨ are das klassische Gaußsche Eliminationsverfahren zur L¨osung des Systems (2.3.44) geeignet. Zu seiner Durchf¨ uhrung ben¨otigt man bei zeilenweiser Numerierung und Ausnutzung der Symmetrie etwa mN Speicherpl¨atze (im folgenden abgek¨ urzt 2 als SP“) und m N arithmetische Operationen (im folgenden abgek¨ urzt als OP“). Im Fal” ” ¨ le N ≈ 104 sind dies etwa 106 SP und 108 OP. Die kurze Uberschlagsrechnung zeigt, daß direkte L¨osungsmethoden f¨ ur das Gleichungssystem (2.3.44) nur in speziellen Situationen in Frage kommen. Sie spielen eine Rolle bei geringer Problemgr¨oße ( N ≤ 103 ) oder im Falle sehr uniformer Matrixeintr¨ age (bei der Approximation von Differentialoperatoren mit konstanten Koeffizienten) ( N ≤ 105 ). Speziell f¨ ur die 5-Punkte-Approximation des Laplace-Operators auf Rechtecken gibt es sehr effiziente direkte L¨osungstechniken auf Grundlage der schnellen Fourier” Transformation“ ( N ≤ 107 ). Diese sind aber bei allgemeineren Problemstellungen meist nicht anwendbar und werden daher hier nicht weiter diskutiert. ¨ Bemerkung: Zur Illustration machen wir dieselbe Uberschlagsrechnung auch f¨ ur die entsprechen3 de dreidimensionale Situation Ω = (0, 1) . Hier hat die Matrix A die Dimension N = m3 ≈ 106 und die Bandbreite 2m2 + 1 ≈ 104 . Folglich betr¨ uge der ben¨otigte L¨osungsaufwand ≈ 1010 SP 14 und ≈ 10 OP, was jenseits der Kapazit¨at normaler Arbeitsplatzrechner liegt. b) Iterative L¨ osung: Wie bereits erw¨ahnt, u ¨ bertragen sich die wichtigen Eigenschaften (B1), (B2) und (B3) des Differenzenschemas unabh¨angig von der gew¨ahlten Numerierung auf die jeweilige Matrix A . Diese ist (irreduzibel) diagonaldominant und von nichtnegativem Typ und folglich eine M-Matrix, d.h.: Es gilt elementweise A−1 ≥ 0 . Zus¨atzlich ist A oft auch symmetrisch und positiv definit. In diesem Falle sind die meisten g¨angigen iterativen Verfahren konvergent. Ausgehend von einer Defektkorrekturiteration dt = F − Axt ,
Cv t = dt ,
xt+1 = xt + v t ,
(2.3.47)
62
Differenzen-Verfahren f¨ ur elliptische Probleme
mit einer regul¨ aren Matrix C ( Vorkonditionierer“) wird die Iteration zun¨achst als Fixpunkti” teration geschrieben Cxt+1 = Cxt + b − Axt
xt+1 = (I − C −1 A)xt + C −1 b.
⇔
(2.3.48)
F¨ ur den Fehler e(t) := x(t) − x gilt e(t) = (I − C −1 A)x(t−1) + C −1 b − x
= (I − C −1 A)x(t−1) + C −1 b − (I − C −1 A)x − C −1 b
(2.3.49)
= (I − C −1 A)e(t−1) = · · · = (I − C −1 A)t e(0) .
Dies zeigt, daß die Iteration konvergiert, wenn die Iterationsmatrix“ B := I − C −1 A eine ” Kontraktion ist, d.h.: ρ(B) := max{|λ|, λ Eigenwert von B} < 1 . Die Konvergenzrate“ der ” Iteration ist dann gegeben durch ρ :=
sup
lim
x(0) ∈RN
t→∞
kx(t) − xk 1/t kx(0) − xk
= ρ(B).
(2.3.50)
Es ist dann n¨ aherungsweise kx(t) − xk ≤ ρt kx(0) − xk.
(2.3.51)
Die Anzahl der zur Erreichung einer Reduktion des Anfangsfehlers um ε erforderlichen Iterationsschritte ergibt sich damit zu tε ≈
ln(ε) . ln(ρ)
(2.3.52)
Der Vorkonditionierer“ C sollte folgende Bedingungen erf¨ ullen: ” – einfache Invertierung (mit O(N ) OP und Speicherbedarf O(N ) SP); – m¨oglichst kleines ρ(I − C −1 A) . Dies sind leider gegenl¨ aufige Zielsetzungen. Die einfachsten Verfahren dieses Typs verwenden ausgehend von der nat¨ urlichen Aufspaltung A = L + D + R die Vorkonditionierer: 1. (Ged¨ ampftes) Richardson4 -Verfahren: 0 < θ ≤ 2λmax (A)−1 B = I − θA.
(2.3.53)
B = −D −1 (L + R).
(2.3.54)
C = θI, 2. Jacobi5 -Verfahren (Gesamtschrittverfahren): C = D, 4
Lewis Fry Richardson (1881-1953): englischer Mathematiker und Physiker; wirkte an verschiedenen Institutionen in England und Schottland; typischer “angewandter Mathematiker”; leistete Pionierbeitr¨ age zur Modellierung und Numerik in der Wettervorhersage. 5 Carl Gustav Jakob Jacobi (1804-1851): deutscher Mathematiker; schon als Kind hochbegabt; wirkte in K¨ onigsberg und Berlin; Beitr¨ age zu vielen Bereichen der Mathematik: zur Zahlentheorie, zu elliptischer Funktionen, zu partiellen Differentialgleichungen, zu Funktionaldeterminanten und zur theoretischen Mechanik.
2.3 L¨osungsaspekte
63
3. Gauß-Seidel6 -Verfahren (Einzelschrittverfahren): C = D + L,
B = −(D + L)−1 R.
(2.3.55)
4. SOR-Verfahren ( Successive Over-Relaxation“): ω = ωopt ∈ (0, 2) ” C = D + ωL,
B = (D + ωL)−1 {(1 − ω)D − ωR}.
5. ILU-Verfahren ( Incomplete LU Decomposition“): ” ˜ R, ˜ ˜ −1 L ˜ −1 A. C=L B =I −R
(2.3.56)
(2.3.57)
F¨ ur eine symmetrische, positiv definite Matrix wird das ILU- zum ILLT -Verfahren ( In” complete Cholesky7 Decomposition“). Die ILU-Zerlegung erh¨alt man mit Hilfe des u ¨ blichen, rekursiven Prozesses zur Bestimmung der LU-Zerlegung aus der Gleichung LU = A durch Nullsetzung aller Matrixeintr¨age zu Indexpaaren {n, m} mit anm = 0 : n = 1, ..., N :
u ˜nm = anm − ˜ lnn = 1,
n−1 X
˜lni u ˜im
(m = 1, ..., N )
i=1
n−1 o n X ˜lin = u ˜ (i = n + 1, ..., N ) l u ˜ a − ˜−1 ij jn in nn j=1
˜lnm = 0, u ˜nm = 0, wenn anm = 0 .
6. ADI-Verfahren ( Alternating-Direction Implicit Iteration“): ” C = (Ax + ωI)(Ay + ωI), B = (Ay + ωI)−1 (ωI − Ax )(Ax + ωI)−1 (ωI − Ay ).
(2.3.58)
Das ADI-Verfahren ist f¨ ur beliebige Wahl des Parameters ω > 0 konvergent. Wenn die Struktur der Matrix seine Anwendung zul¨aßt, ist es bei optimaler Wahl von ω mindestens so schnell wie das optimale SOR-Verfahren. Die Konvergenzraten dieser einfachen Iterationsverfahren verhalten sich in Abh¨angigkeit von der (gleichf¨ ormigen) Gitterweite wie ρ = ρ(I − C −1 A) = 1 − O(hr ), in Abh¨angigkeit von der Gitterweite h der Diskretisierung (bei fester Problemkonfiguration) mit einem geeigneten r ≥ 0 . Die Anzahl T der zur Gewinnung einer Dezimalstelle Genauigeit erforderlichen Iterationsschritte ist also ungef¨ahr bestimmt durch ρT ≈ 10−1 6
⇒
T≈−
ln(10) ≈ h−r . ln(ρ)
(2.3.59)
Philipp Ludwig von Seidel (1821-1896): deutscher Mathematiker; Prof. in M¨ unchen; Beitr¨ age zur Analysis (u.a. Methode der kleinsten Fehlerquadrate) owie Himmelsmechanik und Astronomie. 7 Andr`e Louis Cholesky (1975-1918): franz¨ osischer Mathematiker; Milit¨ arkarriere; Beitr¨ age zur Numerischen Linearen Algebra.
64
Differenzen-Verfahren f¨ ur elliptische Probleme
Hierzu beachte man, daß ln(1 − chr ) = −chr + O(h2r ) . Da die Durchf¨ uhrung eines Iterationsschritts approximativ N ≈ h−2 OP (in zwei Raumdimensionen) kostet, ergibt sich ein Gesamtaufwand pro Dezimalstelle an Genauigkeit von ≈ h−2−r OP. Der f¨ ur die Durchf¨ uhrung dieser Iterationsverfahren ben¨ otigte Speicherplatz entspricht etwa dem zur Speicherung der wesentlichen Elemente der Matrix A erforderlichen. F¨ ur das Jacobi- und Gauß-Seidel-Verfahren ist r = 2 und f¨ ur das (optimale) SOR-Verfahren ist r = 1 . Das ILU- und das ADI-Verfahren liegen bei speziellen Konfigurationen etwa gleich auf zum SOR-Verfahren. Damit ergibt sich ein Gesamtl¨osungsaufwand von jeweils O(N 2 ) bzw. O(N 3/2 ) a.Op. f¨ ur die einzelnen Verfahren. Ein wirklich effizientes“ Verfahren sollte ein m¨oglichst kleines r aufweisen; optimal w¨are r = 0 . ” Dies l¨aßt sich durch den Einsatz von sog. Multi-Level-Techniken“ ( Mehrgitterverfahren“) er” ” reichen, welche sp¨ ater im Zusammenhang mit den Finite-Elemente-Diskretisierungen diskutiert werden.
2.3.1 Aufwandsanalyse: ein Beispiel Wir wollen das Konvergenzverhalten der bisher betrachteten Iterationsverfahren und deren sich daraus ergebende Effizienz anhand des obigen Modellproblems eingehender diskutieren. Dabei soll insbesondere die Bedeutung der Formel (2.3.59) f¨ ur die Konvergenzrate illustriert werden. F¨ ur die obige Modellsituation (5-Punkte-Differenzenoperator auf einem ¨aquidistanden, kartesischen Gitter des Einheitsquadrats) lassen sich die Eigenwerte und zugeh¨origen Eigenvektoren der Systemmatrix A explizit angeben. F¨ ur k, l = 1, . . . , m ergibt sich mit der Bezeichnung Awkl = λkl wkl : λkl = h−2 {4 − 2 (cos(khπ) + cos(lhπ))},
k, l = 1, . . . , m,
wkl = (sin(ikhπ) sin(jlhπ))i,j=1,...,m
(h = 1/(m + 1)) .
Also ist (f¨ ur h ≪ 1) λmax = h−2 {4 − 4 cos (1 − h)π} ≈ 8h−2 ,
λmin = h−2 {4 − 4 cos (hπ)} = h−2 {4 − 4 (1 − 21 π 2 h2 + O(h4 ))} ≈ 2π 2 .
und somit κ := cond2 (A) ≈
4 π 2 h2
.
(2.3.60)
Die Eigenwerte der Jacobi-Matrix J = −D −1 (L + R) sind µkl =
1 2
(cos(khπ) + cos(lhπ))
(k, l = 1, . . . , m)
Folglich wird ρJ = µmax = cos(hπ) = 1 −
π2 2 h + O(h4 ) . 2
(2.3.61)
F¨ ur die Iterationsmatrizen des Gauß-Seidel- und des (optimalen) SOR-Verfahrens gilt dann
2.3 L¨osungsaspekte
65
ρGS = ρ2GS = 1 − π 2 h2 + O(h4 ) , q 1 − 1 − ρ2J 1 − πh + O(h2 ) q = 1 − 2 πh + O(h2 ) . ρSOR = = 2) 1 + πh + O(h 2 1 + 1 − ρJ
F¨ ur die Iterationszahlen (pro Dezimalstelle Fehlerreduktion) ergibt sich also asymptotisch: TJ ≈ − TGS TSOR
ln(10)
≈
4, 6 ≈ π 2 h2
1 2
N, ln(1 − 2 ln(10) 2, 3 ≈− ≈ 2 2 ≈ 14 N , ln(1 − π 2 h2 ) π h √ 2, 3 ln(10) ≈ ≈ 31 N . ≈− ln(1 − 2πh) 2πh π2
h2 )
Der Vollst¨andigkeit halber geben wir hier auch die entsprechenden Werte f¨ ur das CG-Verfahren ( Verfahren der konjugierten Richtungen“): ” √ √ 3 ≈ N. TCG = 12 κ ln(20) ≈ πh Das CG-Verfahren ist zwar langsamer als das optimale“ SOR-Verfahren, erfordert aber nicht ” die Bestimmung eines Iterationsparameters. Zum Vergleich der Effizienz der Iterationsverfahren muß nat¨ urlich auch der Aufwand pro Iterationsschritt ber¨ ucksichtigt werden. F¨ ur die Anzahl OP der arithmetischen Operationen pro Iterationsschritt gilt (optimistische Sch¨atzung) OPJ , OPGS , OPSOR ≈ 6 N ,
OPCG ≈ 10 N .
Als Endresultat finden wir, daß zur Bestimmung der L¨osung des diskretisierten Modellproblems das Jacobi-Verfahren, das Gauß-Seidel-Verfahren und das Gradientenverfahren O(N 2 ) OP ben¨otigen. Das direkte Cholesky-Verfahren w¨ urde f¨ ur die Berechnung der exakten“ L¨osung ” 2 (auf Rundungsfehlergenauigkeit) ebenfalls O(m N ) = O(N 2 ) OP ben¨otigen, erscheint also dem Gauß-Seidel-Verfahren u ucksichtigen, daß letzteres nur ¨berlegen zu sein. Es ist jedoch zu ber¨ O(N ) SP ben¨ otigt, im Gegensatz zu den O(mN ) = O(N 3/2 ) SP f¨ ur das Cholesky-Verfahren. Die schnelleren, auf Mehrgitterkonzepten basierenden Iterationsverfahren sind dagegen dem einfachen direkten L¨ oser asymptotisch klar u ¨ berlegen. F¨ ur das Beispiel mit N = 104 ergibt sich u ¨ berschlagsm¨aßig der folgende Gesamtaufwand GA“ zur sicheren L¨ osung des Systems (2.3.44) unter die Diskretisierungsgenauigkeit ( TOL = ” 10−3 , h = 10−2 , N = 104 ): GAJ (TOL) ≈ 4 · 3N 2 ≈ 1, 2 · 109 OP ,
GAGS (TOL) ≈ 4 · 1, 5N 2 ≈ 6 · 108 OP ,
GASOR (TOL) ≈ 4 · 2N 3/2 ≈ 8 · 106 OP ,
GACG (TOL) ≈ 4 · 10N 3/2 ≈ 4 · 107 OP .
66
Differenzen-Verfahren f¨ ur elliptische Probleme
F¨ ur ein optimales“ Verfahren wie z.B. das Mehrgitterverfahren MG“ w¨ urde man hier wesent” ” lich bessere Werte erwarten: GAM G (TOL) ≈ 4 · 25N ≈ 106 OP . Bemerkung: In drei Raumdimensionen erhalten wir n¨aherungsweise λmax ≈ 12h−2 ,
λmin ≈ 3π 2 ,
κ ≈
8 , 3π 2 h2
und folglich im wesentlichen dieselben Absch¨atzungen f¨ ur ρJ , ρGS und ρSOR sowie f¨ ur die Iterationszahlen TJ , TGS , TSOR und TCG wie im zweidimensionalen Fall. Der Aufwand f¨ ur die Durchf¨ uhrung eines Iterationsschritts ist hier OPJ , OPGS , OPSOR ≈ 8 N bzw. OPCG ≈ 12 N . F¨ ur den Gesamtl¨ osungsaufwand ergibt dies dann: GAJ (TOL) ≈ 4 · 4N 2 ≈ 1, 6 · 1013 OP ,
GAGS (TOL) ≈ 4 · 2N 2 ≈ 8 · 1012 OP ,
GASOR (TOL) ≈ 4 · 3N 3/2 ≈ 1, 2 · 1010 OP ,
GACG (TOL) ≈ 4 · 12N 3/2 ≈ 4, 8 · 1010 OP .
Der Aufwand des Mehrgitterverfahrens erh¨oht sich aber nur vergleichsweise unwesentlich auf GAM G (ε) ≈ 4 · 50N ≈ 2 · 108 OP . Zur Bewertung dieser Komplexit¨ atssch¨atzungen muß man sich die Leistung heutiger Rechner vergegenw¨artigen. Ein normaler Arbeitsplatzrechner leistet real etwa 200 MFlops (200 Millionen Floating-Point“ Operationen pro Sekunde). Das SOR-Verfahren braucht dann auf einem ” solchen Rechner zur L¨ osung des Gleichungssystems (auf Diskretisierungsfehlergenauigkeit) etwa 1, 5 Minuten, wogegen das Mehrgitterverfahren nur“ 1 Sekunde ben¨otigt. ”
¨ 2.4 Ubungen
67
¨ 2.4 Ubungen ¨ Ubung 2.1: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (sog. “Mehrstellenformel”) (9)
−∆h uh (x, y) = f (x, y),
(x, y) ∈ Ωh ,
mit dem “gestreckten” Differenzenoperator (9)
∆h u(x, y) :=
o 1 n − u(x ± 2h, y) + 16u(x ± h, y) − u(x, y ± 2h) + 16u(x, y ± h) − 60u(x, y) 12h2
und dem 9-Punkte-Differenzenschema (9)
−∆h uh (x, y) = f (x, y) +
1 2 12 h ∆f (x, y),
(x, y) ∈ Ωh
mit dem “kompakten” Differenzenoperator n o ¯ (9) u(x, y) = 1 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . ∆ h 6h2
Man zeige, daß dies Approximationen mit der Konsistenzordnung m = 4 sind.
¨ Ubung 2.2: In vielen F¨ allen kann die asymptotische Konvergenzordnung eines Differenzenverfahrens nur experimentell bestimmt werden. Dazu werden bei bekannter exakter L¨osung f¨ ur zwei Schrittweiten h und h/2 die Fehler eh := u − uh und eh/2 := u − uh/2 berechnet und dann die Ordnung α u ¨ ber den formalen Ansatz ku − uh kh = hα mit einer geeigneten Gitternorm k · kh aus der folgenden Formel ermittelt: α=
log(keh kh /keh/2 kh ) . log(2)
a) Man rechtfertige diese Formel und u ¨berlege, wie man vorgehen kann, wenn keine exakte L¨osung u bekannt ist. b) Man bestimme die inh¨ arente Konvergenzordnungen der folgenden Zahlenfolgen: h = 2−1
33.627
26.570
−2
h=2
30.318
27.008
h = 2−3
29.100
27.883
−4
h=2
28.586
28.072
h = 2−5
28.351
28.117
¨ Ubung 2.3: Man betrachte die Diskretisierung der 1. RWA des Laplace-Operators auf dem Einheitsquadrat des R2 mit dem 9-Punkte-Differenzenschema (9)
∆h uh (x, y) = fh (x, y) := f (x, y) +
1 2 12 h ∆f (x, y),
(x, y) ∈ Ωh ,
68
Differenzen-Verfahren f¨ ur elliptische Probleme
mit dem “kompakten” Differenzenoperator (9)
∆h u(x, y) =
o 1 n 4u(x ± h, y) + 4u(x, y ± h) + u(x ± h, y ± h) − 20u(x, y) . 6h2
Diese Approximationen hat nach Aufgabe 3.3 die Konsistenzordnung m = 4 . a) Man zeige mit den Mitteln der Vorlesung die Fehlerabsch¨atzung max |u(P ) − uh (P )| ≤ cM6 (u)h4 .
P ∈Ωh
b) (Zusatzaufgabe f¨ ur Leute mit Ergeiz und Zeit) Im Falle eines allgemeinen, glattberandeten Gebiets Ω ⊂ R2 werde entlang der gekr¨ ummten Randabschnitte die Shortley-WellerApproximation betrachtet: (9)
−∆h uh = f +
1 2 12 h ∆f
in Ωh ,
−∆∗h uh = f in Ω∗h ,
uh = g auf ∂Ωh .
Man zeige hierf¨ ur mit den Mitteln der Vorlesung die Fehlerabsch¨atzung max |u(P ) − uh (P )| ≤ c {M6 (u)h4 + M3 (u)h3 }.
P ∈Ωh
¨ Ubung 2.4: Sei Ah die zum 5-Punkte-Operator auf dem Einheitsquadrat geh¨orende N × N Matrix (bei zeilenweiser Nummerierung der Gitterpunkte mit m Punkten in jeder Zeile). Die N = m2 Eigenvektoren wνµ , ν, µ = 1, . . . , m , und die zugeh¨origen Eigenwerte λνµ von Ah sind gegeben durch: wνµ (x, y) = sin(νπx) sin(µπy), (x, y) ∈ Ωh ,
λνµ =
1 4 − 2(cos(νhπ) + cos(µhπ) . h2
Man zeige, daß f¨ ur die Spektralkondition von Ah gilt: cond2 (Ah ) =:
λmax (Ah ) 4 = 2 2 + O(1). λmin (Ah ) π h
¨ Ubung 2.5: Eine Matrix A ∈ RN ×N heißt “M-Matrix”, wenn sie von nichtnegativem Typ und (−1) (−1) regul¨ar ist und wenn ihre Inverse A−1 = (aij )N ≥ 0. i,j=1 elementweise nichtnegativ ist: aij Das 5-Punkte-Differenzenschema (bzw. das Shortley-Weller-Schema) zur Approximation der 1. RWA des Laplace-Operators f¨ uhrt z.B. auf eine solche M-Matrix. a) Man zeige, daß M-Matrizen “invers-monoton” sind, d.h.: F¨ ur Vektoren v, w ∈ RN gilt komponentenweise: Av ≥ Aw ⇒ v ≥ w. b) Ist ferner Ah w ≥ (1, . . . , 1)T f¨ ur einen Vektor w ∈ RN , so folgt bzgl. der Maximumnorm bzw. Maximalen-Zeilensummen-Norm: kA−1 h k∞ ≤ kwk∞ . c) Man zeige mit Hilfe von (b), daß f¨ ur die Systemmatrix Ah des 5-Punkte-Schemas auf dem
¨ 2.4 Ubungen
69
Einheitsquadrat die Absch¨ atzung kA−1 h k∞ ≤ 1/8 gilt, und folgere hiermit f¨ ur die l∞ -Kondition von Ah : −2 cond∞ (Ah ) := kAh k∞ kA−1 h k∞ ≤ h .
Die l∞ -Kondition von Ah verh¨ alt sich also in Abh¨angigkeit von der Gitterweite h genauso wie die Spektralkondition. (Hinweis: Man versuche es mit der mit w(x, y) = x(1 − x)/2 + y(1 − y)/2 gebildeten Gitterfunktion.) ¨ Ubung 2.6: Gegeben sei die 1. RWA des Laplace-Operators −∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Dreiecksgebiet Ω = {(x, y) ∈ R2 | x, y > 0, x + y < 1} . Man stelle zu einem a¨quidistanten, kartesischen Gitter das Gleichungssystem der 5-Punkte-Differenzenapproximation auf und vergleiche (a) die zeilenweise, (b) die diagonale und (c) die schachbrettartige Gitterpunktnumerierung in Bezug auf Matrixstruktur, Speicherplatzbedarf und Rechenaufwand bei der L¨osung mit dem LR-Verfahren unter Ausnutzung der Bandstruktur. ¨ Ubung 2.7: Zur Auffrischung der Kenntnise ¨ uber iterative L¨ osungsverfahren: Eine Vereinfachung des Jacobi-Verfahrens zur L¨ osung eines linearen N ×N -Gleichungssystems Ax = b ist das sog. “Richardson-Verfahren”. Dabei wird ausgehend von einem beliebigen Startvektor x0 ∈ RN mit einem D¨ ampfungsparameter θ ∈ R wie folgt iteriert: xt+1 = xt − θ(Axt − b),
t = 0, 1, 2, . . . .
a) Im Falle, daß A nur reelle Eigenwerte λmin ≤ · · · ≤ λ ≤ · · · ≤ λmax besitzt, zeige man f¨ ur den Spektralradius ρ(Bθ ) der zugeh¨ origen Iterationsmatrix Bθ = I − θA die Gleichung ρ(Bθ ) = max |1 − θλmin |, |1 − θλmax | . b) Im Falle, daß zus¨ atzlich alle Eigenwerte positiv sind, zeige man ρ(Bθ ) < 1
⇔
0 0 . Allgemeiner wird die Bilinearform a(·, ·) koerzitiv“ (oder regul¨ar“) ” ” genannt, wenn
3.1 Allgemeine Projektionsverfahren
sup ϕ∈V
73
a(v, ϕ) ≥ γ kvkV , kϕkV
sup ϕ∈V
a(ϕ, v) ≥ γ kvkV , kϕkV
v ∈ V,
(3.1.10)
mit einer Konstante γ > 0 . Hilfssatz 3.1 (Lax1 -Milgram2 -Lemma): Unter den obigen Voraussetzungen besitzt die Gleichung (3.1.8) eine eindeutige L¨ osung u ∈ V , f¨ ur welche die a priori Absch¨ atzung gilt: kukV ≤
α klkV ∗ , κ
(3.1.11)
mit der Dualnorm“ klkV ∗ := sup{ϕ∈V, kϕk=1} |l(ϕ)| . ” Beweis: F¨ ur jedes feste v ∈ V definiert a(v, ·) ein lineares, stetiges Funktional auf V . Nach dem Rieszschen3 Darstellungssatz existieren Elemente Av ∈ V und f ∈ V , so daß a(v, ϕ) = (Av, ϕ)V ,
l(ϕ) = (f, ϕ)V ,
ϕ ∈ V.
Die Zuordnung v 7→ Av definiert eine lineare Abbildung mit der Eigenschaft kAvkV ∗ ≤ αkvkV , d.h.: A ist beschr¨ ankt. Die Aufgabe (3.1.8) ist offenbar ¨aquivalent zu der Gleichung Au = f .
(3.1.12)
Wir wollen zeigen, daß die Abbildung v ∈ V 7→ Tδ v := v − δ(Av−f ) ∈ V f¨ ur einen geeigneten Wert δ > 0 eine Kontraktion auf ganz V ist. Dann besitzt die Fixpunktgleichung Tδ v = v eine eindeutige L¨ osung u ∈ V , welche wegen 0 = v − Tδ v = δ(Av − f ) dann auch (eindeutige) L¨osung von (3.1.12) bzw. (3.1.8) ist. Die Kontraktionseigenschaft ergibt sich aus der Beziehung kv − δAvk2V = kvk2V − 2δ a(v, v) + δ2 kAvk2V ≤ (1 − 2δκ + δ2 α2 )kvk2V ,
f¨ ur 0 < δ < 2κ/α2 .
Q.E.D.
Die beiden obigen Beispiele zur 1. RWA passen in diesen Rahmen mit den Setzungen V := H01 (Ω) , l(v) := (f, ϕ) und a(v, w) := (∇v, ∇w),
a(v, w) := (∇v, ∇w) + (∂1 v, w).
3 Frigyes Riesz (1880-1956): ungarischer Mathematiker; Prof. in Szeged und Budapest; fundamentale Beitr¨ age zur Funktionalanalysis, insbesondere der Fourier-Analysis im Hilbert-Raum als theoretische Grundlage der fr¨ uhen Quantenmechanik.
74
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Die Beschr¨ anktheit dieser Formen ergibt sich direkt mit Hilfe der H¨olderschen und der Poincar´eschen Ungleichung. Ihre V -Elliptizit¨at ergibt sich unmittelbar: a(v, v) = k∇vk2 = kvk2V , bzw. unter Beachtung von v|∂Ω = 0 : a(v, v) = k∇vk2 + (∂1 v, v) = k∇vk2 + 12 (∂1 v 2 , 1)
= k∇vk2 + 21 (n1 v 2 , 1)∂Ω = k∇vk2 = kvk2V .
Durch geeignete Setzungen lassen sich auch die variationellen Formulierungen der 2. und 3. RWA in diesen abstrakten Rahmen einordnen. Zur Approximation der Variationsgleichung (3.1.2) werden endlich dimensionale Teilr¨aume Vh ⊂ V
(0 < h ≤ h0 )
ausgew¨ahlt, deren Feinheit durch einen Diskretisierungsparameter h (z.B.: Gitterweite) charakterisiert ist. (i) Im Fall einer symmetrischen Bilinearform a(·, ·) bestimmt das klassische Ritzsche4 Projek” tions-Verfahren“ N¨ aherungsl¨ osungen uh ∈ Vh durch die Vorschrift E(uh ) = min E(vh ) vh ∈V
(3.1.13)
oder ¨aquivalent durch die diskrete Variationsgleichung a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.14)
Die (eindeutige) Existenz der diskreten L¨osung uh ∈ Vh folgt mit demselben Argument wie beim kontinuierlichen Problem. Diese Analogie der Schlußweisen von kontinuierlicher und diskreter (endlich dimensionaler) Situation ist die charakteristische St¨arke der Projektionsmethoden im Gegensatz zu den Differenzenverfahren. Die Bezeichnung Projektionsverfahren ist motiviert durch die Beziehung a(u − uh , ϕh ) = 0 ϕh ∈ Vh ,
(3.1.15)
welche man durch Subtraktion der Gleichungen (3.1.2) und (3.1.19) erh¨alt. Sie kann geometrisch dahingehend interpretiert werden, daß der Fehler eh := u − uh bzgl. des Skalarprodukts a(·, ·) senkrecht auf dem Ansatzraum Vh steht. Dies impliziert auch die sog. Bestapproxi” mationseigenschaft“ f¨ ur den Approximationsfehler eh bzgl. der nat¨ urlichen Energie-Norm“ ” k · ka := a(·, ·)1/2 , denn mit beliebigem ϕh ∈ Vh gilt: keh k2a = a(eh , eh ) = a(eh , u − ϕh ) + a(eh , ϕh − uh ) ≤ keh ka ku − ϕh ka bzw. keh ka ≤ inf ku − ϕh ka . ϕh ∈Vh
4
(3.1.16)
Walter Ritz (1878-1909): schweizer Physiker; Prof. in Z¨ urich und G¨ ottingen; Beitr¨ age zu Spektraltheorie in der Kernphysik und Elektro-Magnetismus.
3.1 Allgemeine Projektionsverfahren
75
Da die Normen k · ka und k · kV auf V ¨aquivalent sind, ist die Frage nach der Konvergenz des Projektionsverfahrens, keh kV → 0
(h → 0),
(3.1.17)
damit zur¨ uckgef¨ uhrt auf die Frage der Approximierbarkeit von Funktionen u ∈ V durch Ansatzfunktionen ϕh ∈ Vh : inf ku − ϕh kV → 0 (h → 0).
ϕh ∈Vh
(3.1.18)
(ii) Wenn die Bilinearform a(·, ·) nicht symmetrisch ist, wie beim obigen Diffusions-TransportProblem, kann die zugeh¨ orige RWA nicht mehr durch ein Minimierungsproblem charakterisiert werden. Das allgemeine Galerkinsche5 (Projektions)-Verfahren“ geht direkt von der Variations” gleichung (3.1.2) aus und bestimmt N¨ aherungen durch die Beziehung a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh .
(3.1.19)
Wegen der V -Elliptizit¨ at der Bilinearform a(·, ·) auf dem endlich dimensionalen Teilraum Vh folgt unmittelbar die Existenz der (eindeutigen) L¨osung uh ∈ Vh . Die Orthogonalit¨atsbeziehung (3.1.15) bleibt dabei g¨ ultig. Damit erschließen wir die Quasi-Best-Approximationseigenschaft ¨ (Ubungsaufgabe) keh ka ≤
α min ku − ϕh ka . κ ϕ∈Vh
(3.1.20)
(iii) Eine noch allgemeinere Variante, bei der Ansatzraum Vhansatz und Testraum Vhtest unterschiedlich gew¨ ahlt werden, u ∈ Vhansatz :
a(uh , ϕh ) = (f, ϕh ) ∀ϕh ∈ Vhtest ,
(3.1.21)
ist das sog. Petrow6 -Galerkin-Verfahren“. Wir werden sp¨ater Beispiele f¨ ur diesen unkonven” tionellen Ansatz kennenlernen. Zur praktischen Realisierung des Projektionsverfahrens muß die zun¨achst abstrakte Variationsgleichung (3.1.19) im Funktionenraum algebraisiert werden, d.h.: in ein ¨aquivalentes algebraisches Gleichungssystem umgewandelt werden. Dazu w¨ahlen wir zun¨achst eine Basis (i) ur die zu bestimmende diskrete {ϕh , i = 1, ..., N }, N := dim Vh , von Vh aus und machen f¨ PN (j) L¨osung den Ansatz uh = j=1 ξj ϕh . Wird dies in (3.1.19) eingesetzt und l¨aßt man die Testfunktionen ϕh ∈ Vh alle Basisfunktionen durchlaufen, ergibt sich ein lineares (algebraisches) N × N -Gleichungssystem N X
(j)
(i)
(i)
ξj a(ϕh , ϕh ) = (f, ϕh ),
i = 1, ..., N,
j=1
5
Boris Grigorievich Galerkin (1871-1945): russischer Bauingenieur und Mathematiker; Prof. in St. Petersburg; Beitr¨ age zur Struktur-Mechanik, insbesondere zur Plattentheorie. 6 Georgi Iwanowitsch Petrow (1912-1987): russischer Ingenieur; 1965-1973 Direktor des Instituts f¨ ur Raumfahrtforschung; Publ.: “Application of the Galerkin method and the problem of flow stability of a viscous liquid” (russ.), Prikl. Mat. Mekh. 4, 36-47 (1947)
76
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
f¨ ur den Vektor ξ = (ξj )N j=1 der Entwicklungskoeffizienten, bzw. in kompakter Schreibweise Ah ξ = bh .
(3.1.22)
N Dabei sind die Koeffizientenmatrix Ah = (aij )N i,j=1 sowie die rechte Seite bh = (bi )i=1 durch die spezielle Wahl der Basis bestimmt: (j)
(i)
(j)
bj = (f, ϕh ).
aij = a(ϕh , ϕh ),
Die Entwicklungskoeffizienten ξj k¨ onnen sehr unterschiedliche Bedeutung haben; z.B.: MonomKoeffizienten einer Polynomdarstellung, Fourier-Koeffizienten einer trigonometrischen Entwicklung, Knotenwerte einer st¨ uckweise polynomialen Funktion, u.s.w.. Die Eigenschaften der Bilinearform a(·, ·) u ¨bertragen sich direkt auf die zugeh¨orige Matrix Ah . Ist a(·, ·) symmetrisch, so auch Ah , (j) (i) (i) (j) aij = a(ϕh , ϕh ) = a(ϕh , ϕh ) = aji , und die V -Elliptizit¨ at von a(·, ·) impliziert die Definitheit von Ah , denn f¨ ur x ∈ Rn \ {0} gilt: (Ah x, x) =
N X
aij xi xj =
i,j=1
N X
(j)
(i)
a(ϕh , ϕh )xi xj
i,j=1
N N N
X X X
(i) 2 (i) (j) xi ϕh > 0. xi ϕh ≥ κ =a xj ϕh , j=1
i=1
i=1
V
3.1.1 Beispiele von Galerkin-Ansatzr¨ aumen Wir wollen einige konkrete Realisierungen f¨ ur den beschriebenen abstrakten Rahmen diskutieren. Bei der Wahl der Ansatzr¨ aume Vh ⊂ V = H01 (Ω) sowie der Basen zur Aufstellung der Gleichungssysteme (3.1.22) sind einige Bedingungen zu beachten: (j)
(i)
(i)
– Die Berechnung der Matrixelemente aij = a(ϕh , ϕh ) sowie die der rechten Seite (f, ϕh ) sollte billig“ sein. ” – Aus Genauigkeitsgr¨ unden wird die Problemdimension in der Regel sehr groß sein: N ≫ 100 . Die Matrix Ah sollte daher m¨oglichst d¨ unn besetzt sein. – Die Matrix Ah sollte nicht zu schlecht konditioniert sein; akzeptabel sind z.B. beim vorliegenden Problem cond2 (Ah ) ≈ O(N ) − O(N 2 ) , wogegen cond2 (Ah ) ≈ O(N 4 ) − O(eN ) nicht praktikabel w¨ aren. Beispiele von solchen Ans¨ atzen sind: 1) Globaler Polynomansatz: Auf einem Quadrat Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht m X cij xi y j , h := 1/m, N = (m + 1)2 . Vh := Qm (Ω) := p(x, y) = i,j=0
Als Basen kommen dabei in Frage:
3.1 Allgemeine Projektionsverfahren
77
a) Monombasis 1, x, y, x2 , xy, y 2 , ... ; die zugeh¨orige Matrix A mit den Elementen aij =
Z
0
1Z 1 0
∇xi · ∇y j dx dy,
0 ≤ i, j ≤ m,
verh¨alt sich dann wie die bekannte Hilbert-Matrix mit exponentiell mit N wachsender Kondition cond2 (Ah ) = O(eN ) . Dieser Ansatz ist also praktisch unbrauchbar. b) Tensorprodukt-Basen L2 -orthogonaler Polynome wie z.B. Legendre-Polynome oder Tschebyscheff-Polynome; die zugeh¨ orige Matrix Ah mit den Elementen Z 1Z 1 (m) (m) aij = ∇Li · ∇Lj dx dy, 0 ≤ i, j ≤ m, 0
0
ist dann zwar voll besetzt, hat aber eine wesentlich g¨ unstigere Kondition, cond2 (Ah ) = O(N ) . Dieser Ansatz f¨ uhrt auf die sog. Spektral-Galerkin-Verfahren“, welche bei Problemen auf geo” metrisch einfachen (rechteckigen) Gebieten sehr leistungsf¨ahig sind. Die Bezeichnung Spek” tralverfahren“ r¨ uhrt daher, daß man die orthogonalen Polynome auch als Eigenfunktionen gewisser Differentialoperatoren 2. Ordnung charakterisieren kann. Wegen ihrer konzeptionellen Beschr¨ankung auf einfache Geometrien wollen wir derartige Methoden hier nicht weiter disku¨ tieren. Stichworte f¨ ur Entwicklungen in Richtung auf eine Uberwindung dieser Restriktion sind z.B. Spektral-Elemente-Methoden“ und h/p-Finite-Elemente-Methode“. ” ” 2) Globaler trigonometrischer Ansatz ( echte Spektralverfahren“): Wieder auf einem Quadrat ” Ω = (0, 1)2 wird der Tensor-Produkt-Ansatz gemacht m X cij sin(iπx) sin(jπy) , Vh := Tm (Ω) := t(x, y) =
h := 1/m, N = (m + 1)2 .
i,j=0
Als Basen verwendet man dabei die nat¨ urliche trigonometrische Basis {1, sin(nπx) sin(mπy), ...} . Die zugeh¨orige Matrix Ah ist dann vergleichsweise gut konditioniert, cond2 (Ah ) = O(N ) . In diesem Fall gibt es mit der schnellen Fourier-Transformation ( FFT“) einen fast optimalen ” Algorithmus mit der Komplexit¨ at O(N ln(N )) zur L¨osung des Gleichungssystems (3.1.22). Der Nachteil dieses in Spezielf¨ allen sehr leistungsf¨ahigen Ansatzes ist wieder seine Beschr¨anktheit auf einfache Rechteckgeometrien und sog. separable“ Differentialoperatoren mit konstanten ” Koeffizienten. 3) St¨ uckweise polynomialer Ansatz ( Finite Elemente“): Um das Problem der Approximation ” allgemeiner Gebiete zu l¨ osen, werden Ansatzfunktionen (auch Formfunktionen“ genannt) ver” uckweise wendet, welche bzgl. einer Zerlegung von Ω in einfache Teilgebiete T , sog. Zellen“, st¨ ” polynomial sind. G¨ angige Beispiele von Zellen sind Dreiecke oder (konvexe) Vierecke in zwei bzw. Tetraeder oder (konvexe) Hexaeder in drei Dimensionen. Der Parameter h ist in diesem Fall etwa der maximale Zelldurchmesser. Wir illustrieren diesen Finite-Elemente-Ansatz anhand eines einfachen Beispiels. Die 1. RWA (3.1.2) sei auf einem (konvexen) polygonalen Gebiet Ω ⊂ R2 mit homogenen Randwerten u|∂Ω = 0 und rechter Seite f ∈ L2 (Ω) gestellt. Die zugeh¨orige L¨osung u ∈ H01 (Ω) ist dann auch im
78
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Sobolew-Raum H 2 (Ω) und gen¨ ugt der a priori Absch¨atzung k∇2 uk ≤ cs kf k,
(3.1.23)
wobei cs = 1 im Falle eines konvexen Gebiets. Weiter sei eine Folge von Zerlegungen Th = {T } des Gebiets Ω in abgeschlossene Dreiecke T ( Triangulierung“) gegeben mit h := maxT diam(T ) → 0 . Wir stellen die folgenden ” Regularit¨atsbedingungen an diese Triangulierung: S i) Strukturregularit¨ at: Je zwei Dreiecke der Zerlegung Ω = {T ∈ Th } u ¨ berlappen sich h¨ochstens in gemeinsamen Eckpunkten oder in ganzen Seiten, d.h.: Sog. h¨angende“ Knoten ” sind hier nicht erlaubt. ii) Formregularit¨ at: Alle Dreicke der Triangulierungen T ∈ Th sind von a¨hnlicher Gestalt, d.h.: F¨ ur den Inkreisradius ρT und Umkreisradius hT eines jeden Dreiecks T gilt gleichm¨aßig f¨ ur h → 0: max
T ∈Th
hT ≤ c1 ρT
(3.1.24)
iii) Gr¨ oßenregularit¨ at: Alle Dreiecke einer Triangulierung Th sind von gleicher Gr¨oßenordnung, d.h.: Es gilt gleichm¨ aßig f¨ ur h → 0 : max hT ≤ c2 min hT .
T ∈Th
T ∈Th
(3.1.25)
T
Ω Abbildung 3.1: Finite-Elemente: Dreiecks- bzw. Vierecksgitter Auf den Triangulierungen Th definieren wir Ansatzr¨aume st¨ uckweise linearer Funktionen ( lineare finite Elemente“: Verallgemeinerung des Konzepts eines Polygonzugs auf h¨ohere Raum” dimensionen): (1) Vh := {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , v|∂Ω = 0} . Dabei bezeichnet allgemein Pr (T ) den Vektorraum der Polynome bis zum Grad r ≥ 0 u ¨ber (1) 1 T . Man u ¨ berlegt sich leicht, daß dadurch tats¨achlich Teilr¨aume Vh ⊂ H0 (Ω) erkl¨art sind. Sei (1) N die Anzahl der inneren“ Knoten (Dreieckseckpunkte) der Triangulierung. Jedes vh ∈ Vh ” ist als st¨ uckweise lineare Funktion eindeutig durch Vorgabe ihrer Funktionswerte ( Knotenwer” te“) in den inneren“ Dreieckseckpunkten ( Knoten“) festgelegt. In den Eckpunkten auf dem ” ” (1) Gebietsrand ∂Ω ist vh = 0 wegen der Dirichlet-Randbedingung. In Vh gibt es daher eine
3.1 Allgemeine Projektionsverfahren
79
nat¨ urliche Basis, die sog. Knotenbasis“ in Analogie zur Lagrange7 -Basis“ bei der eindimen” ” sionalen Lagrange-Interpolation. Jedem Knoten ai wird durch die Bedingung ϕih (aj ) = δij , (1)
eindeutig eine Funktion ϕih ∈ Vh stellung
j = 1, ..., N, (1)
zugeordnet. Damit gilt dann f¨ ur jedes vh ∈ Vh vh =
N X
die Dar-
(i)
vh (ai )ϕh .
i=1
(i)
(1)
Daraus folgt, daß {ϕh , i = 1, ..., N } tats¨achlich eine Basis von Vh jeder kontinuierlichen Funktion v ∈ C(Ω) durch die Vorschrift Ih v :=
N X
ist. Umgekehrt l¨aßt sich
(i)
v(ai )ϕh
i=1
(1)
eindeutig eine (st¨ uckweise lineare) Interpolierende“ Ih v ∈ Vh ” (1) vh f¨ ur vh ∈ Vh .
zuordnen. Offenbar ist Ih vh ≡
Dieser Diskretisierungsansatz erf¨ ullt offensichtlich die oben formulierten Anforderungen an ein brauchbares Galerkin-Verfahren: Die resultierende Systemmatrix Ah ist d¨ unn besetzt (wegen ¨ der geringen Uberlappung der Tr¨ ager der Basisfunktionen), und ihre Elemente sind sehr leicht zu berechnen. Wir werden die praktische Berechnung von A im Zusammenhang mit allgemeineren Finite-Elemente-Ans¨ atze dieser Art noch eingehender diskutieren.
Knotenbasisfunktionen: Lineare sowie bilineare Ans¨atze F¨ ur die Kondition der Matrix Ah werden wir sp¨ater in zwei Dimensionen cond2 (Ah ) = −2 O(h ) = O(N ) zeigen (¨ ahnlich wie bei der 5-Punkte-Differenzendiskretisierung). Wir reka(1) pitulieren f¨ ur das Galerkin-Verfahren mit dem Finite-Elemente-Raum Vh die asymptotische Absch¨atzung f¨ ur den Fehler eh := u − uh : k∇eh k = min
(1)
ϕh ∈Vh
k∇(u − ϕh )k.
(3.1.26)
7 Joseph Louis de Lagrange (1736-1813): franz¨ osischer Mathematiker; 1766-87 Direktor der mathem. Klasse der Berliner Akademie, dann Prof. in Paris; bahnbrechende Arbeiten zur Variationsrechnung, zur komplexen Funktionentheorie sowie zur theor. Mechanik und Himmelsmechanik.
80
Finite-Elemente-Verfahren f¨ ur elliptische Probleme (1)
Die Frage ist also, ob es ϕh ∈ Vh gibt, so daß k∇(u − ϕh )k → 0 (h → 0) . Wenn man nur weiß, daß u ∈ H01 (Ω) ist, dann kann man nur qualitative Konvergenz zeigen. Viel interessanter w¨are es, wieder die Konvergenzgeschwindigkeit in Potenzen der Gitterweite h zu kennen. Hierzu ist aber nat¨ urlich mehr Regularit¨ at der L¨osung u erforderlich. F¨ ur den st¨ uckweise linearen Ansatz werden wir sp¨ ater im Rahmen einer allgemeinen Theorie die folgende Interpolationsabsch¨atzung zeigen: k∇(v − Ih v)k ≤ ci h k∇2 vk,
v ∈ H01 (Ω) ∩ H 2 (Ω).
(3.1.27)
(Man vergleiche die analoge Absch¨ atzung, welche in einer Dimension bei der Finite-ElementeApproximation eindimensionaler Sturm-Liouville-Probleme verwendet wird.) Unter den bisher formulierten Voraussetzungen l¨ aßt sich eine erste quantitative Konvergenzaussage f¨ ur das FiniteElemente-Verfahren ableiten. Satz 3.1 (Konvergenzsatz): F¨ ur die Galerkin-Approximation des Modellproblems (3.1.2) mit linearen“ finiten Elementen gelten unter den obigen Voraussetzungen die Fehlerabsch¨ atzungen ” k∇eh k ≤ ci cs h kf k,
keh k ≤ c2i c2s h2 kf k,
(3.1.28) (3.1.29)
mit den Konstanten ci , cs aus den Ungleichungen (3.1.27) und (3.1.23). Beweis: (i) Die Absch¨ atzung des sog. Energienorm-Fehlers“ ergibt sich unmittelbar aus der ” Best-Approximationsbeziehung (3.1.26), der Interpolationsabsch¨atzung (3.1.27) und der Regularit¨atsabsch¨ atzung (3.1.23): k∇eh k ≤ k∇(u − Ih u)k ≤ ci h k∇2 uk ≤ ci cs h kf k. (ii) Zum Beweis der Fehlerabsch¨ atzung in der L2 -Norm verwenden wir ein sog. Dualit¨atsargu” 8 9 ment“ ( Aubin -Nitsche -Trick“). Sei z ∈ H01 (Ω) die (schwache) L¨osung des Hilfsproblems ” −∆z = keh k−1 eh in Ω,
z|∂Ω = 0.
Diese ist dann auch in H 2 (Ω) , und es gilt die a priori Absch¨atzung k∇2 zk ≤ cs k∆zk = cs , wobei wieder cs = 1 auf konvexem Gebiet Ω . Nach Konstruktion folgt mit Hilfe der GalerkinOrthogonalit¨ at: keh k = (∇eh , ∇z) = (∇eh , ∇(z − Ih z))
≤ k∇eh k k∇(z − Ih z)k ≤ ci h k∇eh k k∇2 zk ≤ ci cs h k∇eh k.
Mit dem Ergebnis (i) ergibt sich damit die gew¨ unschte Absch¨atzung. 8
Q.E.D.
Jean-Pierre Aubin (1939-): franz¨ osischer Mathematiker; Prof. an der Univ. Paris-Dauphine (2004) emeritiert); Beitr¨ age zur Theorie partieller Differentialgleichungen und ihrer Numerik. 9 Joachim A. Nitsche (1926-1996): deutscher Mathematiker; Prof. in Freiburg; fundamentale Beitr¨ age zur Theorie der Finite-Elemente-Methode.
3.1 Allgemeine Projektionsverfahren
81
Die im Beweis von Satz 3.1 verwendete Schlußweise u ¨ber ein Dualit¨atsargument ist das“ ” zentrale Hilfsmittel bei der Konvergenzanalyse von Finite-Elemente-Verfahren. Dieses abstrakte Argument entspricht der allgemeinen Regel, daß sich die Analyse der Projektionsverfahren eng an die abstrakten Hilbertraum-Methoden zur Behandlung des kontinuierlichen Problems anlehnt. Das zentrale Hilfmittel bei der Untersuchung von Differenzenverfahren war dagegen das (diskrete) Maximumprinzip“, welches sich mehr an den klassischen Techniken f¨ ur partielle Dif” ferentialgleichungen orientiert. Wir wollen diesen Vergleich Finite-Elemente-Method (FEM) ” Finite-Differenzen-Method (FDM)“ anhand des Resultats von Satz 3.1 noch etwas weiterf¨ uhren. Die a-priori Fehlerabsch¨ atzung (3.1.29) f¨ ur das Finite-Elemente-Verfahren ist zu vergleichen mit der Absch¨ atzung (2.2.37) f¨ ur das Differenzenverfahren (5-Punkte-Diskretisierung mit Shortley-Weller-Randapproximation auf polygonalen Gebieten): max |eh | ≤ Ω
2 1 2 24 dΩ M4 (u)h
+ O(h3 ),
(3.1.30)
mit der Schranke M4 (u) f¨ ur die vierten Ableitungen von u . Beide Absch¨atzungen zeigen dieselbe asymptotische Konvergenzordnung O(h2 ) , was aufgrund der verwendeten Diskretisierungsans¨atze auch zu erwarten ist. Die Unterschiede liegen zum einen in der Art der Norm, in der der Fehler gemessen wird, und zum anderen in der ben¨otigten Regularit¨at der approximierten L¨osung. Beim Differenzenverfahren erh¨alt man wegen der Verwendung des Maximumprinzips punktweise Absch¨ atzungen, wie sie auch der Anwender gern hat. (Der Ingenieur ist z.B. an der maximalen Auslenkung einer belasteten Br¨ uckenkonstruktion interessiert.) Dagegen liefert die Hilbert-Raum-Theorie f¨ ur das Finite-Elemente-Verfahren zun¨achst nur Absch¨atzungen im quadratischen Mittel, was etwa lokale Ausreißer“ an kritischen Stellen nicht ausschließt. (Dem ” Br¨ uckenbauer gen¨ ugt so etwas nicht, wenn Fehlerspitzen etwa in kritischen Lagerungspunkten der Br¨ ucke auftreten k¨ onnen.) Wir werden sp¨ater die Frage diskutieren, ob und wie man auch f¨ ur das Finite-Elemente-Verfahren Fehlerabsch¨atzungen in der Maximumnorm herleiten kann. Die in der Absch¨ atzung (3.1.30) geforderte hohe Regularit¨at der L¨osung ist ein sehr viel schwerwiegender Nachteil unserer Analyse des Differenzenverfahrens, da diese Regularit¨atsstufe i.a. auf Polygongebieten und unter realistischen Annahmen an die Problemdaten nicht erwartet werden kann. Wir bemerken, daß man f¨ ur das Finite-Elemente-Verfahren mit wesentlich mehr technischem Aufwand optimale“ Maximumnorm-Fehlerabsch¨atzungen der Form ” max |eh | ≤ cM2 (u) h2 | ln h|
(3.1.31)
Ω
beweisen kann. Allerdings ist auch die abgeschw¨achte Annahme M2 (u) < ∞ i.a. noch zu restriktiv. F¨ ur das Finite-Elemente-Verfahren ist auch noch unter der Minimalvoraussetzung 1 u ∈ H0 (Ω) wenigstens qualitative Konvergenz gesichert. Seinen eigentlichen Vorteil, n¨amlich die große Flexibilit¨ at bei der Approximation von komplizierten Geometrien auf unstrukturierten Gittern werden wir sp¨ ater im Zusammenhang mit der Frage nach adaptiver Gittersteuerung und Fehlerkontrolle erkennen. 3.1.2 Diskretes Maximumprinzip fu ¨ r Finite-Elemente-Approximationen Als n¨achstes wollen wir zeigen, daß Galerkin-Verfahren mit finiten Elementen als Ansatzfunktionen tats¨ achlich eng verwandt mit Differenzenverfahren sind. Die Elemente der Steifigkeits” matrix“ Ah des Finite-Elemente-Verfahrens f¨ ur den Fall linearer“ Ansatzfunktionen auf einem ” Dreiecksgitter werden exakt bestimmt.
82
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Dazu wird zun¨ achst ein einzelnes Dreieck T mit den Eckpunkten Pi (i = 1, 2, 3) betrachtet (siehe Bild). Die dem Eckpunkt Pi gegen¨ uberliegende Seite sei mit Si und die zugeh¨orige H¨ohe mit Hi bezeichnet. Die Seiten werden dabei als im Gegenuhrzeigersinn und die H¨ohen gegen den Eckpunkt orientierte Vektoren aufgefaßt. Weiter bezeichne ψi die (st¨ uckweise lineare) Knotenbasisfunktion zum Punkt Pi , welche auf T definiert ist durch ψi (Pk ) = δik , i, k = 1, 2, 3 .
Es gilt ∇ψh ≡ konst. und wegen ψi (Pj ) = ψi (Pk ) = 0, i 6= j, k , hat ∇ψi in Richtung Si die Komponente Null. Folglich zeigt ∇ψi in Richtung Hi und hat wegen ψi (Pi ) = 1 den Betrag |Hi |−1 : Hi ∇ψi = . |Hi |2 Wir erhalten also
(∇ψi , ∇ψj )T = |T |
(Hi , Hj ) . |Hi |2 |Hj |2
F¨ ur den Winkel γij zwischen den H¨ ohen Hi und Hj gilt cos(γij ) =
(Hi , Hj ) |Hi | |Hj |
und, da γij gleich dem Winkel θij zwischen den Seitenvektoren Si und Sj ist, auch (Man beachte die Orientierung von Si und Sj .): cos(γij ) =
(Si , Sj ) |Si | |Sj |
Damit folgt bei Beachtung von 2|T | = |Hi | |Si | die Beziehung (∇ψi , ∇ψj )T = |T |
(Si , Sj ) (Si , Sj ) = . |Si | |Sj | |Hi | |Hj | 4|T |
Hieraus lesen wir ab, daß (∇ψi , ∇ψi )T > 0,
(∇ψi , ∇ψj )T ≤ 0,
i 6= j,
(3.1.32)
falls alle Winkel im Dreieck T kleiner oder gleich π/2 sind. Weiter ist nach Konstruktion 3 X j=1
ψj ≡ 1,
(∇ψi ,
3 X j=1
∇ψj )T = 0,
3.1 Allgemeine Projektionsverfahren
bzw.
N X
j=1,j6=i
F¨ ur die Elemente aij =
P
83
|(∇ψi , ∇ψj )T | ≤ (∇ψi , ∇ψi )T ,
T ∈Th (∇ψj , ∇ψi )T
aii > 0,
i = 1, 2, 3.
der Matrix Ah erhalten wir somit, daß aij ≤ 0
(i 6= j),
wenn alle Dreiecksinnenwinkel in der Triangulierung kleiner oder gleich π/2 sind. Dar¨ uber hinaus gilt X X |aij | ≤ aii , |ai0 j | < ai0 i0 f¨ ur ein i0 . (3.1.33) j6=i
j6=i0
Die Steifigkeitsmatrix Ah ist in diesem Fall also (irreduzibel) diagonal-dominant“, von nicht” ” negativem Typ“ und eine M -Matrix“. Wir fassen die sich daraus ergebenden Konsequenzen in ” einem Satz zusammen. Satz 3.2 (Maximumprinzip fu ¨ r finite Elemente): Wenn alle Innenwinkel der Triangulierung Th kleiner oder gleich π/2 sind, gen¨ ugt das Finite-Elemente-Schema mit st¨ uckweise linearen Ansatzfunktionen einem diskreten Maximumprinzip, d.h.: (n)
(∇vh , ∇ϕh ) ≤ 0 (n = 1, ..., N )
⇒
maxΩ vh ≤ max{0, max∂Ω vh }.
(3.1.34)
Ferner ist die Steifigkeitsmatrix Ah eine M -Matrix, und es gilt A−1 h ≥ 0 sowie x ∈ RN , Ah x ≥ 0
⇒
x ≥ 0.
(3.1.35)
Dieses Resultat kann so interpretiert werden, daß unter den gegebenen Voraussetzungen auch die Finite-Elemente-Diskretisierung ein diskretes Maximumprinzip“ erf¨ ullt. Leider gilt die kri” tische Eigenschaft (3.1.32) praktisch nur in der oben beschriebenen Situation. Insbesondere Finite-Elemente-Ans¨ atze h¨ oherer Ordnung erf¨ ullen dies nicht (z.B. quadratische Ans¨atze nur auf gleichseitigen“ Triangulierungen). ” Bemerkung 3.4: Im Spezialfall einer gleichf¨ormigen, kartesischen Triangulierung (mit Kantenl¨ange h ) des Einheitsquadrats erhalten wir aus der obigen expliziten Darstellung f¨ ur die Matrixelemente aij = (∇ψi , ∇ψj ) die Beziehung: aii = 4,
ai,i±1 = −1,
ai,i±m = −1;
alle anderen Elemente aij sind Null. In diesem Fall stimmt die Steifigkeitsmatrix AFh EM also bis auf den Faktor h−2 mit der Matrix AFh DM des 5-Punkte-Operators“ u ¨ berein: ” AFh EM = h2 AFh DM . F¨ ur die Elemente des zugeh¨ origen Lastvektors“ gilt entsprechend: ” Z f ψi dx ≈ h2 f (Pi ) + O(h4 ) = h2 bFi DM + O(h4 ). bFi EM = Ω
(3.1.36)
(3.1.37)
84
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Dies zeigt, daß aus algebraischer Sicht FEM und FDM eng verwandt sind. F¨ ur eine st¨ uckweise bi-linearen“ Ansatz auf einer gleichf¨ ormigen Quadratzerlegung erh¨alt man ein Analogon zu ” einem kompakten 9-Punkte-Operator“ (siehe Bild): ”
3.1.3 Approximation krummer R¨ ander Zum Abschluß dieser einf¨ uhrenden Diskussion wollen wir noch darstellen, wie in der FEM krumme R¨ander approximiert werden. Dazu sei angenommen, daß der Rand ∂Ω regul¨ar genug ist, daß die schwache L¨ osung u ∈ V := H01 (Ω) auch in H 2 (Ω) ist und der a-priori Absch¨atzung kukH 2 ≤ cs kf k
(3.1.38)
gen¨ ugt. i) Der konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, konvexes Gebiet. Dieses sei u ¨ berdeckt ” durch eine regul¨ are Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets [ Ωh := {T ∈ Th } ⊂ Ω, auf dem Rand ∂Ω liegen. Die L¨ ange der Polygonkanten von ∂Ω ist dann durch die Gitterweite h der Triangulierung Th beschr¨ ankt (siehe Bild).
Abbildung 3.2: Polygonale Approximation eines krumm berandeten Gebiets; Randstreifen Sh = ∪{ST } schraffiert. Auf Ω wird nun zun¨ achst der einfachste Finite-Elemente-Ansatz (mit linearen Formfunktionen) wie folgt definiert: (1)
Vh
:= {vh ∈ C(Ω)| vh|T ∈ P1 (T ), T ∈ Th , vh|Ω\Ωh ≡ 0} ⊂ V = H01 (Ω).
3.1 Allgemeine Projektionsverfahren
85 (1)
Die zugeh¨origen Galerkin-Approximationen uh ∈ Vh
sind durch die Variationsgleichung
(∇uh , ∇ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh
(3.1.39)
bestimmt. Wegen der Teilraumbeziehung Vh ⊂ V gilt dann wieder f¨ ur den Fehler eh := u − uh die Bestapproximationsbeziehung (3.1.26). Satz 3.3 (FEM auf konvexem Gebiet): F¨ ur das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, konvexen Gebiet Ω gelten die a-priori Konvergenzabsch¨ atzungen k∇eh k ≤ (ci +cΩ )cs h kf k,
(3.1.40)
keh k ≤ (ci +cΩ )2 c2s h2 kf k,
(3.1.41)
mit Stabilit¨ ats- und Interpolationskonstanten cs , ci und einer Konstante cΩ . Beweis: (i) Sei Ih u ∈ Vh die nat¨ urliche Knoteninterpolierende von u , welche auf dem Streifen Sh = Ω \ Ωh zu Null gesetzt wird. F¨ ur diese gilt wieder auf jeder Zelle T ∈ Th (wird sp¨ater gezeigt werden) k∇(u − Ih u)kT ≤ ci hT k∇2 ukT ,
(3.1.42)
und folglich k∇(u − Ih u)kΩh ≤ ci hk∇2 ukΩh . Mit Hilfe der Approximationsbeziehung (3.1.26) ergibt sich somit k∇eh k2Ω ≤ c2i h2 k∇2 uk2Ωh + k∇uk2Sh .
(3.1.43)
Es bleibt, das Integral u ¨ ber den Randstreifen Sh zu behandeln. (ii) F¨ ur ein glatt berandetes Gebiet (d.h.: ∂Ω ist C 2 -parametrisiert.) ist nun |Sh | = O(h2 ) . Um dies zu sehen, nehmen wir an, daß der Randabschnitt ∂ΩT , welcher von Γ von ∂Ω abgetrennt wird, als Graph einer Funktion ψ(s) der Bogenl¨ange u ¨ber Γ aufgefaßt werden kann. Diese nehme ihr Maximum ψ0 f¨ ur s = s0 an, so daß (ψ − ψ0 )(s0 ) = 0,
(ψ − ψ0 )′ (s0 ) = 0.
Durch Taylor-Entwicklung von ψ − ψ0 um s0 ergibt sich dann max |ψ(s)| = max |ψ(s) − ψ0 | ≤ δ := Γ
Γ
1 2
max |ψ ′′ | h2T . Γ
Folglich ist |Sh | ≤ ch2 . Damit ist bewiesen, daß k∇eh kΩ ≤ chkukH 2,p .
(3.1.44)
(iii) Zur Absch¨ atzung des Integrals u ¨ ber Sh gehen wir a¨hnlich vor wie beim Beweis der Poincar´eschen Ungleichung. Sei T ∈ Th ein Randdreieck und ST der zugeh¨orige Teilabschnitt des Randstreifens Sh , welcher von der Kante Γ von T begrenzt ist. O.B.d.A. sei angenommen, daß ein Rechteck QT mit Γ als kurzer Seite und L¨ange L > 0 (unabh¨angig von h ) ganz in Ω enthalten ist (siehe Bild 3.2). Sei nun weiter v ∈ C 1 (Ω) beliebig. Es bezeichne nΓ (x) den bzgl.
86
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Sh nach innen gerichteten Normaleneinheitsvektor zu Γ im Punkt x ∈ Γ mit Parameterwert s . Damit gilt f¨ ur 0 ≤ t ≤ δ : Z t ∂r v(x + rnΓ (x)) dr, v(x + tnΓ (x)) = v(x) + 0
bzw. 2
2
|v(x + tnΓ (x))| ≤ 2|v(x)| + 2δ
Z
ψ(s)
0
|∇v(x + rnΓ (x))|2 dr.
Wir integrieren dies zun¨ achst u ur x ∈ Γ gilt ¨ber 0 ≤ t ≤ ψ(s) ≤ δ (Man beachte, daß f¨ x + ψ(s)nΓ (x) ∈ ∂ΩT .), Z
ψ(s) 0
2
2
|v(x + tnΓ (x))| dt ≤ 2δ|v(x)| + 2δ
2
Z
ψ(s)
0
und dann u ¨ber x ∈ Γ und erhalten Z Z Z 2 2 2 |v(x)| dx ≤ 2δ |v(x)| ds + 2δ Γ
ST
|∇v(x + rnΓ (x))|2 dr,
ST
|∇v(x)|2 dx.
F¨ ur das Randintegral rechts erhalten wir mit Hilfe der Spurabsch¨atzung Z |v(x)|2 ds ≤ cΩ kvk2H 1 (QT ) Γ
mit einer von maxΓ |ψ ′ | abh¨ angigen Konstante cΩ . Damit gewinnen wir schließlich die Absch¨ atzung Z |v(x)|2 dx ≤ cΩ h2 kvk2H 1 (Ω) , (3.1.45) Sh
mit einer generischen Konstante cΩ . Durch das u ¨bliche Stetigkeitsargument u ¨ bertr¨agt sich diese 1 Absch¨atzung auf alle Funktionen v ∈ H (Ω) . Wir wenden die Absch¨ atzung (3.1.45) nun f¨ ur die Funktion |∇u| ∈ H 1 (Ω) an und erhalten k∇uk2Sh ≤ cΩ h2 kuk2H 2 , so daß sich mit (3.1.43) schließlich das erste gew¨ unschte Resultat ergibt: k∇ek ≤ ci hk∇2 uk + cΩ hkukH 2 ≤ (ci +cΩ )cs h kf k.
(3.1.46)
Zur Absch¨atzung des L2 -Fehlers wird wieder ein Dualit¨atsargument verwendet. Sei z ∈ H01 (Ω)∩ H 2 (Ω) die L¨ osung des Hilfsproblems −∆z = kek−1 e
in Ω,
z|∂Ω = 0.
Wie im Fall eines Polygongebiets argumentieren wir nun wie folgt: kek = (∇e, ∇z) = (∇e, ∇(z − Ih z)) ≤ k∇ek k∇(z − Ih z)k. Mit Hilfe der Interpolationsabsch¨ atzung (3.1.42) sowie der Randstreifenabsch¨atzung (3.1.45) f¨ ur
3.1 Allgemeine Projektionsverfahren
87
v := |∇z| folgt weiter
kek ≤ k∇ek ci hk∇2 zk + cΩ hkzkH 2 ≤ (ci +cΩ )hk∇ek kzkH 2 .
Hiermit folgt dann unter Verwendung des ersten Resultats (3.1.46) sowie der a-priori Schranke unschte Ungleichung kzkH 2 ≤ cs auch die zweite gew¨ kek ≤ (ci +cΩ )2 c2s h2 kf k. Dies vervollst¨ andigt den Beweis.
(3.1.47) Q.E.D.
ii) Der nicht-konvexe Fall“: Sei Ω ⊂ R2 ein glatt berandetes, aber nicht notwendig konvexes ” Gebiet. Dieses sei wieder u ¨ berdeckt durch S eine regul¨are Triangulierung Th = {T } , so daß alle Eckpunkte des Polygongebiets Ωh := {T ∈ Th } auf dem Rand ∂Ω liegen (siehe Bild).
Die L¨ange der Polygonkanten von ∂Ωh ist dann durch die GitterweiteSh der Triangulierung Th beschr¨ankt. Ist Ω nicht konvex, so ist Ωh 6⊂ Ω . Der auf Ωh = {T ∈ Th } definierte (1) Finite-Elemente-Raum Vh ist dann auch nicht in V enthalten, und die Approximation wird nicht-konform“ (bzgl. V = H01 (Ω) ) genannt. Die Analyse dieser Approximation gestaltet sich ” technisch etwas schwieriger als im konformen Fall. Doch auch hierf¨ ur kann man Konvergenz mit der optimalen Ordnung beweisen. Satz 3.4 (FEM auf nicht-konvexem Gebiet): F¨ ur das Finite-Elemente-Schema (3.1.39) auf einem glatt berandeten, nicht-notwendig konvexen Gebiet Ω gelten die a-priori Konvergenzabsch¨ atzungen k∇eh kΩ ≤ (ci +cΩ )cs hkf kΩ keh kΩ ≤
(ci +cΩ )2 c2s h2 kf kΩ ,
(3.1.48) (3.1.49)
mit Stabilit¨ ats- und Interpolationskonstanten cs , ci und einer Konstante cΩ . Beweis: Der Beweis wird in einer sp¨ ateren Version dieses Skriptums gegeben werden. Q.E.D.
88
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
3.2 Allgemeine Finite-Elemente-Ans¨ atze Wir wollen nun Finite-Elemente-Ansatzr¨aume allgemeineren Typs konstruieren und Fragen der praktischen Realisierung der Methode diskutieren. Zun¨achst wird Ω als ein Polygongebiet (Polyeder in 3-D) angenommen. Seien Th Zerlegungen von Ω in Dreiecke oder Vierecke (Tetraeder oder Hexaeder in 3-D), welche den im vorigen Abschnitt formulierten Bedingungen gen¨ ugen. F¨ ur die folgenden Konstruktionen von Finite-Elemente-Ans¨atzen verwenden wir die Bezeichnungen n o n o X X Pr := p(x) = cij xi1 xj2 , Qr := q(x) = cij xi1 xj2 , 0≤i+j≤r
0≤i,j≤r
f¨ ur Polynom-Vektorr¨ aume im R2 (analog f¨ ur solche im R3 ). Wir verwenden die Bezeichnungen Th = {T } Zerlegung von Ω,
∂Th = {Γ} Menge aller Kanten (bzw. Fl¨achen),
∂ 2 Th = {a}
Menge aller Eckpunkte ( Knoten“), ”
sowie die folgende Symbolik f¨ ur einige typische Knotenwertevorgaben:
Abbildung 3.3: Funktionswerte vh (a) sowie vh (a), ∇vh (a) (links), Normalableitung ∂n vh (m) in Seitenmitten (Mitte), Funktionswerte vh (a), ∇vh (a), ∇2 vh (a) (rechts). Ein Finite-Elemente-Ansatz ist definiert durch Vorgabe eines Polynomraumes P (T ) ⊂ Pr (T ) oder P (T ) ⊂ Qr (T ) auf T ∈ Th sowie eines geeigneten Satzes von Knotenwerten“ (gegeben ” durch lineare Knotenfunktionale“), z.B.: ” {vh (a), vh (m), ∂n vh (m), ∇vh (a), (vh , 1)Γ , (vh , 1)T , . . . }, welcher Polynome aus P (T ) eindeutig bestimmt. Definition 3.1 (Unisolvenz): Ein Polynomraum P (T ) und ein zugeh¨ origer Satz von linearen Knotenfunktionalen“ K(T ) heißen unisolvent“, wenn jedes p ∈ P (T ) eindeutig durch die ” ” Vorgabe von χ(p) f¨ ur alle χ ∈ K(T ) bestimmt ist. Definition 3.2 (Lagrange- und Hermite-Ansatz): Man spricht bei einem FE-Ansatz P (T ) mit zugeh¨ origem Satz von Knotenfunktionalen {χr , r = 1, ..., R} von Lagrange-Elementen“, ” wenn die Knotenfunktionale nur auf Funktionswerte zur¨ uckgreifen; werden auch Ableitungswerte verwendet, spricht man von Hermite10 -Elementen“. ” ´ Charles Hermite (1822-1901): franz¨ osischer Mathematiker; Prof. an der Ecole Polytechnique und der Sorbonne in Paris; Beitr¨ age zur Zahlentheorie und zur Theorie elliptischer Funktionen; Beweis der Transzendenz von e . 10
3.2 Allgemeine Finite-Elemente-Ans¨ atze
89
Notwendig f¨ ur Unisolvenz ist offenbar dim P (T ) = #K(T ) und hinreichend, daß f¨ ur ein p ∈ P (T ) aus χ(p) = 0 f¨ ur alle χ ∈ K(T ) notwendig p ≡ 0 folgt. Dies wird in der Regel zum Nachweis von Unisolvenz verwendet. Definition 3.3 (Interpolation): F¨ ur jede Zelle T ∈ Th sei ein Polynomraum P (T ) mit Dimension R und ein Satz KT = {χr , r = 1, ..., R} von Knotenfunktionalen χr : H m (T ) → R
(r = 1, ..., R),
spezifiziert, welche unisolvent“ sind. Durch die Vorgabe ” χr (Ih v) = χr (v),
r = 1, . . . , R,
ist dann eindeutig eine Finite-Elemente-Interpolierende“ Ih v ∈ P (T ) definiert. ” Durch Zusammensetzen der zun¨ achst zellweise definierten Formfunktionen vT ∈ P (T ) erh¨ alt man global definierte Funktionen vh : Ω → R,
vh|T := vT ,
T ∈ Th ,
mit denen der Finite-Elemente-Ansatzraum Vh gebildet wird. Durch Gleichsetzen geeigneter Knotenwerte auf dem gemeinsamen Rand Γ = T ∩T ′ jeweils benachbarter Zellen wird Stetigkeit, Differenzierbarkeit und auf analogem Wege auch die Randbedingung vh|∂Ω = 0 implementiert. Die Dimension des endlich dimensionalen Teilraumes Vh ⊂ V ist dann gleich der Anzahl der Knotenfunktionalwerte zur eindeutigen Festlegung einer Funktion vh ∈ Vh . Definition 3.4 (Konformit¨ at): Ein Finite-Elemente-Ansatzraum Vh dieser Art heißt H01 ” 1 konform“, wenn Vh ⊂ H0 (Ω), und andernfalls nicht-konform“. ” A) Dreieckselemente im R2 : Als erstes betrachten wir Finite-Elemente-Ans¨atze auf Triangulierungen von Polygongebieten. 1) Konstanter Ansatz: P (T ) = P0 , dim P (T ) = 1 . Mit konstanten Polynomans¨ atzen kann offensichtlich f¨ ur die Variationsgleichung (3.1.2) keine konforme Diskretisierung gewonnen werden. Diese spielen aber bei anderen Typen von variationellen Formulierungen, den sog. dual-gemischten“, eine Rolle ” 2) Linearer Ansatz: P (T ) = P1 , dim P (T ) = 3 .
Der Polynomraum P1 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), i = 1, 2, 3} sind unisolvent, denn f¨ ur p ∈ P1 (T ) mit p(ai ) = 0 gilt notwendig p|∂T ≡ 0 und damit auch p ≡ 0 . Mit dem Ansatz (1)
Vh
= {vh : Ω → R| vh|T ∈ P1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}.
erh¨alt man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] u ¨ ber eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P1 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten von Γ haben.
90
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Einen nicht-konformen Ansatz erh¨ alt man durch (1) V˜h = {vh : Ω → R| vh|T ∈ P1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}.
Die Unisolvenz folgt analog wie die des entsprechenden konformen Ansatzes. Dieses nichtkonforme lineare“ Element spielt z. B. eine Rolle bei der Diskretisierung der Navier-Stokes” Gleichungen in der Str¨ omungsmechanik. 3) Quadratischer Ansatz: P (T ) = P2 , dim P (T ) = 6 . Der Polynomraum P2 (T ) und der Satz von Knotenfunktionalen {χi (p) = p(ai ), ψi (p) = p(mi ), i = 1, 2, 3} sind unisolvent. F¨ ur p ∈ P2 (T ) mit p(ai ) = p(mi ) = 0 gilt notwendig p|∂T ≡ 0 . Dies impliziert, daß ∇p(ai ) = 0 , woraus wegen ∂i p ∈ P1 (T ) wiederum ∇p ≡ 0 und schließlich p ≡ 0 folgt. Mit dem Ansatz (2)
Vh
= {vh : Ω → R| vh|T ∈ P2 , vh stetig in Eckpunkten und Kantenmitten, vh = 0 in solchen Punkten auf ∂Ω}.
erh¨alt man einen H01 -konformen Finite-Elemente-Raum. Denn der Sprung von [vh ] u ¨ ber eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P2 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und dem Mittelpunkt von Γ haben. R Alternativ zu den Werten in den Kantenmitten m kann man auch die −1 Mittelwerte |Γ| ¨ ber Kanten Γ ∈ ∂Th als Knotenwerte verwenden. Γ vh ds u
Der nicht-konforme Ansatz (2) V˜h = {vh : Ω → R| vh|T ∈ P2 , vh stetig in jeweils zwei Gauß-Punkten auf Kanten,
vh = 0 in solchen Punkten auf ∂Ω}
ist nicht unisolvent, denn es existieren nicht-triviale, st¨ uckweise quadratische Funktionen, welche in allen Knotenpunkten verschwinden. Man betrachte dazu auf jeder Kante die LegendrePolynomen L2 zweiten Grades, deren Nullstellen gerade die beiden Gauß-Punkte m1 , m2 sind. Sie k¨onnen wegen ihrer Symmetrie zum Kantenmittelpunkt so normiert werden, daß sie in den Eckpunkten a gleiche Werte L2 (a) = 1 haben. Dann l¨aßt sich eine Funktion L ∈ P2 (T ) finden, durch konforme Interpolation in Eckpunkten und Seitenmitten: L(a) = 1 , L(m) = L2 (m) . Auf jeder Kante ist dann L ≡ L2 , so daß sich ein Widerspruch zur Unisolvenz des Ansatzes ergibt. Eine weitere nicht-konforme Variante des quadratischen Elements (das sog. Morley11 -Platten” element“) erh¨ alt man bei Wahl der Knotenwerte {vh (a), ∂n vh (m)} . Dieser Ansatz ist wieder unisolvent. F¨ ur p ∈ P2 (T ) folgt aus p(ai ) = ∂n p(mi ) = 0, i = 1, 2, 3 , notwendig ∂τ p(mi ) = 0 und somit ∇p(mi ) = 0 . Wegen ∂i p ∈ P1 (T ) folgt ∇p ≡ 0 und damit auch p ≡ 0 . 11
L.S.D. Morley (????-????): englischer Ingenieur; Forscher an der Brunel University in Uxbridge, England; Beitr¨ age zur FEM f¨ ur nichtlineare Schalenmodelle.
3.2 Allgemeine Finite-Elemente-Ans¨ atze
91
Das Morley-Element ist zwar nicht-konform bzgl. der H 1 - wie auch der H 2 -Norm, trotzdem kann es bei geeigneter Modifikation der variationellen Formulierungen, X uh ∈ VhM : (∇2 uh , ∇2 ϕh )T = (f, ϕh ) ∀ϕh ∈ VhM , T ∈Th
sogar zur Approximation des biharmonischen Operators ∆2 u = f verwendet werden.
5) Kubischer Ansatz (sog. kubisches Membran-Element“: P (T ) = P3 , dim P (T ) = 10 . ” Mit dem Ansatz (3)
Vh
={vh : Ω → R| vh|T ∈ P3 , vh stetig in Eckpunkten und in je
zwei Gauß-Punkten auf Kanten, vh = 0 in solchen Punkten auf ∂Th }.
ist H01 -konform. Denn der Sprung von [vh ] u ¨ber eine gemeinsame Kante Γ zweier Dreiecke T1 und T2 ist in P3 (Γ) . Folglich ist vh stetig, da seine Restriktionen auf T1 und T2 gemeinsame Werte in den beiden Endpunkten und zwei Gauß-Punkten auf Γ haben. Alternativ zu den GaußPunkten auf den Kanten kann man auch in jedem Knoten die beiden partiellen Ableitungen, d.h. den Gradienten ∇vh (a) , als Knotenwerte verwenden. Auch damit erh¨alt man einen H01 (3) ¨ (3) konformen Ansatzraum Vˆh ; dieser ist offenbar echt kleiner als Vh (Ubungsaufgabe).
Zur Diskretisierung der biharmonischen Gleichung kann man wieder eine nicht-konforme Variante mit den Knotenwerten {vh (a), ∂n vh (m1 ), ∂n vh (m2 ), vh (z)} ( m1 , m2 zwei Gauß-Punkte auf Γ und z der Mittelpunkt von T ) verwenden. Ein H 2 -konformes Platten-Element erh¨ alt man durch den sog. Clough-Tocher-Ansatz“ als zusammengesetztes“ Element ( vh ∈ C 1 (T ) ” ” st¨ uckweise kubisch).
6) Quartischer Ansatz: P (T ) = P4 (T ) , dim P (T ) = 15 . Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), vh (m1 ), vh (m2 )} (m1 , m2 die beiden Gauߨ Punkte auf jeder Kante Γ ∈ ∂Th ) erh¨ alt man hier einen H 1 -konformen Ansatz (Ubungsaufgabe).
92
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
7) Quintischer Ansatz (sog. Argyris12 -Plattenelement“): P (T ) = P5 (T ) , dim P (T ) = 21 . ” Mit dem Satz von Knotenwerten {vh (a), ∇vh (a), ∇2 vh (a), ∂n vh (m)} erh¨alt man hier sogar einen ¨ H 2 -konformen Ansatz (Ubungsaufgabe). Dieses finite Element ist ein Beispiel f¨ ur einen konformen Ansatz zur L¨ osung der biharmonischen Gleichung ∆2 u = f , f¨ ur welche stetig differenzier¨ bare Uberg¨ ange von Zelle zu Zelle erforderlich sind.
B) Viereckselemente: Als n¨ achstes betrachten wir Finite-Elemente-Ans¨atze auf (kartesischen) Rechteckszerlegungen. 1) Bi-linearer Ansatz: P (T ) = Q1 = span{1, x1 , x2 , x1 x2 } , dim P (T ) = 4 . Der Polynomraum Q1 (T ) und der Satz von Knotenfunktionalewn {χi (p) = p(ai ), i = 1, . . . , 4} sind unisolvent. Ein p ∈ Q1 (T ) ist entlang der Kanten von T linear. Aus p(ai ) = 0 folgt also p|∂T ≡ 0 und weiter ∇p(ai ) = 0 . Wegen ∂i p ∈ P1 (T ) impliziert dies ∇p ≡ 0 und schließlich p ≡ 0 . Der Ansatz (1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Eckpunkten, vh = 0 in Eckpunkten auf ∂Ω}
unge von vh entlang von Kanten linear sind. ist H01 -konform, da die Spr¨
Der naheliegende nicht-konforme Ansatz (1) V˜h = {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Kantenmitten, vh = 0 in Kantenmitten auf ∂Ω}
ist aber i.a. nicht unisolvent, da z.B. die Funktion vh (x1 , x2 ) = x1 x2 in den Kantenmitten des Quadrats T1 = [−1, 1] × [−1, 1] verschwindet. Auf T1 erh¨alt man aber durch P (T ) = span{1, x1 , x2 , x21 − x22 } einen mit den Kantenmitten als Knotenfunktionale unisolventen Ansatz. RAlternativ zu den Funktionswerten in den Seitenmitten kann man auch die Mittelwerte (1) |Γ|−1 Γ vh ds u ¨ber die Kanten als Knotenwerte verwenden. Dies ergibt aber einen von V˜h verschiedenen Ansatzraum. 2) Bi-quadratischer Ansatz: P (T ) = Q2 = span{1, x1 , x2 , x21 , x1 x2 , x22 , x21 x2 , x1 x22 , x21 x22 } , ¨ dim P (T ) = 9 . Die Konstruktion eines zul¨assigen“ Satzes von Knotenwerten ist Ubung. ” 3) Reduzierter bi-quadratischer Ansatz (sog. Wilson13 -Membran-Element“): ” P (T ) = P2 (T ) ⊕ span{x21 x2 , x1 x22 } , dim P (T ) = 8 . Dieser Ansatz wird mit den Knotenwerten 12
John Argyris (1916-2004): deutscher Bauingenieur; Prof. in Stuttgart; einer der Erfinder“ der Finite” Elemente-Methode. 13 E.L. Wilson (????-????): amerikanischer Ingenieur; Publ.: K. Bathe, E.L Wilson: Numerical Methods in Finite Element Analysis, Prentice-Hall, New Jersey, 1976.
3.2 Allgemeine Finite-Elemente-Ans¨ atze
93
{vh (a), vh (m)} H 1 -konform.
4) Bi-kubischer Ansatz: P (T ) = Q3 = span{1, x1 , x2 , x21 , ..., x31 x32 } , dim P (T ) = 16 . ¨ Die Konstruktion eines zul¨ assigen“ Satzes von Knotenwerten wird als Ubung gestellt. ” 5) Reduzierter bi-kubischer Ansatz (sog. Adini14 -Platten-Element“): ” P (T ) = P3 (T ) ⊕ span{x31 x2 , x1 x32 } , dim P (T ) = 12 . Dieser Ansatz wird mit den Knotenwerten {vh (a), ∇vh (a)} unisolvent und H 1 -konform, ist aber nicht H 2 -konform.
Viele der aufgef¨ uhrten zwei-dimensionalen Finite-Elemente-Ans¨atzen haben nat¨ urliche Erweiterungen auf drei Dimensionen. Die gebr¨auchlichsten Beispiele sind: 1) Lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
2) Nicht-konf., lineares Tetraederelement: P (T ) = span{1, x1 , x2 , x3 }, dim P (T ) = 4 . Mit den Funktionswerten in den Fl¨ achenmitten als Knotenwerte ist dieser Ansatz unisolvent, aber nicht-konform. 3) Quadratisches Tetraederelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x21 , x22 , x23 } , dim P (T ) = 10 . Mit den Funktionswerten in den Ecken und den Kantenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
4) Kubisches Tetraederelement: P (T ) = P3 , dim P (T ) = 20 . Mit den Funktionswerten in den Ecken, in zwei Gauß-Punkten auf den Kanten und in den Seitenmitten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. 14
A. Adini (????-????): ????
94
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
5) Tri-lineares Quaderelement: P (T ) = span{1, x1 , x2 , x3 , x1 x2 , x1 x3 , x2 x3 , x1 x2 x3 }, dim P (T ) = 8 . Mit den Funktionswerten in den Eckpunkten als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform.
Ein zugeh¨origes nicht-konformes Quaderelement erh¨alt man durch den Ansatz P (T ) = span{1, x1 , x2 , x3 , x21 − x22 , x21 − x23 }, dim P (T ) = 6 . Mit den Funktionswerten in den Fl¨achenmitten als Knotenwerte ist dieser Ansatz unisolvent. 6) Tri-quadratisches Quaderelement: P (T ) = span{1, x1 , x2 , x3 , ..., x21 x22 x23 }, dim P (T ) = 27 . Mit den Funktionswerten in den Eckpunkten, den Kantenmitten, den Seitenmitten und dem Mittelpunkt als Knotenwerte ist dieser Ansatz unisolvent und H 1 -konform. In allgemeinen Situationen k¨ onnen die Zellen bzgl. des Koordinatensystems gedreht oder gezerrt werden. Daraus folgt, daß es F¨alle gibt, in denen man f¨ ur zwei Zellen der Zerlegung Th nicht denselben Ansatz nehmen kann (z.B. das bi-lineare Viereckselement). Deshalb m¨ ussen wir uns bei der Definition von Finite-Elemente-Ans¨atzen von dem festen Koordinatensystem befreien. Dies induziert die Idee des Referenzelements“. Wir verwenden als Referenzelement ” ein nat¨ urliches Einheitselement Tˆ (Einheitsdreieck, Einheitsviereck, ...) und definieren zun¨achst einen Polynomansatz Pˆ (Tˆ) auf diesem Referenzelement. Sei σT eine (polynomiale) Transformation des Referenzelements auf das ( physikalische“) ” Element mit der Inversen σT−1 : T → Tˆ . Der Ansatz auf der Zelle T ist dann gegeben durch P (T ) := {vh : T → R| vh (σT (·)) ∈ Pˆ (Tˆ)}.
(3.2.50)
Der Funktionenraum P (T ) ist nicht notwendig ein Raum von Polynomen, auch wenn Pˆ (Tˆ) ein solcher ist. Dies liegt daran, daß im Allg. die inverse Abbildung σT−1 und damit die Funktion vh (x) = vh (σ(σ −1 (·))) nicht polynomial ist, z.B. im Fall (echt) bilinearer Abbildungen σT . Wenn man T aus Tˆ durch eine Verschiebung, eine Rotation, eine Scherung und eine Skalierung gewinnen kann, so ist σT eine affin-lineare Transformation: σT (ˆ x) = BT x ˆ + bT mit einer Matrix BT ∈ Rd×d und einem Verschiebungsvektor bT ∈ Rd . Dies ist m¨oglich bei Dreiecken (in 2-D) bzw. Tetraedern (in 3-D) sowie bei Parallelogrammen (in 2-D) bzw. Parallelepipeden (in 3-D). F¨ ur allgemeine (konvexe) Vierecke (in 2-D) oder Hexaeder (in 3-D) ben¨otigt man f¨ ur die Transformation echt bi- bzw. tri-lineare Abbildungen. Wir gehen nun zum allgemeinen d-dimensionalen Fall u ¨ber und betrachten Zerlegungen Th =
3.2 Allgemeine Finite-Elemente-Ans¨ atze
95
{T } eines Gebiets Ω ⊂ Rd in d-Simplizes. Dabei ist ein (nicht degeneriertes) Simplex T ⊂ Rd die konvexe lineare H¨ ulle von d + 1 linear unabh¨ angigen Punkten ai ∈ Rd , i = 0, ..., d: n
d
T = x∈R |x=
d X
i
λi a ,
d X i=0
i=0
o λi = 1, 0 ≤ λi ≤ 1 .
(3.2.51)
Das System {ai , i = 0, ..., d} heißt linear unabh¨angig, wenn die erzeugenden Vektoren {wi = ai − a0 , i = 1, ..., n} eine Basis des Rd bilden. Die einfachsten Beispiele sind wieder Dreiecke f¨ ur d = 2 und Tetraeder f¨ ur d = 3 . Sei Tˆ das Einheitssimplex im Rd , welches von den Punkten e0 := 0 , ei = (δ1i , ..., δdi )T , i = 1, ..., d , aufgespannt wird. Hilfssatz 3.2 (Referenztransformation): Jedes (nicht degenerierte) Simplex T ⊂ Rd l¨ aßt sich mittels einer umkehrbaren affinen Abbildung x = σT (ˆ x) := BT x ˆ + bT ,
BT ∈ Rd×d , bT ∈ Rd ,
(3.2.52)
aus dem Einheitssimplex Tˆ gewinnen: T = BT Tˆ + bT . Dabei ist die Umkehrabbildung gegeben durch x ˆ = σT−1 (x) = BT−1 x−BT−1 bT . Beweis: Wir lassen im folgenden den Zusatz T weg. Sei A ∈ Rd×d die regul¨are Matrix, welche die Basis {wi = ai − a0 , i = 1, ..., d} auf die kartesische Einheitsbasis {ei , i = 1, ..., d} abbildet: ei = Awi , i = 1, ..., d . Man gewinnt ihre Elemente aνµ als L¨osungen der Gleichungssysteme n X
aνµ wµi = eiν ,
i = 1, ..., d ,
µ=1
f¨ ur ν = 1, ..., d. Die Koeffizientenmatrix (wµi )di,µ=1 enth¨alt die linear unabh¨angigen Vektoren wi , i = 1, ..., d, als Zeilenvektoren und ist folglich regul¨ar. Die affine Abbildung x ˆ = Ax − Aa0 ˆ ist dann umkehrbar und bildet das ur x = P Pd Simplex T auf das Einheitssimplex T ab, denn f¨ d i ∈ T ist (Man beachte λ a λ = 1 .) i=0 i i=1 i Ax − Aa0 = und umgekehrt f¨ ur x ˆ= A−1 x ˆ + a0 =
Pd
d X i=0
i i=0 λi e
d X i=0
λi A(ai − a0 ) =
d X
λi ei ∈ Tˆ,
d X
λi ai + (1 −
i=0
∈ Tˆ
λi A−1 ei + a0 =
d X i=0
λi wi + a0 =
i=0
Dies komplettiert den Beweis mit BT := A−1 und bT := a0 .
d X i=1
λi )a0 ∈ T . Q.E.D.
Bemerkung 3.5: Zu Hilfssatz 3.2 gibt es ein Analogon f¨ ur Vierecks-Zerlegungen im R2 sowie 3 Hexaeder-Zerlegungen im R . Zu jedem konvexen Viereck T ∈ R2 oder Hexaeder T ∈ R3 ( 6-Fl¨achner“) existieren bi- bzw. tri-lineare Abbildungen σT : Tˆ → T des Einheitsquadrats ” bzw. Einheitsw¨ urfels Tˆ auf T . Dabei werden die Eckpunkte von Tˆ auf die Eckpunkte von T sowie die Kanten bzw. Seitenfl¨ achen von Tˆ auf die Kanten bzw. Seitenfl¨achen von T abgebildet (jeweils in derselben Orientierung).
96
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Die Erzeugung von Finite-Elemente-Ans¨atzen u ¨ber Transformation von einem Referenzelement hat auch den Zweck, auf allgemeinen Vierecks- oder Hexaeder-Zerlegungen konforme Ans¨atze zu gewinnen. Wir wollen das anhand des bilinearen Ansatzes diskutieren: (1)
Vh
= {vh : Ω → R| vh|T ∈ Q1 , vh stetig in Knoten, vh = 0 in Knoten auf ∂Ω}.
Wir betrachten allgemeine Vierecke T und T ′ , die eine gemeinsame Kante Γ haben, und setzen P (T ) = P1 ⊕ span{x1 x2 }. Der Sprung von vh ist zwar gleich Null in den Endpunkten von Γ , doch ist er im Allg. nicht linear auf Γ , so daß die Stetigkeit u ur ¨ ber Γ nicht gesichert ist. Hierf¨ (1) muß erreicht werden, daß die Restriktion von vh ∈ Vh auf alle Kanten Γ ∈ ∂Th linear ist. (1) Dies kann durch Konstruktion von Vh mit Hilfe der bilinearen Transformationen σT : Tˆ → T erreicht werden. F¨ ur eine bi-lineare Transformation σT : Tˆ → T ist die Inverse σT−1 : T → Tˆ i.a. nicht bi-linear. In diesem Fall ist der gem¨ aß (3.2.50) erzeugte lokale Ansatzraum P (T ) auch kein Polynomraum. Dennoch ist v|Γ auf jeder Kante Γ ∈ ∂Th linear, so daß Stetigkeit in allen Eckpunkten auch automatisch globale Stetigkeit auf Ω sowie v|∂Ω = 0 garantiert. Dieser Transformationsansatz l¨ost also das Problem mit der globalen Stetigkeit. Definition 3.5 (Parametrischer Ansatz): Der Ansatz P (T ) wird parametrisch“ genannt, ” wenn er durch Transformationen σT : Tˆ → T von einem Referenzelement Tˆ erzeugt wird. Er heißt isoparametrisch“, wenn die Transformation σT vom selben Polynomtyp wie die Ansatz” funktionen in Pˆ (Tˆ) ist. Der Begriff des isoparametrischen“ Finite-Element-Ansatzes l¨aßt sich auf h¨oheren Polynomgrad ” r≥2 u ¨bertragen. Dies wird wichtig bei der Approximation eines krummen Randes bei Verwendung von Ans¨ atzen h¨ oherer Ordnung. (siehe Bild mit quadratischer“ Randapproximitation). ” Die einfache Polygonzugapproximation w¨ urde hier zu einer Ordnungsreduktion f¨ uhren: k∇(u − uh )k ≤ c hr kukr + hkuk2 , im Gegensatz zur optimalen Absch¨ atzung
k∇(u − uh )k ≤ chr kukr .
3.3 Interpolation mit finiten Elementen
97
3.3 Interpolation mit finiten Elementen Dieser Abschnitt ist dem grundlegenden Aspekt bei der mathematischen Analyse der Methode der finiten Elemente gewidmet: Wie gut lassen sich hinreichend glatte Funktionen durch st¨ uckweise polynomiale approximieren? Wir gehen von der im vorigen Abschnitt anhand von Beispielen beschriebenen abstrakten Situation aus. Sei T ⊂ Rd eine Zelle eines Finite-Elemente-Gitters Th ; der Durchmesser von T wird wieder mit diam(T ) = hT und der Radius einer (maximalen) einbeschriebenen Kugel mit ρT bezeichnet. Wir betrachten im folgenden ausschließlich parametrische“ Finite-Elemente-Ans¨atze. Jedes ” ˆ≈1 T ∈ Th sei Bild eines Referenz-Einheitselements“ Tˆ ⊂ Rd mit Durchmesser diam(Tˆ) = h ” ˆ und Inkugelradius ρˆ > 0. Die zugeh¨ origen Abbildungen σT : T → T seien der Einfachheit halber als affin-linear angenommen: BT ∈ Rd×d , bT ∈ Rd .
x = σT (ˆ x) = BT x ˆ + bT ,
(3.3.53)
Der Fall allgemeiner Vierecke mit erzeugenden bilinearen Transformationen wird gegebenenfalls in Bemerkungen ber¨ ucksichtigt werden. Allgemeine Interpolationsaufgabe: Auf einem beliebigen, aber festen Element T (z.B. dem Einheitselement Tˆ ) seien ein Vektorraum P (T ) von Polynomen u ¨ ber T mit dim P (T ) = R sowie ein System von linearen Knotenfunktionalen“ KT = {χr , r = 1, ..., R} gegeben, so daß ” die folgenden Bedingungen erf¨ ullt sind: (i) Der Ansatz ist unisolvent: q ∈ P (T ) : χr (q) = 0 (r = 1, ..., R)
⇒
q = 0.
(3.3.54)
(ii) F¨ ur ein m ≥ 1 gilt Pm−1 ⊂ P (T ) .
(iii) Die Knotenfunktionale aus KT sind stetig auf H m (T ) : |χr (v)| ≤ cb kvkm;T ,
v ∈ H m (T ), r = 1, ..., R.
(3.3.55)
Unter der Bedingung (i) ist die zugeh¨orige Lagrangesche bzw. Hermitesche Interpolationsaufgabe eindeutig l¨ osbar, d.h: Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes Interpolationspolynom“ IT v ∈ P (T ) mit den Eigenschaften ” χr (IT v) = χr (v),
r = 1, ..., R.
Wenn die Knotenfunktionale zu singul¨ar“ sind, um f¨ ur Funktionen aus H m (Ω) definiert zu ” m−1 sein (z.B. die Ableitung ∂n v(m) in einer Seitenmitte m ∈ ∂T ), kann auch ein st¨arkerer Sobolew-Raum H m,p (Ω) mit p > d verwendet werden. Wir werden diesen Fall hier aber nicht weiter verfolgen. Notation: Im folgenden verwenden wir eine gebr¨auchliche Multiindex“-Schreibweise f¨ ur mehr” fach indizierte Gr¨ oßen. F¨ ur einen Indexvektor α = (α1 , ..., αd )T ∈ Zd mit ganzzahligen, nichtnegativen Komponenten setzen wir |α| :=
d X i=1
αi ,
xα :=
d Y i=1
xαi i ,
Dα :=
d Y i=1
∂iαi ,
o n X Pk = q(x) = aα xα . |α|≤k
98
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Mit dieser Notation schreiben sich z.B. die Sobolew-Normen bzw. -Halbnormen u ¨ ber T in der Form 1/2 1/2 X X . kD α vk2T , |v|m;T = kD α vk2T kvkm;T = |α|=m
0≤|α|≤m
Wir leiten nun eine Reihe von technischen Hilfss¨atzen ab, die am Schluß zu den gew¨ unschten allgemeinen Absch¨ atzungen f¨ ur den Interpolationsfehler bei Finite-Elemente-Ans¨atze f¨ uhren werden. Die dabei verwendete Schlußweise geht in diesem Zusammenhang auf Bramble und Hilbert (1971) zur¨ uck, weswegen die ganze Theorie auch Bramble-Hilbert-Theorie“ und das ” Hauptresultat Bramble-Hilbert-Lemma“ genannt werden. ” Hilfssatz 3.3 (Nullraum von Ableitungsoperatoren): Jede Funktion v ∈ H m (T ) mit der Eigenschaft Dα v = 0 ,
|α| = m,
(3.3.56)
ist fast ¨ uberall gleich einem Polynom aus Pm−1 (T ) . T k Beweis: Aus den Voraussetzungen folgt D β Dα v ≡ 0 f¨ ur beliebiges β und somit v ∈ ∞ k=1 H (T ) . m Nach dem Sobolewschen Einbettungssatz ist damit v ∈ C (T ), so daß sich die Behauptung mit Hilfe klassischer“ Argumente ergibt. Q.E.D. ” Hilfssatz 3.4 (Polynomprojektion): Zu jeder Funktion v ∈ H m (T ) existiert ein eindeutig bestimmtes Polynom q ∈ Pm−1 (T ) mit der Eigenschaft Z D α (v − q) dx = 0 , 0 ≤ |α| ≤ m − 1 . (3.3.57) T
Beweis: Zur L¨ osung der Aufgabe machen wir den Ansatz X q(x) := ξ β xβ ∈ Pm−1 (T ) |β|≤m−1
mit unbekannten Koeffizienten ξ = (ξ β )|β|≤m−1 (bei lexikographischer Anordnung der Indexkomponenten). Dies f¨ uhrt auf das quadratische, lineare Gleichungssystem Z Z X β α β D α v dx , 0 ≤ |α| ≤ m − 1. ξ D x dx = T
T
0≤|β|≤m−1
Dessen Koeffizientenmatrix M=
Z
D α xβ dx T
0≤|α|,|β|≤m−1
ist regul¨ar. Andernfalls g¨ abe es ein ξ = (ξ β )|β|≤m−1 mit M ξ = 0 . Das damit gebildete Polynom P q(x) = 0≤|β|≤m−1 ξ β xβ ∈ Pm−1 (T ) h¨ atte dann die Eigenschaft Z
D α q dx = 0 ,
T
0 ≤ |α| ≤ m − 1 ,
(3.3.58)
3.3 Interpolation mit finiten Elementen
99
woraus offensichtlich q ≡ 0 und damit der Widerspruch ξ ≡ 0 folgte. Also existiert ein eindeutig bestimmtes Polynom mit den verlangten Eigenschaften. Q.E.D.
Hilfssatz 3.5 (Verallg. Poincar´ esche Ungleichung): F¨ ur jede Funktion v ∈ H m (T ) mit der Eigenschaft Z Dα v dx = 0 , 0 ≤ |α| ≤ m − 1 , (3.3.59) T
gilt mit einer Konstante c0 = c(d, m, T ) kvkm;T ≤ c0 |v|m;T .
(3.3.60)
Beweis: Angenommen, die Behauptung w¨are falsch. Dann existierte eine Folge von Funktionen vk ∈ H m (T ) , k ∈ N mit den Eigenschaften 1 = kvk km;T ≥ k|vk |m;T ,
k ∈ N.
(3.3.61)
Aufgrund der Kompaktheit der Einbettung von H m (T ) in H m−1 (T ) konvergiert eine Teilfolge, welche wir wieder mit (vk )k∈N bezeichnen, in H m−1 (T ) gegen ein v ∈ H m−1 (T ): kvk − vkm−1;T → 0 (k → ∞).
(3.3.62)
Mit der Annahme folgt |vk |m;T → 0 (k → ∞) . Also ist (vk )k∈N Cauchy-Folge in H m (Ω) mit Limes v˜ ∈ H m (T ) . Wegen vk →H m−1 v muß v˜ = v sein. Damit folgt |v|m;T = 0. Nach Hilfssatz 3.3 ist also v ∈ Pm−1 (T ) und besitzt die Eigenschaft Z Z α D α vk dx = 0 , 0 ≤ |α| ≤ m − 1 . (3.3.63) D v dx = lim T
k→∞ T
Dies bedeutet aber wegen Hilfssatz 3.4 notwendig v ≡ 0, was im Widerspruch zur Annahme kvkm;T = limk→∞ kvk km;T = 1 steht. Q.E.D. Nach diesen Vorbereitungen k¨ onnen wir das zentrale Resultat dieses Abschnitts, das sog. 15 16 Bramble -Hilbert -Lemma, beweisen. Satz 3.5 (Bramble-Hilbert-Lemma): Sei F (·) : H m (T ) → R ein beschr¨ anktes, sublineares Funktional, welches auf Pm−1 (T ) verschwindet, d.h.: (i) (ii) (iii) 15
|F (v)| ≤ c1 kvkm;T
(Beschr¨anktkeit),
|F (u + v)| ≤ c2 {|F (u)| + |F (v)|} F (q) = 0,
q ∈ Pm−1 (T )
(Sublinearit¨ at),
(Annulierungseigenschaft).
James H. Bramble (1932-): US-amerikanischer Mathematiker: Prof. an der Cornell University und der Texas A&M University; fundamentale Beitr¨ age zur Theorie der Finite-Elemente-Methode und von Iterationsverfahren, insbesondere Mehrgitterverfahrens. 16 Stephen Hilbert (????-): US-amerikanischer Mathematiker: Prof. am Ithaca College, New York; bekannt durch das sog. “Bramble-Hilbert-Lemma”.
100
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Dann gilt mit der Konstante c0 aus Hilfssatz 3.5: |F (v)| ≤ c0 c1 c2 |v|m;T ,
v ∈ H m (T ).
(3.3.64)
Beweis: F¨ ur ein v ∈ H m (T ) gilt mit beliebigem q ∈ Pm−1 (T ) : |F (v)| = |F (v − q + q)| ≤ c2 {|F (v − q)| + |F (q)|} ≤ c1 c2 kv − qkm;T . Wir w¨ahlen nun q ∈ Pm−1 (T ) als das gem¨aß Hilfssatz 3.4 zu v geh¨orende Polynom, so daß gem¨aß Hilfssatz 3.5 folgt: kv − qkm;T ≤ c0 |v − q|m;T = c0 |v|m;T . Dies impliziert dann |F (v)| ≤ c3 |v|m;T , mit c3 := c0 c1 c2 , was zu beweisen war.
Q.E.D.
Korollar 3.1 (Allg. Interpolationssatz): Seien die obigen Voraussetzungen erf¨ ullt. F¨ ur jede Funktion v ∈ H m (T ) und das zugeh¨orige interpolierende Polynom IT v ∈ P (T ) gilt bzgl. einer beliebigen stetigen Halbnorm | · | auf H m (T ): |v − IT v| ≤ c |v|m;T
(3.3.65)
mit einer Konstante c = c(d, m, R, T, | · |). Beweis: O.B.d.A. sei |v| ≤ kvkm;T , v ∈ H m (T ) . Durch F (v) := |v − IT v| wird auf H m (T ) ein sublineares Funktional definiert. Die Interpolierende IT v besitzt die Darstellung IT v =
R X
χr (v)ϕ(r)
r=1
mit der durch die Bedingung χr (ϕ(s) ) = δrs , (r, s = 1, ..., R) eindeutig bestimmten verallgemeinerten Lagrange-Basis {ϕ(r) , r = 1, ..., R} des Polynomraums P (T ) . Wegen der Beschr¨anktheit der Knotenfunktionale χr folgt |F (v)| ≤ |v| + |IT v| ≤ |v| +
R X r=1
|χr (v)| |ϕ(r) | ≤ (1 + Rcb max |ϕ(r) |) kvkm;T , r=1,...,R
und damit die Beschr¨ anktheit von F (·) . Wegen IT q = q f¨ ur q ∈ P (T ) gilt weiter F (q) = 0,
q ∈ Pm (T ).
Aus Satz 3.5 folgt damit die behauptete Absch¨atzung.
Q.E.D.
Beispiele von Halbnormen, f¨ ur die das obige Resultat angewendet wird, sind etwa: 1. L2 -Norm u ¨ber T : |v − IT v| :=
Z
T
|v − IT v|2 dx
1/2
.
3.3 Interpolation mit finiten Elementen
101
2. L2 -Norm u ¨ber den Rand ∂T : |v − IT v| :=
Z
∂T
|v − IT v|2 dx
1/2
.
3. Mittelwert u ¨ber eine Kante Γ ⊂ ∂T :
Z |v − IT v| := (v − IT v) dx . Γ
4. Maximum-Norm u ¨ber T :
|v − IT v| := max |v − IT v|. T
5. Wert in einem Punkt P ∈ Ω : |v − IT v| := |(v − IT v)(P )|. Als n¨achstes greifen wir nun unser eigentliches Problem an, n¨amlich den Interpolationsfehler auf den einzelnen Zellen T der Zerlegung Th abzusch¨atzen. Wir tun dies f¨ ur den representativen Spezialfall der klassischen Lagrange/Hermite-Interpolation, bei der die Knotenfunktionale χr als Punktfunktionale f¨ ur Funktionswerte sowie Ableitungswerte in gewissen Knotenpunkten a ˆr ∈ ˆ T (r = 1, ..., R) gegeben sind. Sei Tˆ das Referenzelement der Gr¨oße ˆh := diam(Tˆ) = 1 und Inkreisradius ρˆ > 0 . F¨ ur eine einzelne Zelle T ∈ Th bezeichnen wir mit ar = Bˆ ar + b die aus den St¨ utzstellen a ˆr ∈ Tˆ durch Anwendung der Transformation σ(ˆ x) = B x ˆ + b erzeugten Punkte ar ∈ T . Entsprechend seien hT := diam(T ) sowie ρT > 0 der Inkreisradius von T . Die Umkehrabbildung σ −1 : T → Tˆ (−1) hat die Darstellung σ −1 (x) = B −1 x − B −1 b mit der inversen Matrix B −1 = (bij )di,j=1 . Unter Verwendung dieser Abbildung x = σ(ˆ x) werden f¨ ur Funktionen v : T → R und w ˆ : Tˆ → R ˆ zugeh¨orige Funktionen vˆ : T → R und w : T → R definiert durch vˆ(ˆ x) := v(x),
w(x) := w(ˆ ˆ x).
(3.3.66)
Entsprechend lassen sich die partiellen Ableitungen nach x ˆ und x durch die jeweils anderen ausdr¨ ucken: d d X X (−1) bij ∂ˆj . bij ∂j , ∂i := ∂ˆi := j=1
j=1
Wir nehmen an, daß der Polynomansatz Pˆ (Tˆ ) unisolvent ist mit einem Satz von Knotenfunktioˆ r vˆ(ˆ nalen der Form D ar ), r = 1, ..., R , wobei die Punkte a ˆr auch mehrfach auftreten k¨onnen und ˆ r = ∂ˆαr mit geeigneten Multiindizes αr = (αr , ..., αr ) die Ableitungsoperatoren die Gestalt D i d haben. Der Ansatzraum Pˆ (Tˆ) habe die Lagrange-Basis {ϕˆr , r = 1, . . . , R} , d.h.: ˆ r ϕˆs (ˆ D ar ) = δrs . ˆ r auf H m (Tˆ) wohl definiert und Wir nehmen weiter an, daß alle auftretenden Ableitungen D stetig sind: ˆ r vˆ(ˆ |D ar )| ≤ c kˆ v km;Tˆ , vˆ ∈ H m (Tˆ). Die lokalen Polynomr¨ aume P (T ) werden wieder erzeugt via Koordinatentransformation aus
102
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
dem Ansatzraum Pˆ (Tˆ) auf dem Referenzelement: P (T ) := {q : T → R| q(σ(·)) ∈ Pˆ (Tˆ)}. Dasselbe gilt f¨ ur die zugeh¨ origen Basen {ϕ(r) , r = 1, ..., R} von P (T ) ϕr (x) := ϕˆr (σ −1 (x)) ,
x ∈ T.
F¨ ur Funktionen v ∈ H m (Ω) erh¨ alt man dann durch Setzung IT v :=
R X s=1
ˆ s vˆ(ˆ D as )ϕs ∈ P (T )
eine zellweise Lagrange/Hermite-Interpolierende IT v ∈ P (T ) mit den Eigenschaften (Man beˆ r ϕˆs (ˆ achte D ar ) = δrs .): ˆ r IT v(ar ) = D
R X
ˆ s vˆ(ˆ ˆ r ϕs (ar ) = D as )D
s=1
R X
ˆ s vˆ(ˆ ˆ r ϕˆs (ˆ D as )D ar )
s=1
ˆ r vˆ(ˆ ˆ r v(ar ), =D ar ) = D
r = 1, ..., R.
ˆ r l¨aßt sich dies gegebenenfalls auch als eine InterpoJe nach Art der Ableitungsoperatoren D lation mit lokal auf den Einzelzellen T definierten Ableitungsoperatoren Dr bzgl. der (physikalischen) Variablen x ausdr¨ ucken; z.B. in den einfachsten F¨allen Dr v(ar ) := v(ar ) bzw. Dr v(ar ) ≈ ∇v(ar ) . Wir beweisen nun den Hauptsatz dieses Abschnittes zur Lagrange/Hermite-Interpolation. Satz 3.6 (Spez. Interpolationssatz): F¨ ur jedes v ∈ H m (T ) und die zugeh¨ orige LagrangeHermite-Interpolierende IT v ∈ P (T ) auf der Zelle T ∈ Th gilt: |v − IT v|k;T ≤ cI
hm T |v|m;T , ρkT
0 ≤ k ≤ m,
(3.3.67)
mit Durchmesser und Inkreisradius hT bzw. ρT von T und einer Konstante cI = cI (d, m, Tˆ) . Beweis: (i) F¨ ur eine Funktion f ∈ L1 (T ) bezeichnet fˆ ∈ L1 (Tˆ) die zugeh¨orige Transformierte fˆ(ˆ x) := f (x),
x ˆ = σ −1 (x) = B −1 x − B −1 b ∈ Tˆ.
Die Transformation σ −1 hat die Funktionalmatrix ∇σ −1 = B −1 , so daß gilt: Z Z Z f (x) dx . fˆ(ˆ x) dˆ x = | det B −1 | fˆ(σ −1 (x)) dx = | det B|−1 Tˆ
T
(3.3.68)
(3.3.69)
T
(−1)
Wir sch¨atzen nun die Elemente bij sowie bij der Matrizen B und B −1 ab. Jedes x ∈ Rd mit |x| = ρ gestattet mit zwei Punkten ξ, η ∈ T die Darstellung x = ξ − η, wobei ξ etwa als Mittelpunkt der Inkugel von T gew¨ahlt werden kann. Dann sind ξˆ = B −1 ξ − B −1 b, ηˆ = B −1 η − B −1 b ∈ Tˆ, und wir erhalten ˆ |B −1 x| = |B −1 ξ − B −1 b − B −1 η + B −1 b| = |ξˆ − ηˆ| ≤ h.
(3.3.70)
3.3 Interpolation mit finiten Elementen
103
aquivalent sind, gilt mit einer Konstante c = c(d) Da alle Matrizennormen auf Rd×d ¨ max
(−1)
i,j=1,...,d
|bij
| ≤ c sup
x∈Rd
ˆ |B −1 x| |B −1 x| h = c sup ≤c . |x| |x| ρ |x|=ρ
(3.3.71)
Analog wird bewiesen: max
i,j=1,...,d
|bij | ≤ c
h . ρˆ
(3.3.72)
(ii) Es seien nun T ∈ Th sowie v ∈ H m (T ) beliebig gegeben. Es ist IT v ∈ P (T ) die Interpolierende von v auf T und ITˆ vˆ(·) = IT v(σ(·)) ∈ P (Tˆ)
(3.3.73)
die Interpolierende der Transformierten vˆ ∈ H m (Tˆ) auf Tˆ. Nach Satz 3.1 gilt auf Tˆ : |ˆ v − ITˆ vˆ|k;Tˆ ≤ cˆ |ˆ v |m;Tˆ ,
0 ≤ k ≤ m,
(3.3.74)
mit einer festen Konstante cˆ = cˆ(d, m, Tˆ) . Durch Koordinatentransformation zwischen Tˆ und T werden wir nun zeigen, daß |v − IT v|k;T ≤
c | det B|1/2 |ˆ v − ITˆ vˆ|k;Tˆ , ρk
|ˆ v |m;Tˆ ≤ c hm | det B|−1/2 |v|m;T , mit Konstanten c = c(d, m, Tˆ). Diese beiden Beziehungen ergeben dann zusammen mit (3.3.74) die Behauptung. (iii) F¨ ur die Ableitungen von v bzw. vˆ gilt mit x ˆ = σ −1 (x) = B −1 x − B −1 b : ∂c x) = ∂i v(x) = ∂i vˆ(σ −1 (x)) = i v(ˆ
∂ˆi vˆ(ˆ x) = ∂ˆi v(σ(ˆ x)) =
d X
d X
|∂c x)| ≤ c i v(ˆ
d X
∂j v(x) ∂ˆi σj (ˆ x) =
d X
∂j v(x)bji =
d X j=1
j=1
ˆ h max |∂ˆj vˆ(ˆ x)| ρ j=1,...,d
(−1) ∂ˆj vˆ(ˆ x) bji ,
j=1
j=1
j=1
und folglich
∂ˆj vˆ(ˆ x) ∂i σj−1 (x) =
|∂ˆi vˆ(ˆ x)| ≤ c
d ∂j v(ˆ x)bji ,
h max |d ∂j v(ˆ x)|. ρˆ j=1,...,d
ˆ α der Ordnung k = |α| gewinnen wir durch k-malige F¨ ur allgemeine Ableitungen D α bzw. D Anwendung dieser Beziehungen: α v(ˆ d |D x)| ≤ c
ˆ α vˆ(ˆ |D x)| ≤ c
(−1) |α|
|bij
max
d β v(ˆ |bij ||α| max |D x)| ≤ c
i,j=1,...,d
i,j=1,...,d
|
ˆ β vˆ(ˆ max |D x)| ≤ c
max
|β|=|α|
|β|=|α|
h ˆ |α|
ρ h |α| ρˆ
ˆ β vˆ(ˆ max |D x)|,
|β|=|α|
d β v(ˆ max |D x)| .
|β|=|α|
104
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Mit Hilfe dieser Absch¨ atzungen und der Substitutionsformel (3.3.69) folgt nun Z Z α 2 α v(ˆ d |D v(x)| dx = | det B| |D x)|2 dˆ x Tˆ
T
Z h ˆ 2|α| ˆ β vˆ(ˆ max |D x)|2 dˆ x ≤ c | det B| ρ |β|=|α| Tˆ Z Z h 2|α| α 2 d β v(ˆ ˆ max |D x)|2 dˆ x |D vˆ(ˆ x)| dˆ x≤c ρˆ |β|=|α| Tˆ Tˆ Z h 2|α| |D β v(x)|2 dx . ≤ c | det B|−1 max ρˆ |β|=|α| T
Damit ist f¨ ur 0 ≤ k ≤ m bewiesen: |v|k;T ≤ c | det B|1/2
h ˆ k ρ
|ˆ v |k;Tˆ ,
|ˆ v |k;T ≤ c | det B|−1/2
h k ρˆ
|v|k;T .
Anwendung dieser Beziehungen f¨ ur v und v − IT v ergibt schließlich wegen 0 < ρ ≤ h ≤ 1 die behauptete Absch¨ atzungen (3.3.67). Q.E.D. Bemerkung 3.6: Die Fehlerabsch¨ atzung (3.3.67) f¨ ur die Polynominterpolation hat nat¨ urliche Verallgemeinerungen auf andere Halbnormen | · |T sowie auf andere Regularit¨atsstufen v ∈ H m,p (T ) , 1 ≤ p ≤ ∞ . Wir geben ohne Beweis das folgende allgemeine Resultat an: m−d/p
|v − IT v|k,q;T ≤ ci
hT
k−d/q
ρT
|v|m,p;T ,
(3.3.75)
f¨ ur 0 ≤ k ≤ m, 1 ≤ p ≤ q ≤ ∞ , mit einer Konstante ci = ci (d, k, m, p, q, Tˆ) . F¨ ur sp¨atere Zwecke sind hiervon insbesondere die F¨alle p = q = 1 (f¨ ur m ≥ 2) , p = q = ∞ sowie p = 2, q = ∞ (f¨ ur k ≤ m + 2) von Interesse. Z.B. gilt f¨ ur d = 2, m = 2, q = ∞, p = 2 : max |v − IT v| ≤ ci hT |v|2,2;T . T
(3.3.76)
Auf ¨ahnliche Art wie im Beweis von Satz 3.6 gewinnt man durch Transformation auf das ur finite Elemente: Einheitselement Tˆ die folgende sog. inverse Beziehung“ f¨ ” Satz 3.7 (Inverse Beziehung): Unter den obigen Voraussetzungen gilt auf jeder Zelle T ∈ Th f¨ ur Finite-Elemente-Funktionen v ∈ P (T ) mit einer Konstante c = c(d, ρT , k, s): |v|k;T ≤ c
hsT |v|s;T , ρkT
0 ≤ s ≤ k ≤ m.
(3.3.77)
¨ Beweis: F¨ ur Polynome qˆ ∈ P (Tˆ) gilt wegen der Aquivalenz von Normen auf dem (endlich dimensionalen) Quotientenraum P (T )/Pk−1 (T ) mit einer Konstante cˆ = cˆ(d, m, Tˆ) : |ˆ q |k;Tˆ ≤ cˆ |ˆ q |s;Tˆ ,
0 ≤ s ≤ k ≤ m.
Die Behauptung ergibt sich nun wieder durch Transformation auf die Zelle T .
(3.3.78) Q.E.D.
3.3 Interpolation mit finiten Elementen
105
Bemerkung 3.7: Analoge Absch¨ atzungen wie die in Satz 3.6 und Satz 3.7 gelten auch f¨ ur Tensorprodukt-Polynomans¨ atze auf Vierecken bzw. Hexaedern. Wir wollen diese Resultate auf die obigen konkreten Beispiele anwenden. In diesen sind alle formulierten Bedingungen erf¨ ullt. Insbesondere gilt die uniform shape“ Bedingung ” hT ≤ c. sup max T ∈T h ρT h>0 (m−1)
Dann folgt aus Satz 3.6 f¨ ur die FE-Ansatzr¨aume Vh die Interpolationsfehlerabsch¨ atzungen |v − IT v|k;T ≤ c hTm−k |v|m;T ,
⊂ H01 (Ω) vom Polynomgrad m−1 ∈ N0
k = 0, ..., m, T ∈ Th ,
(3.3.79)
mit Konstanten c = c(d, m, Tˆ). Manchmal m¨ochte man den Interpolationsfehler auch u ¨ ber den Rand der Zelle oder punktweise absch¨ atzen. Hierf¨ ur gilt m−1/2
k∇2 vkm;T ,
(3.3.80)
max |v − IT v| ≤ chTm−1 k∇2 vkm;T .
(3.3.81)
kv − IT vk∂T ≤ chT und z.B. in zwei Dimensionen x∈T
Als Folgerung aus diesem lokalen Absch¨atzungwen erhalten wir die folgenden globale Approximationsabsch¨ atzungen |v − Ih v|k ≤ c hm−k |v|m ,
k = 0, ..., m.
(3.3.82)
ku − Ih uk + hk∇(u − Ih u)k ≤ ch2 k∇2 uk.
(3.3.83)
F¨ ur lineare“ finite Elemente gilt also speziell ”
In diesem Fall ergibt die inverse“ Beziehung (3.3.77): ” k∇vh k ≤ h−1 kvh k,
(1)
vh ∈ Vh .
(3.3.84)
Entsprechend gilt f¨ ur quadratische“ finite Elemente ” ku − Ih uk + hk∇(u − Ih u)k ≤ ch3 k∇3 uk,
(3.3.85)
und k∇2 vh k ≤ h−2 kvh k,
(2)
vh ∈ Vh .
(3.3.86)
Damit ist jetzt die theoretische Grundlage f¨ ur die a priori Fehlerabsch¨atzungen f¨ ur das GalerkinFinite-Elemente-Verfahren aus Satz 3.1 geschaffen.
106
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
3.4 A priori Fehleranalyse Die in Abschnitt 3.3 hergeleiteten Absch¨atzungen f¨ ur den Fehler bei der Interpolation mit st¨ uckweise polynomialen Funktionen sind die Basis f¨ ur die a priori Fehleranalyse des FiniteElemente-Verfahrens. Wir formulieren die folgende Verallgemeinerung von Satz 3.1 f¨ ur FEApproximationen allgemeiner Ordnung m ≥ 2 , (∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh ,
(3.4.87)
der Poisson-Gleichung. Dabei ist die sog. Ordnung“ eines FE-Verfahrens im wesentlichen durch ” den Polynomgrad der verwendeten Ansatzfunktionen bestimmt, d.h. durch die Beziehung Pm−1 ⊂ P (T ) f¨ ur alle T ∈ Th . Korollar 3.2 (Allg. FE-Konvergenz): F¨ ur den Fehler eh := u−uh einer FE-Methode mit Ansatzr¨ aumen Vh ⊂ H01 (Ω) der Ordnung m ≥ 2 zur Approximation der Poisson-Gleichung gilt die a priori Fehlerabsch¨ atzung: keh k + hk∇eh k ≤ c hm k∇m uk .
(3.4.88)
Wir wollen eine Schw¨ ache dieses Resultats nicht unerw¨ahnt lassen. Im allgemeinen sind L¨osungen u ∈ H01 (Ω) elliptischer Gleichungen zweiter Ordnung u ¨ ber Gebieten mit Polygonrand nicht aus H m (Ω) f¨ ur m ≥ 3. An den Ecken von ∂Ω treten starke Singularit¨aten der Ableitungen von u auf. Die obige Voraussetzung u ∈ H m (Ω) ist also f¨ ur m > 2 unrealistisch. Finite Elemente h¨oherer Ordnung m > 2 k¨ onnen jedoch bei Gebieten mit hinreichend glattem Rand ∂Ω erfolgreich verwendet werden, denn in diesem Fall kann die Regularit¨atstheorie meist u ∈ H m (Ω) sichern. Dabei sind aber besondere Maßnahmen, wie z. B. die Verwendung isoparametrischer Ans¨atze, zur Approximation entlang des krummen Randes erforderlich. Wir haben gesehen, daß der Fehler z.B. bei linearen“ finiten Elementen gemessen in der L2 ” Norm eine verbesserte Konvergenzordnung O(h2 ) gegen¨ uber der von O(h) in der Energie-Norm zul¨aßt. Es stellt sich die Frage, ob man durch weitere Abschw¨achung der Norm vielleicht noch h¨ohere Konvergenzordnungen erzielen kann. Diese Hoffnung wird zun¨achst best¨arkt durch die Beobachtung, daß dies f¨ ur die L2 -Projektion durchaus der Fall ist. Die in Frage kommenden Normen werden illustrativ als negative“ Sobolew-Normen bezeichnet und sind in den einfachsten ” F¨allen definiert durch kvk−1 := sup ϕ∈V
(v, ϕ) , kϕk1
kvk−2 :=
sup ϕ∈V
∩H 2 (Ω)
(v, ϕ) . kϕk2
wobei wieder V := H01 (Ω) . (1)
Hilfssatz 3.6 (L2 -Projektion): F¨ ur die L2 -Projektion Ph : V → Vh auf den Raum Vh linearen“ finiten Elemente gilt die Fehlerabsch¨atzungen ” ku − Ph uk−2 + hku − Ph uk−1 + h2 ku − Ph uk ≤ ch4 k∇2 uk .
der
(3.4.89)
Beweis: Zun¨ achst rekapitulieren wir die u ¨ bliche Bestapproximationseigenschaft“ der L2 -Projektion: ” ku − Ph uk = min ku − ϕh k . (1)
ϕh ∈Vh
(3.4.90)
3.4 A priori Fehleranalyse
107
Daraus folgt mit der lokalen Interpolationsabsch¨atzung (3.3.79) die Beziehung ku − Ph uk ≤ ch2 k∇2 uk .
(3.4.91)
ur k ∈ {1, 2} : Mit einem beliebigen ϕ ∈ H01 (Ω) gilt entsprechend f¨ (u − Ph u, ϕ) = (u − Ph u, ϕ − Ph ϕ)
≤ ku − Ph uk kϕ − Ph ϕk
≤ ch2+k k∇2 uk k∇k ϕk . Dies impliziert
(u − Ph , ϕ) ≤ ch2+k k∇2 uk , kϕk k ϕ∈H 1 (Ω)∩H k (Ω) sup
0
was zu beweisen war.
Q.E.D.
Der Beweis von Hilfssatz 3.6 zeigt, daß eine weitere Erh¨ohung jenseits O(h4 ) der Approximati(1) onsordnung der L2 -Projektion auf den Ansatzraum Vh auch in einer noch schw¨acheren Norm (1) nicht mehr m¨ oglich ist. F¨ ur die Ritz-Projektion“ Rh : V → Vh ist in diesem Fall sogar O(h2 ) ” die Obergrenze f¨ ur die erreichbare Ordnung. Dies zeigt der folgende Satz. (1)
Satz 3.8 (Ritz-Projektion): F¨ ur die Ritz-Projektion Rh : V → Vh linearen“ finiten Elemente gilt die Absch¨ atzung ” ku − Rh uk−1 ≥ c(f ) k∇(u − Rh u)k2 ,
auf den Raum der (3.4.92)
mit einer positiven Konstante c(f ) > 0 . Beweis: Sei f ∈ H 1 (Ω) . F¨ ur die L¨ osung u ∈ V der Gleichung −∆u = f gilt unter Ausnutzung der Galerkin-Orthogonalit¨ at“: ” (u − Rh u, f ) = (∇(u − Rh u), ∇u) = k∇(u − Rh u)k2 . Wegen sup ϕ∈V
(u − Rh u, f ) (u − Rh u, ϕ) ≥ kϕk1 kf k1
impliziert dies die Behauptung.
Q.E.D.
Da die Energie-Fehlerabsch¨ atzung k∇(u − Rh u)k ≤ ch k∇2 uk bzgl. der Ordnung bestm¨ oglich ist, folgt aus (3.4.92) die Unm¨oglichkeit einer Fehlerabsch¨atzung mit einer Ordnung gr¨ oßer als zwei f¨ ur lineare“ finite Elemente. ” 3.4.1 Punktweise Fehlerabsch¨ atzung In den vorangegangenen Abschnitten haben wir gesehen, daß die Methode der finiten Elemente als Projektionsmethode zun¨ achst ganz nat¨ urlich zu a priori Absch¨atzungen in der Energienorm“ ”
108
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
k∇ek und dann u atsargument auch zu verbesserten Absch¨atzungen in der L2 ¨ber ein Dualit¨ Norm kek f¨ uhrt. Diese Konvergenzaussagen im quadratischen Mittel“ gestatten aber noch ” keinen unmittelbaren Schluß auf die punktweise Konvergenz des Verfahrens. Dieser Frage soll jetzt wieder anhand des einfachen Modellproblems Poisson-Gleichung“, ” −∆u = f in Ω,
u = 0 auf ∂Ω,
(3.4.93)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 nachgegangen werden. Wir beschr¨anken uns da(1) bei auf die Approximation (3.4.87) mit st¨ uckweise linearen Ans¨atzen Vh ⊂ V auf regul¨aren Triangulierungen. Wir rekapitulieren hierf¨ ur die a priori Fehlerabsch¨atzung kek + hk∇ek ≤ ch2 k∇2 uk ,
(3.4.94)
wobei die Konstante c wesentlich durch die Konstante in der Interpolationsfehlerabsch¨atzung k∇(u − Ih u)kT ≤ ci h k∇2 ukT ,
T ∈ Th ,
(3.4.95)
bestimmt ist. Wir erinnern daran, daß im vorliegenden Fall eines konvexen Grundgebiets jedes v ∈ V mit ∆v ∈ L2 (Ω) automatisch in H 2 (Ω) ist und der a priori Absch¨atzung gen¨ ugt: k∇2 vk ≤ k∆vk.
(3.4.96)
Satz 3.9 (Sub-optimale L∞ -Norm-Fehlerabsch¨ atzung): Unter den obigen Voraussetzungen konvergiert die Methode der finiten Elemente punktweise mit der Ordnung O(h) : max |e| ≤ chk∇2 uk .
(3.4.97)
Ω
(1)
Beweis: Sei T ein beliebiges Dreieck aus Th . F¨ ur eine Funktion vh ∈ Vh Z −1 max |vh | ≤ c|T | |vh | dx. T
gilt dann (3.4.98)
T
Dies folgt leicht mit Hilfe der Transformation auf die Referenzzelle Tˆ ( dx ≈ |T |dˆ x ) und der ¨ dort geltenden Beziehung (Aquivalenz von Normen) Z vh | dˆ x. vh | ≤ cˆ |ˆ max |ˆ Tˆ
Tˆ
(1)
Mit der Knoteninterpolierenden Ih u ∈ Vh
zu u ∈ V ∩ H 2 (Ω) gilt
max |u − Ih u| ≤ chT k∇2 ukT . T
Damit erschließen wir dann max |e| ≤ max |u − Ih u| + max |Ih e| T T T Z ≤ max |u − Ih u| + c|T |−1 |Ih e| dx T T Z −1 ≤ max |u − Ih u| + c|T | |e| dx ≤ chT k∇2 ukT + ch−1 T kekT . T
T
(3.4.99)
3.4 A priori Fehleranalyse
109
Mit Hilfe der L2 -Fehlerabsch¨ atzung (3.4.94) folgt also die Behauptung.
Q.E.D.
Bemerkung 3.8: Unter der bloßen Annahme u ∈ V ∩H 2 (Ω) ist die Fehlerabsch¨atzung (3.4.97) bzgl. der h-Potenz optimal. Um dies einzusehen, betrachte man z.B. auf dem Einheitskreis B1 = {x ∈ R2 | |x| < 1} die Funktionen uh (x) := (|x|2 + h4 )1/2 Offenbar ist uh ∈ H 2 (B1 ) , und es gilt Z 1/2 2 h k∇ u kB1 ≤ c (|x|2 + h4 )−1 dx ≤ c | ln(h)|1/2 . B1
Wir nehmen nun an, daß unser L¨ osungsgebiet Ω den Kreis B1 enth¨alt und die Funktionen h h u geeignet zu Funktionen u ¯ ∈ H01 (Ω) ∩ H 2 (Ω) fortgesetzt sind. Ferner geh¨ore zu jeder der Triangulierungen Th ein Dreieck T0 mit Durchmesser h und dem Inkreismittelpunkt a0 = 0. Dann ist in den Eckpunkten ai und dem Mittelpunkt a0 von T0 stets u ¯h (ai ) ≥ h,
u ¯h (a0 ) = h2 .
¯h mit einem ε > 0 gelten W¨ urde nun f¨ ur die Ritz-Projektion u ¯hh ∈ Vh zu u ¯h kΩ , max |¯ uh − u ¯hh | ≤ ch1+ε k∇2 u T0
so erg¨abe sich f¨ ur hinreichend kleines h im Widerspruch zur Linearit¨at der u ¯hh auf T0 : |¯ uhh (a0 )| ≤ |¯ uhh (a0 ) − u ¯h (a0 )| + |¯ uh (a0 )| ≤ ch1+ε1 , |¯ uhh (ai )|
h
h
≥ |¯ u (ai )| − |¯ u (ai ) −
u ¯hh (ai )|
0 < ε1 < ε,
≥ ch.
Numerische Experimente zeigen, daß im Falle h¨oherer Regularit¨at von u (etwa u ∈ C 2 (Ω)) die optimale Ordnung O(h2 ) des L2 -Fehlers auch f¨ ur die punktweise Konvergenz vorliegt. Ein anomen haben wir bereits bei der Differenzenapproximation mit dem 5-Punkte¨ahnliches Ph¨ Operator gesehen, bei dem sich auf gleichf¨ormigen Gittern die Konvergenzordnung O(h) im Falle u ∈ C 3 (Ω) auf O(h2 ) im Falle u ∈ C 4 (Ω) erh¨oht. F¨ ur die Methode der finiten Elemente beweisen wir nun das folgende optimale Resultat auf allgemeinen regul¨aren Gittern: Satz 3.10 (Optimale L∞ -Absch¨ atzung): Im Falle u ∈ V ∩ C 2 (Ω) gilt die Konvergenzabsch¨ atzung max |e| ≤ ch2 {| ln(h)| + 1} max |∇2 u|. Ω
Ω
(3.4.100)
Beweis: Wir notieren zun¨ achst die Interpolationsfehlerabsch¨atzung max |u − Ih u| + h max |∇(u − Ih u)| ≤ ch2 max |∇2 u| Ω
Ω
Ω
(3.4.101)
I) F¨ ur ein h > 0 sei T∗ ∈ Th beliebig, aber fest gew¨ahlt. O.B.d.A. wird im folgenden h ≤ (1)
angenommen. Mit der Knoteninterpolierenden Ih u ∈ Vh
1 2
von u gilt wieder (siehe Beweis von
110
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Satz 3.9) −1
max |e| ≤ c max |u − Ih u| + c|T∗ | T∗
T∗
≤
ch2T∗
2
−1
max |∇ u| + c|T∗ | T∗
Z
T∗
|e| dx
T∗
|e| dx.
Z
Damit ist die Absch¨ atzung des L∞ -Fehlers zur¨ uckgef¨ uhrt auf eine lokale L1 -Fehlerabsch¨atzung. Mit der durch δh :≡ |T∗ |−1 sign(e) in T∗ , δh :≡ 0 sonst, definierten Funktion δh ∈ L2 (Ω) ( regularisierte“ Dirac17 -Funktion) gilt weiter ” Z −1 |T∗ | |e| dx = (δh , e). T∗
II) Im n¨achsten Schritt wird wieder ein Dualit¨atsargument verwendet. Wir betrachten das Hilfsproblem −∆gh = δh in Ω,
gh = 0 auf ∂Ω.
(3.4.102)
Die Funktion gh kann als regularisierte“ Greensche Funktion angesehen werden. Damit erhalten ” wir Z |e| dx = (∇e, ∇gh ). (3.4.103) |T∗ |−1 T∗
Unter Verwendung der durch (1)
(∇ghh , ∇ϕh ) = (∇gh , ∇ϕh ) ∀ϕh ∈ Vh , (1)
definierten Ritz-Projektion“ ghh ∈ Vh von gh erhalten wir durch zweimalige Anwendung der ” Galerkin-Orthogonalit¨ at die Beziehung Z (3.4.104) |e| dx = (∇e, ∇(gh − ghh )) = (∇(u − Ih u), ∇(gh − ghh )). |T∗ |−1 T∗
Mit der H¨olderschen Ungleichung folgt Z Z −1 |∇(gh − ghh )| dx. |T∗ | |e| dx ≤ max |∇(u − Ih u)| T∗
Ω
(3.4.105)
Ω
Unter Beachtung der Interpolationsabsch¨atzung (3.4.101) erhalten wir schließlich die Beziehung Z |∇(gh − ghh )| dx max |∇2 u|. (3.4.106) max |e| ≤ ch h + T∗
Ω
Ω
Die punktweise Absch¨ atzung des Fehlers e ist also zur¨ uckgef¨ uhrt auf eine globale L1 -Fehlerabsch¨atzung f¨ ur den Gradienten der Greenschen Funktion“: ∇(gh − ghh ) . Dieser wird unten ” 17
Paul Adrien Maurice Dirac (1902-1984): franz¨ osischer Physiker und Mathematiker; Prof. in Cambridge; wichtige Beitr¨ age zur Quanten Mechanik und Kosmologie, 1933 Nobel-Preis.
3.4 A priori Fehleranalyse
111
weiter abgesch¨ atzt. Dazu ben¨ otigen wir einige a priori Absch¨atzungen f¨ ur gh , die im folgenden bereitgestellt werden. III) Sei x∗ der Inkreismittelpunkt von T∗ . Wir definieren die Gewichtsfunktion σ(x) := (|x − x∗ |2 + κ2 h2 )1/2 . Durch Nachrechnen verifiziert man leicht die Beziehungen ( 0 < h ≤ κh ≤ σ ≤ c,
|∇σ| ≤ c∗ ,
|∇2 σ| ≤ cσ −1 ,
1 2
)
kσ −1 k ≤ c | ln(h)|1/2 ,
mit von h und κ unabh¨ angigen Konstanten. F¨ ur die Gr¨oßen σ ¯T := maxT σ und σ T := minT σ gilt daher σ ¯T ≤ σ T + h max |∇σ| ≤ σ T + c∗ h, T
und bei Wahl von κ := 2c∗ (unabh¨ angig von h): ¯T , σ ¯T ≤ σ T + 21 σ und damit max
T ∈Th
σ ¯T ≤ 2. σT
(3.4.107)
Hilfssatz 3.7 (Greensche Funktion): F¨ ur die regularisierte Greensche Funktion“ gh gel” ten die a priori Absch¨ atzungen max |gh | ≤ c | ln(h)|, Ω
k∇gh k + kσ∇2 gh k ≤ c | ln(h)|1/2 , 2 h
−1
k∇ g k ≤ ch
,
(3.4.108) (3.4.109) (3.4.110)
mit von h ∈ (0, 12 ] unabh¨ angigen Konstanten c. Beweis: (i) Die richtige“ Greensche Funktion g(·) = g(x∗ , ·) zum Aufpunkt x∗ erlaubt die ” Absch¨atzung (Beweis mit Hilfe des Maximumprinzips) |g(x)| ≤ c {| ln(|x − x∗ |)| + 1} . Konstruktionsgem¨ aß folgt damit |gh (x)| = |(∇gh , ∇g)| = |(δh , g)Ω | ≤ ch−2
Z
T∗
|g| dx ≤ c {| ln(h)| + 1} .
Dies impliziert die Absch¨ atzung (3.4.108). (ii) Zum Beweis von (3.4.110) verwenden wir die u ¨bliche a priori L2 /H 2 -Absch¨atzung k∇2 gh k ≤ ckδh k ≤ ch−1 . (iii) Als n¨achstes notieren wir die einfache a priori Absch¨atzung k∇2 gh k ≤ k∆gh k ≤ ch−1 .
(3.4.111)
112
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Weiter gilt k∇gh k2 = (δh , gh ) ≤ c max |gh | ≤ c | ln(h)|. Ω
Dies impliziert den ersten Teil der Absch¨atzung (3.4.109). (iii) Schließlich setzen wir ξ := x − x∗ und finden wegen |ξi ∇2 gh | ≤ |∇2 (ξi gh )| + |∇gh | die Beziehung kσ∇2 gh k2 = ≤
2 X i=1
kξi ∇2 gh k2 + κ2 h2 k∇2 gh k2
2 n X i=1
o k∇2 (ξi gh )k2 + k∇gh k2 + κ2 h2 k∇2 gh k2 .
Mit Hilfe der u ¨blichen a priori L2 /H 2 -Absch¨atzung (3.4.96) folgt k∇2 (ξi gh )k ≤ k∆(ξi gh )k ≤ kξi ∆gh k + k∇gh k
≤ kξi δh k + k∇gh k ≤ c + c | ln(h)|1/2 .
Die vorausgehenden Absch¨ atzungen implizieren dann o n kσ∇2 gh k ≤ c 1 + | ln(h)|1/2 ,
woraus (3.4.109) folgt. Dies vervollst¨ andigt den Beweis von (3.4.109).
Q.E.D.
IV) Wir kehren nun zum Beweis des Satzes zur¨ uck und sch¨atzen wie folgt ab: Z |∇(gh − ghh )| dx ≤ kσ −1 k kσ∇(gh − ghh )k ≤ c | ln(h)|1/2 kσ∇(gh − ghh )k. Ω
Durch Ausdifferenzieren folgt weiter kσ∇(gh − ghh )k2 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ))) − (∇(gh − ghh ), (gh − ghh )∇σ 2 ) =: E1 − E2 .
Die Terme E1 und E2 werden im folgenden separat abgesch¨atzt. Im Hinblick auf die GalerkinOrthogonalit¨ at gilt E1 = (∇(gh − ghh ), ∇(σ 2 (gh − ghh ) − ψh )) (1)
mit der Knoteninterpolierenden ψh := Ih {∇(σ 2 (gh − ghh ))} ∈ Vh . Dies wird weiter abgesch¨atzt durch X kσ∇(gh − ghh )kT kσ −1 ∇(σ 2 (gh − ghh ) − ψh )kT E1 ≤ T ∈Th
≤ 14 kσ∇(gh − ghh )k2 + c
X
T ∈Th
kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T .
3.4 A priori Fehleranalyse
113
Mit Hilfe der Interpolationsfehlerabsch¨atzung (3.4.99) werden die einzelnen Summanden wie folgt abgesch¨ atzt: 2 2 h h kσ −1 ∇(σ 2 (gh − ghh ) − ψh )k2T ≤ σ −2 T k∇(σ (g − gh ) − ψh )kT
Dies ergibt wegen (3.4.107): E1 ≤
h 1 4 kσ∇(g
2 2 2 h h 2 ≤ c σ −2 T hT k∇ (σ (g − gh ))kT 2 h h 2 h h 2 2 2 h 2 ≤ c σ −2 T hT kg − gh kT + kσ∇(g − gh )kT + kσ ∇ g kT ¯T2 h2T k∇(gh − ghh )k2T + kσ∇2 gh k2T . ≤ c kgh − ghh k2T + c σ −2 T σ
− ghh )k2 + c kgh − ghh k2 + c h2 k∇(gh − ghh )k2 + kσ∇2 gh k2 .
Die schon bekannten L2 -Fehlerabsch¨ atzungen liefern weiter E1 ≤ 14 kσ∇(gh − ghh )k2 + ch2 h2 k∇2 gh k2 + kσ∇2 gh k2 , sowie unter Beachtung der Absch¨ atzungen von Hilfssatz 3.7
E1 ≤ 41 kσ∇(gh − ghh )k2 + ch2 | ln(h)|. F¨ ur den zweiten Term gilt wegen |∇σ 2 | ≤ cσ : E2 ≤ ckσ∇(gh − ghh )kkgh − ghh k ≤ 41 kσ∇(gh − ghh )k2 + ckgh − ghh k2 sowie mit den Argumenten von eben: E2 ≤ 14 kσ∇(gh − ghh )k2 + ch2 . Kombination der Absch¨ atungen f¨ ur E1 und E2 ergibt schließlich kσ∇(gh − ghh )k2 ≤ 21 kσ∇(gh − ghh )k2 + ch2 | ln(h)|, und damit die Behauptung.
Q.E.D.
Der logarithmische Term | ln(h)| in der Absch¨atzung (3.4.100) l¨aßt sich auf allgemeinen Gittern nicht vermeiden. Dies wird durch numerische Tests und auch durch theoretische Analyse best¨atigt. Auf gleichf¨ ormigen Gittern (Je zwei benachbarte Dreiecke bilden ein Parallelogramm.) erh¨alt man unter der st¨ arkeren Glattheitsbedingung u ∈ C 2+α (Ω) allerdings die optimale Konvergenzordnung O(h2 ). Vergleicht man dieses Resultat mit dem entsprechenden f¨ ur die Differenzenapproximation mit dem 5-Punkte-Operator, so stellen wir eine deutliche Abschw¨achung der Regularit¨ atsanforderungen um fast zwei Stufen fest. Auf Polygongebieten ist die Bedingung u ∈ H 2,∞ (Ω) f¨ ur die schwache L¨osung von (3.4.93) im allgemeinen unrealistisch. Bei den Ecken k¨onnen die zweiten Ableitungen Singularit¨aten haben. Auf konvexen Polygongebieten ist gerade die Voraussetzung u ∈ H 2 (Ω) nat¨ urlich, d.h. 2,∞ ′ stets erf¨ ullt, wogegen u ∈ H (Ω1 ) nur auf Teilgebieten Ω1 ⊂ Ω mit positivem Abstand zu den Eckpunkten gilt. In diesem Fall haben wir das folgende lokale“ Resultat: ” Satz 3.11 (Lokales Fehlerverhalten): Sei Ω1 ⊂ Ω ein Teilgebiet mit positivem Abstand δ1 zu den Eckpunkten von Ω und u ∈ H 2 (Ω) ∩ C 2 (Ω1 ). Dann gilt auf jedem zweiten Teilgebiet
114
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Ω2 ⊂ Ω1 mit Abstand δ2 > δ1 zu den Eckpunkten die Fehlerabsch¨ atzung 2 2 2 max |e| ≤ ch | ln(h)| max |∇ u| + k∇ ukΩ . Ω2
Ω1
(3.4.112)
Beweis: Der technisch aufwendige Beweis kann im Rahmen dieser Vorlesung nicht gef¨ uhrt werden. Q.E.D. Bemerkung 3.9: Zum Abschluß bemerken wir noch, daß sich f¨ ur finite Elemente h¨oherer Ordnung (Polynomgrad m − 1 ≥ 2) zu (3.4.100) analoge punktweise Fehlerabsch¨atzungen unter der Voraussetzung u ∈ C m (Ω) herleiten lassen: max |e| ≤ chm max |∇m u|. Ω
Ω
(3.4.113)
Bemerkenswerterweise tritt dabei ab Polynomordnung m − 1 = 2 der st¨orende logarithmische Term | ln(h)| nicht auf. Dasselbe gilt auch f¨ ur den niedrigsten Ansatzgrad m − 1 = 1 , wenn der maximale Fehlergradient betrachtet wird: max |∇e| ≤ ch max |∇2 u|. Ω
Ω
(3.4.114)
3.5 Implementierungsaspekte
115
3.5 Implementierungsaspekte Im folgenden wollen wir einige Fragen im Zusammenhang mit der praktischen Realisierung von Finite-Elemente-Methoden diskutieren. Dazu betrachten wir als Modellfall die 1. RWA eines allgemeineren (elliptischen) Differentialoperators, Lu := −∇{a∇u} = f
in Ω,
u = 0 auf ∂Ω,
(3.5.115)
mit m¨oglicherweise variablem Koeffizienten a = a(x) ≥ α > 0 auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Die Diskretisierung erfolgt wieder auf Ansatzr¨aumen Vh ⊂ H01 (Ω) zu einer Folge von (gleichm¨ aßig) regul¨ aren Zerlegungen Th = {T } des Grundgebiets Ω ⊂ Rd (d = 2, 3), a(u, ϕ) = l(ϕ)
∀ϕh ∈ Vh .
(3.5.116)
mit den bilinearen bzw. linearen Formen a(u, ϕ) := (a∇uh , ∇ϕh ),
l(ϕ) := (f, ϕh ).
Die Aufstellung des zugeh¨ origen linearen Gleichungssystems erfordert in der Regel die Anwendung numerischer Integration, was zu einem zus¨atzlichen Fehler f¨ uhrt.
3.5.1 Aufbau der Systemmatrizen und Vektoren Im Gegensatz zu den Differenzenverfahren auf strukturierten Gittern lassen sich die algebraischen Gleichungssysteme der Finite-Elemente-Verfahren auf allgemeinen Zerlegungen Th in der Regel nicht explizit per Hand“ aufstellen. ” (n) Mit der Knotenbasis {ϕh , n = 1, ..., N } des Finite-Elemente-Raumes Vh ⊂ H01 (Ω) sind N die Systemmatrizen A = (anm )N n,m=1 (”Steifigkeitsmatrix“) und M = (mnm )n,m=1 (”MassenN matrix“) sowie der Lastvektor“ b = (bn )n=1 gebildet gem¨aß ” (m)
(n)
anm = a(ϕh , ϕh ),
(m)
(n)
mnm = (ϕh , ϕh ),
(n)
bn = l(ϕh ).
Beide Matrizen sind konstruktionsgem¨aß symmetrisch und positiv-definit. Ihre gr¨oßten und kleinsten Eigenwerte seien λmax (A) , λmin (A) bzw. λmax (M ) , λmin (M ) , und die zugeh¨origen Spektralkonditionen: λmax (M ) λmax (A) , κ2 (M ) = . κ2 (A) = λmin (A) λmin (M ) Wir rekapitulieren die folgenden Beziehungen zwischen einer Finite-Elemente-Funktion vh ∈ Vh N und ihrem zugeh¨ origen Knotenvektor ξ = (ξn )N n=1 ∈ R : vh =
N X
n=1
(n)
ξn ϕh ,
kvh k2 = hM ξ, ξi,
a(vh , vh ) = hAξ, ξi,
wobei h·, ·i das euklidische Skalarprodukt bezeichnet; die euklidische Vektornorm ist | · | . Der Knotenvektor ξ ist bestimmt durch das lineare Gleichungssystem Aξ = b
(3.5.117)
116
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Zur Aufstellung des Systems (3.5.117) bedient man sich in der Praxis eines zell-orientierten Prozesses, des sog. Assemblierens“ (englischen assembling“). Dabei wird das Konzept der ” ” Element-(Last)-Vektoren“ und Element-(Steifigkeits)-Matrizen” verwendet. F¨ ur einen Kno” ” T T N T T tenvektor ξ ∈ R und eine Zelle T ∈ Th ist dabei ξT = (ξ1 , ..., ξn , ..., ξN ) mit ξnT := ξn
(n)
falls ϕh 6≡ 0 auf T, ξnT := 0
(n)
falls ϕh ≡ 0 auf T.
Die zugeh¨origen Element-Matrizen und -Vektoren haben die Form (m) (n) N AT = (aTnm )N n,m=1 := (a∇ϕh , ∇ϕh )T n,m=1 , (m) (n) N MT = (mTnm )N n,m=1 := (ϕh , ϕh )T n,m=1 , (n) N bT = (bTn )N n=1 := (f, ϕh )T n=1 .
Dabei werden nat¨ urlich nur die wesentlichen, von Null verschiedenen Elemente von AT , MT und bT gespeichert. Die einzelnen Gesamtmatrizen und Vektoren werden dann gebildet durch Assemblierung der entsprechenden Element-Matrizen und -Vektoren gem¨aß : X X X A= AT , M = MT , b = bT . T ∈Th
T ∈Th
T ∈Th
Entsprechend gilt hAξ, ξi =
X
T ∈Th
hAT ξT , ξT i,
hM ξ, ξi =
X
T ∈Th
hMT ξT , ξT i.
Die Element-Beitr¨ age werden in der Regel durch Transformation auf ein Referenzelement berechnet. Wir diskutieren hier nur den Fall von Dreieckszerlegungen. Sei also wieder σT : Tˆ → T die affin-lineare Abbildung des Einheitsdreiecks Tˆ auf das Dreieck T : x = σT (ˆ x) = BT x ˆ + bT ,
x ˆ = σT−1 (x) = BT−1 x − BT−1 bT .
ˆ ρˆ bezeichnet. F¨ Die charakteristischen Parameter von T sowie Tˆ sind mit hT , ρT bzw. h, ur transformierte Funktionen vˆ(ˆ x) = v(x) gilt dann Z Z v(x) dx = | det BT | vˆ(ˆ x) dˆ x, Tˆ
T
woraus insbesondere | det BT | = |T ||Tˆ|−1 ≈ hdT folgt. Ferner ist mit der Inversen BT−1 = (−1) (bij )dij=1 : d d X X (−1) ˆ ∂ˆj vˆ(ˆ x)b . ∂ v ˆ (ˆ x )∂ x ˆ = ∂c v(ˆ x ) = ∂ v(x) = ∂ v ˆ (ˆ x ) = j i j i i i ji
j=1
j=1
c x) = B −T ∇ˆ ˆ v (ˆ bzw. ∇v(ˆ x) . Die Elemente der Element-Matrizen AT und MT sowie des ElementT
3.5 Implementierungsaspekte
117
Vektors bT transformieren sich wie folgt: Z Z (m) (n) T d(n) dˆ d(m) ∇ϕ x ˆ∇ϕ a∇ϕh ∇ϕh dx = | det BT | a anm = h h Tˆ T Z ˆ ϕˆ(n) dˆ ˆ ϕˆ(m) B −T ∇ x =: | det BT | a ˆTnm , ˆBT−T ∇ = | det BT | a T h ˆ T Z Z (m) (n) (m) (n) T x =: | det BT | m ˆ nm . ϕh ϕh dx = | det BT | ϕˆh ϕˆh dˆ mnm = ˆ T T Z Z (n) (n) T x =: | det BT | ˆbn . f ϕh dx = | det BT | fˆϕˆh dˆ bn = Tˆ
T
Die Werte a ˆTnm , m ˆ Tnm und ˆbTn auf der Referenzzelle werden nun mit Hilfe von Quadraturformeln ˆ auf T berechnet. Dazu werden wir weiter unten noch mehr Details angeben. Wichtig ist, daß diese Quadratur nur auf der Referenzzelle stattfindet und die tats¨achlich verwendeten Gr¨oßen anm , mnm und bn im wesentlichen durch Skalierung mit | det BT | gewonnen werden. 3.5.2 Konditionierung der Systemmatrix Wir wollen zun¨ achst die Stabilit¨ at (f¨ ur h → 0 ) der diskreten Finite-Elemente-Gleichung (3.5.117) gegen¨ uber St¨ orungen der Daten untersuchen. Diese treten z.B. auf durch die Fehler bei der Berechnung der Elemente anm und mnm bei Verwendung von numerischer Quadratur. Durch rein algebraische Argumente erhalten wir zun¨achst eine Stabilit¨atsabsch¨atzung f¨ ur allgemeine lineare Gleichungssysteme (siehe Skriptum Einf¨ uhrung in die Numerik“). ” Satz 3.12 (Allgemeiner St¨ orungssatz): Seien St¨orungen δA der Matrix A und δb der rechten Seite b gegeben, so daß µ := κ2 (A)kδAk/kAk < 1 . Dann gilt die Fehlerabsch¨ atzung |δξ| κ2 (A) n kδAk |δb| o . ≤ + |ξ| 1 − µ kAk |b|
(3.5.118)
Zur quantitativen Auswertung dieser Absch¨atzung m¨ ussen wir die Spektralkondition der Steifigkeitsmatrix A in Abh¨ angigkeit von der Gitterweite h absch¨atzen. Dazu nehmen wir an, daß die betrachtete Familie von Zerlegungen (Th )h>0 gleichm¨aßig form- und gr¨oßen-regul¨ar“ ist, ” d.h.: hT maxT ∈Th hT sup max ≤ c, sup ≤ c. h>0 T ∈Th ρT h>0 minT ∈Th hT Dann ergibt sich analog zum Differenzenverfahren das folgende allgemeine Resultat.
Satz 3.13 (Konditionierung): Auf einer Folge von (gleichm¨aßig) regul¨aren Zerlegungen Th gilt f¨ ur die Spektralkonditionen der (symmetrischen und positiv definiten) Steifigkeitsmatrizen A und der Massenmatrizen M : κ2 (A) = O(h−2 ),
κ2 (M ) = O(1)
(h → 0).
Beweis: (i) F¨ ur die gr¨ oßten und kleinsten Eigenwerte von M gilt λmin (M ) = min
ξ∈RN
hM ξ, ξi hM ξ, ξi ≤ max = λmax (M ) . 2 N |ξ| |ξ|2 ξ∈R
(3.5.119)
118
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
In der folgenden Argumentation werden wieder die Element-Matrizen MT . Ferner bezeichne dmin und dmax die kleinste bzw. die gr¨oßte Anzahl von Zellen, die in einem Knoten der Zerlegung Th zusammentreffen. Mit dieser Notation ergibt sich: hM ξ, ξi = hM ξ, ξi =
X
T ∈Th
X
T ∈Th
hMT ξT , ξT i ≥ hMT ξT , ξT i ≤
min
ξ∈RN , T ∈Th
max
ξ∈RN , T ∈Th
hMT ξT , ξT i X |ξT |2 ≥ min {λmin (MT )} dmin |ξ|2 , T ∈Th |ξT |2 T ∈Th
hMT ξT , ξT i X |ξT |2 ≤ max {λmax (MT )} dmax |ξ|2 . T ∈Th |ξT |2 T ∈Th
ˆ := (m Mit Hilfe der Beziehung | det BT | ≈ hdT ergibt sich mit der (festen) Matrix M ˆ nm )N n,m=1 : ˆ ) ≤ chd , λmax (MT ) = | det BT | λmax (M T
ˆ ) ≥ chd , λmin (MT ) = | det BT | λmin (M T
und folglich κ2 (M ) = O(1) . (ii) F¨ ur die kleinsten und gr¨ oßten Eigenwerte von A gilt: hAξ, ξi hM ξ, ξi min = min vh ∈Vh hM ξ, ξi ξ∈RN |ξ|2 hM ξ, ξi hAξ, ξi max = max λmax (A) ≤ max vh ∈Vh |ξ|2 ξ∈RN hM ξ, ξi ξ∈RN λmin (A) ≥ min
ξ∈RN
a(vh , vh ) λmin (M ), kvh k2 a(vh , vh ) λmax (M ). kvh k2
Wir sch¨atzen weiter ab durch min
vh ∈Vh
a(vh , vh ) a(v, v) ≥ min =: λmin (L) 2 2 1 kvh k v∈H0 (Ω) kvk
mit dem kleinste Eigenwert des Differentialoperators L auf dem Gebiet Ω . Ferner ergibt sich mit Hilfe der inversen Beziehung“ f¨ ur Finite-Elemente-Funktionen: ” X X −2 2 2 a(vh , vh ) ≤ kak∞ k∇vh k2T ≤ ckak∞ ρ−2 T kvh kT ≤ ckak∞ max ρT kvh k , T ∈Th
T ∈Th
T ∈Th
bzw. λmax (A) ≤ c maxT ∈Th ρ2T λmax (M ) . Wir gewinnen so die Absch¨atzung λmin (L)λmin (M ) ≤ λmin (A) ≤ λmax (A) ≤ c max ρ−2 T λmax (M ). T ∈Th
ormigkeitsannahmen an die Also ist κ2 (A) ≤ c maxT ∈Th ρ−2 T , was im Hinblick auf die Gleichf¨ Zerlegungsfolge den Beweis vervollst¨ andigt. Q.E.D. Bemerkung 3.10: Wir betonen, daß die Asymptotik O(h−2 ) der Kondition der Steifigkeitsmatrix durch die Ordnung des zugrunde liegenden Differentialoperators L bestimmt ist; sie hat nichts mit dem Polynomgrad m − 1 des Finite-Elemente-Ansatzes oder der Raumdimension d zu tun. In der Tat wurde der Beweis von Satz 3.13 allgemein f¨ ur d ≥ 1 und f¨ ur beliebigen Polynomgrad m − 1 ≥ 1 gef¨ uhrt. Die Abh¨angigkeit von ρ := minT ∈Th ρT kommt u ¨ ber die Verwendung der inversen Beziehung zur Absch¨atzung von λmax (A) ins Spiel. Dabei ergibt offenbar jede Ableitungsstufe in der Energieform a(·, ·) genau eine negative ρ-Potenz. Der Exponent −2 ist also gerade durch die Ordnung des betrachteten Differentialoperators bestimmt. Bei der Finite-Elemente-Diskretisierung von Differentialoperatoren h¨oherer Ordnung 2r ≥ 2 verh¨ alt
3.5 Implementierungsaspekte
119
sich die Kondition der Steifigkeitsmatrix dementsprechend wie κ2 (A) = O(h−2r ) . Zum Beispiel treten in der Plattenstatik Randwertaufgaben vierter Ordnung (r = 2) mit dem biharmonischen Operator ∆2 auf. In diesem Fall verh¨ alt sich die Kondition der zugeh¨origen Steifigkeitsmatrix wie O(h−4 ) . F¨ ur eine Gitterweite der Gr¨oßenordnung h ∼ 10−2 in zwei Dimensionen ergibt sich damit κ2 (A) ∼ 108 , was Rechnung in mindestens doppelt-genauer Arithmetik nahe legt. Die Fehlerabsch¨ atzung (3.5.118) ist am Extremfall einer St¨orung des Eigenvektors wmax in Richtung des Eigenvektors wmin orientiert. Sie erfassen also den ung¨ unstigsten Fehlereinfluß, wie er in der Praxis kaum auftreten wird. Tats¨achlich erweist sich (3.5.118) als viel zu pessimistisch zur realistischen Erfassung des Einflusses von Datenfehlern bei der L¨osung der Finite-ElementeGleichungen Ax = b . Zur Verdeutlichung betrachten wir im folgenden ausschließlich den Fall von St¨orungen in der rechten Seite b , welche durch fehlerhafte Auswertung (z.B. durch numerische Quadratur) der gegebenen rechten Seite f der Differentialgleichung entstehen. Satz 3.14 (Spezieller St¨ orungssatz): Auf einer Folge von (gleichm¨ aßig) regul¨ aren Zerlegungen Th gilt die Fehlerabsch¨atzung κ2 (M ) kf k |δb| |δξ| ≤ , |ξ| λ kuh k |b|
(3.5.120)
mit dem kleinsten Eigenwert λ der 1. RWA des Differentialoperators L auf Ω . Beweis: Aus der Identit¨ at A δξ = δb folgt |δξ| ≤ kA−1 k |δb| = λmin (A)−1 |δb| . Weiter ist hAz, zi hAz, zi hM z, zi ≥ min min 2 |z| |z|2 z∈RN z∈RN hM z, zi z∈RN a(vh , vh ) λmin (M ) ≥ λ λmin (M ) , = min vh ∈Vh kvh k2
λmin (A) = min
und somit |δξ| ≤ λ−1 λmin (M )−1 |δb| . Mit Hilfe der Schwarzschen Ungleichung ergibt sich |b|2 =
N X
(n)
(f, ϕh )2 = f,
N X
n=1
n=1
(n)
(n)
(f, ϕh )ϕh
Wegen
N
X
(n) (n) (f, ϕh )ϕh . ≤ kf k n=1
N N
X X
(n) (m) (n) (m) (n) (n) 2 (f, ϕh )(f, ϕh )(ϕh , ϕh ) = hM b, bi ≤ λmax (M ) |b|2 (f, ϕh )ϕh =
n=1
n,m=1
folgt dann |b| ≤ λmax (M )1/2 kf k . Ferner gilt wegen hM ξ, ξi ≤ λmax (M )kξk2 : |ξ| ≥ λmax (M )−1/2 hM ξ, ξi1/2 = λmax (M )−1/2 kuh k . Wir kombinieren die obigen Beziehungen und erhalten |δξ| λmax (M ) |δb| kf k ≤ λ−1 , |ξ| λmin (M ) |b| kuh k was zu beweisen war.
Q.E.D.
120
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Wir haben in Satz 3.13 gesehen, daß die Massenmatrix M eine gleichm¨aßig bzgl. h beschr¨ankte Spektralkondition hat κ2 (M ) = O(1) (h → 0) . Ferner folgt aus der Konvergenz des Verfahrens die Beziehung kuh k = kuk + O(h) (h → 0). Damit erhalten wir aus Satz 3.14 die folgende asymptotische Absch¨atzung f¨ ur die Fehlerfortpflanzung im Finite-Elemente-Galerkin-Verfahren |δb| |δξ| ≤ c(f, u, Ω) , |ξ| |b|
(3.5.121)
mit einer nur von f, u und Ω abh¨ angigen Konstante c(f, u, Ω). Dies besagt, daß die FiniteElemente-Methode stabil ist (f¨ ur h → 0 ) bzgl. St¨orungen der rechten Seite f . 3.5.3 Aufstellung der Systemmatrizen mit numerischer Integration Im folgenden analysieren wir den zus¨ atzlichen Fehler, welcher bei n¨aherungsweiser Berechnung der Matrix- und Vektorelemente anm und bn mittels numerischer Quadratur entsteht. Im Zuge der Matrix-Assemblierung m¨ ussen Integrale u ¨ ber Gitterzellen T ∈ Th , Z Z (j) (j) (i) (3.5.122) f (x)ϕh (x) dx, a(x)∇ϕh (x)∇ϕh (x) dx, T
T
(i)
berechnet werden, wobei ϕh (x) die Knotenbasisfunktionen sind. Wenn die Datenfunktionen a(x), f (x) konstant oder auf der Zelle durch Polynome approximiert sind, so sind Integrale der Form Z xp1 xq2 dx, p, q ∈ N0 , T
zu berechnen. Hierf¨ ur gibt es z.B. auf Dreiecken explizite Formeln. Sei T ein Dreieck in der (x, y)-Ebene mit den Eckpunkten (xi , yi ), i = 1, 2, 3 . Ist der Ursprung des Koordinatensystems im Schwerpunkt von T , d.h. x1 + x2 + x3 = y1 + y2 + y3 = 0 , so gilt z.B.: Z 1 d(x, y) = |T |, Z ZT y d(x, y) = 0, x d(x, y) = T T Z |T | 2 x2 d(x, y) = (x1 + x22 + x23 ), 12 ZT |T | xy d(x, y) = (x1 y1 + x2 y2 + x3 y3 ), 12 T Z |T | 2 (y1 + y22 + y32 ). y 2 d(x, y) = 12 T Nicht exakt berechenbare Integrale werden durch numerische Quadratur angen¨ahert. Dazu dienen sog. Quadraturformeln“, welche analog wie auf 1-dimensionalen Intervallen auch auf ” 2- oder 3-dimensionalen Zellen u ¨ ber einen Interpolationsansatz erzeugt werden. Dies geschieht zun¨achst auf der Referenzzelle Tˆ und ergibt dann durch Transformation Tˆ → T = σT (Tˆ) = BT x ˆ + bT auch Quadraturformeln auf den einzelnen Zellen T ∈ Th . Wir beschreiben diesen
3.5 Implementierungsaspekte
121
Prozess im folgenden nur f¨ ur Quadratur basierend auf Lagrange-Interpolation. Auf der Referenzzelle Tˆ seien ein Polynomraum P (Tˆ) mit S := dim P (Tˆ) sowie ein Satz von St¨ utzpunkten {ˆ xs ∈ Tˆ, s = 1, ..., S} gew¨ahlt, welche unisolvent sind. Die St¨ utzpunkte x ˆs brauchen nicht mit den Knotenpunkten des Finite-Elemente-Ansatzes u ¨ bereinzustimmen. Seien ˆ s ∈ P (Tˆ) die zugeh¨ weiter L origen Lagrangeschen Basispolynome, welche durch die Eigenschaft ˆ s (ˆ L xr ) = δsr charakterisiert sind. Dies erlaubt wieder die explizite Darstellung des zu einer stetigen Funktion vˆ(ˆ x) geh¨ orenden Interpolationspolynoms durch p(ˆ x) =
S X
ˆ s (ˆ vˆ(ˆ xs )L x).
s=1
Dies f¨ uhrt zu folgendem Ansatz f¨ ur eine Quadraturformel auf Tˆ : QTˆ (ˆ v ) :=
S X
ω ˆ s vˆ(ˆ xs ),
ω ˆ s :=
s=1
Z
Tˆ
ˆ s (ˆ L x) dˆ x.
(3.5.123)
Die St¨ utzpunkte x ˆs werden so gew¨ ahlt, daß Polynome von m¨oglichst hohem Grad durch die Formel exakt integriert werden. Dabei ist aus Stabilit¨atsgr¨ unden wieder darauf zu achten, daß die Gewichte ω ˆ s positiv sind. Definition 3.6 (Quadraturformel): Eine interpolatorische Quadraturformel der Art (3.5.123) auf einer Referenzzelle T heißt von der Ordnung r “, wenn durch sie Polynome bis zum Grad ” r − 1 (und nicht h¨ oher) exakt integriert werden. Sie wird zul¨ assig“ f¨ ur den Polynomansatz ” P (T ) genannt, wenn ihre St¨ utzstellenmenge reichhaltig genug ist, so daß q ∈ P (T ) :
∇q(xs ) = 0 (s = 1, ..., S)
⇒
q ≡ konst.
(3.5.124)
Mit den Bezeichnungen xs := σT (ˆ xs ),
ωs := | det BT | ω ˆs
(s = 1, ..., S),
erhalten wir durch QT (v) :=
S X
ωs v(xs ) :=
S X s=1
s=1
| det BT |ˆ ωs vˆ(ˆ xs ) = | det BT | QTˆ (ˆ v)
(3.5.125)
Quadraturformeln QT (·) auf den einzelnen Zellen T ∈ Th . Die gebr¨auchlichsten solcher Formeln f¨ ur Dreiecke sind in Abbildung 3.4 zusammengestellt. Dabei bedienen wir uns der gebr¨auchlichen Schreibweise mit sog. baryzentrischen Koordinaten“. F¨ ur ein d-Simplex T mit ” Eckpunkten {a0 , ..., ad } besitzt jeder Punkt x ∈ T eine eindeutige Darstellung als konvexe Linearkombination der Eckpunkte: x=
d X i=0
λi ai ,
0 ≤ λ ≤ 1,
d X
λi = 1.
i=0
Die Koeffizienten {λ0 , ..., λd } sind dann die baryzentrischen Koordinaten von x im Simplex T . Zum Beispiel sind {1, 0, ..., 0} die baryzentrischen Koordinaten des Eckpunkts a0 und { 21 , ..., 12 }
122
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
die des Mittelpunktes zT . Die einfachsten Quadraturformeln auf Dreiecken/Simplizes sind die Mittelpunktregel“ und die Trapezregel“ (siehe auch Abb. 3.4): ” ” d
QT (v) := |T |v(zT ),
X 1 v(ai ). |T | QT (v) := d+1 i=0
Abbildung 3.4: Beispiele von Quadraturformeln auf Dreiecken.
Auf Vierecken bzw. Hexaedern werden sog. Tensorproduktformeln“ verwendet. Diese erh¨ alt ” man ebenfalls u ¨ber Transformation von der Referenzzelle. Demgem¨aß lauten auf dem Quadrat/Quader mit Mittelpunkt zT und Eckpunkten {a1 , ..., a2d } die Mittelpunktregel sowie die
3.5 Implementierungsaspekte
123
(Tensorprodukt)-Trapezregel: 2d
X 1 v(ai ). QT (v) := d |T | 2
QT (v) := |T |v(zT ),
i=0
Zur Erzielung h¨ oherer Genauigkeit werden extrapolierte Trapez-Formeln (z.B. TensorproduktSimpson-Regel) oder Tensorprodukt-Gauß-Formeln verwendet, welche ¨ahnlich wie im eindimensionalen Fall konstruiert sind. Ein der gebr¨auchlichsten Formeln f¨ ur Quadrate ist die 4-PunktGauß-Formel 4 1X v(ξi ), QT (v) := 4 i=1
mit den Gauß-Punkten ξ1 = (η− , η− ), ξ2 = (η− , η+ ), ξ3 = (η+ , η− ) und ξ4 (η+ , η+ ), wobei p 1 η± := 2 (1 ± 1/3) . Satz 3.15 (Quadraturfehler): F¨ ur eine interpolatorische Quadraturformel QT (·) der Ordnung r ≥ d auf einer Zelle T ∈ Th angewendet auf eine Funktion v ∈ W r,1 (T ) gilt Z Z v dx − QT (v) ≤ cq hrT |∇r v| dx, (3.5.126) T
T
mit einer von T und v ∈ H r (T ) unbh¨ angigen Quadraturkonstanten cq > 0 .
Bemerkung 3.11: Die Vorausssetzung r ≥ d in Satz 3.15 dient zur Vereinfachung der Formulierung des Resultats. Wegen der Einbettung W d,1 (T ) ⊂ C(T¯) sind f¨ ur Funktionen v ∈ W r,1 (T ) die f¨ ur die Anwendung der Quadraturformel erforderlichen Punktwerte wohl definiert. Dies ist aber auch gerade die richtige“ Regularit¨atsstufe f¨ ur die maximale Ausnutzung der Approxima” tionsg¨ ute der Quadraturformel. Dies ist wichtig f¨ ur die folgende Untersuchung des Einflusses des ¨ Quadraturfehlers auf den Gesamtfehler. Im Ubrigen ist jede der gebr¨auchlichen Quadraturformeln (z.B. Mittelpunkts- oder Trapezregel) mindestens von der Ordnung r = 2 , so daß in zwei Dimensionen gar keine Einschr¨ ankung besteht. In drei Dimensionanen bedarf der Fall r = 2 eine gesonderte Betrachtung, die obwohl nicht schwer, hier nicht durchgef¨ uhrt wird. Beweis: Der Beweis verwendet das Bramble-Hilbert-Lemma 3.5 in Verbindung mit dem Transformationsargument von Satz 3.6. Auf der Referenzzelle Tˆ definieren wir das Fehlerfunktional Z F (ˆ v ) := vˆ(ˆ x) dˆ x − QTˆ (ˆ v ) . Tˆ
Zur Definition von F (·) ben¨ otigen wir Punktwerte von vˆ . Diese sind aufgrund des Sobolewschen Einbettungssatzes in zwei Dimensionen f¨ ur v ∈ H 2,1 (Ω) und in drei Dimensionen f¨ ur v ∈ 3,1 H (Ω) wohl definiert. Es gilt dann |F (ˆ v )| ≤ ckˆ v kH r,1 . Ferner ist F (·) offensichtlich sublinear und verschwindet nach Voraussetzung auf Pr−1 . Nach der L1 -Variante des Bramble-Hilbert-Lemmas gilt dann ˆ r vˆk 1 ˆ . |F (ˆ v )| ≤ ck∇ L (T )
124
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Sei nun σT wieder die affin-lineare Transformation von Tˆ auf die Zelle T . Dann gilt f¨ ur eine Funktion v ∈ H r,1 (Ω) und ihre Transformierte vˆ(ˆ x) := v(x), x = σT (ˆ x) : Z v(x) dx − QT (v) = | det BT | |F (ˆ v )|, T
sowie
ˆ r vˆk 1 ˆ ≤ c| det BT |−1 hr k∇r vkL1 (T ) . k∇ T L (T )
Kombination der letzten beiden Beziehungen ergibt die Behauptung.
Q.E.D.
Im folgenden werden wir uns auf die Quadratur auf Dreiecken bzw. Simplizes beschr¨anken und nehmen außerdem an, daß der Polynomansatz ein voller Polynomraum ist: P (Tˆ) = Pm−1 (Tˆ) . Analoge Resultate gelten auch f¨ ur die Quadratur auf Vierecken bzw. Hexaedern, doch erfordern deren Formulierung und Beweis eine aufwendigere Notation. Die Anwendung von Quadraturformeln zur Berechnung der Zellintegrale (3.5.122) ergibt eine gest¨orte Bilinearform und rechte Seite X X ah (u, ϕ) := QT (a∇u∇ϕ), lh (ϕ) := QT (f ϕ) T ∈Th
T ∈Th
sowie zugeh¨ orige gest¨ orte Steifigkeitsmatrix- und Lastvektorelemente X X (i) (j) (i) ˜bj := QT (f ϕh ). QT (a∇ϕh ∇ϕh ), a ˜ij := T ∈Th
T ∈Th
Statt der exakten Finite-Elemente-L¨ osung uh ∈ Vh ist dann eine gest¨orte Approximation u ˜h ∈ Vh zu bestimmen durch ah (˜ uh , ϕh ) = lh (ϕh ) ∀ϕh ∈ Vh .
(3.5.127)
Satz 3.16 (Numerische Integration): Die Quadraturformel auf der Referenzzelle QTˆ (·) sei zul¨ assig“ f¨ ur den Finite-Elemente-Ansatz P (Tˆ) und von der Ordnung r ≥ d . Dann besitzen die ” gest¨orten Finite-Elemente-Gleichungen (3.5.127) eindeutige L¨ osungen u ˜h ∈ Vh . Ist a ∈ C r (Ω) , so gilt f¨ ur das gest¨ orte Finite-Elemente-Verfahren der Ordnung m ≥ 2 die Fehlerabsch¨atzung ku − u ˜h k + hk∇(u − u ˜h )k ≤ c hmin{m,r+3−m} kukH m .
(3.5.128)
Zur Erzielung einer maximalen Konvergenzordnung ist also r ≥ 2m − 3 zu w¨ ahlen. Beweis: (i) Koerzitivit¨ at: Auf einer Zelle T ∈ Th gilt unter Verwendung der Transformation T = σT (Tˆ) wegen a ≥ α > 0 : QT (a|∇vh |2 ) =
S X
ωs a(xs )|∇vh (xs )|2 ≥ α
s=1 S X
≥α
s=1
S X s=1
ωs |∇vh (xs )|2 = α
S X s=1
ˆ vh (ˆ | det BT | ω ˆ s |BT−1 ∇ˆ xs )|2
ˆ vh (ˆ | det BT | ω ˆ s kBT k−2 |∇ˆ xs )|2 ≥ αc | det BT |h−2 T
S X s=1
ˆ vh (ˆ ω ˆ s |∇ˆ xs )|2 ,
3.5 Implementierungsaspekte
125
wobei vˆh (ˆ x) = vh (x), x ˆ = σT−1 (x) . Analog gilt ˆ vh k2 ≥ c| det BT |−1 h2T k∇vh k2T . k∇ˆ Tˆ Durch |||ˆ vh |||Tˆ :=
S X s=1
ˆ vh (ˆ ω ˆ s |∇ˆ xs )|2
1/2
ist auf dem Quotientenraum P (Tˆ)/P0 eine Norm definiert. Dazu muß nur noch die Definitheit ˆ vh (ˆ gezeigt werden. Aus |||ˆ vh |||Tˆ = 0 folgt offenbar ∇ˆ xs ) = 0 (s = 1, ..., S) , so daß wegen der vorausgesetzten Zul¨ assigkeit“ der Quadraturformel notwendig vˆh ≡ konst. ist. Da auch ˆ vh k ˆ auf P (Tˆ)/P”0 eine Norm ist, gilt wegen der Aquivalenz ¨ k∇ˆ aller Normen auf einem endlich T dimensionalen Vektorraum mit einer Konstante cˆ > 0 : ˆ vh k ˆ . |||ˆ vh |||Tˆ ≥ cˆ k∇ˆ T Dies impliziert dann ˆ vh k2 ≥ c k∇vh k2 , vh |||2Tˆ ≥ c| det BT |h−2 QT (a|∇vh |2 ) ≥ c| det BT |h−2 T T k∇ˆ T |||ˆ Tˆ bzw. die gleichm¨ aßige Koerzitivit¨ at der Bilinearformen ah (·, ·) : ah (vh , vh ) ≥ ck∇vh k2 ,
vh ∈ Vh .
(3.5.129)
(ii) Fehlerabsch¨ atzung: Mit Hilfe der Koerzitivit¨atsabsch¨atzung (3.5.129) folgt f¨ ur den Fehler ηh := uh − u ˜ h ∈ Vh : c k∇ηh k2 ≤ ah (uh − u ˜h , ηh ) = ah (uh , ηh ) − ah (˜ uh , ηh ) ≤ (ah − a)(uh , ηh ) + (l − lh )(ηh ).
Dies impliziert
n |(a − a)(u , v )| |(l − l )(v )| o h h h h h . + vh ∈Vh k∇vh k k∇vh k
k∇ηh k ≤ c max
Zusammen mit der bekannten H 1 -Fehlerabsch¨atzung
k∇(u − uh )k ≤ chm kukH m folgt
n |(a − a)(u , v )| |(l − l )(v )| o h h h h h . + vh ∈Vh k∇vh k k∇vh k
k∇(u − u ˜h )k ≤ chm kukH m + c max Im n¨achsten Schritt werden wir zeigen, daß
n |(a − a)(u , v )| |(l − l )(v )| o h h h h h ≤ c hmin{m,r−m+2} kukH m . + vh ∈Vh k∇vh k k∇vh k max
(3.5.130)
Dies impliziert dann den ersten Teil der Behauptung k∇(u − u ˜h )k ≤ chmin{m,r−m+2} kukH m .
(3.5.131)
126
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
(iii) Konsistenz: Als n¨ achstes sch¨ atzen wir den Abstand“ zwischen a(·, ·) und ah (·, ·) sowie ” l(·) und lh (·) ab. F¨ ur uh , vh ∈ Vh folgt mit Hilfe der Absch¨atzung des Integrationsfehlers in Satz 3.15: X Z a∇uh ∇vh dx − QT (a∇uh ∇vh ) |(a − ah )(uh , vh )| ≤ T
T ∈Th
≤ cq
X
hrT
T ∈Th
Z
T
|∇r (a∇uh ∇vh )| dx.
Durch Ausdifferenzieren erhalten wir |(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH r (T ) k∇vh kH r (T ) ,
wobei die Konstante c wesentlich durch Schranken f¨ ur die Ableitungen der Koeffizientenfunktion a(x) bestimmt ist. Bei Beachtung von vh|T ∈ Pm−1 ergibt sich |(a − ah )(uh , vh )| ≤ c
X
T ∈Th
hrT k∇uh kH m−2 (T ) k∇vh kH m−2 (T ) .
Mit Hilfe der inversen Beziehung“ f¨ ur finite Elemente gilt ” k∇vh kT , k∇vh kH m−2 (T ) ≤ ch2−m T womit folgt: |(a − ah )(uh , vh )| ≤ chr−m+2
X
T ∈Th
k∇uh k2H m−2 (T )
1/2
k∇vh k.
Die Terme in uh werden unter Verwendung der Knoteninterpolierenden Ih u ∈ Vh und mit Hilfe der inversen Beziehung sowie der lokalen Interpolationsabsch¨atzungen wie folgt abgesch¨atzt: k∇uh kH m−2 (T ) ≤ kuh − Ih ukH m−1 (T ) + kIh u − ukH m−1 (T ) + kukH m−1 (T ) kuh − Ih ukH 1 (T ) + chT k∇m ukT + kukH m−1 (T ) ≤ ch2−m T
ku − Ih ukH 1 (T ) + kukH m (T ) kuh − ukH 1 (T ) + ch2−m ≤ ch2−m T T
kuh − ukH 1 (T ) + kukH m (T ) . ≤ ch2−m T
Zusammenfassen der bisherigen Absch¨atzungen ergibt |(a − ah )(uh , vh )| ≤ chr+2−m h2−m kuh − ukH 1 + kukH m k∇vh k,
und unter Verwendung der bekannten H 1 -Fehlerabsch¨atzung kuh − ukH 1 ≤ chm−1 kukH m : |(a − ah )(uh , vh )| ≤ chr+2−m kukH m k∇vh k.
(3.5.132)
Auf analoge Weise erschließen wir |(l − lh )(vh )| ≤ chr−m+2 k∇vh k kukH m .
(3.5.133)
Die Absch¨atzungen (3.5.132) und (3.5.133) ergeben (3.5.130) und damit das Resultat (3.5.131). (iv) L2 -Fehlerabsch¨ atzung: Zur Absch¨ atzung des Fehlers in der L2 -Norm bedienen wir uns wieder
3.5 Implementierungsaspekte
127
eines Dualit¨ atsarguments. Sei z ∈ V die (eindeutige) L¨osung des Hilfsproblems −∇ · {a∇z} = uh − u ˜h
in Ω,
z = 0 auf ∂Ω.
Wegen der angenommenen Glattheit von a und der Konvexit¨at von Ω ist z ∈ H 2 (Ω) und gen¨ ugt der a-priori Absch¨ atzung ˜h k. kzkH 2 ≤ ckuh − u Sei zh ∈ Vh die Ritz-Projektion von z . Mit dieser Konstruktion erhalten wir mit Hilfe der Galerkin-Orthogonalit¨ at: kuh − u ˜h k2 = a(uh − u ˜h , z) = a(uh − u ˜h , zh )
= a(uh , zh ) − (a − ah )(˜ uh , zh ) − ah (˜ uh , zh )
= (l − lh )(zh ) − (a − ah )(˜ uh , zh ).
Die beiden St¨ orungsterme werden nun analog wie unter (iii) abgesch¨atzt. Zun¨achst gilt wieder mit Hilfe der inversen Beziehung: X hrT k∇˜ uh kH m−2 (T ) k∇zh kH m−2 (T ) |(a − ah )(˜ uh , zh )| ≤ c T ∈Th
≤ chr+3−m
X
T ∈Th
k∇˜ uh k2H m−2 (T )
1/2 X
T ∈Th
k∇zh k2H 1 (T )
1/2
.
F¨ ur die beiden Summen erhalten wir analog wie oben unter (iii): X
T ∈Th
sowie
k∇˜ uh k2H m−2 (T ) X
T ∈Th
1/2
k∇zh k2H 1 (T )
k˜ uh − ukH 1 + kukH m , ≤ ch2−m T
1/2
˜h k. ≤ ckzkH 2 ≤ ckuh − u
Kombination dieser Absch¨ atzungen und Ber¨ ucksichtigung der schon bewiesenen H 1 -Fehlerabsch¨ atzung ergibt dann: |(a − ah )(˜ uh , zh )| ≤ chr−m+3 kuh − u ˜h kkukH m .
(3.5.134)
|(l − lh )(zh )| ≤ chr−m+3 kuh − u ˜h k.
(3.5.135)
Analog erschließen wir
Kombinieren aller vorausgehenden Beziehungen ergibt kuh − u ˜h k ≤ chr−m+3 kukH m . Zusammen mit der bekannten L2 -Fehlerabsch¨atzung f¨ ur eh = u − uh erhalten wir schließlich ku − u ˜h k ≤ chmin{m,r−m+3} kukH m , was den Beweis vervollst¨ andigt.
Q.E.D.
128
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Bemerkung 3.12: Die Aussage von Satz 3.16 kann so interpretiert werden, daß zur Vermeidung einer Reduzierung der Konvergenzordnung O(hm−1 ) in der Energie-Norm eine Quadraturformel der Ordnung r ≥ 2m − 3 verwendet werden sollte. Damit w¨ urden dann im Falle eines konstanten Koeffizienten a die Matrixelemente anm exakt berechnet werden. F¨ ur bloße Konvergenz u ˜h → u (h → 0) w¨ are die Wahl r ≥ max{d, m − 2} ausreichend, vorausgesetzt die Zul¨assigkeitsbedingung ist erf¨ ullt.
3.6 A posteriori Fehleranalyse und Gittersteuerung
129
3.6 A posteriori Fehleranalyse und Gittersteuerung Eine wichtige Rolle bei der L¨ osung von partiellen Differentialgleichungen spielen die beiden Aspekte Fehlerkontrolle und Gittersteuerung. Hat man eine approximative L¨osung uh berechnet, ist es von Interesse, den Fehler zwischen dieser N¨aherung und der exakten L¨osung u bzgl. eines geeigneten Maßes abzusch¨ atzen. Zu diesem Zweck dienen sog. a-posteriori Fehlersch¨atzer“, ” welche im besten Fall ausschließlich von berechneten Gr¨oßen und den Daten f abh¨angen. In diesem Abschnitt wollen wir einfache residuen-basierte Fehlersch¨atzer f¨ ur das Modellproblem der 1. RWA des Laplace-Operators herleiten. Eine globale Verfeinerung des ganzen Rechengebietes ist in drei Dimensionen in der Regel nicht realisierbar, da der Speicherplatz auf den verf¨ ugbaren Rechnern dazu nicht ausreicht. Deshalb versucht man, nur dort lokal zu verfeinern, wo es die L¨osungsstruktur bzw. die Genauigkeitsanforderungen verlangen. Unter optimaler Gittersteuerung wird dabei verstanden, m¨oglichst wenige markierte Elemente des Gitters zu verfeinern, so daß der Fehler in m¨oglichst wenigen Schritten unter eine vorgegebene Toleranz gedr¨ uckt wird. Die Wahl der zu verfeinernden Elemente trifft man aufgrund sog. lokaler Fehlerindikatoren“, aus denen sich der globale Fehlersch¨atzer ” zusammensetzt. Solche Gittersteuerungsmethoden werden wir im zweiten Teil dieses Abschnitts diskutieren.
3.6.1 Allgemeine a posteriori Fehlerabsch¨ atzung Aus der a priori Fehlersch¨ atzung aus Abschnitt 3.4 konnten wir die Konvergenzordnung des Diskretisierungsfehlers eh = u − uh schon f¨ ur verschiedene Normen herleiten: – Energienorm-Fehlerabsch¨ atzung: – L2 -Norm-Fehlerabsch¨ atzung: – L∞ -Absch¨ atzung:
k∇eh k ≤ ci cs h kukH 2 , keh k ≤ ci cs h2 kukH 2 ,
maxΩ |eh | ≤ ci cs h2 | ln(h)| M2 (u),
mit lokalen Interpolationskonstanten ci und globalen Stabilit¨atskonstanten cs . Leider sind diese Absch¨atzungen f¨ ur eine quantitative Fehlerkontrolle nicht zu gebrauchen, da die n¨otigen Informationen u oheren Ableitungen der exakten L¨osung u fehlen und insbesondere pr¨azise ¨ber die h¨ Absch¨atzungen f¨ ur die Stabilit¨ atskonstanten cs i.a. nicht zur Verf¨ ugung stehen. Ist aber der Charakter einer lokalen Singularit¨ at der L¨osung bekannt, wie z.B. im Fall von Ecken- oder ” Kantensingulariut¨ aten“, so kann diese Information zur vorab Anpassung des Gitters verwendet werden. Dabei wird die Gitterweite h in Richtung auf die singuil¨are Stelle hin systematisch verkleinert, etwa gem¨ aß h(r) ≈ h0 r α wobei der Exponent α > 1 aus dem bekannten singul¨aren Verhalten der Ableitungen der L¨ osung abgeleitet wird. In allgemeinen Situationen muß man sich aber heuristischer Methoden zur Bestimmung der Regularit¨at der L¨ osung bedienen. Dies l¨auft (in Anlehnung an die traditionelle, abschneidefehlerbasierte Vorgehensweise bei Differenzenverfahren) auf die Sch¨atzung der lokalen Glattheit der unbekannten L¨ osung aus der berechneten numerischen Approximation hinaus. Zum Beispiel kann man versuchen, auf einem Zellblock (etwa aus 2d Zellen) aus einer linearen N¨aherungsl¨osung uh durch Anwendung eines Differenzenquotienten ∇2h zweiter Ordnung im Schwerpunkt zT einer
130
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Zelle T ∈ Th eine Sch¨ atzung der zweiten Ableitungen von u auf T zu gewinnen: max |∇2 u||T ≈ ηT := |∇2h uh (zT )||T . T
(3.6.136)
Auf der Basis dieses Indikators ließen sich dann Strategien zu lokaler Gitterverfeinerung oder -vergr¨oberung aufstellen: Ist zum Beispiel ηT auf einer Zelle T ∈ Th u ¨ berdurchschnittlich groß, so wird diese in Teilzellen zerlegt. Diese Strategie der ad hoc Gitteranpassung erfordert keinen großen Aufwand und funktioniert in der Praxis in vielen F¨allen erstaunlich gut. Daher sind Varianten dieser Strategie derzeit auch in vielen kommerziellen Programmen realisiert, wenn diese u ¨berhaupt Gitteradaption beinhalten. Dabei gibt es aber die folgenden grunds¨atzlichen Schw¨achen: – Die Auswertung von (3.6.136) liefert keine Aussage u ¨ber die tats¨achliche Gr¨oße des Fehlers eh = u − uh . – Die auf den lokalen Indikatoren ηT basierende Gitterverfeinerungsstrategie geht davon aus, daß der gemessene“ Fehler in T auch dort entstanden ist und durch lokale Verfeinerung ” von T reduziert werden kann. Dies ist aber i.a. nicht richtig, da dabei das Ph¨anomen der globalen Fehlerakkumulation“ (auch pollution effect“ genannt) vernachl¨assigt wird. ” ” Ziel der folgenden Diskussion ist es, u ¨ ber eine a posteriori Fehleranalyse via Dualit¨atsargumente systematisch auswertbare und zuverl¨ assige Fehlersch¨atzer zu entwickeln, aus denen auch effiziente Kriterien zur lokalen Gitteranpassung abgeleitet werden k¨onnen. Wir betrachten dazu wieder das Modellproblem −∆u = f
in Ω,
u = 0 auf ∂Ω,
(3.6.137)
auf einem (nicht notwendig konvexen) Polygon- oder Polyedergebiet Ω ⊂ Rd . Die durch die Variationsgleichung (∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V = H01 (Ω),
(3.6.138)
definierte schwache L¨ osung u ∈ H01 (Ω) wird durch ein Galerkin-Finite-Elemente-Verfahren approximiert. Wir konzentrieren uns im folgenden auf die Approximation mit linearen“ finiten ” (1) Elementen. Die N¨ aherungsl¨ osung uh = Rh u ∈ Vh ⊂ V ist bestimmt durch die Gleichung (∇uh , ∇ϕh ) = (f, ϕh )
∀ϕh ∈ Vh .
(3.6.139)
Bei der Sch¨ atzung des Fehlers eh muß man sich f¨ ur ein geeignetes Fehlermaß“ entscheiden, ” welches sich am Bedarf der betrachteten Anwendung orientieren sollte. Beispiele sind etwa wie schon oben erw¨ ahnt die traditionellen Maße Energienorm“, L2 -Norm sowie L∞ -Norm. Weitere ” Beispiele sind: – Mittelwerte: – Linienintegrale: – Ableitungswerte:
|(eh , ψ)Ω |,
ψ ∈ C(Ω),
|(eh , ψ)Γ |, |∂i eh (a)|,
ψ ∈ C(∂Ω), a ∈ Ω.
Um alle diese Sonderf¨ alle im Rahmen einer einheitlichen Theorie behandeln zu k¨onnen, f¨ uhren wir zun¨achst den Begriff des Fehlerfunktionals“ ein. Dies ist ein (der Einfachheit halber als ”
3.6 A posteriori Fehleranalyse und Gittersteuerung
131
linear angenommenes) Funktional J(·) : V → R, bzgl. dem der Fehler eh gesch¨ atzt werden soll; d.h. gesucht ist eine berechenbare Schranke f¨ ur J(eh ) = J(u) − J(uh ) . Zu einem solchen Fehlerfunktional geh¨ort eine (eindeutige) duale ” L¨osung“ z ∈ V , welche als L¨ osung des zugeh¨origen dualen Problems“ bestimmt ist: ” (∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V.
(3.6.140)
Testen wir in (3.6.140) mit ϕ = eh ∈ V , so ergibt sich unter Ber¨ ucksichtigung der GalerkinOrthogonalit¨ at die Fehleridentit¨ at J(eh ) = (∇eh , ∇z) = (∇eh , ∇(z − ψh )),
ψh ∈ Vh .
(3.6.141)
Dies wird nun weiter mit Hilfe von elementweise partieller Integration umgeformt zu X J(eh ) = − (∆eh , z − ψh )T + (∂n eh , z − ψh )∂T T ∈Th
=
X
T ∈Th
(f + ∆uh , z − ψh )T − (∂n uh , z − ψh )∂T .
Da z − ψh stetige Spuren entlang ∂T hat und in der obigen Summe jede Kante zweimal auftritt mit wechselnder Richtung der Normalableitung ∂n uh , erhalten wir X (3.6.142) (f + ∆uh , z − ψh )T − 21 ([∂n uh ], z − ψh )∂T , J(eh ) = T ∈Th
wobei auf inneren“ Kanten [∂n uh ]|Γ := ∂n uh|T + ∂n′ uh|T ′ jeweils den Sprung der Normalablei” tung u ¨ ber Γ ⊂ ∂T zur Nachbarzelle bedeutet. Entlang von Kanten am Rand, Γ ⊂ ∂Ω , setzen wir [∂n uh ]|Γ := 2∂n uh . Diese Fehleridentit¨at beinhaltet Information u ¨ber die Abh¨angigkeit des Fehlerterms J(eh ) von den lokalen Residuen“ RT := (f + ∆uh )|T und r∂T := − 21 [∂n uh ]|∂T : ” ∂J(eh ) ≈ (z − ψh )|T , ∂RT
∂J(eh ) ≈ (z − ψh )|∂T . ∂r∂T
(3.6.143)
Damit k¨onnen wir hoffen, auf das spezielle Zielfunktional J(eh ) bezogene Kriterien f¨ ur lokale Gitterverfeinerung und damit Reduzierung dieser Residuen zu gewinnnen. Dabei mißt“ das ” Zellresiduum“ R(uh ) das Erf¨ ulltsein der Differentialgleichung durch die N¨aherungsl¨osung uh ” und das Kantenresiduum“ r(uh ) deren Glattheit“. ” ” Von der exakten Fehlerdarstellung (3.6.142) k¨onnen wir nun in mehreren Schritten weitere, gegebenenfalls leichter auswertbare Fehlerabsch¨ atzungen ableiten. Zun¨achst ist X (3.6.144) |J(eh )| ≤ (f + ∆uh , z − ψh )T − 12 ([∂n uh ], z − ψh )∂T , T ∈Th
und weiter
|J(eh )| ≤
X (f + ∆uh , z − ψh )T − 1 ([∂n uh ], z − ψh )∂T . 2
T ∈Th
(3.6.145)
132
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Bei Beachtung von z−ψh|∂Ω = 0 folgt dann mit Hilfe der H¨olderschen Ungleichung: |J(eh )| ≤
o X n kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T .
(3.6.146)
T ∈Th
Die letzte Absch¨ atzung schreiben wir in der kompakten Form X |J(eh )| ≤ η(uh ) := ρT (uh ) ωT (z) + ρ∂T (uh ) ω∂T (z)
(3.6.147)
T ∈Th
mit den Zellresiduentermen“ ” ρT (uh ) := kf + ∆uh kT ,
−1/2
ρ∂T (uh ) := 21 hT
k[∂n uh ]k∂T \∂Ω ,
und den Zellgewichten“ ” ωT (z) := kz − Ih zkT ,
1/2
ω∂T (z) := hT kz − Ih zk∂T .
Die Fehlerdarstellung (3.6.142) bzw. die Fehlerabsch¨atzung (3.6.147) sind nicht unmittelbar auswertbar. Zwar sind die Residuenterme“ R(uh ) = f + ∆uh und r(uh ) = − 12 [∂n uh ] aus der ” N¨aherung uh berechenbar, doch die Wichtungsfaktoren z − ψh sind nur implizit u ¨ber das duale Problem (3.6.140) gegeben und m¨ ussen gesondert bestimmt werden. Mit dieser kritischen Frage werden wir uns im Folgenden noch eingehender besch¨aftigen. Die Zellgewichte lassen sich bei Wahl ψh := Ih z mit Hilfe der lokalen Interpolationsfehlerabsch¨atzungen aus Abschnitt 3.3 weiter absch¨atzen durch ωT (z) ≤ ci h3T max{|∇2 z|}. T
(3.6.148)
Hierbei muß nat¨ urlich vorausgesetzt werden, daß die duale L¨osung z ∈ H 2,∞ (Ω) ist. Wir werden sp¨ater sehen, wie man sich von dieser sehr einschr¨ankenden Annahme in gewisser Weise befreien kann. Die Interpolationskonstante ci ist von verschiedenen Faktoren abh¨angig: Von dem Polynomgrad der verwendeten Interpolierenden, vom Referenzelement Tˆ sowie von den Transformationen σT : Tˆ → T . Sie stellt einen Unsicherheitsfaktor dar. Genaueres Nachrechnen ergibt eine Gr¨ oßenordnung von ci ≈ 0, 1 − 10 . Die a posteriori Fehlerabsch¨ atzung (3.6.147) ist zuverl¨assig“ im Sinne, daß sie eine siche” re obere Schranke f¨ ur den Fehler |J(eh )| liefert, vorausgesetzt, es liegen zuverl¨assige Werte f¨ ur die Gewichte ωT (z) und ω∂T (z) vor. Sie w¨are auch effizient“, wenn f¨ ur den zugeh¨origen ” ¨ Effektivit¨atsindex“ ( Ubersch¨ atzungsfaktor“) gilt: ” ” Ieff :=
η(uh ) ≤ c0 |J(eh )|
(h → 0).
(3.6.149)
¨ Bemerkung 3.13: Es ist zu bemerken, daß bereits der Ubergang von der Fehleridentit¨ at“ ” ¨ (3.6.142) zur Fehlerabsch¨ atzung“ (3.6.144) in gewissen F¨allen zu einer groben Ubersch¨ atzung ” des tats¨achlichen Fehlers f¨ uhren kann. Betrachten wir hierzu folgendes Beispiel: Auf dem Quadrat Ω = (−1, 1) × (−1, 1) gilt es, f¨ ur die Poisson-Gleichung den Punktfehler im Ursprung zu finden: J(eh ) = eh (0) . Es ist m¨ oglich, die rechte Seite f und das Gitter Th so anti-symmetrisch bzgl. x = 0 zu konstruieren, daß u(0) = 0 = uh (0) . In diesem Fall wird aber in der Regel η(uh ) ≈ h2 > 0 sein, d.h.: Ieff = ∞ .
3.6 A posteriori Fehleranalyse und Gittersteuerung
133
3.6.2 Spezielle a posteriori Fehlersch¨ atzer Der oben abgeleitete allgemeine Fehlersch¨atzer wird nun f¨ ur verschiedene spezielle Fehlerfunktionale ausgewertet. In den betrachteten F¨allen lassen sich die Gewichte ωT (z), ω∂T (z) analytisch absch¨atzen. Wir beschr¨ anken uns hier auf die Betrachtung von P1 -Elementen. a) Energienorm-Fehlersch¨ atzer: Zur Absch¨atzung des Energienormfehlers“ k∇eh k w¨ahlen wir das Fehlerfunktional ” J(ϕ) := k∇eh k−1 (∇ϕ, ∇eh ), so daß wir f¨ ur ϕ = eh automatisch J(eh ) = k∇eh k haben. F¨ ur die zugeh¨orige L¨osung z ∈ V des dualen Problems (∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.150)
gilt dann k∇zk2 = k∇eh k−1 (∇z, ∇eh ) ≤ k∇zk, woraus sich die folgende einfache a priori Absch¨atzung k∇zk ≤ 1 ergibt. Ausgehend von der allgemeinen Fehlerabsch¨ atzung (3.6.146) erhalten wir X k∇eh k ≤ kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T . T ∈Th
Wir w¨ahlen nun ψh := Ih z als eine verallgemeinerte“ Knoteninterpolierende von z , f¨ ur welche ” die folgende lokale Fehlerabsch¨ atzung gilt: 1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ c˜i hT k∇zkT˜ ,
(3.6.151)
wobei T˜ := ∪{T ′ ∈ Th : T ′ ∩ T 6= ∅} . Damit folgt dann mit den Residuen ρT (uh ) und ρ∂T (uh ) : X −1/2 k∇eh k ≤ c˜i hT kf + ∆uh kT + 12 hT k[∂n uh ]k∂T \∂Ω k∇zkT˜ T ∈Th
≤ c Wegen
X
T ∈Th
1/2 1/2 X k∇zk2T˜ h2T ρT (uh )2 + ρ∂T (uh )2 . T ∈Th
X
T ∈Th
k∇zk2T˜
ergibt sich schließlich das folgende Resultat:
1/2
≤ ck∇zk ≤ c,
Satz 3.17 (a posteriori Energienormfehler): F¨ ur den Fehler eh := u − uh gilt die a posteriori Absch¨ atzung bzgl. der Energienorm: X 1/2 h2T ρT (uh )2 + ρ∂T (uh )2 . (3.6.152) k∇eh k ≤ ηE (uh ) := c T ∈Th
134
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Diese Absch¨ atzung ist in folgendem Sinne “scharf“: X 1/2 h2T kf k2T . ηE (uh ) ≤ ck∇eh k + c
(3.6.153)
T ∈Th
Beweis: Es bleibt, die Absch¨ atzung (3.6.153) zu beweisen. Dazu verwenden wir folgende Regularit¨atsaussage: F¨ ur eine Funktion v ∈ H 1 (Ω) mit der Eigenschaft ∆v ∈ L2 (Ω) existiert ∂n v ∈ L2 (∂Ω) und gen¨ ugt der Absch¨ atzung k∂n vk∂Ω ≤ cΩ k∆vkΩ + k∇vkΩ .
Wir wenden dies auf der Referenzzelle Tˆ an und erhalten mit Hilfe des u ¨blichen Transformationsarguments auf jeder einzelnen Zelle T ∈ Th f¨ ur entsprechende Funktionen v ∈ H 1 (T ) die Absch¨atzung 2 (3.6.154) k∂n vk2∂T ≤ c∗ hT k∆vk2T + h−1 T k∇vkT , mit einer von h unabh¨ angigen Konstanten c∗ .
Auf jeder Zelle T ∈ Th ist uh|T ∈ P1 (T ) und folglich ρT (uh )2 = kf + ∆uh k2T = kf k2T . F¨ ur ein T ∈ Th sei T˜ := ∪{T ′ ∈ Th | T ′ und T haben gemeinsame Kante.} . Wegen der Stetigkeit von ∂h u u ¨ber Zellkanten hinweg, ist [∂n uh ] = −[∂n eh ] . Mit Hilfe der Absch¨atzung (3.6.154) ur T ′ ∈ T˜ : folgt damit wegen hT ≈ hT ′ f¨ X k∂n eh k2∂T ′ \∂Ω h2T ρ∂T (uh )2 = 14 hT k[∂n eh ]k2∂T \∂Ω ≤ chT ≤ c∗ hT = c∗
X
T ′ ∈T˜
X
T ′ ∈T˜
T ′ ∈T˜
2 hT ′ k∆eh k2T ′ + h−1 T ′ k∇eh kT ′
h2T kf k2T ′ + k∇eh k2T ′ .
Dies impliziert nach Summation u ¨ber T ∈ Th die behauptete Absch¨atzung (3.6.153). Q.E.D. Bemerkung 3.14: Mit einer etwas aufwendigeren Argumentation kann man die folgende versch¨arfte a posteriori Absch¨ atzung herleiten: X 1/2 h2T h2T k∇f k2T + ρ∂T (uh )2 . ηE (uh ) ≤ c T ∈Th
Diese besagt, daß im Fehlersch¨ atzer ηE (uh ) in der Regel der Einfluß der Gleichungsresiduen kf + ∆uh kT gegen¨ uber den Regularit¨ atsresiduen k[∂n uh ]k∂T \∂Ω vernachl¨assigt werden k¨onnen. Dies ist in dieser Form allerdings nur richtig f¨ ur lineare bzw. bilineare finite Elemente. b) L2 -Norm-Fehlersch¨ atzer: Zur Absch¨atzung des L2 -Fehlers keh k w¨ahlen wir das Fehlerfunktional
3.6 A posteriori Fehleranalyse und Gittersteuerung
135
J(ϕ) := keh k−1 (ϕ, eh ), womit automatisch J(e) = keh k gilt. Die zugeh¨orige L¨osung z ∈ V des dualen Problems (∇ϕ, ∇z) = J(ϕ)
∀ϕ ∈ V
(3.6.155)
ist dann auf dem konvexen Gebiet Ω auch in H 2 (Ω), und es gilt die a priori Absch¨atzung k∇2 zk ≤ k∆zk = 1 . Ausgehend von der Fehlerabsch¨atzung (3.6.146) erhalten wir wieder X kf + ∆uh kT kz − ψh kT + 21 k[∂n uh ]k∂T \∂Ω kz − ψh k∂T . keh k ≤ T ∈Th
Wir k¨onnen nun ψh := Ih z als die normale Knoteninterpolierende von z w¨ahlen: 1/2
kz − Ih zkT + hT kz − Ih zk∂T ≤ ci h2T k∇2 zkT .
(3.6.156)
Damit folgt dann wieder mit den oben definierten Residuen ρT (uh ) und ρ∂T (uh ) : X −1/2 h2T kf + ∆uh kT + 21 hT k[∂n uh ]k∂T \∂Ω k∇2 zkT keh k ≤ ci T ∈Th
≤ c Wegen
X
T ∈Th
1/2 X 1/2 h4T ρT (uh )2 + ρ∂T (uh )2 k∇2 zk2T . T ∈Th
X
T ∈Th
k∇2 zk2T
ergibt sich schließlich das folgende Resultat:
1/2
= k∇2 zk ≤ 1,
Satz 3.18 (a posteriori L2 -Normfehler): F¨ ur den Fehler eh := u − uh gilt die a posteriori Absch¨ atzung bzgl. der L2 -Norm: X 1/2 h4T ρT (uh )2 + ρ∂T (uh )2 . (3.6.157) keh k ≤ ηL2 (uh ) := c T ∈Th
Diese Absch¨ atzung ist ebenfalls scharf“ in folgendem Sinne: ” X 1/2 h4T kf k2T . ηL2 (uh ) ≤ ckeh k + c
(3.6.158)
T ∈Th
Beweis: Der Beweis verl¨ auft analog wie bei der Energienorm-Fehlerabsch¨atzung. Diesmal basiert die Herleitung der Umkehrabsch¨ atzung (3.6.158) auf der zellweisen Beziehung 2 k∂n vk2∂T ≤ c∗ {hT k∆vk2T + h−3 T kvkT },
(3.6.159)
welche ebenfalls durch Transformation von der Einheitszelle abgeleitet wird. Der Rest des Be¨ weises sei als Ubungsaufgabe gestellt. Q.E.D.
136
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
c) Punktfehler-Sch¨ atzer: Zur Absch¨atzung des Fehlers eh (a) in einem festen Punkt P ∈ Ω w¨ urden wir gern das Fehlerfunktional J(ϕ) := ϕ(P ) w¨ ahlen. Dieses ist auf stetigen Funktionen, aber nicht auf dem ganzen L¨osungsraum V = H01 (Ω) definiert, so daß die oben entwickelte allgemeine Theorie nicht unmittelbar anwendbar w¨ are. Deshalb w¨ ahlen wir eine Kugelumgebung Bε := {x ∈ Rd : |x − P | < ε} des Punktes P und arbeiten statt dessen mit dem regularisierten Funktional Z −1 ϕ dx, Jε (ϕ) := |Bε | Bε
welches sicher auf ganz V definiert und beschr¨ankt ist. Der Regularisierungsparameter ε wird u ur hinreichend glatte ¨blicherweise gleich einer vorgegebenen Fehlertoleranz T OL gesetzt. F¨ Funktionen ϕ ist dabei (Fehler der Mittelpunktregel) |ϕ(P ) − Jε (ϕ)| ≤ c ε2 .
(3.6.160)
Wir betrachten den Fall d = 2 . Die L¨osung zε ∈ V des zugeh¨origen dualen Problems (∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
(3.6.161)
ist dann eine regularisierte“ Greensche Funktion und verh¨alt sich wie ” −2 zε (x) ≈ log(|x−P | + ε) , |∇2 zε | ≈ |x−P | + ε .
Die Gewichte in der a posteriori Fehlerabsch¨atzung (3.6.147) gestatten daher die Absch¨atzung ωT (zε ) + ω∂T (zε ) ≤ ch2T k∇2 zε kT ≤ c h3T d−2 T , mit dT := maxx∈T {|x−a| + ε} . Wir finden also als obere Schranke f¨ ur den Punktfehler: |eh (P )| ≤ c
X
T ∈Th
ρT (uh )h2T k∇2 zε kT + cε2 ≤ c
X
ρT (uh )
T ∈Th
h3T + cε2 . d2T
In diesem Fall ist aber die a-priori Bestimmung der Konstante c praktisch unm¨oglich.
d) Ein hyper-singul¨ arer Fall Einen kuriosen Sonderfall stellt die folgende Auswertungsgr¨oße dar: Z Z Z ∆u dx = − f dx . ∂n u ds = J(u) := ∂Ω
Ω
Ω
Dieser mittlere Normalfluß“ ließe sich offenbar auch direkt aus den Daten f berechnen. Zur ” Illustration wollen wir aber annehmen, daß diese Information nicht ausgenutzt wird, sondern statt dessen J(u) durch J(uh ) approximiert wird. Das Funktional J(·) ist wieder nicht auf dem ganzen L¨ osungsraum V definiert (wohl aber auf der regul¨areren L¨osung u ∈ V ∩ H 2 (Ω) ). Zur Anwendung unserer allgemeinen Theorie muß das Funktional daher zun¨achst regularisiert werden. F¨ ur das Folgende nehmen wir der Einfachheit halber an, daß Ω der Einheitskreis im R2 ist. F¨ ur ε = T OL setzen wir Sε := {x ∈ Ω, dist{x, ∂Ω} < ε} und erhalten f¨ ur glattes ϕ :
3.6 A posteriori Fehleranalyse und Gittersteuerung
−1
Jε (ϕ) := ε
Z
∂r ϕ dx =
137
Z
∂Ω
Sε
∂r ϕ ds + O(ε).
Dabei ist ∂n auf Sε auf nat¨ urliche Weise durch Fortsetzung von ∂Ω definiert. Die L¨osung zε ∈ V des zugeh¨ origen dualen Problems (∇ϕ, ∇zε ) = Jε (ϕ)
∀ϕ ∈ V,
ist dann gegeben durch zε = −1 in Ω\Sε ,
zε (x) = −ε−1 (1−|x|)
Hieraus ergibt sich die Fehlerabsch¨ atzung X h2T ρT (uh )k∇2 zε kT ≈ |Jε (eh )| ≤ ci T ∈Th
auf Sε .
X
... ,
T ∩Sε 6=∅
d.h.: Die Zellen im Innern von Ω tragen nicht zum Gesamtfehler bei. Daher w¨are die beste Strategie zur Gitterverfeinerung, in jedem Verfeinerungszyklus jeweils nur die Zellen entlang des Randes ∂Ω zu verfeinern. Dies setzt aber voraus, daß die Elemente des Lastvektors, bn = (n) (f, ϕh )Ω , exakt berechnet werden. Abbildung 3.5 zeigt ein automatisch verfeinertes Gitter nach 7 Verfeinerungszyklen sowie die numerisch bestimmte duale L¨osung auf diesem Gitter. Die zugeh¨origen Ergebnisse sind in Tabelle 3.1 gelistet.
Abbildung 3.5: Verfeinertes Gitter nach 7 Verfeinerungszyklen (links) und die auf diesem Gitter numerisch bestimmte L¨ osung (rechts).
ηE
optimale“ Strategie ” L N J(eh )
L
N
J(eh )
1
1024
2.91 + 0
1
559
2.90 + 0
2
4096
1.50 + 0
2
1294
1.50 + 0
3
16384
3
3079
4
64768
7.49 − 1
4
7174
5
253858
3.77 − 1
7.48 − 1
5
16738
6
memory
1.73 − 1
exhausted
6
38146
3.62 − 1 1.67 − 1 6.93 − 2
Tabelle 3.1: Resultate mit dem Energienorm-Fehlersch¨atzer ηE (uh ) und der optimalen“ Strategie. ”
138
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Numerische Auswertung des a-posteriori Fehlersch¨ atzers Wir wollen nun kurz die numerische Auswertung der Fehleridentit¨at (3.6.142) diskutieren: X J(eh ) = η(uh ) := (3.6.162) (f + ∆uh , z − ψh )T − 21 ([∂n uh ], z − ψh )∂T . T ∈Th
Wir w¨ahlen dazu ψh := Ih z , die Knoteninterpolierende von z . Die Qualit¨at der Auswertung wird durch den sog. Effektivit¨ atsindex“ gemessen: ” η(u ) h Ieff := . J(eh )
Alle Methoden der Auswertung von (3.6.162) bedienen sich einer numerischen L¨osung zh ∈ Vh des dualen Problems, welche im einfachsten Fall durch direkte Diskretisierung von (3.6.162) mit Hilfe des vorliegenden Verfahrens gewonnen wird: (∇ϕh , ∇zh ) = J(ϕh )
∀ϕh ∈ Vh .
(3.6.163)
Wir unterscheiden zwei Anwendungen der Fehleridentit¨at (3.6.162): ¨ – Uberpr¨ ufung der Genauigkeit einer auf dem Gitter Th berechneten N¨aherungsl¨osung uh und Abbruchkriterium f¨ ur einen Gitterverfeinerungsprozess: η(uh ) ≤ T OL ? – Grundlage zur Gewinnung von Kriterien ( Verfeinerungsindikatoren“ ηT ) zur lokalen Git” teranpassung. Die folgenden Strategien zur Auswertung von η(uh ) kommen in Betracht (hier beschrieben f¨ ur den Fall d-linearer Ans¨ atze auf Rechteckgittern im Rd ): 1. Die duale L¨ osung z wird durch eine N¨aherung h¨oherer Ordnung approximiert. Zum Bei(2) spiel liefert die Approximation z ≈ zh mit der d-quadratischen Ritz-Projektion das gew¨ unschte asymptotische Verhalten limT OL→0 Ieff = 1 . 2. Die duale L¨ osung z wird durch eine zellblockweise (je 2d Zellen) d-quadratische Inter(2) polierende der d-linearen Ritzapproximation approximiert: z ≈ Ih zh . In diesem Fall beobachtet man limT OL→0 Ieff < 1 (≈ 0.5 − 0.9). 3. Die Differenz z−Ih z wird in Anlehnung an die oben zitierte Interpolationsfehlerabsch¨atzung mit Hilfe eines skalierten Differenzenquotienten der d-linearen Ritz-Proktion approximiert: ¨ uhrt in der Regel auf eine grobe Ubersch¨ atzung des Fehlers. |z −Ih z| ≈ ci,T h2T |∇2h zh | . Dies f¨ In der Praxis wird meist die billige“ und ausreichend genaue Prozedur (2) verwendet. Dabei ” brauchen insbesondere keine Interpolationskonstanten ci spezifiziert zu werden. 3.6.3 Strategien zur Gittersteuerung Ziel ist es, den Fehler in dem durch das Fehlerfunktional J(·) beschriebenen Maß unter eine gewisse vorgegebene Toleranz |J(eh )| ≤ T OL zu bringen und dabei mit dem vorhandenen Speicher auszukommen. Es k¨ onnen also nur eine bestimmte Anzahl von Zellen N ≤ Nmax verwaltet
3.6 A posteriori Fehleranalyse und Gittersteuerung
139
werden. Die Gitterverfeinerung erfolgt dabei standardm¨aßig durch Kantenbisektion“, d.h. durch ” Unterteilung einer Zelle T in 2d Teilzellen. Bei Gittervergr¨oberung werden mehrere Zellen zu einer Makrozelle zusammengefaßt. Wir werden im folgenden haupts¨achlich Vierecks- oder Hexaedergitter betrachten. Bei Unterteilung einer Zelle entstehen sog. h¨angende“ Knoten auf den ” Zellr¨andern, so daß das neue Gitter zun¨achst nicht zul¨assig w¨are. Diese Unzul¨assigkeit kann durch verschiedenen Methoden aufgehoben werden. Die meist gebr¨auchliche ist die Elimination der zu den h¨ angenden Knoten geh¨ orenden Freiheitsgraden durch lineare Interpolation, wodurch der entstehende diskrete Ansatzraum wieder konform wird: Vh ⊂ V (s. Bild 3.6). Dabei wird der fiktive Knotenwert vh (P ) in einem h¨angenden Knoten P auf einer Kante Γ ⊂ ∂T mit Endpunkten P ′ , P ′′ durch die Interpolationsvorschrift vh (P ) := 12 {vh (P ′ )+vh (P ′′ )} festgelegt. Alle im folgenden gezeigten Beispielrechnungen bedienen sich dieser Technik.
4 x
Abbildung 3.6: Verfeinertes Rechteckitter mit h¨angendem“ Knoten sowie die Basisfunktion zum ” Mittelknoten. Ausgangspunkt zur Gewinnung von Kriterien f¨ ur die lokale Gitteranpassung ist eine aposteriori Fehlersch¨ atzung der Form X |J(eh )| ≈ ηT , (3.6.164) T ∈Th
mit lokalen Fehlerindikatoren“ ηT , welche durch Auswertung der Fehleridentit¨at (3.6.142) mit ” Hilfe einer der oben beschriebenen Methoden gewonnen werden. Wir erhalten bei Verwendung von Methode (2): (2) (2) ηT := (f + ∆uh , Ih zh − zh )T − 12 ([∂n uh ], Ih zh − zh )∂T \∂Ω
(3.6.165)
und mit Methode (3):
ηT := ci h2T {ρT (uh ) + ρ∂T (uh )} k∇2h zh kT .
(3.6.166)
Wir beschreiben im folgenden das allgemeine Schema eines auf lokalen Fehlerindikatoren ηT basierenden Gitteranpassungsprozesses: Nachdem u ¨ ber das Gebiet Ω ein Grobgitter T0 := Th0 mit einer Gitterweitenverteilung h0 gelegt worden ist, sei der Prozeß der adaptiven Gittersteuerung schon L-mal durchlaufen worden. Wir bestimmen nun auf dem Gitter TL := ThL die approximative L¨osung uL ∈ VL := VhL . Ebenso wird die diskrete duale L¨ osung zL ∈ VL auf TL berechnet. Nun k¨onnen die lokalen
140
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
Fehlerindikatoren ηT gem¨ aß (3.6.165) oder (3.6.166) f¨ ur jede Zelle T ∈ TL ausgewertet werden. Wir bezeichnen mit NL ≈ dim(VL ) die Anzahl der Zellen des Gitters TL . ullt, wird Abbruchabfrage: Ist das Abbruchkriterium η(uh ) ≤ 12 T OL auf dem Gitter TL erf¨ der Adaptionsprozess abgebrochen und zL als N¨aherung zu u akzeptiert, welche die Zielgr¨ oße J(u) durch J(uh ) mit der gew¨ unschten Genauigkeit T OL approximiert. Andernfalls wird ein neuer Adaptionszyklus begonnen. ¨ Adaptionszyklus: Der Ubergang vom Gitter TL zum n¨achsten Gitter TL+1 erfolgt nach einer der im folgenden beschriebenen Adaptionsstrategien“. Zun¨achst werden die Zellen T ∈ TL nach ” der Gr¨oße ihrer Indikatorwerte ηT angeordnet, {Ti , i = 1, ..., NL } :
ηT,1 ≥ ... ≥ ηT,i ≥ ηT,i+1 ≥ ... ≥ ηT,NL .
I) Fehlerbalancierungs-Strategie: Das Ziel ist, die Indikatorwerte so zu balancieren, daß ηT ≈
T OL , NL
T ∈ TL .
(3.6.167)
Dann w¨ urde wie gew¨ unscht gelten: |J(eL )| ≈ η(uL ) ≈
X T OL = T OL. NL
T ∈TL
Das Problem bei dieser Strategie ist zum einen, daß die Zahl NL sich w¨ahrend des Verfeinerungsprozesses st¨ andig ¨ andert, und zum anderen, daß die Balancierungsvorschrift (3.6.167) die delikate Wahl von Parametern 0 < α < β < 1 erfordert: α
T OL T OL ≤ ηT ≤ β . NL NL
F¨ ur die folgende Diskussion setzen wir der Einfachheit halber α = 1/2, β = 1 . Im ersten Schritt testet man, ob ηT,1 ≤ T OL/NL ist. Wenn ja“, ist das Abbruchkriterium erf¨ ullt, wenn nein“, ” ” uhrt zu einer Erh¨ohung von NL auf NL + 3 . Danach w¨ are wird die Zelle T1 verfeinert. Dies f¨ es m¨oglich, daß f¨ ur alle u ¨brigen Zellen TL,i gilt: T OL T OL ≤ ηT,i ≤ . NL + 3 NL Der Verfeinerungszyklus w¨ are also bereits nach dem ersten Schritt zu beenden und auf dem erhaltenen Gitter TL+1 eine neue N¨ aherungsl¨osung uL+1 zu berechnen. Dies w¨are aber sehr ineffizient. Der Verfeinerungsprozeß sollte daher beschleunigt werden. Dazu u uft man von ¨ berpr¨ dem Indikator ηT,1 ausgehend und beginnend mit j = 0 , ob ηT,i ≤
T OL . NL + 3j
Ist dies nicht erf¨ ullt, wird das Element Ti geteilt, die Z¨ahler j und i um Eins erh¨oht, und man geht zum n¨ achstkleineren ηT,i u ullt, hat man das ¨ ber. Ist die Bedingung allerdings erf¨ neue Gitter TL+1 gefunden. Diese Balancierungsstrategie ist zwar potentiell optimal, jedoch mit aufwendigen Abfragen verbunden. M¨ogliche alternative Strategien, die einfacher sind, aber weniger gute Ergebnisse liefern, sind die folgenden.
3.6 A posteriori Fehleranalyse und Gittersteuerung
141
II) Fest-Raten-Strategie“: Ziel ist es, in jedem Adaptionszyklus die Anzahl der Gitterzellen ” NL mit einer festen Rate zu erh¨ ohen oder den Fehlersch¨atzwert η(uL ) mit einer festen Rate zu verkleinern. Ausgangspunkt ist wieder eine Anordnung der Zellen von TL nach der Gr¨oße der zugeh¨origen Indikatorwerte. Zu vorgew¨ahlten Prozents¨atzen X% und Y % werden die Zellen so gruppiert, daß (and der Zellanzahl orientierte Strategie) #{Ti , . . . , TN∗ } ≈
X NL , 100
#{TNL −N ∗ +1 , . . . , TNL } ≈
Y NL , 100
oder alternativ (am Sch¨ atzwert orientierte Strategie) N∗ X i=1
ηT,i ≈ Y η(uL ),
NL X
i=NL
−N ∗ +1
ηT,i ≈ X η(uL ).
Dann werden die Zellen Ti , . . . , TN∗ verfeinert und die Zellen TNL −N ∗ +1 , . . . , NL vergr¨obert. Exakte“ Gitteroptimierung ” Zum Abschluß wollen wir noch diskutieren, daß die Fehlersch¨atzung (3.6.147) X ρT (uh ) ωT (zh ) |J(eh )| ≈ η :=
(3.6.168)
T ∈Th
im Prinzip auch zur direkten Bestimmung eines optimalen“ Gitters mit Gitterweitenfunktion ” h = h(x) verwendet werden k¨ onnte. Dies wird als Nebenprodukt auch eine Rechtfertigung f¨ ur ¨ die Aquilibrierungsstrategie“ liefern. Zu l¨osen sind die folgenden Optimierungsaufgaben: ” (OP I) Bei vorgegebener Fehlertoleranz TOL soll die zu deren Erreichung ben¨otigte Anzahl von Zellen N (d.h. der numerische Aufwand) minimiert werden: N → M IN,
η ≤ T OL.
(3.6.169)
(OP II) Bei vorgegebener maximalen Zellzahl Nmax (d.h. begrenzter Speicherkapazit¨at) soll der Fehler (genauer der Fehlersch¨ atzer) minimiert werden: η → M IN,
N ≤ Nmax .
(3.6.170)
Wir diskutieren im folgenden nur die f¨ ur die Praxis relevantere Fragestellung (OP II). Das Op¨ timierungsproblem (OP I) l¨ aßt sich mit analogen Argumenten behandeln (Ubungsaufgabe). Die grundlegende Annahme ist, daß die Gr¨oßen ρT (uh ) sowie ωT (zh ) (nach geeigneter Skalierung) f¨ ur T OL → 0 zunehmend bessere, lokale Approximationen gewisser kontinuierlicher Funktionen Φ(x) bzw. Ψ(x) sind: −3/2
−1 1 kh−1 h−1 T [∂n uh ]k∂T \∂Ω → Φu (xT ), T ρT (uh ) = hT kf + ∆uh kT + 2 hT o n −5/2 kz − I zk , h kz − I zk → Ψz (zT ), h−3 ωT (zh ) = max h−3 T h h ∂T T T
(3.6.171) (3.6.172)
wobei xT ein gemeinsamer Punkt einer Folge von Zellen T ist. Diese Annahme ist nat¨ urlich im strengen Sinne nicht realistisch, da auf allgemeinen Gitterfolgen (Th )h→0 ein sehr unre-
142
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
gelm¨aßiges Konvergenzverhalten auftreten kann. Unter der obigen Annahme gilt mit der Funktion A(x) := Φ(x)Ψ(x) : Z X X h(x)2 A(x) dx. (3.6.173) h4T h−4 ρ (u ) ω (z ) ≈ ρT (uh ) ωT (zh ) = T T h h T Ω
T ∈Th
T ∈Th
F¨ ur die Zellzahl N haben wir die Darstellung N =
X
X
1 =
h2T h−2 T
T ∈Th
T ∈Th
Z
≈
h(x)−2 dx.
(3.6.174)
Ω
Damit k¨onnen wir die Optimierungsaufgabe (OP II) n¨aherungsweiser in kontinuierlicher Form schreiben als: Z Z 2 h(x)−2 dx = Nmax . (3.6.175) h(x) A(x) dx → M IN, N (h) := F (h) := Ω
Ω
Hierbei haben wir o.B.d.A. die Ungleichungsbedingung N ≤ Nmax durch eine Gleichungsbedingung N = Nmax ersetzt, da sich ein minimaler Fehler sicherlich unter maximaler Ausnutzung der m¨ oglichen Zellzahl ergibt. Dieses restringierte Optimierungsproblem wird nun mit dem Lagrange-Formalismus der Variationsrechnung gel¨ost. Dazu definieren wir die Lagrange” Funktion“ L(h, λ) := F (h) + λ {N (h) − Nmax } mit einem skalaren Lagrange-Parameter λ ∈ R. Jede L¨osung des Optimierungsproblems ist dann notwendig station¨ arer Punkt (Sattelpunkt) von L . Zur Bestimmung eines solchen Sattelpunkts machen wir den Ansatz d L(h + tϕ, λ + tµ)|t=0 = 0 dt
∀ϕ ∈ C(Ω), ∀µ ∈ R.
Auswertung dieser Beziehung ergibt Z Z 2 h(x)A(x)ϕ(x) dx − 2λ h−3 (x)ϕ(x) dx = 0 Ω
Ω
sowie µ bzw. notwendig
Z
−2
h(x) Ω
−3
h(x)A(x) − λh
dx − Nmax
= 0 ∀µ ∈ R, h(x)−2 dx = Nmax .
Ω
h(x) =
W :=
Z
(x) = 0,
Hieraus ergibt sich, daß
und weiter
Z
Ω
A −1/4 λ
∀ϕ ∈ C(Ω)
,
A(x)1/2 dx = λ1/2 Nmax .
3.6 A posteriori Fehleranalyse und Gittersteuerung
143
Damit erhalten wir einerseits den Lagrange-Parameter, λ=
W 2 , Nmax
und andererseits eine Gleichung f¨ ur die gesuchte optimale“ Gitterweitenverteilung ” W 1/2 hopt (x) = A(x)−1/4 . Nmax
(3.6.176)
(3.6.177)
Als Nebenprodukt dieser Rechnung ergibt sich f¨ ur die optimale Gitterweite die Beziehung ηT = h4T AT = λ−1 ≡ konst.,
(3.6.178)
¨ d.h.: Die an der Aquilibrierung der lokalen Fehlerindikatoren ηT orientierten Gittersteuerungsstrategien f¨ uhren tats¨ achlich auf optimale Gitterweitenverteilungen. Wir erw¨ahnen noch, daß das zu (OP I) duale“ Optimierungsproblem (OP II) auf die folgende ” L¨osung f¨ uhrt: hopt (x) =
T OL 1/2 W
A(x)−1/4 .
(3.6.179)
Die Gr¨oße W ist bei den u ¨ blichen Fehlerfunktionalen wohl definiert; dies beinhaltet sogar so singul¨are F¨ alle wie die Punktauswertung von Ableitungen J(u) = ∂i u(a) , wobei A(x) ∼ |x−a|−3 . Erst die Auswertung von zweiten Ableitungen J(u) = ∂i2 u(a) macht hier Probleme.
3.6.4 Ein Testbeispiel
Wir wollen die bisher erzielten Ergebnisse anhand eines konkreten Beispiels illustrieren. Dazu wird wieder das u ¨ bliche Modellproblem betrachtet: −∆u = f
in Ω,
u = 0 auf ∂Ω.
(3.6.180)
Wir wollen den Punktwert ∂1 u(P ) f¨ ur ein P ∈ Ω berechnen. Das zugeh¨orige Funktional ist wieder nicht auf dem ganzen L¨ osungsraum V = H01 (Ω) definiert und muß regularisiert werden. Wir setzen dazu mit ε := T OL : Z −1 Jε (ϕ) := |Bε | ∂1 u dx . (3.6.181) Bε
Testfall 1: Sei Ω := (−1, 1)2 und P = 0 (siehe Abb. 3.7). Die zu dem Funktional Jε (·) geh¨orige duale L¨osung zε verh¨ alt sich dann wie |∇2 zε (x)| ≈ (|x| + ε)−3 . Dies impliziert, daß |∂1 eh (0)| ≈ ci
X h4 T ρT (uh ), d3T
T ∈Th
(3.6.182)
144
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
mit dT := |xT | + ε und dem Mittelpunkt xT von T . Wir wollen hierf¨ ur eine optimale Gitter¨ weitenverteilung bestimmen. Ausgangspunkt ist die Aquilibrierungsbedingung ηT ≈
h4T T OL ≈ 3 N dT
⇒
3/2
h2T ≈ dT
T OL 1/2 N
.
Hieraus ergibt sich N=
X
h2T h−2 T =
N 1/2 N 1/2 X −3/2 ≈ h2T dT T OL T OL T ∈Th
T ∈Th
und folglich Nopt ≈ T OL−1 . Bei Verwendung des Energienorm-Fehlersch¨atzers (3.6.152) zur Gitterverfeinerung ergibt sich dagegen die Gitterkomplexit¨at Nopt ≈ T OL−2 . Dieses vorhergesagte Verhalten der verschiedenen Gitterverfeinerungsprozesse wird durch die numerischen Ergebnisse in Tabelle 3.2 gut best¨ atigt. TOL
N
L
ηweight(uh )
Ieff
4−2
|∂1 eh (0)|
148
6
7.51e-1
5.92e-2
0.08
4−3
940
9
4.10e-1
1.42e-2
0.03
4−4
4912
12
4.14e-3
3.50e-3
0.65
4−5
20980
15
2.27e-4
9.25e-4
4.16
4−6
86740
17
5.82e-5
2.38e-4
4.16
Tabelle 3.2: Resulte der Berechnung von ∂1 u(0) unter Verwendung des gewichteten a posteriori Fehlersch¨atzers ηweight (uh ) f¨ ur verschiedenen Verfeinerungslevel L ; der Effektivit¨atsindex“ ist ” definert durch Ieff := |ηweight (uh )/∂1 eh (0)|. Wir betonen, daß die richtige Wahl des Regularisierungsparameters ε = T OL in (3.6.181) f¨ ur den L¨osungsprozess wichtig ist. Die triviale Alternative ε = hmin ist automatisch realisiert, wenn zur Berechnung der Gewichte ωT (z) die numerisch bestimmte, diskrete, duale L¨osung zh ∈ Vh verwendet wird (siehe Abb. 3.7). Dies kann bei sehr singul¨aren“ Funktionalen zu ” ¨ starker lokaler Uberverfeinerung, d.h. zu unn¨otig vielen Verfeinerungsschritten, f¨ uhren.
Abbildung 3.7: Verfeinerte Gitter und numerisch bestimmte duale L¨osung zur Berechnung von ∂1 u(0) auf dem Quadrat bei Verwendung des a posteriori Fehlersch¨atzers ηweight (uh ) mit TOL = 4−4 .
3.6 A posteriori Fehleranalyse und Gittersteuerung
145
Testfall 2: Sei nun Ω das Rechteckgebiet Ω = (−1, 1) × (−1, 3) mit Schlitz bei (0, 0) (siehe Abb. 3.9). Die Pr¨ asenz der (einspringenden) scharfen Ecke mit Innenwinkel ω = 2π bewirkt in der schwachen L¨ osung eine Eckensingularit¨at“ der Form s = ψ(θ)r 1/2 , d.h. eine Singularit¨ at ” im Gradienten. Wir wollen illustrieren, wie diese Eckensingularit¨at mit der durch die Gewichte ωT (z) im Fehlersch¨ atzer induzierten zusammenspielt. Wir sehen in Abb. 3.9, daß der gewichtete Fehlersch¨atzer Zellen sowohl bei der Schlitzspitze (zur Unterdr¨ uckung des Pollutionseffekts“), aber auch beim Auswertungspunkt konzentriert, ” w¨ahrend der Energienorm-Fehlersch¨ atzer wesentlich st¨arker an der Schlitzspitze und nat¨ urlich gar nicht im Auswertungspunkt verfeinert.
"ETA_weight" "ETA_E"
0.1
"ERROR" "ETA_weight"
0.01 e_x(-2.,.5)
e_x(-2.,.5)
0.01
0.001
0.001 0.0001
1e-05
0.0001 1000
10000 Number of elements N
100000
1000
10000 Number of elements N
Abbildung 3.8: Vergleich der Effizienz von ηE (uh ) und ηweight (uh ) auf dem Schlitzgebiet.
Abbildung 3.9: Verfeinerte Gitter mit ungef¨ahr 5000 Zellen zur Berechnung von ∂1 u(P ) , erzeugt mit dem gewichteten Fehlersch¨ atzer ηweight (uh ) (mittig) sowie dem Energienorm-Fehlersch¨atzer ηE (uh ) (rechts).
146
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
¨ 3.7 Ubungen ¨ Ubung 3.1: Man formuliere das Ritzsche Verfahren mit endlich dimensionalen Teilr¨aumen geeigneter Sobolew-Raume H m (Ω) f¨ ur die folgenden Aufgabenstellungen: a) Neumannsche RWA des Laplace-Operators: −∆u = f in Ω,
∂n u = g auf ∂Ω.
b) Eigenwertproblem des Laplace-Operators: −∆u = λu in Ω,
u = 0 auf ∂Ω.
c) Dirichletsche RWA des “biharmonischen” Operators: −∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω.
Dabei seien jeweils das Gebiet Ω sowie die Daten f, g als gen¨ ugend regul¨ar und kompatibel angenommen. Man versuche, hierf¨ ur analog zur Vorlesung “Bestapproximations”-Aussagen herzuleiten. ¨ Ubung 3.2: Seien V ein Hilbert-Raum mit Skalarprodukt (·, ·)V und zugeh¨origer Norm k·kV und a(·, ·) sowie l(·) bilineare bzw. lineare Formen auf V mit den Eigenschaften |a(v, w)| ≤ αkvkV kwkV , |a(v, v)| ≥ κkvk2V ,
|l(v)| ≤ βkvkV ,
v, w ∈ V
v, w ∈ V v∈V
(Beschr¨anktheit),
(“V-Elliptizit¨at”),
(Beschr¨anktheit).
Dann hat die Variationsgleichung a(u, ϕ) = l(ϕ)
∀ϕ ∈ V
nach dem Satz von Lax-Milgram eine eindeutige L¨osung u ∈ V . F¨ ur endlich dimensionale Teilr¨aume Vh ⊂ V werden approximative L¨osungen uh ∈ Vh bestimmt durch die “GalerkinGleichungen” a(uh , ϕh ) = l(ϕh ) ϕh ∈ Vh . a) Man zeige hierf¨ ur die (eindeutige) Existenz der “diskreten” L¨osungen uh ∈ Vh und die Fehlerabsch¨ atzung α inf ku − ϕh kV . ku − uh kV ≤ κ ϕh ∈Vh b) Man wende das Resultat von (a) zum Nachweis der Konvergenz der Galerkin-Approximation des Diffusions-Konvektions-Problems −∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
auf einem regul¨ aren Gebiet Ω ⊂ R2 mit rechter Seite f ∈ L2 (Ω) an. c) Man versuche das Resultat von (a) f¨ ur den Fall zu verallgemeinern, daß die Biliearform a(·, ·)
¨ 3.7 Ubungen
147
nicht V -elliptisch sondern nur “koerzitiv” ist, d.h.: a(v, ϕ) ≥ γkvk, ϕ∈V \{0} kϕkV sup
a(ϕ, v) ≥ γkvk, ϕ∈V \{0} kϕkV sup
v ∈ V.
Worin bestehen hierbei die Probleme? ¨ Ubung 3.3: Das Modellproblem −∆u = f in Ω,
u|∂Ω = 0,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einem ¨aquidistanten, kartesischen Gitter mit der Gitterweite h mit Hilfe der Finite-Elemente-Methode mit st¨ uckweise bilinearen Ansatzfunktionen diskretisiert. Man stelle die zugeh¨ origen Systemmatrizen auf: a) mit exakter Integration, b) unter Verwendung der 2-dimensionalen “Tensorprodukt-Trapezregel” 4
QT (f ) :=
|T | X f (ai ), 4
ai Eckpunkte der Zelle T.
i=1
Welche Besonderheit ergibt sich? ¨ Ubung 3.4: Man u ¨berlege (etwa durch Konstruktion von Beispielen), in wie weit die folgenden Bedingungen an eine Folge von (im Sinne der Vorlesung regul¨aren) Zerlegungen {Th }h>0 eines Gebiets Ω ⊂ R2 (in Dreiecke oder Vierecke) a¨quivalent sind: a) Die inneren Winkel aller Zellen T ∈ Th sind gleichm¨aßig f¨ ur T ∈ Th und h > 0 von Null wegbeschr¨ankt (“minimum angle condition”). b) F¨ ur die Inkreisradien ρT und Umkreisradien hT der Zellen T ∈ Th gilt (“uniform shape condition”): nh o T sup < ∞. T ∈Th , h>0 ρT c) F¨ ur die Seiten Γ ⊂ ∂T jeder Zelle T ∈ Th gilt max |Γ| ≤ c min |Γ|
Γ⊂∂T
Γ⊂∂T
mit einer von T unabh¨ angigen Konstante c. (1) ¨ uckweise linearen finiten Elemente bzgl. einer Ubung 3.5: Sei Vh ⊂ H 1 (Ω) der Raum der st¨ 2 regul¨aren Triangulierung von Ω ⊂ R . Mit Hilfe des L2 -Skalarprodukts (·, ·) ist die sog. “L2 (1) Projektion” Ph : L2 (Ω) → Vh definiert durch die Vorschrift (1)
(Ph u, ϕh ) = (u, ϕh ) ∀ϕh ∈ Vh . a) Man leite eine Fehlerabsch¨ atzung f¨ ur die L2 -Norm ku − Ph uk her, zun¨achst unter der An2 nahme v ∈ H (Ω) . Was w¨ urde man unter den schw¨acheren Regularit¨atsannahmen v ∈ H 1 (Ω)
148
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
oder v ∈ L2 (Ω) erhalten? b) Welche verbesserte Absch¨ atzung erh¨alt man bzgl. der “negativen” Sobolew-Norm ku − Ph uk−1 :=
(u − Ph u, ϕ) ≤ ch? kvkH 2 ? k∇ϕk 1 ϕ∈H (Ω) sup 0
¨ Ubung 3.6: Man begr¨ unde anhand der eindimensionalen Poisson-Gleichung −u′′ (x) = f (x) in Ω = (0, 1),
u(0) = u(1) = 0,
(1)
daß f¨ ur die Ritz-Projektion Rh : H01 (Ω) → Vh eine Absch¨atzung wie in Aufgabe 6.3b nicht gelten kann. (Hinweis: Man verifiziere, daß in diesem Fall die Ritz-Projektion Rh u identisch mit der Knoteninterpolierenden Ih u ist.)
¨ Ubung 3.7: Die Dirichletsche Randwertaufgabe −∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 werde mit einem Galerkin-Verfahren mit An(1) satzr¨aumen Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert. Mit welcher ” Ordnung konvergieren i) der gewichtete Mittelwert u ¨ ber Ω ( ω ∈ H 1 (Ω) eine glatte Gewichtsfunktion): Z Z uω dx (h → 0) ? uh ω dx → Ω
Ω
ii) der quadratischen Mittelwert u ¨ber einen glatten geschlossenen Weg Γ ⊂ Ω : Z Z u2 ds (h → 0) ? u2h ds → Γ
Γ
(Hinweis: Zur Erzielung eines optimalen Resultats verwende man die Variante des Spurlemmas f¨ ur Funktionen in H 1,1 (Ω) und die Fehlerabsch¨atzungen aus der Vorlesung.)
¨ Ubung 3.8: Man untersuche, ob die folgenden S¨atze von Funktionalen f¨ ur die angegebenen Polynomr¨aume “unisolvent” sind. Dabei bezeichnen ai die Ecken, mi die Seitenmitten sowie bij (j = 1, 2) jeweils zwei Gauß-Punkte auf der Kante Γi , i = 1, . . . , d + 1 , und z den Schwerpunkt des Elements T . i) T (kartesisches) Einheitsdreieck: P (T ) = P3 (T ), P (T ) = P3 (T ), P (T ) = P5 (T ),
p(ai ), ∇p(ai ), p(z); p(ai ), p(bij ), p(z);
p(ai ), ∇p(ai ), ∇2 p(ai ), ∂n p(mi ).
¨ 3.7 Ubungen
149
ii) T (kartesisches) Einheitsquadrat: ˜ 1 (T ) := P1 (T ) ⊕ span{x2 − y 2 }, p(mi ); P (T ) = Q ˜ 3 (T ) := P3 (T ) ⊕ span{x3 y, xy 3 }, p(ai ), ∇p(ai ). P (T ) = Q ¨ Ubung 3.9: Sei Ω ⊂ R2 ein Polygongebiet und Th = {T } eine Triangulierung von Ω . Man betrachte die beiden mit den kubischen Ans¨atzen aus Aufgabe 7.2 gebildeten Ansatzr¨aumen (3) (3) Sh und S˜h und bestimme deren Dimensionen asymptotisch in Abh¨angigkeit von h auf gleichm¨aßigen Triangulierungen. Wieviele von Null verschiedene Elemente haben die zugeh¨origen Steifigkeitsmatrizen pro Zeile bei der Approximation der Laplace-Gleichung? ¨ Ubung 3.10: Die Neumannsche Randwertaufgabe −∆u + u = f in Ω,
∂n u = 0 auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 soll mit einem Galerkin-Verfahren mit Ansatzr¨aumen (1) Vh ⊂ V := H01 (Ω) von linearen” finiten Elementen approximiert werden. ” a) Man formuliere diese Approximation, d. h. die Ansatzr¨aume Vh ⊂ V := H 1 (Ω) und die zugeh¨origen Variationsgleichungen. b) Man leite Fehlerabsch¨ atzhungen in der H 1 - und der L2 -Norm her. c) Wie muß dieser Ansatz im Fall eines krumm berandeten Gebiets und einer inhomogenen Neumann-Randbedingung ∂n u = g auf ∂Ω zur Erzielung einer konformen Approximation modifiziert werden? ¨ Ubung 3.11: Die Randwertaufgabe −∆u = f in Ω,
u|∂Ω = 0,
auf einem Gebiet Ω ⊂ R2 mit (st¨ uckweise) kubisch (z. B. CAD-Daten mit kubischen SplineFunktionen) parametrisiertem C 2 -Rand ∂Ω soll mit einem (isoparametrischen) kubischen FiniteElemente-Ansatz diskretisiert werden. In diesem Fall hat die L¨osung mindestens die Regularit¨atsstufe u ∈ H 3 (Ω) (i. Allg. aber u 6∈ H 4 (Ω) ), und es gilt die a priori Absch¨atzung kuk2+k ≤ ck∆ukk ,
k = 0, 1.
a) Man gebe einen geeigneten Ansatzraum an. Welche Konvergenzordnungen sind daf¨ ur zu 1 2 erwarten bzgl. der Energie-Norm (H -Seminorm) und der L -Norm, und welche Regularit¨ at muß dabei jeweils f¨ ur die L¨ osung u vorausgesetzt werden? b) Welche Fehlerordnung l¨ aßt sich mit Hilfe eines Dualit¨atsarguments f¨ ur die Mittelwerte zeigen, d. h.: Z Z u dx u dx − ≤ ch? kuk? ? h Ω
Ω
¨ Ubung 3.12: Sei T ⊂ R2 ein Dreieck mit Durchmesser hT und Inkreisradius ρT mit hT ≤ cρT , und sei Ih v die lineare Interpolierende mit den Funktionswerten in den Eckpunkten von
150
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
T als Knotenwerte. Man zeige mit den Mitteln der Vorlesung die Absch¨atzung 3/2
kv − Ih vk∂T ≤ chT k∇2 vkT . Hierdurch wird auch die Absch¨ atzung 1/2
kv − Ih vk∂T ≤ chT k∇vkT nahegelegt. Kann diese gelten? ¨ Ubung 3.13: Man gebe die bestm¨ oglichen h-Potenzen in den folgenden Interpolationsfehlerabsch¨atzungen f¨ ur die Lagrange-Interpolation in P (T ) := P2 (T ) an: (i) (ii) (iii) (iv)
k∇2 (v − IT v)kT ≤ ci h?T k∇3 vkT ;
|(v − IT v)(a)| ≤ ci h?T k∇3 vkT ;
k∂n (v − IT v)k∂T ≤ ci h? k∇3 vkT ;
kv − IT vkT ≤ ci h?T k∇2 vkT .
¨ Ubung 3.14: Zur Finite-Elemente-Approximation des sog. Plattenbiegeproblems” (Randwert” problem des biharmonischen” Operators) ” ∆2 u = f in Ω,
u = ∂n u = 0 auf ∂Ω,
wird wieder von einer zugeh¨ origen variationellen Formulierung ausgegangen. Diese ist auf nat¨ urliche Weise im Sobolew-Raum V := H02 (Ω) = {v ∈ H 2 (Ω)| u|∂Ω = ∂n u|∂Ω = 0} definiert: Finde u ∈ V mit a(u, ϕ) := (∆u, ∆ϕ) = (f, ϕ) ∀ϕ ∈ V. Die Bilinearform ist a(·, ·) V -elliptisch, so daß die betrachtete RWA eine eindeutige schwache” ” L¨osung u ∈ V besitzt. Auf einem Rechteck Ω ist diese schwache L¨osung sogar in H 4 (Ω) und gen¨ ugt der a priori Absch¨ atzung kukH 4 ≤ ckf k. F¨ ur einen konformen Finite-Elemente-Ansatzraum Vh muß nun gelten Vh ⊂ V , d.h.: die st¨ uckweise polynomialen Ansatzfunktionen m¨ ußen global stetig differenzierbar sein. Das Grundgebiet Ω sei als konvex polygonal angenommen. a) Einen konformen Finite-Elemente-Ansatzraum Vh ⊂ V erh¨alt man mit Hilfe des quintischen Argyris-Elements. Man gebe hierf¨ ur eine Fehlerabsch¨atzung in der Energienorm” sowie in der ” L2 -Norm an. (Hinweis: Dualit¨ atsargument.) b) Welche Spektral-Kondition in Abh¨angigkeit von der Gitterweite h ist f¨ ur die zugeh¨orige Steifigkeitsmatrix Ah zu erwarten? ¨ Ubung 3.15: Die Steifigkeitsmatrix und der Lastvektor eines kubischen FE-Ansatzes zur Approximation der RWA −∆u = 0 in Ω, u|∂Ω = 0, auf einer Triangulierung von Ω ⊂ R2 werde mit Hilfe numerischer Quadratur berechnet.
¨ 3.7 Ubungen
151
a) Von welcher Ordnung sollte die verwendete Quadraturformel sein, damit (i) Konvergenz des resultierenden Verfahrens bzgl. der Energienorm garantiert ist, und (ii) seine Ordnung optimal ist? Man gebe jeweils ein Verfahrensbeispiel (Quadraturformel) mit m¨oglichst geringer Komplexit¨at (Anzahl der Funktionsauswertungen) an. b) Zur Illustration der Notwendigkeit bzw. Nichtnotwendigkeit der in der Vorlesung abgeleiteten Bedingungen an die numerische Quadratur betrachte man die Approximation der 1. RWA des Laplace-Operators auf dem Einheitsquadrat mit bilinearen finiten Elementen auf einem ¨aquidistanten, kartesischen Gitter. Welches Differenzenschema erh¨alt man, wenn die Elemente der Systemmatrix mit der Mittelpunktsregel berechnet werden? Diese Situation ist durch die Theorie aus der Vorlesung nicht abgedeckt. Ist das resultierende Verfahren dennoch konvergent? ¨ Ubung 3.16: F¨ ur die Systemmatrix Ah einer Finite-Elemente-Diskretisierung f¨ ur die 1. RWA des Laplace-Operators −∆u = f in Ω, u = 0 auf ∂Ω, wurde in der Vorlesung f¨ ur “quasi-gleichf¨ormige” Triangulierungsfolgen (Th )h>0 die Kondition cond2 (Ah ) = O(h−2 ) gezeigt. (i) Man rekapituliere, was f¨ ur eine Triangulierungsfolge “quasi-gleichf¨ormig” bedeutet. (ii) Wie h¨angt die Kondition von Ah von den Inkreis- bzw. Inkugelradien der Zellen ab, wenn die Triangulierungsfolge nicht “formregul¨ar” ist? (iii) Man untersuche die Abh¨ angigkeit der Kondition der Systemmatrix cond2 (Ah ) der “5Punkte-Differenzendiskretisierung auf ¨aquidistanten Tensorproduktgittern mit unterschiedlichen Gitterweiten hx 6= hy vom Seitenverh¨altnis hx /hy (“aspect ratio”). (Hinweis: Man verallgemei¨ nere die in einer fr¨ uheren Ubungsaufgabe hergeleiteten expliziten Formeln f¨ ur die Eigenwerte der 5-Punkte-Matrix f¨ ur die vorliegende Situation.) ¨ Ubung 3.17: Man rekapituliere den Beweis der Konditionsabsch¨atzung cond2 (Ah ) = O(h−2 ) aus der Vorlesung f¨ ur die Systemmatrix einer FE-Diskretisierung der 1. RWA (“Dirichletsche RWA”) des Laplace-Operators auf einer “quasi-gleichf¨ormigen” Triangulierungsfolge f¨ ur die FEDiskretisierung der 2. RWA (“Neumannsche RWA”): −∆u = f in Ω,
∂n u = 0 auf ∂Ω.
¨ Ubung 3.18: Es werde die inhomogene Neumannsche RWA −∇ · (α∇u) + γu = f in Ω,
n · (α∇u) = g auf ∂Ω,
auf einem konvexen Polygongebiet Ω ⊂ R2 betrachtet. Die Daten α , γ , f und g seien glatt und ferner α, γ > 0 . Mit Hilfe der FEM mit st¨ uckweise linearen Ansatzfunktionen wird eine (1) 1 N¨aherung uh ∈ Vh ⊂ H (Ω) berechnet. a) Man gebe die zugeh¨ orige variationelle Formulierung an. b) Man leite eine a posteriori Fehlerabsch¨atzung f¨ ur den Energie-Norm-Fehler her: keh kE := (α∇eh , ∇eh )Ω + (γeh , eh )Ω
1/2
.
c) Man leite eine a posteriori Fehlerabsch¨atzung f¨ ur den L2 -Norm-Fehler keh k2 her.
152
Finite-Elemente-Verfahren f¨ ur elliptische Probleme
¨ Ubung 3.19: Die 1. RWA des Laplace-Operators auf einem konvexen Polygongebiet Ω ⊂ R2 werde durch lineare” finite Elemente auf einer Triangulierung Th von Ω approximiert. Man ” zeige, daß die in der Vorlesung abgeleitete a posteriori Absch¨atzung f¨ ur den L2 -Norm-Fehler, ku − uh k2 ≤ c ηL2 (uh ) mit dem Sch¨ atzer” ” ηL2 (uh ) :=
X
T ∈Th
1/2 2 h4T kf + ∆uh k22;T + 12 h−1 k[∂ u ]k , n h 2;∂T \∂Ω T
asymptotisch optimal ist, d.h.: ηL2 (uh ) ≤ cku − uh k2 +
X
T ∈Th
h4T kf + ∆uh k22
1/2
.
Dazu verwende man die Spur-Absch¨ atzung” ” −3/2
1/2
k∂n vk2;∂T ≤ chT k∆vk2;T + hT
kvk2;T ,
deren genaue h-Potenzen man mit Hilfe des u ¨ blichen Transformationsarguments aus der entsprechenden Ungleichung auf einer Einheitszelle” (Beweisskizze zur Wiederholung) erh¨alt. ” ¨ Ubung 3.20: In Anlehnung an die Argumentationsweise der Vorlesung (siehe auch das Skriptum) leite man eine Formel f¨ ur eine Gitterweitenfunktion h(x) her, welche in folgendem Sinne “optimal” ist: N → min!, η(uh ) ≤ T OL, wobei N :=
Z
h(x)−2 dx,
η(uh ) :=
Ω
Z
h(x)2 A(x) dx. Ω
¨ Ubung 3.21: Dem in der vorigen Aufgabe verwendeten Optimierungsargument liegt die Annahme zugrunde, daß sich die Zellresiduen im wesentlichen wie 1/2
ρT := kf + ∆uh kT + 21 hT k[∂n uh ]k∂T = O(hT ) verhalten. Man zeige, daß dies im Fall linearer Ansatzfunktionen auf einer quasi-gleichf¨ormigen (regul¨ar mit “uniform shape”- und “uniform-size”-Eigenschaft) Folge von Triangulierungen im R2 mit hT ∼ h tats¨ achlich der Fall ist. Dazu verwende man die bekannte a priori Fehlerabsch¨atzung k∇(u − uh )k∞ ≤ chk∇2 uk∞
unter der Annahme u ∈ W 2,∞ (Ω) , sowie die gleichfalls bekannten lokalen Interpolationsfehlerabsch¨atzungen und “inversen” Beziehungen f¨ ur Finite-Elemente-Funktionen. (Bem.: Die Annahme der Quasi-Gleichf¨ ormigkeit ist nat¨ urlich unrealistisch, da ja im Endeffekt gerade lokal verfeinerte Gitter erzeugt werden sollen.)
4 Iterative L¨ osungsverfahren fu ¨ r FD- und FE-Gleichungen In diesem Kapitel werden iterative L¨osungsverfahren f¨ ur die durch Anwendung einer FiniteDifferenzen- oder Finite-Elemente-Diskretisierung entstehenden (linearen) Gleichungssysteme diskutiert. Dies sind neben den traditionellen Fixpunktiterationen vor allem sog. PCG-Verfahren“ ” (preconditioned conjugate gradient methods) und die modernen Mehrgittermethoden“. Zugrun” de gelegt wird dabei meist wieder das Modellproblem der 1. RWA des Laplace-Operators Lu := −∆u = f
in Ω,
u = g auf ∂Ω,
(4.0.1)
auf einem (konvexen) Polygongebiet Ω ⊂ R2 . Erweiterungen f¨ ur Probleme mit variablen Koeffizienten, anderen Randbedingungen, Unsymmetrien sowie auf drei Raumdimensionen werden wieder in Bemerkungen ber¨ ucksichtigt. Die zugeh¨origen algebraischen Systeme haben die Form Ax = b,
(4.0.2)
N mit Matrizen A = (anm )N n,m=1 und Vektoren b = (bn )n=1 der Dimension N . In der Praxis ist meist N ≫ 1000 , so daß neben dem Rechenaufwand auch der Speicherbedarf ein wichtiger Aspekt ist. Je nach der gew¨ ahlten Numerierung der Gitterpunkte bzw. Knoten haben die Matrizen in der Regel Bandstruktur und sind extrem d¨ unn besetzt. Ist das kontinuierliche Problem selbstadjungiert sowie definit, wie z.B. im Fall der 1. RWA des Laplace-Operators, so u ¨bertragen sich diese Eigenschaften bei FE-Diskretisierungen direkt auf die Systemmatrizen A .
4.1 Krylow-Raum-Methoden Wir diskutieren jetzt sog. Krylow1 -Raum-Methoden“, zu denen auch das klassische Verfahren ” der konjugierten Gradienten ( CG-Verfahren“) geh¨ort. Im folgenden werden euklidisches Skalar” produkt und Norm auf RN mit hx, yi bzw. |x| bezeichnet. Die Koeffizientenmatrix A ∈ RN ×N sei zun¨achst als symmetrisch und positiv definit angenommen. Dann l¨aßt sich die Gleichung (4.0.2) ¨aquivalent charakterisieren durch ein quadratisches Minimierungsproblem: ⇔
Ax = b
Q(x) = min Q(y) y∈RN
(4.1.3)
mit Q(y) := 12 hAy, yi − hb, yi.
Wegen ∇2 Q ≡ A folgt aus der Positiv-Definitheit von A die Existenz eines eindeutig bestimmten Minimums von Q(·) , welches notwendig L¨osung von (4.0.2) ist. Diese Konstruktion ist analog zu der beim Nachweis von schwachen“ L¨osungen der 1. RWA des Laplace-Operators. ” Wir halten fest, daß der Gradient von Q in einem Punkt y ∈ Rn gegeben ist durch ∇Q(y) =
1 2
(A + AT )y − b = Ay − b .
(4.1.4)
Dies ist gerade der Defekt“ im Punkt y . F¨ ur jede symmetrische, positiv definite Matrix B ∈ ” 1/2 N ×N R ist durch kykB := hBy, yi eine sog. Energie-Norm“ definiert. Mit dieser Notation ” 1
Aleksei Nikolaevich Krylov (1863-1945): russischer Mathematiker; Prof. an der Sov. Akademie der Wissensch. in St. Petersburg; Beitr¨ age zu Fourier-Analysis und Differentialgleichungen, Anwendungen in der Schiffstechnik.
153
154
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
gilt dann 2Q(y) = hAy, yi − 2hb, yi
= hAy, yi − hb, yi − hAy, A−1 bi + hb, A−1 bi − hb, A−1 bi
= hAy − b, y − A−1 bi − hb, A−1 bi
= hA−1 (Ay − b), Ay − bi − hb, A−1 bi = |Ay − b|2A−1 − |b|2A−1
= hy − A−1 b, Ay − A−1 bi − hAA−1 b, A−1 bi = |x − x|2A − |x|2A ,
d.h.: Die Minimierung des Funktionals Q(·) ist ¨aquivalent zur Minimierung der Defektnorm kAy − bkA−1 bzw. der Energie-Norm ky − xkA . Die sog. Abstiegsverfahren“ bestimmen nun ausgehend von einem geeigneten Startvektor ” x(0) ∈ Rn eine Folge von Iterierten x(t) , t ∈ N , durch x(t+1) = x(t) + αt d(t) .
(4.1.5)
Dabei sind die d(t) vorgegebene oder auch erst im Verlauf der Iteration berechnete Abstiegs” richtungen“, und die Schrittweiten“ αt ∈ R sind durch die Vorschrift bestimmt (sog. line ” ” search“): Q(x(t+1) ) = min Q(x(t) + αd(t) ) .
(4.1.6)
α∈R
Die notwendige Optimalit¨ atsbedingung d Q(x(t) + αd(t) ) = ∇Q(x(t) + αd(t) ) · d(t) = hAx(t) − b, d(t) i + αhAd(t) , d(t) i = 0 dα ergibt mit dem Residuum r (t) := b − Ax(t) = −∇Q(x(t) ) : αt =
hr (t) , d(t) i . hAd(t) , d(t) i
Das allgemeine Abstiegsverfahren lautet also wie folgt: Startwert: f¨ ur t ≥ 0:
x(0) ∈ RN ,
Iterierte x(t) , αt =
Residuum r (t) = b − Ax(t) ,
hr (t) , d(t) i , hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) .
Praktisch g¨ unstiger ist die folgende Schreibweise, bei der man eine Matrix-Vektor-Multiplikation spart, wenn man den Vektor Ad(t) abspeichert: Startwert: f¨ ur t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Iterierte x(t) , αt =
Residuum r (t) ,
hr (t) , d(t) i , hAd(t) , d(t) i
Abstiegsrichtung d(t) ,
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die verschiedenen Abstiegsverfahren unterscheiden sich im wesentlichen durch die jeweilige
4.1 Krylow-Raum-Methoden
155
Wahl der Abstiegsrichtungen d(t) . Die einfachste M¨oglichkeit w¨are, die Richtungen d(t) zyklisch die kartesischen Einheitsvektoren {e(1) , . . . , e(n) } durchlaufen zu lassen. Die so erhaltene iterative Methode wird Koordinatenrelaxation“ genannt. Ein voller Relaxationszyklus ist ¨aquivalent ” ¨ zum Gauß-Seidel-Verfahren (Ubungsaufgabe). Naheliegender ist die Wahl der Richtung des st¨arksten Abfalls von Q(·) im Punkt x(t) , d.h. des Gradienten bzw. Residuums, als Suchrichtung d(t) = −g(t) = −∇Q(x(t) ) = r (t) . Diese Gradientenverfahren“ ist aber relativ langsam (vergleichbar mit dem Jacobi-Verfahren). Je ” zwei aufeinander folgende Abstiegsrichtungen sind dabei orthogonal, (d(t+1) , d(t) ) = 0 , aber d(t+2) braucht nicht einmal ann¨ ahernd orthogonal zu d(t) zu sein. Dies f¨ uhrt zu einem stark oszillatorischen Konvergenzverhalten des Gradientenverfahrens besonders bei Matrizen A mit weit auseinander liegenden Eigenwerten. Dies bedeutet etwa in Fall N = 2 , daß das Funktional Q(·) stark exzentrische Niveaulinien hat und sich die Iterierten in einem Zickzackkurs der L¨osung ann¨ahern (siehe Bild).
4.1.1 Verfahren der konjugierten Richtungen (CG-Verfahren) Das Gradientenverfahren nutzt die Struktur des quadratischen Funktionals Q(·) , d.h. die Verteilung der Eigenwerte der Matrix A , nur lokal von einem Schritt zum n¨achsten aus. Es w¨ are g¨ unstiger, wenn bei der Wahl der Abstiegsrichtungen auch die bereits gewonnenen Informationen u ucksichtigt w¨ urden, d.h. wenn etwa die Abstiegsrichtungen ¨ber die globale Struktur von Q(·) ber¨ paarweise orthogonal w¨ aren. Dies ist die Grundidee des sog. Verfahrens der konjugierten Gra” dienten“ nach Hestenes2 und Stiefel3 ( conjugate gradient method“ oder kurz CG-Verfahren“), ” ” welches sukzessive eine Folge von Abstiegsrichtungen d(t) erzeugt, die bzgl. des Skalarprodukts (·, ·)A orthogonal sind ( A-orthogonal“). Zur Konstruktion dieser Folge macht man den Ansatz ” Kt = span{d(0) , ..., d(t−1) } und sucht, Iterierte in der Form x(t) = x(0) +
t−1 X i=0
αi d(i) ∈ x(0) + Kt
(4.1.7)
zu bestimmen, so daß Q(x(t) ) = min Q(x(0) + y) . y∈Kt
2
Magnus R. Hestenes (1906-1991): US-amerikanischer Mathematiker; Prof. an der UCLA, USA, fundamentale Beitr¨ age u.a. zur Numerischen Linearen Algebra. 3 Eduard Stiefel (1909-1978): schweizer Mathematiker; Prof. an der ETH Z¨ urich; fundamentale Beitr¨ age u.a. zur Numerischen Linearen Algebra.
156
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
Dies ist ¨aquivalent zu den Galerkin-Gleichungen“ ” hx(t) − x, d(t) iA = hAx(t) − b, dj i = 0,
j = 0, ..., t − 1,
(4.1.8)
bzw. zu r (t) = b − Ax(t) ⊥ Kt . Setzt man den Ansatz (4.1.7) in (4.1.8) ein, so erh¨alt man das Gleichungssystem t−1 X i=0
αi hAd(i) , d(j) i = hb − Ax(0) , dj i,
j = 0, ..., t − 1,
(4.1.9)
mit der regul¨ aren Koeffizientenmatrix MA = (hAd(k) , d(j) i)t−1 j,k=0 . Eine nat¨ urliche Wahl der Ansatzr¨ aume Kt sind die sog. Krylow-R¨aume“ ” Kt (r (0) ; A) := span{r (0) , Ar (0) , ..., At−1 r (0) } zum Residuum r (0) = b − Ax(0) des Startvektors x(0) . Nach Konstruktion ist stets r (t) = b − Ax(t) = r (0) − r (0) + b − Ax(t)
= r (0) + A(x(0) − x(t) ) ∈ r (0) + AKt (r (0) ; A) ⊂ Kt+1 (r (0) ; A).
Da nach Konstruktion r (t) ⊥ Kt , ist also stets hr (t) , r (i) i = 0,
i = 0, . . . , t − 1.
Ferner folgt im Fall At r (0) ∈ Kt (r (0) ; A) notwendig r (t) = 0 bzw. Ax(t) = b . Ausgehend von der Formulierung (4.1.8) konstruiert das CG-Verfahren eine A-orthogonale Folge von Abstiegsrichtungen d(i) , die eine Basis des Krylow-Raumes Kt (r (0) ; A) bildet. Dies ließe sich etwa mit Hilfe des klassischen Gram4 -Schmidt5 -Algorithmus leisten, was aber numerisch sehr instabil ist. In Analogie zur vergleichbaren Situation bei der Konstruktion orthogonaler Polynome (z.B. die Legendre6 -Polynome) ist aber zu erwarten, daß dasselbe durch eine zweistufige Rekursion erreichbar ist. Ausgehend von einem Startpunkt x(0) mit Residuum (negativer Gradient) r (0) = b − Ax(0) seien Iterierte x(i) und zugeh¨ orige Abstiegsrichtungen d(i) (i = 0, ..., t − 1) bestimmt, so daß {d(0) , ..., d(t−1) } eine A-orthogonale Basis von Kt (d(0) ; A) ist. Zur Konstruktion des n¨achsten
4
Jørgen Pedersen Gram (1850-1916): d¨ anischer Mathematiker, Mitarbeiter und sp¨ ater Eigent¨ umer einer Versicherungsgesellschaft, Beitr¨ age zur Algebra (Invariantentheorie), Wahrscheinlichkeitstheorie, Numerik und Forstwissenschaft; das u.a. nach ihm benannte Orthogonalisierungsverfahren geht aber wohl auf Laplace zur¨ uck und wurde bereits von Cauchy 1836 verwendet. 5 Erhard Schmidt (1876-1959): deutscher Mathematiker, Prof. in Berlin, Gr¨ under des dortigen Instituts f¨ ur Angewandte Mathematik 1920, nach dem Krieg Direktor des Mathematischen Instituts der Akademie der Wissenschaften der DDR; Beitr¨ age zur Theorie der Integralgleichungen und der Hilbert-R¨ aume sowie sp¨ ater zur Topologie. 6 Adrien-Marie Legendre (1752-1833): franz¨ osischer Mathematiker; Mitglied der Pariser Akademie der Wissensch.; Beitr¨ age zur Himmelsmechanik, Zahlentheorie und Geometrie.
4.1 Krylow-Raum-Methoden
157
d(t) ∈ Kt+1 (d(0) ; A) mit der Eigenschaft d(t) ⊥A Kt (d(0) ; A) machen wir den Ansatz d(t) = r (t) +
t−1 X j=0
βjt−1 d(j) ∈ Kt+1 (d(0) ; A).
(4.1.10)
Dabei wird o.B.d.A. angenommen, daß r (t) = b − Ax(t) ∈ / Kt (d(0) ; A) ist, da andernfalls r (t) = 0 (t) bzw. x = x w¨ are. Zur Bestimmung der Koeffizienten βjt−1 beachten wir f¨ ur i = 0, ..., t − 1 : 0 = hd(t) , Ad(i) i = hr (t) , Ad(i) i +
t−1 X j=0
βjt−1 hd(j) , Ad(i) i = hr (t) + βit−1 d(i) , Ad(i) i .
ur F¨ ur i < t − 1 ist hr (t) , Ad(i) i = 0 wegen Ad(i) ∈ Kt (d(0) ; A) und demnach βit−1 = 0 . F¨ i = t − 1 f¨ uhrt die Bedingung t−1 (t−1) 0 = hr (t) , Ad(t−1) i + βt−1 hd , Ad(t−1) i
(4.1.11)
zu den Formeln t−1 βt−1 := βt−1 =−
hr (t) , Ad(t−1) i , hd(t−1) , Ad(t−1) i
d(t) = r (t) + βt−1 d(t−1) .
(4.1.12)
Die n¨achsten Iterierten x(t+1) und r (t+1) = b − Ax(t+1) sind dann bestimmt durch αt =
hr (t) , d(t) i , hd(t) , Ad(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
(4.1.13)
Dies sind die Rekursionsformeln des klassischen CG-Verfahrens. Wegen r (t) ⊥ Kt (r (0) ; A) und Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } ist hr (t) , d(i) i = 0,
i = 0, . . . , t − 1.
Damit lassen sich die Formeln f¨ ur die Koeeffizienten αt und βt vereinfachen. Mit |r (t) |2 = hd(t) − βt−1 d(t−1) , r (t+1) + αt Ad(t) i = αt hd(t) , Ad(t) i ,
(4.1.14)
|r (t+1) |2 = hr (t) − αt Ad(t) , r (t+1) i = −αt hAd(t) , r (t+1) i .
(4.1.15)
ergibt sich αt =
|r (t) |2 , hd(t) , Ad(t) i
βt =
|r (t+1) |2 , |r (t) |2
(4.1.16)
solange die Iteration nicht mit r (t) = 0 abbricht. Diese Konstruktion f¨ uhrt auf den folgenden
158
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
CG-Algorithmus: Startwert:
x(0) ∈ Rn ,
f¨ ur t ≥ 0:
αt =
r (0) := b − Ax(0) ,
|r (t) |2 , hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) , βt =
|r (t+1) |2 , |r (t) |2
d(t+1) = r (t+1) + βt d(t) .
In jedem Iterationsschritt ist dabei eine Matrix-Vektor-Multiplikation und f¨ unf Operationen der M¨achtigkeit eines Skalarproduktbildung durchzuf¨ uhren. Im Falle einer d¨ unn besetzten Matrix vom Typ der Modellmatrix sind das etwa 10N arithmetische Operationen. Das CG-Verfahren erzeugt eine Basis von Abstiegsrichtungen, so daß es zwangsl¨aufig nach sp¨atestens t = N − 1 Schritten mit der L¨ osung x des Gleichungssystems (4.0.2) abbricht. Es handelt sich hierbei also formal um ein direktes“ L¨ osungsverfahren. Bei großer Dimension N ≥ 103 geht die A” Orthogonalit¨ at der Folge {d(0) , ..., d(t−1) } wegen des unvermeidlichen Rundungsfehlereinflusses schnell verloren, und das Verfahren wird zu einem nicht terminierenden, iterativen Prozess. Außerdem w¨ are die Durchf¨ uhrung von nahezu N − 1 Iterationsschritten wegen der damit ver2 bundenen Zahl von O(N ) arithmetischen Operationen viel zu hoch. Man wird also mit einer wesentlich geringeren Anzahl von t ≪ N Schritten auskommen m¨ ussen. Wir fassen die wichtigsten Eigenschaften des CG-Verfahrens in folgendem Satz zusammen. Satz 4.1 (CG-Konvergenz): Das CG-Verfahren bricht f¨ ur jeden Startvektor x(0) ∈ RN nach (t) sp¨ atestens N −1 Schritten mit x = x ab. F¨ ur 0 ≤ t < N −1 gilt die Fehlerabsch¨ atzung 1 − 1/√κ t √ |e(0) |A , t ≥ 1, (4.1.17) |e(t) |A ≤ 2 1 + 1/ κ mit der Spektralkondition κ := κ2 (A) = λmax (A)/λmin (A) von A . Zur Reduzierung des Anfangsfehlers um den Faktor ε sind h¨ochstens 2 1√ κ ln +1 (4.1.18) t(ε) ≤ 2 ε Iterationsschritte erforderlich. Dieses Resultat zeigt die Wichtigkeit der Kondition κ(A) f¨ ur die Konvergenzgeschwindigkeit des −2 CG-Verfahrens. F¨ ur das Modellproblem ist κ(A) = O(h ) , was eine Gesamtl¨osungskomplexit¨ at von O(N 3/2 ) bedeutet. Das CG-Verfahren ist daher i.a. ¨ahnlich effizient wie das optimale“ ” SOR-Verfahren, allerdings mit einer gr¨oßeren Fehlerkonstanten. Im Gegensatz zu letzterem erfordert das CG-Verfahren aber nicht die Bestimmung eines optimalen Relaxationsparameters. Daf¨ ur ist das Resultat (4.1.17) auf den Fall einer symmetrischen, positiv definiten Matrix A beschr¨ankt. Beweis: (i) Unter Beachtung der Beziehung |x(t) − x|A =
min
y∈x(0) +Kt
|y − x|A ,
Kt := Kt (r (0) ; A) = span{d(0) , . . . , d(t−1) } = span{A0 r (0) , . . . , At−1 r (0) }
4.1 Krylow-Raum-Methoden
159
finden wir |x(t) − x|A = min |x(0) − x + p(A)r (0) |A . p∈Pt−1
Wegen r (0) = b − Ax(0) = A(x − x(0) ) folgt weiter |x(t) − x|A = min |[I − p(A)A](x(0) − x)|A p∈Pt−1
≤ min kI + Ap(A)kA |x(0) − x|A ≤ p∈Pt−1
min
p∈Pt , p(0)=1
kp(A)kA |x(0) − x|A ,
wobei die zu der Vektornorm k · kA assoziierte nat¨ urliche Matrizennorm der Einfachheit halber ebenfalls mit k·kA bezeichnet ist. F¨ ur beliebiges y ∈ RN haben wir mit einer Orthonormalbasis (1) (N ) {w , . . . , w } aus Eigenvektoren von A die Entwicklung y=
N X
γi w(i) ,
γi = hy, w(i) i ,
i=1
und folglich |p(A)y|2A
=
N X
λi p(λi )2 γi2
i=1
wobei
M := sup |p(µ)| ,
≤ M
2
N X i=1
λi γi2 = M 2 |y|2A ,
λ := λmin (A), Λ := λmax (A) .
λ≤µ≤Λ
Dies impliziert dann kp(A)kA =
sup y∈Rn , y6=0
|p(A)y|A ≤ M. |y|A
(ii) Wir haben gefunden, daß |x(t) − x|A ≤
min
p∈Pt , p(0)=1
sup |p(µ)| |x(0) − x|A .
λ≤µ≤Λ
Dies ergibt die Behauptung, wenn wir zeigen k¨onnen, daß min
p∈Pt , p(0)=1
1 − pλ/Λ t p . sup |p(µ)| ≤ 2 1 + λ/Λ λ≤µ≤Λ
Dabei handelt es sich um ein Problem der Bestapproximation mit Polynomen bzgl. der Maximumnorm (Tschebyscheff7 -Approximation). Die L¨osung p¯ ist gegeben durch p¯(µ) = Tt
Λ + λ − 2µ Λ−λ
Tt
Λ + λ −1 Λ−λ
,
mit dem t-ten Tschebyscheff-Polynom Tt auf [−1, 1] . Dabei ist sup p¯(µ) = Tt
λ≤µ≤Λ
Λ + λ −1 Λ−λ
.
7 Pafnuty Lvovich Tschebyscheff (russ.: Chebyshev) (1821-1894): russischer Mathematiker; Prof. in St. Petersburg; Beitr¨ age zur Zahlentheorie, Wahrscjheinlichkeitstheorie und vor allem zur Approximationstheorie; entwickelte allgemeine Theorie orthogonaler Polsynome.
160
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
Aus der Darstellung Tt (µ) =
1 2
µ+
p p t t µ2 − 1 + µ − µ2 − 1 ,
µ ∈ (−∞, ∞),
f¨ ur die Tschebyscheff-Polynome folgt u ¨ ber die Identit¨at r √ √ √ κ+1 κ+1 2 κ ( κ ± 1)2 κ±1 κ + 1 2 −1= ± ± = = √ κ−1 κ−1 κ−1 κ−1 κ−1 κ∓1 die Absch¨atzung nach unten
Tt Also wird
Λ + λ Λ−λ
= Tt
√ √ √ 1 h κ + 1 t κ − 1 t i 1 κ + 1 t √ √ = ≥ + √ . κ−1 2 κ−1 κ+1 2 κ−1
κ + 1
√κ − 1 t , sup p¯(µ) ≤ 2 √ κ+1 λ≤µ≤Λ
was (4.1.17) impliziert.
(iii) Zur Herleitung von (4.1.18) fordern wir √κ − 1 t(ε) 2 √ ln ln √ . ε κ−1 2
1 1 1 1 1 + + + ... 3 x 3x 5 x5
≥
2 x
κ ln(2/ε) .
Q.E.D.
4.1.2 CG-Verfahren fu ¨ r unsymmetrische und indefinite Probleme Zur L¨osung allgemeiner Gleichungssysteme Ax = b mit einer regul¨aren, aber nicht notwendig symmetrisch und positiv definiten Matrix A ∈ Rn mit Hilfe des CG-Verfahrens kann man etwa zu dem ¨aquivalenten System AT Ax = AT b
(4.1.19)
mit der positiv definiten Matrix AT A u ¨bergehen. Hierauf angewendet, schreibt sich das CGVerfahren wie folgt: Startwerte: f¨ ur t ≥ 0:
x(0) ∈ RN , αt =
d(0) = r (0) = AT (b − Ax(0) ) ,
|r (t) |2 , |Ad(t) |2
x(t+1) = x(t) + αt d(t) , βt =
|r (t+1) |2 , |r (t) |2
r (t+1) = r (t) − αt AT Ad(t) ,
d(t+1) = r (t+1) + βt d(t) .
4.1 Krylow-Raum-Methoden
161
Die Konvergenzgeschwindigkeit ist dabei charakterisiert durch κ(AT A) . Das ganze Verfahren beruht offenbar auf der Minimierung des Funktionals Q(y) :=
1 2
hAT Ay, yi − hAT b, yi = 12 |Ay − b|2 − 21 |b|2 .
(4.1.20)
Da κ(AT A) ∼ κ(A)2 ist, muß man mit einer recht langsamen Konvergenz dieses quadrierten“ ” CG-Verfahrens f¨ ur nicht symmetrische Systeme rechnen. Auf der Basis der Chrakterisierung (4.1.3) ist das beschriebene CG-Verfahren auf symmetrische, positiv definite Matrizen beschr¨ankt. Geht man allerdings von der notwendigen ” Optimalit¨atsbedingung“ (4.1.8) aus, so ist dieser Ansatz auch f¨ ur allgemeine Matrizen sinnvoll. Tats¨achlich lassen sich auf diesem Wege leistungsf¨ahige Verallgemeinerungen des CGVerfahrens auch f¨ ur unsymmetrische und indefinite Matrizen ableiten. Dabei werden in der Galerkin-Formulierung (4.1.8) als Ansatzr¨aume meist wieder die Krylow-R¨aume Kt = span{r (0) , Ar (0) , ..., At−1 r (0) } verwendet. Als Testr¨ aume“ treten gleichfalls Kt∗ = Kt oder auch ” Kt∗ = span{r (0) , AT r (0) , ..., (AT )t−1 r (0) } auf. Die resultierenden Verfahren GMRES, ORTHOMIN, CRS, bi-CG-stab u.s.w., haben dann jeweils die eine oder die andere Eigenschaft des normalen CG-Verfahrens, lassen aber keine so vollst¨andige Konvergenzanalyse zu. 4.1.3 Vorkonditionierung (PCG-Verfahren) Die Fehlerabsch¨ atzuung f¨ ur das CG-Verfahren garantiert eine besonders gute Konvergenz, wenn die Kondition der Matrix A nahe bei Eins liegt. Daher wird eine Vorkonditionierung“ vorge” ˜x = ˜b , dessen Matrix nommen, d.h.: Das System Ax = b wird in ein ¨aquivalentes umgeformt, A˜ ˜ A besser konditioniert ist. Sei C eine symmetrische, positiv definite Matrix, welche explizit in Produktform C = KK T
(4.1.21)
gegeben ist mit einer regul¨ aren Matrix K . Das System Ax = b wird dann in der ¨aquivalenten Form geschrieben
K −1 A (K T )−1 K T x = K −1 b . {z } | {z } | {z } | ˜ ˜b A x ˜
(4.1.22)
˜ T = (K T )−1 K −1 A(K T )−1 K T = C −1 A (K T )−1 AK
(4.1.23)
˜x = ˜b angewendet. Die Beziehung Das CG-Verfahren wird nun auf das System A˜
˜ = κ(I) = 1 w¨are. Folglich wird zeigt, daß f¨ ur C ≡ A die Matrix A˜ ¨ ahnlich zu I, d.h. κ(A) −1 −1 man C als m¨ oglichst gute Approximation von A w¨ahlen, wobei nat¨ urlich die Zerlegung ˜x = ˜b kann C = KK T bekannt sein muß. Das CG-Verfahren f¨ ur das transformierte System A˜
162
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
in den urspr¨ unglichen Gr¨ oßen A, b und x als PCG-Verfahren geschrieben werden: Startwert:
x(0) ∈ RN , d(0) = r (0) = b − Ax(0) ρ(0) = C −1 r (0) ,
f¨ ur t ≥ 0:
αt =
hr (t) , ρ(t) i , hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) , r (t+1) = r (t) − αt Ad(t) , ρ(t+1) = C −1 r (t+1) , βt =
hr (t+1) , ρ(t+1) i , hr (t) , ρ(t) i
d(t+1) = r (t+1) + βt d(t) .
Verglichen mit der einfachen CG-Iteration erfordert das PCG-Verfahren in jedem Schritt zus¨atzlich die L¨osung des Systems Cρ(t+1) = r (t+1) , was unter Ausnutzung der Zerlegung C = KK T erfolgt. Zur Erzielung einer Komplexit¨at von O(N ) a.Op. pro Schritt sollte die Dreiecksmatrix K eine ¨ahnliche Besetzungsstruktur wie der untere Dreiecksanteil L von A haben. Ausgehend von den oben betrachteten einfachen Fixpunktiterationen werden in der Praxis die folgenden Vorkonditionierer verwendet: 1) Diagonal-Vorkonditionierung (Skalierung): C = D 1/2 D 1/2 . Die Skalierung bewirkt, daß die Elemente von A auf etwa gleiche Gr¨oßenordnung gebracht werden, insbesondere wird a ˜ii = 1 . Dies reduziert die Kondition, denn es gilt: κ(A) ≥
max1≤i≤N aii . min1≤i≤N aii
(4.1.24)
Beispiel: Die Matrix A = diag{λ1 = ... = λN −1 = 1, λN = 10k } hat die Kondition cond2 (A) = ˜ = 1. 10k . Die skalierte Matrix A˜ = D −1/2 AD−1/2 hat dagegen die optimale Kondition cond2 (A) 2) SSOR-Vorkonditionierung: Mit einem Parameter ω wird gesetzt 1/2 1/2 + {z ωD −1/2 R}) . C = (D + ωL)D −1 (D + ωR) = (D + {z ωLD −1/2})(D | |
K
KT
Offenbar besitzt die Dreiecksmatrix K dieselbe schwache Besetzung wie A . Pro Iterationsschritt erfordert das so vorkonditionierte Verfahren etwa doppelt so viel Aufwand wie das einfache Verfahren. Dagegen gilt f¨ ur die Modellmatrix bei optimaler Wahl des Parameters ω (i.a. nicht leicht zu bestimmen!) p ˜ = κ(A) . κ(A) 3) ICCG-Verfahren (Incomplete Cholesky Conjugate Gradient): Die symmetrische, positiv definite Matrix A besitzt eine Cholesky-Zerlegung A = LLT mit einer unteren Dreiecksmatrix L = (lij )N i,j=1 . Die Elemente von L sind bestimmt durch die
4.1 Krylow-Raum-Methoden
163
Rekursionsformeln lii = lji =
aii −
i−1 X
2 lik
k=1 i−1 X
1 aji − lii
k=1
1/2
,
ljk lik ,
i = 1, . . . , N ,
j = i + 1, . . . , N .
Die Matrix L hat i.a. innerhalb der H¨ ulle von A von Null verschiedene Elemente, erfordert also in der Regel weit mehr Speicherplatz als A selbst. Dies wird jedoch dadurch ausgeglichen, daß man nur eine ”unvollst¨ andige Cholesky-Zerlegung” vornimmt, d.h.: Im Cholesky-Algorithmus werden einige der lji willk¨ urlich Null gesetzt, z.B.: ˜lji = 0 , wenn aji = 0 . Dies ergibt dann eine Zerlegung ˜L ˜T + E A = L
(4.1.25)
˜ = (˜lij )i,j=1,...,N , welche eine ¨ahnliche (d¨ mit einer unteren Dreiecksmatrix L unne) Besetzungsstruktur wie A besitzt. Man spricht von der ICCG(0)-Variante, wenn (4.1.25) gefordert wird. Werden im Fall einer Bandmatrix A weitere p Nebendiagonalen mit von Null verschiede˜ hinzugef¨ nen Elementen in L ugt bzw. weggestrichen, so nennt man dies die ICCG(+p) bzw. ICCG(−p)-Variante. Zur Vorkonditionierung verwendet die ICCG-Methode die Matrix ˜L ˜T . C = KK T = L
(4.1.26)
Obwohl keine strenge theoretische Begr¨ undung f¨ ur den Erfolg dieses Ansatzes vorliegt, so zeigen doch numerische Tests an Modellproblemen, welchen Einfluß diese Konditionierung auf die ˜ nicht deutVerteilung der Eigenwerte der Matrix A˜ hat. Zwar wird die Konditionszahl κ(A) ˜ lich kleiner als κ(A) , doch die Eigenwerte von A h¨aufen sich im Gegensatz zu denen von A stark bei λ = 1 . Dies bewirkt, wie eine feinere Analyse zeigt, eine deutliche Beschleunigung der Konvergenz. 4) ADI-Vorkonditionierung: C = (Ax + ωI)(Ay + ωI)(ATy + ωI)(ATx + ωI) . Auch hier muß zur Bewahrung der Symmetrie von A˜ eine symmetrisierte Variante des ADIMatrix verwendet werden. Eine gute Vorkonditionierung der Modellmatrix bewirkt eine Verbesserung der Konvergenz˜ = 1 − O(h1/2 ) und damit auf die L¨osungskomplexit¨ rate von ρ(A) = 1 − O(h) auf ρ(A) at 5/4 O(N ) . Besonders die ILU-Vorkonditionierung hat sich in der Praxis bei vielen Problemen als effizient und robust erwiesen. Sie reduziert zwar nicht die Kondition, doch bewirkt eine Konzentration der Eigenwerte um den Wert λ = 1 , was ebenfalls eine deutliche Beschleunigung der CG-Konvergenz mit sich bringt.
164
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
4.2 Mehrgitterverfahren Mehrgitterverfahren geh¨ oren zum Typ der (verallgemeinerten) Defektkorrekturiterationen und verwenden eine Folge von Subproblemen ¨ahnlicher Struktur, aber sukzessive kleiner werdender Dimension. Sie sind speziell zugeschnitten auf die L¨osung der Gleichungssysteme, wie sie bei der Diskretisierung partieller Differentialgleichungen mit Differenzen- oder Finite-ElementeVerfahren entstehen. Die Idee ist die eines allen diskreten Problemen zugrunde liegenden u ¨ bergeordneten, kontinuierlichen Problems und der fortgesetzten Aufspaltung von Fehlern und Defekten auf den verschiedenen Gittern in niedrig- und hochfrequente Anteile, die separat behandelt werden. Bei richtiger Zusammenstellung der einzelnen Verfahrenskomponenten erh¨alt man Idealfall das gew¨ unschte optimale“ L¨ osungsverfahren der Komplexit¨at O(N ) . ” Zum Einstieg betrachten wir das Gleichungssystem auf dem Gitter Th : Ah xh = bh
(4.2.27)
und approximieren die L¨ osung mit dem Richardson-Verfahren (t+1)
xh
(t)
(t)
(t)
= xh + θh (bh − Ah xh ) = (Ih − θh Ah )xh + θh bh
(4.2.28)
mit einem D¨ ampfungsfaktor 0 < θh ≤ 1 . Die symmetrische, positiv definite Matrix Ah besitzt (i) ein Orthonormalsystem von Eigenvektoren {wh , i = 1, ..., Nh } zu den geordneten Eigenwerten λmin (Ah ) = λ1 ≤ ... ≤ λN = λmax (Ah ) =: Λh . Entwickelt man den Anfangsfehler in der Form (0) eh
:=
(0) xh
− xh =
Nh X
(i)
εi wh ,
i=1
so gilt f¨ ur die iterierten Fehler entsprechend (t) eh
= (Ih −
(0) θh Ah )t eh
=
Nh X i=1
i
εi (Ih − θh Ah )
(i) wh
=
Nh X i=1
(i)
εi (1 − θh λi )i wh .
Folglich ist (t) |eh |2
=
Nh X i=1
ε2i (1 − θh λi )2t .
(4.2.29)
Die Bedingung 0 < θh ≤ Λ−1 ist hinreichend f¨ ur die Konvergenz der Richardson-Iteration. h Wegen |1 − θh λi | ≪ 1 f¨ ur große λi und |1 − θh λ1 | ≈ 1 werden offenbar hoch-frequente“ ” Komponenten des Fehlers sehr schnell, aber niedrig-frequente“ nur sehr langsam ged¨ampft. ” (t) (t) (t) Dasselbe gilt auch f¨ ur das Residuum rh = bh − Ah xh = Ah eh , d.h.: Bereits nach wenigen Iterationen gilt: [N/2] (t) |rh |2
≈
X i=1
ε2i λ2i (1 − θh λi )2t ,
(4.2.30)
wobei [N/2] := max{n ∈ N| n ≤ N/2} ist. Dies kann so interpretiert werden, daß der iterierte (t) Defekt rh auf dem Gitter Th glatt ist. Daher sollte er auf einem gr¨oberen Gitter T2h mit Git-
4.2 Mehrgitterverfahren
165
terweite 2h gut approximierbar sein. Die resultierende Defektgleichung zur Berechnung der Kor(t) urde dann wegen ihrer geringeren Dimension N2h ≈ Nh /4 rektur zur N¨ aherung xh auf Th w¨ auch weniger Aufwand kosten. Dieser Defektkorrekturproze in Verbindung mit sukzessiver Vergr¨oberung kann weitergef¨ uhrt werden bis zu einem gr¨obsten Gitter, auf dem die Defektgleichung dann exakt gel¨ ost wird. Die wichtigsten Bestandteile eines solchen Mehrgitterprozesses sind die (0) (ν) Gl¨attungsiteration“ xh = Shν (xh ) sowie geeignete Transferoperationen zwischen den Finite” Elemente-R¨ aumen auf den verschiedenen Gittern. Die Gl¨attungsoperation Sh (·) ist gew¨ohnlich gegeben in Form einer Fixpunktiteration (z.B. der Richardson-Iteration) (ν+1)
xh
(ν)
(ν)
= Sh (xh ) := (Ih − Ch−1 Ah )xh + Ch−1 bh ,
mit der Iterationsmatrix Sh := Ih − Ch−1 Ah . 4.2.1 Mehrgitteralgorithmus im Finite-Elemente-Kontext Zur Formalisierung des Mehrgitterprozesses betrachten wir nun eine Folge von Gittern Tl = Thl , l = 0, ..., L , zunehmender Feinheit h0 > ... > hl > ... > hL sowie zugeh¨orige FE-R¨aume Vl := Vhl ⊂ V . Der Einfachheit halber sei angenommen, daß die FE-R¨aume hierarchisch geordnet sind, d.h.: V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL . Diese Voraussetzung erleichtert die Analyse des Mehrgitterprozesses, ist aber nicht entscheidend f¨ ur sein Funktionieren. Zwischen den Funktionen vl ∈ Vl und den zugeh¨ origen Knotenwertevektoren yl ∈ RNl gilt der u ¨bliche Zusammenhang vl (an ) = yl,n , n = 1, ..., Nl . Wie u ¨ blich schreiben wir das kontinuierliche Problem und sein FE-Analogon in kompakter Form als a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V,
(4.2.31)
bzw. auf dem feinsten Gitter TL als a(uL , ϕL ) = (f, ϕL ) ∀ϕL ∈ VL .
(4.2.32)
Dabei sind a(u, ϕ) := (Lu, ϕ) die zum (elliptischen) Operator L geh¨orende “Energie-Form“ und (f, ϕ) das L2 -Skalarprodukt auf dem L¨osungsgebiet Ω . Die exakte“ diskrete L¨osung uL ∈ VL ” gen¨ ugt der a priori Fehlerabsch¨ atzung ku − uL k ≤ c h2L kf k .
(4.2.33)
Ziel ist es, einen L¨ osungsprozess zu finden, der eine Approximation u ˜L ≈ uL liefert mit kuL − u ˜L k ≤ c h2L kf k.
(4.2.34)
Ist der dazu erforderliche Aufwand O(NL ) und zwar gleichm¨aßig bzgl. L , so nennt man diesen Prozess komplexit¨ ats-optimal“. Wir werden sehen, daß der Mehrgitteralgorithmus bei richtiger ” Wahl der Verfahrenskomponenten in diesem Sinne optimal“ ist. ” (0) atzung f¨ ur die exakte L¨osung uL ∈ VL auf Gitterlevel L . Zun¨achst Sei uL ∈ VL eine Sch¨ (0) (0) (0) attet“. Dazu werden ausgehend von u ¯L := uL z.B. ν Schritte des Richardsonwird uL gegl¨ ” Verfahrens durchgef¨ uhrt. In variationeller Schreibweise lautet dies: (k)
(k−1)
uL (¯ uL , ϕL ) = (¯
(k−1) , ϕL ) + θL (f, ϕL ) − a(¯ , ϕL ) uL
∀ϕL ∈ VL ,
(4.2.35)
166
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
wobei θL = λmax (Ah )−1 . Mit der gegl¨ atteten Approximation wird der Defekt dL ∈ VL gebildet (ohne ihn wirklich zu berechnen): (ν)
(dL , ϕL ) := (f, ϕL ) − a(¯ uL , ϕL ),
ϕL ∈ VL .
(4.2.36)
Wegen VL−1 ⊂ VL erh¨ alt man auf dem n¨achst gr¨oberen Gitter TL−1 die Defektgleichung ( Grobgittergleichung“) ” (ν)
a(qL−1 , ϕL−1 ) = (dL , ϕL−1 ) = (f, ϕL−1 ) − a(¯ uL , ϕL−1 ) ∀ϕL−1 .
(4.2.37)
Die Korrektur qL−1 ∈ VL−1 wird nun entweder exakt berechnet (etwa mit einem direkten“ ”(R) (0) L¨oser) oder nur n¨ aherungsweise mit Hilfe einer Defektkorrekturiteration qL−1 → qL−1 unter (R)
Verwendung der noch gr¨ oberen Gitter TL−2 , ..., T0 . Das Ergebnis qL−1 ∈ VL−1 wird dann als (ν)
Element von VL interpretiert und zur Korrektur von u ¯L
verwendet:
(R) (ν) (0) ¯L + ωL qL−1 . u ¯L := u
(4.2.38)
¯L zu Dabei wird der D¨ ampfungsparameter ωL ∈ (0, 1) verwendet, um das Residuum von u minimieren. Auf diesen in der Praxis sehr n¨ utzlichen Trick wollen wir hier nicht weiter eingehen. ¯L wird nun nochmals µ-mal nachgegl¨attet“. Ausgehend Die erhaltene korrigierte N¨ aherung u ” ¯ ¯(0) von u L := uL wird etwa wieder mit dem Richardson-Verfahren iteriert: (k)
(k−1)
¯L , ϕL ) = (u ¯L (u
¯(k−1) , ϕL ) + θL (f, ϕL ) − a(u , ϕL ) L
∀ϕL ∈ VL . (1)
(4.2.39)
(µ)
¯L akzeptiert. Damit Das Ergebnis wird schließlich als die n¨achste Mehrgitteriterierte uL := u haben wir einen Schritt des Mehrgitterverfahrens (einen Zyklus“) auf dem Gitterlevel L be” schrieben. Jeder solche Zyklus beinhaltet also neben ν + µ Richardson-Schritten (auf Level L), welche jeweils eine Inversion der Massematrix erfordern, die L¨osung des Grobgitterproblems“ ” (4.2.37). Wir wollen nun den beschriebenen Mehrgitteralgorithmus in etwas abstrakterer Form darstellen, um seine Struktur besser zu verstehen und ihn auch leichter analysieren zu k¨onnen. Zu den Matrizen Al = Ahl auf den Gittern Tl sind Operatoren Al : Vl → Vl assoziiert durch (Al vl , wl ) = a(vl , wl ) = hAl yl , zl i ∀vl , wl ∈ Vl .
(4.2.40)
Weiter seien Sl (·) die zugeh¨ origen Gl¨attungsoperationen mit (linearen) Iterationsoperatoren Sl . Beim Richardson-Verfahren ist der Iterationsoperator Sl = Il − θl Al . Schließlich f¨ uhren wir noch Transferoperatoren zwischen aufeinander folgenden R¨aumen ein: rll−1 : Vl → Vl−1 (Restriktion),
pll−1 : Vl−1 → Vl (Prolongation).
Im Finite-Elemente-Kontext ist nat¨ urlicherweise rll−1 = Pl−1 die L2 -Projektion und pll−1 = id. die nat¨ urliche Einbettung. Wir beschreiben nun den Mehrgitterprozeß zur Berechnung der L¨osung des Sytems AL uL = fL auf dem feinsten“ Gitter TL . ”
(4.2.41)
4.2 Mehrgitterverfahren
167 (t)
(0)
Mehrgitterprozeß: Ausgehend von einem Startwert uL ∈ VL werden Iterierte uL durch den folgenden rekursiven Prozeß (t)
(t+1)
= M G(L, uL , fL )
uL
(4.2.42)
(t)
erzeugt. Sei also die t-te Mehrgitteriterierte uL bestimmt.
Grobgitterl¨ osung: F¨ ur l = 0 bedeutet M G(0, ·, g0 ) stets die exakte L¨osung des Systems A0 v0 = g0 (z.B. mit Hilfe eines direkten L¨ osungsverfahrens), d.h.: v0 = M G(0, ·, g0 ) = A−1 0 g0 .
(4.2.43)
Rekursion: Sei f¨ ur ein 1 ≤ l ≤ L das System Al vl = gl zu l¨osen. Mit Parameterwerten ν, µ ≥ 1 ist dann (1)
(0)
M G(l, vl , gl ) := vl
≈ vl
(4.2.44)
rekursiv definiert durch die folgenden Schritte: (i) Vorgl¨ attung: (0)
v¯l := Slν (vl ) ;
(4.2.45)
dl := gl − Al v¯l , ;
(4.2.46)
d˜l−1 := rll−1 dl ;
(4.2.47)
(ii) Defektbildung:
(iii) Restriktion:
(0)
ur 1 ≤ r ≤ R iteriert: (iv) Defektgleichung: Ausgehend von ql−1 := 0 wird f¨ (r−1) (r) ql−1 := M G(l − 1, ql−1 , d˜l−1 ) ;
(4.2.48) (4.2.49)
(v) Prolongation: (R)
ql := pll−1 ql−1 ;
(4.2.50)
(vi) Korrektur: Mit einem D¨ ampfungsparameter ωl ∈ (0, 1] wird gesetzt: v¯l := v¯l + ωl ql ;
(4.2.51)
(vii) Nachgl¨attung: (1)
vl
:= Slµ (v¯l ) ;
(4.2.52)
168
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
Im Falle l = L wird schließlich gesetzt: (t+1)
uL
(1)
:= vl
.
(4.2.53) (t+1)
(t)
Schematische Darstellung des Mehrgitterschritts uL → uL (t)
(t)
(t)
:
(t)
¯L ¯L = SLν (uL ) → dL = fL − AL u uL → u
↓ d˜L−1 = rLL−1 dL−1 ˜ qL−1 = A˜−1 L−1 dL−1
(Restriktion)
(R-malige Defektkorrektur)
↓ q˜L = pL L−1 qL−1
(Prolongation)
(t+1) (t) (t) ¯(t) = SLµ (u ¯L + ωL q˜L → uL u ¯L = u L )
Wenn die Defektgleichung AL−1 qL−1 = d˜L−1 auf dem gr¨oberen Gitter TL−1 exakt“ gel¨ost wird ” (z.B. durch Gauß-Elimination), spricht man von einer Zweigittermethode“: In der Regel wird ” der Prozeß aber rekursiv zum Mehrgitterverfahren bis zum gr¨obsten Gitter fortgesetzt. Dabei kann der vollst¨ andige Mehrgitterzyklus auf verschiedene Art organisiert werden. Seine Struktur ist im wesentlichen durch den Parameter R bestimmt, der festlegt, wie oft der Defektkorrekturprozeß auf jedem Gitterlevel durchgef¨ uhrt wird. In der Praxis spielen nur die F¨alle R = 1 oder R = 2 eine Rolle. Dem entsprechen der im schematischen Bild gezeigte sog. V-Zyklus“ und ” der sog. W-Zyklus“. Dabei stehen die Punkte •“ f¨ ur Gl¨attung und Defektkorrektur auf den ” ” Gittern Tl , und die Linie −“ f¨ ur den Transfer zwischen aufeinander folgenden Gitterniveaus. ”
v4 v3 v2 v1 v0
v4 v3 v2 v1 v0 Abbildung 4.1: Schema eines Mehrgitterverfahrens mit V- (oben links) F- (oben rechts) und W-Zyklus (unten). Der V-Zyklus ist sehr effizient (wenn er funktioniert), krankt aber oft an Instabilit¨aten, welche durch Irregularit¨ aten im Problem (starke Unsymmetrien, Eckensingularit¨aten, Gitterunregelm¨aßigkeiten u.s.w.) hervorgerufen werden. Der W-Zyklus ist dagegen sehr robust, aber auch
4.2 Mehrgitterverfahren
169
teurer. Methoden mit R ≥ 3 sind gew¨ohnlich zu ineffizient. Ein guter Kompromiß zwischen VZyklus und W-Zyklus stellt der sog. F-Zyklus“ dar. Dieser wird gew¨ohnlich auf Gitter TL ” (0) (0) gestartet mit einem beliebigen Startvektor uL (meist uL = 0 ). Wird dieser Prozeß allerdings zur L¨osung eines nicht linearen Problems im Rahmen einer Newton-Iteration angewendet, so kann dieser Startwert zu ungenau sein, und die ganze Iteration divergiert. In einem solchen Fall startet man zur Generierung einer hinreichend genauen Anfangsapproximation den Mehrgitterprozess gew¨ ohnlich auf dem gr¨ obsten Gitter T0 . Wir beschreiben dieses sog. geschachtelte“ ” Mehrgitter-Schema ( nested multigrid“) f¨ ur das lineare Problem. ” Geschachteltes MG: Ausgehend von dem Startwert u0 := A−1 obsten Gitter T0 0 f0 auf dem gr¨ werden f¨ ur l = 1, ..., L rekursiv N¨ aherungen u ˜l ≈ ul berechnet nach der Vorschrift: (0)
ul
= pll−1 u ˜l−1
(t)
(t−1)
ul = M G(l, ul
, fl ),
t = 1, ..., tl ,
(t )
(tl )
kul
− ul k ≤ cˆ h2l kf k,
u ˜ l = ul l . Es gibt nicht den“ Mehrgitteralgorithmus. Die erfolgreiche Realisierung des Mehrgitterkon” zepts erfordert eine sorgf¨ altige Balance der verschiedenen Bestandteile wie Gl¨atter Sl und Gitteur das zu l¨osende Problem. Im roperatoren Al sowie der Gittertransfers rll−1 und pll−1 jeweils f¨ folgenden werden wir diese Verfahrenskomponenten im Rahmen des Finite-Elemente-Kontexts diskutieren. i) Gl¨ atter: Gl¨ atter“ sind u ¨blicherweise einfache Fixpunktiterationen, die auch als L¨oser“ ” ” verwendet werden k¨ onnen, aber mit einer sehr schlechten Konvergenzrate. Sie werden auf jedem Gitterniveau nur ein paarmal angewendet (ν, µ ∼ 1 − 4), um die hochfrequenten Fehleranteile auszud¨ampfen. Wir betrachten im folgenden nur das klassische Richardson-Verfahren, Sl := Il − θl Al ,
θl = λmax (Al )−1 ,
(4.2.54)
welches aber nur bei sehr gutartigen“ Problemen funktioniert. Leistungsf¨ahiger und robuster ” sind das Gauß-Seidel- und das ILU-Verfahren. Diese funktionieren auch noch gut, wenn das Problem gewisse Pathologien beinhaltet. Im Fall eines starken Advektionsterms besitzt die Systemmatrix bei Numerierung der Knotenpunkte in Transportrichtung einen dominanten unteren Dreicksanteil L , f¨ ur den die Gauß-Seidel-Methode exakt“ ist. F¨ ur Probleme mit degenerierten ” Koeffizienten in einer Raumrichtung sowie auf stark anisotropen Gittern besitzt die Systemmatrix einen dominaten Tridiagonalanteil, f¨ ur den wiederum die ILU-Iteration exakt ist. F¨ ur echt indefinite Probleme werden spezielle, der jeweiligen Struktur des Problems angepaßte Gl¨atter verwendet, deren Diskussion aber außerhalb des Rahmens dieser Vorlesung liegt. Auf lokal verfeinerten Gittern darf die Gl¨ attung im Wesentlichen nur auf den jeweils neu hinzugekommenen Zellen operieren, da sonst der arithmetische Aufwand pro Gitterlevel zu groß wird. ii) Gittertransfers: Im Kontext einer Finite-Elemente-Diskretisierung mit geschachtelten Ansatzr¨aumen V0 ⊂ V1 ⊂ ... ⊂ Vl ⊂ ... ⊂ VL ist die generische Wahl f¨ ur die Prolongation pll−1 : Vl−1 → Vl die zellweise Einbettung und f¨ ur die Restriktion rll−1 : Vl → Vl−1 die L2 Projektion. Bei anderen Diskretisierungen (z.B. Differenzenschemata) verwendet man geeignete Interpolationsprozesse (z.B. bilineare Interpolation). iii) Grobgitteroperatoren: Die Operatoren Al auf den verschiedenen Gitterniveaus m¨ ussen nicht notwendig zur selben Diskretisierung des Ausgangsproblems geh¨oren. Dies wird z.B. wichtig
170
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
bei der Ber¨ ucksichtigung von gitterweitenabh¨angiger k¨ unstlicher Diffusion ( upwinding“) zur ” Behandlung von Transporttermen. Wir beschr¨anken uns hier aber auf den Idealfall, daß alle Al durch dieselben FE-Diskretisierungen auf der Gitterhierarchie {Tl }l=0,...,L erzeugt sind. In diesem Fall gilt die f¨ ur die theoretische Analyse n¨ utzliche Beziehung (Al−1 vl−1 , wl−1 ) = a(vl−1 , wl−1 ) = a(pll−1 vl−1 , pll−1 wl−1 ) = (Al pll−1 vl−1 , pll−1 wl−1 ) = (rll−1 Al pll−1 vl−1 , wl−1 ) , d.h.: Al−1 = rll−1 Al pll−1 . iv) Korrekturschritt: Im Korrekturschritt wird ein D¨ampfungsparameter ωl ∈ (0, 1] verwendet, der im einfachsten Fall ωl = 1 gesetzt ist. Es hat sich als sehr wirksam erwiesen, ihn so zu w¨ahlen, daß der Defekt Al v¯l − d˜l−1 minimal wird. Dies f¨ uhrt auf die Formel ωl =
(Al v¯l , d˜l−1 − Al v¯l ) . kAl v¯l k2
(4.2.55)
In der folgenden Analyse werden wir der Einfachheit halber stets ωl = 1 setzen.
4.2.2 Konvergenz- und Aufwandsanalyse Die klassische Analyse des Mehrgitteralgorithmus basiert auf seiner Interpretation als eine Defektkorrekturiteration und dem Konzept einer rekursiven Anwendung des Zweigitterverfahrens. Zur Vereinfachung nehmen wir an, daß nur Vorgl¨attung angewendet wird (d.h.: ν > 0, µ = 0) und daß im Korrekturschritt keine D¨ ampfung erfolgt (d.h.: ωl = 1 ). Der Zweigitterprozeß l¨ aßt sich dann in der folgenden Form schreiben: (t+1)
uL
(t) (t) −1 L−1 = SLν (uL ) + pL fL − AL SLν (uL ) L−1 AL−1 rL (t) −1 L−1 ν (t) = SLν (uL ) + pL L−1 AL−1 rL AL uL − SL (uL ) .
(t)
(t)
F¨ ur den Iterationsfehler eL := uL − uL gilt daher (t+1)
eL
ν (t) −1 L−1 = I L − pL L−1 AL−1 rL AL SL (uL ) − uL .
(4.2.56)
Die Gl¨attungsoperation ist gegeben in der (affin-linearen) Form SL (vL ) := SL vL + gL
und erf¨ ullt als Fixpunktiteration die Bedingung SL (uL ) = uL . Daraus erschließt man rekursiv, daß (t) (t) (t) SLν (uL ) − uL = SL SLν−1 (uL ) − uL = ... = SLν eL . Mit dem sog. Zweigitteroperator“ ”
−1 L−1 ν ZGL (ν) := (IL − pL L−1 AL−1 rL AL )SL
4.2 Mehrgitterverfahren
171
gilt daher (t+1)
eL
(t)
= ZGL (ν)eL .
(4.2.57)
Satz 4.2 (Zweigitterkonvergenz): F¨ ur hinreichend h¨ aufige Gl¨attung, ν > 0 , ist der Zweigitteralgorithmus konvergent mit einer bzgl. L gleichm¨ aßigen L2 -Konvergenzrate: kZGL (ν)k ≤ ρZG (ν) = c ν −1 < 1 .
(4.2.58)
ν L −1 L−1 ZGL (ν) = (A−1 L − pL−1 AL−1 rL )AL SL
(4.2.59)
−1 L−1 ν L kZGL (ν)k ≤ kA−1 L − pL−1 AL−1 rL kkAL SL k .
(4.2.60)
Beweis: Wir schreiben
und sch¨atzen ab:
Der erste Term rechts beschreibt die Qualit¨at der Approximation der Feingitterl¨osung auf dem gr¨oberen Gitter, w¨ ahrend der zweite Term den Gl¨attungseffekt enth¨alt. Die Idee f¨ ur die weitere Analyse ist nun, zu zeigen, daß der Gl¨ atter SL (·) die sog. Gl¨attungseigenschaft“, ” kAL SLν vL k ≤ cs ν −1 h−2 L kvL k ,
vL ∈ VL ,
(4.2.61)
und die Grobgitterkorrektur die sog. Approximationseigenschaft“ besitzt, ” −1 L−1 2 L k(A−1 L − pL−1 AL−1 rL )vL k ≤ ca hL kvL k ,
vL ∈ VL ,
(4.2.62)
mit positiven Konstanten cs , ca gleichm¨aßig bzgl. L . Kombination dieser beiden Absch¨atzungen ergibt dann die behauptete Ungleichung (4.2.58). F¨ ur hinreichend h¨aufige Gl¨attung ist ρZG := cν −1 < 1 , und der Zweigitteralgorithmus konvergiert gleichm¨aßig bzgl. L . Alle im folgenden auftretenden Konstanten sind unabh¨ angig von L . (i) Gl¨ attungseigenschaft: Der selbstadjungierte Operator Al besitzt reelle, positive Eigenwerte 0 < λ1 ≤ ... ≤ λi ≤ ... ≤ λNL =: ΛL mit einem zugeh¨origen L2 -Orthonormalsystem von Eigenfunktionen {w(1) , ..., w(NL ) } , so daß sich jedes vL ∈ VL in der Form vL =
NL X
γi w(i) ,
γi = (vL , w(i) )
(4.2.63)
i=1
darstellen l¨ aßt. F¨ ur den Richardson-Iterationsoperator SL := IL − θL AL : VL → VL ,
θL = Λ−1 L ,
(4.2.64)
gilt dann AL SLν vL =
NL X i=1
λi ν (i) w , γi λi 1 − ΛL
(4.2.65)
172
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
und folglich kAL SLν vL k2 =
NL X i=1
λi 2ν γi2 λ2i 1 − ΛL
NL λi 2ν o X γi2 1≤i≤NL ΛL ΛL i=1 n λ 2 2ν o λ i i = Λ2L max 1− kvL k2 . 1≤i≤NL ΛL ΛL
≤ Λ2L max
n λ 2 i
1−
¨ Mit Hilfe der Beziehung (Ubungsaufgabe) max {x2 (1 − x)2ν } ≤ (1 + ν)−2
(4.2.66)
kAL SLν vL k2 ≤ Λ2l (1 + ν)−2 kvL k2 .
(4.2.67)
0≤x≤1
ergibt sich
ur den RichardsonDie Beziehung ΛL ≤ ch−2 L liefert dann schließlich die behauptete Ungleichung f¨ Iterationsoperator kAL SLν k ≤ cs ν −1 h−2 L ,
ν ≥ 1.
(4.2.68)
(ii) Approximationseigenschaft: Wir erinnern daran, daß im vorliegenden Kontext geschachtelter FE-R¨aume Prolongationen und Restriktionen gegeben sind durch pL at), L−1 = id. (Identit¨
rLL−1 = PL−1 (L2 -Projektion).
Ferner erf¨ ullt der Operator AL : VL → VL definitionsgem¨aß (AL vL , ϕL ) = a(vL , ϕL ),
vL , ϕL ∈ VL .
F¨ ur ein beliebiges, aber fest gew¨ ahltes fL ∈ VL gilt demnach f¨ ur die Funktionen vL := A−1 L fL −1 L−1 und vL−1 := AL−1 rL fL : a(vL , ϕL ) = (fL , ϕL ) ∀ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) ∀ϕL−1 ∈ VL−1 . Der Funktion vL ∈ VL ordnen wir eine Funktion v ∈ V ∩ H 2 (Ω) zu als L¨osung der Randwertaufgabe Lv = fL in Ω,
v = 0 auf ∂Ω,
(4.2.69)
bzw. in schwacher“ Formulierung ” a(v, ϕ) = (fL , ϕ)
∀ϕ ∈ V .
(4.2.70)
4.2 Mehrgitterverfahren
173
Daf¨ ur gilt die a priori Absch¨ atzung k∇2 vk ≤ ckfL k.
(4.2.71)
Dann ist a(vL , ϕL ) = (fL , ϕL ) = a(v, ϕL ),
ϕL ∈ VL ,
a(vL−1 , ϕL−1 ) = (fL , ϕL−1 ) = a(v, ϕL−1 ),
ϕL−1 ∈ VL−1 ,
d.h.: vL und vL−1 sind gerade die Ritz-Projektionen von v auf VL bzw. VL−1 . F¨ ur diese gelten 2 die L -Fehlerabsch¨ atzungen kvL − vk ≤ ch2L k∇2 vk,
kvL−1 − vk ≤ ch2L−1 k∇2 vk.
(4.2.72)
Damit erhalten wir wegen hL−1 ≤ 4hL und der a priori Absch¨atzung (4.2.71): kvL − vL−1 k ≤ ch2L k∇2 vk ≤ ch2L kfL k .
(4.2.73)
Dies bedeutet mit der obigen Setzung, daß −1 L−1 2 L kA−1 L fL − pL−1 AL−1 rL fL k ≤ chL kfL k .
(4.2.74)
Damit folgt die gew¨ unschte Absch¨ atztung 2 L −1 L−1 kA−1 L − pL−1 AL−1 rL k ≤ chL .
(4.2.75)
Dies vervollst¨ andigt den Beweis.
Q.E.D.
Das Resultat f¨ ur den Zweigitteralgorithmus wird nun verwendet zum Nachweis der Konvergenz des vollen Mehrgitteralgorithmus.
Satz 4.3 (Mehrgitterkonvergenz): Es sei angenommen, daß der Zweigitteralgorithmus konvergiert mit einer L2 -Konvergenzrate ρZG (ν) → 0 f¨ ur ν → ∞ , gleichm¨ aßig bzgl. L . Dann konvergiert f¨ ur hinreichend h¨ aufige Gl¨ attung der Mehrgitteralgorithmus mit R ≥ 2 (W-Zyklus) mit einer von L unabh¨ angigen L2 -Konvergenzrate ρM G < 1 , (t)
(t)
kuL − M G(L, uL , fL )k ≤ ρM G kuL − uL k.
(4.2.76)
Beweis: Der Beweis wird durch Induktion nach dem Gitterlevel L gef¨ uhrt. Wir betrachten nur den relevanten Fall R = 2 (W-Zyklus) und werden uns der Einfachheit halber nicht bem¨ uhen, die auftretenden Konstanten zu optimieren. Sei ν so groß, daß die Konvergenzrate des Zweigitteralgorithmus ρZG ≤ 81 ist. Wir wollen zeigen, daß dann die Konvergenzrate des Mehrgitteralgorithmus ρM G ≤ 14 ist, gleichm¨ aßig bzgl. L . F¨ ur L = 1 ist dies dann offenbar richtig. Sei nun 1 ur Gitterlevel L − 1 . Auf Gitterlevel L gilt dann ausgehend von der Iterierten auch ρM G ≤ 4 f¨ (2)
(t)
osung qL−1 (nach 2-maliger Anwendung der Grobgitterkorrektur) uL mit der approximativen L¨ und der exakten L¨ osung qˆL−1 der Defektgleichung auf Level L − 1 : (t+1)
uL
(t)
(t)
(2)
ˆL−1 ) = M G(L, uL , fL ) = ZG(L, uL , fL ) + pL L−1 (qL−1 − q
(4.2.77)
174
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
Nach Induktionsvoraussetzung ist (Man beachte, daß der Startwert der Mehrgitteriteration auf L−1 Level L − 1 gleich Null ist und ρˆL−1 = A−1 L−1 rL dL ): (t)
(2)
L−1 ν qL−1 k = ρ2M G kA−1 kˆ qL−1 − qL−1 k ≤ ρ2M G kˆ L−1 rL AL SL (uL − uL )k . (t)
(4.2.78) (t)
Kombination der letzten Beziehungen ergibt f¨ ur den Iterationsfehler eL := uL − uL : (t) (t+1) ν L−1 (4.2.79) A S k keL k . r keL k ≤ ρZG + ρ2M G kA−1 L L L−1 L
Die Norm rechts ist bereits im Zusammenhang mit der Konvergenz des Zweigitteralgorithmus −1 L−1 ν L abgesch¨atzt worden. Mit dem Zweigitteroperator ZGL = (A−1 L − pL−1 AL−1 rL )AL SL gilt −1 L−1 −1 L−1 ν ν L ν ν A−1 L−1 rL AL SL = SL − (AL − pL−1 AL−1 rL )AL SL = SL − ZGL
und somit ν ν L−1 kA−1 L−1 rL AL SL k ≤ kSL k + kZGL k ≤ 1 + ρZG ≤ 2 .
(4.2.80)
Damit erhalten wir schließlich (t+1)
keL
(t) k ≤ ρZG + 2ρ2M G keL k .
(4.2.81)
Mit Hilfe der Annahme u ¨ ber ρZG und der Induktionsannahme folgt (t+1)
keL
k≤
1 8
was den Induktionsbeweis vervollst¨ andigt.
(t) (t) 1 + 2 16 keL k ≤ 41 keL k ,
(4.2.82) Q.E.D.
F¨ ur gutartige“ Probleme (symmetrischer, positiv definiter Operator, glatte Koeffizienten, ” quasi-gleichf¨ ormige Gitter u.s.w.) erreicht man in der Regel Mehrgitterkonvergenzraten im Bereich ρM G = 0, 1 − 0, 3 . Die obige Analyse ist nur f¨ ur den W-Zyklus g¨ ultig, da im Beweisteil (ii) R ≥ 2 ben¨ otigt wird. Der V-Zyklus kann nicht auf Basis nur einer Zweigitteranalyse behandelt werden. In der Literatur finden sich allgemeinere Ans¨atze, die Konvergenz von Mehrgitterverfahren auch in weniger regul¨ aren Situationen garantieren. Als n¨achstes diskutieren wir die numerische Komplexit¨at des Mehrgitteralgorithmus. Dabei werden die folgenden Bezeichnungen verwendet: OP (T ) = Anzahl der a.Op. zur Durchf¨ uhrung einer Operation T, R = Anzahl der Defektkorrekturschritte auf den einzelnen Gitterniveaus, (d = Raumdimension), Nl = dim Vl ≈ h−d l κ = max Nl−1 /Nl , 1≤l≤L
C0 = OP (A−1 0 )/N0 , Cs = max {OP (Sl )/Nl },
Cd = max {OP (dl )/Nl },
Cr = max {OP (rl )/Nl },
Cp = max {OP (pl )/Nl }.
1≤l≤L
1≤l≤L
1≤l≤L
1≤l≤L
In der Praxis ist meist κ ≈ 2−d , Cs ≈ Cd ≈ Cr ≈ Cp ≈ #{anm 6= 0} und C0 N0 ≪ NL .
4.2 Mehrgitterverfahren
175
Satz 4.4 (Mehrgitterkomplexit¨ at): Unter der Bedingung q := Rκ < 1 gilt f¨ ur einen Mehrgitterzyklus M Gl : OP (M GL ) ≤ CL NL mit CL =
(4.2.83)
(ν + µ)Cs + Cd + Cr + Cp + O(q L ), 1−q
Der Mehrgitteralgorithmus liefert die NL -dimensionale diskrete L¨osung uL ∈ VL auf dem Gitter TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit O(NL ln(NL )) a.Op. und hat damit (fast) optimale Komplexit¨ at.
Beweis: Wir setzen Cl := OP (M Gl )/Nl . Ein Mehrgitterschritt beinhaltet die R-fache Anwendung desselben Algorithmus auf dem n¨achst gr¨oberen Gitter. Bei Beachtung von Nl−1 ≤ κNl gilt mit Cˆ := (ν + µ)Cs + Cd + Cr + Cp : ˆ L + R · OP (M GL−1 ) = CN ˆ L + R · CL−1 NL−1 ≤ CN ˆ L + qCL−1 NL , CL NL = OP (M GL ) ≤ CN und folglich CL ≤ Cˆ + qCL−1 . Rekursive Anwendung dieser Beziehung liefert ˆ + q + q 2 + ... + q L−1 ) + q L C0 ≤ CL ≤ C(1
Cˆ + q L C0 . 1−q
Dies impliziert die behauptete Absch¨ atzung (4.2.83). Die Komplexit¨at des Gesamtalgorithmus ergibt sich dann aus den Beziehungen −2/d
ρtM G ≈ h2L ≈ NL
,
t≈−
ln(NL ) . ln(ρM G )
Dies vervollst¨ andigt den Beweis.
Q.E.D.
Wir bemerken, daß im Beweis der Aussage (4.2.83) die Bedingung q := Rκ = R max Nl−1 /Nl < 1 1≤l≤L
¨ wesentlich ist. Dies besagt f¨ ur den W-Zyklus (R = 2), daß sich beim Ubergang vom Gitter Tl−1 zum n¨achst feineren Tl die Anzahl der Gitterpunkte (bzw. Freiheitsgrade) hinreichend stark erh¨ohen muß, etwa wie bei einer gleichf¨ormigen Verfeinerung Nl ≈ 4Nl−1 . Bei einem adaptiv gesteuerten Verfeinerungsprozeß mit teilweise nur lokaler Gitterverfeinerung ist dies meist nicht erf¨ ullt; selbst bei Verwendung der Fest-Raten“-Strategie ist z.B. oft nur ” Nl ≈ 2Nl−1 . In solchen F¨ allen muß der Mehrgitterprozeß zur Aufwandsersparnis modifiziert werden. Dies geschieht dadurch, daß die kostenintensive Gl¨attung sowie die anderen Operatio¨ nen nur jeweils auf den beim Ubergang von Tl−1 zu Tl neu hinzugekommenen Gitterpunkten durchgef¨ uhrt werden. Bei der Implementierung eines Mehrgitteralgorithmus auf lokal verfeinerten Gittern ist viel Fingerspitzengef¨ uhl erforderlich, wenn der resultierende Gesamtalgorithmus komplexit¨ats-optimal sein soll.
176
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
F¨ ur das geschachtelte MG-Schema erh¨alt man sogar im strengen Sinne optimale“ L¨osungs” komplexit¨at O(NL ) , da auf jedem Gitterniveau bestm¨ogliche Startwerte verwendet werden. Satz 4.5 (Geschachteltes Mehrgitterverfahren): Das geschachtelte MG-Schema ist komplexit¨ats-optimal, d.h.: Es liefert die diskrete L¨ osung uL ∈ VL auf dem feinsten Gitter TL im Rahmen der Diskretisierungsgenauigkeit O(h2L ) bzgl. der L2 -Norm mit einem Aufwand von O(NL ) a.Op. Beweis: Die Genauigkeitsanforderung f¨ ur die Mehrgitteriteration auf Gitterlevel TL ist (t)
keL k ≤ cˆh2L kf k.
(4.2.84)
(i) Wir wollen zun¨ achst zeigen, daß (4.2.84) beim geschachtelten MG-Schema unter den Voraussetzungen des Mehrgitterkonvergenzsatzes 4.3 auf jedem Level L mit einer (hinreichend (t) (t) großen) festen Zahl t∗ von Mehrgitterschritten erreichbar ist. Sei eL := uL − uL wieder der (t) (t) (0) Iterationsfehler auf Level L . Nach Annahme ist e0 = 0, t ≥ 1 . Im Fall uL := uL−1 gilt dann (0)
(t)
(t)
keL k ≤ ρtM G keL k = ρtM G kuL−1 − uL k
(t) ≤ ρtM G kuL−1 − uL−1 k + kuL−1 − uk + ku − uL k (t) ≤ ρtM G keL−1 k + ch2L kf k .
Rekursive Anwendung dieser Beziehung f¨ ur L ≥ l ≥ 1 ergibt dann (wegen hl = 2L−l hL ) (t) (t) keL k ≤ ρtM G ρtM G keL−2 k + ch2L−1 kf k + ch2L kf k .. .
(t) t 2 2t 2 Lt 2 ≤ ρLt M G ke0 k + cρM G hL + cρM G hL−1 + ... + cρM G h1 kf k 2·2 2·L = c2−2 h2L ρtM G 22 + ρ2t + ... + ρLt kf k M G2 M G2
≤ c2−2 h2L kf k
22 ρtM G , 1 − 22 ρtM G
vorausgesetzt 22 ρtM G < 1 . Offenbar gibt es also ein t∗ , so daß (4.2.84) f¨ ur t ≥ t∗ erf¨ ullt ist, und zwar gleichm¨ aßig bzgl. L . (ii) Wir kommen nun zur Aufwandsanalyse. Satz 4.4 besagt, daß ein Zyklus des einfachen“ ” Mehrgitteralgorithmus M G(l, ·, ·) auf dem l-ten Level Wl ≤ c∗ Nl a.Op. ben¨otigt (gleichm¨aßig ˆ l die Anzahl der a.Op. des geschachtelten Schemas auf Gitterlevel l . Dann bzgl. l ). Sei nun W gilt konstruktionsgem¨ aß: ˆL ≤ W ˆ L−1 + t∗ WL . W Durch Iteration dieser Beziehung erhalten wir mit κ := max1≤l≤L Nl−1 /Nl < 1 : ˆ L ≤ t∗ c∗ {NL + ... + N0 } ≤ ct∗ c∗ NL {1 + ... + κL } ≤ ct∗ c∗ NL , W 1−κ was zu beweisen war.
Q.E.D.
¨ 4.3 Ubungen
177
¨ 4.3 Ubungen ¨ Ubung 4.1: Das allgemeine “Abstiegsverfahren” zur iterativen L¨osung des Gleichungssystems Ax = b mit symmetrischer, positiv-definiter Matrix A ∈ RN ×N lautet: Startwert: f¨ ur t ≥ 0:
x(0) ∈ Rn ,
r (0) := b − Ax(0) ,
Abstiegsrichtung
αt =
d(t) ,
hr (t) , d(t) i , hAd(t) , d(t) i
x(t+1) = x(t) + αt d(t) ,
r (t+1) = r (t) − αt Ad(t) .
Die sog. “Koordinatenrelaxation” erh¨ alt man durch zyklische Wahl der Abstiegsrichtungen d(t) aus den kartesischen Einheitsvektoren {e(1) , . . . , e(N ) } . Man zeige, daß jeder N -Zyklus der Koordinatenrelaxition ¨ aquivalent ist zum u ur eine ¨ blichen Gauß-Seidel-Verfahren. Bemerkung: F¨ typische FE-Matrix hat die zyklische Koordinatenrelaxation also das Konvergenzverhalten: |x(tN ) − x| ≤ cq t ,
q ≈ 1 − cond2 (A)−1 ≈ 1 − h2 .
¨ Ubung 4.2: Die erste RWA des Laplace-Operators −∆u = f in Ω,
u = 0 auf ∂Ω,
auf einem regul¨ aren” Gebiet Ω ⊂ R2 werde mit einem FE-Verfahren mit st¨ uckweise linea” ren Ansatzfunktionen auf einer Folge von quasi-gleichf¨ormigen Gittern (d.h. gr¨oßen- und formregul¨ar) der Weite h diskretisiert. Dies f¨ uhrt auf lineare Gleichungssysteme Ax = b mit symmetrischen, positiv definiten (N × N )-Matrizen A , wobei N die Anzahl der Knotenpunkte ist. Welchen arithmetischen Aufwand (ausgedr¨ uckt in Potenzen von h) erfordert dabei die L¨osung dieser Gleichungssysteme mit dem CG-Verfahren mit der Genauigkeit des Diskretisierungsfehlers gemessen in der Energie-Norm” k∇(u − uh )k ? Dazu verwende man die folgende bekannte ” Fehlerabsch¨ atzung f¨ ur das CG-Verfahren: √ 1 − 1/ κ t t 0 √ , kx − x kA ≤ 2q kx − x kA , q := 1 + 1/ κ mit der diskreten Energienorm” kxkA := (Ax, x)1/2 und der Spektralkondition κ := cond2 (A) ” von A . (Hinweis: Man verwende die bekannte Beziehung f¨ ur die Spektralkondition von A sowie die aus der obigen Fehlerabsch¨ atzung abgeleitete Absch¨atzung f¨ ur die Anzahl der Iterationsschritte. Der Aufwand pro CG-Schritt entspricht etwas der zweimaligen Defektberechnung x → d := Ax − b .) ¨ Ubung 4.3: Man versuche, den Beweis der Konvergenz des Zweigitterverfahrens ZG aus der Vorlesung f¨ ur den Fall zu verallgemeinern, daß die Restriktion rll−1 : Vl → Vl−1 mit Hilfe lokaler, bilinearer Interpolation (anstelle der L2 -Projektion) auf dem Gitter Tl−1 definiert ist. Wo ist dabei das Problem, und wie kann man damit fertig werden?
178
Iterative L¨osungsverfahren f¨ ur FD- und FE-Gleichungen
¨ Ubung 4.4: Die FE-Diskretisierung des Konvektions-Diffusionsproblems −∆u + ∂1 u = f in Ω,
u = 0 auf ∂Ω,
f¨ uhrt auf unsymmetrische Systemmatrizen Ah . In diesem Fall erfordert die Analyse des Mehrgitterverfahrens einige Modifikationen. Man u ur die ¨bertrage den Beweis aus der Vorlesung f¨ Konvergenz des Zweigitteralgorithmus, wenn als Gl¨atter wieder das Richardson-Verfahren = xth − θt (Ah xth − bh ), xt+1 h
t = 0, 1, 2, . . . ,
mit den D¨ampfungsparametern θt := 21 kAh k−1 verwendet wird. ¨ Ubung 4.5: Zur L¨ osung der 1. RWA der Laplace-Gleichung −∆u = f in Ω,
u = 0 auf ∂Ω,
auf dem Einheitsquadrat Ω = (0, 1)2 werde auf einer Folge ¨aquidistanter, kartesischer Gitter Tl mit Gitterweiten hl = 2−l mit Hilfe bilinearer finiter Elemente approximiert. Die diskrete Gleichung auf Gitterlevel l werde dabei mit einem MG-Verfahren gel¨ost, wobei das RichardsonVerfahren zur Gl¨ attung, die nat¨ urliche Einbettung zur Prolongation und die lokale bilineare Interpolation zur Restriktion verwendet werden. Die Anzahl der Vor- und Nachgl¨attungsschritte sei ν = 2 und µ = 0 . Wieviele a.Op. kosten dann ungef¨ahr ein V-Zyklus und ein W-Zyklus ausgedr¨ uckt in Vielfachen der Dimension Nl = dim Vl ?
5 Verfahren fu ¨ r parabolische Probleme Wir diskutieren zun¨ achst wieder die klassischen Differenzenapproximationen zur L¨osung para¨ bolischer Anfangs-Randwert-Aufgaben. Der Ubersichtlichkeit halber beschr¨anken wir uns dabei auf das Modellproblem der W¨ armeleitungsgleichung in zwei Ortsdimensionen mit Dirichletschen Randbedingungen, d.h. auf die 1. ARWA: ∂t u + Lu = f
in Ω × (0, T ),
u|∂Ω = 0,
u|t=0 = u0 ,
(5.0.1)
mit einem elliptischen Operator L , der hier exemplarisch als L := −a∆ mit einer Konstanten a > 0 gew¨ahlt wird. Das Definitionsgebiet Ω ∈ R2 wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, g, u0 sind ebenfalls glatt und kompatibel, so daß die L¨osung ebenfalls als glatt angenommen werden kann. Erweiterungen f¨ ur Probleme mit weniger regul¨aren Daten oder anderen Randbedingungen sowie auf den dreidimensionalen Fall werden gegebenenfalls in Bemerkungen ber¨ ucksichtigt. Gelegentlich wird auch das eindimensionale Analogon von (5.0.1) betrachtet. Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von (5.0.1): (∂t u, ϕ) + a(u, ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(5.0.2)
mit dem u ¨blichen Sobolew-Raum V := H01 (Ω) und der symmetrischen und positiv definiten Energie-Form“ a(u, ϕ) := (a∇u, ∇ϕ)Ω . ” Bei der Diskretisierung von instation¨aren Problemen gibt es drei verschiedene Vorgehensweisen, die wir im folgenden kurz beschreiben wollen. i) Linienmethode“: Zun¨ achst wird eine Diskretisierung bzgl. der Ortsvariablen vorgenom” men, d.h.: mit Hilfe eines Finite-Differenzen- oder Finite-Elemente-Ansatzes werden diskrete“ ” Funktionen uh (t) = uh (·, t) bestimmt aus der Gleichung u˙ h (t) + Ah uh (t) = fh (t), t ≥ 0,
uh (0) = u0h .
(5.0.3)
Im Falle eines Differenzenverfahrens auf einem Ortsgitter {xi }i=1,...,N ist die diskrete Funktion N → RN die uh (t) = (un (t))N n=1 der Vektor der Knotenwerte un (t) ≈ u(xn , t) , Ah = Ah : R zum verwendeten Differenzenoperator korrespondierende Matrix und fh = bh = (f (xn ))N n=1 . Beim Finite-Elemente-Ansatz ist uh (t) ∈ Vh eine Finite-Elemente-Funktion, Ah =: Vh → Vh das durch (Ah vh , ϕh ) = a(vh , ϕh ), vh , ϕh ∈ Vh ,
definierte diskrete Analogon zum Differentialoperators L und fh = Ph f ∈ Vh die L2 -Projektion der rechten Seite f auf Vh . Die Aufgabe (5.0.3) lautet demgem¨aß in variationeller Form wie folgt: (u˙ h (t), ϕh ) + a(uh (t), ϕh ) = (f, ϕh ) ∀ϕh ∈ Vh , t ∈ I,
uh (0) = Ph u0 .
(5.0.4)
(n)
Nach Einf¨ uhrung einer Knotenbasis {ϕh , n = 1, ..., N = dim(Vh )} geht dieses Problem u ¨ber N in ein System f¨ ur den Vektor Uh (t) = (Un (t))n=1 der zugeh¨origen Knotenwerte, Mh U˙ h (t) + Ah Uh (t) = bh (t), t ≥ 0, 179
Uh (0) = Uh0 ,
(5.0.5)
180
Verfahren f¨ ur parabolische Probleme
mit der Steifigkeitsmatrix“ und Massenmatrix“ ” ” (n)
(m)
Ah = (a(ϕh , ϕh ))N n,m=1 ,
(n)
(m)
Mh = ((ϕh , ϕh ))N n,m=1
der Finite-Elemente-Basis. In beiden F¨allen, (5.0.3) oder (5.0.5), handelt es sich um ein System von (linearen) gew¨ ohnlichen Differentialgleichungen. Dieses wird nun mit einem der u ¨ blichen Schemata bzgl. der Zeit diskretisiert. Nach Wahl einer (zun¨achst konstanten) Zeitschrittweite k werden zu den “diskreten“ Zeitleveln tm = mk Approximationen Uhm = (Unm )N n=1 zu u(·, tm ) bestimmt. Wir sprechen von einem Einschritt-“ bzw. einem Zweischrittverfahren“, wenn Uhm ” ” aus den vorausgehenden Werten gem¨ aß einer Formel der Form Uhm = F (Uhm , Uhm−1 ) bzw. Uhm = F (Uhm , Uhm−1 , Uhm−2 ) berechnet wird. Im Falle Uhm = F (Uhm−1 ) bzw. Uhm = F (Uhm−1 , Uhm−2 ) heißt die Methode explizit“. Zur Durchf¨ uhrung einer nicht expliziten, d.h. impliziten“, Me” ” thode m¨ ussen in jedem Zeitschritt Gleichungssysteme gel¨ost werden. Die hohe Dimension des Systems, N = #{Gitterpunkte an } bzw. N = dim(Vh ) , mit N ∼ 103 − 108 impliziert im Hinblick auf die L¨ osungs¨ okonomie Einschr¨ankungen bei der Wahl der Verfahren. Es kommen in der Regel nur Schemata einfacher Struktur, d.h. mit wenigen Matrix-Vektor-Multiplikationen, und niedriger Ordnung r = 1 − 4 in Frage. Eine weitere wesentliche Einschr¨ankung besteht in der generischen Steifheit des Systems. Die Systemmatrix Ah hat in Abh¨angigkeit von der (gleichf¨ormigen) Gitterfeinheit h die Kondition κ2 (Ah ) ≈ h−2 . Bei expliziten Zeitschrittschemata sind also einschneidende Schrittweitenrestriktionen einzuhalten, welche deren Verwendung in der Regel verbietet. Der formale Vorteil der expliziten Verfahren, daß in den einzelnen Zeitschritten keine impliziten Gleichungssysteme zu l¨osen sind, wird besonders in h¨ oheren Raumdimensionen (d = 2, 3) durch die hohe Zahl von durchzuf¨ uhrenden Zeitschritten (besonders bei Verwendung lokal verfeinerter Ortsgitter) schnell aufgehoben. Beispiel numerischer Instabilit¨ at: Wir wollen dies anhand einer einfachen Modellsituation illustrieren. Die eindimensionale, homogene Version der ARWA (5.0.1) ∂t u − ∂x2 u = 0 in Ω = (0, 1),
u|∂Ω = 0,
u|t=0 = u0
(5.0.6)
wird auf einem ¨ aquidistanten Gitter 0 = x0 < ... < xn < ... < xN +1 = 1 mit Hilfe zentraler Differenzenquotienten 2. Ordnung, n o ∂x2 u(xn , t) ≈ h−2 Un−1 (t) − 2Un (t) + Un+1 (t) .
ugt dann dem System gew¨ohnlicher diskretisiert. Die Vektorfunktion Uh (t) = (Un (t))N n=1 gen¨ Differentialgleichungen U˙ n (t) − h−2 {Un−1 (t) − 2Un (t) + Un+1 (t)} = 0 , wobei bei Ber¨ ucksichtigung der Randbedingungen U0 ≡ UN +1 ≡ 0 gesetzt ist. Die Anfangswerte
181
sind naturgem¨ aß Un (0) = u0 (xn ). Dies kann kompakt geschrieben werden als U˙ h + Ah Uh (t) = 0 , t ≥ 0, mit der (N × N )-Matrix
Ah = h−2
−2
1 0
1
Uh (0) = U 0 ,
0
−2 .. .. . .
(5.0.7)
.. . . −2 1 1 −2
Diese Matrix hat, wie wir bereits wissen, die Eigenwerte 0 < λ1 ≤ ... ≤ λN =
4 + O(h2 ), h2
(5.0.8)
d.h.: Das nach Ortsdiskretisierung entstandene System (5.0.7) wird f¨ ur kleines h zunehmend −2 1 steif mit Steifigkeitsrate κ = O(h ). Beim expliziten Euler -Schema ( Polygonzugmethode“) ” ist z.B. aus Stabilit¨ atsgr¨ unden die Schrittweitenbedingung −λn k ∈ [−2, 0]
⇒
k ≤ 21 h2
(5.0.9)
einzuhalten. Diese Schrittweitenbeschr¨ankung f¨ ur explizite Verfahren hat entscheidende praktische Bedeutung. Wir wollen das Ph¨anomen der numerischen Instabilit¨at illustrieren. Dazu betrachten wir als einfachstes explizites Zeitschrittschema das klassische Euler-Verfahren (Polygonzugmethode) mit ¨ aquidistanter Schrittweite k . Dies f¨ uhrt auf die folgenden Differenzengleichungen f¨ ur die Approximationen Unm ≈ u(xn , tm ) : Unm+1 = Unm + F¨ ur k = h2 ist dann
k m m m U − 2U + U n n+1 . h2 n−1
(5.0.10)
m m Unm+1 = Un−1 − Unm + Un+1 .
Im Fall oszillierender Anfangsdaten u0n = (−1)n ergibt sich
Un1 = (−1)n−1 − (−1)n + (−1)n+1 = −3(−1)n = −3Un0 , und bei Fortsetzung dieses Arguments: Unm = (−3)m Un0 ,
m ≥ 1, n = 1, ..., N.
(5.0.11)
Dieses Verhalten bedeutet numerische Instabilit¨at“. Es mag unrealistisch erscheinen, eine oszil” lierende Anfangsbedingung der Art Un0 = (−1)n anzunehmen, doch bedingt durch Rundungs-
1 Leonhard Euler (1707-1783), geb. in Basel: universeller Mathematiker und Physiker; bedeutendster und produktivster Mathematiker seiner Zeit; wirkte in Berlin und St. Petersburg; Arbeiten zu allen mathemischen Gebieten seiner Zeit.
182
Verfahren f¨ ur parabolische Probleme
fehler k¨onnte gelten Un0 = Vn0 + ε(−1)n
(5.0.12)
mit glatten“ exakten Anfangsdaten V 0 . Wegen der Linearit¨at der betrachteten Differenzen” gleichungen folgt Unm = Vnm + ε(−3)m (−1)n ,
(5.0.13)
so daß die anf¨ anglich kleinen Anfangsst¨ orungen schnell anwachsen. Z.B. ist diese f¨ ur ε = 10−15 > −32 3 bereits nach nur 32 Zeitschritten auf Gr¨oße ≈ 1 angewachsen und zwar unabh¨angig von der Gr¨oße von h . ii) Rothe-Methode“: Bei der Rothe2 -Methode wird die Differentialgleichung als gew¨ohnliche ” Differentialgleichung f¨ ur eine Hilbertraum-wertige Funktion U (t) ∈ V aufgefaßt und zun¨achst mit einem A-stabilen Verfahren in der Zeit diskretisiert. Bei Verwendung z.B. des impliziten Euler-Schemas ergibt sich eine Folge von speziellen Randwertaufgaben U m + kLU m = U m−1 + kf m , m ≥ 1,
U 0 (x) = u0 (x) .
Diese Probleme werden nun nacheinander auf m¨oglicherweise wechselnden, dem L¨osungsverlauf angepaßten Ortsgittern diskretisiert. Das Problem ist dabei der ad¨aquate Transfer der jeweiligen Startl¨osung U m−1 vom alten auf das neue Ortsgitter. Hier zeigt sich wieder der systematische Vorteil einer Finite-Elemente-Galerkin-Methode, bei der sich ganz automatisch als richtige Wahl die L2 -Projektion von U m−1 auf das neue Gitter ergibt. ¨ iii) Globale Orts-Zeit-Diskretisierung: Ahnlich wie bei den Transportproblemen k¨onnte auch bei der W¨ armeleitungsgleichung eine simultane Diskretisierung (etwa mit einem FiniteElemente-Galerkin-Verfahren) auf einem unstrukturierten Gitter der ganzen (x, t)-Ebene erfolgen. Dieser theoretisch durchaus attraktive Ansatz wird aber bei h¨oher dimensionalen Problemen wegen der globalen Kopplung aller Unbekannten sehr rechenaufwendig und spielt daher bei parabolischen Problemen in der Praxis keine wesentliche Rolle. Im folgenden Abschnitt werden wir Differenzenapproximationen in Verbindung mit der Linienmethode betrachten. Die Rothe-Methode wird in Verbindung mit Finite-Elemente-Verfahren im Ort diskutiert. Dies m¨ undet dann auch ohne Probleme in Galerkin-Diskretisierungen simultan in Ort und Zeit, den sog. unstetigen“ oder stetigen“ Galerkin-Verfahren (sog. dG(r)-“ ” ” ” oder cG(r)-Verfahren“). ”
2
Erich Rothe (1895-1988): deutscher Mathematiker; Promotion und Habilitation in Berlin (1928), danach Assistent in Breslau, nach dem Krieg Prof. an der University of Michigan, USA.
5.1 Differenzenverfahren f¨ ur parabolische Probleme
183
5.1 Differenzenverfahren fu ¨r parabolische Probleme 5.1.1 Zeitschrittverfahren Wir beginnen mit der Diskussion der Linienmethode“ zur Diskretisierung von parabolischen ” ARWAn der Art ∂t u + Lu = f
in QT := Ω × I,
u|∂Ω = 0, u|t=0 = u0 ,
(5.1.14)
mit L := −a∆ auf einem beschr¨ ankten (regul¨ar berandeten) Gebiet Ω ⊂ R2 und einem Zeitintervall I = [0, T ] . Der Einfachheit halber wird die rechte Seite f gelegentlich zu Null gesetzt. Ortsdiskretisierung von (5.1.14) mit einem der u ¨ blichen Differenzenverfahren (z.B. dem 5Punkte-Operator mit geeigneter Randapproximation) f¨ uhrt auf ein System gew¨ohnlicher Differentialgleichungen U˙ h (t) + Ah Uh (t) = 0,
t > 0,
Uh (0) = U 0 ,
(5.1.15)
f¨ ur den Vektor Uh (t) ∈ RN der Knotenwerte. Da die Eigenwerte der Systemmatrix Ah alle reell sind (oder wenigstens nahe an der rellen Achse liegen), k¨ame zur stabilen Integration des Systems (5.1.15) jede A(0)-stabile Formel in Frage. Dabei muß aber der hohe numerische Aufwand bei der Durchf¨ uhrung komplizierter impliziter Verfahren hoher Ordnung ber¨ ucksichtigt werden. ¨ Durch Ubertragung der klassischen Zeitschrittformeln f¨ ur gew¨ohnliche Differentialgleichungen auf das System (5.1.15) erhalten wir unter Benutzung der oben eingef¨ uhrten Bezeichnungen die folgenden einfachsten Einschrittverfahren: 1) Explizites Euler-Verfahren (Polygonzugmethode): k−1 {Uhm − Uhm−1 } + Ah Uhm−1 = f m−1 ,
m ≥ 1,
2) Implizites Euler-Verfahren: k−1 {Uhm − Uhm−1 } + Ah Uhm = f m ,
m ≥ 1,
3) Crank3 -Nicolson4 -Verfahren (Trapezregel): k−1 {Uhm − Uhm−1 } + 21 Ah (Uhm + Uhm−1 ) = 12 k(f m + f m−1 ),
m ≥ 1,
und die Zweischrittverfahren: 4) BDF(2)-Verfahren (R¨ uckw¨ artsdifferenzenformel): m 1 −1 2 k {3Uh
− 4Uhm−1 + Uhm−2 } + Ah Uhm = f m,
m ≥ 2,
5) Mittelpunkts-Verfahren: m 1 −1 2 k {Uh 3
− Uhm−2 } + Ah Uhm−1 = f m−1 ,
m ≥ 2,
John Crank (1916-): englischer Mathematiker; Prof. an der Brunel University, Uxbridge, England; Beitr¨ age zur Numerik partieller Differentialgleichungen, bekannt durch das Crank-Nicolson-Verfahren“. ” 4 Phyllis L. Nicolson (1917-1968): englische Physikerin; Lecturer an der Univ. Leeds und an der Univ. Manchester; bekannt durch das Crank-Nicolson-Verfahren“. ”
184
Verfahren f¨ ur parabolische Probleme
6) Simpson-Verfahren: m 1 −1 2 k {Uh
− Uhm−2 } + 23 Ah {Uhm + 4Uhm−1 + Uhm−2 } = f m−1 ,
m ≥ 2.
Als Startwerte werden gew¨ ohnlich (im Fall glatter Anfangsdaten) einfach die Restriktionen Un0 = u0 (an ) verwendet. Bei den Zweischrittverfahren wird der zweite erforderliche Startwert Uh1 durch Anwendung einer Einschrittformel entsprechender Ordnung gewonnen. Wegen ihrer inh¨ arenten Instabilit¨ at (triviales Stabilit¨ atsgebiet) kommen die Mittelpunktsformel und die Simpson-Formel f¨ ur die praktische Anwendung nicht in Frage. Wie bei der Analyse von Differenzenverfahren u ¨ blich verwenden wir den Abschneidefehler“ ” m = (τ m )N der Differenzenformeln. Diesen erh¨ a lt man wieder durch formales Auswerten der τh,k n n=1 Differenzenformeln auf der exakten L¨ osung: m := um − F (um , um−1 , um−2 ). k τh,k
Bei einer Ortsdiskretisierung der Ordnung p verh¨alt sich der Abschneidefehler dann gem¨aß m τh,k = O(hp + kq ),
wobei q die Ordnung“ des Zeitschrittverfahrens ist. Von der Fehleranalyse der Zeitschrittverfah” ren f¨ ur gew¨ohnliche Differentialgleichungen wissen wir bereits, daß die einfachen Euler-Verfahren die Ordnung q = 1 und das Crank-Nicolson- sowie das BDF(2)-Verfahren die Ordnung q = 2 haben. Sp¨ater werden wir noch Verfahren der Ordnung q = 3, 4 kennenlernen. Bei der Analyse dieser Zeitschrittschemata f¨ ur parabolische Probleme ist die genaue Abh¨angigkeit des Abschneidefehlers von der ¨ ortlichen und zeitlichen Regularit¨at der L¨osung interessant. Hilfssatz 5.1 (Konsistenz): F¨ ur die ARWA (5.1.14) gen¨ ugen die Abschneidefehler der betrachteten Differenzenverfahren den folgenden (scharfen) Absch¨atzungen: i) Explizites und implizites Euler-Verfahren: m | ≤ max |τhm | + 12 k max |∂t2 u| ; max |τh,k ¯T Q
¯T Q
¯T Q
(5.1.16)
ii) Crank-Nicolson-Verfahren: max |∂t3 u| ;
(5.1.17)
m | ≤ max |τhm | + 32 k2 max |∂t3 u| . max |τh,k
(5.1.18)
m | ≤ max |τhm | + max |τh,k ¯T Q
¯T Q
1 2 12 k
¯T Q
iii) BDF(2)-Verfahren: ¯T Q
¯T Q
¯T Q
Dabei ist τhm = O(h2 ) der Abschneidefehler der Ortsdiskretisierung. Beweis: Der Abschneidefehler der Ortsdiskretisierung gen¨ ugt im allgemeinen der Absch¨atzung |τhm | = |Lum − Lh um | ≤ ch2 M4m (u), wobei Lh der Ortsdifferenzenoperator ist und M4 (u) := maxΩ¯ |∇4 um | . Speziell in einer Raum-
5.1 Differenzenverfahren f¨ ur parabolische Probleme
185
dimension mit Ω = (0, 1) gilt |τhm | = |∂x2 um − Lh um | ≤
4 m 1 2 12 h max |∂x u |. [0,1]
i) F¨ ur die explizite Euler-Formel gilt |k
−1
m
(u − u
m−1
m−1
) + Lh u
Z −1 | = k Z = k−1
Z ≤ k−1
≤ k−1
Z
tm tm−1 tm tm−1 tm tm−1 tm
tm−1
∂t u dt + Lh um−1
∂t u dt − ∂t um−1 − Lum−1 + Lh um−1
∂t u − ∂t um−1 ds + |Lum−1 − Lh um−1 |
(t − tm−1 ) dt
max |∂t2 u| + |τhm−1 |
[tm−1 ,tm ]
Es folgt m | ≤ 21 k max |∂t2 u| + max |τhm−1 |. max |τh,k ¯T Q
¯T Q
¯T Q
Dieselbe Absch¨ atzung gilt auch f¨ ur die implizite Euler-Formel. ii) F¨ ur die Crank-Nicolson-Formel gilt |k
−1
m
(u − u
m−1
)+
m 1 2 Lh (u
+u
m−1
Z −1 )| = k
tm tm−1
∂t u dt − 21 (∂t um + ∂t um−1 )
+ 12 (Lum − Lh um ) + 21 (Lum−1 − Lh um−1 ) Z tm −1 1 ≤k (t − t )(t − t ) dt max |∂t3 u| m m−1 2 +
tm−1 m−1 m 1 |) 2 (|τh | + |τh
[tm−1 ,tm ]
Wir erhalten damit m max |τh,k |≤ ¯T Q
1 2 12 k
max |∂t3 u| + max |τhm |. ¯T Q
¯T Q
iii) F¨ ur die BDF(2)-Formel gilt m 1 −1 2 k {3u
− 4um−1 + um−2 + Lh um } = 21 k−1 {3um − 4um−1 + um−2 − 2k∂t um } + Lh um − Lum .
Taylor-Entwicklung um tm liefert 3um − 4um−1 + um−2 − 2k∂t um = 43 k3 ∂t3 u(·, η m )
186
Verfahren f¨ ur parabolische Probleme
mit gewissen Zwischenstellen η m ∈ [tm−2 , tm ] . Damit erhalten wir m | ≤ 32 k2 max |∂t3 u| + max |τhm |. max |τh,k ¯T Q
¯T Q
¯T Q
Dies vervollst¨ andigt den Beweis.
Q.E.D.
Die L¨osung der ARWA (5.1.14) besitzt die explizite Darstellung u(x, t) =
∞ X
u0n v (n) (x)e−λn t ,
n=1
(x, t) ∈ QT ,
(5.1.19)
mit den Eigenwerten und (orthonormierten) Eigenfunktionen des regul¨aren elliptischen“ Ope” rators −a∆ : V ⊂ L2 (Ω) → L2 (Ω) , 0 < λ1 < ... ≤ λn ≤ ... (n ∈ N),
v (n) (x) ∈ V :
−a∆v (n) = λn v (n) ,
und den Entwicklungskoeffizienten der Startwerte u0 (x) =
∞ X
u0n v (n) (x) ,
u0n = (u0 , v (n) )Ω .
n=0
Diese Darstellung l¨ aßt sich wegen der gleichm¨aßigen Konvergenz der Reihen wie folgt umformen: u(x, t) = = =
∞ X
∞ X
u0n v (n) (x)
i i i λn t
(−1)
i!
∞ ∞ iX X it (−1) u0n λin v (n) (x) = i!
n=1 i=0 i=0 ∞ ∞ ∞ X i i X X it it 0 i (n) i (−1) (−1) ∆ un ∆ v (x) = u0n v (n) (x) i! n=1 i! n=1 i=0 i=0 ∞ X 0 t∆ 0 i i1 n=1 ∞ X
(−1)
i=0
i!
(−t∆) u (x) =: e u (x).
Die Definition der Operatorfunktion et∆ u ¨ber eine konvergente Taylor-Reihe l¨aßt sich auf beliebige analytische Funktionen u ¨ bertragen. Wir betonen, daß eine solche kompakte L¨osungsdarstellung nur im Fall zeitlich konstanter Koeffizienten a m¨oglich ist. Auf dem diskreten Zeitgitter gilt dann u(·, tm ) = ek∆ u(·, tm−1 ),
m ∈ N.
(5.1.20)
Dies legt es nahe, den Zeitschritt tm−1 → tm mit Hilfe einer rationalen Approximation R(z) ≈ ez der Exponentialfunktion der Ordnung“ q + 1 anzusetzen, ” P (z) R(z) = = ez + O(|z|q+1 ), z ≤ 0, (5.1.21) Q(z) mit geeigneten Polynomen P ∈ Pr und Q ∈ Ps , wobei nat¨ urlich Q auf z ∈ R− keine Nullstellen haben darf. Das Diskretisierungsschema lautet dann Uhm = R(−kAh )Uhm−1
bzw. Q(−kAh )Uhm = P (−kAh )Uhm−1 .
(5.1.22)
5.1 Differenzenverfahren f¨ ur parabolische Probleme
187
Die oben betrachteten Einschrittverfahren lassen sich in diesen Rahmen einordnen gem¨aß: Expliziter Euler“ : ” Impliziter Euler“ : ” Crank-Nicolson“ : ”
R(z) = 1 + z , R(z) = (1 − z)−1 ,
R(z) = (1 + 21 z)(1 − 21 z)−1 .
Durch die Ordnungsbedingung ez Qrs (z) − Prs (z) = O(|z|r+s+1 ),
z ≤ 0,
(5.1.23)
f¨ ur den Ansatz Prs ∈ Pr , Qrs ∈ Ps wird man auf die sog. Pad´e5 -Schemata“ gef¨ uhrt. Diese ” sind eindeutig bestimmt und werden gew¨ohnlich in der sog. Pad´e-Tafel“ dargestellt: ”
1 1 1−z+ z 2 2
1+z 1 1 1+ z 2 1 1− z 2 1 1+ z 3 1 2 1− z+ z 2 3 6
1 1+z+ z 2 2 1 2 1 1+ z+ z 2 3 6 1 1− z 3 1 1 1+ z+ z 2 2 12 1 1 1− z+ z 2 2 12
...
...
...
...
1 1 1 1−z
1 1 1+x+ z 2 + z 3 2 6 1 3 1 1 1+ z+ z 2 + z 3 4 4 24 1 1− z 4
... ...
...
...
...
1 1 1 3 1+ z+ z 2 + z 2 10 120 1 2 1 3 1 z 1− z+ z − 2 10 120
...
...
...
...
.
Offensichtlich sind alle bisher betrachteten Einschrittschemata Pad´e-Formeln und damit in diesem Sinne ordnungsoptimal. Aus der Pad´e-Tafel erhalten wir nun weitere Zeitschrittverfahren ¨ h¨oherer Ordnung. Dabei kommen aus Okonomiegr¨ unden nur die diagonalen“ oder subdiago” ” nalen“ Pad´e-Schemata in Frage; z.B. die folgenden impliziten Verfahren 3. bzw. 4. Ordnung:
(I +
(I + 31 kAh )Uhm = (I − 23 kAh + 61 k2 A2h )Uhm−1
1 2 kAh
+
m 1 2 2 12 k Ah )Uh
= (I −
1 2 kAh
+
m−1 1 2 2 12 k Ah )Uh
(q = 3), (q = 4).
Wir bemerken f¨ ur die weitere Analyse, daß eine rationale Approximation R(z) der Exponentialfunktion (der Ordnung r ≥ 1 ) die folgende Eigenschaft hat: |R(z)| ≤ eδz ,
−1 ≤ z ≤ 0,
(5.1.24)
mit einem geeigneten δ > 0 . Die Wirkung der Zeitschrittschemata des Typs (5.1.22) l¨aßt sich mit Hilfe der Spektralzerlegung der Matrix Ah wieder beschreiben durch: Uhm
=
N X
n=1
5
Uj0 R(−kλn )m v (n) ,
m ≥ 1,
Henri Eug`ene Pad´e (1785-1836): franz¨ osischer Mathematiker; Prof. in Poitiers und Bordeaux; entwickelte die sog. Pad´e-Approximation.
188
Verfahren f¨ ur parabolische Probleme
bzw. (mit der Euklidischen Vektornorm | · | ) |Uhm |2 =
N X
n=1
|Un0 |2 |R(−kλn )|2m .
Ihr qualitatives Verhalten l¨ aßt sich also weitgehend durch die Eigenschaften der verwendeten rationalen Funktion R(z) charakterisieren. Wir stellen einige wichtige Bedingungen f¨ ur die folgende Analyse zusammen. (i) Die A-Stabilit¨at |R(z)| ≤ 1 ,
z ≤ 0.
sichert die Stabilit¨ at“ der Zeititeration supm≥0 |Uhm | < ∞ . ” (ii) Die strenge A-Stabilit¨at |R(z)| ≤ 1 − ck , z ≤ −1, sichert die Beschr¨ anktheit der diskreten L¨osung auch im Fall inhomogener rechter Seiten, supm≥0 |Uhm | < c supm≥0 |f m | . (iii) Die starke A-Stabilit¨ at |R(z)| ≤ κ < 1 ,
z ≤ −1 ,
sichert die (exponentielle) D¨ ampfung hochfrequenter“ L¨osungsanteile und macht das Verfahren ” robust gegen¨ uber lokalen St¨ orungen der Daten ( Gl¨attungseigenschaft“). ” (iv) Zur korrekten Wiedergabe von Schwingungsprozessen (im Ort oszillierenden L¨osungen) sollte R(±i) ∼ 1 sein, um diese Schwingungen m¨ oglichst wenig zu d¨ampfen ( numerischen Dissipativit¨at“). ” Offensichtlich k¨ onnen nur implizite Verfahren die gelisteten Eigenschaften haben. Das implizite Euler-Schema (und genauso alle sub-diagonalen Pad´e-Schemata) ist stark A-stabil (mit √ ¨ Limes κ = 0 ), neigt aber zur Uberd¨ ampfung: |(1 + i)−1 | = 1/ 2 . Dagegen ist das CrankNicolson-Schema (und genauso alle diagonalen Pad´e-Schemata) nur einfach A-stabil, 1 − 12 z = 1, lim z→−∞ 1 + 1 z 2 besitzt aber praktisch auch keine numerische Dissipation: |(1 − i/2)(1 + i/2)−1 | = 1 . Die fehlende starke A-Stabilit¨ at hat nachteilige Konsequenzen im Fall von irregul¨aren Anfangswerten 0 u (z.B.: lokalen Temperaturspitzen). Die durch diese Anfangsdaten induzierten hochfrequenten Fehleranteile werden durch das Crank-Nicolson-Schema nur unzureichend ausged¨ampft, so daß sich ein unphysikalisches L¨ osungsverhalten zeigen kann. Es sei daran erinnert, daß der kontinuierliche Differentialoperator stark d¨ ampfend ist: ku(t)k ≤ e−λmin t ku0 k ,
t ≥ 0,
mit dem kleinsten Eigenwert des Ortsoperators, λmin > 0 . Bei Verwendung des Crank-Nicolson-Schemas f¨ ur Rechnungen u ¨ ber lange Zeitr¨aume sollte es stabilisiert werden, um wenigstens strenge A-Stabilit¨at zu sichern. Dies kann ohne Reduktion
5.1 Differenzenverfahren f¨ ur parabolische Probleme
189
der Konsistenzordnung durch einen leichten k-abh¨angigen Schift erfolgen: I + 21 (1 + ck)kAh Uhm = I − 12 (1 − ck)kAh Uhm−1 .
(5.1.25)
Verfahren h¨ oherer Ordnung erfordern die Invertierung der Operatorfunktion Q(−kAh ) . Dies ist in der Regel zu teuer. Einerseits ist die Besetzungstruktur von Q(−kAh ) selbst bei Polynomgrad j = 2 bereits deutlich dichter als die von Ah , andererseits w¨ urde das Arbeiten mit der Linearfaktorzerlegung Q(z) = (z − µ)(z − µ ¯) die Verwendung (kostspieliger) komplexer Arithmetik erfordern. Geeignet w¨ arenQdagegen Schemata, bei denen das Nennerpolynom in reelle Linearfaktoren zerf¨ allt: Q(z) = sj=1 (z − µj ), µj ∈ R . Durch diesen Ansatz sollten sich systematisch Verfahren mit g¨ unstigeren Eigenschaften als die der einfachen Basisschemata gewinnen lassen. Ein Beispiel f¨ ur einen solchen Ansatz ist die parameter-abh¨angige rationale Funktion (1 + αθ ′ z)(1 + βθz)2 = ez + O(|z|3 ), (1 − αθz)2 (1 − βθ ′ z)
Rθ (z) =
z ≤ 0,
√ mit θ = 1 − 21 2 = 0, 292893..., θ ′ = 1 − 2θ und beliebigen Werten α ∈ ( 21 , 1], β = 1 − α . Das auf dieser rationalen Funktion basierende Schema ist wegen |Rθ (z)| < 1 , z < 0 ,
β < 1. α
lim |Rθ (z)| =
z→−∞
stark A-stabil. Die Entwicklung Rθ (z) = 1 + z + 21 z 2 {1 − (α − β)(2θ 2 − 4θ + 1)} + 16 r(θ, α)z 3 + O(|z|4 ) zeigt, daß f¨ ur die obige Parameterwahl von der Ordnung O(k2 ) ist. F¨ ur die G¨ ute dieser Approximation im Vergleich zu der des Crank-Nicolson-Schemas ist die Gr¨oße der f¨ uhrenden Fehlerkonstante r(α) bestimmend. Eine Taylor-Entwicklung ergibt 2
3
r(θ, α) = (18θ ′ + 24θ 3 )α3 + (42θ 2 θ ′ + 12θθ ′ + 30θ ′ )α2 β 2
3
2
3
+ (12θ 3 + 30θ 2 θ ′ + 24θθ ′ + 6θ ′ )αβ 2 + (6θ 2 θ ′ + 12θθ ′ + 6θ ′ ). Im betrachteten Bereich {0, 5 < α ≤ 1} ist |r(θ, α)| ≤ 0, 5 . Damit ist die Fehlerkonstante dieser 1 der Approximation nur in akzeptablem Maß gr¨oßer als die entsprechende Fehlerkonstante 12 Trapezregel. Das zugeh¨ orige Verfahren l¨aßt sich in Form eines Teilschrittschemas schreiben (hier f¨ ur den inhomogenen Fall), Teilschritt-θ-Verfahren (Fractional-Step-θ-Method): (I + αθkAh )U m−1+θ = (I − βθkAh )U m−1 + θkfhm−1 , ′
(I + βθ kAh )U
m−θ
′
= (I − αθ kAh )U
m−1+θ
(I + αθkAh )U m = (I − βθkAh )U m−θ +
′
+ θ kfhm−θ , θkfhm−θ .
(5.1.26) (5.1.27) (5.1.28)
Jeder der Teilschritte hat die Form eines geschifteten Crank-Nicolson-Schritts, so daß der Gesamtaufwand pro Zeitschritt dem von drei Crank-Nicolson-Schritten entspricht. F¨ ur den speziellen Wert α = (1 − 2θ)(1 − θ)−1 = 0, 585786...
190
Verfahren f¨ ur parabolische Probleme
ist αθ = βθ ′ , so daß die zu invertierenden Matrizen in den drei Teilschritten u ¨ bereinstimmen, was z.B. bei der direkten L¨ osung der Gleichungssysteme ausgenutzt werden kann. Eine genaue Analyse des Abschneidefehlers des FS-Schemas zeigt, daß seine f¨ uhrende Fehlerkonstante nur wenig gr¨oßer als die von drei kombinierten Crank-Nicolson-Schritten ist: τkm = cˆk2 + O(k3 ),
cˆF S ∼ cˆ3×CN .
Dies bedeutet, daß das FS-Schema gegen¨ uber dem CN-Schema bzgl. Genauigkeit und Aufwand gleichwertig ist, aber u ohere Robustheit verf¨ ugt. Das FS-Schema hat sich in der Pra¨ber eine h¨ xis als besonders geeignet zur Behandlung von parabolischen Problemen mit nicht notwendig regul¨aren Daten und geringer nat¨ urlicher Eigendissipation erwiesen.
5.1.2 Stabilit¨ at und Konvergenz Wir wollen nun die Stabilit¨ at und Konvergenz von Diskretisierungen der W¨armeleitungsgleichung untersuchen. Dabei bedienen wir uns exemplarisch verschiedener Techniken, die alle diskrete Analoga von Analysemethoden beim kontinuierlichen Problem sind. i) Maximumprinzipmethode“ ” Eine einfache, direkte Variante der Maximumprinzipmethode kann bei gewissen expliziten Differenzenschemata angewendet werden. Die Ortsdiskretisierung f¨ uhre auf eine M-Matrix Ah . F¨ ur die explizite Euler-Formel Uhm = Uhm−1 − kAh Uhm−1 gilt dann wegen der Diagonaldominanz von Ah : |Unm | = |1 − kann ||Unm−1 | + k kann ||Unm−1 | +
≤ |1 −
X
ν6=n
|anν ||Uνm−1 |
kann max |Uνm−1 |. ν
Unter der Schrittweitenbedingung 2 k ≤ max{a−1 nn } ∼ ch
(5.1.29)
n
folgt daher die L∞ -Stabilit¨ at des Verfahrens max |Unm | ≤ max |Unm−1 | ≤ ... ≤ max |Un0 |, n
n
n
m ≥ 1.
(5.1.30)
Im Fall des 5-Punkte-Schemas ist ann = 4h−2 , so daß die Stabilit¨atsbedingung (5.1.29) die Form k ≤ 41 h2
(5.1.31)
erh¨alt.
Satz 5.1 (Explizites Euler-Verfahren): Unter der Schrittweitenbedingung (5.1.29) gilt f¨ ur
5.1 Differenzenverfahren f¨ ur parabolische Probleme
191
das explizite Euler-Verfahren die Konvergenzabsch¨ atzung m 2 m 1 max |Uh − u(·, tm )| ≤ T 2 k max |∂t u| + max |τh | . ¯T Q
¯T Q
QT
(5.1.32)
mit dem ¨ ortlichen Abschneidefehler τhm = O(hq ) . Beweis: Der Fehler em := u(·, tm ) − U m gen¨ ugt der Gleichung m k−1 (em − em−1 ) + Ah em = τh,k
mit dem Abschneidefehler m | ≤ 21 k max |∂t2 u| + max |τhm | . max |τh,k ¯T Q
¯T Q
¯T Q
Das bei der Herleitung der Stabilit¨ atsbedingung (5.1.29) verwendete Argument liefert m | max |em | ≤ max |em−1 | + k max |τh,k ¯ Ω
¯ Ω
¯T Q
Durch Iteration dieser Absch¨ atzung folgt weiter wegen e0 = 0 : max |em | ≤ k ¯ Ω
≤
m X
µ |τh,k |
µ=1 1 |∂t2 u| + tm max |τhm |. 2 tm k max ¯T ¯T Q Q
Dies impliziert die behauptete Fehlerabsch¨atzung.
Q.E.D.
Eine wichtige Eigenschaft des kontinuierlichen W¨armeleitungsoperators ist seine inverse ” Monotonie“, d.h.: L¨ osungen zu nicht-negativen Anfangsdaten und rechter Seite bleiben nichtnegativ. Diese Eigenschaft u agt sich auf die diskretisierten Probleme, wenn die Systemma¨bertr¨ trix Ah M-Matrix ist. (i) F¨ ur das explizite Euler-Verfahren folgt unter der Schrittweitenbedingung (5.1.29) aus Unm−1 ≥ 0 und fnm ≥ 0 notwendig auch X Unm = (1 − kann )Unm−1 + k |anν |Uνm−1 + kfnm ≥ 0. ν6=n
(ii) F¨ ur das implizite Euler-Verfahren ist im Falle Unm−1 ≥ 0 und fnm ≥ 0 (Ih + kAh )Uhm = Uhm−1 + kfhm ≥ 0. Da mit Ah nat¨ urlich auch Ih + kAh M-Matrix ist, gilt (Ih + kAh )−1 ≥ 0 . Es folgt Uhm ≥ 0 . In beiden F¨ allen ist also auch das diskrete Schema invers-monoton“. Dies ist i.a. f¨ ur das Crank” Nicolson-Schema nicht der Fall. ii) Von Neumannsche Methode“ (Fourier-Methode) ” Wir beschr¨ anken uns auf den ¨ ortlich eindimensionalen Fall mit Ω = (−π, π) , ∂t u − ∂x2 u = 0 in QT ,
192
Verfahren f¨ ur parabolische Probleme
mit periodischen“ Dirichlet-Randbedingungen ” u(−π, t) = u(π, t),
t ≥ 0.
In diesem Fall kann die L¨ osung der ARWA nach trigonometrischen Funktionen entwickelt werden (Fourier-Entwicklung). In komplexer Schreibweise lautet dies u(x, t) =
∞ X
2
a0ν eiνx eν t ,
(5.1.33)
ν=0
mit den Entwicklungskoeffizienten a0ν der Anfangsbedingung. Auf einem ¨aquidistanten Punktgitter {xn = −π + nh, n = 0, ..., N = 2π/h} machen wir f¨ ur die diskrete L¨osung Uhm = m {Un , n = 0, ..., N }, m ≥ 0, den analogen Entwicklungsansatz Unm
=
N X
iνnh am ν e
=:
N X
a0ν ωνm eiβν n
(5.1.34)
ν=0
ν=0
mit βν := νh und zu bestimmenden Parametern ων ∈ C . Wir fragen nach der Stabilit¨at f¨ ur m → ∞ der Differenzendiskretisierung bzgl. der diskreten Spektralnorm kUhm kh :=
N X
n=1
2 |am n|
1/2
.
Die Wirkung des (linearen) Differenzenschemas kann f¨ ur jede einzelne Fourier-Komponente separat untersucht werden. Gesucht sind Bedingungen an k und h , unter denen |ων | ≤ 1 ist f¨ ur alle m¨oglichen βν . Dann liegt Stabilit¨ at vor in dem Sinne, daß kUhm k2h =
N X
n=1
|a0n |2 |ων |2m ≤
N X
n=1
|a0n |2 = kUh0 k2h .
(5.1.35)
Wir f¨ uhren diese Analyse wieder exemplarisch f¨ ur das explizite Euler-Schema durch. Mit r := −2 kh gilt m m Unm+1 = rUn−1 + (1 − 2r)Unm + rUn+1 .
Einsetzen von Unm := ω m eiβn ergibt
ω m+1 eiβn = rω m eiβ(n−1) + (1 − 2r)ω m eiβn + rω m eiβ(n+1) , und nach Vereinfachung ω = re−iβ + (1 − 2r) + reiβ . Es liegt Stabilit¨ at vor, wenn |ω| ≤ 1 f¨ ur beliebiges β . Unter Ausnutzung der Beziehungen eiβ = cos(β) + i sin(β),
cos(β) = 1 − 2 sin2 ( 12 β),
folgt ω = r eiβ + e−iβ + (1 − 2r) = r (cos(β) + i sin(β) + cos(β) − i sin(β)) + (1 − 2r) = r 2 − 4 sin2 ( 12 β) + (1 − 2r) = 1 − 4r sin2 ( 12 β).
5.1 Differenzenverfahren f¨ ur parabolische Probleme
193
Stabilit¨at liegt vor f¨ ur −1 ≤ 1 − 4r sin2 ( 12 β) ≤ 1 ∀β, was ¨aquivalent ist zu
r sin2 ( 12 β) ≤ 21 .
Dies f¨ uhrt auf die schon bekannte Stabilit¨atsbedingung k ≤ 12 h2 .
(5.1.36)
Die Fourier-Methode kann auch f¨ ur exotischere“ Differenzenformeln angewendet werden. ” Wir demonstrieren dies anhand des klassischen Du Fort6 -Frankel7 -Verfahren“: ” 1 1 m m Unm+1 − Unm−1 − 2 Un−1 = 0. (5.1.37) − (Unm+1 + Unm−1 ) + Un+1 2k h
Sein Abschneidefehler verh¨ alt sich wie
max |τnm | = O(k2 /h + k2 + h2 ). n,m
(5.1.38)
Die von Neumannsche Stabilit¨ atsanalyse liefert f¨ ur die Verst¨arkungsfaktoren die Darstellung 2 ( r := k/h ) p 2r cos(β) ± 1 − 4r 2 sin2 (β) . (5.1.39) ω= 1 + 2r Dies impliziert , daß |ω| ≤ 1 f¨ ur alle β , d.h.: Das DuFord-Frankel-Schema ist unbedingt stabil. Analog zeigt man, daß das sog. Richardson-Verfahren“ ” 1 1 m m (Unm+1 − Unm−1 ) − 2 (Un−1 − 2Unm + Un−1 )=0 (5.1.40) 2k h unbedingt instabil ist. Obwohl es die optimale“ Konsistenzordnung O(h2 + k2 ) besitzt, ist ” es also praktisch unbrauchbar. Dies ist nicht verwunderlich, da dieses Schema ein Derivat der Mittelpunktsregel mit dem Stabilit¨ atspolynom π(z, hλ) und den Wurzeln z1,2 = hλ ± (h2 λ2 + 1/2 1) ist. Die von Neumann’sche Fourier-Methode zur Stabilit¨atsanalyse von Differenzenschemata ist auf den Fall periodischer Dirichlet-Randbedingungen bzw. den Grenzfall von Ganzraum-Proble” men“ ( Ω = R1 ) beschr¨ ankt und erfordert ¨aquidistante Ortsgitter. F¨ ur allgemeinere Ortsdiskretisierungen anwendbar ist die im folgenden pr¨asentierte Spektralmethode“. ” iii) Spektral-Methode: Die symmetrische, positiv definite Matrix Ah habe die Eigenwerte und zugeh¨origen (l2 -orthonormierten) Eigenvektoren 0 < λ1 ≤ ... ≤ λN , 6
{w(n) , n = 1, ..., N }.
E.C. Du Fort (????-????): ????; Publ. mit S.P. Frankel: Stability conditions in the numerical tratment of parabolic differential equations, Math. Tables and other Aids to Comput. (jetzt Math. Comput.) 7, 135-152 (1953). 7 S.P. Frankel (????-????): ????
194
Verfahren f¨ ur parabolische Probleme
Jede Gitterfunktion besitzt dann eine Entwicklung der Form Uhm =
N X
an w(n) ,
n=1
an = hUhm , w(n) i.
Dabei ist das Skalarprodukt h·, ·i f¨ ur eine FD-Diskretisierung im Ort wieder ein diskretes Analogon der kontinuierlichen L2 -Norm, hv, wi :=
N X
h2n vn wn ,
n=1
und f¨ ur eine FE-Diskretisierung gerade diese: hv, wi := (v, w)Ω . Entsprechend sind die zugeh¨origen Normen kuk := hv, vi1/2 definiert. Wir analysieren im folgenden isoliert den Zeitschrittfehler im Rahmen der Linienmethode.
Satz 5.2 (Gl¨ attungseigenschaft): Jedes stark A-stabile Einschrittschema vom Typ (5.1.22) der Ordnung r besitzt die Gl¨ attungseigenschaft: kUhm − um hk≤c
kr 0 ku k, trm h
m > 0.
(5.1.41)
Beweis: Nach Voraussetzung ist supz≥0 |R(−z)| ≤ 1 , limz→∞ |R(−z)| ≤ ω < 1 und |R(−z) − e−z | ≤ c|z|r+1 ,
0 ≤ z ≤ 1.
O.B.d.A. nehmen wir an, daß |R(−z)| ≤ ω < 1 f¨ ur z ≥ 1 . Wir verwenden wieder das Spektralargument von oben. Mit den Eigenwerten 0 < λ1 ≤ ... ≤ λN von Ah und einem zugeh¨origen Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren gilt wieder f¨ ur den Anfangswert u0h =
N X
αn w(n)
n=1
die Absch¨atzung ( τn := kλn ) |Uhm
−
2 um h|
=
N X
n=1
=
2 α2n R(−kλn )m − e−mkλn
X
τn ≤1
... +
X
... .
τn >1
F¨ ur die erste Summe rechts gilt mit einem geeigneten δ > 0 : X
τn ≤1
... =
2 2 m−1 X X R(−τn )m−1−µ e−µτn α2n R(−τn ) − e−τn
τn ≤1
≤c
X
τn ≤1
µ=0
τn2r+2 m2 e−2δ(m−1)τn α2n
≤ cm−2r |u0h |2 .
5.1 Differenzenverfahren f¨ ur parabolische Probleme
195
F¨ ur die zweite Summe rechts gilt entsprechend mit einem δ > 0 : o n X X ... ≤ 2 α2n |R(−τn )|2m + e−2mτn τn >1
τn >1
≤ ce−δm
X
τn >1
α2n ≤ cm−2r |u0h |2 .
Kombination dieser beiden Absch¨ atzungen liefert wegen m = tm /k : 2 |Uhm − um h| ≤c
k2r 0 2 |uh | . t2r m
Dies vervollst¨ andigt den Beweis.
(5.1.42) Q.E.D.
Das popul¨ are Crank-Nicolson-Schema Uhm = (Ih + 21 kAh )−1 (Ih − 21 kAh )Uhm−1 besitzt als nicht stark A-stabiles Schema nicht die volle Gl¨attungseigenschaft. Wir wollen diesen Defekt anhand einer Modellbetrachtung erl¨autern. Sei Uh0
=
N X
α0n v (n)
⇒
n=1
Uhm
=
N X
α0n
n=1
1 − kλ /2 m n v (n) . 1 + kλn /2
Die L¨osungskomponente zur h¨ ochsten Frequenz Λ = λN verh¨alt sich wie ωm =
1 − kΛ/2 m 1 + kΛ/2
∼ e−tm Λ ,
was dem Abfall der exakten“ L¨ osung entspricht. ” (i) F¨ ur kΛ < 2 (⇔ k ∼ h2 ) ist |ω| ≤ e−δ , δ > 0,
was den korrekten exponentiellen Abfall e−δm impliziert. (ii) Im Fall kΛ ∼ k/h2 ∼ 4/h (⇔ k ∼ h) ist ω∼−
1 − h/2 , 1 + h/2
was oszillierendes Verhalten (−1)m e−hm impliziert. Zur D¨ampfung dieser Oszillationen in den hochfrequenten“ Komponenten k¨onnen folgende ” Strategien verwendet werden: a) Mittelbildung: ˜ 1 = 1 {U 0 + 2U 1 + U 2 } = U h h h h 4
N X
n=1
α0n
n1
4
+
1 1 − 12 kλn 1 1 − 12 kλn 2 o (i) w . + 2 1 + 12 kλn 4 1 + 12 kλn
196
Verfahren f¨ ur parabolische Probleme
Auswertung des Ausdrucks in der Klammer ergibt 1 + kλn + 12 k2 λ2n + 2 − 12 k2 λ2n + 1 − kλn + 41 k2 λ2n 1 = 1 1 2 4(1 + 2 kλn ) (1 + 2 kλn )2 und somit ˜1 = U h
N X
αn . (1 + 12 kλn )2 n=1
b) Euler-D¨ ampfung: Der Zeitschrittprozeß wird mit zwei impliziten Euler-Schritten mit halber Schrittl¨ange gestartet. Dies ergibt ˜1 = U h
N X
n=1
α0n
1 1 + 21 kλn
2
w(n) .
Satz 5.3 (Ged¨ ampftes Crank-Nicolson-Verfahren): Das durch zwei Euler-Schritte ged¨ ampfte Crank-Nicolson-Verfahren besitzt die Gl¨attungseigenschaft: kUhm − um hk≤c Beweis: F¨ ur z ≥ 0 gilt 1 z3 −z 1 − 2 z , e − ≤c 1 1 + 2z 1 + 12 z
k2 0 ku k. t2m h
−z e −
Wir verwenden dies in der folgenden Absch¨atzung: 2 kUhm − um hk =
N X
n=1
α2n
(5.1.43)
1 z2 ≤c . 1+z 1+z
o2 2 n 1 − 1 kλ m 1 n −mkλn 2 − 2 e 1 + 12 kλn 1 + 21 kλn
Wir bezeichnen den Inhalt der ¨ außeren Klammer mit σnm und setzen τn := kλn . Es gilt 1 − 1 τ m 2 o n 2 o 1 1 −(m−2)τn 2 n − + e − 2 1 + 12 τn 1 + 12 τn 1 + 12 τn 1 1 = e−(m−2)τn e−τn − e−τn + 1 + 12 τn 1 + 21 τn 1 2 m−3 M −3−µ X 1 − 12 τn 1 −µτn 1 − 2 τn e . + e−τn − 1 + 21 τn 1 + 12 τn µ=0 1 + 12 τn
n σnm = e−(m−2)τn e−2τn −
i) Fall τn ≤ 2 :
1 1 − 12 τn − 2 τn ≤ e . 1 + 12 τn
Dies sieht man wie folgt: Wegen ez ≥ z gilt −1 + ze−z ≤ 0 . Die Funktion f (z) := 1 − z − (1 + z)e−z hat die Eigenschaften f (0) = 0 und f ′ (z) = −1 + ze−z ≤ 0 und folglich f (z) ≤ 0 .
5.1 Differenzenverfahren f¨ ur parabolische Probleme
197
Damit erschließen wir |σnm |
m−3 o n X 3 −mτn /2 −mτn 2 e−µτn /2 τn + τi e ≤c e µ=0
n 1 − e−(m−2)τn /2 o ≤ c e−mτn τn2 + τn3 e−mτn /2 1 − e−τn /2 2 c k ≤ 2 =c 2 . m tm ii) Fall τn > 2 :
1 − τ /2 n ≤ e−2/τn . 1 + τn /2
Damit erschließen wir:
n 1o |σnm | ≤ c e−mτn + e−2(m−2)/τn 2 τn n m 2 1 o 1 ≤ c (mτn )2 e−mτn 2 + e−2m/τn m τ n m2 1 k2 ≤c 2 =c 2 . m tm Zusammenfassung der Resultate (i) und (ii) liefert nun: 2 kUhm − um hk ≤c
N k4 X 2 αn . t4m
(5.1.44)
n=1
Dies vervollst¨ andigt den Beweis.
Q.E.D.
Auch die Spektralmethode ist auf den Fall parabolischer Probleme mit zeitunabh¨angigen, selbstadjungierten Operatoren wie dem Laplace-Operator ∆ beschr¨ankt. Die weitreichendste Analysetechnik ist die sog. Energie-Methode“ (Hilbertraum-Methode), welche auch f¨ ur Pro” bleme mit unsymmetrischen Operatoren mit zeitabh¨angigen Koeffizienten anwendbar ist. Wir demonstrieren diese Technik hier aber nur f¨ ur die vorliegende Modellsituation. iv) Energie-Methode: Wir betrachten das popul¨ are Crank-Nicolson-Schema. F¨ ur Funktionen (vn )N ¨quin=1 auf einem a distanten Quadratgitter sind (v, w)h := hd
N X
n=1
vn wn ,
1/2
kvkh := (v, v)h ,
diskrete Analoga des L2 -Skalarprodukts und der zugeh¨origen L2 -Norm.
198
Verfahren f¨ ur parabolische Probleme
Satz 5.4 (Crank-Nicolson-Verfahren): Das Crank-Nicolson-Verfahren hat f¨ ur hinreichend glatte L¨ osung u den globalen Diskretisierungsfehler max ku − Uh kh ≤ c(u) T {h2 + k2 } , ¯T Q
(5.1.45)
mit einer Konstante c(u) ≈ maxQ¯ T {|∂t3 u| + a|∇4 u|} . Beweis: F¨ ur den Fehler em := um − U m gilt m . k−1 (em − em−1 ) + 12 Ah (em + em−1 ) = τh,k
Multiplikation dieser Identit¨ at mit em + em−1 und Summation u ¨ber m ergibt m k−1 {kem k2h − kem−1 k2h } + 21 (Ah (em + em−1 ), em + em−1 )h = (τh,k , em + em−1 )h .
Der kleinste Eigenwert von Ah ist λ > 0 . Damit erschließen wir m 2 kh , k−1 {kem k2h − kem−1 k2h } + 12 λkem + em−1 k2h ≤ 12 λkem + em−1 k2h + 12 λ−1 kτh,k
bzw. m 2 kh . kem k2h ≤ kem−1 k2h + 12 λ−1 kkτh,k
Wir summieren nun u ¨ber µ = m, ..., 1 und erhalten kem k2h ≤ ke0 k2h + 21 λ−1 k
m X
µ=1
µ 2 kτh,k kh .
Mit e0 = 0 und der obigen Absch¨ atzung f¨ ur den Abschneidefehler folgt schließlich die Behauptung. Q.E.D.
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
199
5.2 FE-Galerkin-Verfahren fu ¨r parabolische Probleme
Wir diskutieren nun die Rothe-Methode zur L¨osung des Problems ∂t u − ∆u = f
in QT = Ω × [0, T ],
(5.2.46)
mit den Nebenbedingungen u|t=0 = u0 und u|∂Ω = 0 . Da die folgende Analyse exemplarischen Charakter hat, betrachten wir nur das implizite Euler-Schema. Dieses lautet angewendet auf das kontinuierliche Problem (5.2.46) −1 (U m − U m−1 ) − ∆U m = f¯m , km
U 0 := u0 ,
(5.2.47)
wobei die rechte Seite im zeitlichen Mittel ausgewertet wird gem¨aß Z tm m −1 ¯ f (t) dt = f m + O(km ). f := km tm−1
Die Zeitschrittweite km := tm − tm−1 darf hier variieren, um eine m¨oglichst gute Anpassung an die L¨osungseigenschaften zu erreichen. Mechanismen zur adaptiven Wahl der Zeitschrittweiten auf der Basis von a posteriori Fehlerabsch¨atzungen werden weiter unten diskutiert. Die einzelnen Zeitschritte seien mit Hilfe eines FE-Verfahrens mit Ansatzr¨aumen Vhm ⊂ V auf m¨oglicherweise von Zeit zu Zeit wechselnden Gittern Tm h diskretisiert: (Uhm , ϕ) + km (∇Uhm , ∇ϕ) = (Uhm−1 , ϕ) + km (f¯m , ϕ)
∀ϕ ∈ Vhm .
(5.2.48)
Die Varianz der Ortsdiskretisierungen im Verlaufe der Zeititeration erm¨oglicht die dynamische adaptive Anpassung der Ortsgitter an die momentane L¨osungsstruktur. In Operatorschreibweise lautet das Schema (5.2.47) m m−1 m + km Phm f¯m , (Ihm + km Am h )Uh = Ph Uh
Uh0 = Ph0 u0 ,
(5.2.49)
m,n uglich der u mit der L2 -Projektion Phm auf Vhm . Bez¨ ¨ blichen Knotenbasen {ϕh , n = 1, ..., Nm = aßt sich dies als lineares Gleichungssystem zur Bestimmung der zuaume Vhm l¨ dim Vhm } der R¨ Nm schreiben. Dazu f¨ uhren wir zus¨atzlich zu Massemageh¨origen Knotenwertevektoren xm h ∈R trizen, Steifigkeitsmatrizen und Lastvektoren
Nm m,j , ϕ ) Mhm := (ϕm,i , h h i,j=1
Nm m,i m,j Am , h := (∇ϕh , ∇ϕh ) i,j=1
Nm ¯m m,j bm h := (f , ϕh )
j=1
aumen Vhm−1 und Vhm ein: auf dem Gitter Tm h noch Transfermatrizen zwischen den R¨ Nm−1 ,Nm Mhm−1,m := (ϕhm−1,j , ϕm,n ) . h j,n=1
Damit schreibt sich Nm−1
(Uhm−1 , ϕm,n h )=
X j=1
m−1,m m−1 xjm−1 (ϕhm−1,j , ϕm,n xh h ) = Mh
200
Verfahren f¨ ur parabolische Probleme
und folglich m−1,m m−1 m xh + km Mhm bm (Mhm + km Am h. h )xh = Mh
(5.2.50)
Wir wollen dieses Verfahren im folgenden im Hinblick auf Stabilit¨at, Konvergenz sowie a priori und a posteriori Fehlerabsch¨ atzung untersuchen.
5.2.1 A priori Konvergenzabsch¨ atzungen Der nat¨ urliche Ansatz zur Analyse von FE-Diskretisierungen ist die Energie-Methode“. Wir ” geben zun¨achst einen einfachen Beweis f¨ ur das implizite Euler-Verfahren unter realistischen Annahmen an die Regularit¨ at der L¨ osung. Wir setzen hm := maxm diam(K), K∈Th
k = max km 1≤m≤M
m mit um := u(·, t ) . m und em m h := Uh − u
Satz 5.5 (Implizites Euler-Verfahren): F¨ ur das implizite Euler-Schema in Verbindung mit einer FE-Diskretisierung 2. Ordnung gelten die folgenden Fehlerabsch¨ atzungen: i) F¨ ur beliebig variierende Ortsdiskretisierung: max
1≤m≤M
kem hk
≤ cT
1/2
max
0≤m≤M
−1/2 2 {km hm k∇2 um k}
Z M X 2 km +c m=1
tm
tm−1
k∇∂t uk2 dt
1/2
;
(5.2.51)
ur alle m : ii) Im Spezialfall Vhm = Vh gleich f¨ max
1≤m≤M
kem h k
≤ cT
1/2
max
0≤m≤M
{h2m k∇2 um k}
Z M X 2 +c km m=1
tm tm−1
k∇∂t uk2 dt
1/2
.
(5.2.52)
4/3
Die Konvergenzordnung in (5.2.51) ist nicht optimal. Unter der Bedingung hm ≤ ckm ergibt sich aber die zeit-optimale Konvergenzordnung O(km ) . Das optimale Resultat (5.2.52) l¨ aßt −1 ≤ κ sich auch unter den weniger einschr¨ ankenden Bedingungen Vhm−1 ⊂ Vhm oder h2m km hinreichend klein beweisen. Beweis: Wir bezeichnen mit Rhm u ∈ Vhm die elliptische“ Ritz-Projektion der kontinuierlichen ” L¨osung um zum Zeitlevel tm auf den Finite-Elemente-Raum Vhm , definiert durch (∇Rhm v, ∇ϕh ) = (∇v, ∇ϕh )
∀ϕh ∈ Vhm .
(5.2.53)
F¨ ur deren Fehler gilt kv − Rhm vk + hm k∇(v − Rhm v)k ≤ ch2m k∇2 vk.
(5.2.54)
ur beliebiges ϕh ∈ Vhm ist Wir betrachten nun zun¨ achst die Differenz ηhm := Uhm − Rhm um . F¨ dann unter Ausnutzung der Identit¨ at (Uhm − Uhm−1 , ϕh ) + km (∇Uhm , ∇ϕh ) = km (f¯m , ϕh )
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
201
und der Projektionseigenschaft von Rhm : (ηhm − ηhm−1 , ϕh ) + km (∇ηhm , ∇ϕh ) = km (f¯m , ϕh ) − (Rhm um −Rhm−1 um−1 , ϕh ) − km (∇Rhm um , ∇ϕh ) = km (f¯m , ϕh ) − (Rm um −Rm−1 um−1 , ϕh ) h
h
m
− km (∇u , ∇ϕh ).
Wir setzen nun ϕh := ηhm und erhalten mit Hilfe der Identit¨at (a − b)a = 12 a2 − 21 b2 + 21 (a − b)2 die Beziehung m 2 1 2 kηh k
− 12 kηhm−1 k2 + 21 kηhm − ηhm−1 k2 + km k∇ηhm k2 = km (f¯m , η m ) − (Rm um − Rm−1 um−1 , η m ) − km (∇um , ∇η m ) h
h
h
h
h
= km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm ) +
+
(5.2.55)
(u − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ). m
Weiter haben wir km (f¯m , ηhm ) − (um − um−1 , ηhm ) − km (∇um , ∇ηhm ) Z tm (f − ∂t u, ηhm ) dt − km (∇um , ∇ηhm ) = = =
Z
tm−1 tm
tm−1 Z tm
tm−1
≤
(∇u, ∇ηhm ) dt − km (∇um , ∇ηhm )
(5.2.56)
(t − tm−1 )(∇∂t u, ∇ηhm ) dt
km k∇ηhm k2
+
1 2 4 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ 12 kηhm−1 − ηhm k2 + ch4m k∇2 um−1 k2
(5.2.57)
−1 m−1 − ηhm k2 + ckm h4m k∇2 um−1 k2 kηh (um−1 − Rhm−1 um−1 , ηhm−1 − ηhm ) ≤ km
(5.2.58)
oder
i) Wir betrachten zun¨ achst den Fall allgemein variierender Ortsdiskretisierung. Kombination der Beziehungen (5.2.55), (5.2.56) und (5.2.57) und Absorption von Termen in die linke Seite ergibt m 2 1 2 kηh k
− 12 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) Z tm 1 2 k∂t ∇uk2 dt + ch4m k∇2 um−1 k2 . + 4 km tm−1
202
Verfahren f¨ ur parabolische Probleme
Wir wenden diese Absch¨ atzung rekursiv f¨ ur m, m − 1, ..., 1 an und finden kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 ) Z tµ m n o X kµ2 +c k∂t ∇uk2 dt + ch4µ k∇2 uµ−1 k2 tµ−1
µ=1
bzw. kηhm k2 ≤ kηh0 k2 + 12 kηhm k2 + 12 kum − Rhm um k2 − (u0 − Rh0 u0 , ηh0 ) Z tµ m X 2 −1 4 kµ k∂t ∇uk2 dt + ctm max {km hµ k∇2 uµ k2 }. +c 0≤µ≤m
tµ−1
µ=1
Mit Hilfe der Absch¨ atzung kuµ − Rhµ uµ k + kuµ − Phµ uµ k ≤ ch2µ k∇2 uµ k,
µ = 1, ..., m,
(5.2.59)
folgt 2 2 m m m m m m kem h k ≤ kηh k + ku − Rh u k ≤ kηh k + chm k∇ u k,
kηh0 k
0
≤ ku −
Rh0 u0 k
0
+ ku −
Ph0 u0 k
≤
ch20 k∇2 u0 k
(5.2.60) (5.2.61)
und damit schließlich die Fehlerabsch¨ atzung (5.2.51): 2 kem h k
≤
ctm max {kµ−1 h4µ k∇2 uµ k2 } + 0≤µ≤m
c
m X
kµ2
µ=1
Z
tµ
tµ−1
k∇∂t uk2 dt.
(5.2.62)
ur m = 1, ..., M . Kombination der ii) Wir nehmen nun an, daß Vhm = Vh bzw. Rhm = Rh f¨ Beziehungen (5.2.55), (5.2.56) und (5.2.58) und Absorption von Termen in die linke Seite ergibt m 2 1 2 kηh k
− 12 kηhm−1 k2 ≤ (um − Rhm um , ηhm ) − (um−1 − Rhm−1 um−1 , ηhm−1 ) Z tm −1 m−1 2 − ηhm k2 + ckm h4m k∇2 um−1 k2 . + 14 km k∂t ∇uk2 dt + km kηh tm−1
Wir wenden diese Absch¨ atzung rekursiv f¨ ur m, m − 1, ..., 1 an und finden: kηhm k2 ≤ kηh0 k2 + 2(um − Rhm um , ηhm ) − 2(u0 − Rh0 u0 , ηh0 ) Z tµ m n o X 2 k∂t ∇uk2 dt + km h4µ k∇2 uµ−1 k2 + kµ−1 kηhµ−1 − ηhµ k2 kµ +c µ=1
tµ−1
bzw. mit den Absch¨ atzungen (5.2.59), (5.2.60) und (5.2.61), 2 kem h k
≤ ctm max
0≤µ≤m
{h2µ k∇2 uµ k2 }
+
m X
µ=1
kµ−1 kηhµ−1
−
ηhµ k2
+c
m X
µ=1
kµ2
Z
tµ tµ−1
k∂t ∇uk2 dt. (5.2.63)
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
203
m Im letzten Schritt sch¨ atzen wir die mittlere Summe rechts ab. Jetzt kann ϕh = ϕm h := ηh − m−1 ηh ∈ Vh als Testfunktion verwendet werden, und wir erhalten wie oben m−1 2 2 m 2 2 1 1 k + 21 km k∇ϕm kϕm h k h k + 2 km k∇ηh k − 2 km k∇ηh = km (f¯m , ϕm ) − (Rm um −Rm−1 um−1 , ϕm ) − km (∇Rm um , ∇ϕm ) h
h
h
h
h
h
m m−1 m m = km (f¯m , ϕm , ϕm h ) − (u − u h ) − km (∇u , ∇ϕh )
+ (um − um−1 − Rh (um + um−1 ), ϕm h ). Weiter haben wir m m m m−1 , ϕm km (f¯m , ϕm h ) − km (∇u , ∇ϕh ) = h ) − (u − u
= =
Z
tm
tm−1 Z tm
tm−1 Z tm tm−1
≤
m m (f − ∂t u, ϕm h ) dt − km (∇u , ∇ϕh ) m m (∇u, ∇ϕm h ) dt − km (∇u , ∇ϕh )
(t − tm−1 )(∇∂t u, ∇ϕm h ) dt
m 2 1 2 km k∇ϕh k
+
1 2 2 km
Z
tm
tm−1
k∂t ∇uk2 dt
sowie m 2 2 m m−1 2 1 )k (um − um−1 − Rh (um − um−1 ), ϕm h ) ≤ 4 kϕh k + chm k∇(u − u Z tm 2 2 ≤ 41 kϕm k∇∂t uk2 dt. h k + chm km tm−1
Kombination dieser Absch¨ atzungen und Absorption von Termen in die linke Seite ergibt Z tm m−1 2 m 2 m 2 2 2 k∇∂t uk2 dt. kϕh k + km k∇ηh k − km k∇ηh k ≤ {km + chm km } tm−1
Wir wenden diese Absch¨ atzung wieder rekursiv f¨ ur m, m − 1, ..., 1 an und finden m X
µ=1
2 kµ−1 kϕm h k
+
k∇ηhm k2
k∇ηh0 k2
≤
+c
m X
µ=1
{kµ +
Mit k∇ηh0 k2 ≤ ch40 k∇2 u0 k2 folgt schließlich m X
µ=1
kµ−1 kηhµ
−
ηhµ−1 k2
≤
ch40 k∇2 u0 k2
+c
m X
µ=1
{kµ +
h2µ }
Z
h2µ }
tµ tµ−1
Z
tµ tµ−1
k∂t ∇uk2 dt.
k∂t ∇uk2 dt.
(5.2.64)
Wir setzen dies in (5.2.63) ein und erhalten die behauptete Absch¨atzung (5.2.52): 2 2 2 µ 2 kem h k ≤ ctm max {hµ k∇ u k } + 0≤µ≤m
was den Beweis vervollst¨ andigt.
m X
µ=1
kµ−1 kηhµ−1 − ηhµ k2 + c
m X
µ=1
kµ2
Z
tµ
tµ−1
k∂t ∇uk2 dt, Q.E.D.
204
Verfahren f¨ ur parabolische Probleme
Hilfssatz 5.2 (A-priori Schranke): F¨ ur die L¨ osung der ARWA (5.2.46) gilt die a priori Absch¨ atzung Z −1 max k∇ uk + T
T
2
[0,T ]
0
k∇∂t uk2 dt
1/2
≤ c k∇2 u0 k + c max {kf k + k∂t f k}. [0,T ]
(5.2.65)
Beweis: Der Beweis verwendet die Energie-Technik“, wird hier aber nicht ausgef¨ uhrt. Q.E.D. ” Wir wollen noch die Frage nach der inversen Monotonie“ der Orts-Zeit-Diskretisierung dis” kutieren. Unter bestimmten Bedingungen an das Ortsgitter (z.B. alle Innenwinkel einer Triangulierung ω ≤ π/2 ) ist die Steifigkeitsmatrix Ah eine M-Matrix. Die Systemmatrix Mh +kAh muß aber nicht automatisch M-Matrix sein. Um dies dennoch sicherzustellen, werden die Elemente von Mh , m,j mij = (ϕm,i h , ϕh ), mit Hilfe der Trapezregel ausgewertet. Bei st¨ uckweise linearen Ans¨atzen liefert dies eine Diago˜ h = Mh + O(h2 ) mit positiven Diagonalelementen, so daß M ˜ h + kAh M-Matrix nalmatrix M wird. Dieser Mass-Lumping“ genannte Prozeß erh¨alt die Konvergenzordnung des Gesamtsche” ¨ mas und stellt seine inverse Monotonie“ sicher (Ubungsaufgabe). ” 5.2.2 Fehlerkontrolle und Schrittweitensteuerung Zur Herleitung von a posteriori Fehlerabsch¨atzungen erweist sich eine globale Betrachtung simultan in Ort und Zeit (ohne die bisherige Aufspaltung in Orts- und Zeitdiskretisierung) als angemessen. Wir f¨ uhren dazu das Konzept der unstetigen Galerkin-Verfahren“ f¨ ur parabolische ” ARWAn ein, als deren einfachster Spezialfall das implizite Euler-Verfahren (5.2.48) erscheinen wird. Die Vorgehensweise entspricht der bereits von den gew¨ohnlichen AWAn her bekannten, erg¨anzt um die Aspekte der Ortsdiskretisierung. m ¯ Ausgehend von oben formulierten Diskretisierungen Tm h = {Kn } des Ortsgebiets Ω und 0 = t0 < ... < tµ < ... < tM = T des Zeitintervalls I = [0, T ] f¨ uhren wir die folgenden Bezeichnungen ein (Man beachte, daß die Zeitschrittweite nicht bzgl. des Orts variiert.):
Im := (tm−1 , tm ], k :=
max
m=1,...,M
km ,
km = tm − tm−1 ,
hm := maxm hK ,
v m± := lim v(·, tm ± s), Qm n :=
s↓0 Knm
× Im ,
h :=
K∈Th
max
m=1,...,M
hm ,
[v]m := v m+ − v m− ,
m ∂Qm n := ∂Kn × Im ,
Qm := Ω × Im .
Die ARWA (5.2.46) l¨ aßt sich ¨ aquivalent schreiben in der Form M Z X
m=1
m−1
Im
{(∂t u, ϕ) + (∇u∇ϕ)} dt + ([u]
(m−1)+
,ϕ
Z ) = (f, ϕ) dt
(5.2.66)
I
f¨ ur beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung durch die Setzung u0− := u0 ber¨ ucksichtigt ist. Jede (glatte) L¨osung von (5.2.46) erf¨ ullt offenbar die Beziehung (5.2.66), und umgekehrt muß jede L¨osung von (5.2.66) in den Teilintervallen Im der
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
205
W¨armeleitungsgleichung gen¨ ugen und bei tm auch stetig sein. Damit folgt dann wieder, daß es sich um eine L¨ osung der ARWA handeln muß. Dieses Problem wird nun mit einem GalerkinAnsatz auf dem ganzen Orts-Zeit-Zylinder QT diskretisiert. Dazu f¨ uhren wir die folgenden Finite–Elemente–R¨ aume ein: ¯ T → R| vt∈Im (·, t) ∈ V m , vt∈Im (x, ·) ∈ Pr (Im ), (x, t) ∈ QT }. Vh = {v : Q h Die Funktionen in Vh sind also bzgl. des Ortes st¨ uckweise in Vhm (d.h. linear oder bilinear und stetig) und bzgl. der Zeit st¨ uckweise polynomial vom Grad r (und unstetig). Der GalerkinAnsatz sucht dann Approximationen Uh ∈ Vh zu bestimmen durch die Vorschrift M Z X
m=1
Im
(m−1)+
{(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ]m−1 , ϕh
Z ) = (f, ϕh ) dt
(5.2.67)
I
f¨ ur beliebige Testfunktion ϕh ∈ Vh mit dem Anfangswert Uh0− = Ph0 u0 ( Ph0 die L2 -Projektion urfen, zerf¨allt dieses formal zeitlich auf Vh0 ). Da die Testfunktionen unstetig in der Zeit sein d¨ global gekoppelte System in lokale Teilprobleme auf jedem Zeitstreifen Qm = Ω × Im . Dieses Schema wird unstetiges Galerkin-Verfahren“ (abgek¨ urzt dG(r)-Verfahren“) genannt. Wir wol” ” len im folgenden nur den einfachsten Fall r = 0 , d.h. das dG(0)-Verfahren, betrachten. In diesem Fall reduziert sich das globale Schema (5.2.67) auf die folgende Sequenz von lokalen Gleichungen auf den Zeitintervallen Im , m = 1, ..., M : Z Z m−1 (f, ϕh ) dt (5.2.68) {(∂t Uh , ϕh ) + (∇Uh , ∇ϕh )} dt + ([Uh ] , ϕh ) = Im
Im
f¨ ur beliebiges ϕh ∈ Vhm . Mit der Setzung Uhm := Uhm,− ergibt sich wegen ∂t Uh ≡ 0 auf Im : km (∇Uhm , ∇ϕh ) + (Uhm − Uhm−1 , ϕ) = km (f¯m , ϕh )
(5.2.69)
f¨ ur beliebiges ϕh ∈ Vhm . Dies ist gerade das implizite Euler-Verfahren (5.2.48), welches sich also in diesem Rahmen als dG(0)-Verfahren interpretieren l¨aßt. Diese Sicht ¨andert zwar nichts am Verfahren selbst, bietet jedoch einen systematischen Zugang zu seiner Fehleranalyse. Bemerkung 5.1: Die dG(r)-Verfahren h¨oheren Grades r ≥ 1 entsprechen keinem der oben diskutierten Zeitschritt-Schemata, sie sind vielmehr Varianten gewisser impliziter Runge8 Kutta9 -Verfahren. Wir bemerken aber, daß sich auch das popul¨ are Crank-Nicolson-Verfahren in den Rahmen der Galerkin-Verfahren einordnen l¨ aßt. Dazu macht man einen modifizierten Ansatz mit bzgl. der Zeit st¨ uckweise linearen, aber diesmal global stetigen Funktionen. Der Raum der Testfunktionen ist dagegen derselbe wie beim dG(0)-Verfahren. Dies wird dann ein Petrow-Galerkin-Verfahren“ (sog. cG(1)-Verfahren), welches sich ¨ ahnlich analysieren l¨aßt wie ” das dG(0)-Verfahren: (Uhm , ϕh ) + 12 km (∇(Uhm + Uhm−1 ), ∇ϕh ) = (Uhm−1 , ϕh ) + km (f¯m , ϕh ),
(5.2.70)
f¨ ur beliebige Testfunktion ϕh ∈ Vhm . 8
Carle David Tolm´e Runge (1856-1927): deutscher Mathematiker; Prof. in Hannover und G¨ ottingen; Beitr¨ age zur Spektraltheorie mit Anwendungen in der Atom-Physik. 9 Martin Wilhelm Kutta (1867-1944): deutscher Mathematiker; Prof. in Stuttgart; Beitr¨ age zur Aerodynamik und zur Numerik von Differentialgleichungen.
206
Verfahren f¨ ur parabolische Probleme
Wir wollen jetzt eine a posteriori Fehlerabsch¨atzung f¨ ur das dG(0)-Verfahren ableiten, welche als Basis f¨ ur eine simultane Anpassung des Ortsgitters und der Zeitschrittweite an den L¨osungsverlauf dienen kann. Dazu setzen wir eh := Uh − u . Ein typisches Beispiel ist die Kontrolle des + L2 -Fehlers zum Endzeitpunkt J(eh ) := keN h k. Satz 5.6 (A-posteriori Fehlerschranke): F¨ ur das dG(0)-Verfahren gilt bei Kontrolle des + atzung ortlichen L2 -Fehlers zum Endzeitpunkt, J(eh ) := keN ¨ h k , die a posteriori Fehlerabsch¨ J(eh ) ≤ η(Uh ) := ci
m X X µ=1
ρµn (Uh ) ωnµ (z),
(5.2.71)
µ Kn ∈Tµ h
mit den Residuentermen ρµn (Uh ) := kR(Uh )kQµn + hn−1/2 k[∂n Uh ]k∂K×I µ + kµ−1/2 k[Uh ]µ−1 kKnµ , R(Uh ) := f − ∂t Uh + ∆Uh , und einer Interpolationskonstante“ ci . Mit der L¨ osung z des ” dualen Problems“ ” −∂t z − ∆z = 0
z|∂Ω = 0, z|t=tm = kem+ k−1 em+ .
in Ω × [0, tm ],
(5.2.72)
haben die Gewichte ωnµ (z) die Gestalt: ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn . Beweis: Das erste Standbein“ des Beweises ist ein (parabolisches) Dualit¨atsargument. Wir ” f¨ uhren zun¨achst f¨ ur ein festes tm ∈ I das (kontinuierliche) duale Problem“ ein: ” −∂t z − ∆z = ψ
in Qm := Ω × [0, tm ],
z|∂Ω , zt=tm = χ,
(5.2.73)
∀ϕ ∈ V.
(5.2.74)
bzw. in semi-variationeller Formulierung −(∂t z, ϕ) + (∇z, ∇ϕ) = (ψ, ϕ) Umschreiben in die Form (5.2.66) ergibt m nZ X
µ=1
Iµ
µ+
{−(ϕ, ∂t z) + (∇ϕ, ∇z)} dt + (ϕ
o Z , [z] ) = µ
(ϕ, ψ) dt [0,tm ]
f¨ ur beliebige in der Zeit stetige Testfunktion ϕ(·, t) ∈ V , wobei die Anfangsbedingung wieder durch die Vorschrift z m+ := χ ber¨ ucksichtigt ist. Durch partielle Integration in der Zeit wird dies umgeformt zu m nZ X
µ=1
Iµ
µ−1
{(∂t ϕ, z) + (∇ϕ, ∇z)} dt + ([ϕ]
,z
(µ−1)+
Z o m+ ) = (ϕ , χ) +
(ϕ, ψ) dt
(5.2.75)
[0,tm ]
f¨ ur beliebige in der Zeit (st¨ uckweise) differenzierbare Testfunktion ϕ(·, t) ∈ V . Das zweite Standbein“ des Beweises ist die Galerkin-Orthogonalit¨at des Fehlers des dG(0)” Verfahrens. Durch Vergleich der beiden Gleichungen (5.2.66) f¨ ur u und (5.2.67) f¨ ur Uh erhalten
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
207
wir f¨ ur den Fehler eh := Uh − u die Galerkin-Orthogonalit¨at“: ” Z M X (m−1)+ m−1 ) =0 {(∂t eh , ϕh ) + (∇eh ∇ϕh )}, dt + ([eh ] , ϕh
(5.2.76)
Im
m=1
f¨ ur beliebige stetige Testfunktion ϕh (·, t) ∈ Vh . Wir w¨ahlen nun in (5.2.75) die spezielle Testfunktion ϕ := eh und erhalten m nZ X µ=1
Iµ
Z o , χ) + {(∂t eh , z) + (∇eh , ∇z)} dt + ([eh ]µ−1 , z (µ−1)+ ) = (em+ h
(eh , ψ) dt.
[0,tm ]
Unter Ausnutzung von (5.2.76) erhalten wir damit die allgemeine Fehleridentit¨at: (em+ h , χ)
+
Z
(eh , ψ) dt =
[0,tm ]
m nZ X
Iµ
µ=1
{(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt
o + ([eh ]µ−1 , (z − zh )(µ−1)+ )
(5.2.77)
mit einer beliebigen Approximation zh ∈ Vh zur dualen L¨osung z . Wir setzen nun im dualen Problem tm = T , ψ := 0 und χ := keN + k−1 eN + . Aus der allgemeinen Fehleridentit¨at (5.2.77) folgt kem+ h k=
m nZ X
Iµ
µ=1
o {(∂t eh , z − zh ) + (∇eh , ∇(z − zh ))} dt + ([eh ]µ−1 , (z − zh )(µ−1)+ ) (5.2.78)
mit einer beliebigen Approximation zh ∈ Vh zur dualen L¨osung z . Wir nutzen nun die L¨osungseigenschaften von u und integrieren auf jeder Zelle Knm partiell bzgl. des Orts: kem+ h k
=
m X X nZ
µ=1
Iµ
µ Kn ∈Tµ h
{(∂t u − ∂t Uh , z − zh )Knµ − (∆u − ∆Uh , z − zh )Knµ
o − (∂n (Uh − u), z − zh )∂Knµ } dt + ([Uh − u]µ−1 , (z − zh )(µ−1)+ )Knµ .
Dies ergibt
kem+ h k=
m X X nZ
µ µ=1 Kn ∈Tµ
Iµ
{(R(Uh ), z − zh )Knµ − 12 ([∂n Uh ], z − zh )∂Knµ } dt
h
o + ([Uh ]µ−1 , (z − zh )(µ−1)+ )Knµ ,
mit dem Residuum R(Uh ) := f − ∂t Uh + ∆Uh und dem Sprung [∂n Uh ] von ∂n Uh u ¨ber die Zellkanten. Durch Anwendung der H¨ older’schen Ungleichung erhalten wir kem+ h k≤
m X X n kR(Uh )kQµn kz − zh kQµn µ µ=1 Kn ∈Tµ h
o + 21 k[∂n Uh ]k∂Qµn kz − zh k∂Qµn } dt + k[Uh ]µ−1 kKnµ k(z − zh )(µ−1)+ kKnµ ,
(5.2.79)
208
Verfahren f¨ ur parabolische Probleme
Wir w¨ahlen nun f¨ ur zh die nat¨ urliche Interpolierende Ih,k z ∈ Vh , welche zellweise definiert ist durch die Vorschrift Z −1 Ih,k z|Iµ = kµ z dt, Ih,k z|Knµ = konstante Interpolation von z. (5.2.80) Iµ
Dann gelten die Interpolationsabsch¨ atzungen (Beweis mit Hilfe einer Variante des BrambleHilbert-Lemmas) kz − Ih,k zkQµn ≤ ci ωnµ (z),
hn1/2 kz − Ih,k zk∂Qµn ≤ ci ωnµ (z),
kµ1/2 k(z − Ih,k z)(µ−1)+ kKnµ ≤ ci ωnµ (z),
(5.2.81) (5.2.82) (5.2.83)
wobei ωnµ (z) := kµ k∂t zkQµn + kµ2 k∂t2 zkQµn + h2n k∇2 zkQµn . Die Interpolationskonstante“ ci , welche in die a posteriori Fehlerabsch¨atzung (5.2.71) eingeht, ” hat dabei in der Regel die Gr¨ oße ci ∼ 0, 1−1 . Einsetzen dieser Absch¨atzungen in (5.2.79) und Anwendung der Schwarz’schen Ungleichung ergeben kem+ h k ≤ ci
m X X n
µ µ=1 Kn ∈Tµ h
o kR(Uh )kQµn + hn−1/2 k[∂n Uh ]k∂Qµn + kµ−1/2 k[Uh ]µ−1 kKnµ ωnµ (z),
Dies impliziert die Behauptung.
Q.E.D.
Zur konkreten Auswertung der a posteriori Fehlerabsch¨atzung (5.2.71) m¨ ussen die Gewichte berechnet werden. Dazu wird analog zum station¨aren, elliptischen Fall das duale Problem (5.2.72) numerisch auf dem aktuellen Gitter gel¨ost. Mit der resultierenden diskreten dualen L¨osung zh wird dann approximiert gem¨aß:
ωnm (z)
ωnµ (z) ≈ ω ˜ nµ := kµ kkµ−1 [zh ]µ−1 kKnµ + h2n k∇2h zh kQµn ,
(5.2.84)
wobei ∇2h zh ∼ ∇2 z ein geeigneter Differenzenqotient ist. Auf der Basis der approximativen a posteriori Fehlerabsch¨ atzung kem+ ˜(Uh ) := ci h k≈η
m X X
ρµn (Uh ) ω ˜ nµ (z)
(5.2.85)
µ µ=1 Kn ∈Tµ h
k¨onnen nun simultan das Ortsgitter und die Zeitschrittweite adaptiert werden. Dabei werden in einem iterativen Prozess die Ortsresiduen ρm,1 + hn−1/2 k[∂n Uh ]k∂Qµn , n (Uh ) := kR(Uh )kQµ n und Zeitresiduen −1/2 ρm,2 k[Uh ]µ−1 kKnµ , n (Uh ) := kµ
durch Anpassen von hn und km balanciert, bis η˜(Uh ) ≤ T OL f¨ ur eine vorgegebene Fehlertoleranz TOL.
5.2 FE-Galerkin-Verfahren f¨ ur parabolische Probleme
209
Analoge Resultate gelten f¨ ur andere Fehlermaße, z.B. den globalen L2 -Fehler auf QT : Z 1/2 J(eh ) := keh kQT = keh k2 dt . (5.2.86) I
In diesem Fall gilt die a posteriori Fehlerabsch¨atzung (5.2.85) mit dem dualen Problem −1/2
−∂t z − ∆z = keh kQT eh
in Ω × [0, tm ],
z|∂Ω = 0, z|t=tm = 0.
(5.2.87)
Die Wirksamkeit der adaptiven Steuerung der Ortsgitterweite auf der Basis dieser a posteriori Fehlerabsch¨ atzungen wird anhand eines einfachen Beispiels demonstriert. Beispiel 5.1: Wir l¨ osen die inhomogene W¨armeleitungsgleichung ∂t u − ∆u = f
in QT ,
u|∂Ω = 0, u|t=0 = u0 ,
(5.2.88)
auf dem Einheitsquadrat Ω = (0, 1)2 . Als exakte“ L¨osung wird angesetzt: ” T 1 , x0 := 21 + 14 cos(2πt), 12 + 14 sin(2πt) , u(x, t) := 0 2 1 + α|x − x | woraus sich Anfangswert und rechte Seite ergeben zu u0 (x) := u(x, 0),
f (x, t) := ∂t u(x, t) − ∆u(x, t).
Diese L¨osungsfunktion beschreibt einen H¨ ugel“ im Gebiet (0, 1)2 , der w¨ahrend des Zeitinter” valls I = [0, 1] einmal im Kreis um den Punkt ( 12 , 12 ) heruml¨auft. Die Gr¨oße bzw. Steigung des H¨ ugels l¨aßt sich durch Wahl des Parameters α steuern. F¨ ur den Test wird α = 50 gesetzt.
210
Verfahren f¨ ur parabolische Probleme
Abbildung 5.1: Gittersequenzen bei Kontrolle des Endzeit-L2 -Fehlers keM kΩ ; Quelle: R. Hartmann, A
posteriori Fehlersch¨atzung ... f¨ ur die W¨armeleitungsgleichung“, Diplomarbeit 1998.
”
Abbildung 5.2: Gittersequenzen bei Kontrolle des globalen L2 -Fehlers kekΩ×I (unten); Quelle: R. Hart-
mann, A posteriori Fehlersch¨atzung ... bei Galerkin-Verfahren f¨ ur die W¨armeleitungsgleichung“, Di” plomarbeit 1998.
5.3 Verallgemeinerungen und L¨ osungsaspekte
211
5.3 Verallgemeinerungen und L¨ osungsaspekte Wir haben als Modellfall die W¨ armeleitungsgleichung ∂t u − a∆u = f
in QT = Ω × [0, T ],
(5.3.89)
mit homogenen Dirichlet-Randbedingungen u|∂Ω = 0 und einem konstanten Diffusionskoeffi” zienten“ a > 0 betrachtet. i) Verallgemeinerungen: Wir lassen nun zu, daß der Koeffizient a = a(x, t) vom Ort und von der Zeit abh¨angt. Das Problem schreibt sich dann in der Form ∂t u − ∇ · {a∇u} = f
in QT = Ω × [0, T ].
(5.3.90)
Die oben betrachteten Zeitschrittverfahren lassen sich in der Regel leicht auf diesen allgemeineren Fall u ¨bertragen. Wir wollen dies anhand des Crank-Nicolson-Verfahren diskutieren: 1 m m−1 m−1 m = 2 fh + fhm−1 , (5.3.91) Uh k−1 Uhm − Uhm−1 + 12 Am h Uh + Ah
mit der Ortsdiskretisierung Ah (t) des Operators −∇ · (a(·, t)∇) . Dabei werden f¨ ur Funktionen w(t) die abk¨ urzenden Bezeichnungen wm := w(tm ) , wm−1/2 := w(tm−1/2 ) und tm−1/2 := 1 2 (tm + tm−1 ) verwendet. Dies entspricht der sog. ”Sehnentrapezregel“; Anwendung der ”Tangententrapezregel“ f¨ uhrt auf das Schema: m−1/2 m−1/2 . Uhm + Uhm−1 = fh k−1 Uhm − Uhm−1 + 12 Ah
(5.3.92)
Beide Verfahrensvarianten sind unbedingt stabil und von der Konvergenzordnung O(k2 + h2 ) . Zu Ihrer Analyse ist das elegante Spektralargument aus dem vorigen Abschnitt leider nicht mehr geeignet, da der Operator Ah (t) nun mit der Zeit variiert. Statt dessen verwendet man die flexiblere Energietechnik“ und beh¨ alt im wesentlichen dieselben Aussagen wie im autonomen Fall, ” allerdings mit wesentlich mehr Aufwand. Im (praktisch wichtigen) nichtlinearen Fall a = a(u(t)) wird zweckm¨ aßigerweise die Tangententrapezform des Crank-Nicolson-Schemas verwendet: k−1 Uhm − Uhm−1 + Ah
m 1 2 (Uh
Hier ist auch die BDF(2)-Formel gut anwendbar:
m−1/2 . + Uhm−1 ) = fh
2k−1 3Uhm − 4Uhm−1 + Uhm−2 + Ah (Uhm ) = fhm .
(5.3.93)
(5.3.94)
Eine Stabilit¨ ats- und Konvergenzanalyse steht aber außerhalb des Rahmens dieser Vorlesung. ii) Berechnung der Startwerte: Bei der Durchf¨ uhrung jedes Zeitschritts ist die rechte Seite aufzubauen, welche die Information vom vorausgehenden Zeitlevel beinhaltet. Dabei ist unter Umst¨anden eine L2 -Projektion auf das aktuelle Gitter vorzunehmen. a) Anfangswert: Die Auswertung des Anfangswerts Uh0 kann meist durch einfache, lokale Interpolation (oder Restriktion) des kontinuierlichen Anfangswerts u0 auf das Gitter erfolgen. Im ¯ , ist jedoch Vorsicht geboten. Zur Gew¨ahrFall eines irregul¨ aren Anfangswerts, etwa u0 ∈ / C(Ω) leistung der vollen Gl¨ attungseigenschaft“ der Diskretisierung (im Ort sowie in der Zeit) sollte ”
212
Verfahren f¨ ur parabolische Probleme
Uh0 als L2 -Projektion ausgewertet werde gem¨aß: (Uh0 , ϕh ) = (u0 , ϕh ) ϕh ∈ Vh .
(5.3.95)
b) Ortsgitterwechsel: Ver¨ andert sich die Ortsdiskretisierung vom Zeitlevel tm−1 zum Zeitlevel tm , so muß die vorausgehende N¨ aherung Uhm−1 ∈ Vhm−1 auf das neue Gitter transferiert werden. Im FE-Kontext geschieht dies zwangsl¨ aufig gem¨aß (Uhm−1 , ϕh ) ∀ϕh ∈ Vhm ,
(5.3.96)
was gleichbedeutend mit der Auswertung der L2 -Projektion Phm Uhm−1 ∈ Vhm ist. Dieser unscheinbare Schritt kann unter Umst¨ anden die teure“ Komponente des ganzen L¨osungsprozesses ” ollig unabh¨angig vonsein. Dies ist dann der Fall, wenn die beiden Gitter Thm−1 und Tm h v¨ einander erzeugt werden. Zur Auswertung von (5.3.96) m¨ ussen Zellintegrale u ¨ ber Produkte von Knotenbasisfunktionen berechnet werden: Z ϕhm−1,j ϕm,n dx. h m Kn
Normalerweise geschieht dies mit Hilfe von Quadraturformeln. Da die Funktion ϕhm−1,j auf der Zelle Knm aber in der Regel nur st¨ uckweise glatt ist, w¨are das zu ungenau. Der dadurch in jedem Zeitschritt eingeschleppte Fehler w¨ urde im Verlaufe der Rechnung akkumulieren und das Ergebnis stark verf¨ alschen. Die Verwendung von Quadraturformeln besonders hoher Ordnung (z.B. 3 × 3-Gauß-Formeln) behebt diese Schwierigkeit nicht, da letztere zur Erreichung ihrer hohen Genauigkeit nat¨ urlich auch eine entsprechend hohe Regularit¨at des Integranden ben¨otigen. Gerade diese ist aber im betrachteten Fall nicht gegeben. Es gibt im wesentlichen drei Wege zur L¨osung dieses technischen Problems: - Es werden summierte“ Quadraturformeln auf den einzelnen Zellen Knm verwendet; etwa ” durch Unterteilung in 4 − 16 Unterzellen. Dies erh¨oht zwar nicht die Ordnung der Integration, vermindert aber die relevante Fehlerkonstante. - Die Integration wird f¨ ur den st¨ uckweise polynomialen Integranden exakt“ durchgef¨ uhrt. Dazu ” m−1,j m ist die Bestimmung aller Teilst¨ ucke von Kn erforderlich, auf denen ϕh glatt ist. Dies wird bei, unstrukturierten Gittern in 3-D allerdings sehr aufwendig. - Geh¨oren die Gitter Thm−1 und Tm h zu einer Familie von hierarchisch verfeinerten Gittern, kann diese strukturelle Information zur effizienten Berechnung der Integrale verwendet werden, da die Lage der kritischen Knicklinien von ϕhm−1,j durch die regul¨are Verfeinerung bestimmt ist. iii) L¨ osungskomplexit¨ at: Wir betrachten wieder den Modellfall der homogenen W¨armeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 ⊂ R2 , ∂t u − ∆u = 0
in QT ,
(5.3.97)
welche auf einem ¨ aquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei. (i) Explizite Verfahren (etwa das explizite Euler-Schema) erfordern in jedem Zeitschritt eine Matrix-Vektor-Multiplikation mit einem arithmetischen Aufwand O(N ) . Die Stabilit¨atsbedingung k ≤ ch2 erzwingt etwa M ∼ h−2 ∼ N Zeitschritte pro Zeiteinheit. Dies bedeutet einen
5.3 Verallgemeinerungen und L¨ osungsaspekte
213
Gesamtaufwand von O(N 2 ) OP. (ii) Implizite Verfahren erfordern in jedem Zeitschritt die L¨osung eines linearen Gleichungssy¨ stems, erlauben aber gr¨ oßere Zeitschritte. Zur Uberbr¨ uckung einer Zeiteinheit sind aus Genau−1 igkeitsgr¨ unden in der Regel M ∼ h Zeitschritte erforderlich. Wir diskutieren exemplarisch das Crank-Nicolson-Verfahren. Bei zeilenweiser Numerierung der Gitterpunkte haben die resultierenden Gleichungssysteme (Ih + 12 akAh )U m = (Ih − 21 akAh )U m−1
(5.3.98)
die Koeffizientenmatrix Lh := Ih + 12 akAh , wobei wieder
Bm −Im
−Im Bm −Im Ah = −Im Bm .. .
. . N . .. .
Bm
−1 4 −1 = . . m . −1 4 .. .. . .
4 −1
mit der m×m-Einheitsmatrix Im . Die Eigenwerte dieser Matrix sind gegeben durch: λkl (Lh ) = 1 + 12 akh−2 {4 − 2(cos(khπ) + cos(lhπ))},
k, l = 1, ..., m.
Damit ergibt sich ihre Spektralkondition zu cond2 (Lh ) =
1 + 4akh−2 λmax (Lh ) ∼ . λmin (Lh ) 1 + akπ 2
(5.3.99)
Wir haben also unterschiedlich kritische Konditionierung abh¨angig von der Relation zwischen k und h . Im Hinblick auf eine Balancierung von Orts- und Zeitfehler ist die Wahl k ∼ h sinnvoll. In diesem Fall ist dann κ2 (Lh ) = O(h−1 ).
(5.3.100)
Im parabolischen Fall ist in der Regel die Konditionierung der zu l¨osenden impliziten Gleichungssysteme also weniger kritisch als bei elliptischen Problemen. Bei Einhaltung der (nat¨ urlich unrealistischen) Schrittweitenrelation k ∼ h2 wird sogar κ2 (Lh ) = O(1) , und der L¨osungsaufwand der impliziten Verfahren n¨ ahert sich dem der expliziten. Zur L¨osung des Systems (5.3.98) k¨onnen alle oben diskutierten Methoden verwendet werden. Da sich im autonomen Fall die Matrix Lh von Zeitschritt zu Zeitschritt nicht ¨andert, bietet sich die direkte L¨ osung mit Hilfe einer einmaligen Cholesky-Zerlegung zu Beginn der Rechnung an (wenn dies speichertechnisch m¨ oglich ist). Dieser Ansatz erfordert es aber, den Zeitschritt k konstant zu halten, was in den meisten praktischen F¨allen nicht ¨okonomisch ist. Im allgemeinen muß in jedem Zeitschritt eine neue“ Matrix invertiert werden, was die Verwendung ” iterativer L¨ osungsverfahren impliziert. Dabei steht mit Uhm−1 ein meist recht guter Startwert zur Verf¨ ugung. Bei Verwendung eines Mehrgitterverfahrens bietet sich daher die Organisation im F-Zyklus an. H¨ aufig ist wegen der vergleichsweise moderaten Konditionierung der Matrizen Lh (bei kleiner Zeitschrittweite) zu ihrer Invertierung ein normales CG-Verfahren ausreichend schnell, so daß sich der Einsatz der komplizierten Mehrgitteriteration er¨ ubrigt. Dies h¨angt aber sehr von der jeweiligen konkreten Situation ab.
214
Verfahren f¨ ur parabolische Probleme
iv) Splitting-Methoden (ADI-Verfahren): In h¨oheren Raumdimensionen ist die L¨osung der Gleichungssysteme in jedem Zeitschritt eines impliziten Verfahrens kostspielig und kann Rechnungen u ¨ber sehr lange Zeitintervalle T ≫ 1 ¨ unm¨oglich machen. Der Ubergang zu expliziten Schemata ist in der Regel wegen der damit verbundenen Zeitschrittrestriktion auch nicht sinnvoll. In dieser Situation stellen die sog. Splitting” Methoden“ eine attraktive Alternative dar. Diese zerlegen die L¨osung der vollen d-dimensionalen Gleichungssysteme in eine Folge von tridiagonalen Systemen (wie im 1-dimensionalen Fall), welche mit optimaler O(N )-Komplexit¨ at gel¨ost werden k¨onnen. Ein Vertreter dieses Verfahrenstyps ist das ADI-Verfahren“ (Alternating Direction Implicit Iteration) nach Peaceman-Rachford, ” welches wir bereits im Zusammenhang mit iterativen L¨osungsverfahren f¨ ur spezielle separable“ ” Gleichungssysteme kennengelernt haben. Bei mehrdimensionalen, parabolischen Problemen wird es nun als Diskretisierungsverfahren eingesetzt.
Wir betrachten wieder die W¨ armeleitungsgleichung auf dem Einheitsquadrat Ω = (0, 1)2 , ∂t u − a∆u = 0
in QT ,
(5.3.101)
welche auf einem ¨ aquidistanten Gitter mit dem 5-Punkte-Differenzenoperator diskretisiert sei. Bei zeilenweiser Numerierung der Gitterpunkte haben die aus dem Crank-Nicolson-Verfahren resultierenden Gleichungssysteme die Gestalt (Ih + 21 akAh )U m = (Ih − 12 akAh )U m−1 .
(5.3.102)
Der Differenzenoperator Ah wird auf dem kartesischen Tensorprodukt-Gitter in seine Bestandteile bzgl. der einzelnen Koordinatenrichtungen zerlegt gem¨aß Ah = Ah,1 + Ah,2 . Entsprechend erh¨ alt das Gleichungssystem (5.3.102) des Crank-Nicolson-Schemas die Form (Ih + 12 ak(Ah,1 + Ah,2 ))U m = (Ih − 21 ak(Ah,1 + Ah,2 ))U m−1 m−1/2
Die Ah,i sind Tridiagonalmatrizen. Es wird dann unter Einf¨ uhrung von Zwischenwerten Uh wie folgt iteriert: m−1/2
(Ih + 21 akAh,1 )Uh
= (Ih − 12 akAh,2 )Uhm−1
m−1/2
(Ih + 21 akAh,2 )Uhm = (Ih − 12 akAh,1 )Uh
.
Die ADI-Methode kann als ein Mehrschritt-Differenzenschema interpretiert werden, wobei allerdings die Zwischenwerte keine physikalische Relevanz haben. In jedem Teilschritt m¨ ussen Gleichungssysteme mit Tridiagonalgestalt gel¨ost werden. Wir wissen bereits von der Diskussion der iterativen L¨ osungsverfahren, daß der ADI-Algorithmus f¨ ur jeden Wert des Parameters ak > 0 gegen die L¨ osung Uh∞ des Gleichungssystems Ah Uh∞ = 0 konvergiert. Dies ist auch physikalisch“ sinnvoll, da ja im homogenen Fall ( f ≡ 0 ) auch f¨ ur die exakte L¨osung gilt ” u(t) → 0 (t → ∞) . Damit erweist sich das ADI-Verfahren automatisch als unbedingt numerisch m−1/2 erhalten wir stabil. Durch Elimination des Zwischenwertes Uh (I + 12 kAh,1 )(I + 12 kAh,2 )Uhm = (I − 21 kAh,1 )(I − 12 kAh,2 )Uhm−1 .
(5.3.103)
5.3 Verallgemeinerungen und L¨ osungsaspekte
215
Der Abschneidefehler dieser Differenzenformel erlaubt die Absch¨atzung n o m |τh,k | ≤ c k2 max |∂t3 u| + h2 max |∇4 u| . ¯T Q
¯T Q
(5.3.104)
Eine Konvergenzanalyse ist leicht m¨ oglich, wenn wir wieder annehmen, daß die Zerlegungsmatrizen Ah,1 und Ah,2 kommutieren, d.h.: Ah,1 Ah,2 = Ah,2 Ah,1 . In diesem Fall besitzen sie ein gemeinsames ONS von Eigenvektoren {v (n) , n = 1, ..., N } zu Eigenwerten λn = λn (Ah,1 ) und µn = µn (Ah,2 ) . Die Koeffizienten in der Entwicklung Uhm =
N X
(n) αm ν v
ν=1
werden dann durch das ADI-Schema wie folgt fortgepflanzt αm n =
(1 − 21 kλn )(1 − 21 kµn ) m−1 αn . (1 + 12 kλn )(1 + 21 kµn )
(5.3.105)
Hieraus folgt wieder, analog zum Crank-Nicolson-Schema, direkt die unbedingte Stabilit¨at des ADI-Schemas. F¨ ur die Fourier-Koeffizienten αn (t) der ¨ortlich semi-diskreten Approximation uh (t) gilt αn (tm ) = e−k(λn +µn ) αn (tm−1 ).
(5.3.106)
Aus der Beziehung f¨ ur z = z1 + z2 , zi ≤ 0 , 1 + 12 z1 1 + 12 z2 z1 · = e + O(|z1 |3 ) ez2 + O(|z2 |3 ) = ez + O(|z|3 ) 1 1 1 − 2 z1 1 − 2 z2
(5.3.107)
erh¨alt man durch Adaption des Arguments, welches bei der Konvergenzanalyse der Pad´e-Verfahren verwendet wurde, den folgenden Satz. Satz 5.7 (ADI-Verfahren): Angewendet auf die 5-Punkte-Diskretisierung der W¨ armeleitungsgleichung auf dem Einheitsquadrat ist das ADI-Verfahren f¨ ur jede Zeitschrittweite k stabil und mit 2. Ordnung konvergent: m m 2 3 2 4 kUh − u kh ≤ c k max |∂t u| + h max |∇ u| . (5.3.108) ¯T Q
¯T Q
Beweis: Der Beweis bedient sich wieder der Spektralmethode.
Q.E.D.
Der ADI-Ansatz ist generell auf (kartesischen) Tensorproduktgittern in beliebigen Raumdimensionen m¨ oglich, wenn der zugrunde liegende Differentialoperator separabel“ ist, d.h. additiv ” in eindimensionale Operatoren zerf¨ allt, wie z.B. der Operator Lu = −∂12 u − ∂22 u + ∂1 u + ∂2 u + u. In allgemeineren Situationen (z.B. bei Auftreten gemischter Ableitungen ∂1 ∂2 u oder auf unstrukturierten Gittern) sind additive Zerlegungen von Ah in tridiagonale Teilmatrizen nicht mehr m¨oglich, und der Wert des ADI-Ansatzes wird zweifelhaft.
216
¨ 5.4 Ubungen ¨ Ubung 5.1: ¨ Ubung 5.2:
Verfahren f¨ ur parabolische Probleme
6 Verfahren fu ¨ r hyperbolische Probleme Wir diskutieren zun¨ achst wieder die klassischen Differenzenapproximationen zur L¨osung hyper¨ bolischer Anfangs-Randwert-Aufgaben (ARWAn). Der Ubersichtlichkeit halber beschr¨anken wir uns dabei auf das Modellproblem der Wellengleichung in einer Ortsdimension mit Dirichletschen Randbedingungen, d.h. auf die 1. ARWA: ∂t2 u − c2 ∂x2 u = f
in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
0
(6.0.1) 0
u(x, 0) = u , ∂t u(x, 0) = v ,
bzw. deren o ¨rtlich zweidimensionales Analogon ∂t2 u − c2 ∆u = f u|∂Ω = 0,
in QT := Ω × [0, T ], 0
(6.0.2)
0
u|t=0 = u , ∂t u|t=0 = v .
Das Definitionsgebiet Ω wird wieder als glatt berandet oder als konvexes Polygongebiet vorausgesetzt. Die Problemdaten f, u0 , v 0 sind ebenfalls glatt und kompatibel, so daß die L¨osung ¨ ebenfalls als glatt angenommen werden kann. Unsere theoretischen Uberlegungen haben gezeigt, daß bei hyperbolischen Problemen Irregularit¨aten in den Anfangsdaten oder der rechten Seite entlang der Charakteristiken fortgepflanzt werden. Im Gegensatz zu den elliptischen und parabolischen Problemen besitzen hyperbolische keinerlei Gl¨attungseigenschaft“. Lokale St¨orungen ” (bzw. Wellen) werden unged¨ ampft fortgeplanzt. Insbesondere gilt das Prinzip der Energieer” haltung“, d.h.: F¨ ur f ≡ 0 bleibt die Gesamtenergie (Summe aus kinetischer und elastischer Energie) in der Zeit erhalten: k∂t u(t)k2 + c2 k∇u(t)k2 = kv 0 k2 + c2 k∇u0 k2 .
(6.0.3)
Diese charakteristische Eigenschaft sollten auch Diskretisierungen der Wellengleichung besitzen.
6.1 Differenzenverfahren fu ¨r hyperbolische Probleme Wir beginnen mit der ¨ ortlich eindimensionalen, homogenen Wellengleichung ∂t2 u − c2 ∂x2 u = 0 in QT := (0, 1) × [0, T ],
u(0, t) = u(1, t) = 0,
(6.1.4)
u(x, 0) = u0 , ∂t u(x, t) = v 0 .
Auf einem (¨ aquidistanten) Orts-Zeit-Gitter {xn = nh, tm = mk} mit Ortsgitterweite h sowie Zeitschrittweite k lautet die nat¨ urliche, zentrale Differenzenapproximation 2. Ordnung m−1 m−1 k−2 {Unm − 2Unm−1 + Unm−2 } − c2 h−2 {Un−1 − Unm−1 + Un+1 }
(6.1.5)
zur Bestimmung der Approximationen Unm ∼ u(xn , tm ) . Dies ist eine (explizite) Zweischrittformel“. ” Die Startwerte Un0 und Un1 werden aus den Anfangsbedingungen berechnet gem¨aß: Un0 := u0 (xn ), 217
218
Verfahren f¨ ur hyperbolische Probleme
sowie unter Beachtung von u(xn , k) = u(xn , 0) + k∂t u(xn , 0) + 12 k2 ∂t2 u(xn , 0) + ... = u0 (xn ) + kv 0 (xn ) + 21 c2 k2 ∂x2 u0 (xn ) + ... durch Un1 = u0 (xn ) + kv 0 (xn ) + 21 c2 k2 h−2 {u0 (xn−1 ) − 2u0 (xn ) + u0 (xn+1 )}. Mit dem Quotienten σ := k/h gilt f¨ ur den zugeh¨origen Abschneidefehler: τh,k = {∂t2 u − c2 ∂x2 u} +
1 2 2 12 h (σ
− c−2 )∂t4 u +
1 4 4 360 h (σ
− c−4 )∂t6 u + ....
Offenbar ist τh,k ≡ 0 f¨ ur σ = c−1 , d.h.: Die explizite Differenzenformel m−1 m−1 Unn = Un−1 + Un+1 − Unm−2
ist eine exakte“ Differenzendarstellung der Wellengleichung. Das Abh¨angigkeitsgebiet der Dif” ferenzenformel h¨ angt offenbar von der Schrittweitenrelation σ = k/h ab. 1. Fall 0 < σ ≤ c−1 : Abh¨ angigkeitsgebiet der Differenzenformel enth¨alt das der Differentialgleichung; ¨ 2. Fall σ = c−1 : Ubereinstimmung“; ” 3. Fall σ > c−1 : Abh¨ angigkeitsgebiet der Differenzenformel ist enthalten in dem der Differentialgleichung. Satz 6.1 (Courant1 -Friedrichs2 -Lewy3 ): Notwendig f¨ ur die Konvergenz Unm → u(xn , tm )
(h, k → 0),
f¨ ur beliebige Anfangsdaten ist die Schrittweitenbedingung ( CFL-Bedingung“) ” k σ := ≤ c−1 . h
(6.1.6)
(6.1.7)
Beweis: Sei σ > c−1 . Wenn in irgendeinem festen Gitterpunkt (xn , tm ) f¨ ur eine spezielle m Anfangsbedingung Un → u(xn , tm ) konvergiert f¨ ur h, k → 0 , so k¨onnen wir diese Anfangsdaten außerhalb des Abh¨ angigkeitsintervalls von (xn , tm ) bzgl. der Differenzenformel beliebig ¨andern, ohne daß Unm ver¨ andert wird. In diesem Fall kann also Unm nicht gegen die ver¨anderte L¨osung u ˜(xn , tm ) konvergieren. Q.E.D. Bemerkung 6.1: Wir weisen darauf hin, daß f¨ ur spezielle Anfangsdaten durchaus (theoreti−1 sche) Konvergenz auch f¨ ur σ > c eintreten kann; in diesem Fall liegt aber numerische Instabilit¨ at vor. Die Schrittweitenbedingung (6.1.7) ist weniger restriktiv als die entsprechende armeleitungsgleichung. Bedingung k ≤ 12 ah2 bei der W¨ Im folgenden werden wir die Konvergenz des Differenzenschemas (6.1.5) untersuchen. Dabei bedienen wir uns der Spektraltechnik, die wir bereits bei parabolischen Problemen kennengelernt
6.1 Differenzenverfahren f¨ ur hyperbolische Probleme
219
haben. Der ¨ ortliche Differenzenoperator Ah Unm := −
c2 m } {U m − 2Unm + Un+1 h2 n−1
(6.1.8)
m ( U0m = UN +1 = 0 ) ist symmetrisch und positiv definit bzgl. des diskreten Skalarprodukts
(v, w)h := h2
N X
vn wn ,
n=1
1/2
kvkh := (v, v)h .
Seine Eigenwerte seien 0 < λ1 ≤ ... ≤ λN ∼ 4c2 /h2 mit einem zugeh¨origen Orthonormalsystem {w(n) , n = 1, ..., N } von Eigenvektoren. Insbesondere gilt (Ah v, v)h ≥ λkvk2h
(6.1.9)
mit einer von h unabh¨ angigen Konstante λ > 0 .
Satz 6.2 (CFL-Bedingung): Die explizite Differenzenformel (6.1.5) ist genau dann numerisch stabil, wenn die CFL-Bedingung k/h ≤ c−1 erf¨ ullt ist. Im Falle einer hinreichend glatten L¨ osung gilt dann die Konvergenzabsch¨atzung max kUhm − u(·, tm )kh ≤ c(u)T 2 {k2 + h2 }. [0,T ]
(6.1.10)
Beweis: i) F¨ ur die Entwicklungskoeffizienten in Uhm =
N X
(n) am nw
n=1
gilt m−1 + anm−2 + k2 λn anm−1 = 0 am n − 2an
bzw. 2 m−1 am + anm−2 = 0. n + (k λn − 2)an
(6.1.11)
Diese homogene Differenzengleichung hat die allgemeine L¨osung m m am n = c1 r1 + c2 r2
mit den Wurzeln ri des charakteristischen Polynoms ρ(r) = r 2 + (k2 λn − 2)r + 1 : p 2 − k2 λn ± (2 − k2 λn )2 − 4 r1,2 = . 2 Im Fall k2 λn ≤ 4 ist |r1,2 | ≤ 1 , d.h.: Es liegt Stabilit¨at vor. Im Fall k2 λn > 4 ist |r2 | > 1 , d.h.: Es besteht Instabilit¨ at. Offenbar gilt f¨ ur h → 0 : k2 λn ≤ 4
⇔
σ ≤ c−1 .
(6.1.12)
220
Verfahren f¨ ur hyperbolische Probleme
ii) Sei nun k2 λn ≤ 4 und die L¨ osung u glatt. Wir betrachten den Fehler der Ortsdiskretisierung getrennt von dem der Zeitdiskretisierung: m m m em n := u(xn , tm ) − Un = u(xn , tm ) − uh (xn , tm ) + uh (xn , tm ) − Un =: εh (xn , tm ) + En .
F¨ ur den Ortsdiskretisierungsfehler εh gilt ε0h = ∂t ε0h = 0 und ∂t2 εh + Ah εh = O(h2 ). Wir multiplizieren diese Identit¨ at mit ∂t εh , 2 2 1 2 dt k∂t εh kh + (Ah εh , εh )h = (O(h ), ∂t εh )h , und integrieren u ¨ber [0, t] : k∂t εh (t)k2h Dies impliziert
+ (Ah εh (t), εh (t))h =
kεh (0)k2h
+ (Ah εh (0), εh (0))h +
Z
t
(O(h2 ), ∂s εh )h ds.
0
max k∂t εh k2h + (Ah εh , εh )h ≤ t O(h2 ) max k∂t εh kh [0,t]
[0,t]
bzw. nach Aufintegrieren bzgl. der Zeit:
max kεh kh ≤ c t2 h2 . [0,t]
(6.1.13)
Der Faktor t2 l¨ aßt sich hier nicht vermeiden, da bei der Wellengleichung (im Gegensatz zur W¨armeleitungsgleichung) lokale St¨ orungen nicht ausged¨ampft werden.
iii) F¨ ur den Zeitdiskretisierungsfehler gilt k−2 {E m − 2E m−1 + E m−2 } + Ah E m−1 = O(k2 ).
(6.1.14)
Die Konstante in O(k2 ) h¨ angt dabei von den Zeitableitungen von uh (t) bis zur Ordnung 4 ab. Diese lassen sich durch die entsprechenden Zeitableitungen von u beschr¨anken, was hier jedoch nicht ausgef¨ uhrt werden soll. F¨ ur die n-te Fourier-Komponente Enm = (E m , w(n) )h gilt Enm − 2Enm−1 + Enm−2 + k2 λn Enm−1 = (O(k4 ), w(n) )h , gleichm¨aßig bzgl. n . Das charakteristische Polynom dieser Differenzengleichung ist ρ(r) = r 2 + (k2 λn − 2)r + 1 mit Wurzeln |r1,2 | = 1 . Die a priori Absch¨atzung f¨ ur L¨osungen inhomogener Differenzengleichungen aus Hilfssatz 6.1 liefert also: n o |Enm | ≤ c max |Enν | + m2 max O(k4 ) µ=0,1
bzw. kE m k2h
=
m X ν=1
ν=2,...,m
|Enν |2 ≤ c kE 0 k2h + kE 1 k2h + ct4m k4 .
6.1 Differenzenverfahren f¨ ur hyperbolische Probleme
221
Offenbar ist E 0 = 0 und E 1 = uh (t1 ) − U 1 = uh (t1 ) − u0 − ku1 − 12 k2 Ah u0
= −ε(t1 ) + u(t1 ) − u0 − ku1 − 12 k2 c2 ∂x2 u(0) + O(k2 h2 ) = −ε(t1 ) + u(t1 ) − u0 − ku1 − 21 k2 ∂t2 u(0) + O(k2 h2 )
= O(k3 + k2 h2 ) + O(k3 ). Dies f¨ uhrt auf
kE m k2h ≤ c t2m {h2 + k2 }2 .
(6.1.15)
Kombination der Absch¨ atzungen (6.1.13) und (6.1.15) vervollst¨andigt schließlich den Beweis. Q.E.D. Hilfssatz 6.1 (Differenzengleichungen): Die Folge {ym }m∈N gen¨ uge der linearen, inhomogenen Differenzengleichung R X
aν ym+ν = gm ,
ν=0
m ≥ 0.
(6.1.16)
Wenn alle Nullstellen λν des charakteristischen Polynoms ρ(z) :=
R X
aν z ν
ν=0
Betrag |λν | ≤ 1 haben, gilt die a priori Absch¨ atzung max |yν | ≤ cR max |yν | + m2 max |gν | , R≤ν≤m
0≤ν≤R
0≤ν≤m
m ≥ R.
Beweis: ohne
(6.1.17) Q.E.D.
Bemerkung 6.2: Die bisher erhaltenen Aussagen bleiben g¨ ultig, wenn man das explizite Differenzenschema auf das reine Anfangswertproblem ( Cauchy-Problem“) der Wellengleichung an” wendet. In diesem Fall ist man auf explizite Verfahren angewiesen, da zur Verwendung impliziter Formeln die notwendigen Randwerte fehlen. Bei der ARWA der Wellengleichung kann man sich von der einschr¨ankenden CFL-Bedingung durch Verwendung impliziter Differenzenformeln befreien, etwa der Art k−2 {Uhm − 2Uhm−1 + Uhm−2 } + αAh Uhm + (1 − 2α)Ah Uhm−1 + αAhm−2 = 0 mit einem Parameter α ∈ [0, 1] . Diese Formel hat den Abschneidefehler o n 1 (σ 2 − 1) − ασ 2 }∂x4 u + O(h2 ) ; τh = h2 { 12
(6.1.18)
Sie ist also f¨ ur beliebiges α von zweiter Ordnung. F¨ ur ein implizites Differenzenschema enth¨ alt ihr Abh¨angigkeitsbereich offensichtlich den der Differentialgleichung.
222
Verfahren f¨ ur hyperbolische Probleme
Satz 6.3 (Konvergenz impliziter Verfahren): Die implizite Differenzenformel (6.1.18) ist im Falle α ≥ 1/4 unbedingt stabil und im Fall 0 < α < 1/4 stabil f¨ ur 1 ; 0 4(1 + k2 λn α)2
⇒
|r2 | > 1.
(6.1.22)
b) Instabiler Fall
Der Kette ¨ aquivalenter Ungleichungen k2 λn (1 − 2α) − 2 ≤
k2 λn − 2αk2 λn ≤ 4 + 2αk2 λn
k2 λn − 4αk2 λn ≤ 4
4k2 c2 (1 − 4α) ≤ 4 h2 k2 (1 − 4α) ≤ c−2 h2
2 + 2k2 λn α
6.1 Differenzenverfahren f¨ ur hyperbolische Probleme
223
entnehmen wir die Bedingungen α ≥ 1/4 oder 0 < α < 1/4,
1 σ≤ √ . c 1 − 4α
(6.1.23)
Dagegen ist k2 λn (1 − 2α) − 2 ≥ −2 − 2k2 λn α k2 λn − 2αk2 λn ≥ −2αk2 λn k2 λn ≥ 0,
stets erf¨ ullt. Dies beweist den die Stabilit¨ at betreffenden Teil des Satzes. Die Konvergenzabsch¨atzung wird dann ¨ ahnlich wie im expliziten Fall gezeigt. Wir lassen die Details weg. Q.E.D. In zwei Raumdimensionen ist der Abh¨angigkeitsbereich der Wellengleichung kegelf¨ormig (z.B. Kreiskegel bei kreisf¨ ormigem Grundgebiet). Die obigen Aussagen f¨ ur den eindimensionalen Fall gelten sinngem¨ aß auch in zwei Dimensionen. Bei Ortsdiskretisierung mit dem 5-PunkteOperator Ah lautet das Analogon des expliziten Schemas (6.1.5) (6.1.24) k−2 Uhm − 2Uhm−1 + Uhm−2 + c2 Ah Uhm−1 = 0
und hat die Stabilit¨ atsbedingung
1 σ≤√ . 2c √ In drei Raumdimensionen versch¨ arft sich diese Bedingung zu σ ≤ ( 3c)−1 .
(6.1.25)
224
Verfahren f¨ ur hyperbolische Probleme
6.2 Finite-Elemente-Verfahren fu ¨r hyperbolische Probleme Als Basis von Finite-Elemente-Diskretisierungen dient wieder die variationelle Formulierung von (6.0.2): (∂t2 u, ϕ) + (a∇u, ∇ϕ) = (f, ϕ)
∀ϕ ∈ V, t > 0,
u|t=0 = 0,
(6.2.26)
mit dem u ¨ blichen Sobolew-Raum V := H01 (Ω) . Im Sinne der Rothe-Methode“ k¨onnten diese ” Gleichung nun zun¨ achst wieder mit einem Differenzenschema 2. Ordnung in der Zeit und anschließend die einzelnen Zeitschritte mit FE-Ans¨atzen im Ort diskretisiert werden. Dies f¨ uhrt wie bei den Differenzenverfahren zwangsl¨aufig auf Zwei-Schritt-Schemata, mit denen die Energieerhaltung nicht zu bewerkstelligen ist. Wir wollen daher jetzt einen anderen Weg beschreiten, der etwas n¨ aher an der Vorgehensweise bei parabolischen Problemen ist. Durch Einf¨ uhrung der zus¨atzlichen Unbekannten v = ∂t u geht die Wellengleichung u ¨ ber in das System ∂t u − v = 0,
∂t v − c2 ∆u = f, mit den nat¨ urlichen Randbedingungen u|∂Ω = v|∂Ω = 0 sowie den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . In variationeller Form schreibt sich dies wie (∂t v, ϕ) − (v, ψ) = 0 ∀ψ ∈ V, t ∈ [0, T ],
(∂t u, ψ) + c2 (∇u, ∇ϕ) = (f, ϕ),
∀ϕ ∈ V,
mit den Anfangsbedingungen u|t=0 = u0 und v|t=0 = v 0 . Dieses System von Differentialgleichungen ist wieder hyperbolisch“, da alle Eigenwerte der Koeffizientenmatrix rein imagin¨ ar ” sind. Zur Diskretisierung w¨ are also ein Zeitschrittverfahren g¨ unstig, bei dem die imagin¨are Achse gerade der Rand des Stabilit¨ atsgebiets ist. Das Crank-Nicolson-Verfahren besitzt diese Eigenschaft. Zur Diskretisierung dieses Systems verwenden wir das Rothe-Verfahren, d.h.: Zun¨achst wird bzgl. der Zeit diskretisiert. Dazu verwenden wir auf einem Zeitgitter 0 = t0 < t1 < ... < tm < ... < tM = T, mit Schrittweiten km = tm − tm−1 das Crank-Nicolson-Schema: (um −um−1 , ψ) − 21 km (v m +v m−1 , ψ) = 0,
(v m −v m−1 , ϕ) + 21 km (c2 ∇(um +um−1 ), ∇ϕ) =0,
f¨ ur alle Testfunktionen ϕ und ψ mit Anfangswerten u0 und v 0 . Bei diesem Zeitschrittverfahren bleibt die totale Energie in jedem einzelnen Zeitschritt erhalten. Dazu setzen wir im variationellen Schema ϕ := um − um−1 und ψ := v m − v m−1 und kombinieren die beiden resultierenden Gleichungen zu m 2 1 2 kv k
+ 12 kc∇um k2 =
m−1 2 1 k 2 kv
+ 12 kc∇um−1 k2 .
(6.2.27)
Die einzelnen Probleme in jedem Zeitschritt tm−1 → tm werden nun mit Hilfe eines FEVerfahrens diskretisiert. Dazu werden zu jedem Zeitlevel tm FE-Ansatzr¨aume Vhm ⊂ V =
6.2 Finite-Elemente-Verfahren f¨ ur hyperbolische Probleme
225
H01 (Ω) auf Gittern Tm ¨blichen Art gew¨ahlt. Im folgenden betrachten wir zun¨achst den Fall, H der u daß die Gitter und Ansatzr¨ aume zu allen Zeitpunkten dieselben sind. Die allgemeine Situation von mit der Zeit variierenden Ortsgittern ist in Abb. 6.1 skizziert.
Abbildung 6.1: Raum-Zeit-Gitter mit “h¨angenden Knoten“
Zu dem FE-Ansatz geh¨ oren wieder die Masse- und Steifigkeitsmatrizen
(i)
(i) (j) Mh = (mij )ij = (ϕh , ϕh ) ij ,
(i) (j) Ah = (aij )ij = (c2 ∇ϕh , ∇ϕh ) ij ,
wobei {ϕh , i = 1, ..., N } die Knotenbasis von Vh ist. Dabei wird angenommen, daß beide Unbekannte uh sowie vh in demselben Ansatzraum Vh bestimmt werden. Dies ist wegen der physikalisch vorgegebenen Randbedingung v|∂Ω = ∂t u|∂Ω = 0 sinnvoll. Eigentlich br¨auchte vh im Hinblick auf die gew¨ ahlte variationelle Formulierung aber nur in L2 (Ω) gew¨ahlt zu werden. m m Bezeichnen wir nun die zugeh¨ origen Knotenwertvektoren von um h und vh ebenfalls mit uh m alt das Zeitschrittschema die Gestalt und vh , so erh¨
Mh (Uhm − Uhm−1 ) + 12 km Mh (Vhm − Vhm−1 ) = 0, Mh (Vhm − Vhm−1 ) + 21 km Ah (Uhm + Uhm−1 ) = 0.
Dies kann nun so umgeformt werden, daß ein System von zwei sukzessive l¨osbaren Problemen entsteht: 2 2 (Mh + 14 km Ah )Uhm = Mh Uhm−1 + km Mh Vhm−1 − 14 km Ah Uhm−1 ,
Mh Vhm = Mh Vhm−1 − 12 km Ah (Uhm + Uhm−1 ).
In jedem Zeitschritt sind also eine (modifizierte) Ritz-Projektion sowie eine L2 -Projektion durchzuf¨ uhren. Die Konvergenzanalyse dieses Verfahrens kann wieder mit Hilfe der oben schon beschriebenen Energie-Technik“ erfolgen, was hier aber nicht ausgef¨ uhrt werden soll. ”
226
Verfahren f¨ ur hyperbolische Probleme
6.3 Verallgemeinerungen und L¨ osungsaspekte Bei der Anwendung unbedingt stabiler, impliziter Differenzenschemata m¨ ussen in jedem Zeitschritt lineare Gleichungssysteme mit Koeffizientenmatrizen der Form Ih +αk2 Ah gel¨ost werden. Deren Kondition verh¨ alt sich im Falle k ∼ h wie κ2 (Ah ) ∼ 1.
(6.3.28)
Auf solchen gleichf¨ ormigen Gittern sind implizite Verfahren also verh¨altnism¨aßig kosteng¨ unstig. Dies ¨andert sich aber, wenn das Ortsgitter zur Anpassung an irregul¨are L¨osungsstrukturen lokal verfeinert wird.
¨ 6.4 Ubungen
¨ 6.4 Ubungen ¨ Ubung 6.1: ¨ Ubung 6.2:
227
228
Verfahren f¨ ur hyperbolische Probleme
Index 5-Punkte-Operator, 48, 57, 64, 83 7-Punkte-Operator, 50 9-Punkte-Operator gestreckter, 48 kompakter, 48, 84 2 L -Norm-Fehler, 130 L2 -Norm-Fehlersch¨ atzer, 135 L2 -Projektion, 107, 148, 227 L∞ -Norm-Fehler, 109, 130 M -Matrix, 83 V -elliptisch, 72 dG(0)-Verfahren, 208 dG(r)-Verfahren, 207 h/p-Finite-Elemente-Methode, 77 A-orthogonal, 157 A-Stabilit¨at, 190 starke, 190, 196 strenge, 190 Abh¨angigkeitsbereich, 39, 225 Ableitung schwache, 24 verallgemeinerte, 24 Abschneidefehler, 46, 186, 217, 223 Abstiegsrichtung, 156 Abstiegsverfahren, 156 Adaptionsstrategie, 141 ADI-Verfahren, 63, 216, 217 Adini (????-????), 93 Adini-Plattenelement, 93 Allgemeiner St¨ orungssatz, 118 Anfangs-Randwert-Aufgabe, 32 Approximationseigenschaft, 173 Argyris (1916-2004), 92 Argyris-Plattenelement, 92 Assemblierung, 117 Aubin (????-????), 80 Aubin-Nitsche-Trick, 80 Banach (1892-1945), 2 Bandmatrix, 52, 60 Baryzentrische Koordinaten, 122 BDF-Verfahren, 185, 186 Bestapproximationseigenschaft, 74, 107 Bestimmtheitsbereich, 39 Biharmonischer Operator, 7, 21, 91, 120, 151 Bramble (1932-), 100 Bramble-Hilbert-Lemma, 100, 124, 210 Cauchy (1789-1857), 11
Cauchy-Problem, 11, 223 CFL-Bedingung, 220, 221 CG-Verfahren, 157, 160, 179, 215 quadriertes, 163 Charakteristik, 12 Charakteristisches Polynom, 223 Cholesky (1975-1918), 63 Cholesky-Zerlegung, 63, 215 Courant (1888-1972), 220 Crank (1916-), 185 Crank-Nicolson-Verfahren, 186, 190, 200, 207, 213, 215, 216, 226 ged¨ampftes, 198 Sehnentrapezform, 213 Tangententrapezform, 213 D¨ampfung, 172 Defekt, 155 Defektgleichung, 169 Defektkorrektur-Iteration, 61 Diagonaldominanz erweiterte , 52 irreduzible, 53 Differentialgleichung 2. Ordnung, 10 gew¨ohnliche, 10 lineare, 9 nichtlineare, 9, 15 Differentialoperator elliptischer, 12 hyperbolischer, 12 parabolischer, 12 Differenzenappoximation, 45 Differenzengleichung, 223 Differenzenoperatoren, 45 Differenzenverfahren A(0)-stabil, 185 explizit, 182 implizit, 182 Diffusions-Transport-Gleichung, 72 Dirac (1902-1984), 111 Dirac-Funktion, 111 Direkte Methode, 18 Dirichlet (1805-1859), 15 Divergenz, 1 Du Fort (????-????), 195 Du Fort-Frankel-Verfahren, 195 Duale L¨osung, 132 Duales Problem, 132 229
230
Dualit¨atsargument, 80, 208 Eckensingularit¨ at, 23, 43, 146 Effektivit¨atsindex, 133, 139 Eigenwerte, 68 Eigenwertproblem, 31 Einschrittverfahren, 182 Element-(Last)-Vektor, 117 Element-(Steifigkeits)-Matrix, 117 Energie, 39 Energie-Form, 167, 181 Energie-Methode, 36, 199 Energie-Norm, 18, 74, 155 Energieerhaltung, 219 Energiefunktional, 71 Energienorm-Fehler, 80, 130 Energienorm-Fehlersch¨ atzer, 134 Erhaltungsgleichung, 40 Euklid (ca. 355-290 v. Chr.), 1 Euklidische Vektornorm, 1 Euklidisches Produkt, 1 Euler (1707-1783), 183 Explizites Euler-Verfahren, 185, 192 F-Zyklus, 171, 215 Fehler lokaler, 114 Fehlerbalancierungs-Strategie, 141 Fehlerfunktional, 131 Fehlerindikator, 140 Fest-Raten-Strategie, 142 Finite Elemente, 77 bi-kubisch, 93, 94 bi-linear, 92 bi-quadratisch, 92 isoparametrisch, 96 konform, 89 konstant, 89 kubisch, 91, 150 linear, 78, 89, 93 nicht-konform, 89 parametrisch, 96 quadratisch, 90, 93 quartisch, 91 quintisch, 92 tri-linear, 94 tri-quadratisch, 94 Finite-Elemente-Interpolierende, 89 Finite-Elemente-Raum, 207
INDEX
Fixpunktiteration, 62 Formfunktion, 77 Formregularit¨at, 78 Fourier (1768-1830), 31 Fourier-Entwicklung, 31 Frankel (????-????), 195 Friedrichs (1901-1982), 220 Galerkin (1871-1945), 75 Galerkin-Gleichungen, 158 Galerkin-Orthogonalit¨at, 208 Galerkin-Verfahren, 75 Gauß-Seidel-Verfahren, 63 Gaußsches Eliminationsverfahren, 61 Gauß (1777-1855), 2 Geschachteltes Mehrgitterverfahren, 171 Gitterfeinheit, 45 Gitternumerierung diagonale, 60 Schachbrett, 61 zeilenweise, 60 Gitteroptimierung, 142 Gittersteuerung, 139 Gittertransfer, 171 Gl¨atter, 171 Gl¨attungseigenschaft, 36, 173, 190, 196, 198, 213 Gl¨attungsiteration, 167 Gr¨oßenregularit¨at, 78 Gradient, 1 Gradientenverfahren, 157 Gram (1850-1916), 158 Gram-Schmidt-Algorithmus, 158 Green (1793-1841), 2 Greensche Funktion, 17, 111, 112 Greensche Identit¨at, 56 Grobgitteroperatoren, 171 Grobgitterproblem, 168 H¨angender Knoten, 227 H¨older (1859-1937), 2 H¨oldersche Ungleichung, 2, 27 Hadamard (1865-1963), 9 Halbbandbreite, 52 Halbgruppen-Methode, 36 Hauptteil, 12, 13 Hermite (1822-1901), 88 Hermite-Element, 88 Hestenes (1906-1991), 157
INDEX
Hilbert (1862-1943), 2 Hilbert (????-), 100 ILU-Verfahren, 63 Implizites Euler-Verfahren, 185, 186, 202, 207 Integralformel von Green, 2 Integralsatz von Gauß, 2 Interpolationsabsch¨ atzung, 101, 103 Interpolationskonstante, 208, 210 Interpolierende, 79 Inverse Beziehung, 105 Inverse Monotonie, 54, 193 inverse Monotonie, 68 Iterationsmatrix, 62 Jacobi (1804-1851), 62 Jacobi-Verfahren, 62 Jordan (1838-1922), 11 Kantenresiduum, 132 Kegelschnitt, 12 klassische L¨ osung, 32 Knoten, 78 Knotenbasis, 79 Knotenbasisfunktion, 79 Knotenfunktional, 88 Knotenwert, 78, 88 Koerzitivit¨at, 72 Konditionierung, 118, 151 Konditionszahl, 68 Konformit¨at, 89 Konsistenz, 46, 186 Konsistenzordnung, 46 Kontinuit¨atsgleichung, 5 Konvergenz, 57 Konvergenzordnung, 46, 67 Konvergenzrate, 62 Koordinatenrelaxation, 157 Kovalevskaya (1850-1891), 15 Kronecker (1823-1891), 56 Kronecker-Symbol, 56 Krylov (1879-1955), 155 Krylow-Raum, 158 Krylow-Raum-Methode, 155 Kutta (1867-1944), 207 L¨osung klassische, 16 schwache, 19, 43
231
L¨osungskomplexit¨at, 214 Lagrange (1736-1813), 79 Lagrange-Basis, 79 Lagrange-Element, 88 Lagrange-Hermite-Interpolation, 103 Lagrange-Interpolation, 79 Laplace (1749-1827), 1 Laplace-Operator, 1, 13, 30, 43, 48, 59, 155 Lastvektor, 116, 201 Lax (????-), 73 Lax-Milgram-Lemma, 73 Lebesgue (1875-1941), 23 Lebesgue-Raum, 26 Legendre (1752-1833), 158 Legendre-Polynom, 158 Lewy (????-????), 220 Line Search, 156 Linienmethode, 181, 185 M-Matrix, 54, 68, 193, 206 Mass-Lumping, 206 Massematrix, 116, 182, 201, 227 Matrix diagonal-dominant, 83 von nicht-negativem Typ, 52, 83 Matrizennorm, 1 Maximumnorm, 2 Maximumprinzip, 20, 112 diskretes, 53 elliptisches, 20 f¨ ur finite Elemente, 83 parabolisches, 34 Maximumprinzipmethode, 192 Mehrgitter-Zyklus, 168 Mehrgitterverfahren, 166, 215 Mehrstellenformel, 67 Milgram (????-????), 73 Minimalfolge, 18 Mittelpunktregel, 123 Mittelpunkts-Verfahren, 185 Monombasis, 77 Morley (????-????), 90 Morley-Plattenelement, 90 Multiindex, 98 Nabla-Operator, 1 Nachgl¨attung, 169 Navier (1785-1836), 5 Navier-Stokes-Gleichungen, 5
232
Neumann, von (1903-1957), 16 Nicolson (1917-1968), 185 Nitsche (1926-1996), 80 Normaleneinheitsvektor, 1 Numerische Dissipativit¨ at, 190 Numerische Integration, 121, 125, 151 Operator kompakt, 31 positiv-definit, 31 symmetrisch, 31 Orthonormalsystem, 173 Orts-Zeit-Diskretisierung, 184 Pad´e (1785-1836), 189 Pad´e-Schema, 189 Pad´e-Tafel, 189 Parallelogrammidentit¨ at, 18 Parseval (1755-1836), 37 Parsevalsche Identit¨ at, 37 Partielle Ableitung, 1 PCG-Verfahren, 163 Petrow (1912-1987), 75 Petrow-Galerkin-Verfahren, 75, 207 Plattengleichung, 7 Poincar´e (1854-1912), 3 Poincar´esche Ungleichung, 3, 27, 42, 43, 100 Poisson (1781-1840), 4 Poisson-Gleichung, 4, 7, 13, 15, 71, 109 Pollution-Effekt, 146 Polygonzugmethode, 183 Projektionsmethode, 74 Prolongation, 168, 169 Punktfehler-Sch¨ atzer, 137 Punktgitter, 45 Quadraturfehler, 124 Quadraturformel, 122 R¨ uckw¨artsdifferenzenformel, 185 Randbedingungen Dirichletsche, 15, 32, 71 nat¨ urliche, 72 Neumannsche, 16, 32, 72 Robinsche, 16, 32, 72 Randwertaufgabe, 15, 42 Referenzelement, 94, 102, 117 Referenztransformation, 95 Rellichscher Auswahlsatz, 30
INDEX
Residuum, 132 Restriktion, 168, 169 Reynolds (1842-1912), 5 Richardson (1881-1953), 62 Richardson-Verfahren, 62, 166, 168, 180, 195 Riemann (1826-1866), 16 Riesz (1880-1956), 73 Rieszscher Darstellungssatz, 73 Ritz (1878-1909), 74 Ritz-Projektion, 108, 202, 227 Ritzsche Projektions-Verfahren, 74 Robin 1855-1897, 16 Rothe (1895-1988), 184 Rothe-Methode, 184, 201, 226 Runge (1856-1927), 207 Runge-Kutta-Verfahren, 207 Satz Geschachteltes Mehrgitterverfahren, 178 Mehrgitterkomplexit¨at, 177 Mehrgitterkonvergenz, 175 von Cauchy-Kovalevskaya, 15 von Lax-Milgram, 147 Schlitzgebiet, 23 Schmidt (1876-1959), 158 Schnelle Fourier-Transformation, 61 Schrittweitensteuerung, 206 Seidel, von (1821-1896), 63 Separabilit¨at, 216 Shortley (1910-), 49 Shortley-Weller-Approximation, 49, 53, 58, 60, 67, 81 Simplex, 95 Simpson-Verfahren, 186 Sobolew (1908-1989), 19 Sobolew-Raum, 18, 24, 26, 71 Sobolewsche Ungleichung, 29, 44 Sobolow-Raum, 43 SOR-Verfahren, 63 Spektral-Elemente-Methode, 77 Spektral-Galerkin-Verfahren, 77 Spektral-Methode, 36, 195 Spektral-Theorie, 30 Spektralkondition, 160, 215 Spektralnorm, 194 Spektralverfahren, 77 Spezieller St¨orungssatz, 120 Splitting-Methode, 216
INDEX
Spur-Absch¨ atzung, 28 Spur-Lemma, 28 Stabilit¨at, 46 Startwert, 213 Steifigkeitsmatrix, 116, 182, 201, 227 Stiefel (1909-1978), 157 Stokes (1819-1903), 5 Strukturregularit¨ at, 78 Taylor (1685-1731), 10 Taylor-Reihe, 10 Teilschritt-θ-Verfahren, 191 Tensorprodukt-Basis, 77 Tensorprodukt-Gauß-Formel, 124 Tensorprodukt-Simpson-Regel, 124 Tensorprodukt-Trapezregel, 148 Tensorproduktformel, 123 Transfermatrix, 201 Trapezregel, 123 Triangulierung, 78 Tschebyscheff (1821-1894), 161 Tschebyscheff-Approximation, 161 Typeneinteilung, 10, 41 Unisolvenz, 88, 98, 149, 153 Unstetiges Galerkin-Verfahren, 207 V-Zyklus, 170 Variablenseparation, 33 Variationelle Formulierung, 72, 181, 226 Variationsgleichung, 6, 72, 74 Verfeinerungstrategie Fehler¨aquilibrierung, 142 Vertr¨aglichkeit, 46 Vieta (1540-1603), 13 Vietascher Wurzelsatz, 13 Von Neumannsche Methode, 193 Von Neumannsche Stabilit¨ atsanalyse, 195 Vorgl¨attung, 169 Vorkonditionierung, 62, 163 ADI, 165 Diagonal, 164 ICCG, 164 SSOR, 164 W-Zyklus, 170 W¨armeleitungsgleichung, 4, 5, 14, 32, 181, 211 Wellengleichung, 4, 7, 14, 38, 219, 226 Weller (????-????), 49
233
Wilson (????-????), 93 Wilson-Plattenelelement, 93 Wohl-gestellt, 9, 15 Zeilensummenkriterium schwaches, 53 Zeitschrittverfahren, 185 Zeitschrittweite, 182, 206, 219 Zelle, 77 Zellgewicht, 133 Zellresiduum, 132 Zusammenhang, 52 Zweigittermethode, 170 Zweigitteroperator, 172 Zweischrittformel, 219 Zweischrittverfahren, 182