Mathematik fuer Ingenieure und Naturwissenschaftler

Lothar Papula Mathematik fur Ingenieure und Naturwissenschaftler Band 3 Die drei Sande Mathematik fur Ingenieure und ...

Author: Lothar Papula

1813 downloads 5843 Views 71MB Size Report

This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form

DOWNLOAD PDF

Lothar Papula Mathematik fur Ingenieure und Naturwissenschaftler Band 3

Die drei Sande Mathematik fur Ingenieure und Naturwissenschaftler werden durch eine Formelsammlung, ein Such mit Klausur- und Obungsaufgaben sowie ein Such mit Anwendungsbeispielen zu einemLehr- und Lernsystern erganzt: Lothar Papula Mathematische Formelsammlung fur Ingenieure und Naturwissenschaftler Mit zahlreichen Abbildungen und Rechenbeispielen und einer ausfuhrllchen Integraltafel

Mathematik fur Ingenieure und Naturwissenschaftler Klausur- und Obungsaufgaben Mathematik fur Ingenieure und Natufwissenschaftler Anwendungsbeispiele Aufgabenstellungen aus Naturwissenschaft und Technik mit ausfuhrlichen L6sungen

www.viewegteubner.de

---'

Lothar Papula

Mathematik fur Ingenieure und Naturwissenschaftler Band 3 Vektoranalysis, Wahrscheinlichkeitsrechnung, Mathematische Statistik, Fehler- und Ausgleichsrechnung 5., verbesserte und erweiterte Auflage Mit 549 Abbildungen, zahlreichen Beispielen aus Naturwissenschaft und Technik sowie 285 Obungsaufgaben mit ausHihrlichen L6sungen STUDIUM

VIEWEG+ TEUBNER

Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet uber abrufbar.

1. 2., 3., 4., 5.,

Auflage 1994 verbesserte Auflage 1997 verbesserte Auflage 1999 verbesserte Auflage Mai 2001 verbesserte und erweiterte Auflage 2008

Aile Rechte vorbehalten © Vieweg +Teubner Verlag I GWV Fachverlage GmbH, Wiesbaden 2008 Lektorat: Thomas Zipsner Der Vieweg+Teubner Verlag ist ein Unternehmen von Springer Science+Business Media. www.viewegteubner.de Das Werk einschlieBlich aller seiner Teile ist urheberrechtlich geschutzt. Jede Verwertung auBerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulassig und strafbar. Das gilt insbesondere fur Vervielfaltigungen, Obersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten waren und daher von jedermann benutzt werden diirften. Technische Redaktion: Gabriele McLemore, Wiesbaden Umschlaggestaltung: Kiinkelt.opka Medienentwicklung, Heidelberg Satz: Druckhaus Thomas Mimtzer, Bad Langensalza Druck und buchbinderische Verarbeitung: Teslnska Tiskarna, a. s., Tschechien Gedruckt auf saurefreiern und chlorfrei gebleichtem Rapier. Printed in Czech Republic ISBN 978-3-8348-0225-5

v Vorwort

Das dreibandige Werk Mathematik fur Ingenieure und Naturwissenschaftler ist ein Lehr- und Arbeitsbuch fur das Grund- und Hauptstudium der naturwissenschaftlichtechnischen Disziplinen im Hochschulbereich. Es wird durch eine mathematische Formelsammlung und ein Ubungsbuch mit ausschlieBlich anwendungsorientierten Aufgaben zu einem kompakten Lehr- und Lernsystem erganzt. Die Bande 1 und 2 lassen sich dem Grundstudium zuordnen, wahrend der vorliegende dritte Band spezielle Themen aus dem Hauptstudium behandelt. In der aktuellen 5. Auflage wurden aIle bekannt gewordenen Fehler berichtigt und das Kapitel Fehler- und Ausgleichsrechnung geringfugig erweitert.

Zur Stoffauswahl des dritten Bandes In diesem Band werden die folgenden im Hauptstudium wichtigen mathematischen Stoffgebiete behandelt: • Vektoranalysis: Kurven und Flachen, Skalar- und Vektorfelder, Gradient, Divergenz und Rotation, spezielle ebene und raumliche Koordinatensysteme, Linien- oder Kurvenintegrale, Oberflachenintegrale, Integralsatze von GauB und Stokes

• Wahrscheinlichkeitsrechnung: Kombinatorik, Zufallsexperimente, Wahrscheinlichkeiten, Zufallsvariable, Wahrscheinlichkeitsverteilung einer Zufallsvariablen, Kennwerte oder MaBzahlen einer Verteilung, spezielle Wahrscheinlichkeitsverteilungen wie z. B. Binomial-, Poisson- oder GauBverteilung, Verteilungen von mehreren ZufaIlsvariablen, Pruf- oder Testverteilungen wie z. B. Chi-Quadrat- oder t-Verteilung • Grundlagen der mathematischen Statistik: Zufallsstichproben, Haufigkeitsverteilungen, Kennwerte oder MaBzahlen einer Stichprobe, Parameterschatzungen, Parametertests, Anpassungs- oder Verteilungstests wie z. B. der Chi-Quadrat-Test, Korrelation und Regression • Fehler- und Ausgleichsrechnung: .Fehlerarten" und MeBabweichungen, statistische Verteilung der MeBwerte und MeBabweichungen, Auswertung einer MeBreihe, Vertrauensbereiche, .Fehlerfortpflanzung" nach GauB (Varianzfortpflanzungsgesetz), Ausgleichs- oder Regressionskurven • 1m Anhang (Teil A) findet der Leser wichtige Tabellen zur Wahrscheinlichkeitsrechnung und Statistik (benutzerfreundlich auf farbigem Papier gedruckt).

Zur Darstellung des Stoffes Auch in diesem Band wird eine anschauliche, anwendungsorientierte und leicht verstandliche Darstellungsform des mathematischen Stoffes gewahlt, Begriffe, Zusammenhange, Satze und Formeln werden durch zahlreiche Beispiele aus Naturwissenschaft und Technik und anhand vieler Abbildungen naher erlautert.

VI

Zur aulleren Form Zentrale Inhalte wie Definitionen, Satze, Formeln, Tabellen, Zusammenfassungen und Beispiele sind besonders hervorgehoben:

• Definitionen und Satze, Formeln und Zusammenfassungen sind gerahmt und grau unterlegt. • Tabellen sind gerahmt und teilweise grau unterlegt. • Anfang und Ende eines Beispiels sind durch das Symbol _ gekennzeichnet. Bei der (bildlichen) Darstellung von Flachen und raumlichen Korpern werden Grauraster unterschiedlicher HeIligkeit verwendet, urn besonders anschauliche und aussagekraftige Bilder zu erhalten.

Zum Einsatz von Computeralgebra-Programmen In zunehmendem MaBe werden leistungsfahige Computeralgebra-Programme wie z. B. DERIVE, MATHCAD oder MATHEMATICA bei der mathematischen Losung kompakter naturwissenschaftlich-technischer Probleme in Praxis und Wissenschaft erfolgreich eingesetzt. Solche Programme konnen bereits im Grundstudium ein nutzliches und sinnvolles Hilfsmittel sein und so z. B. als eine Art .Kontrollinstanz" beim Losen von Ubungsautgaben verwendet werden (Uberprufung der von Hand ermittelten Losungen mit Hilfeeines Computeralgebra-Programms auf einem PC). Die meisten der in diesem Werk gestellten Aufgaben lassen sich auf diese Weise problemlos losen.

Eine Bitte .des Autors Fur Hinweise und Anregungen - insbesondere auch aus dem Kreis der Studierenden bin ich stetsdankbar, Sie sindeine unverzichtbare Voraussetzung und Hilfe fur die stetige Verbesserung des Lehrwerkes.

Ein Wort des Dankes ... · .. an aIle Fachkollegen und Studierenden, die durch Anregungen und Hinweise zur Verbesserung dieses Werkes beigetragen haben, · .. an die Mitarbeiterdes Verlages, ganz besonders aber an Herro Thomas Zipsner und Herro Ewald Schmitt, fur die hervorragende Zusammenarbeit wahrend der Entstehung und Drucklegung dieses Werkes.

Wiesbaden, im Friihjahr 2008

Lothar Papula

VII

Inhaltsverzeichnis

I ·Vektoranalysis

1

1 Ebene und raumliche Kurven . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.1 Vektorielle Darstellung einer Kurve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Differentiation eines Vektors nach einem Parameter . . . . . . . . . . . . . . . . . . . 1.2.1 Ableitung eines Vektors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Geschwindigkeits- und Beschleunigungsvektor eines Massenpunktes 1.3 Bogenlange einer Kurve 1.4 Tangenten- und Hauptnormaleneinheitsvektor 1.5 Kriimmung einer Kurve 1.6 Ein Anwendungsbeispiel: Zerlegung von Geschwindigkeit und Beschleunigung in Tangential- und Normalkomponenten

1 4 4

2 Flachen im Raum

2.1 2.2 2.3 2.4

9 12 16 21 27 31

Vektorielle Darstellung einer Flache Flachenkurven Tangentialebene, Flachennormale, Flachenelement . . . . . . . . . . . . . . . . . . . . Flachen vom Typ z = f't»; y)

31 35 37 43

3 Skalar- und Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

47

3.1 3.2 3.3 3.4

Ein einfiihrendes Beispiel Skalarfelder Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . Spezielle Vektorfelder aus Physik und Technik 3.4.1 Homogenes Vektorfeld 3.4.2 Kugelsymmetrisches Vektorfeld (Zentralfeld) . . . . . . . . . . . . . . . . . . . . 3.4.3 Zylindersymmetrisches Vektorfeld 3.4.4 Zusammenstellung der behandelten Vektorfelder

47 50 51 55 55 56 58 60

4 Gradient eines Skalarfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

Definition und Eigenschaften des Gradienten Richtungsableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Flachen vom Typ F(x; y; z) = 0 Ein Anwendungsbeispiel: Elektrisches Feld einer Punktladung

61 65 67 69

4.1 4.2 4.3 4.4

VIII

Inhaltsverzeichnis

5 Divergenz und Rotation eines Vektorfeldes 5.1 Divergenz eines Vektorfeldes 5.1.1 Ein einfiihrendes Beispiel .. . . . 5.1.2 Definition und Eigenschaften der Divergenz 5.1.3 Ein Anwendungsbeispiel: Elektrisches Feld eines homogen geladenen Zylinders 5.2 Rotation eines Vektorfeldes '.................... 5.2.1 Definition und Eigenschaften der Rotation 5.2.2 Ein Anwendungsbeispiel: Geschwindigkeitsfeld einer rotierenden Scheibe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Spezielle Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Quellenfreies Vektorfeld 5.3.2 Wirbelfreies Vektorfeld 5.3.3 Laplace- und Poisson-Gleichung 5.3.4 Ein Anwendungsbeispiel: Potentialgleichung des elektrischen Feldes . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Spezielle ebene und raumliche Koordinatensysteme 6.1 Polarkoordinaten 6.1.1 Definition und Eigenschaften der Polarkoordinaten . . . . . . . . . . . . . . 6.1.2 Darstellung eines Vektors in Polarkoordinaten 6.1.3 Darstellung von Gradient, Divergenz, Rotation und LaplaceOperator in Polarkoordinaten 6.1.4 Ein Anwendungsbeispiel: Geschwindigkeitsvektor bei einer gleichformigen Kreisbewegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.2 Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.2.1 Definition und Eigenschaften der Zylinderkoordinaten 6.2.2 Darstellung eines Vektors in Zylinderkoordinaten 6.2.3 Darstellung von Gradient, Divergenz, Rotation und LaplaceOperator in Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.2.4 Zylindersymmetrische Vektorfelder 6.2.5 Ein Anwendungsbeispiel: Geschwindigkeitsvektor eines Massenpunktes in Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3 Kugelkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3.1 Definition und Eigenschaften der Kugelkoordinaten 6.3.2 Darstellung eines Vektors in Kugelkoordinaten . . . . . . . . . . . . . . . . .. 6.3.3 Darstellung von Gradient, Divergenz, Rotation und LaplaceOperator in Kugelkoordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.3.4 Kugelsymmetrische Vektorfelder (Zentralfelder) 6.3.5 Ein Anwendungsbeispiel: Potential und elektrische Feldstarke in der Umgebung einer geladenen Kugel

71 71 71 75 78 79 79 83 85 85 86 88 92 92 92 92 94 100 103 105 105 110 115 118 120 122 122 128 134 136 139

Inhaltsverzeichnis

IX

7 Linien- oder Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

7.1 7.2 7.3 7.4

Ein einfiihrendes Beispiel Definition eines Linien- oder Kurvenintegrals Berechnung eines Linien- oder Kurvenintegrals . . . . . . . . . . . . . . . . . . . . . .. Wegunabhangigkeit eines Linien- oder Kurvenintegrals. Konservative Vektorfelder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7.5 Anwendungsbeispiele aus Physik und Technik . . . . . . . . . . . . . . . . . . . . . . .. 7.5.1 Kugelsymmetrische Vektorfelder (Zentralfelder) 7.5.2 Magnetfeld eines stromdurchflossenen linearen Leiters 7.5.3 Elektrisches Feld eines geladenen Drahtes 7.6 Arbeitsintegral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7.6.1 Arbeit eines Kraftfeldes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7.6.2 Ein Anwendungsbeispiel: Elektronen im Magnetfeld

8 Oberflachenintegrale

142 145 147 151 159 159 160 161 163 163 164 166

8.1 Ein einfiihrendes Beispiel 8.2 Definition eines Oberflachenintegrals 8.3 Berechnung eines Oberflachenintegrals 8.3.1 Oberflachenintegral in speziellen Koordinaten . . . . . . . . . . . . . . . . . .. 8.3.2 Oberflachenintegral in Flachenparametern .... ~ . . . . . . . . . . . . . . . .. 8.4 Anwendungsbeispiele aus Physik und Technik . . . . . . . . . . . . . . . . . . . . . . .. 8.4.1 FluB eines homogenen Vektorfeldes durch die Oberflache eines Wiirfels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 8.4.2 FluB eines zylindersymmetrischen Vektorfeldes durch die Oberflache eines Zylinders 8.4.3 FluB eines kugelsymmetrischen Vektorfeldes durch die Oberflache einer Kugel 9 Integralsatze von GauB und Stokes

166 171 173 174 186 191 191 195 198 201

9.1 GauBscher Integralsatz 9.1.1 Ein einfuhrendes Beispiel 9.1.2 GauBscher Integralsatzim Raum 9.1.3 GauBscher Integralsatz in der Ebene . . . . . . . . . . . . . . . . . . . . . . . . . .. 9.2 Stokes'scher Integralsatz 9.3 Anwendungsbeispiele aus Physik und Technik . . . . . . . . . . . . . . . . . . . . . . .. 9.3.1 Elektrisches Feld eines homogen geladenen Zylinders 9.3.2 Magnetfeld eines stromdurchflossenen linearen Leiters Ubungsaufgaben Zu Abschnitt 1 Zu Abschnitt 2 Zu Abschnitt 3 Zu Abschnitt 4 Zu Abschnitt 5 Zu Abschnitt 6

142

'. . . . . . . . . . . . . . . . . . . . . . . . ..

201 201 203 207 210 217 217 222 226 226 228 230 232 233 235

x

Inhaltsverzeichnis Zu Abschnitt 7 Zu Abschnitt 8 Zu Abschnitt 9

238 241 245

II Wahrscheinlichkeitsrechnung

249

1 Hilfsmittel aus der Kombinatorik

249

1.1 1.2 1.3 1.4 1.5

U rnenmodell Permutationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Kombinationen Variationen /. . . . . . . . . . . . . . .. Tabellarische Zusammenstellung der wichtigsten Formeln . . . . . . . . . . . . ..

2 Grundbegriffe

2.1 2.2 2.3 2.4 2.5

Einfiihrende Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Zufallsexperimente Elementarereignisse und Ergebnismenge eines Zufallsexperiments Ereignisse und Ereignisraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Verkniipfungen von Ereignissen

3 Wahrscheinlichkeit

3.1 Laplace-Experimente 3.2 Wahrscheinlichkeitsaxiome 3.2.1 Eigenschaften der relativen Haufigkeiten 3.2.2 Wahrscheinlichkeitsaxiome von Kolmogoroff 3.2.3 Festlegung unbekannter Wahrscheinlichkeiten in der Praxis ("statistische" Definition der Wahrscheinlichkeit) . . . . . . . . . . . . . . .. 3.2.4 Wahrscheinlichkeitsraum (. . . . . . . . . . . . . . . . . . . . . . .. 3.3 Additionssatz fur beliebige Ereignisse . . . . . . . . . . . .. 3.4 Bedingte Wahrscheinlichkeit 3.5 Multiplikationssatz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.6 Stochastisch unabhangige Ereignisse 3.7 Ereignisbaume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.8 Totale Wahrscheinlichkeit eines Ereignisses und Bayes'sche Formel ..... 4 Wahrscheinlichkeitsverteilung einer Zufallsvariablen

4.1 Zufallsvariable oder Zufallsgrolsen 4.1.1 Einfiihrende Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.1.2 Definition einer Zufallsvariablen 4.2 Verteilungsfunktion einer Zufallsvariablen 4.3 Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariablen (diskrete Verteilung) 4.4 Wahrscheinlichkeitsverteilung einer stetigen Zufallsvariablen (stetige Verteilung)

249 250 253 258 262 262 262 266 267 268 270 274 274 279 279 282 284 285 288 290 293 297 300 306 313 313 313 315 316 317 325

Inhaltsverzeichnis

XI

5 Kennwerte oder Ma8zahlen einer Wahrscheinlichkeitsverteilung . . . . . . . . . . . . ..

332

5.1 Erwartungswert einer Zufallsvariablen 5.1.1 Ein einfiihrendes Beispiel 5.1.2 Erwartungswert einer diskreten Zufallsvariablen . . . . . . . . . . . . . . . .. 5.1.3 Erwartungswert einer stetigen Zufallsvariablen 5.2 Erwartungswert einer Funktion 5.3 Mittelwert, Varianz und Standardabweichung einer diskreten Zufallsvariablen 5.4 Mittelwert, Varianz und Standardabweichung einer stetigen Zufallsvariablen 5.5 Mittelwert und Varianz einer linearen Funktion

333 333 333 334 336

6 Spezielle Wahrscheinlichkeitsverteilungen

6.1 6.2 6.3 6.4

Binomialverteilung Hypergeometrische Verteilung Poisson-Verteilung GauBsche Normalverteilung 6.4.1 Allgemeine Normalverteilung . . . . . . . . . . . . . . . . . . . . .. . .. 6.4.2 Standardnormalverteilung , 6.4.3 Erlauterungen zur tabellierten Verteilungsfunktion der Standardnormalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.4.4 Berechnung von Wahrscheinlichkeiten mit Hilfe der tabellierten Verteilungsfunktion der Standardnormalverteilung . . . . . . . . . . . . . .. 6.4.5 Quantile der Standardnormalverteilung 6.5 Zusammenhang zwischen der Binomialverteilung und der Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6.6 Tabellarische Zusammenstellung der wichtigsten Wahrscheinlichkeitsverteilungen 6.7 Approximation einer diskreten Verteilung durch eine andere Verteilung, insbesondere durch die Normalverteilung . .. . . . . . . . . . . . . . . . . . . . . . . . .. 7 Wahrscheinlichkeitsverteilungen von mehreren Zufallsvariablen

7.1 Ein einfuhrendes Beispiel .....'.................................... 7.2 Zweidimensionale Wahrscheinlichkeitsverteilungen . . . . . . . . . . . . . . . . . . .. 7.2.1 Verteilungsfunktion einer zweidimensionalen Zufallsvariablen 7.2.2 Diskrete zweidimensionale Verteilung 7.2.3 Stetige zweidimensionale Verteilung 7.3 Stochastisch unabhangige Zufallsvariable . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7.4 Funktionen von mehreren Zufallsvariablen 7.5 Summen und Produkte von Zufallsvariablen 7.5.1 Additionssatz fur Mittelwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 7.5:2 Multiplikationssatz fur Mittelwerte 7.5.3 Additionssatz fur Varianzen 7.5.4 Eigenschaften einer Summe von stochastisch unabhangigen und normalverteilten Zufallsvariablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

337 341 344 346 346 357 363 367 367 370 372 374 384 386 394 394 397 397 400 400 402 405 411 417 419 419 421 424 427

XII

Inhaltsverzeichnis

7.6 Uber die groBe Bedeutung der GauBschen Normalverteilung in den Anwendungen 7.6.1 Zentraler Grenzwertsatz 7.6.2 Wahrscheinlichkeitsverteilung einer Summevon Zufallsvariablen .. 7.6.3 Grenzwertsatz von Moivre-Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . ..

g Pruf- oder Testverteilungen 8.1 Chi-Quadrat-Verteilung 8.2 t- Verteilung von Student

430 430 432 434 435 435 440

Ubungsaufgaben

Zu Zu Zu Zu Zu Zu Zu

Abschnitt 1 Abschnitt 2 Abschnitt 3 Abschnitt 4 Abschnitt 5 Abschnitt 6 Abschnitt 7

445 447 448 451 453 456 460

III Grundlagen der mathematischen Statistik

465

1 Grundbegriffe

465

1.1 Ein einfuhrendes Beispiel 1.2 Zufallsstichproben aus einer Grundgesamtheit 1.3 Haufigkeitsverteilung einer Stichprobe 1.3.1 Haufigkeitsfunktion einer Stichprobe 1.3.2 Verteilungsfunktion einer Stichprobe . . . . . . . . . . . . . . . . . . . . . . . . . .. 1.3.3 Gruppierung der Stichprobenwerte bei umfangreichen Stichproben (Einteilung in Klassen) 2 Kennwerte oder Mafizahlen einer Stichprobe

465 466 468 468 471 473 479

2.1 Mittelwert, Varianz und Standardabweichung einer Stichprobe 480 2.2 Spezielle Berechnungsformeln fiir die Kennwerte einer Stichprobe . . . . . .. 483 2.2.1 Berechnung der Kennwerte unter Verwendung der Haufigkeitsfunktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. .483 2.2.2 Berechnung der Kennwerte einer gruppierten Stichprobe 485 3 Statistische Schatzmethoden fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Parameterschiitzungen") .. . . . . . . . . . . . . . . . . . . . . .. . . . ..

3.1 Aufgaben der Parameterschatzung 3.2 Schatzfunktionen und Schatzwerte fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Punktschatzungen") 3.2.1 Ein einfuhrendes Beispiel 3.2.2 Schatz- und Stichprobenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . ..

487 487 488 489 489

Inhaltsverzeichnis 3.2.3 Schatzungen fur den Mittelwert J.1 ••••••••••••••••••••••••••••• 3.2.4 Schatzungen fur die Varianz (J2 ••••••••••••••••••••••••••••••• 3.2.5 Schatzungen fur einen Anteilswert p (Parameter p einer Binomialverteilung) 3.2.6 Tabellarische Zusammenstellung der wichtigsten Schatzfunktionen und ihrer Schatzwerte 3.3 Ein Verfahren zur Gewinnung von Schatzfunktionen . . . . . . . . . . . . . . . . .. 3.3.1 Maximum-Likelihood-Methode 3.3.2 Anwendungen auf spezielle Wahrscheinlichkeitsverteilungen . . . . . .. 3.3.2.1 Binomialverteilung 3.3.2.2 Poisson-Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.3.2.3 GauBsche Normalverteilung 3.4 Vertrauens- oder Konfidenzintervalle fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Intervallschatzungen") 3.4.1Vertrauens- oder Konfidenzintervalle und statistische Sicherheit 3.4.2 Vertrauensintervalle fur den unbekannten Mittelwert J.1 einer Normalverteilung bei bekannter Varianz (J2 • • •• • • • • • • • • • • • • • • • •• 3.4.3 Vertrauensintervalle fur den unbekannten Mittelwert J.1 einer Normalverteilung bei unbekannter Varianz (J2 •••••••••••••••••• 3.4.4 Vertrauensintervalle fiir die unbekannte Varianz (J2 einer Normalverteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.4.5 Vertrauensintervalle fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) . . . . . . . . . . . . . . . . . . . . . . . .. 3.4.6 Vertrauensintervalle fur den unbekannten Mittelwert J.1 einer beliebigen Verteilung 4 Statistische Prufverfahren fur die unbekannten Parameter einer WahrscheinIichkeitsverteilung ("Parametertests")

4.1 4.2 4.3 4.4 4.5

Ein einfiihrendes Beispiel Statistische Hypothesen und Parametertests . . . . . . . . . . . . . . . . . . . . . . . . .. Planung und Durchfiihrung eines Parametertests Mogliche Fehlerquellen bei einem Parametertest . . . . . . . . . . . . . . . . . . . . .. Spezielle Parametertests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 4.5.1 Tests fur den unbekannten Mittelwert J.1 einer Normalverteilung bei bekannter Varianz (J2 • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • • •• 4.5.2 Tests fur den unbekannten Mittelwert J.1 einer Normalverteilung bei un bekannter Varianz (J2 •••••••••••••••••••••••••••••••••• 4.5.3 Tests fur die Gleichheit der unbekannten Mittelwerte J.11 und J.12 zweier N ormalverteilungen (Differenzentests) 4.5.3.1 Abhangige und unabhangige Stichproben . . . . . . . . . . . . . . .. 4.5.3.2 Differenzentests bei abhangigen Stichproben 4.5.3.3 Differenzentests bei unabhangigen Stichproben 4.5.4 Tests fur die unbekannte Varianz (J2 einer Normalverteilung 4.5.5 Tests fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) 4.6 Ein Anwendungsbeispiel: Statistische Qualitatskontrolle unter Verwendung von Kontrollkarten

XIII 492 493 494 494 497 498 500 500 502 505 508 508 512 519 524 528 533

534 534 538 539 544 549 549 558 563 563 565 570 582 587 593

Inhaltsverzeichnis

XIV

5 Statistische Pnifverfahren fur die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung ("Anpassungs- oder Verteilungstests") . . . . . . . . ..

5.1 Aufgaben eines Anpassungs- oder Verteilungstests 5.2 Ein einfuhrendes Beispiel 2 5.3 Chi-Quadrat-Test (" X -Test") 6 Korrelation und Regression

6.1 Korrelation 6.1.1 Korrelationskoeffizient einer zweidimensionalen Stichprobe 6.1.2 Korrelationskoeffizient einer zweidimensionalen Grundgesamtheit . 6.2 Regression

598 598 599 601 614 614 614 624 627

Ubungsaufgaben Zu Abschnitt 1 Zu Abschnitt 2 Zu Abschnitt 3 Zu Abschnitt 4 Zu Abschnitt 5 Zu Abschnitt 6

633 636 636 639 642 643

IV Fehler- und Ausgleichsrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

645

1 "Fehlerarten" (systematische und zufallige Me6abweichungen). Aufgaben der Fehler- undAusgleichsrechnung

645

2 Statistische Verteilung der Me6werte und Me6abweichungen ("Me6fehler")

649

2.1 Haufigkeitsverteiiungen 2.2 Normalverteilte Mebgroben

649 651

3 Auswertung einer Me6reihe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

657

3.1 Mittelwert und Standardabweichung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3.2 Vertrauensbereich fur den Mittelwert 11, MeBunsicherheit, MeBergebnis ..

657 665

4 "Fehlerfortpflanzung" nach Gau6

4.1 4.2 4.3 4.4

Ein einfiihrendes Beispiel Mittelwert einer "indirekten" Mehgrolse GauBsches Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) MeBergebnis fur eine .Jndirekte" Meligrobe

5 Ausgleichs- oder Regressionskurven

5.1 Ein einfiihrendes Beispiel 5.2 Ausgleichung nach der "GauBschen Methode der kleinsten Quadrate" ..

674 674 675 678 682 689 689 691

xv

Inhaltsverzeichnis 5.3 Ausgleichs- oder Regressionsgerade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.3.1 Bestimmung der Parameter einer Ausgleichsgeraden ...,. . . . . . . . . .. 5.3.2 StreuungsmaBe und Unsicherheiten bei der Parameterbestimmung..... 5.4 Ausgleichs- oder Regressionsparabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5.5 Nichtlineare Ausgleichsprobleme, die auf die lineare Regression zuruckfuhrbar sind . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

696 696 704 710 714

Ubungsaufgaben Zu Abschnitt 3 Zu Abschnitt 4 Zu Abschnitt 5

725 727 730

Anhang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

735

Teil A: Tabellen zur Wahrscheinlichkeitsrechnung und Statistik . . . . . . .. 736 Tabelle Tabelle Tabelle Tabelle

1: Verteilungsfunktion ¢ (u) der Standardnormalverteilung ..... 2: Quantile der Standardnormalverteilung . . . . . . . . . . . . . . . . . .. 3: Quantile der Chi-Quadrat- Verteilung '. . . . . . . . . . . .. 4: Quantile der t- Verteilung von "Student" . . . . . . . . . . . . . . . . ..

736 738 740 742

Teil B: Losungen der Ubungsaufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 745 I

Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

746

Abschnitt 1 '. . . . . . . Abschnitt 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Abschnitt 9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

746 747 750 754 756 760 764 768 772

II Wahrscheinlichkeitsrechnung..............................

775

Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt

1....... '. . . . . . . . . . . . . . . . . . . . . . . . . .. 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . .. 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 6 '. . . . . . . . . . . . . . . . . . . . . . . .. 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

775 776 776 779 782 785 789

Inhaltsverzeichnis

XVI

III Grundlagen der mathematischen Statistik . . . . . . . . . . . . . . . . . . .. 793 Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt Abschnitt

1 2 3 4. 5. 6 .... 0

0

0

••

0

0

••••••

••••

0

0

•

0

•••••••••••••

0

••

0

•••

0

0

0

0

•

0

0

•••••••

0

•

0

••

0

•••

0

•••

0

•••

0

0

0

•

0

•

•

0

•

•

•

•

0

•

•

••

0

0

•

0

••••••

0

•••

0

•••

0

0

•

0

•

••••

•

0

•

0

•

o. ••

0

0

0

•••

0

••

0

••

0

0

•

0

•

0

•

0

0

•

•

••

•

0

•

0

•

•

0

0

••

0

0

•

0

0

•

•

•

•

0

•

•

•

•

0

0

•

0

•

•

0

0

•

•

0

•

•

0

•

0

••

0

•

0

0

•

0

••

0

•

•

0

0

•

•

•

•

0

0

•

•

•

0

•

•

•

0

•

•

0

•

•

0

•

•

•

0

•

••

0

0

0

••

0

•

•

•

•

0

•

•

•

•

0

0

•

0

•

0

•

0

0

0

0

0

0

•

•

•

0

•

•

0

0

0

••

0

•••

0

•••••••••••••••••••••••

0

•••

0

•

0

•

•

••

0

••••••

0

0

•

••

Literaturhinweise Sachwortverzeichnis ...

••

•

0

•

0

•

0

0

00

•

0

•

0

•

0

0

•

0

•

0

•

0

0

•

••

•

••

0

•

•••••

0

••

0

0

0

0

•

0

••••••

0

•

0

0

0

0

•

0

0

•

•

•

0

0

0

••

•

0

Abschnitt 3 Abschnitt 4 . . . . . . Abschnitt 5

0

0

•

0

••

•••••••

•••••

0

•

0

0

•

0

•

•

0

0

•••

0

0

0

0

•

0

•

•

0

0

0

0

IV Fehler- und Ausgleichsrechnung .. 0

•••

0

0

0

0

••

••••••••

•••

•••

0

0

•••••••••••••

0

0

•

0

0

0

•••••••

793 799 800 803 809 813 816 816 817 819 825 826

XVII

Inhaltsiibersicht Band 1

Kapitel I:

Allgemeine Grundlagen 1 2 3 4 5 6

Kapitel II:

Einige grundlegende Begriffe tiber Mengen Die Menge der reellen Zahlen Gleichungen U ngleichungen Lineare Gleichungssysteme Der Binomische Lehrsatz

Vektoralgebra 1 2 3 4

Grundbegriffe Vektorrechnung in der Ebene Vektorrechnung im 3-dimensionalen Raum Anwendungen in der Geometrie

Kapitel III: Funktionen und Kurven 1 2 3 4 5 6 7 8 9 10 11 12 13

Definition und Darstellung einer Funktion Allgemeine Funktionseigenschaften Koordinatentransformationen Grenzwert und Stetigkeit einer Funktion Ganzrationale Funktionen (Polynomfunktionen) Gebrochenrationale Funktionen Potenz- und Wurzelfunktionen Algebraische Funktionen Trigonometrische Funktionen Arkusfunktionen Exponentialfunktionen Logarithmusfunktionen Hyperbel- und Areafunktionen

Kapitel IV : Differentialrechnung 1 Differenzierbarkeit einer Funktion 2 Ableitungsregeln 3 Anwendungen der Differentialrechnung

XVIII

Kapitel V:


Integralrechnung 1 2 3 4 5 6 7 8 9 10

Integration als Umkehrung der Differentiation Das bestimmte Integral als Flacheninhalt Unbestimmtes Integral und Flachenfunktion Der Fundamentalsatz der Differential- und Integralrechnung Grund- oder Stammintegrale Berechnung bestimmter Integrale unter Verwendung einer Stammfunktion Elementare Integrationsregeln Integrationsmethoden Uneigentliche Integrale Anwendungen

Kapitel VI: Potenzreihenentwicklungen 1 U nendliche Reihen 2 Potenzreihen 3 Taylor-Reihen

Anhang:

Losungen der Ubungsaufgaben

XIX


Kapitel I:

Lineare Algebra 1 2 3 4 5 6

Kapitel II:

Reelle Matrizen Determinanten Erganzungen Lineare Gleichungssysteme Komplexe Matrizen Eigenwerte und Eigenvektoren einer quadratischen Matrix

Fourier-Reihen 1 Fourier- Reihe einer periodischen Funktion 2 Anwendungen

Kapitel III: Komplexe Zahlen und Funktionen 1 2 3 4

Definition und Darstellung einer komplexen Zahl Komplexe Rechnung Anwendungen der komplexen Rechnung Ortskurven

Kapitel IV : Differential- und Integralrechnung fur Funktionen von mehreren Variablen 1 Funktionen von mehreren Variablen und ihre Darstellung 2 Partielle Differentiation 3 Mehrfachintegrale

Kapitel V:

Gewohnliche Differentialgleichungen 1 Grundbegriffe 2 Differentialgleichungen 1. Ordnung 3 Lineare Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten 4 Anwendungen in der Schwingungslehre 5 Lineare Differentialgleichungen n-ter Ordnung mit konstanten Koeffizienten 6 Numerische Integration einer Differentialgleichung 7 Systeme linearer Differentialgleichungen

XX

Kapitel VI:


Laplace-Transformationen 1 2 3 4 5

Anhang:

Grundbegriffe Allgemeine Eigenschaften der Laplace-Transformation Laplace- Transformierte einer periodischen Funktion Riicktransformation aus dem Bildbereich in den Originalbereich Anwendungen der Laplace-Transformation

Losungen der Ubungsaufgaben

I Vektoranalysis

1 Ebene und raumliche Kurven 1.1 Vektorielle Darstellung einer Kurve Die Parameterdarstellung einer ebenen Kurve C laute: C:

x == x(t),

y == y(t)

(1-1)

Der zum Parameterwert t gehorige Kurvenpunkt P == (x(t); y(t)) ist dann eindeutig durch seinen Ortsvektor

_

_

_ (X(t))

r(P) = x(t) ex + y(t) ey =

(1-2)

y(t)

bestimmt (Bild 1-1).

y

Bild 1-1 Vektordarstellung einer Kurve x

Beim Durchlaufen samtlicher t-Werte von t 1 bis t 2 bewegt sich der Punkt P langsder Kurve C von ~ nach ~. Die Kurve selbst kann somit auch durch den parameterabhdngigen Ortsvektor

_

_

_ (X(t))

r(t) = x(t) ex + y(t) ey = y(t)

(1-3)

beschrieben werden. Analog Hifit sich eine rdumliche Kurve durch einen 3-dimensionalen Ortsvektor darstellen.

1 Vektoranalysis

2

Anmerkungen (1) Die vektorielle Darstellungsform einer Kurve ist in den Anwendungen weit verbreitet und eignet sich - wie wir noch sehen werden - in besonderem MaBe zur Beschreibung von Bewegungsabldufen. Als Parametergrolse dient dabei meist die Zeit, manchmal auch ein Winkel. (2)

Der Ortsvektor r ist eine Funktion des Parameters t: r von einem reellen Parameter t abhangiger Vektor

==

r(t). Allgemein wird ein

(1-6)

als eine Vektorfunktion des Parameters t bezeichnet (t1 dinaten sind dabei Funktionen des Parameters t:

~

t

~

t 2). Die Vektorkoor(1-7)

•

Beispiele (1)

Schiefer Wurf Ein Korper wird unter einem Winkel a gegen die Horizontale mit einer Geschwindigkeit yom Betrag Va abgeworfen (Bild 1-2). Die dabei durchlaufene Bahnkurve ist eine Parabel, in diesem Zusammenhang auch Wurfparabel genannt, und kann durch die Parametergleichungen x(t)

==

(va· cos a) t,

. 1 y (t) == (va . SIna) t - - g t 2 2

(t

~

0)

Ebene und raumliche Kurven

3

oder durch den zeitabhdngigen Ortsvektor

r(t)

==

(Va . cos a) t ) 1 ( (va . sin a) t - 2g t 2

(t

~

0)

beschrieben werden.

y

Bild 1-2 Wurfparabel beim schiefen Wurf, dargestellt durch einen zeitabhangigen Ortsvektor

Wurfparabel

x(t)

(2)

x

Elektronen im Magnetfeld

Elektronen, die schief in ein homogenes Magnetfeld eingeschossen werden, bewegen sich auf einer Schraubenlinie urn die Feldrichtung (z-Achse; Bild 1-3). Die Bahnkurve HiBt sich dabei durch die Parametergleichungen x(t) == R . cos(wt),

y(t)

==

R· sin(wt),

z(t)

==

ct

(t

~

0)

oder durch den zeitabhdngigen Ortsvektor r(t)

==

R . cos(wt)

ex + R . sin(wt) e + ct e y

z

(t

~

0)

beschreiben (R, co und c sind Konstanten).

z

Richtung des Magnetfeldes

Bild 1-3 Schraubenlinienformige Bahn eines Elektrons in einem homogenen Magnetfeld, dargestellt durch einen zeitabhangigen Ortsvektor y

x

I Vektoranalysis

4

Anmerkung: Die Elektronen rotieren mit der Winkelgeschwindigkeit (j) auf einer Kreisbahn mit dem Radius R urn das Magnetfeld und fiihren gleichzeitig eine Translationsbewegung mit der konstanten Geschwindigkeit "o == c in der Feldrichtung aus. Durch ungestorte Ubertagerung dieser Bewegungen entsteht die schraubenlinienformige Bahnkurve.

(3)

Ein elektrisches Feld besitze in einem bestimmten Punkt des Raumes den zeitabhdngigen Feldstdrkevektor Eo . sin (co t) ) E

= E(t) = ( Eo' ~:(wt)

= Eo (

sin (co t) ) cos ((j)t) 1

Die elektrische Feldstarkc i ist somit eine Vektorfunktion des Zeitparameters t. Der Betrag der elektrischen Feldstarke ist jedoch zu allen Zeiten der gleiche, d. h. eine konstante Grobe:

Ii I == Eo· J sin 2 ((j)t) + cos 2 ( co t) + 12 ,

"

==

J2 Eo •

1

1.2 Differentiation eines Vektors nach einem Parameter 1.2.1 Ableitung eines Vektors Auf einer ebenen Kurve mit der vektoriellen Darstellung r (t)

==

(x

(t)) betrachten wir y(t)

zwei benachbarte Punkte P und'Q (Bild 1-4). Ihre Ortsvektoren r(t) bzw. r(t unterscheiden sich durch den Differenzvektor (Sehnenvektor) A- == -( r t tir

A) + tit

-() r t == (X(t

y(t

+ At) + At)

- x (t).) - y(t)

+ At)

(1-8)

Wir dividieren diesen Vektor noch durch den Skalar l1t =1= 0 und erhalten den in der gleichen Richtung liegenden Vektor

Ar l1t

r(t

+ At) At

x(t

+ At)

y(t

+ l1t) -

- x(t)

At

r(t)

At

y(t)

(1-9)

5

1 Ebene und raumliche Kurven y

Bild 1-4 Zum Begriff des Tangentenvektors einer Kurve

x

Er geht beim Grenziibergang f1t lim I1r = f1t

L\t~O

lim r(t

~

'+ M) -

L\t~O

0 in den sog. Tangentenvektor r(t) =

f1t

(X(t)) y(t)

(1-10)

iiber, der die Richtung der Tangente im Kurvenpunkt P = (x(t); y(t)) festlegt (Bild 1-5).

y

Bild 1-5 Orts- und Tangentenvektor einer Kurve

x

Der Tangentenvektor entsteht somit aus dem Ortsvektor r(t) durch komponentenweise Differentiation nach dem Parameter t und wird daher auch als die 1. Ableitung des Vektors (t) bezeichnet. In Anlehnung an die Differentialrechnung fiir Funktionen schreibt man dafiir:

r

~ r(t)

dr

.

= dt = x(t)

_

.

_

ex + y(t) ey =

(x

(t )) y(t)

(I-11)

Analog liegen die Verhaltnisse bei einem 3-dimensionalen Ortsvektor (Raumkurve).

I Vektoranalysis

6

Anmerkungen

(1)

Der Tangentenvektor -; liegt in der Kurventangente (daher stammt auch die Bezeichnung) und zeigt in die Richtung, in die sich der Kurvenpunkt P mit wachsendem Parameterwert t bewegen wiirde.

(2)

Durch zweimalige komponentenweise Differentiation des Ortsvektors r(t) erhalt man die 2. Ableitung x(t) ;(t) == x(t)

ex + y(t) e + z(t) i. == ( y

y(t) ) z(t)

(1-14)

Analog lassen sich hohere Ableitungen bilden (Voraussetzung: Die Vektorkoordinaten x, y und z sind entsprechend oft differenzierbar). Alle Ableitungen des Ortsvektors sind wiederum Vektoren. (3)

Wir verwenden fur die 1. Ableitung im folgenden meist die Kurzschreibweise oder Entsprechendes gilt fur die hoheren Ableitungen.

(1-15)

1 Ebene und raumliche Kurven (4)

7

Die Ableitungsregel gilt ganz allgemein fur beliebige (differenzierbare) Vektorfunk-

::i:~ )nach dem Pa-

tionen. Die Differentiation einer Vektorfunktion a == a(t) = .( rameter t erfolgt somit komponentenweise: az(t)

(1-16)

Wir nennen daher eine Vektorfunktion difJerenzierbar, wenn ihre Vektorkoordinaten differenzierbare Funktionen eines Parameters t sind.

•

Beispiele

(1)

Der Tangentenvektor der eben en Kurve mit dem Ortsvektor

lautet wie folgt:

~r(t)=2te- x + 3 t 2 (2)

-

ey =

(

2t) 3t 2

Wir bestimmen den Tangentenvektor an die Raumkurve

c.

r(t)=(:·.:~::) e2 t

im Kurvenpunkt P mit dem Parameterwert t = O. Durch komponenteweise Differentiation nach dem Parameter t erhalten wir zunachst t(t) =

(

COS t

- t . sin t )

sint

+ t· cost 2. e2 t

1m Punkt P(t = 0) = (0;0; 1) besitzt die Raumkurve dann den folgenden Tangentenvektor:

8

I Vektoranalysis (3)

Wir differenzieren die Vektorfunktion COS(2 t ) ) a(t) ==

(

t

sin (2 t)

zweimal komponentenweise nach dem Parameter t und erhalten:

. a(t) ==

( - 2 . sin (2 t) ) 1 , 2 . cos(2 t)

.. a(t) ==

( - 4 . cos (2 t) ) 0

- 4· sin(2t)

•

Zum AbschluB wollen wir noch einige sehr niitzliche Ableitungsregeln fur Summen und Produkte von Vektorfunktionen angeben:

1 Ebene und raumliche Kurven

9

Anmerkung Summen- und Produktregel erinnern an die entsprechenden Ableitungsregeln fur Funktionen von einer unabhangigen Variablen.

•

Beispiel Die auf einen Korper der Masse m einwirkende Kraft Fist definiert als die zeitfiche Anderung des Impulses p = m v(v: Geschwindigkeitsvektor der Masse). 80mit gilt nach der Produktregel (1-20): - dp d ( _) . _ ~ . _ _ F=-=- m v =m v+m v=m v+m a dt dt

die Beschleunigung a des Korpers: t = a). Bei konstanter Masse ist und wir erhalten die aus der elementaren Mechanik bekannte Formel

(t ist

m= 0,

• 1.2.2 Geschwindigkeits- und Beschleunigungsvektor eines Massenpunktes In den naturwissenschaftlich-technischen Anwendungen wird die Bahnkurve eines Massenpunktes haufig durch einen zeitabhdngigen Ortsvektor ret) beschrieben. Den Geschwindigkeits- bzw. Beschleunigungsvektor der Bewegung erhalt man dann durch einbzw. zweimalige Differentiation von ret) nach dem Zeitparameter t.

10 •

I Vektoranalysis Beispiele

(1)

Schiefer Wurf

Beim schiefen Wurf erhalten wir aus dem zeitabhdngigen Ortsvektor (vo' cos a) t r(t) =

( (vo . sin a) t -

) (t ~ 0)

1

2g t 2

durch Differentiation zunachst den Geschwindigkeitsvektor --+

v(t)

= ~r(t) =

(vo.. cos a ) V o ' SIn

a - gt

und durch nochmalige Differentiation den Beschleunigungsvektor

· . (0)

a(t) = v(t) = r(t) =

~9

Bild 1-6 zeigt die Bahnkurve mit den Vektoren r(t), v(t) und a(t). y Bild 1-6

Wurfparabel

Wurfparabel beim schiefen Wurf mit Orts-, Geschwindigkeits- und Beschleunigungsvektor

x

(2)

Elektronen im Magnetfeld

Wir bestimmen den Geschwindigkeitsvektor v(t) und den Beschleunigungsvektor a(t) fiir die in Bild 1-3 skizzierte schraubenlinienfiirmige Bahnkurve eines Elektrons in einem Magnetfeld:

ex + R . sin(wt) e + ct e v(t) = ;(t) = - Rei sin(wt) ex + Rt» . cos(wt) e + c e a(t) = t(t) = ;(t) = - Rw cos(wt) ex - Rw sin(wt) e + 0 e r(t) = R· cos(wt)

y

z

y

2

.

2

.

z

y

z

Die z-Komponente von a verschwindet somit. Wegen F = m a gilt dies auch fur die z-Komponente der auf das Elektron einwirkenden Kraft F. Der Kraftvektor liegt damit in einer zur z-Achse senkrechten Ebene. Mit anderen Worten: Elektronen erfahren in einem homogenen Magnetfeld stets eine Kraft senkrecht zur Feldrichtung (sog. Lorenzkraft).

1 Ebene und raumliche Kurven (3)

11

Ein Masseteilchen bewegt sich auf einer Bahnkurve mit dem zeitabhdngigen Ortsvektor ~

(t

0)

Es handelt sich dabei urn den Einheitskreis der x, y- Ebene. Denn es gilt: x2 +

= cos' (t 2 ) +sin 2 (t 2 ) = 1

y2

Wir untersuchen nun die Geschwindigkeit und Beschleunigung des Teilchens. Die Bewegung solI dabei aus der Anfangslage A heraus im Gegenuhrzeigersinn erfolgen (Bild 1-7).

y ~

v

((t) A

= (1 ;0)

x(t)

x

Bild 1-7 Bewegung eines Massenpunktes auf dem Einheitskreis

2

2

v(t) = ;(t) = (- 2t . Sin(t ) ) = 2 (- t . Sin(t ) ) 2t·cos(t 2 ) tocos(t 2 )

Dabei wachst der Betrag der Geschwindigkeit linear mit der Zeit:

Ivl = 2 Jt 2 sin 2(t 2 ) + t 2 COS 2(t 2 ) = 0

0

=2 Jt 2 [sin2(t 2 ) 0

0

+ COS 2(t 2 ) ] = 1

2

Jti = 2t

I Vektoranalysis

12

Wir folgern daraus: Die Kreisbahn wird von Umlauf zu Umlauf immer schneller durchlaufen, d. h. die Umlaufdauer nimmt mit der Zeit immer starker abo Fur die Beschleunigung des Massenpunktes erhalten wir dem Betrage nach 1): I

+ (cos u - 2 u . sin u) 2] == == 4[sin 2u + 4u· sinu· cosu + 4u 2 . cos 2u +

a 1 2 == 4 [(- sin u - 2 u . cos u) 2

+ cos 2 U

-

4 u . sin u . cos u + 4 u2 . sin 2 u] ==

== 4[(sin 2u + cos 2u) + 4u 2(cOS 2 U + sin 2u)] == '-v-'

'-v-'

1

== 4(1 + 4u

2

)

1

== 4(1 + 4t

4

)

lal==2·J1+4t 4

•

Auch die Beschleunigung wdchst also mit der Zeit.

1.3 Bogenlange einer Kurve Mit der Berechnung der Bogenldnge seiner ebenen Kurve haben wir uns bereits in Band 1, Abschnitt V.10.4 beschaftigt, Liegt die Kurvengleichung in der expliziten Form y == f (x) vor, so gilt fur die Lange des Bogens vom Punkt ~ bis zum Punkt Ii die bekannte F ormel (Bild 1-8) b

(1-23)

s= fJ1+(y')2dX a

y

s

Bild 1-8

Zum Begriff der Bogenlange einer ebenen Kurve

a

1)

Bei der Zwischenrechnung setzen wir der besseren Ubersicht wegen t 2

b

=

u.

x


13

Wir nehmen jetzt an, daB sich die Kurve auch durch einen parameterabhiingigen Ortsvektor r(t) ==

(X(t))

(1-24)

y(t)

beschreiben laBt, wobei die Parameterwerte t 1 und t 2 den beidenRandpunkten Il und entsprechen (Bild 1-9). Zwischen der Tangentensteigung y' und den Ableitungen x und y der beiden Vektorkomponenten von r(t) besteht dann bekanntlich der folgende Zusammenhang: ~

, y

y ==

(1-25)

~

x

(vgL hierzu Band 1, Abschnitt IV.2.11). Mit Hilfe dieser Beziehung und unter Beachtung von dx == x dt laBt sich dann die Integralformel (1-23) fur die Bogenlange in die Parameterform uberfiihren.

y

s

Bild 1-9 Bogenlange einer durch einen Ortsvektor dargestellten ebenen Kurve

Zunachst einmal ist , 2

(y)2 == 1 + ~ y2 == x

2

1 + (y) == 1 + ~

X

X

+ y2 -2

X

(1-26)

und somit (1-27)

14

1 Vektoranalysis

Fur die Bogenlange s erhalten wir damit die folgende Formel: t2 S

=

t2

fJ x + P f1-;I 2

dt =

(1-28)

dt

Das Differential der Bogenlange s lautet daher ds =

Jx

2

+ Pdt = 1-;1 dt

=

I~~I dt =

Idrl

(1-29)

und heiBt Bogen- oder Linienelement oder auch Bogendifferential. Hieraus folgt sofort die wichtige Beziehung

ds = Idrl = dt dt

ItI

(1-30)

d. h. die Ableitung der Bogenlange s nach dem Parameter t ist gleich dem Betrag des Tangentenvektors t. Die Lange des Tangentenvektors ist somit ein MaB fur die ;fnderungsgeschwindigkeit der Bogenlange ' Bei einer Raumkurve erweitert sich die Integralformel (1-28) entsprechend. In diesem FaIle gilt: t2 S

=

fJ x + P + 2

t2

i 2 dt

=

f1-;I

dt

Wir fassen die Ergebnisse wie folgt zusarnmen:

(1-31)

1 Ebene und raumliche Kurven •

15

Beispiele

(1)

Durch den Ortsvektor

_) r(t == R (t - sin t) 1 - cos t

(O~t~2n)

wird der in Bild 1-10 dargestellte Bogen einer gewohnlichen Z ykloide (Rollkurve) beschrie ben. y

Bild 1-10 Bogenlange einer gewohnlichen Zykloide (Rollkurve)

2R

nR

2nR

x

Wir wollen nun die Lange s dieses Bogens berechnen. Dazu benotigen wir zunachst den Tangentenvektor r, d. h. die erste Ableitung des Ortsvektors

r:

~r == R

(1 - t).. cos sin t

Der Tangentenvektor; besitzt dann die folgende Lange (Betrag):

I;I == R . J (1 -

+ (sin t) 2 == R . J 1 -

cos t) 2

2 . cos t

+ cos 2 t + sin 2 t == "-v-"

1

== R . J2 - 2 . cos t == R . J2(1 - cos t) Unter Verwendung der trigonometrischen Formel

(t)

. 2 1 - cos t == 2 . SIn 2"

konnen wir dafiir auch schreiben:

I;I =

R .

J

2 . 2 . sin 2

G)

= 2 R . sin

G)

Damit erhalten wir die folgende Bogenlange: 2n

s=

f I;I

2n

dt = 2 R·

o

= - 4R [cos

f

sin

G) dt

=

2 R [ - 2 . cos

(DTon

0

G)Ton

= - 4R(cos n -

cos 0) = - 4R( - 1 - 1) = 8R

16


In Beispiel (2) aus Abschnitt 1.1 haben wir die schraubenlinienformige Bahn von Elektronen in einem Magnetfeld durch den zeitabhdngigen Ortsvektor

ex + R· sin(wt) e + ct e

r(t) == R . cos(wt)

y

z

beschrieben (vgl. hierzu Bild 1-3). Wir berechnen nun den bei einem vollen Umlauf zuriickgelegten Weg s. Dazu benotigen wir zuerst einmal die Ableitung -; sowie den Betrag dieser Ableitung:

I-; I

t(t) == - Rw· sin(wt)

ex + Rw· cos(wt) e + c e

I J[- Ri» . sin(w t)]2

I;(t) ==

=

JR

2

w 2 [sin2(wt) "

z

y

+ [Rw . cos(wt)] 2+ c 2 ==

+ cos2(wt)], + c 2 =

JR

2

w

2

+ c2

Da die Elektronen das Magnetfeld mit der Winkelgeschwindigkeit co umkreisen, benotigen sie fur eine volle Drehung die Zeit T == 2 nlto. Somit ist T

2~

2~

s= fl-frldt= f JR 20)2+ C2dt=JR 20)2+ C2. f dt= o 0 0 1 2 2 2 2 1t 2n .JR w + c = J R20)2 + c 2 [t 0 0) (j)

J

der von ihnen bei einem Umlauf auf der Schraubenlinie zuriickgelegte Weg. _

1.4 Tangenten- und Hauptnormaleneinheitsvektor Jedem Punkt einer Bahnkurve, beschrieben durch einen Ortsvektor r(t), ordnen wir in eindeutiger Weise zwei Einheitsvektoren zu, die sich insbesondere bei der Untersuchung von Bewegungsablaufen als sehr niitzlich erweisen. Es sind dies der Tangenteneinheitsvektor T == T(t) und der dazu senkrechte Hauptnormaleneinheitsvektor N == N(t) (Bild 1-11).

Bild 1-11 Tangenten- und Hauptnormaleneinheitsvektor einer Kurve Kurve

1 Ebene und raumliche Kurven Den Tangenteneinheitsvektor

17

l' erhalt man

aus dem Tangentenvektor -; durch N ormie-

rung:

(1-34)

Er liegt in der Kurventangente des Punktes P und zeigt in die Richtung, in die sich dieser Punkt mit wachsendem t bewegen wiirde (tangentiale Richtung: Bild 1-12).

f Kurve

Bild1-12 Tangenteneinheitsvektor einer Kurve

f

Den Hauptnormaleneinheitsvektor N erhalten wir wie folgt: Wir differenzieren zunachst das Skalarprodukt 1'.1' == 1 mit Hilfe der Produktregel (1-18) des vorherigen Abschnitts nach dem Parameter t: d - d1' - (T· T) == - . T dt dt

- ri d + T· - == dt

dt

(1) == 0

(1-35)

Wegen der Kommutativitdt eines Skalarproduktes folgt dann weiter (1-36)

und somit schlieBlich

- «i

-

~

T·-==T·T==O dt

Dies aber bedeutet, daB der Vektor dT = dt T- steht (Bild 1-13).

(1-37)

f senkrecht auf dem Tangenteneinheitsvektor

Der normierte Vektor (1-38) heiBt Hauptnormaleneinheitsvektor und zeigt stets in Richtung der Kurvenkriimmung (Bild 1-14).

18

IVektoranalysis

f

Kurve

Kurve

Bild 1-13 Die Vektoren fund Tstehen senkrecht aufeinander

Bild 1-14 Tangenten- und Hauptnormaleneinheitsvektor einer Kurve

Wir fassen zusammen:

•

Beispiel

Wir bestimmen die Vektoren vektor

r(t)

-+

==

(RR .. cos t) .

SIn

t

==

T und N fur

R (cos . t) SIn

t

den Mittelpunktskreis mit dem Orts-

(O~t~2n)

(Kreis mit dem Radius R urn den Nullpunkt, Bild 1-15).


19

y

R

x Bild 1-15 Mittelpunktskreis mit dem Radius R, dargestellt durch einen parameterabhangigen Ortsvektor

Tangenteneinheitsvektor

~r =

T

R. ( - sint) cost

I;I = R . J(- sin t)

2

+ (cos t) 2 = R . J sin 2 t + cos 2 t = R ~

- -; --· 1 R (- sin t ) - ( - sin t ) T

-1;/- R

cost

H auptnormaleneinheitsvektor

-

cost

IV

T= (-- sm c~st) z ITI = J(- cos t) 2 + (-

sin t) 2 =

J cos

2

t

+ sin 2 t =

1

~

1

-

T

t)

1 (- cos -sint

N=lfl=i"

=-

t)

(cos sint

Der Hauptnormaleneinheitsvektor IV zeigt somit stets in Richtung des Kreismittelpunktes und ist antiparallel zum Ortsvektor r(t) (Bild 1-16).

I Vektoranalysis

20 y

R Bild 1-16

x

Tangenteneinheitsvektor T und Hauptnormaleneinheitsvektor N beim Mittelpunktskreis

• In den Anwendungen stellt der Kurvenparameter t meist die Zeit dar. Aber auch geometrische Parameter wie z. B. die Bogenliinge s der Kurve finden Verwendung. In diesem wichtigen Sonderfall ist der Ortsvektor der Kurve eine Vektorfunktion der Bogenldnge s, die von einem bestimmtenPunkt ~ aus gemessen wird: r = r(s) (Bild 1-17).

r

Bild 1-17

Zur natiirlichen Darstellung einer Kurve: Die Bogenlange s dient als Parameter des Ortsvektors r

r(s)

o Man spricht in diesem Zusammenhang auch von einem natialichen Parameter und nennt die Parameterdarstellung r(s) eine natiirliche Darstellung der Kurve. Der Tangentenvektor

d""r = ;(8) ist dann bereits

ds einheitsvektor

T:

dr T= - = r(s) ds -+

normiert und somit identisch mit dem Tangenten-

mit

I T I = !drl ds = ,-r(s) , = 1 -+

(1-41 )


21

1.5 Kriimmung einer Kurve Wir gehen in diesem Abschnitt zunachst von der sog. naturlichen Darstellung einer Kurve aus, d. h. wir verwenden die Bogenldnge s als Kurvenparameter. Dann ist r = r(s) -+

-+

dr

der Ortsvektor einer solchen Kurve und T = T(s) = - der zugehorige Tangenteneinds heitsvektor, der sich im allgemeinen von Kurvenpunkt zu Kurvenpunkt verandern wird (Bild 1-18).

Kurve

f

Bild 1-18 Der Tangenteneinheitsvektor f einer Kurve dndert im allgemeinen seine Richtung von Punkt zu Punkt

Eine Ausnahme bilden allerdings die Geraden, deren Tangenteneinheitsvektoren in jedem Punkt die gleiche Richtung besitzen (Bild 1-19). Wir konnen diese wichtige Eigenschaft einer Geraden auch durch die Gleichung

dT ~ ~ = T(s) = 0 ds

-

(1-42)

zum Ausdruck bringen.

Gerade

Bild 1-19 Eine Gerade besitzt einen konstant bleibenden Tangenteneinheitsvektor

f

dT ~ .. Bei einer beliebigen Raumkurve kennzeichnet der Vektor - = T(s) die Anderungsgeds schwindigkeit des Tangenteneinheitsvektors 1: Wenn wir also langs der Kurve in positiver Richtung urn das Bogenelement ds fortschreiten, so dndert sich der Vektor Tum dT = T(s) ds Bild 1-20 verdeutlicht diese Aussage.

(1-43)

22

I Vektoranalysis

{(8LS

ds

T(s)

T(s)

Kurve

Bild 1-20 Zur Anderungsgeschwindigkeit eines Tangenteneinheitsvektors T

Je grafter diese Anderung ist (beifestem ds), umso starker weicht die Kurve offensichtlich vom geradlinigen Verlauf ab und umso starker ist sie somit gekrianmt. Die Anderungsgeschwindigkeit des Tangenteneinheitsvektors T charakterisiert also in gewisser Weise die Krianmung der Kurve an der betreffenden Stelle. Daher ist die positive Grobe

=

K

I~~I = l1\s)1

(1-44)

ein geeignetes Maft fiir die Abweichung der Kurve vom geradlinigen Verlauf und wird folgerichtig als Kurvenkriimmung bezeichnet. Sie andert sich im allgemeinen von Punkt zu Punkt, d.h. die Kriimmung Kist eine Funktion der Bogenlange s: K == K(S). Ihr reziproker Wert Q-

1

1

(1-45)

- - -K -

IY(s) I dT

wird als Kriimmungsradius bezeichnet. Der Vektor - weist dabei in die Richtung des ds Hauptnormaleneinheitsvektors N, seine Lange ist die Kriimmung K (Bild 1-21)~ Somit gilt:

si ~ -. -==T(S)==K N ds

-.

T(s)

(K

~

(1-46)

0)

-.

= 7( N

Kurve

Bild 1-21 Zum Begriff der Kriimmung einer Kurve

23


r"'l -~

If'

a.

Anmerkungen (1)

Bei einer ebenen Kurve wird noch zwischen Rechts- und Linkskriimmung unterschieden (vgl. hierzu auch Band 1, Abschnitt IV.3.3.1 und IV.3.3.2). Die Kriimmungsart wird dabei wie folgt durch ein Vorzeichen gekennzeichnet: Rechtskriimmung:

K < 0, der Tangentenvektor gersinn (Bild 1-22, a))

Linkskriimmung:

K

f

dreht sich im Uhrzei-

> 0, der Tangenvektor T dreht sich im Gegenuhrzeigersinn (Bild 1-22, b))

Bei einer Raumkurve ist eine Unterscheidung zwischen Rechts- und Linkskrummung jedoch nicht moglich. Die Krummung ist hier stets positive (2)

Fur die Krummung einer ebenen Kurve gelten die folgenden Formeln: a) Kurve mit dem Ortsvektor r == r(t) K

xy - xy

== - - - - (x 2

(1-49)

+ Y2) 3/2

b) Kurve mit der expliziten Gleichung y == f(x) K

y" == - - - - [1

(I-50)

+ (y ') 2] 3/2

Herleitung dieser Formel: Siehe Ubungsautgabe 11) auf Seite 228

(3)

Wichtige Beispiele fur Kurven mit konstanter Krummung sind: Gerade:

K

== 0

Kreis:

K

== const. == 1/ r

(r: Kreisradius)

I Vektoranalysis

24 y

y

~

T

Kurve

x

•

x

a)

b)

Bild 1-22 Zur Krummung einer ebenen Kurve

a) Rech tskriimmung b) Linkskriimmung

Beispiele (1)

Die in Bild 1-23 dargestellte Mittelpunktsellipse mit den Halbachsen a und b liiBt sich durch den Ortsvektor -.r(t) == (a / . cos . t) b . SIn t

(0~t~2n)

darstellen (a, b > 0).

y b

a

x

Mit

x == -

a . sin t,

y == b . cos t,

x == -

a . cos t,

y == -

b . sin t

Bild 1-23 Mi ttelpunktsellipse, dargestellt durch einen parameterabhangigen Ortsvektor


25

erhalten wir dann nach Formel (1-49) die folgende Kriimmung.:

(- a . sin t) ( - b . sin t) - ( - a . cos t) (b . cos t) (a2. sin ' t + b 2 . cos ' t)3/2

K==------------------

a b . sin 2 t + a b . cos 2 t (a2. sin? t + b? . cos? t)3/2

+ cos '

ab(sin 2 t

t)

ab

Sonderfall: Fur a == b == r erhalten wir einen Mittelpunktskreis mit dem Radius r. Er besitzt die konstante Kriimmung

r2 r2 - . 2. 2. 2(sin 2 - (r sin ' t + r cos" t)3/2 - [r t + cos ' t)]3/2 -

K-

'-v-"

1

r2

r2

(r 2 ) 3/2

r3

Der Kriimmungsradius

r Q

ist daher mit dem Radius r des Kreises identisch:

1

Q==-==r K

(2)

Bild 1-24 zeigt eine Schraubenlinie mit dem Ortsvektor

r(t) == R . cos (w t) ex + R . sin (w t) e + c t e y

z

(Bahnkurve eines Elektrons im Magnetfeld, vgl. hierzu Beispiel (2) aus Abschnitt 1.1).


Bild 1-24 Schraubenlinie, dargestellt durch einen pararneterabhangigen Ortsvektor

1ft) y

x

I Vektoranalysis

26

Fur die Berechnung der Kurvenkriimmung benotigen wir die Ableitungen -; und

t.

; == - Rei sin(wt) ;==

ex

+ Rei cos(wt)ey + c

ez

-Rw 2'cos(wt) e x-Rw 2'sin(wt) e y

Hieraus lassen sich die in Formel (1-48) benotigten Grolien \; x ; wie folgt bestimmen:

\;1 == JR

2w 2

+ R 2w 2 . cos 2(wt) + c 2 ==

sin 2(wt)

•

I und I;I

== JR 2w 2 [sin2(wt) + cos 2(wt)] + c 2 == JR 2w2 + c 2 1

r:

- R t» . sin (w t)) Rw

-; x; = ,

(

= Rw

-Rw . Sin(wt)) ( - COS(wt)) Rw ·cCOS(wt) x - Si~(wt) =

2

== R w 2

2

( - R w • cos (w t) ) 2 x - Rw ~Sin(wt) =

(

) c . sin (co t) C . cos (w t) == 2 2 . sin ( co t) + R co . cos (w t) -

(

R t»

== Rw 2 (

)

~: :~~t})

_ 2

R to [sin (w t)

+ cos

2

==Rw 2

(

_

~ :~~:t;)) :

R oi

(w t)]

1

I; x;\ == Rw

2

Jc 2 . sin 2(wt)

.

+ c 2 . cos 2(wt) + R 2w2 ==

== Rw 2 . Jc 2 [sin2(wt) + cos 2(wt)] + R 2w 2 == 1

Nach Formel (1-48) erhalten wir damit die folgende Kurvenkriimmung:

. == I; x; / R ==

K

\ ; /3

(j)2 .

(JR

JR 2

w2

2

w2

+ c2

+ c2 ) 3

R w2 R2 w2

+ c2

== const.

Die Schraubenlinie besitzt somit in jedem Punkt die gleiche Krummung. Der konstante Krummungsradius betragt 1

(1---

K -

R 2 w 2 + c2 Rw 2

•


27

1.6 Ein Anwendnngsbeispiel: Zerlegnng von Geschwindigkeit und Beschleonigong in Tangential- und Normalkomponenten Ein Massenpunkt bewege sich auf einer (ebenen oder raumlichen) Bahnkurve mit dem zeitabhiingigen Ortsvektor r == r(t). Wir wollen jetzt den Geschwindigkeitsvektor == f sowie den Beschleunigungsvektor == fj == ~ in jeweils eine Tangential- und Normalkomponente zerlegen. Gesucht sind also Zerlegungen in der Form

v

a

und wobei

f

(I-51)

der Tangenteneinheitsvektor und

N

der Hauptnormaleneinheitsvektor ist.

Geschwindigkeitsvektor

Der Geschwindigkeitsvektor v == f liegt bekanntlich in Richtung der Kurventangente und laBt sich somit auch in der Form

Vx2 + y2 + z2

v= v T =

T

(I-52)

darstellen, wobei v =

~~

=

Vx2 + y2 + z2

(I-53)

der zeitabhangige Geschwindigkeitsbetrag und f der Tangenteneinheitsvektor ist. Die Geschwindigkeit v besitzt daher nur eine Tangentialkomponente v T == v, wahrend die Normalkomponente v N stets verschwindet: v N == 0 (Bild 1-25).

Bild 1-25 Der Geschwindigkeitsvektor besitzt nur eine Tangentialkomponente v T =

v V

Beschleunigungsvektor

Wir differenzieren den Geschwindigkeitsvektor v == v f nach der Zeit t und erhalten definitionsgemaf den Beschleunigungsvektor

a:

d -_ d v __ _d (v T-+ ) == -d v T dt dt dt

-+

+ v -ddtf ==

-+

iJT

f + vddt -

(I-54)

I Vektoranalysis

28

Ferner ist

dT (dT) ds - vds dt =(K N)V=KV N=Q N

(I-55)

di=

wobei wir von den Beziehungen

dT == K N,-

d;

ds == v

-

dt

und

1

(I-56)

K==Q

Gebrauch gemacht haben. Damit bekommt der Beschleunigungsvektor (I-54) die folgende Gestalt:

aaus Gleichung (I-57)

v2

Er besitzt somit die Tangentialkomponente aT == V und die N ormalkomponente aN == - , die auch als Zentripetalbeschleunigung bezeichnet wird (Bild 1-26). Q

Bild 1-26 Zerlegung des Beschleunigungsvektors a in eine Tangential- und Normalkomponente

Wir fassen diese Ergebnisse wie folgt zusammen:

29


•

Beispiele

(1)

Bei einer Kreisbewegung mit konstanter Geschwindigkeit v ist V == O. Die Tangentialbeschleunigung ist somit Null: aT == O. Die Normalkomponente (Zentripetalbeschleunigung) aN == v21r ist stets auf den Kreismittelpunkt gerichtet und andert Iaufend die Richtung der Geschwindigkeit, nicht jedoch den Geschwindigkeitsbetrag (r: Kreisradius; Bild 1-27). Es gilt somit unter Beriicksichtigung der Beziehung v == OJ r, wobei OJ die (konstante) Winkelgeschwindigkeit ist, mit der sich der Massenpunkt um den Kreismittelpunkt bewegt: --. _ v2 _ v2 v2 --. (OJ r)2 _ 2 _ a == aN N == - N == - - - == - - 2 r == - - 2- r == - OJ r r r r r r

r

y

x Bild 1-27 Kreisbewegung mit konstanter Winkelgeschwindigkeit OJ

30


Die Bahnkurve eines Korpers laute wie folgt: (t

~

0)

Wir interessieren uns fur die Tangential- und N orrnalkornponenten von Geschwindigkeit und Beschleunigung

v

Geschwindigkeit

a.

v (es existiert bekanntlich nur eine Tangentialkomponente)

Somit besitzt der Geschwindigkeitsvektor

v die Tangentialkomponente

a

Beschleunigung

Wir berechnen zunachst alle benotigten Grolsen (v und K):

v== ~(J4t2 dt

+

2) = ~(4t2 + 2)1/2 = dt

1

4t

2

J4t 2 + 2

== - (4t 2 + 2)-1/2·8 t == - - - -

I; xii == J( - 2)2 + 02 + 22 == J8 == 2 J2 I;xil 2)2 K == - - == - - - 1;13

(4t 2

+ 2)3/2

Damit besitzt der Beschleunigungsvektor aT

==

.

v

==

adie Tangentialkomponente

4t J4t 2

+2

und die N ormalkornponente

•

2 FHichen im Raum

31

2 Flachen im Raum 2.1 Vektorielle Darstellung einer Flache Eine Flache im Raum Hifit sich durch einen Ortsvektorbeschreiben, der von zwei (reellen) Parametern u und v abhangt, d. h. die Vektorkoordinaten x, y und z sind Funktionen der beiden Variablen u und v: x(u; (1-60) r ==r(u; v) == x(u; v) + y(u; v) y + z(u; v) z == y(u; v) ( z(u; v) (Bild 1-28).

ex

e

y x

x

e

V))

BUd1-28

Vektordarstellung einer Flache im Raum

y

Die Flache wird dabei von einem Netz von Parameterkurven, auch Parameter- oder Koordinatenlinien genannt, durchzogen. Wir unterscheiden dabei die folgenden Linien (Bild 1-29):

u-Linien (u variabel; v == const.): r == r(u; v == const.)

(1-61 )

v-Linien (v variabel; u == const.) : r == r(u == const.; v)

(1-62)

Langs einer Parameterlinie ist also jeweils einer der beiden Parameter konstant. Die Parameterlinien haugen somit nur noch von einem Parameter abo

I Vektoranalysis

32

u = canst. =a1 u = canst. = a2 u = canst. = 83

v e const. =b 3 v = canst.

=b 2

Bild 1-29 Parameter- oder Koordinatenlinien einer FHiche

v = canst. = b,

Der in Bild 1-29 eingezeichnete Flachenpunkt P ist der Schnittpunkt der u-Linie v = const. = b2 mit der v-Linie u = const. = a2 und somit durch die Parameterwerte u = a 2 , v = b2 eindeutig festgelegt. Wir interessieren uns jetzt fur die Tangentenvektoren an die Parameterlinien (Bild 1-30). Da langs einer u-Linie der Parameter v konstant bleibt, hangt der Ortsvektor dieser Kurve nur vom Parameter u abo Dann ist nach den Ergebnissen aus Abschnitt 1.2 der Tangentenvektor an diese Kurve durch die 1. Ableitung des Ortsvektors = r(u; v = const.) nach dem Parameter u gegeben. Wir schreiben dafiir

r

- or

0

_

(1-63)

tu = ou = ou [r(u; v = const.)]

r

Es .handelt sich hier also urn eine partielle Ableitung 1. Ordnung, da formal von u und v, d. h. von zwei Variablen abhangt, Beim Differenzieren gilt dabei die bereits bekannte Regel, daB ein Vektor komponentenweise differenziert wird (hier also partiell nach der Variablen u). In ausfiihrlicher Schreibweise gilt also:

- or ox _ oy _ oz_

tu = OU = OU ex + OU ey

+ OU

Tv

(1-64)

ez

v-Linie

Bild 1-30 Tangentenvektoren an die Parameteroder Koordinatenlinien einer Flache u-Linie

2 FHichen im Raum

33

Analog erhalt man den Tangentenvektor an die v-Linie. Die beiden Tangentenvektoren lauten somit:

ar

--+

Tangentenvektor an die u-Linie :

t =-

Tangentenvektor an die v-Linie:

t

au

u

--+

v

ar

=~

av

Wir fassen die Ergebnisse wie folgt zusammen:

•

Beispiele

(1)

Die durch den Ortsvektor

erfaBten Punkte bilden die M antelfldche eines Rotationsparaboloids, das durch Drehung der Normalparabel urn die z-Achse entstanden ist (Bild 1..,31). Die Tangentenvektoren an die Parameterkurven lauten:

at=~= u au

(1) 0

2u

'

I Vektoranalysis

34

z

Bild 1-31 Mantelflache eines Rotationsparaboloids y

x

So gehort z. B. zu den Parameterwerten u == 1, v == 2 der Punkt P == (1; 2; 5) mit den Tangentenvektoren

~(1;2) (~)

und

=

(2)

~(1;2)=(~)

Bild 1-32 zeigt einen Zylinder vom Radius R == 1 und der Hohe H == 5. Die M antelfldche HiBt sich dann durch den Ortsvektor

COSU) r = r(u; v) =

(

(0 ~ u < 2n; 0

Si:u

~

v

~

5)

beschreiben. Ihre Parameterlinien sind (Bild 1-33): u-Linien (v == const.) :

Einheitskreise, deren Mittelpunkte auf der z-Achse liegen (0 ~ z ~ 5)

v-Linien (u == const.):

M antellinien des Zylinders

Die Tangentenvektoren an diese Parameterlinien lauten dann:

a- (- sinu ) t == ~ cosu a == u

u

0

'

~ ist dabei in jedem Flachenpunkt identisch mit dem kartesischen Einheitsvektor z •

e

35

2 FHichen im Raum z

z

u-Linie

x

x

Bild 1-32

Bild 1-33

Zur Vektordarstellung der Mantelflache eines Zylinders

Parameterlinien einer Zylindermantelflache

•

2.2 Flachenkurven Sind die Flachenparameter u und v Funktionen einer Variablen t, gilt also u

==

u(t)

und

(1-67)

v == v(t)

so beschreibt der letztlich nurvon t abhangige Ortsvektor

r == r(u(t); v(t)) == r(t) == (

x(u(t); V(t))) Y(u(t); v(t)) z(u(t); v(t))

(1-68)

eine sog. Fldchenkurve, d. h. eine auf der Flache r

==

r(u; v) verlaufende Kurve (Bild 1-34).

Bild 1-34

Flectie {(u;v)

Flachenkurve auf einer raumlichen Flache, dargestellt durch einen parameterabhangigen Ortsvektor

I Vektoranalysis

36

Der zum Parameter t gehorige Punkt P == P(t) der Flachenkurve besitzt dann den folgenden Tangentenvektor:

~r==-== dr (ar) du (ar) -+ -av dt au dt

dv -. -==t u+t- .v==u. t- +v. t dt U v U v

(1-69)

Die Ableitung wird hier wiederum komponentenweise tiber die Kettenregel gebildet, da die Vektorkoordinaten jeweils von u und v abhangen und diese wiederum Funktionen des Parameters t sind. Wir fassen zusammen:

•

Beispiel Elektronen, die schrdg in ein homognes Magnetfeld eintreten, bewegen sich auf der Mantelfldche eines Zylinders, beschrieben durch den Ortsvektor

r

=

r(u; v) =

(

R· COSU) R. u

:in

(Bild 1-35). Die Flachenparameter u und v sind dabei noch wie folgt von der Zeit t abhangig: u

== OJ t,

v

== ct

(OJ, c: Konstanten). Die von den Elektronen durchlaufene Bahnkurve ist eine Schraubenlinie (Bild 1-35).

2 FHichen im Raum

37


Bild 1-35 Schraubenlinienformige Bahn eines Elektrons in einem homogenen Magnetfeld, dargestellt durch einen parameterabhangigen Ortsvektor

f(t)

y

x

Wir bestimmen jetzt den Tangentenvektor dieser Kurve nach Formel (1-71):

SinU) - = -or_ = ( - RR··cosu ou '

t

u

u = OJ,

o

V

=

C

- R OJ . sin u ) =

(

RW · cosu

c

r:

( - R OJ . sin (OJ t) ) =

Rw

Dieses Ergebnis hatten wir bereits in Abschnitt 1.2.2 hergeleitet (Beispiel (2)). Der Tangentenvektor ; ist dabei nichts anderes als der Geschwindigkeitsvektor der eingeschossenen Elektronen, die sich auf der angegebenen Schraubenlinie bewe-

v

~~

.

2.3 Tangentialebene, Flachennormale, Flachenelement Flachennormale Die Tangentialebene in einem Flachenpunkt P = (x.,; Yo; zo) der Flache r = r(u; v) enthalt sdmtliche Tangenten, die man in P an die Flache anlegen kann. Sie wird dabei von den beiden Tangentenvektoren ~ und ~ aufgespannt, vorausgesetzt, daB diese nicht in einer Linie liegen, also die Bedingung ~ x ~ i= 0 crfiillcn (Bild 1-36) 2). 2)

Diese Bedingung bedeutet geometrisch, daB die beiden Tangentenvektoren ~ und ~ ein Parallelogramm aufspannen.

1 Vektoranalysis

38

Bild 1-36 Zum Begriff des Normaleneinheitsvektors einer FHiche (Flachennormale N) Flecne ((u;v)

Dann steht das Vektorprodukt ~ x ~ senkrechtauf der Tangentialebene des FHichenpunktes P. Durch N ormierung erhalten wir aus ~ x ~ den N ormaleneinheitsvektor der Flache, den wir kurz als Fldchennormale N bezeichnen wollen: (1-72) Es gehort also zu jedem Punkt der Flache genau eine Flachennormale. Tangentialebene

Wir wollen uns jetzt mit der Tangentialebene in einem festen Flachenpunkt P = (x o ; Yo; zo) naher auseinandersetzen und insbesondere deren Gleichung herleiten (Bild 1-37).

Tangentialebene in P

Bild 1-37 Tangentialebene einer Flache im Flachenpunkt P

o

2 Flachen im Raum

39

Ist Y der Ortsvektor eines beliebigen Punktes Q der Tangentialebene, so liegt der Vektor PQ == y - Yo in dieser Ebene und steht damit senkrecht zur Flachennormale No im Flachenpunkt P 3). Das Skalarprodukt dieser Vektoren verschwindet daher und fiihrt uns zu der gesuchten Gleichung der Tangentialebene. Diese HiBt sich somit in der Form

~

-+

No . (y - Yo) == 0

(1-73)

darstellen. Wir fassen zusammen:

Anmerkungen (1) Die Flachennormale ~ und r.. (2)

N ist

das normierte Vektorprodukt der Tangentenvektoren

Da die Vektoren ~ x ~ und durch die Gleichung

(~ x ~)o' (y - Yo) == 0

N parallel sind,

HiBt sich die Tangentialebene auch (1-76)

beschreiben (die Normierung des Vektorproduktes (~ x ~)o ist fur die Tangentialebene ohne Bedeutung).

3)

Urn Milrverstandnisse zu vermeiden, werden wir im folgenden aIle Grofien, die sich auf einen speziellen ( fest vorgegebenen) Punkt P = (x.,: Yo; zo) beziehen, durch den Index ,,0" kennzeichnen. So ist beispielsweise No die Flachennormale in demfesten Flachenpunkt P mit den Koordinatenwerten x o, Yo und zoo

40

•

I Vektoranalysis

Beispiel Durch den Ortsvektor

HiBt sich die Mantelfliiche eines Rotationsparaboloidsbeschreiben, die durch Drehung der Normalparabel um die z-Achse entstanden ist (Bild 1-38). Wie lautet die Gleichung der Tangentialebene im Flachenpunkt P mit den Parameterwerten u == 1, v == 1 ?

z

Bild 1-38 Mantelflache eines Rotationsparaboloids y

x

Losung: Zunachst bestimmen wir die beiden Tangentenvektoren des Flachenpunktes P == (1; 1; 2):

=>

~(1; 1) (~) =

Fur das Vektorprodukt der Tangentenvektoren erhalten wir damit:

~(1; ~(1; 1) x

1) = (

~) (~) = ( =~ ) x

2 FHichen im Raum

41

N ormierung fiihrt zur Fldchennormale im Punkt P:

Wir sind jetzt in der Lage, die Gleichung der Tangentialebene im Punkt P zu bestimmen:

r- ro =

(

~

No . (r - ro) = - 2)

(

- :

- 2x

.

~) ~ =~ )

) - (

= (

0 =>

~ =:).( ~ =~ ) (

=

0

(X-1) ~ ~ .;

. = - 2(x - 1) - 2(y - 1) + 1 (z - 2) = 0

+ 2 - 2y + 2 + z - 2 == 0

- 2x - 2y

+ z + 2 == 0

Die Tangentialebene im Punkt P HiBt sich somit durch die Gleichung

z==2x+2y-2

•

beschreiben.

Flachenelement Fur spatere Zwecke, z. B. fur die Berechnung von Oberfldchenintegraien, benotigen wir noch einen allgemeinen Ausdruck fur das Fldchenelement d A einer Flache r == r (u; v). Ein solches Flachenelement wird durch je zwei infinitesimal benachbarte u- und v-Parameterlinien begrenzt (Bild 1-39). Die Tangentenvektoren im Flachenpunkt P langs der u-Linie durch P und Q bzw. langs der v-Linie durch P und S lauten:

Tangentenvektor an die u-Linie in P:

Tangentenvektor an die v-Linie in P:

--+

ar

t ==u

au

42

I Vektoranalysis u +du

v = canst.

Bild 1-39 Flachenelement dA einer raumlichen Flache

u t-du

v+dv

Ftectienetement dA

v =canst. Bild 1-40 Das Flachenelement dA laBt sich durch ein Parallelogramm annahern

Die Lange des Bogens PQ auf der u-Linie durch P und Q wird dann angendhert durch die Lange des Vektors ~ du (Bild 1-40). Analog ist die Lange des Vektores ~ dv eine ~

Niiherung fur die Lange des Bogens PS auf der v-Linie durch P und S. Das Fldchenelement dA besitzt dann anndhernd den gleichen Inhalt wie das von den beiden Vektoren ~ du und ~ dv aufgespannte Parallelogramm. Somit ist dA ndherungsweise gleich dem Betrag des Vektorproduktes aus ~ du und ~ dv: dA == I(~ du) x (~ dv)1 == I~ x ~I du dv

(1-77)

2 Flachen im Raum

43


Anmerkung

Flachenelement dA und Flachennormale N verdndern sich im allgemeinen von Flachenpunkt zu Flachenpunkt, sind damit Funktionen der beiden Flachenparameter u und v.

2.4 Flachen vom Typ z

= f(x;y)

Aus Band 2, Abschnitt IV.1.2.3 ist uns bereits bekannt, daB eine Funktion vom Typ z == f (x; y) bildlich durch eine Fldche im Raum dargestellt werden kann (Bild 1-41). Ein beliebiger Punkt P auf dieser Flache besitzt dann die folgenden Koordinaten: P == (x; y; z == f (x; y)). Die Bildfldche der Funktion z == f (x; y) HiBt sich auch in vektorieller Form darstellen, wobei die kartesischen Koordinaten x und y als Fldchenparameter dienen:

r==r(x;y)==x e x+ y ey+f(x;y) e z==(

f

~

)

(1-79)

(x; y)

Damit erhalten wir die folgenden Tangentenvektoren an die Parameterlinien der Flache (x- Linien und y- Linien):

_(1)

- or

t ==-== x

ox

0

fx

(1-80)

'

I, und j, sind dabei die

partiellen Ableitungen 1. Ordnung von z == f(x; y).

44

I Vektoranalysis z

Flectie z = f(x;y)

y

/

y

/ /x

Bild 1-41 Flache vorn Typ z

x

=

f(x; y)

x Definitionsbereich D

Da eine Verwechslung mit Vektorkoordinaten an dieser Stelle nicht moglich ist, haben wir hier die Kurzschreibweise fiir partielle Ableitungen gewahlt, Das Vektorprodukt der beiden Tangentenvektoren lautet dann:

(1-81 )

(1-82) Durch Normierung erhalten wir daraus die Fldchennormale N:

--

- _ t x x ty N -

I i;

x

_

1

~ I - J!l' + !/ + 1

(-Ix) I. _

1

(1-83)

y

Wir bestimmen nun die Gleichung der Tangentialebene im Flachenpunkt P == (x o; Yo; zo) mit dem Ortsvektor E, nach Gleichung (1-75) bzw. (1-76):

(1-84)

2 FUichen im Raum

45

Die partiellen Ableitungen sind dabei im (fest vorgegebenen) Flachenpunkt P zu bilden, d.h. fur die Parameterwerte x == X o und y == Yo. Wir losen noch nach z auf und erhalten die bereits aus Band 2 bekannte Gleichung der Tangentialebene in der Form

z

==

fx(x o ; Yo) (x - x o) + fy(x o ; Yo) (y - Yo) + Zo

(1-85)

(Band 2, Abschnitt IV.2.3.1, Gleichung (IV-29)). Zum AbschluB geben wir noch das Fldchenelement dA an, ausgedruckt in den kartesischen Flachenparametern x und y. Es lautet: dA ==

I

r: x ~ I dx dy

==

J fx

2

+ I,2 + 1

dx d y

Wir fassen die Ergebnisse nun wie folgt zusammen:

(1-86)

46

•

I Vektoranalysis

Beispiel Die Flache

2 =

f (x; y) = x 2 • e X Y HiBt sich auch durch den Ortsvektor

mit den kartesischen Flachenparametern x und y beschreiben. Wir interessieren uns fur die Gleichung der Tangentialebene im Punkt P mit den Parameterwerten x = 1, y = O. Losung: Der Punkt P besitzt die Koordinaten X o = 1, Yo = 0 und 2 0 = f(x o; Yo) = f (1; 0) = 1. Wir bestimmen zunachst die benotigten Tangentenvektoren in diesem Punkt:

~ ~~ =

-.

ar ay

=

t = --= Y

(2X .e (

XY :

01 x3 .

e

x 2 y . e XY ) =

((2X +

X~

y) . e

y )

) XY

~(l;O) = (~} Das Vektorprodukt dieser Vektoren lautet dann:

(~x ~)o ~(l;O) x ~(l;O) (~) x ( : ) =

=

=

(=:)

3 Skalar- und Vektorfelder

47

Wir konnen jetzt die Tangentialebene im Punkt P = (1; 0; 1) nach Formel (1-91) bestimmen:

- 2(x - 1) - 1 (y - 0) + 1 (z - 1) = 0

+2- y+z- 1=0 - 2x - y + z + 1 = 0

- 2x

Die Gleichung der gesuchten Tangentialebene lautet damit: z

= 2x +

3 Skalar-

•

y- 1

ODd

Vektorfelder

3.1 Ein einfiihrendes Beispiel Die in Naturwissenschaft und Technik so grundlegenden Begriffe "Skalarfeld" und "Vektorfeld" sollen anhand eines einfachen physikalischen Beispiels eingefiihrt werden. Wir betrachten dazu das elektrische Feld in der Umgebung einer positiven Punktladung Q. In jedem Punkt P dieses Feldes erfahrt eine positive Probeladung q eine radial nach aujJen gerichtete Kraft F(P), deren Betrag mit zunehmendem Abstand r von der felderzeugenden Ladung Q abnimmt (Bild 1-42). Es gilt das von Coulomb stammende Kraftgesetz 1 Qq F=--·2

4 tt

(8 0:

80

r

r- = -1 _ .Qqr

4n

80

elektrischeFeldkonstante).

r2

-+

e

e = -rr ist dabei ein radial nach r

(1-93)

r

auBen gerichteter Ein-

heitsvektor. Er hat die gleiche Richtung wie der Ortsvektor r = r(p).

Die Kraftwirkung nach dem Coulombgesetz ist dabei von art zu art verschieden, hangt allerdings auch noch von der Probeladung q selbst ab, wobei gilt: (1-94) Wir verdeutlichen diesen Sachverhalt durch die Schreibweise F = F(P; q). Urn die Coulombkraft von der Probeladung q unabhdngig zu machen, wird die Kraftwirkung auf die Einheitsladung (q = 1) bezogen.

I Vektoranalysis

48

~

F(P)

p +q

r

+0

a)

Bild1-42 Kraftfeld in der Umgebung einer positiven Punktladung Q a) Kraftwirkung auf eine positive Probeladung q b) Die Kraftwirkung des elektrischen Feldes nimmt nach auBen hin ab (Coulomb-Gesetz; die Kraftvektoren sind der besseren Ubersicht wegen nicht maBstabsgetreu gezeichnet)

Wir erhalten dann den als elektrische Feldstdrke bezeichneten Vektor 1 Q_ E==--·-2 e

4n8 o r

(1-95)

r

der von der Probeladung vollkommen unabhdngig ist und somit nur noch yom betrachteten Ort abhangt (bei fest vorgegebener Ladung Q). ZU jedem Punkt P des elektrischen Feldes gehort somit genau ein Feldstarkevektor E(P). Er beschreibt die Kraftwirkung des Feldes auf eine Einheitsladung nach Richtung undGrofic in eindeutiger und vollstdndiger Weise. Man spricht daher in diesem Zusammenhang auch von einem elektrischen Kraftfeld oder etwas allgemeiner von einem Vektorfeld. Ein ebener Schnitt durch dieses Feld (die Schnittebene enthalt die felderzeugende Ladung Q) fiihrt uns zu dem in Bild 1-43 dargestellten ebenen Vektorfeld. Alle Feldstarkevektoren liegen in der Schnittebene und sind in der iiblichen Weise durch Pfeile gekennzeichnet. Das elektrische Feld in der Umgebung der positiven Punktladung Q kann aber auch durch eine skalare Grobe eindeutig und vollstdndig beschrieben werden. Als geeignet erweist sich dabei die physikalische Arbeit die man an einer positiven Probeladung q verrichten muB, urn diese aus dem "Unendlichen" in einen Punkt P des elektrischen Feldes zu bringen. Bei dieser Verschiebung muB die abstoBende Coulomb-Kraft iiberwunden werden. Es zeigt sich nun, daB die dabei aufzubringende Arbeit W vollig un-

u-:


49

-..

P

E(P)

Bild 1-43

+0

Ebener Schnitt durch das elektrische Feld einer positiven Punktladung Q (Schnitt durch die felderzeugende Ladung Q)

abhdngig von dem eingeschlagenen Verbindungsweg C ist und somit nur vom Endpunkt P des Weges abhangt, In Bild 1-44 wird diese Aussage verdeutlicht: Wenn wir die Probeladung q langs der eingezeichneten Wege C 1 , C 2 und C 3 aus dem "Un-, endlichen" in den gemeinsamen Endpunkt P verschieben, so miissen wir dabei jeweils die gleiche Arbeit verrichten. Allerdings ist diese Arbeit auch noch von der Probeladung q abhangig, wobei gilt:

(1-96) Wir bringen diese Abhangigkeit durch die Schreibweise W = W(P; q) zum Ausdruck.

Bild 1-44

Die Arbeit eines elektrischcn Feldes an einer Probeladung ist unabhdngig vom eingeschlagenen Verbindungsweg

Urn die Arbeit von der Probeladung q unabhdngig zu machen, verwenden wir wiederurn die Einheitsladung (q = 1) und erhalten auf diese Weise eine von q unabhdngige Arbeitsgrobe, die als elektrostatisches Potential U = U (P) bezeichnet wird. Zu jedem Punkt P des elektrischen Feldes gehort somit genau ein Potential U (P). Es beschreibt die physikalische Arbeit, die man aufbringen muB, wenn man die Einheitsladung aus dem "Unendlichen" in den Punkt P verschieben will. Da es sich urn eine skalare, von Ort zu Ort variierende Grobe handelt, spricht man in diesem Zusammenhang von einem Potentialfeld oder etwas allgemeiner von einem Skalarfeld.

I Vektoranalysis

50

3.2 Skalarfelder Im einfiihrcnden Beispiel haben wir erstmals den Begriff eines skalaren Feldes kennengelernt. Jedem Punkt P des elektrischen Feldes konnten wir namlich in eindeutiger Weise ein Potential U (P), also eine skalare GroBe, zuordnen. Dies fuhrt uns zu der folgenden Begriffsbildung:

Anmerkungen.

(1)

Skalare Felder verandern sich haufig mit der Zeit, d. h. die skalare Grobe ¢ ist oft noch zeitabhdngig. Ein Beispiel dafiir liefert die Temperaturverteilung in einem Raum. Wir beschaftigen uns in diesem Kapitel jedoch ausschlieBlich mit stationdren, d. h. zeitunabhdngigen Skalarfeldern.

(2)

Eine Flache im Raum, auf der das skalare Feld einen konstanten Wert annimmt, heiBt Niveaufldche. Die Niveauflachcn eines Skalarfeldes cjJ(x; y; z) werden daher durch die Gleichungen cjJ(x; y; z) :=: const. beschrieben. In den technischen Anwendungen wird eine solche Niveauflache meist als ;fquipotentialflache bezeichnet. Bei einem ebenen Feld wird durch die Gleichung cjJ(x; y) :=: const. eine sog. Niveaulinie definiert. Auf ihr besitzt das skalare Feld einen konstanten Wert.

•

Beispiele (1)

Wir nennen einige Beispiele fur skalare Felder: Dichteverteilung im Innern der Erdkugel Temperaturverteilung in einem Raum Elektrostatisches Potential in der Umgebung einer geladenen Kugel

(2)

Beispiele fur N iveaufldchen liefern die ;fquipotentialfliichen elektrisch geladener Korper: Aquipotentialflachen einer Punktladung: Konzentrische Kugelschalen (Bild 1-45) Aquipotentialflachen eines geladenen Plattenkondensators: Ebenen parallel zu den Plattenflachen (Bild 1-46) Aquipotentialflachen eines geladenen Zylinders: Koaxiale Zylindermantel (Bild 1-47)


51 Kondensatorplatten

Aquipotentialflache (Kugelschale)

1 1/

~

/ .1/

/ Aquipotentialflache (Ebene)

Bild 1-46 Aquipotentialflachen eines geladenen Plattenkondensators

Bild 1-45 Aquipotentialflachen einer Punktladung (ebener Schnitt durch die Punktladung)

1-- Zylinderachse

-, I

.--+--

--

-,

-

~

/

----:.

geladener Zylinder

- ",-

/ ,..---

.......

_I

""

a:

ea=I~1 li=~(-~)

~)

4 Gradient eines Skalarfeldes

67

Als nachstes berechnen wir den Gradient von ¢ im Punkt P:

Damit besitzt die Richtungsableitung

~~

im Punkt P den folgenden Wert:

• 4.3 Flachen vom Typ F(x; y; z)

=0

In den Abschnitten 2.3 und 2.4 haben wir uns bereits mit den Eigenschaften von Flachen beschaftigt, die entweder in der vektoriellen Form r == r(u; v) oder aber in Form einer Funktionsgleichung vom expliziten Typ z == f (x; y) gegeben waren. Jetzt beschaftigen wir uns mit Flachen vom impliziten Funktionstyp F(x; y; z) == o. Eine solche Flache F(x; y; z) == 0 liiBt sich dann auffassen als eine spezielle Niveaufldche des skalaren Feldes ¢ == ¢(x; y; z) == F(x; y; z), dessen Niveauflachen ja bekanntlich durch die Gleichung ¢ (x; y; z) == F(x; y; z) == const. == c

(1-126)

definiert sind. Fur den speziellen Wert c == 0 erhalten wir gerade die vorgegebene Flache F(x; y; z) == o. Da der Gradient des skalaren Feldes ¢ == F(x; y; z) stets senkrecht auf den N iveaufldchen steht, verlauft er auch senkrecht zu unserer Flache und ist somit ein Normalenvektor dieser Flache, Die in einem Flachenpunkt P == (x o; Yo; zo) mit dem Ortsvektor o errichtete Tangentialebene liiBt sich dann in der Form

r

(1-127)

darstellen, wobei ebene ist.

r der Ortsvektor eines beliebigen Punktes Q == (x; y; z)der Tangential-

1 Vektoranalysis

68

Anmerkung Eine Flache vom expliziten Typ z = f (x; y) kann als eine spezielle Niveauflache des skalaren F eldes ¢ = ¢(x; y; z) = z - f(x; y)

aufgefaBt werden. Dann ist grad ¢ = Vektor (Normalenvektor) und

(1-129)

(

-fx) I, -

ein auf der Flache senkrecht stehender

1

(1-130)

die zum Flachenpunkt P gehorige Tangentialebene. Zu diesem Ergebnis sind wir bereits in Abschnitt 2.4 gelangt. •

Beispiel

Die Kugeloberfldche x 2 + y2 + Z2 = 49 ist eine spezielle Niveauflache des Skalarfeldes ¢(x; y; z) = x 2 + y2 + Z2. Wir bestimmen die Gleichung der Tangentialebene im Flachenpunkt P = (2; 3; 6). Zunachst berechnen wir den Gradient von ¢ im Punkt P:

69

4 Gradient eines Skalarfeldes Damit erhalten wir die folgende Tangentialebene:

(grad ¢)o . (r - ro) = 2 (

~ ) . ( ~ =~ )

=

0

2[2(x - 2) + 3(y - 3) + 6(z - 6)] == 0 2(x - 2) + 3(y - 3) + 6(z -6) == 0

2x - 4 + 3y - 9 + 6z - 36 == 0

•

2 x + 3 y + 6 z == 49

4.4 Ein Anwendungsbeispiel: Elektrisches Feld einer Punktladung Wir betrachten das elektrische Feld in der Umgebung einer positiven Punktladung Q (Bild 1-63). Die elektrischen Feldlinien verlaufen dabei radial nach aujJen. In jedem Punkt P des Feldes herrscht ein bestimmtes elektrostatisches Potential U (P) und eine bestimmte elektrische Feldstdrke E(P). Das Potential hangt dabei wegen der Radial- oder Kugelsymmetrie nur vom Abstand r des Punktes P vom Koordinatenursprung ab 5):

Q

U(P) == U(r) = = - -

4ne or

(r > 0)

(1-131)

(eo: elektrische Feldkonstante). Die Niveaufldchen, hier ;fquipotentialjlachen genannt, sind konzentrische Kugelschalen (Bild 1-63).

FeIdlinie

.4quipotentialflache

Bild 1-63

Niveauflachen (Aquipotentialflachen) des elektrischen Feldes einer positiven PunktladungQ (ebener Schnitt durch die Punktladung)

5)

Die felderzeugende Punktladung Q befindet sich im Koordinatenursprung.

I Vektoranalysis

70

Zwischen dem Feldstarkevektor dabei die folgende Beziehung:

£ == -

£ (P) == £ (r)

und dem Potential U (P) == U (r) besteht

(1-132)

grad U

d. h. die Feldstarke ist - vom Vorzeichen abgesehen - der Gradient des Potentials. Mit ihrer Berechnung wollen wir uns jetzt beschaftigen. Dazu benotigen wir die partiellen Ableitungen 1. Ordnung der Potentialfunktion U, die sich unter Berucksichtigung von

r == Jx 2

+ y2 + Z2 == (x 2 + y2 + Z2)1/2

(1-133)

auch in der Form

(1-134) durch kartesische Koordinaten darstellen laBt. Wir differenzieren diese Funktion mit Hilfe der Kettenregel zunachst partiell nach der Variablen x:

Q x == _~.~ 3 = - 4nso . (x 2 + y2 + Z2)~ 4nso r

(1-135)

Entsprechende Ausdriicke erhalten wir fur die partiellen Ableitungen 1. Ordnung nach y bzw. z:

au ay == -

au fu == -

Q y 4 n C;o • r 3 '

Fur den Feldstdrkevektor

-

£ folgt

Q

z

(1-136)

4 n C;o • r 3

damit:

(au _e + -au _e + -au _) ax x ay Y az ez ==

E == - grad U == - .. -

z_)

Q y _ Q Q x _ == - . _ - - . -3 e - - _ . -3 e - - - . -3 e == ( 4 tt e0 Y r x 0 4 ti e r 0 4 tt c; r z Q

---.

- 4nc;0

x

ex + y e + z ez - -Q- . r - - -Q- . r- - - Q_ -- e y

r3

-

4nc;0 r 3

-

4nc;o r2 r - 4nc;o r2

r

(1-137)

e == -rr ein Einheitsvektor in radialer Richtung und somit von gleicher Richtung wie der Ortsvektor r. Der Feldstdrkevektor £ zeigt daher in jedem Punkt des

Dabei ist

r

Feldes radial nach aufien, sein Betrag

1£1 == E(r) == _Q4nc; or

2

(r > 0)

(1-138)

5 Divergenz und Rotation eines Vektorfeldes

71

ist wegen der Kugelsymmetrie des Feldes nur vom Abstand r abhangig, d. h. auf einer Kugelschale urn den Nullpunkt hat die elektrische Feldstarke E einen konstanten Betrag. Die ;fquipotentialflachen des elektrischen Feldes einer Punktladung Q sind demnach die Oberflachcn konzentrischer Kugeln, die ihren gcmcinsamen Mittelpunkt am Ort der felderzeugenden Ladung Q haben (Bild 1-64).

Aquipotentialflache (Kugelschale)

Bild 1-64

Die Aquipotcntialflachen des elektrischen Feldes einer Punktladung Q sind konzentrische Kugelschalen (ebener Schnitt durch die Punktladung)

5 Divergenz und Rotation eines Vektorfeldes 5.1 Divergenz eines Vektorfeldes 5.1.1 Ein einfiihrendes Beispiel Wir wollen den etwas abstrakten Begriff der .Divergenz" eines Vektorfeldes am Modell einer stromenden Fliissigkeit einfiihren. Die Geschwindigkeit eines Fliissigkeitsteilchens wird dabei im allgemeinen von Ort zu Ort verschieden sein. Die Strornung laBt sich dann durch das Geschwindigkeitsfeld (1-139) beschreiben, wobei die Geschwindigkeitskomponenten noch ortsabhdngig, d. h. Funktionen von x, y und z sind: (1-140) In diese Stromung bringen wir einen kleinen Quader mit den achsenparallelen Kanten der Langen ~x, ~y und ~z (Bild 1-65). Dabei setzen wir voraus, daB die Quaderflachen fur die Fliissigkeit vollig durchldssig sind. Durch das Einbringen des quaderformigen Korpers wird also die Fliissigkeitsstromung in keinster Weise behindert.

I Vektoranalysis

72

z

x

y

L\y

Bild 1-65 Vollig durchlassiger quaderformiger Korper in einer Fliissigkeitsstromung

Zunachst interessieren wir uns fur den Fliissigkeitsstrom durch die beiden zur x, zEbene parallelen Quaderflachen, die wir in Bild 1-66 grau unterlegt haben. Beitrage kommen dabei ausschliejJlich durch die y-Komponente des Geschwindigkeitsfeldes zustande.

v

Eintrtttsttecbe L\x L\z

Vy (x;

Y +L\y ;z)

L\y

Austrittstlectie L\x L\z

Bild 1-66 Fliissigkeitsstrom durch die Quaderoberflache in y-Richtung

Bei einem Quader mit sehr kleinen Kantenlangen (wie hier vorausgesetzt) konnen wir dann davon ausgehen, daB die Geschwindigkeitskomponente "» auf beiden Flachen einen jeweils nahezu konstanten Wert annimmt. Die Geschwindigkeitskomponente vy besitzt daher auf den grau unterlegten Quaderflachen die folgenden Werte (der Abstand der Flachen betragt i1y): .Einiriusflache", vy(x; y; z) "Austrittsfliiche": vy(x; y

+ i1y; z)


73

Wir bestimmen nun die Fliissigkeitsmengen (Fliissigkeitsvolumina), die in dem sehr kleinen Zcitintervall Ar durch die beiden grau unterlegten Quaderflachen in den Quader einbzw. austreten. Die .Jiintriusmenge'' betragt dabei (1-141)

Denn aIle diejenigen Fliissigkeitsteilchen, die sich zu einem Zeitpunkt t links von der "Eintrittsflache" befinden und von dieser einen Abstand haben, der nicht grofler ist als vy(x; y; z) I1t, legen in der nachfolgenden Zeit I1t den Weg I1s == vy(x; y; z) I1t zuriick und flieBen somit in diesem Zeitintervall durch die Eintrittsflache I1x I1z in den Quader herein. Analog erhalt man fur die in der gleichen Zeit durch die rechte Quaderflache ausgetretene Fliissigkeitsmenge den Wert

[vy(x; y

+ l1y; z) I1t] I1x I1z == vy(x; y + l1y; z) I1x I1z I1t

(1-142)

Die Differenz zwischen abgeflossener und zugeflossener Menge ist somit

+ l1y; z) I1x I1z I1t - vy(x; y; z) I1x I1z I1t == == [vy(x; y + l1y; z) - vy(x; y; z)] I1x I1z I1t

vy(x; y

(1-143)

Auf die Zeiteinheit bezogen ergibt dies einen .Uberschufs" von

[vy(x; y

+ l1y; z) -

vy(x; y; z)] I1x I1z

(1-144)

Wir erweitern diesen Ausdruck noch mit l1y und beachten dabei, daB 11 V == I1x l1y I1z das Quadervolumen bedeutet: (1-145)

Wenn wir diese Grobe noch durch das Quadervolumen 11 V dividieren, erhalten wir den" Volumengewinn" an Fliissigkeit pro Volumen- und Zeiteinheit. Er betragt somit

vy(x; y

+ l1y; z) - vy(x; y; z) l1y

(1-146)

Analoge Beitrage ergeben sich fur die x- und z-Richtung: In der x-Richtung durch die Geschwindigkeitskomponente vx(x; y; z):

vx(x

+ I1x; y; z) -

vx(x; y; z)

I1x

(1-147)

In der z-Richtung durch die Geschwindigkeitskomponente vz(x; y; z}:

vz(x; y; z

+ I1z) I1z

vz(x; y; z)

(1-148)

Man beachte dabei, dalidiese Beitrage aus mathematischer Sicht Differenzenquotienten darsteIlen!

I Vektoranalysis

74

Wir " verkleinern" jetzt unseren Quader, d. h. wir lassen die Kantenlangen ~x, ~y und ~z jeweils gegen Null gehen. Mit anderen Worten: Wir gehen von unserem Quader mit dem Volumen ~ V = ~x ~y Az zu einem infinitesimal kleinen (quaderformigen) Volumenelement dV = dx dy dz iiber, Bei diesem Grenziibergang streben die drei Differenzenquotienten gegen die entsprechenden partiellen Differentialquotienten oder partiellen Ableitungen 1.0rdnung:

Vx(x + ~x; y; z) - vx(x; y; z) ~x

Vy(x; y

+ ~y; z) -

vy(x; y; z)

~y

~

oV y oy

(1-149)

Durch Addition der einzelnen Beitrage in x-, y- und z- Richtung ergibt sich damit der folgende "Volumengewinn" an Fliissigkeit pro Volumen- und Zeiteinheit: (1-150) Man bezeichnet diese skalare Grobe als die .Divergenz" des Geschwindigkeitsfeldes v(x; y; z) und schreibt dafiir symbolisch:

(I-151) Im Volumenelement dV wird somit in der Zeiteinheit das Fliissigkeitsvolumen diIVV- dV= .(OV - x+oV -y+OV-z ) d V

ox

oy

oz

"erzeugt" oder " vernichtet". Die skalare Grobe div mungsmodell wie folgt anschaulich deuten:

(I -152)

v laBt sich daher in unserem Stro-

v

div > 0: Der abfliej3ende Anteil iiberwiegt, d. h. es tritt mehr Fliissigkeit aus als ein. Im Volumenelement dV befindet sich eine "Quelle", in der Fliissigkeit "erzeugt" wird.

v

div < 0: Der zufliej3ende Anteil iiberwiegt, d. h. es tritt mehr Fliissigkeit ein als aus. Im Volumenelement dV befindet sich eine .Senke", in der Fliissigkeit " vernichtet" wird.

v

div = 0: ZuflieBender und abflieBender Anteil halten sich das Gleichgewicht. Im Volumenelement dV befindet sich daher weder eine "Quelle" noch eine "Senke", das Stromungsfeld ist hier "quellenfrei".

75


5.1.2 Definition und Eigenschaften der Divergenz Aufgrund unseres Beispiels definieren wir den Begriff .Divergenz eines Vektorfeldes" allgemein wie folgt:

Anmerkungen (1) Bei einem ebenen Vektorfeld F(x; y) = zwei Summanden:

. -

oFx

( . )

(Fx(X~ y )

reduziert sich die Divergenz auf

F; x; y)

oFy oy

(1-154)

dIVF=-+-

ox

(2)

Die Bezeichnung .Divergenz" stammt aus der Hydrodynamik und bedeutet soviel wie "Auseinanderstromen einer Fliissigkeit" ("Divergieren "). Die skalare Grobe div F wird daher auch als "Quelldichte" oder "Quellstiirke pro Volumenelement" bezeichnet. Dabei gilt in Analogie zum Geschwindigkeitsfeld einer strornenden Fliissigkeit:

div i> 0: 1m Volumenelement befindet sich eine "Quelle". div i < 0: 1m Volumenelement befindet sich eine "Senke". div i = 0: 1m Volumenelement befindet sich weder eine "Quelle" noch eine "Senke", das Vektorfeld ist an dieser Stelle "quellenfrei".

F heiBt in

einem Bereich quellenfrei, wenn dort iiberall div F = 0

(3)

Ein Vektorfeld gilt.

(4)

In den Anwendungen in Physik und Technik werden Vektorfelder haufig durch Feldlinien veranschaulicht (z.B. elektrische Felder von Ladungen oder Geschwindigkeitsfelder bei stromenden Fltissigkeiten). Die Feldlinien "entspringen" dabei den "Quellen" und "enden" in den "Senken". Bei einem elektrischen Feld sind die positiven Ladungen als die "Quellen" und die negativen Ladungen als die "Senken" anzusehen. Bild 1-67 zeigt das Feldlinienbild zweier entgegengesetzt gleichgrofJer Ladungen.

76

I Vektoranalysis

Bild 1-67

"Quellen" und "Senken" in einem elektrischen Feld (hier ; Feldlinienbild fur zwei entgegengesetzt gleichstark geladene Kugeln)

Die Divergenz eines Vektorfeldes FUiBt sichformal auch als skalares Produkt aus NablaOperator Vund Feldvektor F darstellen:

e ox div

o

F == V. F ==

(1-155)

oy

o oz •

Beispiele

(1)

Wir nennen einige Beispiele fur quellenfreie Felder, die in den Anwendungen eine gewisse Rolle spielen: Homogene Vektorfelder wie z. B. das elektrische Feld in einem geladenen Plattenkondensator Elektrisches Feld einer Punktladung Gravitationsfeld einer Masse Magnetfeld in der Umgebung eines stromdurchflossenen linearen Leiters

(2)

Wir bilden die Divergenz des Ortsvektors In der Ebene gilt:

_ (x) r ==

y

==>

._

div r == -

0

ox

(x)

+ -0

oy

r in Ebene und Raum:

(y) == 1

+ 1 == 2

1m Raum dagegen gilt:

_ div r

==

0 0 0 -5 (x) + - (y) + - (z) == 1 + 1 + 1 == 3 x

oy

oz

77


(3)

W~ b~re~h~en die Divergenz des Vektorfeldes F = ( - ::~2Z2) im Punkt P - (1,2,1).

-

xyz

a ax

a

a az

div F = -(x 2z) + -(- 4 y 2 Z 2 ) + _( x y z 2 ) = 2xz - 8 y z 2

ay

+ 2xyz

(div F)o = 2 - 16 + 4 = - 10 (4)

1m Innern einer homogen geladenen Kugel herrscht die elektrische Feldstarke

(1;1

~ R)

(R: Kugelradius; Q: Ladung der Kugel;

8 0: elektrische Feldkonstante). Wir bestimmen die Divergenz dieses kugelsymmetrischen Vektorfeldes und verwenden dabei das Ergebnis aus Beispiel (2):

(nach Beispiel (2) ist div F = 3 bei einem rdumlichen Ortsvektor). Mit der Ladungsdichte QI= e

Ladung Volumen

Q

3Q

=--=-~nR3 4nR 3

konnen wir dafur auch schreiben: div

E = Qel

/ 80

Diese wichtige Beziehung besagt, daB jeder Punkt im Innern der geladenen Kugel eine Quelle des elektrischen Feldes ist.

•

Wir schlieBen mit einigen wichtigen Rechenregeln fur Divergenzen:

1 Vektoranalysis

78

5.1.3 Ein Anwendungsbeispiel: Elektrisches Feld eines homogen geladenen Zylinders Wir wollen uns nun mit dem elektrischen Feld eines unendlich langen homogen geladenen Zylinders beschaftigen (Zylinderradius: R; Ladungsdichte: Qel). Im Innern des Zylinders besitzt das axialsymmetrische Feld die elektrische Feldstarke

E==~(~) 2E 0

(1-161)

o .

im AufJenraum dagegen die Feldstarke

(1-162)

(EO: elektrische Feldkonstante). Bild 1-68 zeigt einen ebenen Schnitt durch das Feld senkrecht zur Zylinderachse (z-Achse), wobei wir von einer positiven Ladungsdichte ausgegangen sind. Da die z-Komponente der Feldstarke im gesamten Bereich verschwindet tE, == 0), haben wir es mit einem ebenen Vektorfeld zu tun.

y

Aquipotentialflache

x Zylinderquerschnitt

Bild 1-68

Elektrisches Feld in der Umgebung eines homogen geladenen Zylinders (positive Ladungsdichte; ebener Schnitt senkrecht zur Zylinderachse)

Elektrisches Feld au6erhalb des Zylinders

Wir zeigen zunachst, daB das ·elektrische Feld aufJerhalb des Zylinders quellenfrei ist (div E == 0).

5 Divergenz und Rotation eines Vektorfeldes Dazu benotigen wir die partielIen Ableitungen

oe,

fu = _

Gel

R

2

~.

a(

x

)

ax x + y2 2

oE _x

ax

und

oE oy

_Y,

die wir nun berechnen:

=

R 2 .1(x 2 + y2) -2-.x' x = 28 (X2 + y2)2

R 2 . y2 - x 2 280 (X2 + y2)2

Gel

-

79

GeI

0

(1-163)

Analog: oE y

Gel

R2

a(

ay = ~ . oy

R 2 x 2 _ y2 ) Gel + y2 = ~ . (X2 + y2)2 y

X2

(1-164)

Somit ist _

oE X.

div E = OX

se

+ 0; =

G R 2 ( y2 -

;[;0

(X2

X

2

X

2

_

y2 )

+ y2)2 + (X2 + y2)2 = 0

(1-165)

Das elektrische Feld im Auj3enraum des geladenen Zylinders ist daher quellenfrei. Physikalische Begriindung: Auj3erhalb des Zylinders befinden sich keine Ladungen.

Elektrisches Feld innerhalb des Zylinders Im lnnern des Zylinders dagegen verschwindet die Divergenz des Vektorfeldes

E nicht.

Vielmehr gilt: divE =

~(~(X) + ~(y)) = ~(1 + 1) = Gel 28 ax oy 28 8 0

0

(1-166)

0

Diese wichtige Beziehung gehort zu den Maxwellschen Gleichungen der Elektrodynamik und besagt, daB die positiven Ladungen im Zylinderinnern die Quellen des elektrischen Feldes sind.

5.2 Rotation eines Vektorfeldes 5.2.1 Definition und Eigenschaften der Rotation Bei der mathematischen Behandlung elektrischer und magnetischer Felder sowie der Geschwindigkeitsfelder stromender Fliissigkeiten erweist sich eine weitere Differentialoperation als sehr niitzlich, die als "Rotation" des entsprechenden Vektorfeldes bezeichnet wird. Ein einfaches Beispiel fur ein solches Geschwindigkeitsfeld v = v(x; y; z) liefert die (stationare) Wasserstromung in einem Kanal. Die Stromungsgeschwindigkeit ist dabei in der Kanalmitte am grolrten, nimmt jedoch (durch Reibungskrafte bedingt) zum Ufer hin abo Kleine, in die Stromung gebrachte Kugeln rotieren in Ufernahe infolge des dortigen Geschwindigkeitsgefalles urn ihre Achsen und erlauben somit einen anschaulichen Einblick in die Bewegung der dortigen Wasserteilchen. Diese Rotation laBt sich nun in geeigneter Weise durch einen Vektor mit der Bezeichnung "Rotation des Geschwindigkeitsfeldes" beschreiben. (Siehe Skizze nachste Seite oben).

1 Vektoranalysis

80

Die Richtung dieses Vektors fallt dabei in die jeweilige Drehachse der rotierenden Kugel (bzw. des Wasserteilchens), wahrend der Betrag des Vektors als ein geeignetes MaB fiir die Starke der "Fliissigkeitswirbel" dient. Allgemein definieren wir den Begriff "Rotation eines Vektorfeldes" wie folgt:

Anmerkungen

(1)

Bei einem ebenen Vektorfeld F(x; y) =

(Fx({X: Y))) r; x,y

verschwindet sowohl die x-Kom-

ponente als auch die y-Komponente der Rotation automatisch. Die verbleibende z-Komponente lautet:

-

aF aFx ax ay y

(1-168)

(rotF) = - - z

Somit gilt fur ein ebenes Vektorfeld:

- (aF aFx ax ay y

rotF= - - -) _e

(1-169)

Z

(2)

Die Bezeichnung "Rotation" stammt aus der Hydrodynamik und beschreibt dort die Bildung von "Wirbeln" (geschlossene Feldlinien bei Geschwindigkeitsfeldern stromcnder Fliissigkeiten).

(3)

Der Vektor rot F wird auch als "Wirbeldichte" des Feldes F bezeichnet.

(4)

Das Vektorfeld rot F wird haufig auch als Wirbelfeld zu F bezeichnet.

(5)

Ein Vektorfeld F heiBt in einem Bereich wirbelfrei, wenn dort iiberall rot F =

0gilt.


81

Die Rotation eines Vektorfeldes f Hifit sich formal auch als Vektorprodukt aus dem "Nabla-Operator" Vund dem Feldvektor f darstellen:

aFz _ aF ay az

a

y

ax rot

a

f == V x f ==

ay

x

et;

st,

az

ax

(1-170)

---

a

az Desweiteren besteht die Moglichkeit der Determinantenschreibweise 6): ex

rot

a

F == -ax r,

ey

e.

a

ay

a az

r;

Fz

-

(1-171)

Durch Entwicklung dieser Determinante nach den Elementen der ersten Zeile erhalt man genau die Definitionsformel (1-167). •

Beispiele

(1)

Die folgenden Vektorfelder der Physik sind stets wirbelfrei: Homogene Vektorfelder (Beispiel: elektrisches Feld in einem geladenen P lattenkondensator) Kugel- oder radialsymmetrische Vektorfelder (Zentralfelder) (Beispiele: elektrisches Feld einer Punktladung, Gravitationsfeld einer Masse)

Z ylinder- oder axialsymmetrische Vektorfelder (Beispiel: elektrisches Feld in der Umgebung eines geladenen Zylinders) (2)

Die Rotation desOrtsvektors -; verschwindet (in Ebene und Raum):

rot -; ==

V x -; ==

a ax a ay

a az

6)

x x

y

z

a

a az a -(z) ax a -(x)

-(z) - -(y) ay

a az a -(y) ax -(x) -

ay

0 0

==0

0

In Band 1, Abschnitt 11.3.4.1 haben wir gezeigt, daf sich ein Vektorprodukt formal durch eine 3-reihige Determinante darstellen HiBt.

82

I Vektoranalysis

(3)

Wir berechnen die Rotation des Geschwindigkeitsfeldes Punkt P == (1; - 1; 1). Zunachst erhalten wir fiir rot

ex rot

v == ox0 x z"

_

4:~4) im 2 y Z2

v in der Determinantenschreibweise:

ey

ez

0

0

oy

OZ

- 4xz

2 y z2

-

-

v == (

Entwicklung nach den Elementen der ersten Zeile liefert:

2 0

- [0

rotv= -(2yz )--(-4xz) oz oy

J -e [0-(2yz 2)--(xz) 0 4J-e + ox oz x -

y

4J-e.> 0 0 + [ -(-4xz)--(xz) ox

oy

ex- (O - 4 x z e + ( + 4x) ex + 4xz e 4z e

==(2z 2 +4x) (2z 2

==

ImPunkt P

==

3

)

y -

y

4 z - 0)

e= z

z

(1; - 1; 1) gilt dann:

(rot F)o == (2 + 4) (4)

3

ex + 4 ey - 4 e == 6 ex + 4 ey - 4 e z

z

Im Innern einer homogen geladenen Kugel wird das elektrische Feld durch den Feldstdrkevektor

dargestellt (R: Kugelradius; Q: Ladung der Kugel; stante). Die Rotation dieses Feldes verschwindet: rot E ==

Q . rot 4n Go R 3

GO:

elektrische Feldkon-

r == 0 r

Denn nach Beispiel (2) ist rot == O. Das elektrische Feld im I nnern der geladenen Kugel ist somit wirbelfrei.

•


83

AbschlieBend geben wir noch die wichtigsten Rechenregeln fur Rotationen an:

5.2.2 Ein Anwendungsbeispiel: Geschwindigkeitsfeld einer rotierenden Scheibe Eine dunne homogene Scheibe rotiere mit der konstanten Winkelgeschwindigkeit z urn die Symmetrieachse der Scheibe (z-Achse; Bild 1-69) 7).

OJ == W o

e

rotierende Scheibe

Bild 1-69

y

Gleichmalsig urn die Symmetrieachse (z-Achse) rotierende Scheibe

p

x

Wir betrachten jetzt ein beliebiges Teilchen auf der Scheibe mit dem Ortsvektor besitzt den folgenden Geschwindigkeitsvektor:

v = wx r = ( 7)

~o

) x(

~

)

= (

-

~:~

)

Die Scheibe wird als [ldchenhafter Korper angesehen (Schichtdicke ~ Null).

r. Es

(1-177)

1 Vektoranalysis

84

Dieses ebene Geschwindigkeitsfeld ist ein Wirbelfeld, da die Rotation von v nicht verschwindet, wie wir gleich zeigen werden. Da bei einem ebenen Vektorfeld die ersten beiden Komponenten der Rotation automatisch verschwinden, miissen wir nur noch die z-Komponente bestimmen. Nach Formel (1-168) gilt dann:

oVy

-+

(rot v)z

= -

ox

ov x

- -

oy

0

0

(wox) - - (- woy) ox oy

= -

=

Wo + Wo = 2w o i= 0

(1-178)

Damit ist rot

v = 0 ex + 0 e + 2w o ez = y

2w o

e= z

2 W i=

0

(1-179)

Das Geschwindigkeitsfeld ist also - wie behauptet - ein Wirbelfeld. Die Feldlinien (Teilchenbahnen) sind dabei konzentrische Kreise, wie man der Anschauung unmittelbar entnehmen kann (Bild 1-70).

~

v

kreistormiqe Feldlinie

Bild 1-70 Geschwindigkeitsfeld einer gleichmabig urn die Symmetrieachse (z-Achse) rotierenden Scheibe

Sie konnen auch aus der Bedingung (1-101), d.h. hier also aus der Gleichung

v x dr = 0

(1-180)

direkt ermittelt werden:

vx dr

=

d;

- Wo Y ) ( dx ) ~o x x = (

= Wo

Wo

( - y)

~

x

d;

( dx )

( 0 ) (0) =

0

- y dy - x dx

=

(I-181)

0

0

Somit gilt: - y dy - x dx = 0

oder

y dy

+ x dx =

0

(1-182)


85

Diese Differentialgleichung 1. Ordnung haben wir bereits in Abschnitt 3.3 (Beispiel (2)) gelost. Sie fiihrte uns zu den Kurven x2

+ y2 == const. == c

(c > 0)

(1-183)

d. h. zu konzentrischen Kreisen urn den Koordinatenursprung mit den Radien r == ~.

5.3 Spezielle Vektorfelder 5.3.1 Quellenfreies Vektorfeld Ein Vektorfeld F, dessen Divergenz verschwindet (div frei. Wir wollen zunachst zeigen, daB ein Wirbelfeld somit der Gleichung div

F == 0), heiBt bekanntlich quellenF == rot E stets quellenfrei ist und

F == div(rot E) == 0

(1-184)

geniigt. Mit

E == Ex

ex

+ E y e y + Ez"oez

(1-185)

und

y) x OE z) _ (OE y OE x)_ rot E- == (OE - z - -OE _e + (OE oy oz x -oz - -ox ey + -ox - -0y ez

(1-186)

erhal ten wir

(1-187) Denn die in den Klammern stehenden Ausdriicke verschwinden nach dem Satz von Schwarz, wenn wir voraussetzen, daB die Vektorkoordinaten von E stetige partielle Ableitung 2. Ordnung besitzen 8). Unter diesen Voraussetzungen gilt somit div(rot E) == 0

(1-188)

und ein Wirbelfeld ist daher stets quellenfrei.

Umgekehrt laBt sich zeigen, daB ein quellenfreies Vektorfeld Vektorfeldes E, Vektorpotential genannt, darstellbar ist: div

8)

F == 0

=>

F == rot E

F stets

als Rotation eines (1-189)

Die Reihenfolge, in der die Differentiationen ausgefiihrt werden, spielt dann keine Rolle und die in den jeweiligen Klammern enthaltenen partiellen Ableitungen sind somit gleich.

86

1 Vektoranalysis

Das Vektorpotential deutig bestimmt.

_

E ist

dabei bis auf den Gradienten einer skalaren Funktion ¢ ein-

Beispiele

Die folgenden Vektorfelder der Physik sind quellenfrei: H omogenes elektrisches Feld in einem geladenen Plattenkondensator

Elektrisches Feld einer Punktladung Gravitationsfeld der Erde Magnetfeld in der Umgebung eines stromdurchflossenen linearen Leiters _

5.3.2 Wirbelfreies Vektorfeld Ein Vektorfeld If, dessen Rotation verschwindet (rot F == 0), bezeichnen wir bekanntlich als wirbelfrei. Wir zeigen zunachst, daB ein Gradientenfeld F == grad ¢ stets wirbelfrei ist und somit die Bedingung rot

F == rot (grad ¢) == 0

(1-192)

erfiillt, Mit

grad ¢

o¢ _ o¢ _ o¢_ ox ex + -oy e + -OZ ez

== -

(1-193)

y

folgt zunachst (in der speziellen Determinantenschreibweise)

rot (grad

0

¢) == ox o¢ ox

ez

ey

ex

0

0

oy

oz

-

o¢

-

oy

o¢

-

oz

(1-194)


87

Wir entwickeln diese Determinante nach den Elementen der ersten Zeile und erhalten rot (grad

¢) == [~oy (o¢) ex - [~(o¢) oz - ~oz (o¢)J oy ox oz - ~oz (o¢)J ox e + y

(1-195) Wenn wir voraussetzen, daB die partiellen Ableitungen 2. Ordnung des skalaren Feldes ¢ stetig sind, so verschwinden nach dem Satz von Schwarz die in den Klammern stehenden Ausdriicke und es gilt rot (grad ¢) ==

0

(1-196)

Unter den genannten Voraussetzungen ist ein Gradientenfeld also stets wirbelfrei. Umgekehrt HiBt sich zeigen, daB ein wirbelfreies Feld stets als Gradient eines skalaren Feldes dargestellt werden kann: rot

•

F == 0 => F == grad ¢

(1-197)

Beispiele

Die folgenden Vektorfelder der Physik sind stets wirbelfrei:

Homogene Vektorfelder wie z. B. das elektrische Feld in einem geladenen Plattenkondensator Kugel- oder radialsymmetrische Vektorfelder (Zentralfelder) wie z. B. das elektrische Feld einer Punktladung oder das Gravitationsfeld der Erde Z ylinder- oder axialsymmetrische Vektorfelder wie z. B. das elektrische Feld in der Umgebung eines geladenen Zylinders

•

88

I Vektoranalysis

5.3.3 Laplace- und Poisson-Gleichung Fur ein quellen- und zugleich wirbelfreies Vektorfeld jf miissen die folgenden Gleichungen erfiill t sein: div jf == 0

rot jf ==

und

0

(1-200)

Ein solches Vektorfeld ist dann wegen seiner Wirbelfreiheit als Gradient eines skalaren Feldes cjJ darstellbar:

jf == grad cjJ

(1-201)

Wir setzen diese Beziehung in die erste der beiden Gleichungen (1-200) ein und erhalten div jf

== div(grad cjJ) ==

0

(1-202)

Mit

acjJ -+e + -acjJ -+e ax x ay

grad cjJ == -

Y

acjJ-+

+ -az ez

(1-203)

wird daraus schlieBlich

~ (acjJ) + ~ (acjJ) + ~ (acjJ) == a 2 + a + a 2 == 0 ax ax ay ay az az ax ay2 az 2cjJ

div(grad ¢) =

2cjJ

2cjJ

(1-204)

Diese partielle Differentialgleichung 2. Ordnung fur das skalare Feld cjJ HiBt sich mit Hilfe des sog. "Laplace-Operators"

(1-205) vcrkiirzt auch wie folgt schreiben: div(grad cjJ)

==

~cjJ

== 0

(1-206).

Sie wird in den Anwendungen als Laplacesche Differentialgleichung oder kurz als Laplace-Gleichung bezeichnet.Der Laplace-Operator ~ kann dabei auch als das skalare Produkt des Nabla- Vektors V mit sich selbst aufgefaBt werden:

~==V·V==

a ax a

-

a ax a -

a az

a az

ay

ay

a2 ax

a2

a2 az

==-+-+2 2

ay2

(1-207)

In der Operatoren-Schreibweise gilt somit: div(grad cjJ)

== V· (VcjJ) == (V· V)cjJ == ~cjJ

(1-208)


89

Die Losungen der Laplace-Gleichung 11¢ = 0 werden als harmonische Funktionen bezeichnet. Die Laplace-Gleichung ist dabei ein Sonderfall der allgemeineren Poissonschen-Differentialgleichung

11¢ = f(x; y; z)

(1-209)

die auch als Potentialgleichung bezeichnet wird, da sie z. B. bei der Beschreibung des Potentials eines elektrischen F eldes von groBer Bedeutung ist. Die Losung ¢ der Poissonoder Potentialgleichung heiBt daher auch Potentialfunktion oder kurz Potential. Wir fassen zusammen:

Anmerkungen

(1)

Die Hintereinanderanwendung der Differentialoperatoren "div" und "grad" fuhrt somit zum "Laplace-Operator" 11: div(grad) =

V.V = 11

11 ist ebenfalls ein Differentialoperator (von 2. Ordnung).

(I-213)

90

1 Vektoranalysis

(2)

Ein wirbelfreies Vektorfeld ff (rot ff = 0) HiBt sich stets als Gradient eines skalaren Feldes ¢ darstellen: ff = grad ¢. Ist das Vektorfeld zusatzlich auch noch quellenfrei (div ff = 0), so ist ¢ eine Losung der Laplace-Gleichung, ansonsten jedoch eine Losung der Poisson-Gleichung.

(3)

Ein wirbelfreies Quellenfeld div

ff #0

und

ff erfiillt die rot ff = 0

Bedingungen (1-214)

und wird auch als ein Poisson-Feld bezeichnet, da in diesem Fall die zugehorige Potentialfunktion ¢ eine Losung der Poisson-Gleichung ist. 1st das Vektorfeld ff jedoch quellen- und wirbelfrei, gilt somit div

ff = 0

rot ff =

und

0

(I-215)

so heiBt dieses Feld auch ein Laplace-Feld. Denn die zugehorige Potentialfunktion ¢ ist in diesem Fall eine Losung der Laplace-Gleichung. (4)

Bei einem ebenen Problem reduziert sich der Laplace-Operator auf

a ax

a ay 2

2 2 ~ ~ ~=V·V=-+2

•

(1-216)

Beispiele

(1)

Wir zeigen, daf die Funktion ¢ = In

(~) im Zweidimensionalen eine harmo-

nische Funktion ist, d. h. eine spezielle Losung der Laplace-Gleichung ~¢ = 0 darstellt (r > 0). Zunachst bringen wir die Funktion ¢ durch elementare Umformungen und unter Beriicksichtigung von r = x 2 + y2 = (x 2 + y2) 1/2 auf eine fur die

J

Differentiation geeignetere Form:

¢ = In

G)

= In 1 -Inr = -Inr = -In(x

2

+ y2)1/2 =

-

~

o

In(x 2

Die benotigten partiellen Ableitungen 2. Ordnung lauten dann:

a¢ a[ ax 2 = ax 2

Analog:

a2 ¢

ay 2

y2 _ x2 (x2

J

2 x 1 (x + y2) - 2x . X x 2 - y2 2 2 x + y2 = (x + y2)2 = (x 2 + y2)2

+ y2)2

+ y2)


91

Somit gilt:

Die Funktion ¢ = In (2)

(~) ist daher eine Losung der Laplace-Gleichung.

Das rdumliche skalare Feld ¢ == In r ist eine (spezielle) Losung der Poisson-

Gleichung 11¢ = 12 (r > 0). Urn dies zu zeigen, bringen wir die gegebene Funkr

J

tion zunachst einmal unter Beachtung der Beziehung r == x 2 + (x 2 + y2 + Z2) 1/2 auf eine beim Differenzieren giinstigere Form:

Wir differenzieren jetzt zweimal partiell nach x und erhalten:

_ x2 +

y2

+

Z2

+ y2 + Z2)2

(x 2

Analog: 02 ¢

x2

oy2

(x +

y2

_

2

y2

+ Z2 +

02¢

Z2)2'

OZ2

x2

(x 2

+ y2 +

y2

_

Z2

+

Z2)2

Somit ist:

_ x2

x2 (x 2

+ y2 + Z2 + x 2 _ y2 + Z2 + x 2 + y2 (x 2 + y2 + Z2)2

+

y2

+

1

Z2

+ y2 + Z2)2

x2

+ y2 + Z2

1 r2

_

Z2

y2

+

Z2

==

I Vektoranalysis

92

Damit haben wir gezeigt, daB die Funktion cjJ == In r tatsachlich eine (spe1 zielle) Losung der Poisson-Gleichung J1.¢ = 2" ist (im Zweidimensionalen ist r _ dies aber nicht der Fall).

5.3.4 Ein Anwendungsbeispiel: Potentialgleichung des elektrischen Feldes In einem elektrischen Feld besteht zwischen dem elektrostatischen Potential U und der elektrischen Feldstdrke E die Beziehung

E ==

-

grad U

(1-217)

Das Feld wird dabei von einer Raumladung mit der (im allgemeinen ortsabhangigen) Ladungsdichte Qel == Qel (x; y; z) erzeugt. Feldstarke E und Ladungsdichte Qel sind dabei durch die fundamentale M axwellsche Gleichung diIV E- ==Qel

(I-218)

80

miteinander verkniipft (80: elektrische Feldkonstante). Das Potential U geniigt dann einer Poisson-Gleichung. Denn aus div

E = div( -

grad U) == - div(grad U) = - J1.U ==

Qel

(1-219)

80

folgt

J1.U = _

Qel

(1-220)

80

Diese partielle Differentialgleichung 2. Ordnung wird in der Elektrodynamik als Potentialgleichung bezeichnet. Sie geht im Falle eines ladungsfreien Feldes in die Laplace'sche Differentialg leichung

J1.U=O

(1-221)

iiber.

6 Spezielle ebene und raurnliche Koordinatensysteme 6.1 Polarkoordinaten 6.1.1 Definition und Eigenschaften der Polarkoordinaten Polarkoordinaten verwendet man vorzugsweise bei ebenen Problemen mit Kreis- oder Radialsymmetrie. Wir haben sie bereits in Band 1 (Abschnitt 111.3.3) ausfiihrlich beschrieben und beschranken uns daher auf eine kurze Zusammenfassung ihrer wichtigsten Eigenschaften, die fiir die weiteren Ausfiihrungen benotigt werden.

6 Spezielle ebene und raumliche Koordinatensysteme

93

94

I Vektoranalysis

Anmerkungen (1) Die Abstandskoordinate r ist die Lange (der Betrag) des Ortsvektors == OP. Daher ist stets r ~ o.

r

~

(2)

Der Winkel qJ wird positiv gezahlt bei Drehung im Gegenuhrzeigersinn (mathematisch positiver Drehsinn), negativ dagegen bei Drehung im Uhrzeigersinn (mathematisch negativer Drehsinn). Er ist jedoch nur bis auf ganzzahlige Vielfache von 360° bzw. 2n bestimmt. Man beschrankt sich bei der Winkelangabe daher meist auf den im Intervall 0° ~ qJ < 360° bzw. 0 ~ qJ < 2n gelegenen Hauptwert.

(3)

Der Koordinatenursprung, in diesem Zusammenhang auch als Pol bezeichnet, hat die Abstandskoordinate r == 0, die Winkelkoordinate qJ dagegen ist unbestimmt.

(4)

Die Berechnung der Polarkoordinaten aus den (gegebenen) kartesischen Koordinaten erfolgt am zweckmafiigsten anhand einer Lageskizze des Punktes P, urn Fehler bei der Winkelberechnung zu vermeiden. Der Winkel tp wird dabei iiber einen Hilfswinkel in einem rechtwinkligen Dreieck berechnet (Einzelheiten und Beispiele hierzu in Band 1, Abschnitt 111.3.3.1).

6.1.2 Darstellung eines Vektorsin Polarkoordinaten In einem (ebenen) kartesischen Koordinatensystem wird ein Vektor

ain der Form (1-224)

dargestellt (Bild 1-73). Dabei sind ex und e y zwei Einheitsvektoren in Richtung der xbzw. y-Achse. Sie bilden die Basis fur diese Vektordarstellung und werden daher als Basisvektoren bezeichnet. y

Bild 1-73

Darstellung eines Vektors im kartesischen Koordinatensystem

x

a

Die Vektorkoordinaten ax und ay sind dabei die Projektionen des Vektors auf diese Einheitsvektoren, unter Beriicksichtigung der Richtung, in die diese Projektionen fallen 9). 9)

Vereinbarungsgemdfi gilt: Eine Vektorkoordinate wird positiv gezahlt, wenn der Projektionsvektor die gleiche Richtung hatwie der entsprechende Einheitsvektor. Ansonsten wird die Vektorkoordinate negativ gezahlt,


95

a

Unsere Aufgabe besteht nun darin, den Vektor in Polarkoordinaten darzustellen, wobei wir zunachst zwei geeignete Einheitsvektoren als Basisvektoren benotigen, Basisvektoren in Polarkoordinaten

Die im kartesischen Koordinatensystem verwendeten Basisvektoren ex und e y sind die (konstanten) Tangenteneinheitsvektoren an die x- bzw. y- Koordinatenlinien. Analog verfahren wir bei den Polarkoordinaten. Auch hier erweisen sich die Tangenteneinheitsvektoren an die r- bzw. cp- Koordinatenlinien als eine geeignete Basis fur die Darstellung eines beliebigen Vektors (Bild 1-74). Wir bezeichen diese Einheitsvektoren (Basisvektoren) mit e r und e die mit einem Vorzeichen versehenen Projektionen des Vektors Q auf die beiden Basisvektoren r und eq> (Bild 1-76) 10). Mit anderen Worten: Die (positiven oder negativen) Grollen a, und aq> sind die Vektorkoordinaten oder skalaren Vektorkomponenten des Vektors Q, bezogen auf die Basis r , eq>' Uns interessiert nun natiirlich, wie sich die neuen Vektorkoordinaten an aq> aus den alten (kartesischen) Vektorkoordinaten ax, "» berechnen lassen.

e

e

10)

Beziiglich des Vorzeichens gilt die gleiche Vereinbarung wie bei der kartesischen Vektordarstellung.

98

I Vektoranalysis

Aus diesem Grund driicken wir in Gleichung (1-224) die alten Basisvektoren ex, e y mittels der Transformation (1-229) durch die neuen Basisvektoren eq> aus:

en

a== ax ex + a

ey

y

==

ax (cos cp e r

==

ax . cos cp e r

==

(ax' cos tp

==

sin cp eq»

-

+ ay (sin tp e r + cos

cp eq»

==

ax . sin cp eq> _+ a; . sin cp e r + ay • cos cp eq>

-

+a

y '

sin cp) e r

+ (-ax'

sin cp

+a

y '

==

cos cp) eq>

(1-232)

a, Wir erhalten somit die folgenden Transformationsgleichungen:

a,

==

aq>

== -

+ ay • sin cp ax . sin cp + ay • cos cp

ax . cos cp

(1-233)

Oder - in der Matrizenform -: (1-234) A

Die Transformationsmatrix A ist dabei die gleiche wie bei der entsprechenden Transformation der Basisvektoren. Die Vektorkoordinaten eines beliebigen Vektors transformieren sich somit beim Ubergang von den kartesischen Koordinaten zu den Polarkoordinaten in der gleichen Weise wie die Basisvektoren!

a

Umgekehrt lassen sich auch die kartesischen Vektorkoordinaten ax, ay durch die Vektorkoordinaten an aq> im Polarkoordinatensystem ausdrucken. Die Transformation erfolgt dabei iiber die zu A inverse Matrix A-I:

a

(a

r ) - sin cp ) ( r ) == A-I cos cp aq> aq>

Wir fassen die wichtigsten Ergebnisse wie folgt zusammen:

(1-235)


99

Anmerkung

Die Riicktransformation, d. h. der Ubergang von den Polarkoordinaten zu den kartesischen Koordinaten, erfolgt tiber die zu A inverse Matrix A-I. Sie lautet: A-I =

(c~s cp SIn

•

cp

- sin cp) cos cp

(1-239)

Beispiel

In einem kartesischen Koordinatensystem ist das folgende Geschwindigkeitsfeld definiert: _ v

=

_() v x; y

=

1 x

2

+y

( 2

-

_ _) Y ex + x ey

Es besitzt im Polarkoordinatensystem die Darstellung v = v(r; cp) = u,

e + v
0)

•

6.1.3 Darstellung von Gradient, Divergenz, Rotation und Laplace-Operator in Polarkoordinaten Die Differentialoperationen Gradient, Divergenz und Rotation sowie der Laplace-Operator lassen sich auch durch Polarkoordinaten ausdriicken. Sie besitzen dann die folgende Gestalt 11):

11)

Auf die Herleitung dieser Ausdriicke wollen wir verzichten und verweisen den an Einzelheiten interessierten Leser auf die Spezialliteratur (siehe Literaturverzeichnis).


101

Anmerkung

Der in Polarkoordinationen ausgedriickte Laplace-Operator enthalt auch eine leitung im Gegensatz zur kartesischen Darstellung.

•

j

0

Ab-

Beispiele (1)

Wir berechnen die Divergenz des ebenen Ortsvektors Radialkomponente r besitzt:

r = r er, der nur eine

10 10 1 dlvr=dlv(r er)=-o-(ror)=-o-(r 2 )=-02r=2 0_

0

_

r or

r or

r

Zum gleichen Ergebnis kamen wir bereits in der kartesischen Darstellung (Beispiel (2) aus Abschnitt 5.102)~ (2)

Wir wollen zeigen, daB das Geschwindigkeitsfeld _ v

=

_() v x; y

=

1

x

2

+y

( 2

quellen- und wirbelfrei ist.

-

_ _) Y ex + x ey

102

I Vektoranalysis In Polarkoordinaten besitzt dieses Vektorfeld die folgende, besonders einfache Darstellung: _

_

1_ (r > 0)

v == v(r; r

(siehe hierzu das Beispiel im vorherigen Abschnitt 6.1.2). Fur die Divergenz und Rotation des Geschwindigkeitsfeldes erhalten wir dann:

. _ . (1r _)q> == -1r . -o

rot

v == 0

v

Wegen div == 0 und rot == 6 handelt es sich in der Tat urn ein quellen- und wirbelfreies Geschwindigkeitsfeld. (3)

Wir interessieren uns nun fur diejenigen Losungen der Laplace-Gleichung i1¢ == 0, die Rotationssymmetrie besitzen, d. h. nur von der Abstandskoordinate r abhangen: ¢ == 1(r). Die Laplace-Gleichung lautet in diesem Fall wie folgt:

Diese Differentialgleichung 2. Ordnung konnen wir auch in der Form 1

+ -' ¢'(r) == 0

¢"(r)

(cP/(r) =

r

~~)

schreiben. Wir losen sie mit Hilfe der Substitution u == ¢' (r),

u' == ¢" (r)

durch "Trennung derVariablen" (Band 2, Abschnitt V.2.2):

+ ~ . u == 0

u'

du dr

f

u

du

r

u

dU --; == - fdr --;:

In u

du dr

=>

u r

-+-==0

oder

r

dr r In u == - In r

+ In r == In (u r) == In C 1

+ In C 1


103

Rucksubstitution und anschlieBende unbestimmte Integration ergeben dann: u = ep'(r) = C 1 r

Die rotationssymmetrischen Losungen der LapIace-GIeichung sind somit (im ebenen Fall) durch die logarithmischen Funktionen cjJ (r) = C 1 . In r

+ C2

(r > 0)

•

gegeben (C 1 , C 2 ElR).

6.1.4 Ein Anwendungsbeispiel: Geschwindigkeitsvektor bei einer glelchformlgen Kreisbewegung Ein MasseteiIchen bewege sich gleichfiirmig, d. h. mit der konstanten WinkeIgeschwindigkeit co auf einer Kreisbahn mit dem Radius R (BiId 1-77). Wir beschreiben diese Bahn durch den zeitabhdngigen Ortsvektor -+

r(t)

fur t

~

=

R· cos(wt) ex + R· sintoir) ey - + .

-+

t))

(COS(W R.. . sint«i t)

=

0 (Anfangslage zur Zeit t = 0: Punkt A).

y

A

x Bild 1-77 Gleichformige Kreisbewegung

(1-246)

I Vektoranalysis

104

Durch Differentiation nach dem Zeitparameter t erhalten wir daraus den Geschwindigkeitsvektor

~

-+

v(t)=r(t)=R

(-w,sin(wt)) (-sin(wt)) =Rw co . cos(wt) cos(wt)

(1-247)

Das Teilchen besitzt somit die kartesischen Geschwindigkeitskomponenten Vx

= - Rw' sin(wt)

"» = Rei cos(wt)

und

Wir interessieren uns jetzt fur die Darstellung des Geschwindigkeitsvektors koordinaten, d. h. fur eine Darstellung in der Form

(1-248)

v in Polar(1-249)

Beim Ubergang von den kartesischen Koordinaten zu den Polarkoordinaten transformieren sich die kartesischen Geschwindigkeitskomponenten V x und vy nach Gleichung (1-234) bzw. (1-238) wie folgt: (1-250)

Wir setzen noch fur V x und "» die Zeitabhangigkeiten ein und beachten ferner, daB bei der gleichformigen Kreisbewegung die Beziehung cp = cot gilt: Vr (

vq>

) =(

cos(wt) - sin(wt)

= Rw (

Sin(wt))RW(-sin(wt))= cos(wt) cos(wt)

cos(w t) - sin(wt)

sin(w t)) ( - sin(w t) ) cos(wt) cos(wt)

(1-251)

Nach Durchfuhrung der Matrizenmultiplikation erhalten wir fur die gesuchten Geschwindigkeitskomponenten u, und vq> dann die folgenden Ausdrucke: v, = Rio [- cos(wt)· sin(wt)

vq> = Rio [sin2(wt)

+ sin(wt)· cos(wt)] = 0

+ cos 2(wt)] =

Rw

(1-252)


105

Das Masseteilchen besitzt also nur eine (konstante) tangentiale Geschwindigkeitskomponente vq> = Reo, in Ubereinstimmuug mit unseren Uberlegungen in Abschnitt 1.6. Der Geschwindigkeitsvektor lautet somit in der Polarkoordinatendarstellung wie folgt (Bild 1-78): (1-253)

y

x

Bild 1-78 Geschwindigkeitsvektor bei einer glcichformigen Kreisbcwegung, dargestellt im Polarkoordinatensystem

6.2 Zylinderkoordinaten 6.2.1 Definition und Eigenschaften der Zylinderkoordinaten Zylinderkoordinaten werden vorzugsweise bei raumlichen Problemen mit Axial- oder Zylindersymmetrie bzw. Rotationssymmetrie verwendet. Wir haben sie bereits in knapper

Form in Band 2 (Abschnitt IV.3.2.2.2) kennengelernt und beschranken uns daher auf eine kurze Zusammenfassung ihrer wichtigsten Eigenschaften.

106

12)

13)

I Vektoranalysis

Die Zylinderkoordinate (l gibt den senkrechten Abstand des Raumpunktes P von der z-Achse an und ist daher nicht zu verwechseln mit dem Abstand r desselben Punktes Yom' Koordinatenursprung 0, d.h. mit der Lange des Ortsvektors r = GP. Urn solche Verwechslungen zu vermeiden, verwenden wir hier ausschliefilich das Symbol (l fur die Abstandskoordinate. Fur die Punkte der x, y- Ebene besteht allerdings kein Unterschied zwischen r und (l. Daher hatten wir auch bei den Polarkoordinaten der Ebene das Symbol r fur den Abstand eines Punktes vom Koordinatenursprung gewahlt. Dieser Eigenschaft verdanken die Zylinderkoordinaten ihren Namen.


107

z

Z

4.

"

",I

.,.'"

,

p = canst.

."..,.

"-

--- - r

!iiiii·~-~r---

qJ

......... .........

p

y

Y

I

.

...........

~

x

x

Bild 1-80

Bild 1-81

Koordinatenflache (Zylindermantel)

Q=

const.

Koordinatenflache tp = const. (Halbebene, begrenzt durch die z-Achse)

z

,

I I I I I I

Bild 1-82

."..,.----t--- . . . .

"

}-- - "-+--~

/

x

= canst.

y

Koordinatenflache z = const. (zur x, y-Ebene parallele Ebene)

108

I Vektoranalysis

p-Linie

t------I--

z- Lln ie Bild 1-83

Koordinatenlinien des Zylinderkoordinatensystems

x


z

dqy

dz dA

= p do dz

pdqy

y

x

Bild 1-84 Flachenelement dA auf dem Zylindermantel

109

I Vektoranalysis

110

z

Volumenelement dV = dA dz = P ikp do dz dz

dA=pdcpdp dcp

p dtp

x

y

p+dp dA =pdcpdp

Bild 1-85 Volumenelement dV in Zylinderkoordinaten

6.2.2 Darstellung eines Vektors in Zylinderkoordinaten In einem raumlichcn kartesischen Koordinatensystem wird ein Vektor

ain der Form (1-260)

ex, e

e

dargestellt. Dabei sind y und z Einheitsvektoren in der positiven x, y- und z-Richtung. Sie bilden die Basis fur diese Vektordarstellung. Unsere Aufgabe besteht nun darin, den Vektor in Z ylinderkoordinaten darzustellen. Dazu benotigen wir aber zunachst drei geeignete Einheitsvektoren als Basisvektoren.

a

6 Spezielle ebene und raumliche Koordinatensysterne

111

Basisvektoren in Zylinderkoordinaten

Wir iibernehmen die beiden Basisvektoren der Polarkoordinaten, also die Einheitsvektoren eQund e und ez sind daher orthogonal, d. h. sie stehen paarweise senkrecht aufeinander.

e

e

e

Der Ubergang von der kartesischen Basis ex, ey, z zur "neuen" Basis e g , eq>' z laBt sich wie bei den ebenen Polarkoordinaten durch eine orthogonale Transforrnationsrnatrix A wie folgt beschreiben:

(. ~ee

eq>

)

=

(

c~s tp

-

(1-262)

SIn ' e z ' wie folgt darstellen: (1-265) Dabei sind ag , aq> und az der Reihe nach die mit einem Vorzeichen versehenen Projektionen von auf die drei Basisvektoren e g , eq> und e z • Diese (positiven oder negativen) skalaren Groben sind die Vektorkoordinaten oder skalaren Vektorkomponenten des Vektors im Z ylinderkoordinatensystem. Sie lassen sich wie folgt aus den kartesischen Vektorkoordinaten ax, ay und a, bestimmen:

a

a

ag = ax . cos

ip

+ ay • sin qJ (1-266)


113

Die ersten beiden Transformationsgleichungen haben wir direkt von den Polarkoordinaten iibernommen, wahrend die dritte Vektorkoordinate a, unverdndert bleibt (denn sie wurde ja aus der kartesischen Darstellung iibernommen). Die Transformationsgleichungen (1-266) lassen sich auch in der M atrizenform darstellen:

c~s qJ sin tp a; ) ( aqJ = - SIn tp cos tp ( az 0 0

(1-267)

A

Wie bei den Polarkcordinaten gilt auch hier: Die Vektorkoordinaten eines beliebigen Vektors transformieren sich beim Ubergang von den kartesischen Koordinaten zu den Zylinderkoordinaten in der gleichen Weise wie die Basisvektoren. Umgekehrt erfolgt der Ubergang von den skalaren Vektorkomponenten a(J' aqJ' az des Zylinderkoordinatensystems zu den kartesischen Komponenten ax, ay , a z mit Hilfe der zu A inversen Matrix A-I:

a

(1-268)

Wir fassen die Ergebnisse wie folgt zusammen:

114

1 Vektoranalysis

Anmerkung

Die Riicktransformation, d. h. der Ubergang von den Z ylinderkoordinaten zu den kartesischen Koordinaten, erfolgt iiber die zu A inverse Matrix A-I. Sie lautet:

0)

- sin cp~ cos cp

(1-272)

o •

Beispiel Wir wollen das im kartesischen Koordinatensystem gegebene Vektorfeld

in Zylinderkoordinaten, d. h. in der Form F == F(Q; o; z) == Fg e g

darstellen (x

2

+ y2

+ FqJ

eqJ

+ r;

ez

#- 0).

Die gesuchten Vektorkoordinaten Fg , FqJ und F; lassen sich unter Verwendung von x == Q . cos sp •

y

==

Q.

sin cP,

z == z,


1t5

aus den Gleichungen (1-271) wie folgt berechnen: . F Q == Fx . cos cp + Fy • SIn cp ==

1

Jx2 1

== -

(Q .

cos" cp

+ y2

+ Q . sin? cp) == cos"

cp

. (x . COS cp + Y . SIn cp) ==

+ sin'

cp == 1

Q

F
0 stets wirbelfrei. Denn das Feld besitzt nur eine einzige skalare Vektorkomponente in axialer Richtung und diese wiederum ist nur von g abhangig: (1-281) Die Rotation dieses Feldes verschwindet daher nach Gleichung (1-277): rot F = rot (f (g)

e =0

(1-282)

g)

(alle partiellen Ableitungen sind gleich Null). I

Dagegen ist ein zylindersymmetrisches Vektorfeld im allgemeinen nicht quellenfrei. Denn aus Gleichung (1-276) erhalten wir fur die Divergenz des Vektorfeldes den folgenden Ausdruck: . div F

~

1

a (g . F) = -1 . -a (g . f

- .-

g ag

e

g ag

(g))

(1-283)

6 Spezielle ebene und raumliche Koordinatensysteme Er kann nur dann verschwinden, wenn das Produkt (2 .

f

((2)

= const.

oder

f

((2)

(2 .

119

f((2) eine Konstante ist, also

= const.

(1-284)

(2

gilt. Dieser Sonderfall tritt also genau dann ein, wenn der Betrag des Feldvektors umgekehrt proportional zum Abstand (2 ist.

•

F

Beispiel Ein Musterbeispiel fur ein wirbel- und quellenfreies Vektorfeld mit Zylindersymmetrie liefert das elektrische Feld in der Umgebung eines homogen geladenen Zylinders (Bild 1-88).

Aquipotentialflache Bild 1-88

Zylinderquerschnitt

I Vektoranalysis

120 Fur die elektrische Feldstdrke

E gilt namlich 15):

_ QeI R 2 1_ E==E(Q)==--'- e

2 Go

Q

(Q ~ R)

g

Ladungsdichte; R: Zylinderradius; Go: elektrische Feldkonstante). Das E-Feld ist wegen der Zylindersymmetrie wirbelfrei und wegen

(QeI:

auch quellenfrei.

•

6.2.5 Ein Anwendungsbeispiel: Geschwindigkeitsvektor eines Massenpunktes in Zylinderkoordinaten Ein Massenpunkt bewege sich auf einer rdumlichen Bahnkurve mit dem zeitabhdngigen Ortsvektor

r(t) == x(t)

ex + y(t) e + z(t) e == x ex + y e + z e y

z

z

y

(1-288)

Der zugehorige Geschwindigkeitsvektor (1-289) mit den kartesischen Geschwindigkeitskoordinaten Zylinderkoordinaten, d. h. in der Form

Vx

==

x, vy == y und v; == i

solI nun in (1-290)

dargeste11t werden. Beim Ubergang zu den Zylinderkoordinaten gelten die Transformationsgleichungen (1-271). Sie lauten hier:

+ vy • sin
auch durch eine orthogonale Transformationsmatrix A wie folgt beschreiben:

er )

( ~.9eq>

(Sin:) . cos q> = cos 9 '. cos tp - SIn q>

sin 9 . sin q> cos:) . sin q> cos q>

(1-311)

A

Umgekehrt lassen sich die "alten" Einheitsvektoren aus den "neuen" Einheitsvektoren mittels der zu A inversen Matrix A-I bestimmen: ex ) (

~y

ez

(Sin 9 . cos q> =. sin 9 . sin qJ cos:)

cos 9 . cos q> cos S . sin qJ - sin 9

Vektordarstellung in Kugelkoordinaten

Ein im kartesischen Koordinatensystem gegebener Vektor (1-313)

HiBt sich in Kugelkoordinaten, bezogen auf die Basis e r , e 9 , eq>' wie folgt darstellen: (1-314)

Dabei sind a., a9 und aq> der Reihe nach die mit einem Vorzeichen versehenen Projektionen des Vektors auf die drei Basisvektoren e r , e 9 und eq>. Diese (positiven oder negativen) skalaren Groben sind die Vektorkoordinaten oder skalaren Vektorkomponenten des Vektors im Kugelkoordinatensystem. Sie lassen sich wie folgt aus den kartesischen Vektorkoordinaten ax, ay und az bestimmen:

a

a

+ ay • sin 9 . sin tp + az . cos 9 a9 = ax . cos 9 . cos qJ + ay • cos:) . sin qJ - az • sin :) aqJ = - ax . sin qJ + ay • cos qJ a, = ax . sin 9 . cos tp

(1-315)

Diese Transformationsgleichungen lauten in der Matrizenform:

(

a; ) a9

a.;

(Sin 9 . cos = . cos t) .. cos

- sm

tp

qJ qJ

sin 9 . sin tp cos:) . sin qJ cos qJ

(1-316)

A

a

Auch fur die Kugelkoordinaten gilt: Die Vektorkoordinaten eines beliebigen Vektors transformieren sich beim Ubergang von den kartesischen Koordinaten zu den Kugelkoordinaten in der gleichen Weise wie die Basisvektoren.

I Vektoranalysis

130

Umgekehrt erfolgt der Ubergang von der Darstellung in Kugelkoordinaten zur kartesischen Darstellung mit Hilfe der zu A inversen Matrix A -1 :

(

aax) == A - ( asa; ) y

a,

1

aqJ

cos 9 . cos qJ ( sin 9 . cos qJ == sin 9 . sin tp cos 9 . sin qJ - sin 9 cos 9v

A -1

Wir fassen nun die wichtigsten Ergebnisse zusammen:

- sin qJ) cos qJ

o

(

a; ) as aqJ

(1-317)


131

Anmerkung Die Riicktransformation, d. h. der Ubergang von den Kugelkoordinaten zu den kartesischen Koordinaten, erfolgt tiber die zu A inverse Matrix A-I. Sie lautet: A-I ==

•

(

sin 9 . cos

qJ

.sin 9 . sin

qJ

cos 9 . cos qJ cos 9 . sin qJ - sin 9

cos 9

- sin qJ) cos tp

(1-321)

o

Beispiele (1)

Wie lautet die Darstellung des Feldvektors

F == F(x; y; z) == x ex + y ey + ez in Kugelkoordinaten?

Liisung: Der gegebene Feldvektor soll in der Form

F == F(r; 9; qJ) == F,.

+ t;

er

eij + F({J e({J

dargestellt werden. Die gesuchten Vektorkoordinaten F',., Fij und F({J lassen sich dann unter Verwendung von x

==

y == r . sin 9 . sin

r . sin [) . cos qJ,

qJ,

z == r : cos [)

aus den Gleichungen (1-320) wie folgt berechnen: F, == F; . sin [) . cos

== x . sin 9- . cos == r . sin 2 ==

2

[) .

qJ

+ F; . sin 9 . sin tp + F, . cos 9 ==

qJ +

cos 2

qJ

Y . sin [) . sin

+ r . sin 2 [)

2

2

r . sin 9 (cos qJ + sin qJ)

.

qJ +

sin 2

1 . cos 9- ==

+ cos [) ==

qJ

+ cos [) ==

r . sin 2

[)

+ cos 9-

1

Fij == F; . cos 9- . cos qJ + F; . cos [) . sin qJ - Fz . sin [) ==

== ==

x . cos [) . cos qJ + Y . cos r . sin

9- . cos [) . cos

== r . sin 9 . cos [)(cos 2

2

qJ qJ

9- . sin

+r

qJ -

1 . sin 9 ==

. sin [) . cos

+ sin 2 qJ) -

9- . sin 2

qJ -

sin [) ==

sin 9 ==

1

== r . sin [) . cos [) - sin 9- == (r . cos 9- - 1) . sin 9F({J == - Fx . sin qJ, + Fy • cos

== - r . sin [) . cos

qJ

qJ • sin qJ

== - x . sin

qJ

+ Y . cos qJ ==

+ r . sin [) . sin qJ . cos qJ == 0

132

1 Vektoranalysis Somit ist

ff = (r . sin 2 [) + cos [)) er + (r . cos [) -

1) . sin [)

e:J

die gesuchte Darstellung des Feldvektors in Kugelkoordinaten. Man beachte, daB diese Darstellung unabhdngig vom Winkel tp ist und keine Komponente in Richtung des Breitenkreises besitzt. (2)

Ein Massenpunkt bewege sich auf dem Breitenkreis einer Kugel mit dem Radius r (Bild 1-100). Die Bahn ist dann durch Angabe der Breitenkoordinate [) eindeutig festgelegt. Wir interessieren uns nun fur den Geschwindigkeitsvektor v des Teilchens, ausgedriickt in Kugelkoordinaten.

z

Breitenkreis

y

Bild 1-100 Zur Bewegung eines Massenpunktes auf dem Breitenkreis 9- = canst.

x

r

Dabei gehen wir zunachst von kartesischen Koordinaten aus. Ortsvektor und Geschwindigkeitsvektor lauten dann (beide sind zeitabhiingig):

v

r=r(t)=x v=v(t)=x

ex+y ey+z ez ex+Y ey+i ez

Der Geschwindigkeitsvektor

v besitzt in Kugelkoordinaten die Darstellung

Zwischen den "alten" und den "neuen" Geschwindigkeitskomponenten bestehen dabei nach den Gleichungen (1-320) die folgenden Beziehungen:

o, = = Vs

+ vy • sin [) . sin tp + Vz • cos [) = x. sin [) . cos qJ + Y. sin [) . sin qJ + i . cos [) Vx •

sin [) . cos tp

= o; . cos [) . cos qJ + vy . cos [) . sin qJ -

Vz .

sin [) =

x. cos [) . cos qJ + Y. cos [) . sin qJ - i . sin [) VqJ = - V sin qJ + v cos qJ = - x. sin qJ + Y. cos qJ =

x .

y •


133

Wir driicken nun x, y und z mittels der Transformationsgleichungen (1-305) durch die Kugelkoordinaten r, :) und qJ aus und differenzieren die Gleichungen anschlieBend nach der Zeit t. Da auf dem Breitenkreis r und :) feste Grobe sind, gilt = 0 und :) = o. Unter Beriicksichtigung dieser Bedingungen erhalten wir dann:

r

x = r . sin :) . cos qJ

--+

y = r . sin :) . sin tp

--+

x = - r . sin :) . sin qJ . cP Y = r . sin :) . cos tp . cP

z = r . cos :)

--+

i

=

0

Damit nehmen die gesuchten Geschwindigkeitskomponenten Vr' V s und v({J die folgende Gestalt an: X . sin S . cos (p,+ Y. sin S . sin

Vr =

qJ

+ i . cos:) =

= - r . sin 2 :) . sin qJ • cos qJ • cP +

+r Vs

=

.

sin 2

:) •

sin

qJ • cos tp .

cP

+ 0 . cos :) =

x. cos:) . cos qJ + Y. cos:) . sin qJ -

= -

r . sin S . cos :) . sin

qJ • cos qJ •

cP

+ r . sin :) . cos :) . sin qJ • cos qJ • cP v({J

= -

0

i . sin S =

+ - 0 . sin :) = 0

x. sin qJ + Y. cos qJ =

+ r . sin :) . cos 2 qJ • cP = = r . sin :) . cP (sin2 tp + cos 2 qJ) = r . sin :) . cP

=

r . sin :) . sin 2

qJ • cP

Das Teilchen bewegt sich somit auf dem Breitenkreis mit dem Geschwindigkeitsvektor

v = r . sin [) . cP

e({J

Erfolgt die Bewegung mit konstanter Winkelgeschwindigkeit OJ, so ist qJ = OJ t und cP = OJ und wir erhalten das bereits aus Abschnitt 6.1.4 bekannte Ergebnis

v=

r . sin S . OJ e({J ,=

OJ r

. sin S e({J

= ROJ e({J

Dabei ist R = r . sin S der Radius des Breitenkreises aus Bild 1-100.

•

134

I Vektoranalysis

6.3.3 Darstellung von Gradient, Divergenz, Rotation und Laplace-Operator in Kugelkoordinaten Die Differentialoperationen Gradient, Divergenz und Rotation sowie der Laplace-Operator besitzen in Kugelkoordinaten das folgende Aussehen:

6 Spezielle ebeneund raumliche Koordinatensysteme

135

Anmerkung Der in Kugelkoordinaten ausgedriickte Laplace-Operator enthalt auch partielle Ableitungen 1. Ordnung (im Unterschied zum kartesischen Fall):

(1-328)

a¢. a2¢ a9a (a¢) sin 9. a9 = cos 9. a9 + SIn 9. a9 2 •

Beispiele (1)

Wir bestimmen den Gradient des skalaren Feldes ¢ = ¢(r; 9; == oir : sin 9 eq>.

Fur die Rotation des Feldvektors

verhalten wir dann nach Gleichung (1-326):

1 (a rot _ v == - - . - - (sin 9 . vq» r . SIn 9 a9

)_e, - -l(a-a· (r· .)_ vq» es ==

.2)-

== - -1. - (a - (wr . SfIl 9) er r . SIn

9 a9

1 r . SIn 9

== --.-. wr(2· sin

9· cos 9)

r

-

r

l(a- (wr r ar

-

2.)- == . SIn 9)

es

_1_ e, - _. w· sin 9· (2r) es == r

Der in der Klammer stehende Vektor ist aber nach Gleichung (1-312)genau der Einheitsvektor z . Somit gilt:

e rot v == 2 co e == 2 OJ . Dabei ist OJ == co e der in der positiven z-Achse liegende Vektor der Winkelgez

z

schwindigkeit. Das Geschwindigkeitsfeld auf einer rotierenden Kugel ist somit ein Wirbelfeld, ein Ergebnis, das wir bereits von einer rotierenden Scheibe her kennen (vgl. hierzu Abschnitt 5.2.2).

•

6.3.4 Kugelsymmetrische Vektorfelder (Zentralfelder) Ein kugel- oder radialsymmetrisches Vektorfeld, in den naturwissenschaftlichen Anwendungen meist als Zentralfeld bezeichnet, vom allgemeinen Typ (1-329) ist fur r #- 0 stets wirbelfrei. Denn das Feld besitzt nur eine Komponente in radialer Richtung und diese wiederum ist nur von r abhangig, nicht aber von den beiden Winkelkoordinaten 9 und tp:

F,. == f (r),

(1-330)


137

Daher verschwinden in dem Formelausdruck (1-326) fur die Rotation samtliche partiellen Ableitungen, d. h. es gilt rot

F == rot (f (r)

e

r ) ==

0

(1-331 )

Ein Zentralfeld ist somit immer wirbelfrei. Es ist dagegen im allgemeinen nicht quellenfrei, da die Divergenz des Feldes nur in Sonderfdllen verschwindet. Nach Gleichung (1-325) gilt namlich fur die Divergenz: div F

10 2 . - (r . F,.) r 2 or

== -

10 2 . - (r . f (r)) r 2 or

(1-332)

== -

e

Die Divergenz des Zentralfeldes F(r) == f(r) r kann daher nur dann den Wert Null annehmen, wenn das Produkt r2 . f(r) eine Konstante ist, d.h. r 2 . f (r) == const.

oder

f( r)

const.

==2

r

(I-333)

gilt. Dies ist genau dann der Fall, wenn der Betrag des Feldvektors F umgekehrt proportional zum Quadrat des Abstandes r ist.


138

•

I Vektoranalysis

Beispiele (1)

Das Gravitationsfeld der Erde ist ein wirbel- und quellenfreies Zentralfeld. Nach dem Gravitationsgesetz von Newton erfahrt eine Einheitsmasse (m == 1) die folgende Anziehungskraft: -

M_ e,

(r > 0)

F == - y 2 r

(M: Erdmasse; y: Gravitationskonstante; Bild 1-103).

Fur den Betrag dieser Kraft gilt somit:

-I -_ M _ 1F Y r

y M _ const.

2 -

r

2-

r

2'

Bild 1-103

Gravitationsfeld der Erde (ebener Schnitt durch den Erdmittelpunkt)

(2)

Das elektrische Feld in der Umgebung einer (positiven) Punktladung Q ist ein wirbel- und quellenfreies Zentralfeld mit der elektrischen Feldstarke

Q E==---e 2 4n 8 0 r

(r > 0)

r

(Bild 1-104). Denn der Feldstdrkebetrag ist dem Quadrat des Abstandes umgekehrt proportional:

Q- == -Q- . -1 == (const.) . -1 == const. 1E-I == 4 8 r 4 tt 8 r r r tt 0

2

2

0

2

2


139

-+-

E

•

Bild 1-104 Radialsymmetrisches elektrisches Feld in der Umgebung einer posiliven Punktladung Q (ebener Schnitt durch die Punktladung)

+Q

• 6.3.5 Ein Anwendungsbeispiel: Potential und elektrische Feldstarke in der Umgebung einer geladenen Kugel Eine homogen geladene Kugel mit dem Radius R und der (positiven) Ladung Q erzeugt in ihrer Umgebung ein kugel- oder radialsymmetrisches elektrisches Feld, dessen Potential U = U (~) der Laplace-Gleichung I1U

=

I1U(r)

=0

(r

~ R)

(1-337)

geniigt (Bild 1-105).

geladene Kugel

Bild 1-105 Radialsymmetrisches elektrisches Feld in der Umgebung einer positiv geladenen Kugel (ebener Schnitt durch den Kugelmittelpunkt)

I Vektoranalysis

140

Unter Beriicksichtigung der Kugelsymmetrie lautet diese Differentialgleichung 2. Ordnung dann wie folgt:

(2

au)

dU =

au). or

-12 . -a r . r or or

( u '(r) =

dr

== -1 . -d

r2 dr

2

(r . U (r) == 0 I

(1-338)

Die in dieser Gleichung auftretende Ableitung kann nur dann

verschwinden, wenn das Produkt r2 . U' (r) eine Konstante ist, d. h. wenn r2 • U (r) == const. I

==

C1

(1-339)

gilt. Wir losen diese Gleichung nach U (r) auf und integrieren anschlieBend unbestimmt: I

U'(r) = C21 r

U(r)

== C 1 ·

1 r

C1 r

f

2. dr == - -

+ C2

(1-340)

Das Potential wird dabei iiblicherweise so festgelegt, daBes im Unendlichen verschwindet. Aus der Bedingung U (r == 00) == 0 folgt dann:

U (r

==

00) == 0

C2

=>

==

0

(1-341)

Somit ist

C1

U(r)== - -

(1-342)

r

Die Konstante C 1 UiBt sich aus der Kapazitat C == 4ns oR der Kugel bestimmen (R: Kugelradius; so: elektrische Feldkonstante). Aus der Definitionsformel der Kapazitat

Q

C == - - == 4 tt Eo R U(R)

(1-343)

folgt dann fur das Potential U (R) auf der Kugeloberfldche: U(R)==-Q-

(1-344)

4nsoR

Zusammen mit der Gleichung (1-342) erhalten wir daraus eine Bestimmungsgleichung fur die Konstante C 1 : U(R)==

C1

Q

R

4ns oR

--==--

=>

(1-345)


141

Das Potential im Auj3enraum der Kugel wird somit durch die kugelsymmetrische Funktion

Q U=U(r)=-4ne or

(r

~

R)

(1-346)

beschrieben. Die elektrische Feldstdrke E ist der negative Gradient des Potentials. Wegen der Kugelsymmetrie gilt dann nach Gleichung (1-324)

-

E = - grad U = -

au _

a;:

e, = -

dU _ e,

a;:

(1-347)

Mit der Ableitung dU

d (

a;: = dr

Q)

4 n Eo r

Q d -1 Q -2Q = 4 n Eo . dr (r ) = 4 n Eo ( - r ) = - 4 n Eo r 2

(1-348)

erhalten wir schlielilich den radial nach auj3en gerichteten Feldstarkevektor dU _ Q_ E=--e=---e dr r 4neor2 r

(r

~

(1-349)

R)

Der Betrag der Feldstarke nimmt dabei mit zunehmender Entfernung r vom Kugelmittelpunkt ab und zwar umgekehrt proportional zum Quadrat des Abstandes (Bild 1-106).

E(r)

E(R)

Bild 1-106 Verlauf der elektrischen Feldstarke in der Umgebung einer positiv geladenen Kugel

R

r

142

I Vektoranalysis

7 Linien- oder Kurvenintegrale 7.1 Ein einfiihrendes Beispiel Wir fiihren den Begriff eines Linien- oder Kurvenintegrals in anschaulicher Weise am Beispiel der physikalischen Arbeit ein, die von einer Kraft bzw. einem Kraftfeld beim Verschieben eines Massenpunktes verrichtet wird. Schrittweise gehen wir dabei wie folgt vor: Verschiebung lings einer Geraden durch eine konstante Kraft (Bild 1-107)

Der Massenpunkt wird durch eine konstante Kraft F langs einer Geraden urn den Vektor s verschoben. Die dabei verrichtete Arbeit ist definitionsgemaf das skalare Produkt aus dem Kraftvektor Fund dem Verschiebungsvektor s:

W=F's=P's'cosqJ

(1-350)

(vgl. hierzu auch Band 1, Abschnitt 11.3.3.5).

s

Bild 1-107 Zum Begriff der Arbeit einer konstanten Kraft beim Verschieben langs einer Geraden

Verschiebung lings einer Geraden durch eine ortsabhangige Kraft (Bild 1-108) Frs)

s

dss +ds

s

Bild 1-108 Zum Begriff der Arbeit einer ortsabhdngigen Kraft beim Verschieben langs einer Geraden

Die auf den Massenpunkt einwirkende Kraft ist jetzt von Ort zu Ort verschieden: F = F(s). Wir zerlegen das geradlinige Wegstiick in eine groBe Anzahl von sehr kleinen Wegelementen, Iangs eines jeden Wegelementes darf dann die einwirkende Kraft als nahezu konstant betrachtet werden. Die bei einer infinitesimal kleinen Verschiebung des Massenpunktes urn ds verrichtete Arbeit betragt dann definitionsgemaf

dW = F (s) . ds = F;;(s) ds

(1-351)

~(s) ist dabei die Kraftkomponente in Wegrichtung. Durch Integration erhalten wir die insgesamt von der Kraft F(s) langs des (geradlinigen) Weges von Sl nach S2 geleistete Arbeit.

143

7 Linien- oder Kurvenintegrale Sie fuhrt uns zu dem Arbeitsintegral

f ff

S2

W=

f

S2

dW =

S2

(s) . ds =

(1-352)

Fs(s) ds

(vgl. hierzu auch Band 1, Abschnitt V.l0.6) Allgemeiner Fall: Verschiebung lings einer Kurve in einem Kraftfeld (Bild 1-109)

Die bisher betrachteten Verschiebungswege waren ausschlieBlich geradlinig. Diese Einschrankung lassen wir nun fallen, wir wenden uns dem allgemeinen Fall zu: In einem ebenen Kraftfeld F(x; y) solI ein Massenpunkt vom Punkt ~ aus langs einer Kurve emit dem Ortsvektor r == r(t) in den Punkt ~ verschoben werden (t 1 ~ t ~ t 2 ) . Welche Arbeit wird dabei vom Kraftfeld an der Masse verrichtet? y

Bild 1-109 Zum Begriff der Arbeit in einem (beliebigen) ebenen Kraftfeld

x

Bei der Berechnung der Arbeit miissen wir beriicksichtigen, daB die auf den Massenpunkt langs der Kurve C einwirkende Kraft von Ort zu Ort variiert. Wir gehen daher analog vor wie in Fall 2 und zerlegen die Kurve C zunachst in eine groBe Anzahl von Wegelementen, wobei wiederum langs eines jeden Wegelementes eine nahezu konstante Kraft angenommen werden darf. Beim Verschieben des Massenpunktes von P aus urn ein infinitesimal kleines Wegelement dr in den Punkt Q verrichtet das Kraftfeld die Arbeit - _ (Fx(X; y)) . (dX) ==Fx(x;y)dx+F(x;y)dy dW==F·dr== Fy(x; y) dy y

(1-353)

(Bild 1-110). Die bei einer Verschiebung auf der Kurve C von ~ nach ~ insgesamt vom Kraftfeld aufzubringende Arbeit erhalten wir dann durch Integration: W=

f ff . f dW =

c

d'f =

c

(Fx(x; y) dx

c

+ Fy(x~ y) dy)

(1-354)

I Vektoranalysis

144 y

c

Bild 1-110 Zur Herleitung des Arbeitsintegrals

x

Da die Integration langs einer bestimmten Kurve, auch Weg oder Linie genannt, erfolgt, bezeichnet man ein solches Integral als Linien- oder Kurvenintegral und schreibt verabredungsgemaf das Kurvensymbol (hier: C) unten an das Integralzeichen. Bei der Berechnung des Integrals ist dabei zu beachten, daB das Kraftfeld noch von den Koordinaten x und y des Kurvenpunktes P abhangt. Diese jedoch sind keineswegs voneinander unabhangig, sondern tiber die Kurvengleichung miteinander verkniipft. Fiir die Koordinaten x und y setzt man daher die Parametergleichungen x (t) bzw. y(t) der Integrationskurve C ein. Die langs dieses Weges wirkende Kraft hangt dann nur noch yom Kurvenparameter tab. Das Wegelement dr ersetzen wir noch durch den Tangentenvektorr = ;(t) und das Differential dt des Parameters t. Es ist ~ dr r=-

und somit

dt

_

~ d r = r dt =

Das Arbeitsintegral (Linienintegral)

(x(t)) Y(t) dt

(1-355)

f

F . dr geht schlieBlich mit Hilfe dieser Substitu-

c tion in ein gewohnliches Integral iiber:

W=

t2

f

f

C

t1

F . dr =

(11 . -;) dt =

t2

=

f

fFx(x(t); y(t))· x(t) + Fy(x(t); y(t)) . y(t)) dt

(1-356)

t1

•

Beispiel

Wir berechnen die Arbeit, die das ebene Kraftfeld F(x; y) =

G~2)

Massenpunkt bei einer geradlinigen Verschiebung von Pi = (0; 0) nach verrichtet (Bild 1-111).

an einem ~

= (1;

1)

7 Linien- oder Kurvenintegrale

145

y

c Bild 1-111

x

P t = (0;0)

Der Integrationsweg C lautet in vektorieller Darstellung:

c: Fur

F, ;

r(t) =

C~:;) = (:)

und das Skalarprodukt

(0 ~ t ~ 1)

F.; erhalten wir dann:

Die vom Kraftfeld geleistete Arbeit betragt somit nach der Integralformel (1-356): 2

W

==

f t

t1

-.

~

(F· r) dt

==

fi (t 3 + t 2 ) dt ==

[1 t + -1t ] 7 -

4

4

3

3

1

0

== -

12

•

0

7.2 Definition eines Linien- oder Kurvenintegrals Die Berechnung der Arbeit eines ebenen Kraftfeldes an einer punktformigen Masse fiihrte uns zu dem Begriff eines Linien- oder Kurvenintegrals. Wir iibertragen diesen Begriff nun auf ein rdumliches Vektorfeld.

146

I Vektoranalysis

Anmerkungen (1) Das Linien- oder Kurvenintegrai (1-357) lautet in ausfiihrlicher Schreibweise wie folgt: t2

f

[FAx; y; z) dx

+ Fy(x; y; z) dy + FzCx; y; z) dz]

C

=

f

(Fx x + FyY

+ Fzz) dt

t 1

(1-358)

F(x; y) und

(2)

Die Definition (1-357) gilt sinngemaf auch fur ein ebenes Vektorfeld eine ebene Kurve == r(t).

(3)

Man beachte, daB der Wert eines Linien- oder Kurvenintegrals i. a. nicht nur vom Anfangs- und Endpunkt des Integrationsweges, sondern auch noch vom eingeschlagenen Verbindungsweg abhangt.

(4)

Wird der Integrationsweg C in der umgekehrten Richtung durchlaufen (symbolische Schreibweise: - C), so tritt im Integral ein Vorzeichenwechsel ein:

r

fl.

dr

= -

-c (5)

fl.

(1-359)

dr

c

Fiir ein Kurvenintegral langs einer geschlossenen Linie C verwenden wir das Symbol

fl.

dr oder auch

fl.

dr (Bild 1-112). Ein so1ches Kurvenintegral wird

c in den physikalisch-technischen Anwendungen auch als Zirkulation des Vektorfeldes F langs der geschlossenen Kurve C bezeichnet.

BUd 1-112 Geschlossener Integrationsweg C mit dem Anfangs- und Endpunkt Pi

c (6)

fl. fl. f(I.T)

Das Kurvenintegral

dr HiBt sich auch wie folgt ausdriicken:

c

dr

c

=

ds

(1-360)

c

Dabei ist T der Tangenteneinheitsvektor und ds das Linienelement der Kurve C (Bild 1-113). Integriert wird dann tiber die Tangentialkomponente des Vektorfeldes F langs der Kurve C.

147


Kurve C

Tang~ntialkomponente

von F

Bild 1-113 Zur Integration tiber die Tangentialkomponente des Vektorfeldes F

Analog HiBt sich auch ein Kurvenintegral tiber die N ormalkomponente von langs des Weges C definieren:

F

(1-361)

N ist dabei der

Hauptnormaleneinheitsvektor der Kurve C.

7.3 Berechnung eines Linien- oder Kurvenintegrals Die Berechnung eines Linien- oder Kurvenintegrals wird wie folgt vorgenommen:

148

•

I Vektoranalysis

Beispiele (1)

Wir berechnen das Linienintegral f (y . eX dx

+ eX dy)

langs des parabel-

c [iirmigen Verbindungsweges C: x = t, Y = t 2 der beiden Punkte 0 = (0; 0) und P = (1; 1) (Bild 1-114). y P

= (1 ;1)

Bild 1-114 Parabelformiger Integrationsweg C

o

x

Langs dieses Weges gilt: x = t,

.

x

dx dt

=- =1

dx = dt

'

. dy Y=dt=2t,

dy=2tdt

::s; t ::s; 1). Durch Einsetzen dieser Ausdriicke in das Linienintegral erhalten wir dann:

(0

1

f (y. e" dx

+ eX dy) =

C

f (t 2 • e' dt

+ e t • 2t dt) =

0 1

=

f (t 2 • c'

+ 2t· e') dt =

o 1

=

=

f t

1 2

•

c' dt

+ 2 . ft.

o

0

[(t2 - 2t + 2)·

etI

= (e - 2) + 2(0

c' dt =

+ 2[(t -

+ 1) = e -

2

1)·

etI

+ 2 = e = 2,7183

Die anfallenden Integrale haben wir dabei der I ntegraltafel der Formelsammlung entnommen (IntegraleNr. 313 bzw. Nr. 314).

7 Linien- oder Kurvenintegrale (2)

149

Welchen Wert besitzt das Linienintegral des raumlichen Vektorfeldes F(x; y; z) =

(2:2::2)

langs der Kurve C, die durch den Ortsvektor

x+z

r(t)

=(;2)

mit 0 :::;: t:::;: 1 beschrieben wird?

Liisung :

Es ist x = t, Y =

und z = t und somit

t? 4

_ F

=

(2t+t t5

)

,

2t

= (2 t + t 4 ) . 1 + t 5 . 2 t + 2 t . 1 = 2 t'' + t 4 + 4 t 87

35

•

Bei einem ebenen Problem, d. h. einem Linienintegral in der Ebene, liegt der Integrationsweg C haufig in Form einer expliziten Funktionsgleichung y = f (x) vor. Die Berechnung des Linienintegrals

fi

0

dr wird dann wie folgt vorgenommen: Man ersetzt

C

die Koordinate y durch die Funktionf(x) und das Differential dy durchf'(x)dx und erhalt auf diese Weise ein gewohnliches Integral mit der Integrationsvariablen x (die Integrationsgrenzen sind dabei die Abszissenwerte der beiden Kurvenrandpunkte):

fi

0

dr =

c

f

(FAx; y) dx

+ Fy(x; y) dy) =

c

f

X2

=

•

[FAx;f(x))

+ Fy(x;f(x)) of'(x)] dx

Beispiel Wir berechnen das Kurvenintegral

f

(x y2 dx

+ x y dy) fur

(1-362)

die in Bild 1-115 skiz-

c zierten Verbindungswege der Punkte 0 = (0; 0) und P =(1; 1).

150

I Vektoranalysis y P

= (1;1)

y=x 3 Bild 1-115

Drei verschiedene Verbindungswege der Punkte 0 = (0; 0) und P = (1; 1)

x

0=(0;0)

Integrationsweg C 1: Y = dy == 1 dx '

X,

0

~ X ~

1

dy == dx 1

f

(X

y2 dx

+ X Y dy) =

C1

f

1 (X .

2

x dx

+ X . X dx) =

0

f (x

3

+ x 2) dx

0

Integrationsweg C 2 : Y = x 3 , 0 ~

X

~

1

dy == 3x 2 dx 1

f(

x y2 dx

+ xy dy) =

C2

f

(X .

x" dx

+ X . x 3 • 3x 2 dx) =

0 1

f

[

== (x7 + 3 x 6 ) dx == -1 x 8 + -3 X 7 .

o

Integrationsweg C 3

= Ci + c;*

Teilweg Cf ldng« der y-Achse von 0 nach Q:

x == 0,

f Cf

dx == 0, 1

(X

y2 dx

+ X Y dy) =

f

0 dy = 0

0

8

7

J1 == -3156 0

=

151

7 Linien- oder Kurvenintegrale Teilweg Cj* ldngs der Geraden y = 1 von Q nach P: dy = 0,

y = 1,

Langs des Gesamtweges C 3 gilt somit:

Wir stellen fest: In diesem Beispiel hangt das Linienintegral nicht nur vom Anfangs- und Endpunkt des Weges, sondern auch noch von dem eingeschlagenen Verbindungsweg selbst abo Wir erhalten fur jeden der drei Verbindungswege einen anderen Wert.

•

7.4 Wegunabhangigkeit eines Linien- oder Kurvenintegrals. Konservative Vektorfelder Wir untersuchen in diesem Abschnitt die Voraussetzungen, unter denen der Wert eines Linien- oder Kurvenintegrals nur vom Anfangs- und Endpunkt, nicht aber vom eingeschlagenen Verbindungsweg der heiden Punkte abhangt, wobei wir uns zunachst auf ebene Vektorfelder beschranken wollen. Ein Linienintegral vom Typ

fi . f dr =

c

(FAx; y) dx

+ Fy(x; y) dy)

(1-363)

c

ist wegunabhdngig, wenn die lineare Differentialform

p. dr = Fx(x; y) dx + Fy(x; y) dy

(1-364)

vollstdndig ist, d. h. das totale oder vollstdndige Differential d¢ einer ortsabhangigen Funktion <jJ(P) = <jJ(x; y) darstellt: d¢ = F; dx

+ F; dy =

o¢

o¢

ox dx + oy dy

(1-365)

Dann namlich gilt:

fi . f dr =

c

(Fx dx

c

+ Fy dy) =

f(~~ c

P2

dx

+ ~~ dy) =

f

d¢ = [¢(P)J; =

Pt

(1-366)

152

1 Vektoranalysis

Das Linienintegral hangt in diesem Fall nur vom Anfangspunkt ~ == (Xl; Y1) und dem Endpunkt ~ == (x 2; Y2) des Integrationsweges abo Ein Vektorfeld mit dieser Eigenschaft wird in den Anwendungen als konservatives Feld oder Potentialfeld, die Funktion ¢(x; y) als Potentialfunktion oder kurz als Potential des Feldes bezeichnet.

Woran aber kann man nun erkennen, ob ein vorgegebenes (ebenes) Vektorfeld F(x; y) mit den skalaren Komponenten Fx(x; y) und Fy(x; y) konservativ ist oder nicht? Die Beantwortung dieser Frage ist in der Praxis von groBer Bedeutung. Falls F(x; y) konservativ, d. h. ein Potentialfeld ist und ¢ (x; y) die zugehorige Potentialfunktion 18), so gilt jedenfalls:

a¢

F ==x

ax

und

a¢

F ==y

ay

(1-367)

Die skalaren Komponenten des Feldvektors F(x; y) sind in diesem Fall die partiellen Ableitungen i.Ordnung der Potentialfunktion ¢(x; y), d.h. der Feldvektor F(x; y) ist der Gradient der Potentialfunktion ¢(x; y):

F(x; y) == grad ¢(x; y) ==

(1-368)

Die Wegunabhdngigkeit eines Linienintegrals bedeutet also, daB das Vektorfeld als Gradient einer Potentialfunktion darstellbar ist. Unter den Voraussetzungen des Schwarzschen Satzes gilt dann weiter: und somit

(1-369)

Diese Bedingung ist notwendig und zugleich hinreichend fur die Wegunabhangigkeit eines Linienintegrals vom Typ (1-363). Sie laBt sich auch durch die Gleichung rot

F == 0

beschreiben.

18)

Die Potentialfunktion ist bis auf ein konstantes Glied eindeutig bestimmt.

(1-370)


153

Denn bekanntlich verschwindet bei einem ebenen Feld F == F(x; y) sowohl die x-Komponente als auch die y-Komponente des Vektors rot F automatisch, wahrend die z-Komponente

-

oPy - -oPx ox oy

(rot P) == z

(I -371)

offensichtlich genau dann Null wird, wenn die Bedingung (1-369) erfullt ist:

-

(rot P)

oPy - -oP ox oy

== z

x

==

0

oPy == -oP ox oy

-

x

(1-372)

Fur ein rdumliches Verktorfeld ergeben sich analoge Beziehungen zwischen den partiellen Ableitungen 1. Ordnung der skalaren Vektorkomponenten. Auch in diesem Fall ist rot F == 0 eine notwendige und hinreichende Bedingung fur die Wegunabhdngigkeit.

I Vektoranalysis

154 Anmerkungen

(1)

Ein Bereich heiBt einfach-zusammenhiingend, wenn sich jede im Bereich gelegene geschlossene Kurve auf einen Punkt "zusammenziehen" HiBt. Ein ebener einfachzusammenhangender Bereich wird von einer einzigen geschlossenen Kurve begrenzt. Beispiele sind in Bild 1-116 dargestellt (rechteckiger bzw. kreisformiger Bereich).

,

.

".

-

"

J I I

.

.

'\

I

.

.

..

.

v

~

- -----x

x b)

a)

Bild 1-116 Eitifach-zusammenhangende Bereiche a) Rechteckiger Bereich b) Kreisformiger Bereich

innerer Rand iiuBerer Rand

Bild 1-117

Bild 1-118

Zweifach-zusammenhangender Bereich

x, y-Ebene mit einem "Loch" im Koordinatenursprung

Besteht der Rand eines Bereiches jedoch aus mehreren geschlossenen Kurven, so liegt ein mehrfach-zusammenhdngender Bereich vor. Bild 1-117 zeigt einen (ebenen) zweifach-zusammenhdngenden Bereich. Auch die x, y-Ebene ohne den Nullpunkt stellt einen zweifach-zusammenhdngenden Bereich dar (Bereich mit einem sog. "Loch"; Bild 1-118).


155

(2)

Die Bedingung (1-373) bzw. (1-374) wird auch als Integrabilitiitsbedingung bezeichnet.

(3)

Im FaIle der Wegunabhangigkeit verschwindet das Linienintegral langs einer geschlossenen Kurve. Sind namlich C l und C 2 zwei verschiedene Verbindungswege der Punkte Ii und ~ (Bild 1-119), so ist wegen der Wegunabhiingigkeit

f F' dr f F' dr

(1-378)

=

C1

C2

Bild 1-119 Im Falle der Wegunabhdngigkeit verschwindet das Linienintegral langs des geschlossenen Weges C l - C2 (C l und C 2 sind zwei von Pi nach P 2 orientierte Verbindungswege)

Fur die geschlossene Kurve C l - C 2 , die zunachst von Ii langs der Kurve C l nach P2 und von dort Iangs der Kurve - C 2 zuriick nach Pl fiihrt, gilt dann unter Beriicksichtigung der Gleichung (1-378):

fF .dr f F. dr f F' dr + f F' dr f F' dr - f F' dr =

=

C1

-

C2

=

-C 2

C1

(1-379)

=0

=

C1

C2

Wir hatten bereits erkannt, daB ein Linien- oder Kurvenintegral

fF. dr

genau dann

C

wegunabhiingig ist, wenn das (ebene oder raumliche) Vektorfeld ff als Gradient einer ortsabhangigen Funktion ¢, Potentialfunktion genannt, darstellbar ist: ff = grad ¢. Da die konservativen Vektorfelder in Naturwissenschaft und Technik eine iiberragende Rolle spielen, wollen wir ihre wichtigsten Eigenschaften wie folgt zusammenstellen:

156

•

I Vektoranalysis

Beispiele (1)

Das ebene Vektorfeld Potentialfeld, da

F(x; y) == 3 x 2 y

oF 0 2 2 - x == - (3 x y) == 3 x

oy

oy

ex + x 3 ey ist konservativ, d. h. ein

und

und somit die lntegrabilitdtsbedingung (1-373) erfiillt ist:

oFx

st;

-==-==3x

oy

2

ox

Das Linienintegral

ff . f

(3 Xl Y dx

dr =

C

c

+ x 3 dy)


157

ist daher wegunahhdngig, wobei C einen beliebigen Verbindungsweg zweier Punkte ~ und ~ bedeutet, d.h. es gilt: Pz

ff . f

+ x 3 dy)

2

(3 x y dx

dr =

~

C

Wir bestimmen nun die Potentialfunktion ¢(P) = ¢(x; y), deren partielle Ableitungen 1. Ordnung wir bereits kennen. Denn es gilt

F = grad ¢ und somit o¢

-

ox =

F = 3x Z y

und

x

o¢

- = F =X

oy

3

y

Wir integrieren oel> und beachten dabei, daB die Integrationskonstante noch

ox

von der Variablen y abhangen kann:

Durch partielle Differentiation nach y und unter Beriicksichtigung von o¢ = x3 erhalten wir daraus schlieBlich:

oy

o¢ =

-

oy

X

3

+ K ' (y) =

x

3

K'(y) = 0 ~ K(y) = const. = K o

Die Potentialfunktion lautet daher: ¢(x;y)=x 3 y + K o

Fiir einen beliebigen, von tionsweg C gilt somit:

(2)

~

= (Xl; Yl) nach

~

= (x z; yz) fiihrenden Integra-

Wir betrachten das folgende, in Polarkoordinaten definierte Vektorfeld: -+

-+

-+

F=F(r;({J)=r er

({J

+-

r

eq>

(r > 0)

158

I Vektoranalysis Die Rotation dieses Feldes verschwindet in jedem Bereich, der den Koordinatenursprung nicht enthalt, Denn mit

F,.

und

== r

folgt nach Gleichung (1-244) fur die z-Komponente der Rotation (die x- und y-Komponenten verschwinden bei einem ebenen Feld bekanntlich automatisch): (rot F) z

=;:1 . or0 (r . F'fJ) -

1 sr; ;: . ocp

=;:1 [0or (cp) -

0 ocp (r)

J=

0

Das Vektorfeld Fist somit fur r > 0 wirbelfrei. Jetzt berechnen wir das Linienintegral dieses Feldes langs des Mittelpunktskreises K mit dem Radius r (Bild 1-120).

y

-,

r

x

Bild 1-120 Zur Integration Iangs eines Mittelpunktskreises mit dem Radius r

Kreis K

Da der Vektor dr hier tangentiale Richtung hat und somit zum Tangenteneinheitsvektor (Basisvektor) eqJ parallel verlauft, laBt er sich in der Form

dr

==

ds eqJ

==

(r dqJ) eqJ

darstellen 19). Damit erhalten wir fur das Skalarprodukt druck

- d-r == (r -e; + -;: qJ F· eqJ) . d-r == (r -e, ==

r2 de: (er ' eqJ)

+ qJ dqJ

~

o 19)

ds = r dip ist das Linienelement des Kreises.

+ -;:qJ

eqJ) . (d r qJ -) eqJ

(eqJ' eqJ) == qJ dip '-...---'

1

F' ==

dr den Aus-


159

Das Linienintegral langs des Kreises K besitzt damit den folgenden Wert:

Wir erhalten somit langs der geschlossenen Kreislinie einen von Null verschiedenen Wert, obwohl die Rotation des Vektorfeldes F verschwindet. Diesen nur scheinbaren Widerspruch losen wir jetzt wie folgt auf: Die Integrationskurve K umschlieBt eine Singularitdt, namlich den N ull== 0, in dem der Feldvektor F nicht definiert ist. Unsere Kreislinie liegt somit nicht - wie im Kriterium (1-373) gefordert - in einem einfachzusammenhdngenden Bereich, sondern in einem zweifach-zusammenhdngenden Bereich (gesamte x, y-Ebene mit Ausnahme eines "Loches" im Nullpunkt). Diese Aussage gilt im iibrigen auch fiirjede andere geschlossene Kurve urn den Nullpunkt. Mit anderen Worten: Die Kreislinie K liegt in einem Bereich, in dem die Bedingung rot F == 0 nur fur r > 0 erfiillt ist. Das Kriterium fur die Wegunabhangigkeit eines Kurven- oder Linienintegrals ist somit in unserem konkreten Fall nicht anwendbar. punkt r

• 7.5 Anwendungsbeispiele aus Physik und Technik 7.5.1 Kugelsymmetrische Vektorfelder (Zentralfelder) Wie bereits bekannt, verschwindet die Rotation eines kugelsymmetrischen Vektorfeldes oder Zentralfeldes F == f (r) r in jedem Bereich, der den Nullpunkt r == 0 nicht enthalt:

e

rot

F == 0

(r > 0)

(1-384)

Daher ist ein Zentralfeld in jedem einfach-zusammenhangenden Gebiet, das den Nullpunkt ausschlieBt, konservativ. Da aber der Nullpunkt die einzige singulare Stelle im Raum ist, lafit sich jede geschlossene Kurve C ober- oder unterhalb des Nullpunktes auf einen Punkt zusammenziehen. Der Raum ohne Nullpunkt stellt also fur ein Zentralfeld einen einfach-zusammenhangenden Bereich dar. Somit gilt fur jede geschlossene Kurve C, die nicht durch den Nullpunkt verlauft: (1-385)

Mit anderen Worten: Ein kugel- oder radialsymmetrisches Vektorfeld (Zentralfeld) ist stets konservativ.

I Vektoranalysis

160

•

Beispiel

Sowohl das Gravitationsfeld der Erde als auch das elektrische Feld einer Punktladung sind Zentralfelder und somit konservative Vektorfelder.

•

7.5.2 Magnetfeld eines stromdurchflossenen linearen Leiters In der Umgebung eines stromdurchflossenen linearen Leiters existiert ein ringfiirmiges Magnetfeld mit der magnetischen Feldstdrke 1-+ H==-- e -+

2ng

(Q > 0)

(1-386)

qJ

(in Zylinderkoordinaten; I: Stromstarke; o: senkrechter Abstand des Punktes P von der Leiterachse; Bild 1-121). z

rinqtormiqes Magnetfeld

i~ I

magnetische Feldlinie K

elektrischer Leiter

Bild 1-121 Ringformiges Magnetfeld in der Umgebung eines stromdurchflossenen linearen Leiters

Bild 1-122 Zur Integration langs einer kreisformigen magnetischen Feldlinie

Wir interessieren uns nun fur das geschlossene Linienintegral

fifo dr liings

einer

K

kreisfiirmigen Feldlinie K urn den Leiter (Berechnung der "Zirkulation"; Bild 1-122).


161

Der differentielle Verschiebungsvektor dr liegt dabei in der Kreistangente und ist somit in der Form

== ds

dr

(1-387)

e d9 dip

(Ad

Die 1ntegrationsgrenzen lauten dabei wie folgt: 9-1ntegration: tp-Integration:

Von 9 =10 bis 9 =n/2 Von
R

fff

(1-468)

div if dV erhalten wir daher aufierhalb des geladenen

(V)

Zylinders keine Beitrage. Somit kann die Integration auf das Volumen Vz dieses Zylinders beschrankt werden. I nnerhalb dieses Bereiches gilt nach wie vor (1-469)

9 Integralsatze von GauB und Stokes

221

Wir erhalten dann aus dem Gaufischen Integralsatz die folgende Beziehung (Gleichung (1-464)): E(g)· 2n o! =

ffI

div i dV=

(~)

Iff ~:l

dV =

~:l

(~)

.Iff

dV =

~:l. nR

21

(1-470)

(~) ~

nR 2l

Im Aufienraum des geladenen Zylinders gilt daher: QeI R 2 1 E(g) == - _ . 2 Go g

(g

~

(1-471)

R)

D.h. die elektrische Feldstarke E(g) ist dart umgekehrt proportional zum Abstand g von der Zylinderachse, das Feld nimmt also nach auBen hin ab (Bild 1-172).

E(p)

E(R) E(R)

= Pel R 2£0

Bild 1-172

Im AuBenraum eines homogen geladenen Zylinders nimmt die elektrische Feldstarke nach auBen hin ab R

P

Gesamtfeld des geladenen Zylinders Insgesamt haben wir damit die folgende Feldstdrkeverteilung: gel. g _

2 Go E (Q)

==

fur Qel

R2.~

2 GO

g

Bild 1-173 zeigt den Verlauf dieser Verteilung.

(1-472)

222

I Vektoranalysis

E(p)

E(R)

R

p

auBen

innen

Bild 1-173 Verlauf der elektrischen Feldstarke bei einem homogen geladenen Zylinder in axialer Richtung (positive Ladungsdichte; Zylinderradius R)

9.3.2 Magnetfeld eines stromdurchflossenen linearen Leiters Ein sehr langer, linearer Leiter wird von einem konstanten Strom mit der Stromdichte i = io z durchflossen. Er erzeugt in seiner Umgebung ein ringfiirmiges Magnetfeld (Bild 1-174).

e

z

Bild 1-174 Ringformiges Magnetfeld eines stromdurchflossenen linearen Leiters Leiter

--1

magnetische Feldlinie

Der magnetische Feldstarkevektor jj tangiert dabei die kreisformigen Feldlinien und sein Betrag kann daher wegen der Zylindersymmetrie nur vom Abstand g von der Leiterachse abhangen. Bei Verwendung von Zylinderkoordinaten gilt somit:

jj = H(g)

s,

(1-473)

223


Wir stellen uns nun die Aufgabe, den funktionalen Zusammenhang zwischen der magnetischen Feldstarke und dem Abstand vom Leiter herzuleiten. Dabei verwenden wir den I ntegralsatz von Stokes. Er lautet hier:

f if . If dr =

e

(rot

if) . N dA

(1-474)

(A)

Dabei ist C eine kreisformige magnetische Feldlinie mit dem Radius g und A die eingeschlossene, in Bild 1-175 grau unterlegte Kreisflache.

Bild 1-175 Zur Integration langs einer kreisformigen magnetischen Feldlinie

Leiterquerschnitt kretstormiqe magnetische Feldlinie (Integrationskurve C)

Wir berechnen zunachst das Kurvenintegralim Stokes'schen Integralsatz. Da der Feldstarkcvektor H in die Tangentenrichtung fallt, d. h. zum Tangenteneinheitsvektor T == eqJ parallel ist, gilt

H· dr == (H· T)

ds ==

(H· eqJ)

ds == H(g) (eqJ· eqJ) ds == H(g) ds

(1-475)

'-y----I

1

und somit

f if . f dr =

e

H(g) ds = H(g) .

e

f

ds = H(g) . 2n g

(1-476)

e

'--.r--'

2ng Denn der Betrag H (g) der Feldstarke ist Iangs der magnetischen Feldlinie konstant und das verbliebene Kurvenintegral

f

ds beschreibt den Umfang U der kreisformigen Feld-

e linie, besitzt also den Wert U == 2 tt g.

224

I Vektoranalysis

Jetzt wenden wir uns dem Wirbelfluj3 im Stokeschen Integralsatz zu. Nach Maxwell besteht dabei zwischen der magnetischen Feldstarke if und der Stromdichte in jedem Punkt des Feldes der folgende Zusammenhang:

r

rot if ==

r

(I -477)

(es handelt si~h hierbei urn eine der vier Maxwellschen Gleichungen). Beim Fluj3 des Vektors rot H durch die in Bild 1-175 grau unterlegte Kreisflache beachten wir ferner, daB die Flachennormale N in die z-Richtung zeigt und somit mit dem Basisvektor (Einheitsvektor) z identisch ist. Dann aber gilt:

e

(rot if) . N ==

t ez == io (e z . ez) == io

(1-478)

"---v----'

1 Bei der Berechnung des .Wirbelflusses" mussen wir berucksichtigen, daB die Stromdichte auj3erhalb des Leiterquerschnitts uberall den Wert Null hat (Bild 1-176). Die Integration ist daher nur tiber die Ouerschnittsflache A * des Leiters zu erstrecken, unddort hat die Stromdichte den konstanten Wert i o.

magnetische Feldlinie C

Leitercuersctmittstteche A *

Flecbe A, berandet von der magnetischen Feldlinie C

Bild 1-176

Damit erhalten wir:

JJ (rot if) . N dA = JJ io dA (A)

(1-479)

(A*)

Das verbliebene Doppelintegral ist definitionsgemaf die (hier konstante) Stromstiirke I des Leiters. Der Wirbelfluj3 des Magnetfeldes betragt damit:

JJ (rot H) . N dA = JJ io dA = io . JJ dA = ioA* = (A)

(A*)

(A*)

A*

1

(1-480)


225

Der Stokes'sche Integralsatz fiihrt also zu dem folgenden Ergebnis: H(Q)

0

2nQ

=

(1-481)

I

Die magnetische Feldstarke H(Q) ist daher dem Abstand Q vom Leiter umgekehrt proportional, nimmt also nach auBen hin ab: I

1

(Q > 0)

H(Q)=_o2n Q

(1-482)

Diese Abhangigkeit wird in Bild 1-177 verdeutlicht.

H(p)

Bild 1-177

H(p) ~

Verlauf der magnetischen Feldstarke in der Umgebung eines stromdurchflossenen linearen Leiters

Lp

p

226

I Vektoranalysis

Ubungsaufgaben Zu Abschnitt 1 1) Wie lautet die vektorielle Darstellung der in Bild 1-178 skizzierten Wurfparabel (waagerechter Wurfmit der Anfangsgeschwindigkeit vo)? x(t)

x

yet)

Wurfparabel

Bild 1-178 y

2)

Beschreiben Sie die folgenden Kurven durch parameterabhdngige Ortsvektoren und bestimmen Sie den jeweiligen Tangentenvektor: a) Parabel y = 4x 2 , X ~ 0 b) Mittelpunktskreis (Radius R, positiver Umlaufsinn) c) Gerade durch den Ursprung mit der Steigung m = 2

3) Auf dem Bildschirm eines Oszillographen durchlaufe ein Elektronenstrahl eine Bahn mit dem zeitabhdngigen Ortsvektor r(t) = (.a . c~s(w t)) b . sin teo t)

a) b) c)

4)

(t

~

0)

Zeichnen Siedie Bahnkurve. Welche Bedeutung haben die Konstanten a, b und w? Bestimmen Sie den Geschwindigkeits- und Beschleunigungsvektor. Zeigen Sie: Der Beschleunigungsvektor (t) ist stets dem Ortsvektor (t ) entgegengerichtet.

a

r

Bestimmen Sie fur die folgenden Bewegungen eines Massenpunktes den Geschwindigkeitsvektor v(t) und den Beschleunigungsvektor a(t): a)

Kreisbahn: r(t) = (R . c~s(w t)) R . sln(w t)

(t

~

0)

b)

Zykloide:

(t

~

0)

r(t) = (R(t - sin t)) R(1 - cos t)

227

Ubuugsaufgaben 5)

Differenzieren Sie die folgenden, vom Parameter t abhangigen Vektoren zweimal nach t: a)

a(t)=(Sin~;t))

a(t)=(:=::t~::)

b)

cos(2t) 6)

Gegeben sind die folgenden parameierabhdngigen Vektoren:

b(t) =

(

t)

2 , cos 2. t

;:n

,

Berechnen Sie die 1. Ableitung der folgenden Skalar- und Vektorprodukte: a)

7)

a .b

b.c

b)

c)

a

xb

d)

a

xc

Gegeben ist die Raumkurve mit dem Ortsvektor

r(t) = 2· cos(5t)

ex + 2· sin(5t) e + lOt e

z

y

Bestimmen Sie den Tangenten- und Hauptnormaleneinheitsvektor sowie die Kriimmung der Kurve fur den Parameterwert t =

8)

r

Bestimmen Sie fur die Raumkurve (z) = ( :: ) die folgenden Groben: a) b)

9)

Bogenldnge im Intervall 0 ~ t ~ 1 Kriimmung und Kriimmungsradius fur den Parameterwert t = 1

Die Gleichung einer ebenen Bewegung laute:

r(t)= t ex + t e 2

a) b) c) d) e)

10)

n

"4'

( -

y

CfJ

0)

(r ist der Abstand des Punktes P == (x; y) vom Koordinatenursprung). Skizzieren Sie das Vektorfeld.

9)

Ein Masseteilchen bewegt sich in dem ebenen Geschwindigkeitsfeld v(x; y) == Wie lautet die Bahnkurve des Teilchens, wenn essich zur Zeit t == 0 im Punkt P == (0 ; 2) befindet?

ex + y eye

Anleitung: Das Teilchen bewegt sich auf einer Feldlinie, die hier als "Stromlinie" des Geschwindigkeitsfeldes bezeichnet wird.

232

10)

I Vektoranalysis Gegeben sind die folgenden physikalischen Vektorfelder: a)

Elektrische Feldstdrke

Q

E== 4 tt

80

r2

E in

Q

e== r

der Umgebung einer Punktladung Q:

4 ti

80

(80: elektrische Feldkonstante; Richtung des Ortsvektors r)

b)

M agnetische Feldstdrke ters:

if

~ I ~ H==-- e

2n 0 qJ

~

(r > 0)

r2 r

e

r:

Einheitsvektor in radialer Richtung, d.h. in

eines linearen, vom Strom I durchflossenen Lei-

(0 > 0)

(0: senkrechter Abstand von der Leiterachse; eqJ: Einheitsvektor in tangentialer Richtung)

Bestimmen und charakterisieren Sie die Flachen, auf denen der Betrag der jeweiligen Feldstarke einen konstanten Wert annimmt.

Zu Abschnitt 4 1)

Bestimmen Sie die N iveaulinien sowie den Gradient der folgenden ebenen Skalarfelder: ¢(x;y) == y b) ¢(x;y) == x 2 + y2 a)

2)

Welche ebenen Skalarfelder ¢ gehoren zu dem Gradientenfeld grad ¢ ==

yex + x e ? y

3)

Berechnen Sie den Gradient von ¢ sowie den Betrag des Gradienten im jeweiligen Punkt P: a)

¢(x;y;z)==10x2y3-5xyz2,

P==(1;-1;2)

b)

¢(x;y;z)==x2·eyz+yz3, ¢(x;y;z)==X 2+y2+ Z2,

P==(1;2; -2)

c) 4)

Zeigen Sie: Das skalare Feld ¢ = In r besitzt den Gradient grad ¢ = 12

J

(r == x 2 sprung).

5)

P == (2; 0; 1)

r

+ y2 + Z2

r

ist der raumliche Abstand des Punktes P == (x; y; z) vom Ur-

Gegeben sind die Skalarfelder ¢ == x 2 Y z + x . e " und fjJ == y . e", Bestimmen Sie den Gradient des Produktes U == ¢ . fjJ auf zwei verschiedene Arten.

233

Ubungsaufgaben 6)

Bestimmen Sie die Richtungsableitung von ¢ (x; y; z) = x y z des Vektors

a=

(

-

~) im Raumpunkt P

=

+ 3 X Z3

in Richtung

(1; 2; 1).

7)

Berechnen Sie die Richtungsableitung des ebenen Skalarfeldes ¢ in radialer Richtung im jeweiligen Punkt P: a) ¢(x;y) = x 2 _ y2, P = (3; 4) b) ¢(x;y)=4x 2+9 y2, P = (1; 0)

8)

Wie lautet die Fldchennormale der Bildflache von x 2 + (y - 1)2 - Z2 = 10 im Punkt P = (1; 2; 5)7

9)

Bestimmen Sie die Gleichung der Tangentialebene, die man im Punkt P an die Flache F(x; y; z) = anlegen kann: a) Zylindermantelflache 2\ + y2 - 5 = 0, ~ z ~ 10, P = (2; 1; 5) b) xy2z+6x2Z2_22=0, P=(2;1;-1)

10)

°

°

x

Das elektrostatische Potential in der Umgebung einer negativ geladenen Kugel lautet:

-Q

U(r)=-4n eor

(r

~

R)

(- Q: Ladung der Kugel; eo: elektrische Feldkonstante; R: Kugelradius). P sei ein beliebiger Punkt des elektrischen Feldes im AuBenraum der Kugel (r ~ R). In welcher Richtung von P nimmt das Potential U am stdrksten zu 7 Wie groB ist dieser M aximalwert ?

Zu Abschnitt 5 1)

Bestimmen Sie die Divergenz der folgenden ebenen Vektorfelder: a)

2)

b)

c)

In welchen Punkten der x, y-Ebene verschwindet die Divergenz des Vektorfeldes

_

F=

(

xy2

)

?

x 2 Y - 4y .

I Vektoranalysis

234

3)

Bestimmen Sie die Divergenz der folgenden raumlichen Vektorfelder:

a)

. . (2X F == x 2

3

-

Z2

Z2

)

xyz

4)

Berechnen Sie die Divergenz des Vektorfeldes

genden Punkten: P; == (2; 0; 1),

~ ==

F(x; y; z) ==

(1; 2; - 1),

11

xy2 ) 2 Y Z3 in den fol-

(

xyz

(3; 2; 3).

==

5)

Bestimmen Sie die Divergenz des cjJ(x; y; z) == (x - 1)2 + (y - 5)2 + Z2.

6)

Gegeben sind das Skalarfeld 4> = x 2 . eY Z und das Vektorfeld

Gradienten

stimmen Sie die Divergenz des Vektorfeldes 7)

Wie muB man die Funktion (r) rquellenfrei ist?

F == f 8)

f

der

skalaren

F=

A == cjJ F auf zwei

Funktion

( - : ) . Be-

verschiedene Arten.

(r) wahlen, damit das raumliche Zentralfeld

BestimmenSie den Gradient des radialsymmetrischen raumlichen Skalarfeldes

b

-

cjJ == a+ - und zeigen Sie, daB die Divergenz des Gradienten verschwindet (a, b: r

Konstanten; r> 0). 9)

Bestimmen Sie die Rotation der folgenden ebenen Vektorfelder: a)

10)

11)

1_(

F(X;y)== _ _ Jx2 + y2

y)

-

b)

F(x; y)

X

Zeigen Sie, daB das ebene Geschwindigkeitsfeld Ii = wirbelfrei ist.

1_(X -+ + 2) +

== _ _

Jx

Jx

1 2

+

y

y2

2

(- x

y2

Bestimmen Sie die Rotation der folgenden raumlichen Vektorfelder:

a)

F(x; y; z) =.... (

b)

F(x; y; z) ==

....

xy - Z2 ) 2xyz , x 2 Z - y2 Z .

1........-+ 2. 2 2 (x ex + y ey + z e z ) xi- y + z

X

Y- 1

ex - ye

y)

Ubungsaufgaben 12)

235

Wie sind die Parameter a und b zu wahlen, damit die Rotation des Vektorfeldes

F=

2XZ2 + y3 Z a x y2 z ( 2 2x z + b x y 3

)

iiberall verschwindet?

F=

xy3 ) 2x y2 z im Punkt P = (1; 2;1)? ( 2 x y - Z2

13)

WelchenWert besitzt die Rotation von

14)

Zeigen Sie: Das rdumliche Vektorfeld F = f (r) differenzierbare Funktion des Abstandes r).

15)

Es ist O. Berechnen Sie das Oberfldchenintegral

If (V (A)

x

F) . IV

2

+

y2

+ Z2

=

9,

dA

auf direktem Wege, mit Hilfe des I ntegralsatzes von Stokes. (A: Mantelflache der angegebenen Halbkugel mit kreisformiger Randkurve in der x, y-Ebene, Orientierung von Flache und Randkurve wie in Aufgabe 6, vgl. hierzu auch Bild 1-195). a) b)

249


1 Hilfsmittel aus der Kombinatorik Wir beschaftigen uns in diesem Abschnitt mit den Permutationen, Kombinationen und Variationen. Diese aus der Kombinatorik stammenden Abzahlmethodcn sind ein wichtiges Hilfsmittel bei der Losung zahlreicher Probleme in der Wahrscheinlichkeitsrechnung und Statistik und lassen sich in sehr anschaulicher Weise anhand des Urnenmodells einfuhren.

1.1 U rnenmodell In einer Urne befinden sich n verschiedene Kugeln, die sich z. B. in ihrer Farbe voneinander unterscheiden. Wir wollen uns dann in den nachsten Teilabschnitten mit den folgenden, in der Wahrscheinlichkeitsrechnung haufig vorkommenden Fragestellungen beschaftigen: 1. Auf wieviel verschiedene Arten lassen sich diese Kugeln anordnen? Dies fuhrt uns zu dem Begriff "Permutation". 2. Aus der Urne werden nacheinander k Kugeln gezogen, wobei wir noch die folgenden Falle unterscheiden miissen: a) Ziehung ohne Zuriicklegen (Bild II-1):

Die jeweils gezogene Kugel wird nicht in die Urne zuruckgelegt und scheidet somit fur alle weiteren Ziehungen aus. Jede der n Kugeln kann also nur einmal gezogen werden.

10 Die gezogene Kugel scheidet aus

Bild 11-1 Ziehung einer Kugel ohne Zuriicklegen


250

b) Ziehung mit Zuriicklegen (Bild 11-2): J ede Kugel darf mehrmals verwendet werden, d. h. daB jede gezogene Kugel vor der nachsten Ziehung in die Urne zuriickgelegt wird und somit bei der nachfolgenden Ziehung abermals gezogen werden kann.

Bild 11-2 Ziehung einer Kugel mit Zuriicklegen Die gezogene Kugel wird in die Urne zurOckgelegt

In beiden Fallen unterscheiden wir ferner, ob die Reihenfolge der Ziehung beriicksichtigt werden soIl oder nicht. Wir stoBen so auf die Begriffe "Variation" und .Kombination" . In der Statistik wird eine solche zufdllige Entnahme von k Kugeln als Stichprobe vom Umfang k bezeichnet 1). Sie heiBt geordnet, wenn die Reihenfolge, in der die Stichprobenelemente (hier: Kugeln) gezogen werden, berucksichtigt wird. Spielt die Reihenfolge jedoch keine Rolle, so liegt eine ungeordnete Stichprobe vor.

1.2 Permutationen Wir beschaftigen uns zunachst mit dem folgenden Problem: In einer Urne befinden sich n verschiedenfarbige Kugeln. Auf wieviel verschiedeneArten lassen sich diese Kugeln (beispielsweise nebeneinander) anordnen? Wir beginnen mit einem einfachen Beispiel. •

Beispiel Drei verschiedenfarbige Kugeln, z. B. je eine weiBe, graue und schwarze Kugel, lassen sich auf genau 6 verschiedene Arten wie folgt anordnen (Bild 11-3):

08e

oeo

oe eoe eo e 0

Bild 11-3 Drei verschiedenfarbige Kugeln lassen sich auf sechs verschiedene Arten (nebeneinander) anordnen

1)

•

Der in der Statistik grundlegende Begriff .Btichprooe aus einer Grundgesamtheit" wird in Kap. III, Abschnitt 1.2 noch ausfiihrlich erortert,


251

Allgemein heiBt eine Anordnung von n verschiedenen Elementen (Kugeln) in einer bestimmten Reihenfolge eine Permutation der n Elemente (Kugeln). Wie viele Moglichkeiten gibt es dann, n verschiedene Elemente (Kugeln) anzuordnen? Wie groB ist somit die Anzahl der Permutationen von n Elementen? Wir Iosen dieses Problem nun wie folgt: Es sind n Platze vorhanden, die wir in der iiblichen Weise von 1 bis n durchnumerieren, und n verschiedene Kugeln, mit denen wir diese Platze besetzen wollen, Den Platz Nr. 1 konnen wir mit jeder der n Kugeln belegen. Ist diese Stelle jedoch einmal besetzt, so bleiben fur die Besetzung des 2. Platzes nur noch n - 1 Moglichkeiten, Denn jede der n - 1 iibriggebliebenen Kugeln kann diesen Platz einnehmen. Ist schlieBlich auch dieser Platz besetzt, so bleiben fur die Besetzung des 3. Platzes nur noch n - 2 Moglichkeiten iibrig u. s.w.. Fur die Besetzung der Platze 1, 2, 3, ... , n gibt es daher der Reihe nach n, n - 1, n - 2, ... , 1 Moglichkeiten, Bild II-4 verdeutlicht diese Aussage.

• • •

n

n-1

n-2

Platzziffer

Anzahl der moqtichen Besetzungen

Bild 11-4 Besetzungsmoglichkeiten fur die verschiedenen Platze

Die Anzahl der Permutationen von n verschiedenen Kugeln (oder allgemein: von n verschiedenen Elementen) ist daher

P(n)

==

n(n - 1) (n - 2) ... 1 == n!

(II-1)

Befinden sich jedoch unter den n Kugeln n 1 gleiche (z.B. n1 schwarze Kugeln), so fallen alle jene Anordnungen zusammen, die durch Vertauschungen der gleichen Kugeln untereinander hervorgehen (alle iibrigen Kugeln behalten dabei ihre Platze). Bild 11-5 verdeutlicht dies fur eine Anordnung von 5 Kugeln, unter denen sich 3 gleiche (namlich schwarze) Kugeln befinden. Werden diese untereinander vertauscht, was auf genau P (3) == 3! == 6 verschiedene Arten moglich ist, so entstehen dabei keine neuen Anordnungen. Vertauschung

In

eee o

Bild 11-5 Durch Vertauschung der schwarzen Kugeln untereinander entstehen keine neuen Anordnungen

252


Bei n 1 gleichfarbigen Kugeln gibt es somit P (n1 ) = n 1! verschiedene Moglichkeiten, diese untereinander zu vertauschen. Daher gibt es genau (11-2)

verschiedene Anordnungsmoglichkeiten fur n Kugeln, unter denen sich n1 gleiche Kugeln befinden. Analog UiBt sich zeigen: Die Anzahl der verschiedenen Permutationen von n Kugeln, unter denen sich jeweils n 1 , n2 , ••• , nk gleiche befinden, ist P(n; n 1 , n2 ,

••• ,

n! nk ) = - - - - n 1!n2!···nk!

(11-3)

Wir fassen diese Ergebnisse nun in etwas allgemeinerer Form wie folgt zusammen:

2)

Die n Kugeln zerfallen somit in k verschiedene Klassen, wobei die Kugeln einer jeden Klasse gleichfarbig sind. Es treten somit nur k :::.:; n verschiedene Farben auf.

1 Hilfsmittel aus der Kombinatorik •

253

Beispiele

(1)

Auf einem Regal sol1en 5 verschiedene Gegenstande angeordnet werden. Es gibt dann P(5) == 5! == 120

verschiedene Anordnungsmoglichkeiten (Permutationen). (2)

Wir betrachten 6 Kugeln, darunter 3 weiBe, 2 graue und 1 schwarze Kugel (Bild II -6):

Bild 11-6

Es gibt dann genau P (6· 3 2 1) ==

, "

6! 3! 2! 1!

== 60

verschiedene Anordnungsmoglichkeiten (Permutationen).

•

1.3 Kombinationen Kombinationen ohne Wiederholung

Einer Urne mit n verschiedenen Kugeln entnehmen wir nacheinander k Kugeln ohne Zuriicklegen. Die Reihenfolge der gezogenen Kugeln soll dabei ohne Bedeutung sein, bleibt also unberiicksichtigt. Eine solche ungeordnete Stichprobe von k Kugeln (oder allgemein: von k Elementen) heiBt eine Kombination k-ter Ordnung ohne Wiederholung 3). •

Beispiel

Befinden sich in einer Urne drei verschiedenfarbige Kugeln (z.B. je eine weiBe, graue und schwarze Kugel) und ziehen wir nacheinander wahllos zwei Kugeln ohne Zurucklegen, so ist z. B. die folgende Ziehung eine von mehreren moglichen (Bild 11-7):

loe_

eS 1. Kugel

j •

Anordnung in der Reihenfolge der Ziehung:

oe

Bild 11-7

2. Kugel

3)

JedeKugel darf nur einmal verwendet werden und kann somit in der Stichprobe hochstens einmal vertreten sein.


254

Spielt dabei die Reihenfolge, in der die beiden Kugeln gezogen werden, keine Rolle, so wird diese Ziehung nicht von der folgenden Ziehung unterschieden (Bild II-8):

10••

Io

~

Anordnung in der Reihenfolge der Ziehung:

eo

1. Kugel

2. Kugel

Bild 11-8

Die beiden Stichproben (Anordnungen) unterscheiden sich lediglich in der Reihenfolge ihrer Elemente und werden daher als ungeordnete Stichproben oder Kombinationen 2. Ordnung nicht unterschieden.

• Die Fragestellung lautet jetzt: Auf wieviel verschiedene Arten lassen sich k Kugeln aus einer Urne mit n verschiedenen Kugeln ohne Zuriicklegen und ohne Beriicksichtigung der Reihenfolge ziehen? Wie grof ist somit die Anzahl der Kombinationen k-ter Ordnung ohne Wiederholung bei n verschiedenen Kugeln (Elementen)? Zur Klarung dieser Frage ordnen wir die n verschiedenen Kugeln a 1 , a2 , ..• , an zunachst in einer Reihe an und kennzeichnen dann diejenigen k Kugeln, die wir gezogen haben, durch die Zahl 0, alle iibrigen n - k Kugeln durch die Zahl 1 (Bild II -9):

°

genau k-mal und die Zahl 1 genau In dieser Anordnung tritt somit die Zahl (n - k)-mal auf. Wir konnen nun unsere Fragestellung auch wie folgt formulieren: Wieviel verschiedene Anordnungsmoglichkeiten gibt es fiir die insgesamt n Zahlen, unter denen k-mal die Zahl und (n - k)-mal die Zahll vorkommt?

°

255


Offensichtlich handelt es sich dabei urn die Permutationen von n Zahlen, die sich in zwei Klassen wie folgt aufteilen lassen (Bild II -10):

Bild 11-10

Daher gibt es nach Gleichung (II-5) genau

n'

(n)

C (n; k) == P (n; k n - k) == . == , , , k!(n-k)! k

(11-6)

verschiedene Moglichkeiten, aus einer Urne mit n verschiedenen Kugeln k Kugeln ohne Zuriicklegen und ohne Beriicksichtigung der Reihenfolge herauszugreifen. Kombinationen mit Wiederholungen Darf jedoch jede der n verschiedenen Kugeln mehrmals verwendet werden, so erhalt man Kombinationen k-ter Ordnung mit Wiederholung 4). Ihre Anzahl ist Cw(n; k) == (

n

+kk

1)

(11-7)

Dabei ist zu beachten, daB k jetzt auch grojJer als n sein kann. Auf die Herleitung dieser F ormel soIl verzichtet werden. Wir fassen die bisherigen Ergebnisse wiederum in etwas allgemeinerer Form wie folgt zusammen:

4)

Jede gezogene Kugel wird dabei vor der nachsten Ziehung in die Urne zuriickgelegt und hat somit die Chance, mehrmals gezogen zu werden (Ziehung mit Zuriicklegen).


256

Anmerkung

Bei Kombinationen findet also die Reihenfolge oder Anordnung der Elemente grundsatzlich keine Beriicksichtigung. Sie konnen daher auch als ungeordnete Stichproben aufgefaBt werden, die man einer sog. Grundgesamtheit mit n Elementen entnommen hat. Die Urne mit ihren n verschiedenen Kugeln liefert ein sehr anschauliches Modell fur eine solche Grundgesamtheit 5) •

•

Beispiele

(1)

Einer Warenlieferung von 12 Gliihbimen solI zu Kontrollzwecken eine Stichprobe von 3 Gliihbirnenentnommen werden. Wieviel verschiedene Stichproben sind dabei moglich? Losung :

Da es bei dieser (ungeordneten) Stichprobe auf die Reihenfolge der gezogenen Gliihbirnen nicht ankommt und die Ziehung (wie in der Praxis allgemein iiblich) ohne Zuriicklegen erfolgt, gibt es genau 12)

C(12· 3) = ( , 3

=

12 . 11 . 10 = 220 1 ·2·3

verschiedene Moglichkeiten, aus 12 Gliihbirnen 3 auszuwahlen (Kombinationen 3. Ordnung von 12 Elementen ohne Wiederholung).

5)

Der Begriff "Grundgesamtheit" wird in Kap. III, Abschnitt 1.2 naher erlautert.

1 Hilfsmittel aus der Kombinatorik (2)

257

Fur die in Bild 11-11 dargestellte Parallelschaltung dreier Widerstande stehen uns insgesamt 5 verschiedene ohmsche Widerstande R 1 , R 2 , .•. .R; zur Verfiigung. Wieviel verschiedene Schaltmoglichkeiten gibt es, wenn jeder der 5 Widerstande a) hochstens einmal, b) mehrmals, d. h. hier bis zu dreimal verwendet werden darf?

Bild 11-11 Parallelschaltung dreier Widerstande

Losung: Aus 5 Widerstanden miissen wir 3 Widerstande auswahlen, wobei die Anordnung (Reihenfolge) im Schaltkreis keine Rolle spielt. Es handelt sich also urn Kombinationen 3. Ordnung von 5 Elementen (Widerstanden) 6) • a) Da jeder Widerstand nur einmal verwendet werden darf, haben wir es hier mit Kombinationen 3. Ordnung ohne Wiederholung zu tun. In diesem Fall gibt es somit

5)

C(5' 3) = ( , 3

b)

5 ·4·3 =. - = 10 1 ·2·3

verschiedene Parallelschaltungen. Jeder Widerstand kann bis zu dreimal verwendet werden. Es handelt sich daher diesmal urn Kombinationen 3. Ordnung mit Wiederholung. Wir haben somit

Cw(5; 3) =

3- 1)= (7)3 = ~ 7.6.5= 35 (5+ 3

verschiedene Moglichkeiten fur eine Parallelschaltung aus drei Wider-

standen.

6)

•

Der Gesamtwiderstand ist unabhdngig von der Reihenfolge, in der die Einzelwiderstande geschaltet werden.


258

1.4 Variationen Variationen ohne Wiederholung Wir gehen von den gleichen Ubetlegungen aus wie im vorangegangenen Abschnitt, beritcksichtigen diesmal jedoch die Reihenfolge, in der wir die k Kugeln aus der Urne entnommen haben. Eine solche geordnete Stichprobe von k Kugeln heiBt dann eine Variation k-ter Ordnung ohne Wiederholung, wenn die Ziehung ohne Zurucklegen der Kugeln erfolgte. Jede der n verschiedenen Kugeln ist in solch einer Anordnung also hochstens einmal vertreten.

•

Beispiel In einer Urne befinden sich je eine weiBe, graue und schwarze Kugel. Wir ziehen nacheinander zwei Kugeln ohne Zuriicklegen und vergleichen die beiden folgenden miiglichen Ergebnisse miteinander (Bild 11-12):

t

0 1. Kugel

Ie

j 0

t

e 1. Kugel

Bild11-12 Ziehung zweier Kugeln ohne Zuriicklegen

2. Kugel

2. Kugel

Unter Beriicksichtigung der Reihenfolge der gezogenen Kugeln notieren wir das Ergebnis der beiden Experimente wie folgt: 1. Experiment: 2. Experiment:

e eo 0

Die beiden Anordnungen unterscheiden sich lediglich in der Reihenfolge ihrer Elemente und werden daher definitionsgemiifJ als zwei verschiedene Variationen 2. Ordnung ohne Wiederholung betrachtet.

•

Die Fragestellung lautet jetzt allgemein: Auf wieviel verschiedene Arten lassen sich k Kugeln ohne Zuriicklegen, aber unter Beriicksichtigung der Reihenfolge ziehen? Wie groB ist somit die Anzahl der Variationen k-ter Ordnung ohne Wiederholung bei n Elementen?

259


Bei der Losung dieses Problems gehen wir zunachst von einer beliebigen Kombination k-ter Ordnung ohne Wiederholung aus. Sie enthalt genau k verschiedene Kugeln, die wir der Reihe nach mit a., a 2 , ••• , ak bezeichnen, in einer beliebigen Anordnung, z.B.

Da sich diex Kugeln auf k! verschiedene Arten permutieren lassen, erhalten wir aus dieser Kombination genau k! Variationen. Dies aber gilt fur jede Kombination k-ter Ordnung. Somit ist

n! V(n; k) = k! C(n; k)

n!

(11-10)

= k! k!(n _ k)! = (n _ k)!

die Anzahl der moglichen Variationen k-ter Ordnung ohne Wiederholung.

Variationen mit Wiederholung Darf dagegen jede der insgesamt n verschiedenen Kugeln in der Urne mehrmals verwendet werden, so erhalt man Variationen k-ter Ordnung mit Wiederholung. Jede gezogene Kugel muB daher vor der nachsten Ziehung in die Urne zuriickgelegt werden (Ziehung mit Zurucklegen), Die Anzahl der Variationen k-ter Ordnung betragt in diesem Fall

(II -11) Denn wir konnen jeden der k Platze in einer solchen Anordnung mit jeder der n verschiedenen Kugeln belegen, da Mehrfachziehung jetzt zuldssig ist (Bild II-13):

• • •

n

n

n

Platzziffer

n

Anzahl der moqttchen Besetzungen

BUd 11-13 Besetzungsmoglichkeiten fur die k vorhandenen Platze

Somit gibt es genau

n . n . n ... n == n" '-v-'

k-mal

verschiedene Anordnungen.

(II-12)


260

Wir fassen die Ergebnisse in etwas allgemeinerer Form wie folgt zusammen:

Anmerkungen (1) Variationen unterscheiden sich somit von Kombinationen grundsatzlich dadurch, daB die Reihenfolge oder Anordnung der Elemente beriicksichtigt wird. Sie konnen daher auch als geordnete Stichproben aufgefaBt werden, die einer sog. Grundgesamtheit mit n Elementen entnommen wurden. (2)

Variationen k-ter Ordnung werden haufig auch als Kombinationen k-ter Ordnung unter Beriicksichtigung der Anordnung bezeichnet.

•

Beispiele

(1)

Beim Pferdetoto muB in der sog. Dreierwette der Zieleinlauf der ersten drei Pferde in der richtigen Reihenfolge vorausgesagt werden. Wieviel verschiedene Dreier-Wetten sind moglich, wenn 10 Pferde starten?


261

Losung :

Drei der zehn Pferde erreichen in einer bestimmten Reihenfolge als erste das Ziel. Es handelt sich in diesem Beispiel somit um Variationen 3. Ordnung von 10 Elementen ohne Wiederholung. Daher gibt es V(10· 3) ==

,

10! 10! == - == 8 ·9·10 == 720 (10 - 3)! 7!

verschiedene Dreier-Wetten.

(2)

Beim gleichzeitigen Wurf zweier unterschiedlich gekennzeichneter homogener Wiirfel interessieren wir uns fur die dabei auftretenden Augenpaare. Wieviel verschiedene Augenpaare sind moglich? Losung:

Als Augenzahlen eines jeden der beiden Wiirfel kommen die Zahlen 1, 2, 3, 4, 5 und 6 infrage. Bei den Augenpaaren(i; j) handelt es sich dann um geordnete Zahlenpaare, da die Wiirfel unterschiedlich gekennzeichnet sind (z.B. ein weiBer und ein schwarzer Wiirfel) und somit um Variationen 2. Ordnung der 6 Zahlen 1 bis 6 mit Wiederholung. Es gibt daher

verschiedene Augenpaare, namlich

(1; 1), (1; 2), (1; 3), (2; 1), (2; 2), (2; 3),

, (1; 6) , (2; 6)

(6; 1), (6; 2), (6; 3), ... , (6; 6) (3)

Aus den Ziffern 1 bis 9 sollen dreistellige Zahlen gebildet werden. Wieviele Moglichkeiten gibt es, wenn jede Ziffer nur einmal verwendet werden darf? Losung:

9 Ziffern werden auf 3 Platze verteilt, wobei jede Ziffer nur einmal verwendet werden darf und die Anordnung der Ziffern von Bedeutung ist. Es handelt sich also um Variationen 3. Ordnung ohne Wiederholung. Ihre Anzahl betragt 9! V(9; 3) = (9 _ 3)!

9! 6!

6!· 7·8·9 6!

- - - == 7 . 8 . 9 == 504

•

262


1.5 Tabellarische Zusammenstellung der wichtigsten Formeln Ungeordnete Stichproben sind Kombinationen, geordnete Stichproben dagegen Variationen. Tabelle 1 zeigt den Zusammenhang zwischen den Stichproben einerseits und den Kombinationen und Variationen andererseits und enthalt eine Zusammenstellung

wichtiger Formeln aus der Kombinatorik, die sich in der Wahrscheinlichkeitsrechnung und Statistik als sehr niitzlich erweisen.

Tabelle 1: Hilfreiche Formeln aus der Kombinatorik

2 Grundbegriffe 2.1 Einfiihrende Beispiele Wir beginnen mit drei einfachen Beispielen, die uns durch das gesamte Kapitel begleiten werden. Standardbeispiel1: Augenzahlen beim Wurf eines homogenen Wiirfels 7) Beim Wurf eines homogenen Wiirfels notieren wir die jeweils oben liegende Zahl, auch Augenzahl oder kurz Augen genannt. Dabei sind genau 6 verschiedene Ergebnisse oder Versuchsausgange moglich: Die Augenzahl wird stets eine der 6 Zahlen 1, 2, 3, 4, 5 und 6 seine Wir nennen ein solches Ergebnis ein Elementarereignis co. Die Elementarereignisse bilden in ihrer Gesamtheit die Ergebnismenge Q.

7)

Homogen bedeutet in diesem Zusammenhang: Der Wiirfel ist aus einem homogenen Material und geometrisch einwandfrei. Keine der 6 Seiten ist gegenuber einer anderen Seite in irgendeiner Weise bevorzugt. Diese Eigenschaften wollen wir bei allen weiteren Wiirfelexperimenten stets voraussetzen.

2 Grundbegriffe

263

Unser Wiirfelexperiment fiihrt demnach zu der Ergebnismenge Q

== {1, 2, 3, 4, 5, 6}

(II-15)

bestehend aus den 6 Elementarereignissen Wi == i (i == 1, 2, ... , 6). Es HiBt sich jedoch nicht voraussagen, welches der 6 Elementarereignisse bei einem bestimmten Wurf tatsachlich eintreten wird. Der Ausgang des Experimentes ist somit nicht vorhersehbar, sondern zuJallsbedingt. Wir sprechen daher in diesem Zusammenhang von einem Zu[allsexperiment. Erhalten wir z. B. bei einem bestimmten Wurf die Augenzahl ,,5", so konnen wir dieses Elementarereignis auch durch die Menge A == {5} beschreiben, die eine aus genau einem Element bestehende Teilmenge von Q ist. Ebenso beschreibt die Teilmenge B == {2} ein Elementarereignis, namlich das Wiirfeln der Augenzahl ,,2". Neben den Elementarereignissen sind aber noch weitere Versuchsausgange moglich, die wir ganz allgemein als Ereignisse bezeichnen wollen. Ein solches Ereignis ist z. B. das "Wiirfeln einer ungeraden Augenzahl". Dieses Ereignis laBt sich dann durch die Teilmenge

c == {1, 3, 5}

(11-16)

darstellen. Damit bringen wir zum Ausdruck, daB dieses Ereignis genau dann eintritt, wenn die erzielte Augenzahl entweder eine ,,1" oder eine ,,3" oder eine ,,5" ist. Das Ereignis C enthalt somit als Elemente genau 3 Elementarereignisse.Allgemein gilt: Ereignisse sind Teilmengen der Ergebnismenge Q.

Standardbeispiel2: Augenpaare beim Wurfmit zwei unterscheidbaren homogenen Wilrfeln

Wir wiirfeln gleichzeitig mit zwei unterscheidbaren homogenen Wiirfeln, z. B. mit einem weiBen und einem grauen Wiirfel und notieren dabei die erzielten Augenpaare. Ein mogliches Ergebnis ist dann beispielsweise

~ ~ 1. WOrfel (weiB)

(6; 1)

2. vvurtel (grau)

Augenzahl des grauen WOrfels

Augenzahl des weiBen WOrfels

II Wahrscheinlichkeitsrechn ung

264

Dieses Elementarereignis beschreiben wir durch das geordnete Zahlenpaar (6; 1). Insgesamt gibt es dann 62 == 36 verschiedene Augenpaare oder Elementarereignisse 8): Augenzahl des 2. Wiirfels

C/'J

~ $-;

(2; 1)

(2; 2)

(2; 3)

(2; 4)

(2; 5)

(2; 6)

(3; 1)

(3; 2)

(3; 3)

(3; 4)

(3; 5)

(3; 6)

:aco

(4; 1)

(4; 2)

(4; 3)

(4; 4)

(4; 5)

(4; 6)

I=:

(5; 1)

(5; 2)

(5; 3)

(5; 4)

(5; 5)

(5; 6)

(6; 1)

(6; 2)

(6; 3)

(6; 4)

(6; 5)

(6; 6)

:~

~ ~

C/'J ~

'"d N

~

on ~

~

Sie bilden in ihrer Gesamtheit die Ergebnismenge Q dieses Wiirfelexperiments: Q == {( 1;

1), (1; 2), (1; 3), ... , (6; 5), (6; 6)}

(11-17)

Wiederum gilt die Aussage: Es HiBt sich nicht vorausbestimmen, welches Elementarereignis (Augenpaar) bei einer bestimmten Durchfiihrung des Wiirfelexperiments tatsachlich eintritt. Das jeweilige Ergebnis ist rein zufallsbedingt. Es handelt sich also auch hier urn ein Zufallsexperiment. Neben diesen Elementarereignissen sind noch weitere Ereignisse moglich, die als Teilmengen der Ergebnismenge Q darstellbar sind. So wird z. B. das Ereignis A: Die Augenzahldes I, Wiirfels (weij3) ist eine ,,2" durch die 6 verschiedenen Elementarereignisse (2; 1), (2; 2), (2; 3), (2; 4), (2; 5), (2; 6)

realisiert und laBt sich somit durch die Teilmenge A

==

{(2; 1), (2; 2), ... , (2; 6)}

(11-18)

beschreiben. Das ebenfalls mogliche Ereignis B: DieAugensumme beider Wiafel ist gleich 4 wird durch die 3 Elementarereignisse (1; 3), (2; 2), (3; 1)

realisiert. 8)

Es handelt sich dabei urn Variationen 2. Ordnung der 6 Zahlen 1,2,3,4,5 und 6 mit Wiederholung.

2 Grundbegriffe

265

Daher gilt B == {(1; 3), (2; 2), (3; 1)}

(11-19)

Standardbeispiel 3: Ziehung von Kugeln aus einer U rne mit Zuriicklegen Eine Urne enthalte 5 Kugeln, darunter 3 weiBe und 2 schwarze Kugeln 9) (Bild 11-14):

1000H

Bild 11-14

Nacheinander ziehen wir ganz zufallig 3 Kugeln, wobei wir nach jedem Zug die jeweils gezogene Kugel in die U rne zuriicklegen, und notieren dabei die Farbe der gezogenen Kugeln. Es ergeben sich dann unter Beriicksichtigung der Reihenfolge, in der die Kugeln gezogen werden, die folgenden 8 Moglichkeiten (Elementarereignisse) (Bild 11-15):

000

ooe oee eee oeo eoe eoo eeo

Bild 11-15

Die Ergebnismenge Q dieses Zufallsexperiments enthalt daher genau diese 8 Elementarereignisse als Elemente: Q

==

{OOO, ooe, oeo, eoo, oee, eoe, eeo, eee}

Das Ereignis

(11-20)

A: Zwei der drei gezogenen Kugeln sind weijJ wird dabei durch die 3 Elementarereignisse

ooe, oeo, eoo realisiert und laBt sich somit durch die Teilmenge

A ==

{OOe, oeo, eOO}

(11-21 )

darstellen. Das Ereignis

B: Die drei gezogenen Kugeln sind gleichfarbig

9)

Die Kugeln unterscheiden sich lediglich in ihrer Farbe, sind ansonsten aber "baugleich" (d.h. gleicher Durchmesser, gleiches Material u. s.w.). Dies gilt auch fur aIle weiteren Urnenmodelle.

266


dagegen wird nur durch zwei Elementarereignisse, namlich

000

und

eee

realisiert ("alle Kugeln sind entweder weiB oder schwarz"). Daher gilt: B == {OOO,

eee}

(11-22)

2.2 Zufallsexperimente In den einfiihrenden Beispielen haben wir den wichtigen Grundbegriff Zufallsexperiment bereits kennengelernt. Wir definieren ihn allgemein wie folgt:

•

Beispiele (1)

Erste Beispiele fur Zufallsexperimente haben wir bereits in unseren 3 Standardbeispielen aus Abschnitt 2.1 kennengelernt. So ist das Wiirfeln mit einem oder zwei homogenen Wiirfeln ebenso ein Zufallsexperiment wie die zufdllige Entnahme von Kugeln aus einer Urne.

(2)

Ein weiteres einfaches Beispiel liefert das Zufallsexperiment "Wurf einer homogenen Miinze" mit den beiden moglichen Ergebnissen (Elementarereignissen) "Zahl" und "Wappen". Das Ergebnis eines Miinzwurfs laBt sich jedoch nicht vorausbestimmen, sondern ist ausschlieftlich zufallsbedingt.

(3)

Urn die Qualitat zu sichern, wird der Hersteller eines M assenartikels die laufende Produktion einer sog. Qualitiitskontrolle unterziehen, in dem er in regelmdfiigen Zeitabstanden Stichproben entnimmt und diese dann auf die geforderten Merkmale hin iiberpriift. Auf diese Weise konnen eventuell festgestellte unzulassige Abweichungen von vorgegebenen Sollwerten durch einen Eingriff in die Produktion noch korrigiert werden.

•

2 Grundbegriffe

267

2.3 Elementarereignisse und Ergebnismenge eines Zufallsexperiments Bei einem ZuJallsexperiment sind stets mehrere Versuchsergebnisse moglich, die sich jedoch gegenseitig ausschliej3en. Dies fiihrt uns zu den wichtigen Grundbegriffen .Elementarereignis" und .Ergebrusmenge".

Anmerkung

Wir beschranken uns im Rahmen dieser Einfiihrung auf endliche bzw. abzdhlbar-unendliche Ergebnismengen: 1. Eine endliche Ergebnismenge Q enthalt nur endlich viele Elemente (Elementarereignisse): (11-23)

2. Eine abzdhlbar-unendliche Ergebnismenge Q enthalt dagegen unendlich viele Elemente, die wir aber wie die natiirlichen Zahlen durchnumerieren konnen: (11-24)

•

Beispiele (1)

Beobachten wir beim Zufallsexperiment "WurJ eines homogenen Wiafels" (Standardbeispiel 1) die erreichte Augenzahl i, so erhalten wir eine endliche Ergebnismenge mit genau 6 verschiedenen Elementarereignissen (i

= 1, 2, ... , 6)

Sie lautet demnach wie folgt: Q

(2)

= {1, 2, 3, 4, 5, 6}

Wir fiihren mit einem homogenen Wiirfel das folgende ZuJallsexperiment durch: Es wird solange gewiirfelt, bis erstmals die Augenzahl ,,6" erscheint. Dies kann bereits nach dem ersten, zweiten oder dritten Wurf der Fall sein. Es kann aber auch langer dauern, theoretisch sogar unendlich lange. Die Anzahl i der ausgefiihrten Wiirfe bis zum erstmaligen Auftreten der Augenzahl ,,6" kann somit irgendeine natiirliche Zahl sein. Die moglichen sich gegenseitig ausschlieBenden Ergebnisse oder Elementarereignisse sind daher in der Form (i

= 1, 2, 3, ...)

268

II Wahrscheinlichkeitsrechnung darstellbar. Die Ergebnismenge Q dieses Zufallsexperiments enthalt somit (abzahlbar) unendlich viele Elemente (Elementarereignisse): Q ==

{1, 2, 3, ...}

•

2.4 Ereignisse ODd Ereignisraum Durch Zusammenfassungen von einzelnen Elementarereignissen erhalt man Teilmengen der Ergebnismenge Q. Im einfachsten Fall enthalt eine Teilmenge genau ein Element und reprasentiert somit ein Elementarereignis. Wir verdeutlichen dies an einem Beispiel.

•

Beispiel Beim Zufallsexperiment "Wurf eines homogenen Wiirfels" (Standardbeispiel l ) erhielten wir die folgende Ergebnismenge: Q == {1, 2, 3, 4, 5, 6}

Aus ihr lassen sich 6 verschiedene Teilmengen mit genau einem Element bilden:

{1}, {2}, {3}, {4}, {5}, {6} Sie reprasentieren der Reihe nach die insgesamt 6 moglichen Ergebnisse (Elementarereignisse) beim Wiirfeln, namlich der Reihe nach das Auftreten der Augenzahlen 1, 2, 3, 4, 5 und 6. •

Allgemein beschreiben die Teilmengen von Q sog.· Ereignisse, d. h. Versuchsausgange, die bei der Durchfuhrung eines Zufallsexperiments eintreten konnen, aber nicht unbedingt eintreten miissen, Wir definieren daher:

Anmerkungen (1) Die moglichen Ereignisse eines Zufallsexperiments mit der Ergebnismenge Q werden somit durch die Teilmengen von Q beschrieben.

(2)

Ein Ereignis A ist dabei eingetreten, wenn das Ergebnis des Zufallsexperiments ein Element von A ist.

(3)

Zu beachten ist, daB sowohl die leere Menge 0 als auch die Ergebnismenge Q definitionsgemaf Teilmengen von Q sind und somit Ereignisse mit folgender Bedeu tung darstellen:

269

2 Grundbegriffe

0: Die leere Menge enthalt kein Element und symbolisiert das sog. unmogQ:

liche Ereignis, d. h. ein Ereignis, das nie eintreten kann. Die Ergebnismenge dagegen enthalt aIle Elementarereignisse und reprasentiert somit das sog. sichere Ereignis, d. h. ein Ereignis, das immer eintritt. Denn bei jeder Durchfiihrung des Zufallsexperiments tritt genau eines der Elemen tarereignisse ein.

(4)

Ein Ereignis A ist somit entweder das unmogliche Ereignis 0 (A enthalt dann kein Element der Ergebnismenge Q) oder ein Elementarereignis (A enthalt dann genau ein Element von Q) oder eine Zusammenfassung von mehreren Elementarereignissen (A enthalt somit mehrere Elemente von Q) oder das sichere Ereignis Q (A enthalt dann aIle Elemente von Q, d. h. es ist A == Q).

•

Beispiele

(1)

Beim Zufallsexperiment "Wurf eines homogenen Wiirfels" (StandardbeispieI1) lautet die Ergebnismenge Q fur die beobachtete Augenzahl bekanntlich wie folgt: Q == {1,2,3,4,5,6}

Wir bilden einige Teilmengen von Q und erlautern die zugeordneten Ereignisse:

A ==

{2}

Wiirfeln einer ,,2" (Elementarereignis)

B == {2, 4, 6}

Wiirfeln einer geraden Zahl

C == {3, 6}

Wiirfeln einer durch ,,3" teilbaren Zahl

D == {1, 3, 5}

Wiirfeln einer ungeraden Zahl

E

== {5, 6}

Wiirfeln einer ,,5" oder ,,6"

270

II Wahrscheinlichkeitsrechnung (2)

Bei unserem Urnenbeispiel aus Abschnitt 2.1 (Urne mit 5 Kugeln, darunter 3 weiBe und 2 schwarze) erhielten wir bei 3 nacheinander mit Zuriicklegen gezogenen Kugeln die folgende Ergebnismenge: Q ==

{OOO, ooe. oeo, eoo, oee, eoe, eeo, eee}

Die Teilmenge A ==

{OOe, oeo, eOO}

beschreibt dann das Ereignis .Unter den 3 gezogenen Kugeln befindet sich genau eine schwarze Kugel". Dieses Ereignis wird dabei durch 3 verschiedene Elemen tarereignisse realisiert, namlich:

ooe, oeo, eoo In allen drei Fallen werden jeweils 2 weiBe und eine schwarze Kugel gezogen (jedoch in unterschiedlicher Reihenfolge). Die Teilmenge B ==

{OOO, eee}

dagegen bedeutet das Ereignis "Die drei gezogenen Kugeln sind gleichfarbig". Es wird durch zwei Elementarereignisse realisiert (entweder sind aIle gezogenen Kugeln weijioder sie sind alle schwarz). Q selbst bedeutet das sichere Ereignis, das immer eintritt. Denn Q enthalt jedes mogliche Ergebnis (Elementarereignis) unseres Zufallsexperiments.

• 2.5 Verkniipfungen von Ereignissen Ereignisse sind, wie wir inzwischen wissen, Teilmengen der Ergebnismenge Q. Sie lassen sich daher wie Mengen verkniipfen. 'Man erhalt auf diese Weise neue Ereignisse, sog. zusammengesetzte Ereignisse. Die wichtigsten Verkniipfungen mit ihren Symbolen haben wir in der folgenden Tabelle zusammengestellt.

2 Grundbegriffe

271

Tabelle 2: Verknupfungen von Ereignissen und ihre Bedeutung (Q: Ergebnismenge eines Zufallsexperiments; A, B: Beliebige Ereignisse, d. h. Teilmengen von Q)

A

ua

Vereinigung der Ereignisse A und B: Entweder tritt A ein oder B oder A und B gleichzeitig

Symbolische Schreibweise: A u B

Ana

Durchschnitt der Ereignisse A und B: A und B treten gleichzeitig ein

Symbolische Schreibweise: A

r,

B

Zu A komplementdres Ereignis: A tritt nicht ein Symbolische Schreibweise: A

Anmerkungen zur Tabelle 2

(1)

Das Ereignis A u B wird auch als Summe aus A und B bezeichnet (symbolische Schreibweise: A + B).

(2)

Das Ereignis A n B heiBt auch Produkt .aus A und B (symbolische Schreibweise: A . B oder kurz AB).

(3)

A ist die

10)

Restmenge (Differenzmenge) von Q und A:

A=

Q\ A

Die hier verwendeten Verkniipfungen von Mengen wurden bereits in Band 1, Abschnitt 1.1.2 ausfiihrlich erortert,

272 (4)

II Wahrscheinlichkeitsrechnung SchlieBen sich zwei Ereignisse A und B gegenseitig aus, so gilt (Bild II -16): .Q

AnB==0

BUd 11-16 Die Ereignisse A und B schlieBen sich gegenseitig aus ("disjunkte" Mengen)

A und B sind sog. disjunkte Mengen. Ein wichtiges Beispiel liefern die Elementarereignisse eines Zufallsexperiments, die sich stets paarweise gegenseitig ausschlieBen.

•

Beispiele (1)

Beim "Wurf einer homogenen Miinze" sei A das Ereignis "Zahl liegt oben". Dann ist das Ereignis "Wappen liegt oben" das zu A komplementdre Ereignis A.

(2)

Beim Zufallsexperiment "Wurf eines homogenen Witrfels" wird die Augenzahl beobachtet. Die Ergebnismenge Q lautet dann: Q

== {1, 2, 3, 4, 5, 6}

Wir betrachten nun die folgenden Teilmengen (Ereignisse): A == {1, 3, 5}

(Wiirfeln einer ungeraden Zahl)

B == {2, 4, 6}

(Wiirfeln einer geraden Zahl)

Dann abergilt:

A == {2, 4, 6} ==

B

Wiirfeln einer geraden Zahl

B == {1, 3, 5} == A

Wiirfeln einer ungeraden Zahl

A u B == {1, 2, 3, 4, 5, 6} == Q

Sicheres Ereignis (tritt bei jedem Wurf ein)

AnB==0

Unmogliches Ereignis (tritt nie ein, da eine Zahl nicht zugleich gerade und ungerade sein kann)

2 Grundbegriffe (3)

273

Der in Bild II -17 dargestellte stromdurchflossene Schaltkreis enthalt drei Gluhlampchen L I , L 2 und L 3 • Mit Ai bezeichnen wir das Ereignis, daB das i-te Gluhlampchen L, durchbrennt (i == 1, 2, 3). Dann laBt sich das Ereignis B: Unterbrechung des Stromkreises

wie folgt als zusammengesetztes Ereignis darsteIlen: B == Al u (A z n A 3 )

Bild 11-17 Stromkreis mit drei Gliihlampchen

Denn der Stromkreis wird genau dann unterbrochen, wenn entweder L 1 durchbrennt (Ereignis A 1) oder gleichzeitig L z und L 3 (Ereignis A z n A 3 ) oder aIle drei Gliihlampchen gleichzeitig durchbrennen (Ereignis A 1 nA znA 3 ) ·

•

Zum AbschluB erwahnen wir noch die sog. De Morganschen Regeln, die sich beim Losen mancher Probleme in der Wahrscheinlichkeitsrechnung als sehr niitzlich erweisen:

274


3 Wahrscheinlichkeit 3.1 Laplace-Experimente Wird ein Zufallsexperiment mit einer endlichen Ergebnismenge Q == {WI' W 2,· .. , W m } geniigend oft wiederholt und zeigt sich dabei, daB aile Elementarereignisse mit nahezu gleicher Haufigkeit auftreten, so spricht man von einem Laplace-Experiment 11). Bei einem solchen Experiment sind demnach alle Elementarereignisse "gleichmoglich", d. h. kein Elementarereignis ist in irgendeiner Weise gegeniiber den anderen Elementarereignissen bevorzugt oder benachteiligt. Wir geben hierzu zunachst zwei einfache Beispiele.

•

Beispiele (1)

Beim wiederholten Wurf einer (unverfalschten) Miinze erwarten wir, daB die beiden moglichen Ergebnisse (Elementarereignisse) "Zahl" und "Wappen" mit nahezu gleicher absoluter bzw. relativer Haufigkeit auftreten. Es handelt sich also beim Wurf einer Miinze im Idealfall urn ein Laplace-Experiment. Bei 1000 Wiirfen liegt unsere Erwartung somit bei je SOO-mal "Zahl" (Z) und "Wappen" (W). Mit zunehmender Anzahl n der Wiederholungen stabilisieren sich die relativen Haufigkeiten h; (Z) und h; (W) und werden sich dann nur noch unwesentlich vorn erwarteten Wert 1/2 unterscheiden (Bild 11-18 zeigt das zugehorige Stabdiagramm):

relative Heuiiqlcei:

(fur groBes n) 1/2

Bild 11-18 Stabdiagramm beim Miinzwurf (theoretisch "erwartetes" Ergebnis)

z

11)

w

Man unterscheidet noch zwischen absoluter und relativer Haufigkeit, Wird ein Zufallsexperiment n-mal durchgefiihrt und tritt dabei das Ereignis A genau n(A)-mal ein, so gilt definitionsgemdfi:

absolute Haufigkeit: n(A) relative Haufigkeit: hn(A) = n(A) n

3 Wahrscheinlichkeit (2)

275

In einer Urne befinden sich 5 Kugeln, darunter 3 weiBe und 2 schwarze (Bild 11-19):

1000"

Bild 11-19

Wir entnehmen rein zufallig eine Kugel, notieren ihre Farbe und legen sie dann wieder zuruck in die Urne (Ziehung mit Zuriicklegen). Wenn wir dieses Zufallsexperiment nur geniigend oft wiederholen, beispielsweise 1000 Ziehungen vornehmen, so erwarten wir in 3/5 == 60% aller Falle eine weifie Kugel und in 2/5 == 40 % aller Falle eine schwarze Kugel. Denn grundsatzlich besteht fur jede der 5 Kugeln die gleiche Chance, gezogen zu werden. Es handelt sich also auch hier urn ein Laplace-Experiment. Un sere "Erwartung" lautet daher bei 1000 Ziehungen (mit Zuriicklegen) wie folgt:

o e

600-mal 400-mal

In einer konkreten Versuchsserie vom gleichen Umfang wird man jedoch zufallsbedingt meist etwas abweichende Haufigkeitswerte erhalten. Bild 11-20 verdeutlicht dies in einem Stabdiagramm.

absolute Heuiiqkeit

600

-

--

400

-

-

-

dunner Balken: erwarteter Wert -

'- -

dicker Balken: beobachteter Wert

100

Bild 11-20

o

•

•


276

Eine Ergebnismenge Q mit m gleichmiiglichen Elementarereignissen wird auch LaplaceRaum genannt. Einem Elementarereignis i», wird dabei definitionsgemaf die positive Zahl p(wJ

1

(i

==-

m

== 1, 2,

(11-27)

... , m)

als sog. Wahrscheinlichkeit zugeordnet 12). Die Wahrscheinlichkeit fur ein Ereignis A ist dann durch die Gleichung peA)

== ' \

!...J

p(wJ

==

1 g(A) . -

m

g(A)

== -

(11-28)

m

definiert, wobei g(A) die Anzahl der Elemente (Elementarereignisse) von A ist (summiert wird iiber aIle in A enthaltenen Elementarereignisse wJ. Wir fassen zusammen:

12)

Wir verwenden hier die Kurzschreibweise P( {mJ)

=

p(mJ.


277

Anmerkungen (1) Man beachte, daf diese sag. klassische Definition der Wahrscheinlichkeit nur begrenzt anwendbar ist. Sie gilt nur fur Laplace-Experimente, d. h. Zufallsexperimente, bei denen folgende Voraussetzungen erfiillt sind: a) Die Ergebnismenge Q ist endlich; b) Aile Elementarereignisse (Ergebnisse) sind gleichwahrscheinlich. (2)

Die Definitionsformel (11-30) fur die Wahrscheinlichkeit P(A) eines Ereignisses A HiBt sich auch in der Form Anzahl g (A) der Elemente von A P ()A = - - - - - - - - - Anzahl m der Elemente von Q

(11-31)

angeben.

•

Beispiele

(1)

Beim Zufallsexperiment "Wurf eines homogenen Wurfels" (Standardbeispiel1) treten alle 6 moglichen Augenzahlen (Elementarereignisse) mit der gleichen Wahrscheinlichkeit auf 13): fur

i

= ·1,2, ... ,6

Denn fur jedes Elementarereignis gilt: Anzahl der gitnstigen Falle: g (i) = 1 Anzahl der moglichen Falle: m = 6 Bild 11-21 verdeutlicht diesen Sachverhalt in einem Stabdiagramm.

p(i)

1/6

-f-

Bild 11-21 Beim Wurf eines homogenen Wiirfels treten alle "Augenzahlen" mit gleicher Wahrscheinlichkeit auf (, Gleichverteilung")

2

13)

3

4

5

6

p(i) ist die Wahrscheinlichkeit fur das Elementarereignis "Augenzahl i" (i = 1, 2, ... , 6).


278 Fur das Ereignis

A

==

{2, 4, 6}

(" gerade Augenzahl ")

erhalten wir somit nach Formel (11-30) die Wahrscheinlichkeit peA)

= g(A) = ~ = ~ m

6

2

Denn die Anzahl der fiir das Ereignis A giinstigen Falle ist 9 (A) == 3, da A durch genau drei Elementarereignisse realisiert wird (A tritt ein bei der Augenzahl ,,2" oder ,,4" oder ,,6"), wahrend die Anzahl der moglichen Falle m == 6 betragt (es gibt genau 6 Elementarereignisse). (2)

In einer Warenlieferung von 100 Gliihbirnen befinden sich 20 defekte (was dem belieferten Kunden jedoch unbekannt ist). Zu KontrolIzwecken wird der Lieferung wahlIos eine Gliihbime entnommen. Die Wahrscheinlichkeit fur das Z ufallsereignis

A: Ziehung einer defekten Gluhbirne ist dann P(A) == g(A) == ~ == 02 m 100 '

Denn jede der m == 100 Gliihbirnen hat die gleiche Chance (Wahrscheinlichkeit), gezogen zu werden, wobei es 9(A) == 20 fur das Eintreten des Ereignisses A giinstige Falle gibt. Es liegt also ein Laplace-Experiment vor. Das zum Ereignis A komplementdre Ereignis

A: Ziehung einer einwandfreien Gluhbirne hat dann die Wahrscheinlichkeit g(A) 80 P(A) == == == 08 m 100 '

Man beachte die (sogar alIgemein giiltige) Beziehung P(A)

(3)

+ P(A) == 0,2 + 0,8 == 1

Beim ZufalIsexperiment "Wurf mit zwei ·unterscheidbaren homogenen Wiirfeln" (StandardbeispieI2) interessieren wir uns fiir die Wahrscheinlichkeit des Ereignisses

A: Die Augensumme ist gleich 9 Die Ergebnismenge Q dieses ZufalIsexperiments enthalt 36 gleichmogliche Elementarereignisse: Q == {(1; 1), (1; 2), (1; 3), ... , (6; 5), (6; 6)}

Es handelt sich also urn einen Laplace-Raum, bei dem jedes Elementarereignis die gleiche Wahrscheinlichkeit p == 1/36 besitzt (Bild 11-22).

279

3 Wahrscheinlichkeit p 1/36

~

(1;1)

(1;2)

(1;3)

(6;6)

Elementarereignis

Bild 11-22 Beim Wurf mit zwei homogenen Wiirfeln treten alle geordneten .Augcnpaare" mit gleicher Wahrscheinlichkeit auf

Unter den 36 Elementarereignissen befinden sich genau 4 fur das Ereignis A giinstige Falle, da es genau 4 verschiedene Elementarereignisse gibt, die zur Augensumme 9 fiihren. Dies sind die Augenpaare (3; 6), (4; 5), (5; 4)

und

(6; 3)

Somit ist g (A) == 4 und m == 36. Die Wahrscheinlichkeit P (A) betragt daher peA) = g(A) = ~ = ~ m 36 9

Wir deuten dieses Ergebnis wie folgt: Wiirden wir dieses Laplace-Experiment z. B. 900-mal durchfuhren, so diirfen wir in nahezu 100 Fallen eine Augensumme von 9 erwarten.

•

3.2 Wahrscheinlichkeitsaxiome Der klassische Wahrscheinlichkeitsbegriff .1aBt sich nur sehr begrenzt, namlich ausschlieBlich auf Laplace-Experimente anwenden. In der modernen Wahrscheinlichkeitstheorie betrachtet man daher den Begriff der "Wahrscheinlichkeit eines zufalligen Ereignisses" als einen Grundbegriff, der gewissen Axiomen, den sag. Wahrscheinlichkeitsaxiomen, geniigt. Der Aufbau dieses Axiomensystems geschieht dabei in enger Anlehnung an die Eigenschaften der relativen Haufigkeiten von zufalligen Ereignissen, die man aus umfangreichen Versuchsserien gewonnen hat.

3.2.1 Eigenschaften der relativen Haufigkeiten Anhand eines einfachen Urnenbeispiels wollen wir uns zunachst mit den wesentlichen Eigenschaften der relativen Haufigkeiten von zufalligen Ereignissen naher vertraut machen.


280

In einer Urne befinden sich 6 Kugeln, darunter 1 weiBe, 2 graue und 3 schwarze Kugeln. Wir entnehmen der Urne zufallig eine Kugel und beschreiben die dabei moglichen Ergebnisse (Elementarereignisse) durch die in Bild 11-23 naher beschriebenen Mengen A, B und C:

Bild 11-23 A=

II

A

B

{O}

Ziehung einer weiBen Kugel

=

C=

Ziehung einer grauen Kugel

{e}

Ziehung einer schwarzen Kugel

c

B

Dann ist Q == {O,

e} die Ergebnismenge dieses Zufallsexperiments.

Eigenschaften der relativen Haufigkeiten Bei einer n-fachen Ausfiihrung unseres Zufallsexperiments "Ziehung einer Kugel" treten die Ereignisse A, B und C der Reihe nach mit den absoluten Haufigkeiten n(A), n(B) und n(C) auf, wobei stets

n(A)

+ n(B) + n(C) == n

(II-32)

gilt. Die Werte der zugehorigen relativen Haufigkeiten hn(A) = n(A), n

hn(B) = n(B) n

und

hn(C) = n(C) n

(11-33)

liegen dann zwischen 0 und 1. Damit haben wir bereits eine erste Eigenschaft der relativen Haufigkeit erkannt: Die relative Haufigkeit n; (A) eines beliebigen Ereignisses A liegt stets zwischen 0 und 1. Wir beschaftigen uns jetzt mit dem Ereignis "Ziehung einer weijJen oder grauen Kugel". Es wird beschrieben durch die Menge

AuB=={O,

(11-34)

Da sich die Ereignisse A und B gegenseitig ausschliejJen, tritt das Ereignis A u B genau dann ein, wenn entweder A oder B eintritt. Der Fall, daB die Ereignisse A und B gleichzeitig eintreten, ist unter der gegebenen Voraussetzung hier nicht moglich. Somit erhalten wir bei den n Ausfiihrungen un seres Zufallsexperiments in genau n(A) + n(B) Fallen eine weiBe oder eine graue Kugel. Das Ereignis A u B tritt daher mit der relativen Haufigkeit hn(A u B)

= n(A) + n(B) = n(A) + n(B) = hn(A) + hn(B) n

ein.

n

n

(11-35)


281

Diese Aussage HiBt sich wie folgt verallgemeinern: Fur zwei sich gegenseitig ausschliefJende Ereignisse A und B gilt stets:

(II-36) Damit haben wir eine weitere Eigenschaft det relativen Haufigkeit festgestellt. Eine dritte allgemeine Eigenschaft der relativen Haufigkeit beruht darauf, daB das sichere Ereignis Q = A u B u C immer eintritt. Daher gilt: h (Q) n

= hn(A u B u C) = n(A) + nCB) + nee) = ~ = 1 n

(11-37)

n

Stabilisierung der relativen Haufigkeit bei umfangreichen Versuchsreihen

Wir konzentrieren uns jetzt auf das Ereignis A = {O} ("Ziehung einer weifJen Kugel"). Die relative Haufigkeit hn(A) ist das Ergebnis eines Zufallsexperiments und hangt somit selbst vom Zufall abo Daher werden wir bei verschiedenen Versuchsreihen vom gleichen Umfang n im allgemeinen auch verschiedene Werte fur die relativen Haufigkeiten erhalten. Bei einer geniigend oft wiederholten Ausfiihrung unseres Zufallsexperiments "erwarten" wir jedoch, daB im Mittel jede 6. Ziehung eine weifJe Kugel bringt. Unser "Erwartungswert" fur die relative Haufigkeit hn(A) liegt somit bei 1/6. Die in der Praxis tatsachlich beobachteten Werte fur hn(A) werden jedoch als Zufallsprodukte mehr oder weniger stark urn diesen Wert schwanken. Die Erfahrung lehrt aber, daB die relative Haufigkeit eines Ereignisses bei sehr umfangreichen Versuchsreihen nahezu konstant ist. Mit zunehmender Anzahl n der Versuche werden sich daher im allgemeinen die beo bachteten Werte fur h; (A) immer mehr "stabilisieren ", wie in Bild 11-24 verdeutlicht wird.

1/6

•

50

100

150

200

250

300

350

400

450

n

Bild 11-24 Die Erfahrung zeigt: Die relative Haufigkeit eines Ereignisses ist bei umfangreichen Versuchsreihen nahezu konstant, "stabilisiert" sich also mit zunehmendem Umfang n

282


Wir fassen die wichtigsten Aussagen zusammen:

3.2.2 Wahrscheinlichkeitsaxiome von Kolmogoroff Es liegt nun nahe, den Begriff der Wahrscheinlichkeit P(A) eines Ereignisses A als Grenzwert der relativen Haufigkeit hn(A) fiir n ~ 00 zu definieren. In der Tat ist dies auch versucht worden, fiihrte jedoch zu uniiberbriickbaren Schwierigkeiten, auf die wir im Rahmen dieser Darstellung nicht naher eingehen konnen, In der modernen Wahrscheinlichkeitstheorie verzichtet man daher auf die Definition des Begriffes "Wahrscheinlichkeit" und bctrachtct ihn vielmehr als einen Grundbegriff, der gewissen Axiomen geniigt. Die beobachteten Eigenschaften der relativen Haufigkeiten werden "idealisiert" und fiihren dann zu den folgenden Wahrscheinlichkeitsaxiomen von Kolmogoroff:


283

Anmerkungen (1) Axiom 3 wird auch als Additionssatz fur sich gegenseitig ausschliefiende Ereignisse bezeichnet. (2)

Bei einem Laplace-Experiment Hif3t sich die Wahrscheinlichkeit P(A) eines zufalligen Ereignisses A nach der Definitionsformel (11-30) exakt berechnen (sog. klassische Definition der Wahrscheinlichkeit). Selbstverstandlich werden dabei alle Wahrscheinlichkeitsaxiome erfullt.

(3)

Die Wahrscheinlichkeitsaxiome enthalten keinerlei Aussagen daruber, wie man in einem konkreten Zufallsexperiment die Wahrscheinlichkeiten der dabei auftretenden Ereignisse ermittelt. Sie legen den Wahrscheinlichkeiten aber Bedingungen auf, die erfullt werden miissen und stellen somit in gewisser Hinsicht Rechenregeln fur den Umgang mit Wahrscheinlichkeiten dar. Mit der Ermittlung der (meist unbekannten) Wahrscheinlichkeiten in der Praxis werden wir uns im nachsten Abschnitt 3.2.3 noch beschaftigen.

Aus den Wahrscheinlichkeitsaxiomen lassen sich weitere Eigenschaften der Wahrscheinlichkeiten herleiten, die wir wie folgt zusammenstellen:

284


3.2.3 Festlegung unbekannter Wahrscheinlichkeiten in der Praxis (" statistische" Definition der Wahrscheinlichkeit) Wir beschaftigen uns jetzt mit der fur die Praxis so auBerordentlich wichtigen, bisher aber offen gebliebenen Frage, wie man in einem konkreten Fall die unbekannten Wahrscheinlichkeiten der zufalligen Ereignisse festlegen bzw. ermitteln kann. 1m einfachsten Fall liegt ein Laplace-Experiment vor. Dann HiBt sich die Wahrscheinlichkeit P(A) eines Ereignisses A aus der "klassischen" Definitionsformel (11-30) sogar exakt berechnen, wobei die Wahrscheinlichkeitsaxiome von Kolmogoroff automatisch erfiillt sind. Bei vielen Zufallsexperimenten sind die Wahrscheinlichkeiten jedoch unbekannt und miissen dann erst festgelegt werden. Dies gilt insbesondere fur solche Experimente, die keine Laplace-Experimente darstellen. Als Grundlage fur die Festlegung der (unbekannten) Wahrscheinlichkeitswerte dient dabei die Erfahrungstatsache, daB sich die relativen Haufigkeiten der zufalligen Ereignisse bei umfangreichen Versuchsreihen im allgemeinen "stabilisieren" und sich mit zunehmender Anzahl n der Versuche immer weniger von einem bestimmten Wert unterscheiden (vgl. hierzu Abschnitt 3.2.1). Die Festlegung der unbekannten Werte der Wahrscheinlichkeiten erfolgt daher im Regelfall anhand der bei umfangreichen Versuchsreihen beobachteten relativen Hdufigkeiten. Man betrachtet dabei die relative Haufigkeit n;(A) eines Ereignisses A als einen N dherungs- oder Schdtzwert fur die unbekannte Wahrscheinlichkeit P (A), mit der das Ereignis A eintritt: (fur hinreichend grofles n)

(11-47)

Diese Art der Festlegung der Wahrscheinlichkeit wird daher auch haufig als "statistische" Definition der Wahrscheinlichkeit bezeichnet, obwohl es sich dabei urn keine Definition im mathematischen Sinne handelt. Somit gilt folgende "Regel":


285

Anmerkung Man spricht bei dieser Art der Festlegung von Wahrscheinlichkeiten auch von den empirisch bestimmten Wahrscheinlichkeitswerten. •

Beispiel

Wir kehren zu dem Urnenbeispiel aus Abschnitt 3.2.1 zuriick (Bild 11-25). Aus umfangreichen Versuchsreihen erhalten wir fur die 3 Elementarereignisse A, B und C der Reihe nach die relativen Haufigkeiten hn(A) ~ 1/6, hn(B) ~ 2/6 == 1/3 und h; (C) ~ 3/6 == 1/2. Sie liefern geeignete Schdtzwerte fur die unbekannten Wahrscheinlichkeiten P(A), P(B) und P(C) (Bild 11-25).

I A

j B

prAy

~

h n (A)

prAy

=t

P(B)

~

hn (B)

P(B)

=t

P(C)

~

hn (C)

P(C) =

t

C

Bild 11-25 Schatzwerte fur die Wahrscheinlichkeiten der Ereignisse A, B und C

•

3.2.4 Wahrscheinlichkeitsraum In der Praxis geht man bei der Bestimmung der Wahrscheinlichkeiten oft so vor, daB man den Elementarereignissen eines Zufallsexperiments mit der Ergebnismenge Q == {Wi' W 2, W 3,···} Wahrscheinlichkeiten Pi ~ 0 so zuordnet, daB die sog. Normierungsbedingung 00

I

Pi = Pi

+ pz + P3 + ."

= 1

(11-49)

i = 1

erfullt ist. Die Wahrscheinlichkeit P (A) eines Ereignisses A aus dem zugehorigen Ereignisraum ist dann durch den Ausdruck (II-50) gegeben, wobei iiber alle in A enthaltenen Elementarereignisse co, summiert wird. Der Ereignisraum wird auf diese Weise zu einem Wahrscheinlichkeitsraum.


286

Anmerkung

Bei einem endlichen Ereignisraum lauft der Index i von 1 bis n (n: Anzahl der Elementarereignisse in Q).

•

Beispiel Eine (unverfalschte) Miinze wird solange geworfen, bis erstmals "Zahl" erscheint. Dies kann bereits beim 1. Wurf der Fall sein, kann aber auch (theoretisch) unendlich lange dauern. Wir beschreiben die Elementarereignisse Ai: Beim i-ten Wurf erstmals "Zahl"

durch die Angabe der Anzahl i der Wiirfe bis zum erstmaligen Auftreten der "Zahl". Dabei kann i eine beliebige natiirliche Zahl sein. So tritt beispielsweise das Elementarereignis A 3 genau dann ein, wenn beim 3.Wurf der Miinze erstmals "Zahl" erscheint. Die Ergebnismenge Q enthalt somit unendlich viele Elemente: Q={1,2,3, ... }

Der auf dieser Ergebnismenge beruhende Ergebnisraum solI jetzt zu einem Wahrscheinlichkeitsraum erweitert werden. Dazu benotigen wir zunachst die Wahrscheinlichkeiten Pi der Elementarereignisse, die wir mit Hilfe des in Bild 11-26 dargestellten Diagramms wie folgt bestimmen konnen 14): 14)

Das Diagramm liefert ein erstes Beispiel fur ein sehr anschauliches graphisches Hilfsmittel, den sog. Ereignisbaum. Dieses Verfahren wird spater in Abschnitt 3.,7 noch naher erlautert.

3 Wahrscheinlichkeit 1. Wurf

287 2. Wurf

i-ter Wurf

3. Wurf

z z W

Bild 11-26 Ereignisbaum beim wiederholten Miinzwurf

z w W

z

w/

0, ansonsten ist

f

e (-

0: t

lJ

P

=

IX

fJ t f3 -

(t) = 0).

1.

e(-

0: t

l

P

•

5 Kennwerte oder Ma8zahlen einer Wahrscheinlichkeitsverteilung Die Wahrscheinlichkeitsverteilung einer (diskreten oder stetigen) Zufallsvariablen X laBt sich in eindeutiger und vollstandiger Weise entweder durch die Verteilungsfunktion F (x) oder aber durch die zugehorige Wahrscheinlichkeits- bzw. Dichtefunktion f (x) beschreiben. Die Verteilung kann aber auch durch bestimmte Parameter, die man als Kennwerte oder M aj3zahlen der Verteilung bezeichnet, charakterisiert werden. Zu ihnen zahlen u.a. der M ittel- oder Erwartungswert u, die Varianz (J 2 und die Standardabweichung (J. Sie sind wichtige Sonderfdlle einer Gruppe von Kennwerten, die als M omente einer Wahrscheinlichkeitsverteilung bezeichnet werden 20). Der M ittelwert j.1 kennzeichnet dabei .in gewisser Weise das Zentrum oder die M itte der Wahrscheinlichkeitsverteilung, wahrend die Varianz (J 2 und die Standardabweichung (J geeignete MaBzahlen fur die Streuung der Werte urn diesen Mittelwert darstellen.

20)

Im Rahmen dieser einfuhrenden Darstellung konnen wir auf die Momente einer Verteilung nicht naher eingehen und verweisen den Leser auf die spezielle Fachliteratur (siehe Literaturverzeichnis).

5 Kennwerte oder MaBzahlen einer Wahrscheinlichkeitsverteilung

333

5.1 Erwartungswert einer Zufallsvariablen 5.1.1 Ein einfiihrendes Beispiel Beim Zufallsexperiment "Wurf eines homogenen Wurfels" treten die 6 moglichen Werte 1, 2, 3, 4, 5 und 6 der diskreten Zufallsvariablen

X == Erzielte Augenzahl mit gleicher Wahrscheinlichkeit auf. Wenn wir dieses Experiment nur oft genug wiederholen, konnen wir "erwarten", daB die mittlere Augenzahl in der Nahe des arithmetischen Mittels aus den 6 moglichen Werten 1 bis 6 liegt. Wir "erwarten" somit bei hinreichend groBen Versuchsserien eine mittlere Augenzahl von nahezu X==

1+2+3+4+5+6 ==35 6 '

(11-96)

Dieser Wert ist der sog. Erwartungswert der Zufallsvariablen X in dem beschriebenen Wiirfelexperiment. Bei einer groBen Anzahl von Wiirfen konnen wir daher erwarten, daB wir pro Wurf eine mittlere Augenzahl von 3,5 erhalten.

5.1.2 Erwartungswert einer diskreten Zufallsvariablen In dem soeben beschriebenen Beispiel traten die moglichen Werte der diskreten Zufallsvariablen X ("Augenzahl beim Wurfeln") alle mit der gleichen Wahrscheinlichkeit auf. 1m allgemeinen jedoch sind die Werte einer diskreten Zufallsvariablen X nicht gleichverteilt. Bei der Berechnung des Erwartungswertes spielt daher die Wahrscheinlichkeitsfunktion f (x) eine entscheidende Rolle. Sie bestimmt in gewisser Weise die Gewichtungsfaktoren, mit denen die moglichen Werte Xi in die Berechnung eingehen. Den Erwartungswert der Zufallsvariablen X erhalt man dann als Summe der gewichteten Werte Xi· f (x.). Dies fuhrt zu der folgenden Definition:

Anmerkung In der Definitionsformel (11-97) wird uber alle moglichen Werte Xi summiert. Bei einer diskreten Zufallsvariablen mit abziihlbar unendlich vielen Werten wird dabei die absolute Konvergenz der Reihe in Gleichung (II-97) vorausgesetzt. Andernfalls besitzt die Verteilung keinen Erwartungswert.


334

•

Beispiele (1)

Gegeben ist eine diskrete Zufallsvariable mit der Verteilungstabelle

1

f(xJ

8

2

3

3 8

3

1

8

8

4

Sie besitzt den folgenden Erwartungswert: 4 1 3 3 1 20 E(X) = ~ x·' f(x.) = 1 . - + 2 . - + 3 . - + 4 . - = - = 2 5 ~l t 88888' i= 1

(2)

Beim ; Wurf eines homogenen Wiirfels" ist die diskrete Zufallsvariable

x

=

Erzielte Augenzahl

gleichverteilt: 2

Xi

1

f(xd

1

4

3

5

1

6

-

-

-

1

1

-

-

-

6

6

6

6

6

6

1

Sie besitzt den folgenden Erwartungswert: 6

1

1

1

E(X) = ~ x··f(x.)=1·-+2·-+ +6·-= t 66'" 6

c:

i= 1

1

1

= - (1 + 2 + ". + 6) = - . 21 = 3,5 6 6

•

5.1.3 Erwartungswert einer stetigen Zufallsvariablen Im FaIle einer stetigen ZufaIlsvariablen X definieren wir den Erwartungswert E (X) wie folgt:

5 Kennwerte oder MaBzahlen einer Wahrscheinlichkeitsverteilung 00

Anmerkung

Es wird vorausgesetzt, daB das Integral die Verteilung keinen Erwartungswert.

•

f

335

Ix I . J (x) dx

existiert. Andernfalls besitzt

-00

Beispiel Die Lebensdauer T eines bestimmten elektronischen Bauelements kann in guter Naherung als eine exponentialverteilte Zufallsvariable mit der DichteJunktion

t 2 ein absolutes Maximum an der Stelle z 1 == n - 2 (Bild II -128).

(2)

Fur grojJe Freiheitsgrade n HiBt sich die Chi-Quadrat-Verteilungdurch eine Normalverteilung mit dem Mittelwert J1 == n und der Varianz (J2 == 2 n anndhern. Die hier meist verwendete Faustregel lautet: n> 100.

•

Beispiel 2

Z sei eine X -verteilte Zufallsvariable mit f == n == 10 Freiheitsgraden. Wie muB man die Intervallgrenze a wahlen, damit 950/0 aller Werte im Intervall Z ~ a liegen? Liisung: Wir miissen die Intervallgrenze a so bestimmen, daB die Bedingung P(Z ~ a)

==

F(a)

== 0,95

erfiillt ist (hellgrau unterlegte Flache in Bild 11-129). Aus der Tabelle 3 im Anhang entnehmen wir fur f == n == 10 Freiheitsgrade den gesuchten Wert der Konstanten a: F(a)

== 0,95

f= 10

a

==

Z(0,95;10)

== 18,31

Die Intervallgrenze a ist das Quantil Z(0,95; 10) der Chi-Quadrat-Verteilung. Die Zufallsvariable Z nimmt somit mit einer Wahrscheinlichkeit von 95% Werte an, die hochstens gleich 18,31 sind.

f(z)

Bild 11-129

•


440

Spezielle Werte und Rekursionsformeln der Gamma-Funktion

r(~)

Die nachfolgende Tabelle 5 enthalt einige Werte der Gamma-Funktion sowie hilfreiche Rekursionsformeln, durch die die Berechnung der N ormierungskonstanten An in der Funktionsgleichung (11-294) ermoglicht wird.

Tabelle 5: Spezielle Werte und Rekursionsformeln der Gamma-Funktion r(a)

8.2 t-Verteilung von Student Eine weitere wichtige Testverteilung ist die sog. t-Verteilung von Student 38). Sie bildet die Grundlage fur bestimmte Parametertests in der mathematischen Statistik. Wir gehen dabei von den folgenden Voraussetzungen aus: X und Y seien zwei stochastisch unabhdngige Zufallsvariable, wobei X der Standardnormalverteilung und Y der Chi-Quadrat- Verteilung mit dem Freiheitsgrad n geniige. Die aus diesen Zufallsvariablen gebildete GroBe X T==--

(11-299)

~

ist dann eine stetige Zufallsvariable, die der sog. t- Verteilung mit der Dichtefunktion

f (t) == An . (

t 2 ) (n+1)/2

(-oo 0 und somit auch s > 0, sofern nicht aIle Stichprobenwerte gleich sind (in diesem Sonderfall ist S2 == 0 und somit auch s == 0).

8)

Die Angabe des Stichprobenmittelwertes x allein reicht zur Charakterisierung der Haufigkeitsverteilung nicht aus, da empirische Verteilungen mit demselben Mittelwert vollig verschieden aussehen konnen.

III Grund1agen der mathematischen Statistik

482

(4)

Es iiberrascht zunachst, daB bei der Bi1dung der Varianz die Summe der Abweichungsquadrate nicht (wie eigentlich nahe1iegend) durch die Anzah1 n der Stichprobenwerte, sondern durch die Zah1 n - 1 dividiert wird. Eine ausreichende Begriindung ist an dieser Stelle nicht moglich, wir reich en sie aber spater nach (vgl. hierzu Abschnitt 3.2.4).

(5)

Fur praktische Berechnungen der Varianz gleichwertige Forme1 2 8

=

n

~ 1 [.I 1

S2

ist die mit der Definition (111-19)

2

Xf -

n .x

(111-20)

]

=1

oft besser geeignet. •

Beispiel

Die Untersuchung des Wirkungsgrades X von 5 serieng1eichen Kesse1n einer 61Heizungsan1age eines bestimmten Fabrikats fiihrte zu der fo1genden Urliste: (alle Werte in 0/0)

92,4; 91,9; 92,0; 91,8; 91,9

Wir bestimmen Mittelwert X, Varianz S2 und Standardabweichung s dieser Stichprobe:

1

92,4

0,4

0,16

8537,76

2

91,9

-0,1

0,01

8445,61

3

92,0 91,8

-0,2

°

8464

4

°

0,04

8427,24

5

91,9

-0,1

0,01

8445,61

Fur den M ittelwert

x erhalten wir nach der

Definitionsforme1 (111-17): (in 0/0)

Die Berechnung der Varianz S2 und damit der Standardabweichung s soll zunachst nach der Definitionsforme1 (III -19) erfo1gen:

2 Kennwerte oder MaBzahlen einer Stichprobe 1 5- 1

I

1

5

S2 = - - '

(Xi - X)2 =

4: . 0,22 =

483

0,055 ~ 0,06

i = 1

, , s = ySt;i = )0055 = 0,235 ~ 024

(in %)

Die rechnerisch bequemere Formel (111-20) fiihrt natiirlich zum gleichen Ergebnis:

S2

= -15-1

[5~ x~ ~

i= 1

~

n.

]

1 . (42320 22 x2 = -4 '

5 . 92 2 )

= 0 055 ~ 006 "

(in 0/0 2 )

Der mittIere Wirkungsgrad der Heizkessel betragt somit X = 92%. Varianz ~ 0,06% 2 und Standardabweichung s ~ 0,24% kennzeichnen dabei die Streuung der Einzelwerte urn diesen Mittelwert. _

S2

2.2 Spezielle Berechnungsformeln fur die Kennwerte einer Stichprobe 2.2.1 Berechnung der Kennwerte unter Verwendung der Haufigkeitsfunktion f(x) sei die Hdufigkeitsfunktion der (geordneten) Stichprobe vom Umfang n mit der folgenden Verteilungstabelle:

M ittelwert

x und

Varianz S2 lassen sich dann wie folgt aus dieser Tabelle berechnen:


484

Anrnerkung Fur praktische Berechnungen der Varianz

S2

1 [.

= n:

±

1

xf·

f

S2

ist die gleichwertige Formel

2

(x;) - X

(III -23)

]

= 1

oft rechnerisch bequerner. •

Beispiel

Aus einer Serienfabrikation von Gewindeschrauben wurden wahllos 100 Schrauben entnommen und der je.weilige Durchrnesser bestimmt. Diese Stichprobe vom Umfang n == 100 fiihrte dabei zu der folgenden Verteilungstabelle: -

Xi

mm

f(xJ

3,50

3,51

3,52

3,53

3,54

3,55

3,56

3,57

0,03

0,08

0,22

0,30

0,18

0,10

0,06

0,03

Wir berechnen den M ittelwert .x:, die Varianz S2 und die Standardabweichung s dieser Stichprobe unter Verwendung der folgenden Tabelle:

3,50

0,03

0,1050

- 0,0321

10,3041

0,309123

2

3,51

0,08

0,2808

- 0,0221

4,8841

0,390728

3

3,52

0,22

0,7744

- 0,0121

1,4641

0,322102

4

3,53

0,30

1,0590

- 0,0021

0,0441

0,013230

5

3,54

0,18

0,6372

0,0079

0,6241

0,112338

6

3,55

0,10

0,3550

0,0179

3,2041

0,320410

7

3,56

0,06

0,2136

0,0279

7,7841

0,467046

8

3,57

0,03

0,1071

0,0379

14,3641

0,430923

Mittelwert: 8

I

X= i

=1

Xi·

f

(x;) = 3,5321 mm

~ 3,532 mm

2 Kennwerte oder MaBzahlen einer Stichprobe

485

Varianz:

Sl

==

100 8 . ~ (Xi 100 -.:. 1 L

X)l .

100 f(xJ == -99 .2,3659.10- 4 mm ' ==

i= 1

Standardabweichung:

s ==

R

== )2,39 .10- 4 mm? == 1,55 .10- 1 mm == 0,0155 mm ~ 0,016 mm

Die Schrauben in der entnommenen Stichprobe besitzen somit einen mittleren Durchmesser von == 3,532 mm. Die Streuung der Einzelwerte urn diesen Mittelwert wird durch die Standardabweichung s == 0,016 mm charakterisiert.

x

• 2.2.2 Berechnung der Kennwerte einer gruppierten Stichprobe

f (x)

sei die Klassenhdufigkeitsfunktion einer in k Klassen aufgeteilten Stichprobe vom Urn fang n mit der folgenden Verteilungstabelle:

x

Xl' Xl' ... , k sind dabei die Klassenmitten. E's gelten dann die bereits aus dem vorangegangenen Abschnitt bekannten Formeln fur den Mittelwert x und die Varianz Sl, wenn man dort die verschiedenen Stichprobenwerte Xl' Xl' ... , X k durch die Klassenmitten Xl' Xl' ... , Xk ersetzt.

486


Anmerkung In der Praxis verwendet man zur Berechnung der Varianz S2 meist die rechnerisch bequemere (und der Definitionsformel 111-25 gleichwertige) Formel (111-26)

•

Beispiel Wir kommen nochmals auf das Beispiel in Abschnitt 1.3.3 zuriick (Entnahme einer Stichprobe vom Umfang n = 50 aus einer Serienproduktion von ohmschen Widerstanden mit dem Sollwert 100 Q). Die Stichprobenwerte hatten wir dabei in 8 Klassen der Breite ~x = 1 Q mit den ganzzahligen Klassenmitten 97 Q, 98 Q, ... , 104 Q aufgeteilt. Diese Klasseneinteilung fiihrte dann zu der folgenden Klassenhdufigkeitsfunktion f (x) (vgl. hierzu auch das in Bild 111-13 dargestellte Stabdiagramm): Klassen-Nr. i

1

2

3

4

5

6

7

8

Klassenmitte Xi (in Q)

97

98

99

100

101

102

103

104

f(xJ

0,04

0,10

0,20

0,26

0,18

0,12

0,08

0,02

Wir bestimmen den Mittelwert X, die Varianz S2 und die Standardabweichung s dieser Stichprobe unter Verwendung der nachfolgenden Tabelle:

1

97

0,04

3,88

9409

376,36

2

98

0,10

9,80

9604

960,4

3

99

0,20

19,80

9801

1960,20

4

100

0,26

26,00

10000

2600,00

5

101

0,18

18,18

10201

1 836,18

6

102

0,12

12,24

10404

1248,48

7

103

0,08

8,24

10609

848,72

8

104

0,02

2,08

10816

216,32

3 Parameterschatzungen

487

Mittelwert: 8

X=

L Xi' f(x;)

= 100,22

o

i = 1

Varianz (nach der Formel (111-26) berechnet):

2 S

50 =50-1

8 -2 - -2] [.L "f(xi)-x Xi

1=

=

1

= 50 [10046,66 n 2 _ (100,22 n)2] = 2,6649 n 2 ~ 2,665 n 2 49

Standardabweichung:

s ==

p

== J2,6649 Q2 == 1,6325 Q ~ 1,633 Q

Die entnommenen Widerstande besitzen im Mittel einen Wert von x == 100,22 Q. Die mittlere Abweichung der einzelnen Widerstandswerte von diesem Mittelwert wird durch die Standardabweichung s == 1,633Q beschrieben.

•

3 Statistische Schatzmethoden fiir die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Parameterschatzungen") 3.1 Aufgaben der Parameterschatzung Eine Grundgesamtheit, deren Elemente wir hinsichtlich eines bestimmten Merkmals X betrachten, ist bekanntlich durch die Verteilungsfunktion F(x) der Zufallsvariablen X vollstdndig charakterisiert. Wir driicken diesen Sachverhalt kurz und knapp wie folgt aus: "Die Grundgesamtheit besitzt die Verteilungsfunktion F(x)". In den Anwendungen aber stellt sich dann haufig das folgende Problem: Die Verteilungsfunktion F(x) einer Grundgesamtheit ist zwar von der Art her bekannt, enthalt jedoch noch unbekannte Parameter. So hat man es in vielen Fallen mit Normalverteilungen zu tun, deren Parameter J1 und (J jedoch noch unbekannt sind. Es ergeben sich daraus dann folgende Fragestellungen: 1. Wie erhdlt man auf der Basis einer konkreten Stichprobe Schatz- oder Ndherungswerte fur die unbekannten Parameter? 2. Wie genau und wie sicher sind solche Schdtzwerte'l

488


Mit der ersten Frage werden wir uns in den nachfolgenden Abschnitten 3.2 und 3.3 auseinandersetzen und dabei sehen, wie man unter Verwendung einer konkreten Stichprobe mit Hilfe sog. Schdtzfunktionen Naherungs- oder Schatzwerte fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung erhalten kann. Die zweite Frage fiihrt uns dann zu den sog. Konfidenz- oder Vertrauensintervallen, die wir in Abschnitt 3.4 ausfiihrlich behandeln werden. Dort werden wir zeigen, wie sich durch Stichprobenuntersuchungen Intervalle bestimmen lassen, die einen unbekannten Parameter der Verteilung mit einer vorgegebenen (groBen) Wahrscheinlichkeit iiberdecken. Man bezeichnet daher diese auf Stichprobenuntersuchungen beruhenden statistischen Schatzmethoden als Parameterschdtzungen und unterscheidet dabei noch wie folgt zwischen einer Punkt- und einer Intervallschdtzung:

3.2 Schatzfunktionen und Schatzwerte fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Punktschatzungen") Wir beschaftigen uns in diesem Abschnitt mit der Schdtzung von unbekannten Mittelwerten, Varianzen und Anteilswerten ("Erfolgswahrscheinlichkeiten" einer Binomialverteilung). Ein Verfahren zur Gewinnung von Schatzfunktionen werden wir dann im nachsten Abschnitt kennenlernen (Maximum-Likelihood-Methode). Beginnen wollen wir aber mit einem anschaulichen Beispiel.


489

3.2.1 Ein einfiihrendes Beispiel Beim radioaktiven Zerfall eines bestimmten chemischen Elementes zerfallen die einzelnen Atomkerne auf natiirliche Art und Weise regellos undunabhiingig voneinander nach den Gesetzmalsigkeiten der mathematischen Statistik. Die diskrete Zufallsvariable X = Anzahl der Atomkerne, die in einem bestimmten Zeitintervall dt zerfallen

erweist sich dabei als eine geeignete Grobe zur Beschreibung dieses statistischen Vor.. gangs. Sie geniigt einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion flX

f(x) = P(X = x) = _. e"!'

(111-27)

(x = 0, 1, 2, ...)

x!

Der dabei meist unbekannte Parameter fl in dieser Verteilung ist der Erwartungs- oder Mittelwert der Zufallsvariablen X und gibt an, wieviele Atomkerne im Mittel in dem gewahlten Zeitintervall dt zerfallen. In der Praxis stellt sich dann die Aufgabe, diesen Parameter aus einer konkreten Stichprobe zu schdtzen. Wir gehen dabei wie folgt vor: In n aufeinander folgenden Zeitintervallen gleicher Lange dt messen wir mit einem Zahlgerat, wieviele Atomkerne in diesem Zeitraum jeweils zerfallen. Wir erhalten dabei der Reihe nach Xl' X 2, X 3, ... , x; Zerfalle:

Zeitintervall Nr. i

1

2

3

n

Anzahl Xi der Atomkerne, dieim i-ten Zeitintervall zerfallen sind

Xl

X2

X3

Xn

x

Es liegt dann nahe, den arithmetischen Mittelwert dieser Stichprobe als Schatz- oder Ndherungswert fiir den unbekannten Mittelwert fl der Verteilung zu betrachten:

L n

-

fl~x

1 n

=_.

i= 1

+

+ ... +

Xl x2 x; Xi = - - - - - - -

n

(111-28)

In Abschnitt 3.3.2.2 werden wir dann naher begrunden, warum der Stichprobenmittelwert in der Tat als Schdtzwert fur den Parameter fl geeignet ist. Der durch die PoissonVerteilung (111-27) charakterisierte radioaktive Zerfall ist damit durch die Naherung fl ~ vollstdndig und eindeutig beschrieben.

x

x

3.2.2 Schatz- und Stichprobenfunktionen Fur die Schdtzung der unbekannten Parameter einer Wahrscheinlichkeitsverteilung werden spezielle Funktionen benotigt. Sie ermoglichen die ndherungsweise Berechnung dieser Parameter unter Verwendung einer konkreten Stichprobe, die man der entsprechenden Grundgesamtheit entnommen hat. Wir wollen in diesem Abschnitt zunachst am Beispiel des Mittelwertes fl einer Verteilung die wichtigen Begriffe einer Schatz- und Stichprobenfunktion einfiihren, uns dann den besonderen Eigenschaften dieser Funktionen zuwenden und abschlieBend Kriterien fur .optimale" Schatzfunktionen aufstellen.


490 Schatzung des Mittelwertes

x

Es HiBt sich zeigen, daBder Mittelwert einer konkreten ZufaIlsstichprobe Xl' X 2, ... , x; als ein geeigneter Schatz- ·oder Ndherungswert fur den unbekannten Mittelwert /1 der Wahrscheinlichkeitsverteilung der zugehorigen ZufaIlsvariablen X betrachtet werden kann 9): A

_

n

~

1

L

/1~/1=x=~'

Xi

=

Xl +X 2

+ ... +

Xn

(111-29)

n

i= 1

Diesen Schatzwert fassen wir als einen speziellen Wert oder eine Realisierung der Funktion

Xl + X 2 + ... + X; Xi = - - - ---i= 1

(111-30)

n

auf. Xl' X 2' ... , X n sind dabei stochastisch unabhdngige ZufaIlsvariable, die aIle die gleiche Verteilung besitzen wie die Zufallsgrolie X (Mittelwert /1., Varianz (T2) und Xl' X 2, ••. , x; die Werte dieser ZufaIlsvariablen anhand der entnommenen konkreten Stichprobe. Die von den n ZufaIlsvariablen Xl' X 2' ... , X n abhangigeFunktion X ist dann ebenfalls eine Zufallsvariable und wird in diesem Zusammenhang als eine Schdtzfunktion fur den unbekannten M ittelwert /1 der Zufallsvariablen X bezeichnet. Stichprobenfunktionen Die ZufaIlsvariable X ist ein erstes Beispiel fiir eine sog. Stichprobenfunktion. Darunter versteht man in der mathematischen Statistik ganz allgemein eine Funktion (ZufaIlsvariable), die von n unabhdngigen ZufaIlsvariablen Xl' X 2' ... , X n abhangt, die aIle der gleichen Verteilungsfunktion F(x) geniigen, Die unabhdngigen Zufallsvariablen Xl' Xl' ... , X n konnen dabei auch als die Komponenten einer n-dimensionalen ZufaIlsgrebe (III -31) die haufig auch als Zufallsvektor X bezeichnet wird, aufgefaBt werden. Sie beschreibt (in sehr abstrakter Weise) eine sog. mathematische Stichprobe. Eine Stichprobenuntersuchung fiihrt dann stets zu einer konkreten Stichprobe mit den Stichprobenwerten (x J ' X 2, ••• , x.}, die wir als eine Realisierung der n-dimensionalen Zufallsgrolse (X1; X 2; ... ; X n) interpretieren: n-dimensionale Zufallsgrolle

(X 1; X 2; ... ; X n)

1 1 konkrete Stichprobe

1

(Xl; X 2;···; X n )

In den nachfolgenden Abschnitten werden wir noch weitere Stichprobenfunktionen kennenlernen.

9)

Schdtzwerte kennzeichnen wir durch ein .Dach''. Beispiel: (Mittelwert) 11.

p,

ist ein Schdtzwert fur den Parameter

491

3 Parameterschatzungen Besondere Eigenschaften der Schatzfunktion X

Wir kehren nun zu der Stichprobenfunktion X, der Schdtzfunktion fur den Mittelwert J.1, zuruck. Fur verschiedene Stichproben erhalten wir im allgemeinen verschiedene Stichprobenmittelwerte x und damit auch verschiedene Schatzwerte (t fur den unbekannten Mittelwert J.1 der Grundgesamtheit 10). Unsere Schatzfunktion X besitzt dabei drei besonders wiinschenswerte Eigenschaften, die uns z.T. bereits aus Kapitel II, Abschnitt 7.5.4 (1. Beispiel) bekannt sind: (1)

Die Schatzfunktion X besitzt den Erwartungswert J.1:

(111-32)

E(X) = J.1

Eine Schatzfunktion mit dieser Eigenschaft heiBt erwartungstreu. X ist somit eine erwartungstreue Schatzfunktion fur den unbekannten Mittelwert J.1 der Grundgesamtheit. (2)

Fur die Varianz Var(X) gilt bekanntlich: _

(52

Var(X) = n

(III -33)

Dies aber bedeutet, daf die Varianz der Schatzfunktion X mit zunehmendem Stichprobenumfang n abnimmt und fur n ~ 00 gegen Null strebt. Mit anderen Worten: Die Werte der Zufallsvariablen X streuen mit zunehmendem n immer geringer um den (unbekannten) Mittelwert J.1. Die Schatzfunktion X ist - wie man sagt - konsistent. Damit bringt man ganz allgemein zum Ausdruck, daB die Wahrscheinlichkeit dafiir, daB sich die Werte einer Schatzfunktion beliebig wenig von dem zu schatzenden (unbekannten) Parameter der Grundgesamtheit unterscheiden, fur n ~ 00 gegen den Wert Eins konvergiert. (3)

Unsere Schatzfunktion X ist aber nur eine von mehreren moglichen erwartungstreuen Schatzfunktionen fur den Mittelwert J.1. Es laBt sichjedoch zeigen, daB es bei gleichem Stichprobenumfang n keine andere erwartungstreueSchatzfunktion fur den Parameter J.1 mit einer kleineren Varianz gibt.Die Schatzfunktion X heiBt daher wirksam oder effizient.

Kriterien .fur eine "optimale" Schatzfunktion

Die Schatzung eines unbekannten Parameters 9- erfolgt also mit Hilfe einer geeigneten Stichprobenfunktion

(111-34) die in diesem Zusammenhang als Schdtzfunktion fur den Parameter 9- bezeichnet wird.

10)

Der Mittelwert X einer Stichprobe ist eine Funktion der n unabhangigen Stichprobenwerte x2'

0.

O'Xn0

Xl'


492

Eine solche Schatzfunktion wird als "optimal" betrachtet, wenn sie die folgenden Kriterien erfiillt:

Anmerkung

Ein Musterbeispiel fur eine "optimale" Schatzfunktion liefert die durch Gleichung (111-30) definierte Schatzfunktion X fur den M ittelwert 11.

3.2.3 Schatzungen fur den Mittelwert Jl Wie wir aus dem vorherigen Abschnitt bereits wissen, liefert der arithmetische Mittelwert X 2, .•. , x; einen geeigneten Schatz- oder N dherungswert {l, fur den unbekannten Mittelwert u der Wahrscheinlichkeitsverteilung der zugehorigen Zufallsvariablen X:

x einer Zufallsstichprobe Xl'

A

Jl ~ Jl =

_

X

1

n

~

= ;;. i....J i= 1

Xi

(III-38)

493

3 Parameterschatzungen Die zugehorige Schdtzfunktion istdie Stichprobenfunktion

(III -39)

die zu jeder konkreten Stichprobe einen "optimalen" Schatzwert fur den Mittelwert f.l liefert. "Optimal" bedeutet in diesemZusammenhang, daB diese Schatzfunktion unter allen moglichen Schatzfunktionen den jeweils "besten" Naherungswert fur f.l bringt. Wir werden sparer diese wichtige Schatzfunktion fur den unbekannten Mittelwert f.l einer Verteilung mit Hilfe der Maximum-Likelihood-Methode herleiten (Abschnitt 3.3.2.3).

3.2.4 Schatzungen fiir die Varianz

(12

Die Varianz S2 einer Zufallsstichprobe Xl' x 2, ... , x; liefert einen geigneten Schatz- oder N dherungswert 8 2 fur die unbekannte Varianz (J2 der Wahrscheinlichkeitsverteilung der zugehorigen Zufallsvariablen X: (111-40)

Die zugehorige Schdtzfunktion ist die Stichprobenfunktion (111-41)

Sie ist (ebenso wie X) erwartungstreu, d.h. es gilt:

E(S2) = (J2

(111-42)

Genau diese wichtige Eigenschaft der Erwartungstreue ist der Grund dafiir, daB in der Definitionsgleichung fur die Varianz S2 einer Stichprobe die Summe der Abweichungsquadrate nicht (wie naheliegend) durch die Anzahl n der Stichprobenwerte geteilt wird, sondern durch die Zahl n - 1 (vgl. hierzu Abschnitt 2.1). Vereinzelt wird auch die Stichprobenfunktion n

1.

'\'

-)2 S* =~. !....J (Xi-X 2

(111-43)

i= 1

als Schdtzfunktion fur die unbekannte Varianz (J2 verwendet 11). Sie hat jedoch den Nachteil, daB sie nicht erwartungstreu ist.

11)

Diese Schatzfunktion erhalt man, wenn man die Maximum-Likelihood-Methode auf eine normalverteilte Grundgesamtheit anwendet (vgl. hierzu den nachfolgenden Abschnitt 3.3.2.3).


494

Als Schatzfunktion fur die Standardabweichung (J der Grundgesamtheit verwendet man die Stichprobenfunktion S = )S2, d.h. die Quadratwurzel aus der Stichprobenvarianz S 2. Diese Funktion ist jedoch nicht erwartungstreu.

3.2.5 Schatzungen fur einen Anteilswert p (Parameter p einer Binomialverteilung) Bei einem Bernoulli-Experiment trete das Ereignis A mit der unbekannten Wahrscheinlichkeit p ein, das komplemenidre Ereignis A somit mit der Wahrscheinlichkeit q = 1 - p. Der Parameter p, auch Anteilswert oder ErJolgswahrscheinlichkeit genannt, laBt sichdann anhand einer Stichprobe vom Umfang n wie folgt schatzen: Das Bernoulli-Experiment wird insgesamt n-mal durchgefiihrt und dabei die Anzahl k der Erfolge festgestellt 12). Dann ist die relative Haufigkeit h(A) = kin, mit der das Ereignis A ("Erfolg") eingetreten ist, ein Schatz- oder N dherungswert fur den unbekannten Parameter p der binomialverteilten Grundgesamtheit, der diese Stichprobe entnommen wurde: p

~

A

p

=

h(A)

k n

=-

(III~44)

Die zugehorige Schdtzfunktion ist

'" X

p=n

(111-45)

wobei durch die Zufallsvariable X die Anzahl der .Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments beschrieben wird. Die Zufallsvariable X geniigt bekanntlich einer Binomialverteilung mitdem Erwartungsoder Mittelwert E(X) = J1 = np und der Varianz Var(X) = (J2= np(l - p) (vgl. hierzu Kapitel II, Abschnitt 6.1). Die Schdtzfunktion P = X In fur den Anteilswert p ist dann ebenfalls binomialverteilt mit dem Erwartungs- oder M ittelwert E (P) = p und der Varianz Var(P) = p(l - p)ln.

3.2.6 Tabellarische Zusammenstellung der wichtigsten Schatzfunktionen und ihrer Schatzwerte Tabelle 1 gibt einen Uberblick tiber die Schdtzfunktionen und die zugehorigen, aus einer konkreten Zufallsstichprobe gewonnenen Schdtzwerte fur die wichtigsten statistischen Parameter und Kennwerte einer beliebigen Grundgesamtheit:

12)

Das Eintreten des Ereignisses A werten ~ir als Erfolg, das Nichteintreten von A (und somit das Eintreten des komplementdren Ereignisses A) als M ij3erfolg.


495

Tabelle 1: Schatzfunktionen und zugehorige Schatzwerte fur die wichtigsten statistischen Parameter und Kennwerte einer beliebigen Grundgesamtheit

n

I

x=~, i

Mittelwert der konkreten Stichprobe Xl' X 2 , ••• , X n :

Xi

=1

n

8 2 == _1_. \' (Xi _ X)2 n-1 L i

-"

Varianz der konkreten Stichprobe Xl.' X 2, .•. , X n :

=1

X

p==n

X == Anzahl der "Erfolge" bei n-facher Ausfiihrung des BernoulliExperiments

Relative Haufigkeit fur das Ereignis A ("Erfolg") bei n-facher Ausfiihrung des Bernoulli-Experiments:

k p == h(A) == n k: Anzahl der Erfolge A

Anmerkungen zur Tabelle 1

P sind

P

(1)

Die Schatzfunktionen X, 8 2 und auch efJizient.

(2)

Die Zufallsvariablen Xi geniigen alle der gleichen Verteilung (Mittelwert 11, Varianz Sind sie auBerdem noch alle normalverteilt, so ist auch die Schatzfunktion X eine normalverteilte Zufallsgrobe mit dem Erwartungs- oder Mittelwert E (X) == 11 und der Varianz Var(X)== (J2 In.

erwartungstreu und konsistent, X und

(J2).

(3)

Bei beliebig verteilten Zufallsvariablen Xi mit E (XJ == 11 und Var(XJ == (J2 folgt aus dem Zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung (Kap. II, Abschnitt 7.6.1), daB die Schatzfunktion X ndherungsweise normalverteilt ist mit dem Mittelwert E (X) == 11 und der Varianz Var (X) == (J2 In.

(4)

Die binomialverteilte Zufallsvariable Pist bei umfangreichen Stichproben ndherungsweise normalverteilt mit dem Mittelwert E (P) == p und der Varianz Var (P) == p(1 - p)ln. Diese Aussage folgt aus dem Grenzwertsatz von Moivre und Laplace (Kap. II, Abschnitt 7.6.3).

496 (5)


JS2

ist eine Schdtzfunktion fur die StandardabweiDie Stichprobenfunktion S == (J der Grundgesamtheit. Sie ist jedoch nicht erwartungstreu, d.h. es gilt:

chung

E (S) =1=

(111-46)

(J

Tabelle 2 enthalt eine Zusammenstellung der Schatzwerte fiir die Parameter spezieller Wahrscheinlichkeitsverteilungen, die in den technischen Anwendungen eine besondere Rolle spielen:

Tabelle 2: Schatzwerte fiir die Parameter spezieller Wahrscheinlichkeitsverteilungen, ermittelt aus einer konkreten Stichprobe

k: Anzahl der "Erfolge" bei einer n-fachen Ausfiihrung des BernoulliExperiments

k p==n A

Mittelwert /1:

x: Mittelwert der Stichprobe

Parameter A:


a) Mittelwert /1:


b) Varianz

S2:

(J2:

Varianz der Stichprobe

Anmerkung zur Tabelle 2

Die Herleitung der angegebenen Formeln zur Berechnung der Schatzwerte erfolgt exemplarisch im nachsten Abschnitt mit Hilfe der sog. Maximum-Likelihood-Methode.

13)

Es ist die jeweilige Wahrscheinlichkeits- bzw. Dichtefunktion

f

(x) angegeben.

3 Parameterschatzungen •

497

Beispiele

(1)

Die Lebensdauer T eines bestimmten elektronischen Bauelements geniige einer Exponentialverteilung mit dem unbekannten Parameter A. Wir ermitteln einen Schdtzwert 1 fur diesen Parameter anhand der folgenden Stichprobe (8 Elemente wurden zufiillig entnommen und die jeweilige Lebensdauer t i in Stunden (h) bestimmt):

i ti

-

h

1

2

3

4

5

6

7

8

950

980

1150

770

1230

1210

990

1120

Die Stichpro be ergibt den M ittelwert

_ 1 t = 8·

1

I

8

tj =

8 (950 + 980 + ... + 1120)h =

1050 h

i= 1

Somit ist ~

1 t

1 1050 h

1 1050

A == -=- == - - == - - h -1

~

000095 h- 1 '

ein Schdtzwert fiir den unbekannten Parameter A der zugrunde gelegten Exponentialverteilung. Die mittlere Lebensdauer der elektronischen Bauelemente betragt daher ndherungsweise E(T) ~ t == 1050 h. (2)

Es solI der AusschujJanteil p einer Serienproduktion von Gliihbirnen mittels einer Stichprobenuntersuchung geschdtzt werden. Aus diesemGrunde wurde eine Stichprobe von n == 300 Stiick entnommen.wobeisich k == 6 Gliihbirnen als defekt erwiesen. Somit ist ~

p

k

6

== ~ == 300 == 0,02 == 2%

ein Schdtzwert fur den (unbekannten) AusschuBanteil pin der Gesamtproduktion.

•

3.3 Ein Verfahren zur Gewinnung von Schatzfunktionen Es gibt eine Reihe von Verfahren zur Gewinnung von Schdtzfunktionen fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung. Das wohl bedeutendste Verfahren ist die sog. Maximum-Likelihood-Methode, mit der wir uns in diesem Abschnitt ausschlieBlich beschaftigen werden.

498


3.3.1 Maximum-Likelihood-Methode Wir gehen zunachst von den folgenden Ubcrlcgungen aus: X sei eine diskrete Zufallsvariable, deren Wahrscheinlichkeitsfunktion f (x) noch einen unbekannten Parameter 9 enthalte, der aus einer Zufallsstichprobe mit n voneinander unabhangigen Stichprobenwerten Xl' X 2, ... , x; geschiitzt werden solI. Die Zufallsvariable X nimmt dabei die einzelnen Stichprobenwerte mit den folgenden Wahrscheinlichkeiten an:

Wegen der Unabhiingigkeit der Stichprobenwerte ist nachdem Multiplikationssatz der Wahrscheinlichkeitsrechnung (Kapitel II, Abschnitt 3.5 bzw. 3.6) die Wahrscheinlichkeit dafiir, eine Stichprobe zu erhalten, die gerade die speziellen Werte Xl' X 2, ... , x; enthalt, durch das Produkt (111-47) gegeben. Diese Funktion hangt somit von den n Variablen (Stichprobenwerten) Xl' X 2, ... 'X n ab, zusiitzlich aber auch noch von dem unbekannten Parameter 9 der Wahrscheinlichkeitsfunktion f (x) 14). Fur eine vorgegebene konkrete Stichprobe (d.h. fur feste Werte Xl' X 2' ... , X n ) kann daher L als eine nur vom Parameter 9 abhangige Funktion betrachtet werden. Man bezeichnet diese Funktion als Likelihood-Funktion und schreibt dafiir symbolisch (111-48) Der Parameter 9 wird nun so bestimmt, daB diese Funktion einen moglichst grojJen Wert annimmt. Wir unterstellen somit, daB die vorgegebene Stichprobe unter allen denkbaren (moglichen) Stichproben mit der grojJten Wahrscheinlichkeit auftritt. Man erhalt auf diese Weise einen Schiitzwert § fur den unbekannten Parameter 9. Er laBt sich leicht aus der fur ein (relatives) Maximum notwendigen Bedingung

oL

-=0

09

(111-49)

ermitteln und ist dabei durch die n Stichprobenwerte Xl' X 2, ... , x; eindeutig bestimmt 15). Im FaIle einer stetigen ZufaIlsvariablen X muB die Likelihood-Funktion (111-48) mit der entsprechenden Dichtefunktion f (x; 9) gebildet werden, die dann ebenfalls noch von einem unbekannten Parameter 9 abhangt.

14)

Der Wert der Wahrscheinlichkeitsfunktion hangt formal von x und 9 abo Wir schreiben daher ab sofort (x; 9) anstatt von f (x). Die Likelihood-Funktion L = L(9) hangt (formal betrachtet) auch noch von den n Stichprobenwerten Xl' X 2' .,., X n ab, die jedoch bei der Bildung der Ableitung als feste GraBen angesehen werden. Wir schreiben daher die Ableitung von L nach dem Parameter 9 als partielle Ableitung.

f 15)


499

Wir fassen diese Ergebnisse wie folgt zusammen:

Anmerkungen

(1)

Wir verweisen nochmals (urn Milrverstandnisse und Verwechslungen zu vermeiden) auf die unterschiedliche Bedeutung der folgenden Symbole: 9: Unbekannter Parameter

(2)

9:

Schdtzwert fur den unbekannten Parameter 9

e:

Schdtzfunktion (Stichprobenfunktion) fur den unbekannten Parameter 9, die fur jede konkrete Stichprobe einen Schatzwert 9 liefert

Man beachte die Bedeutung der Faktoren f (Xi; 9) in der Likelihood-Funktion (III-50):

? Wahrscheinlichkeitsfunktion bei einer diskreten Zufallsvariablen X

f(x;9)

~

Dichtefunktion bei einer stetigen Zufallsvariablen X

500 (3)

III Grundlagen der mathematischen Statistik Enthalt die Wahrscheinlichkeits- bzw. Dichtefunktion mehrere unbekannte Parameter 9 1 , 9 2 , ... , 9 n so hangt auch die zugehorige Likelihood-Funktion noch von diesen Parametern ab: (III-54) Die Schdtzwerte 91 , 92 , ... , 9r fur die Parameter werden dann aus den fur ein Maximum notwendigen Bedingungen

oL

09

= 1

0,

oL

as- = 0, 2

oL

. . . '09 = r

°

(III -55)

ermittelt. Man erhalt auf diese Weise ein Gleichungssystem mit r Gleichungen und ebenso vielen Unbekannten, aus dem sich dann die'Schiitzwerte fur die unbekannten Parameter in Abhangigkeit von den n Stichprobenwerten Xl' x 2 , .•. , x, berechnen lassen (Maximum-Likelihood-Schiitzfunktionen bzw. Schiitzwerte). (4)

Die Berechnung der Schatzwerte fur die unbekannten Parameter laBt sich meist wesentlich vereinfachen, wenn man die fur das gesuchte Maximum notwendigen Bedingungen auf die logarithmierte Likelihood-Funktion (III-56) anwendet. Dies ist erlaubt, da In L eine streng monoton wachsende Funktion von L ist und somit genau dort ein Maximum annimmt, wo L selbst maximal wird. Die notwendigen Bedingungen lauten dann wie folgt:

o

-(lnL) = 0,

09 1

o

--n-(lnL) = 0, 0l1'2

o

,--n(ln L) = Ol1'r

°

(III-57)

Regel: Die Likelihood-Funktion wird zunachst logarithmiert und dann nach den einzelnen Parametern 9 1 , 9 2 , ... , 9 r partiell differenziert. Diese Ableitungen werden schlieBlich alle gleich Null gesetzt. Aus dem erhaltenen Gleichungssystem lassen sich dann die unbekannten Parameter (naherungsweise) berechnen.

3.3.2 Anwendungen auf spezielle Wahrscheinlichkeitsverteilungen. 3.3.2.1 Binomialverteilung Bei einem Bernoulli-Experiment trete das Ereignis A mit der unbekannten Wahrscheinlichkeit p ein. Bei einer n-fachen Ausfiihrungdieses Experiments ist die Wahrscheinlichkeit dafiir, daB dabei genau x-mal das Ereignis A eintritt, durch die Wahrscheinlichkeitsfunktion (x = 0, 1, ... , n)

(III -58)


501

der diskreten Binomialverteilung gegeben. Urn den Wert des unbekannten Parameters p, haufig auch Anteilswert oder Erfolgswahrscheinlichkeit genannt 16), abzuschatzen, entnehmen wir der Grundgesamtheit wie folgt eine Stichprobe vom Umfang n: Das Bernoulli-Experiment wird n-mal unabhangig voneinander ausgefuhrt, wobei genau k-mal das Ereignis A ("Erfolg") und somit (n - k)-mal das komplementdre Ereignis A ("MiBerfolg") eintrete. Da das Ereignis A dabei jeweils mit der Wahrscheinlichkeit p, das komplementare Ereignis A jeweils mit der Wahrscheinlichkeit q = 1 - p eintritt, ist die Gesamtwahrscheinlichkeit fur k-mal .Erfolg" (Ereignis A) und (n - k)-mal "MiBerfolg" (Ereignis A) durch das Produkt pk «' = pk (1 _ p)n-k

(III-59)

gegeben. Dieser Ausdruck liefert zugleich die benotigte Likelihood-Funktion, die somit die folgende Gestalt besitzt: (111-60) (n und k sind dabei als feste Werte anzusehen). Zweckmalligerweise gehen wir nun zur logarithmierten Likelihood-Funktion L* = In Luber: (III -61)

Durch Anwendung elementarer logarithmischer Rechenregeln erhalten wir hieraus: L* = In o" + In (1 -

w:: = k . In p + (n -

k) . In (1 - p)

(111-62)

Wir differenzieren diese Funktion nun partiell nach dem Parameter p:

aL* = -a [k . In p + (n ap ap

-

k) . In (1 - p)] =

1 1 k n-k - - -p l-p p l-p

= k . - + (n - k) . - - . (- 1) =

(111-63)

Die notwendige Bedingung (III-51) bzw. (III-57) fur das gesuchte Maximum lautet daher: k

n-k

-;---,,=0 p 1- p

(111-64)

Durch Auflosen dieser Gleichung nach p erhalten wir fur den unbekannten Parameter p der Binomialverteilung den folgenden Ndherungs- oder Schdtzwert: " k p=n

(111-65)

Dieser Schatzwert ist somit nichts anderes als die empirisch bestimmte relative Hiiufigkeit p(A) des Ereignisses A bei einer n-fachen Ausfuhrung des Bernoulli-Experiments.

16)Wiederum gilt: Eintreten des Ereignisses A bedeutet Erfolg, Eintreten des komplementdren Ereignisses A daher Mif3erfolg.


502

Die zugehorige Schdtzfunktion ist die bereits aus Abschnitt 3.2.5 bekannte Stichprobenfunktion ~ X P=-

(111-66)

n

(die Zufallsvariable X beschreibt dabei die Anzahl der .Erfolge" bei einer n-fachen Ausfuhrung des Bernoulli-Experiments).

•

Beispiel

Urn den Ausschuj3anteil p in der Tagesproduktion von Gliihbirnen zu schatzen, wurde eine Stichprobe vom Umfang n = 120 entnommen. Dabei erwiesen sich k = 6 Gliihbimen als nicht brauchbar. Die Maximum-Likelihood-Methode liefert dann fiir den AusschuBanteil p den folgenden N dherungs- oder Schdtzwert: A

k

6 1 = 120 20

p = - = -

n

=

005 = 5%

'

Wir konnen somit davon ausgehen, daB im Mittel jede zwanzigste Gliihbirne in der Tagesproduktion unbrauchbar ist.

•

3.3.2.2 Poisson-Verteilung

Die Zufallsvariable X geniige einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion (x

= 0, 1, 2, ...)

(111-67)

Der unbekannte Parameter (Mittelwert) f.11aBt sich dann aus einer konkreten Stichprobe vom Umfang n mit den Stichprobenwerten Xl' x 2 , ••• , X n nach der Maximum-LikelihoodMethode wie folgt schatzen: Zunachst stellen wir die Likelihood-Funktion auf:

(111-68)


503

Durch Logarithmieren unter Verwendung elementarer Rechenregeln fur Logarithmen wird daraus:

(111-69) Die benotigte partielle Ableitung von L* nach dem Parameter f.llautet damit:

(111-70) Die fur das gesuchte Maximum notwendige Bedingung (III-51) bzw. (III-57) fiihrt damit auf die Gleichung

(111-71) aus der wir dann den folgenden Maximum-Likelihood-Schdtzwert fur den unbekannten Mittelwert f.l erhalten: A

f.l=

Xl

+

Xl

+ ... + n

Xn

-

(111-72)

=x

Der Schdtzwert {t erweist sich dabei als der Mittelwert f.l ~ {t

•

=

x.

x der

vorgelegten Stichprobe:

Beispiel Beim natiirlichen radioaktiven Zerfall zerfallen die Atomkerne vollig regellos und unabhdngig voneinander nach den Gesetzmalrigkeiten der mathematischen Statistik. Die Zufallsvariable

x

= Anzahl der Atomkerne, die in einem bestimmten Zeitintervall

At zerfallen

geniigt dabei naherungsweise einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion (x = 0, 1, 2, ...)

Der noch unbekannte Parameter f.l beschreibt dabei die mittlere Anzahl der im (festen)Zeitintervall At stattgefundenen Zerfallc,

504

III Grundlagen der mathematischen Statistik In einem Experiment wurde in n == 200 aufeinander folgenden Zeitintervallen einer bestimmten (hier nicht naher interessierenden) Lange Llt die jeweilige Anzahl der zerfallenen Atomkerne eines speziellen radioaktiven Praparates mit einem Zahlgerat gemessen. Es ergab sich dabei das folgende MeBprotokoll (es wurden bis zu 10 Zerfalle pro Zeitintervall Llt gemessen):

4

0

16

16

2

31

62

3

40

120

4

38

152

5

33

165

6

19

114

7

10

70

8

5

40

9

3

27

0

10

10

Der M ittelwert dieser Stichprobe betragt somit

x=

1 200'

10.

Ln

i Xi

=

776 200 = 3,88

i=O

und ist zugleich ein N dherungs- oder Schdtzwert fur den unbekannten Parameter (Mittelwert) f.l der Poisson-verteilten Grundgesamtheit: fl ~ {t

==

x == 3,88

Somit zerfallen im Zeitintervall Llt durchschnittlich 3,88 Atomkerne.

•

505

3 Parameterschatzungen 3.3.2.3 Gau6sche Normalverteilung

Die unbekannten Parameter J.l und Dichtefunktion

(J

einer normalverteilten Grundgesamtheit mit der

(111-73) konnen nach dem Maximum-Likelihood-Prinzip aus einer konkreten Stichprobe vom Umfang n mit den Stichprobenwerten Xl' x 2 , , x; wie foIgt geschatzt werden: Wir stellen zunachst die Likelihood-Funktion L = L(J.l; (J) auf: L

= L(J.l; (J) = f = [

(Xl;

u; (J) --- f (x,; u; oJ =

~ . (J .e - (X~~/)] ... [ ~ .(J .e _(X;~/)] = (x

=(~'(J)"'(~'(J)-e- ~~2

(x, -

fl)2

"'e-

fl)2

2T

(111-74)

Der besseren Ubersicht wegen haben wir dabei die foigende (vorubergehende) Abkiirzung eingefiihrt: n

rx

= (Xl -

flf

+ ... + (x n -

fl)2

=

I

(111-75)

(Xi - fl)2

i= 1

Durch Logarithmierung der Likelihood-Funktion erhalten wir dann:

= - n -ln (J2;c -(J) - ~ = ~ n -In J2;c - n -In (J - ~ = 2(J2

2(J2

(111-76)

506


Die benotigten partiellen Ableitungen 1. Ordnung dieser Funktion lauten dann: n

oL*

1

o,u

2 (J2

n

1 ~ 2(x i-,u)·(-1)=-· ~ (xi-,u) L (J 2 L

-= --'

i = 1

(111-77)

i = 1

(111-78)

Die notwendigen Bedingungen (III-57) fur das gesuchte Maximum der Likelihood-Funktion fiihren damit zu dem folgenden Gleichungssystem: n

1

82

~

L (Xi -

'

A

,u) = 0

i= 1

(111-79)

Aus der ersten Gleichung folgt unmittelbar n

I

n

n

A)

(Xi -

i=l

=

I

Xi -

i=l

I

i=l

n

{1

=

I

Xi -

n {1 = 0

(111-80)

i=l

und somit

{1

=

n

I

~. i

Xi = X

(111-81)

== 1

Die Maximum-Likelihood-Schdtzung fur den Mittelwert J1 fiihrt somit auf den Mittelwert x der Stichprobe: u ~ A= x. Die zugehorige Schdtzfunktion ist die bereits aus Abschnitt 3.2.3 bekannte Stichprobenfunktion (111-82)

Einen Schdtzwert fur die Varianz (J2 der normalverteilten Grundgesamtheit erhalten wir aus der zweiten der Gleichungen (111-79) unter Berucksichtigung von A= x:

(rz=~.

n

I

(Xi -

X)2

i= 1

Die dieser Schatzung zugrundeliegende Maximum-Likelihood-Schiitzfunktion

(111-83)

507


S*2 =

n

I

~.

(111-84)

(Xi - X)2

i= 1

ist jedoch nicht erwartungstreu. Sie unterscheidet sich von der in Abschnitt 3.2.4 angegebenen erwartungstreuen Schatzfunktion S2 urn einen konstanten Faktor. Es gilt: 2 n- 1 2 S* =--'S

(III-85)

n

Fur groj3es n ist jedoch ndherungsweise S * 2 = S 2.

•

Beispiel X sei eine normalverteilte Zufallsvariable mit "den unbekannten Parametern f1 und (J (bzw. (J2), deren Werte aus der folgenden Stichprobe vom Umfang n = 10 mit Hilfe der M aximum-Likelihood-Schiitzfunktionen geschatzt werden sollen: StichprobenNr.i

1

2

3

4

5

6

7

8

9

10

Xi

248

250

251

251

247

252

248

250

248

255

Die Schdtzwerte (L und 8 2 lassen sich dann unter Verwendung der nachfolgenden Tabelle leicht berechnen:

248

-2

4

2

250

0

0

3

251

4

251

5

247

-3

9

6

252

2

4

7

248

-2

4

8

250

0

0

9

248

-2

4

10

255

5

25

III Grundlagen dermathematischen Statistik

508

Schdtzwert fur den M ittelwert J.1:

I

10

J.1 ~

1 J.1 == x == _. 10 A

-

i

=

1 x. == -·2500 == 250 I 10 1

Schdtzwert fur die Varianz (J 2: 10

(J2

~ 8 2 == ~. ~ L

10

i

(x. I

X)2

==

~ . 52 == 5 2

10

'

=1

Die Stichprobenwerte entstammen somit einer normalverteilten Grundgesamtheit mit dem Mittelwert J.1 ~ 250 und der Varianz (J2 ~ 5,2.

•

3.4 Vertrauens- oder Konfidenzintervalle fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Intervallschatzungen") 3.4.1 Vertrauens- oder Konfidenzintervalle und statistische Sicherheit In den vorangegangenen Abschnitten haben wir uns ausfiihrlich mit der ndherungsweisen Berechnung (Schiitzung) der unbekannten Parameter einer Wahrscheinlichkeitsverteilung beschaftigt und gezeigt, wie man aus einer konkreten Stichprobe mit Hilfe geeigneter Schatzfunktionen N dherungs- oder Schdtzwerte fur die betreffenden Parameter erhalt. Diese sog. Punktschdtzung ermoglicht jedoch keinerlei Aussagen iiber die Genauigkeit und Sicherheit der Schdtzung. Der aus einer Zufallsstichprobe gewonnene Schatzwert fur einen Parameter kann namlich noch erheblich vom tatsdchlichen (aber unbekannten) Wert abweichen, insbesondere bei kleinem Stichprobenumfang. Wir wollen uns daher im folgenden mit diesem wichtigen Thema naher auseinandersetzen. Die konkrete Fragestellung lautet dabei: Wie genau und sicher sind die aus Stichprobenuntersuchungen mit Hilfe von Schdtzfunktionen bestimmten N dherungs- oder Schatzwerte fur die unbekannten Parameter? Es liegt daher nahe, anhand einer konkreten Stichprobe ein Intervall [cu ; co] zu bestimmen,das den unbekannten Parameter mit Sicherheit enthalt (Bild 111-16):

Parameter 19

Zahlengerade

Bild 111-16 Interval!

fcu ; col


509

Ein solches Intervall kann es jedoch nicht geben, da absolut sichere Riickschliisse von einer Zufallsstichprobe auf die zugehorige Grundgesamtheit grundsatzlich nicht moglich sind 17). Auch der Versuch, ein Intervall [cu ; co] anzugeben, das den unbekannten Parameter 9- mit einer grojJen Wahrscheinlichkeit y enthalt, muB scheitern (0 < y < 1). Denn die Aussage (111-86)

("der Parameter 9-liegt zwischen den Schranken Cu und co") ist entweder richtig, dann aber gilt Pte; ~ 9- ~ co) = 1

(111-87)

oder sie ist falsch. In diesem Fall gilt Pic; ~ 9- ~ co) = 0

(111-88)

Der Fall (111-89)

mit 0 < y < 1 ist somit nicht moglichl Diese Uberlegungen zwingen uns nun, wie folgt vorzugehen: Wir bestimmen zwei ZufallsgrojJen e u und eo so, daB sie mit einer beliebig gewahlten, aber grojJen Wahrscheinlichkeit y Werte annehmen, die den wahren, aber unbekannten Parameterwert 9- einschliefien 18). Somit gilt (111-90)

Die Werte der beiden Zufallsvariablen e u und eo miissen sich dabei aus den Stichprobenwerten Xl' X 2, ... , x; einer vorgegebenen .konkreten Stichprobe berechnen lassen und variieren daher von Stichprobe zu Stichprobe. Die Zufallsvariablen e u und eo sind demnach Stichprobenfunktionen der n unabhdngigen Zufallsvariablen Xl' X 2' ... , X n» die alle die gleiche Verteilungsfunktion besitzen wie die Zufallsvariable X. Sie sind zugleich auch Schdtzfunktionen des Parameters 9. Sind die beiden Stichproben- oder Schdtzfunktionen (111-91)

und (111-92)

bekannt 19), so erhalt man aus einer konkreten Stichprobe vom Umfang n durch Einsetzen der Stichprobenwerte Xl' X 2, ... , x; in diese Funktionen zwei Werte c; und co: 17)

Von den trivialen Fallen wird abgesehen. Dazu zahlen wir Aussagen wie die folgenden: - .Der Parameterwert 9- liegt zwischen - 00 und + 00" - "Die Erfolgswahrscheinlichkeit p bei einem Bernoulli-Experiment liegt zwischen und 1"

18)

Man wahlt in der Praxis meist y = 0,95 oder y = 0,99, manchmal auch y

°

19)

=

0,999.

e u und eosind die Grenzen des Zufallsintervalls [e u ; eo], das den Parameter 9- mit der Wahrscheinlichkeit y iiberdeckt. Die Wahl der verwendeten Stichprobenfunktionen e u und eo wird in den nachsten Abschnitten am jeweiligen konkreten Problem naher erlautert.

510

III Grundlagen der mathematischen Statistik (III -93)

Sie bilden die Grenzen eines Intervalls, das in der Statistik als Vertrauens- oder Konfidenzintervall fur den unbekannten Parameter 9 bezeichnet wird. Die Intervallrandpunkte c; und Co heiBen daher auch Vertrauens- oder Konfidenzgrenzen (Bild 111-17) 20). ~ Vertrauensgrenzen

t Zahlengerade

Vertrauensintervall

~I

Bild 111-17 Vertrauens- oder Konfidenzintervall

Das aus der konkreten Stichprobe bestimmte Vertrauensintervall c; ~ 9 ~ Co ist eine Realisierung des Zufallsintervalls mit den Grenzen e u und eo. Die vorgegebene Wahrscheinlichkeit y heiBt in diesem Zusammenhang auch statistische Sicherheit oder Vertrauens- oder Konfidenzniveau. a = 1 - y ist die sog. Irrtumswahrscheinlichkeit. Das vor der Stichprobenuntersuchung gewahlte Vertrauensniveau y = 1 - a ist somit die Wahrscheinlichkeit dafiir, aus einer konkreten Zufallsstichprobe ein Vertrauens- oder Konfidenzintervall zu erhalten, das den wahren (aber unbekannten) Parameterwert 9 enthdlt. Man wird daher fur grojJes y (d. h. fur y = 0,95 oder y = 0,99 oder ahnlichc Werte) meist eine richtige Entscheidung treffen. Die statistische Sicherheit y = 1 - a kann namlich wie folgt sehr anschaulich gedeutet werden: Da die Intervallgrenzen (Vertrauensgrenzen) c; und Co noch von den Stichprobenwerten Xl' X 2 , •.. , x; abhangen und sich somit von Stichprobezu Stichprobe verdndern, erhalten wir fur jede Zufallsstichprobe ein etwas anderes Vertrauensintervall. Von 100 Vertrauensintervallen fur den unbekannten Parameter 9, die aus ebenso vielen Zufallsstichproben ermittelt wurden, enthalten dann ungefahr y . 100 Intervalle den wahren Parameterwert und nur ca. a . 100 dieser Vertrauensintervalle werden diesen Wert nicht enthalten. Mit anderen Worten: In rund y . 100 Fallen wird eine richtige und in rund a . (100 Fallen eine falsche Entscheidung getroffen. Die Bestimmung eines Vertrauensintervalls fur einen unbekannten Parameter 9 ist dabei nur moglich, wenn die Verteilungsfunktion der verwendeten Schatzfunktion fur 9 bekannt ist. Die Vertrauensgrenzen c; und Co lassen sich dann fur ein vorgegebenes Vertrauensniveau y = 1 - a aus der Bedingung (111-90) und unter Verwendung einer konkreten Stichprobe berechnen. Wie man in einem konkreten Fall ein Vertrauensintervall bestimmt, werden wir in den nachsten Abschnitten fur die Parameter jl und (52 einer Normalverteilung und den Parameter p einer Binomialverteilung noch ausfiihrlich zeigen.

20)

Die Stichprobenfunktionen

e

u

und

eo sind somit Schdtzfunktionen fiir die beiden Vertrauensgrenzen.


511

Zu beachten ist ferner, daB die Vertrauensgrenzen c; und Co nicht nur von den Stichprobenwerten Xl' X 2, •.. , x; abhangen, sondern auch noch von dem gewahlten Vertrauensniveau » == 1 - a. Dabei gilt: Je grafter)', umso ldnger (breiter) werden die Vertrauensintervalle. Mit anderen Worten: Will man eine grofte statistische Sicherheit )' (und somit eine geringe Irrtumswahrscheinlichkeit a) erreichen, so IDuB man dafiir ein relativ breites Vertrauensintervall in Kauf nehmen (Bild 111-18). Die Lange 1 == Co - c; des Vertrauensintervalls ist dann ein MaB fur die Genauigkeit der Parameterschatzung und verringert sich mit zunehmendem Stichprobenumfang n. Welches Vertrauensniveau in der Praxis gewahlt wird, muB dabei einzig und alleine am konkreten Problem entschieden werden. Wir fassen die wichtigsten Ergebnisse wie folgt zusammen:

512


I~

Vertrauensintervall tiir Y= 0,99

-----1-----+-----+-----+-------Zahlengerade

Vertrauensintervall fOr Y= 0,95

Bild 111-18 Die Vertrauensintervalle werden mit zunehmender statistischer Sicherheit y immer breiter

Anmerkung

Wir konnen somit davon ausgehen, daB die aus einer langen Serie von Zufallsstichproben ermittelten Vertrauensintervalle in etwa y . 100% aller Falle den unbekannten Parameter 9 enthalten und nur in etwa a . 1000/0 aller Falle diesen Parameter nicht enthalten. Wir treffen daher in y . 100% aller Falle eine richtige Entscheidung. •

Beispiel

Wir wahlen in einem konkreten Anwendungsfall ein Vertrauensniveau von y = 0,95 = 95%. Entnimmt man der betreffenden Grundgesamtheit 100 (voneinander unabhangige) Stichproben, so konnen wir darauf vertrauen, daB in etwa 95 Fallen der unbekannte Parameter 9 in das zugehorige Vertrauensintervall fallt und nur in etwa 5 Fallen auflerhalb des Vertrauensintervalls liegt. Die Irrtumswahrscheinlichkeit ist somit a = 1 - y = 1 - 0,95 = 0,05 = 5%. Wir treffen somit in etwa 95 Fallen eine richtige und in etwa 5 Fallen eine falsche Entscheidung.

• 3.4.2 Vertrauensintervalle fiir den unbekannten Mittelwert Jl einer Normalverteilung bei bekannter Varianz (12 Wir gehen von einer normalverteilten ZufaIlsvariablen X mit dem unbekannten Mittelwert (J 2 aus. Unter Verwendung einer konkreten Stichprobe Xl' X 2, ... , x; solI dann auf dem vorgegebenen Vertrauensniveau y = 1 - a das zugehorige Vertrauens- oder Konfidenzintervall fur den unbekannten Mittelwert J1 bestimmt werden. Als Schdtzfunktion fur den Mittelwert J1 verwenden wir die bereits aus Abschnitt 3.2.3 bekannte Stichprobenfunktion

J1 und der als bekannt vorausgesetzten Varianz

X =_X_l_+_X_ .._._+_X_n 2 _+_ n

1 n

n

(111-99)

X ist dabei bekanntlich eine normalverteilte ZufalIsvariable mit dem Mittelwert E (X) = J1 und der Varianz Var(X) = (J2 In (vgl. hierzu Abschnitt 3.2.2).


513

Dann ist die zugehorige standardisierte Zufallsvariable

x-

jl

(111-100)

U==--

(J/~

standardnormalverteilt (Mittelwert E(U) == 0; Varianz Var(U) == 1). Fur U und somit auch fur X HiBt sich schrittweise wie folgt ein Vertrauensintervall konstruieren: (1)

Wir wahlen zunachst ein bestimmtes Vertrauensniveau y == 1 - a (0 < y < 1). In den technischen Anwendungen iibliche Werte sind: y == 0,95 == 950/0 oder y == 0,99 == 99%. a ist dabei die Irrtumswahrscheinlichkeit.

(2)

Die ZufalIsvariable U solI dann mit der gewahlten Wahrscheinlichkeit y == 1 -a einen Wert aus dem symmetrischen Intervall - c ~ U ~ c annehmen (Bild 111-19). Somit gilt: P( - c

~

U

~

c) == y

== 1 - a

(III -101)

Den zugehorigen Wert fur die Schranke c entnehmen wir der Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung).

-c

o

c

u

Vertrauensintervall fur das Vertrauensniveau Y= 1-a

Bild 111-19 Zur Berechnung der Schranke c (die hellgrau unterlegteFlache entspricht dem gewahlten Vertrauensniveau y = 1 - a; die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit «)

(3)

Unter Verwendung der Beziehung (111-100) konnen wir das Intervall - c auch in der Form

~

U

~

c

(111-102) darstellen.

514

III Grundlagen der mathematischen Statistik Mit Hilfe elementarer algebraischer Umformungen HiBt sich hieraus schlieBlich eine Ungleichung fur den unbekannten Mittelwert f1 wie folgt herleiten:

x-

u

mit ~ multiplizieren

-c~--~c

(J/~

~

mit -1 multiplizieren

Seiten verta uschen

X addieren (J (J X-c-·~IJ~X+c-

(111-103)

~

.,'::

Die Bedingung (111-101) geht damit iiber in -

(J

(J)

-

P ( X-C~~f1~X+c~ =y=l-(J. '-v-"

'-v-"

eu

eo

(111-104)

oder

p(e u ~ f1

~

eo) == y ==

(111-105)

1- a

Die Zufallsvariablen -

e

(J

==X-c-

und

~

u

-

(J

eo ==X + c -

yf;z

(111-106)

sind dabei Schdtzfunktionen fur die gesuchten Vertrauensgrenzen c; und co. (4)

Die Berechnung dieser Vertrauensgrenzen erfolgt dann anhand einer konkreten Stichprobe Xl' X 2, ... , X n , in dem man in die Schatzfunktionen e u und eo fur X den aus der Stichprobe Xl' X 2, ... , X n berechneten Mittelwert Xeinsetzt. Das Vertrauensintervall fur den unbekannten Mittelwert f1 der normalverteilten Grundgesamtheit lautet damit wie folgt: _

(J

_

(J

(111-107)

x-c ~~f1~x+c~

Dieses Intervall mit den beiden Grenzen (Vertrauensgrenzen) c == u

_ X -

(J

c~

_

und

Co

==

X

(J

+ c~

(111-108)


515

und der Lange 1 = 2 C (J / yf;z enthalt dann mit einem Vertrauen von y . 100 % den wahren (aber unbekannten) Wert des Mittelwertes J1 (Bild 111-20).

Wir fassen dieses wichtige Ergebnis wie folgt zusammen:


516

-

-

x

Cu 4

1= 2c(J'

vn

1

X

Co

~I

Bild 111-20 Vertrauensintervall fur den unbekannten Mittelwert 11 einer N ormalverteilung (bei bekannter Varianz (J 2)

Anmerkungen (1) Bei vielen MeBinstrumenten, Maschinen und Automaten wird die Varianz reits vom Hersteller also eine Art Gerdtekonstante mitangegeben.

0'2

be-

(2)

Haufig wird auch die Irrtumswahrscheinlichkeit a vorgegeben (meist a == 0,05 == 5% oder a == 0,01 == 1 %). Das Vertrauensniveau oder die statistische Sicherheit ist dann y == 1 - a.

(3)

Das Vertrauensintervall besitzt die Lange [== 2 c a/j";z und. hangt somit noch von derStandardabweichung a, dem Stichprobenumfang nund dem Vertrauensniveau y == 1 - a ab (Bild 111-21) 21). Fur feste Werte von a und y gilt daher: 1

[r-..;-

(111-112)

j";z Dies aber bedeutet, daB eine Verkiirzung des Vertrauensintervalls stets durch eine entsprechende VergrojJerung des Stichprobenumfangs n erreicht werden kann.

r--

Vertrauensgrenzen ~

Zahlengerade

Bild 111-21

21)

Die aus Gleichung (III -109) berechnete Konstante c ist namlich noch von. dem gewahlten Vertrauensniveau y abhangig,

517

3 Parameterschatzungen •

Beispiele (1)

Die Ldngenmessung von 10 Schrauben, die nach dem Zufallsprinzip aus einem bestimmten Sortiment ausgewahlt wurden, fiihrte zu dem folgenden Ergebnis: i -

Xi

mm

1

2

3

4

5

6

7

8

9

10

10

8

9

10

11

11

9

12

8

12

Wir setzen dabei voraus, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit mit der Varianz (J2 =:= 4 mm" stammt und wollen fur den unbekannten M ittelwert u ein Vertrauensintervall zum Vertrauensniveau y == 0,95 == 95% bestimmen. Dabei gehen wir schrittweise wie folgt vor: 1. Schritt: Das Vertrauensniveau y ist bereits vorgegeben: y

==

0,95.

2. Schritt: Die Bestimmungsgleichung fur die Konstante c lautet damit (Bild 111-22):

Bild 111-22

o

-c

P(-c

~

U

~

u

c

c) == 0,95

Daraus folgt dann weiter: P( - c ~ U ~ c) == ¢(c) - ¢( - c) == ¢(c) - [1 - ¢(c)] == ==

2 . ¢ (c) - 1 == 0,95

Aus Tabelle 2 im Anhangerhalten wir schlieBlich: ¢(c) == 0,975

~

c

==

U O,975

==

1,960

Die gesuchte Konstante (Schranke) c ist somit das Quantil dardnormalverteil ung. 3. Schritt: Wir berechnen den Mittelwert

1 x == _ . 10

10

~

L

i= 1

1 (10 + 8 + 9 10

Xi == -

x der

U O,975

der Stan-

Stichprobe und erhalten:

+ ... + 12) mm

==

10 mm


518

4. Schritt: Mitn = 10, X = 10 mm und (J" = 2 mm berechnen wir zweckmalsigerweise zunachst die folgende Hilfsgrofie: (J" 2mm k = c= 1 960 . - - = 1 240 mm ~

,

J10

'

Das Vertrauensintervall fur den M ittelwert J1 der normalverteilten Grundgesamtheit .lautet damit:

(10 - 1,240) mm

~

J1

~

(10 + 1,240) mm

Wir konnen daher mit einem Vertrauen von 95% davon ausgehen, daB der wahre Wert von J1 in diesem Intervall der Lange 1 = 2 k = 2,480 mm liegt (Bild 111-23).

Bild 111-23

-

8,760

(2)

10

11,240

x

mm

Einer normalverteilten Grundgesamtheit mit der Varianz (J" 2 = 100 solI eine Stichprobe yom Umfang n entnommen werden. Wie groB muB man den Stichprobenumfang wahlen, damit das Vertrauensintervall fur den unbekannten Mittelwert J1 bei einem Vertrauensniveau von 'Y = 99% die Lange 1 = 2 besitzt?

Losung: Zunachst Iosen wir die Gleichung 1 = 2 c(J"/~ fur die Lange des Vertrauensintervalls nach n auf und erhalten:

Die noch unbekannte Konstante c laBt sich dabei aus der Bedingung P( - c

~

U

~

c) = 0,99


519

mit Hilfe der Tabelle 2 im Anhang wie folgt bestimmen (Bild III -24):

Bild 111-24

o

-c

P(-c

~

U

~

u

c

c) = cjJ(c) - cjJ(-c) = cjJ(c) - [1 - cjJ(c)] =

= 2 . cjJ(c) - 1 = 0,99 cjJ(c) = 0,995

~

c=

U O,995

= 2,576

Die gesuchte Konstante c ist somit das Quanti! U O,995 = 2,576 der Standardnormalverteil ung. Der gesuchte Stichprobenumfang betragt damit: 2C

0")2 = (2 . 2,576 . 10)2 = 25 76 2

n=(1

2

'

~

•

664

3.4.3 Vertrauensintervalle flir den unbekannten Mittelwert Jl einer Normalverteilung bei unbekannter Varianz (12 X sei eine normalverteilte Zufallsvariable mit dem unbekannten Mittelwert fJ und der ebenfalls unbekannten Varianz (J2. Anhand einer konkreten Stichprobe Xl' X 2 , ••• , x; solI fur ein (beliebig vorgegebenes) Vertrauensniveau y = 1 - rx das zugehorige Vertrauensoder Konfidenzintervall fur den unbekannten Mittelwert fJ der normalverteilten Grundgesamtheit bestimmt werden. Im Gegensatz zum vorangegangenen Abschnitt ist diesmal auch die Varianz (J2 und damit auch die Standardabweichung (J unbekannt. Bei der Herleitung eines Vertrauensintervalls fur den Mittelwert fJ muB daher die bisher verwendete standardnormalverteilte Zufallsvariable U = X - J1 durch die Zufallsgrolse

0"/0z

X-fJ

T=--

s/0z

(111-113)

ersetzt werden. S ist dabei die aus Abschnitt 3.2.4 bekannte Schatzfunktion fur die unbekannte Standardabweichung 0" der Grundgesamtheit. Es laBt sich zeigen, daB die Zufallsvariable T der t-Verteilung von Student mit f = n - 1 Freiheitsgraden geniigt. Die Grenzen des gesuchten Vertrauensintervalls miissen dabei so bestimmt werden, daB die Zufallsgrolse T mit der gewahlten Wahrscheinlichkeit y = 1 - rx Werte aus dem symmetrischen Intervall - c ~ T ~ c annimmt (Bild III -25).


520

Aus der Bedingung P( - c

~

T

~

c) == 'Y

==

1- a

(111-114)

HiBt sich dann die Schranke emit Hilfe von Tabelle 4 im Anhang leicht berechnen (Tabelle der Quantile der t-Verteilung). Wir erhalten damit das folgende Liisungsschema:


521

o

-c

Bild 111-25 Zur Berechnung der Schranke c (die hellgrau unterlegte Flache entspricht dem gewahlten Vertrauensniveau y = 1 - a, die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit (X)

c

Anmerkungen (1) Haufig wird auch die I rrtumswahrscheinlichkeit a vorgegeben (meist a = 0,05 = 5 0/0 oder a = 0,01 = 1 0/0). Das Vertrauensniveau oder die statistische Sicherheit ist dann y = 1 - a. (2) Das Vertrauensintervall besitzt die Lange 1 = 2 c s/~ und hangt somit noch von dem gewahlten Vertrauensniveau y = 1 - a, dem Stichprobenumfang n und der Standardabweichung s der Stichprobe ab (Bild 111-26). Fur feste Werte von y und s gilt somit: 1 It'o/-

(111-118)

~

Eine Verkiirzung des Vertrauensintervalls lafit sich daher stets durch eine entsprechende Vergrofierung; des Stichprobenumfangs n erreichen.

r-

Vertrauensgrenzen

I Zahlengerade

Bild 111-26

(3)

Bei unbekannter Varianz (J 2 sind die Vertrauensintervalle fur den Mittelwert J1 stets breiter als bei bekannter Varianz (bei gleichem Vertrauensniveau y und gleichem Stichprobenumfang n).

(4)

Bei umfangreichen Stichproben (Faustregel: n > 30) kann die unbekannte Standardabweichung (J der Grundgesamtheit durch die Standardabweichung s der Stichprobe geschdtzt werden: (J ~ s. In diesem Sonderfall darf man daher von einer normalverteilten Grundgesamtheit mit der bekannten Varianz (J2 ~ S2 ausgehen und das bereits im vorangegangenen Abschnitt 3.4.2 besprochene Verfahren zur Bestimmung eines Vertrauens- oder Konfidenzintervalls fur den M ittelwert J1 einer normalverteilten Grundgesamtheit anwenden 22).

22)

Wir erinnern: Die t- Verteilung von Student strebt fur n hierzu Kap. II, Abschnitt 8.2).

-+ CIJ

gegen die Standardnormalverteilung (vgl.

522 •

III Grundlagen der mathematischen Statistik Beispiel

Die Messung von 8 Widerstiinden, die rein zufallig einer laufenden Serienproduktion entnommen wurden, fiihrte zu dem folgenden MeBprotokoll: i Xi -

Q

1

2

3

4

5

6

7

8

100

104

98

96

101

104

98

99

Wir setzen dabei voraus, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, deren Mittelwert J1 und Varianz (J 2 beide unbekannt sind. Es solI ein Vertrauens- .oder Konfidenzintervall fur den M ittelwert J1 bestimmt werden. Wir losen die gestellte Aufgabe dann schrittweise wie folgt: 1. Schritt: Als Vertrauensniveau wahlen wir )' == 0,95. 2. Schritt: Die Bestimmungsgleichung fur die Konstante c lautet damit (Bild 111-27): P( - c

~

T

~

c) == 0,95

Bild 111-27

o

-c

c

Mit Hilfe von Tabelle 4 im Anhang erhalten wir hieraus fur f == n - 1 == 7 Freiheitsgrade den folgenden Wert fur c: P( - c

~

T

~

F(c) == 0,975

c) == F(c) - F( - c) == F(c) - [1 - F(c)] == 2 . F(c) - 1 == 0,95 f=7

c == t (0,97 5; 7) == 2,365

Die gesuchte Konstante c ist somit das Quantil t(0,975; 7) der t-Verteilung. 3. Schritt: Wir berechnen nun den Mittelwert

Stichprobe mit Hilfe der folgenden Tabelle:

x und die Standardabweichung s der


_

523

100

0

0

2

104

4

16

3

98

-2

4

4

96

-4

16

5

101

6

104

4

16

7

98

-2

4

8

99

-1

1 \

X =-'

8

i

1

= -·8000 = 1000 8

x.

/:

I

=1

1 S2 = _1_. \ (Xi _ X)2 = -7 .580 2 = 8,2860 2 8-1 i...J i

s=

R

=1

= )8,2860 2 = 2,8780

4. Schritt: Mit n = 8, c = 2,365 und s zunachst die folgende Hilfsgroj3e:

k = c-

s

= 2,878 0 berechnen wir zweckmalsigerweise

2,8780

= 2 365 . - - = 2406 0

J8

j;;'

'

Das Vertrauensintervall fur den unbekannten Mittelwert /1 der normalverteilten Grundgesamtheit lautet damit:

x-

k

(100 - 2,406) 0

~

/1

~

x -s-k

~

/1

~

(100 + 2,406) 0

Der wahre Wert von /1liegt daher mit einem Vertrauen von 95% in diesem Intervall der Lange I = 2k = 4,812 O.

•

524


3.4.4 Vertrauensintervalle fiir die unbekannte Varianz Normalverteilung

(12

einer

Urn die Gleichmafsigkeit eines Massenproduktes beurteilen zu konnen, benotigt man neben dem Mittelwert fl der interessierenden Zufallsgr6Be X noch zusatzliche Kenntnisse iiber deren Varianz (J 2, die ja als StreuungsmaB Aufschluf iiber die Groj3e der Schwankungen gibt, denen das Merkmal X unterworfen ist. Dieser Parameter ist jedoch in der Praxis oft unbekannt und muB daher geschdtzt werden. Ahnlich wie fiir den Mittelwert fllaBt sich auch fiir die Varianz (J2 einer normalverteilten Grundgesamtheit ein Vertrauens- oder Konfidenzintervall bestimmen. Beiunseren weiteren Uberlegungen gehen wir wiederum von einer normalverteilten Grundgesamtheit mit dem (bekannten oder unbekannten) Mittelwert fl und der unbekannten Varianz (J2 aus. Wir stellen uns dabei die Aufgabe,aus einer konkreten Zufallsstichprobe Xl' X 2, ... , X n ein Vertrauens- oder KonJidenzintervall fiir die unbekannte Varianz (J 2 zu bestimmen. Als Schdtzfunktion fiir die Varianz (J 2 verwenden wir die bereits aus Abschnitt 3.2.4 bekannte StichprobenJunktion S 2 und bilden mit ihr die Zufallsvariable (Stichprobenfunktion) S2 Z == (n - 1) (J2

(111-119)

die einerChi-Quadrat- Verteilung mit J == n - 1 Freiheitsgraden geniigt. Nach Vorgabe eines bestimmten Vertrauensniveaus y == 1 - a lassen sich dann zwei Schranken C l und C2 so bestimmen, daB diese Zufallsvariable mit der gewahlten Wahrscheinlichkeit y == 1 - a Werte aus dem Intervall C l ~ Z ~ C 2 annimmt. Die Berechnung der Intervallgrenzen erfolgt dabei aus der Bedingung

P (c 1 ~ Z

~ c 2) ==

Y == 1 - a

(111-120)

Der Flachenanteil der Irrtumswahrscheinlichkeit a wird dabei gleichmiij3ig auf beide Seiten der Dichtefunktion J (z) verteilt (Bild 111-28).

Bild 111-28 Zur Berechnung der Schranken c1 und c2 (die hellgraue Flache entspricht dem Vertrauensniveau y = 1 - If., die dunkelgraue der Irrtumswahrscheinlichkeit z)

Fiir die Intervallgrenzen C l und C 2 ergeben sich dann aus Bild 111-28 unmittelbar die folgenden Bestimmungsgleichungen:

(111-121)

P (Z

~

all c2) == F (c2) == 1 - - == 1 - - (1 - y) == - (1 + y) 222


525

Aus diesen Gleichungen lassen sich C l und C2 mit Hilfe der tabellierten Verteilungsfunktion F(z) der Chi-Quadrat- Verteilung mit J = n - 1 Freiheitsgraden leicht berechnen (Tabelle 3 im Anhang). Aus der Ungleichung oder

(111-122)

folgt dann eine entsprechende Ungleichung fur die Varianz

82

(n - 1) -

C2

~

0"2

~

82

(n - 1)-

0"2:

(111-123)

Cl

Fur die Schdtzfunktion 8 2 der Varianz setzen wir noch den aus der konkreten Stichprobe Xl' X 2, ... , x; ermittelten Schdtzwert S2 (d.h. die Stichprobenvarianz) ein und erhalten dann das gewiinschte Vertrauens- oder Konjidenzintervall fur die unbekannte Varianz 0"2 in der Form (111-124)

Wir fassen die wichtigsten Ergebnisse zusammen:


526

Anmerkungen

(1)

Haufig wird auch die Irrtumswahrscheinlichkeit rt vorgegeben (meist rt == 0,05 == 5% oder rt == 0,01 == 1%). Das Vertrauensniveau oder die statistische Sicherheit ist dann y == 1- a.

(2)

Man beachte: Die Vertrauensgrenzen sind eindeutig durch das vorgegebene Vertrauensniveau y == 1 - o. sowie den Umfang n und die Varianz S2 der vorgelegten Stichprobe bestimmt.

(3)

. 11 besi .. I Das Vertrauensinterva esitzt diIe Lange

==

(n - 1) (c2

-

c 1) S2 .

C1 C2

(4)

Aus dem Vertrauensintervall (111-128) fur die Varianz (J2 erhalt man durch Wurzelziehen ein entsprechendes Vertrauensintervall fur die Standardabweichung (J.

•

Beispiel Wir kommen nochmais auf das Beispiel des vorangegangenen Abschnitts zuruck (Messung von n == 8 ohmschen Widerstanden aus einer normalverteilten Grundgesamtheit, deren Mittelwert f1 und Varianz (J 2 beide unbekannt sind) und bestimmen nun ein Vertrauens- oder Konfidenzintervall fur die unbekannte Varianz (J2 bei einem vorgegebenen Vertrauensniveau von y == 0,95 == 95°~. 1. Schritt: Das Vertrauensniveau ist bereits vorgegeben: y == 0,95. Die Irrtumswahrscheinlichkeit betragt somit rt = 0,05.


527

2. Schritt: Die Konstanten

C 1 und gleichungen ermittelt (Bild 111-29):

1

1

werden aus den folgenden Bestimmungs-

F(c 1 ) =

2(1 -

F(c 2 ) =

2(1 + y) = 2(1 + 0,95) = 0,975

y) =

1

2(1 -

C2

0,95) = 0,025

1

Bild 111-29

Unter Verwendung von Tabelle 3 im Anhang erhalten wir fur 8 - 1 = 7 Freiheitsgrade die folgenden Werte: f=7

F(c 1 ) = 0,025

--~)

F(c 2 ) = 0,975

--~)

f=7

C 1 =Z(O,025;7)

= 1,69

C 2 =Z(O,975;7)

=

f

=

n- 1=

16,01

Die gesuchten Konstanten C 1 und C 2 entsprechen somit den beiden Quantilen = 1,69 und Z(O,975;7) = 16,01 der Chi-Quadrat-Verteilung mit f = 7 Freiheitsgraden.

Z(O,025;7)

3. Schritt: Die Varianz S2 der Stichprobe wurde bereits im Beispiel des vorangegan-

genen Abschnitts 3.4.3 zu s 2 = 8,286 0 2 ermittelt.

4. Schritt: Mit n = 8, S2 = 8,2860 2 , c1 = 1,69 und nachst die beiden Vertrauensgrenzen: k1 =

k2 =

(n - 1)s2

=

2 (8 - 1).8,2860 2 = 36230 16,01 '

=

(8 - 1) . 8,286 0 2 112 = 34 321 ~~ 1,69 '

C2

(n - 1)s 2 C1

C2

= 16,01 berechnen wir

zu-

Das Vertrauensintervall fur die unbekannte Varianz (J" 2 der normalverteilten Grundgesamtheit lautetdamit: k1

~

(J"2

~

k2

528

11.1 Grundlagen der mathematischen Statistik

Der wahre Wert der Varianz (J2 liegt dabei mit einem Vertrauen von 95% in diesem Intervall. Fur die Standardabweichung erhalt man damit das folgende Vertrauensintervall (bei einer Irrtumswahrscheinlichkeit von ebenfalls 5%):

J 3,623 Q2 ~

(J

~

J 34,321 Q2 •

3.4.5 Vertrauensintervalle fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) Auch fur den unbekannten Parameter p einer binomialverteilten Grundgesamtheit laBt sich auf dem vorgegebenen Vertrauensniveau 'Y = 1 - rx aus einer konkreten Stichprobe ein Vertrauens- oder Konfidenzintervall bestimmen, das mit einem Vertrauen von 'Y . 100% den wahren Wert des Parameters p enthalt. Wir gehen dabei von den folgenden Uberlegungen aus: p sei die unbekannte Wahrscheinlichkeit dafur, daB bei einem Bernoulli-Experiment das Ereignis A eintrete. Die Wahrscheinlichkeit fur das Eintreten des komplementdren Ereignisses A ist dann q = 1 - p. In Abschnitt 3.2.5 haben wir uns bereits mit der Schdtzung des Parameters p beschaftigt und dabei gezeigt, wie man aus einer konkreten Stichprobe einen Schdtzwert p erhalt, Eine solche Stichprobe besteht nun in einer n-fachen Ausfiihrung des Bernoulli-Experiments, wobei die Anzahl k der dabei erzieiten .Erfolge" festgestellt wird (das Eintreten des Ereignisses A werten wir wiederum ais .Erfolg", das Eintreten des komplementdren Ereignisses A ais "MifJerfolg"). Dann ist p= kin ein Schatz- oder Ndherungswert fur die unbekannte .Erfolgswahrscheinlichkeii (den Anteilswert) p. Fur diesen Parameter laBt sich nun unter gewissen Voraussetzungen auch ein Vertrauensoder Konfidenzintervall bestimmen, dessen Grenzen symmetrisch zumSchatzwert p = kin angeordnet sind (Bild III -30).

I

Vertrauensgrenzen ~

p"

>

-

k

n

Vertrauensintervall

Zahlengerade

Bild 111-30 Vertra uensin tervall fur den unbekannten An teilswert P, (Parameter p einer Binomialverteilung)

Bei der Herieitung des Vertrauensintervalls gehen wir von der Zufallsvariablen X = Anzahl deri.Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments aus, die nach Abschnitt 6.1 aus Kapitel II binomialverteilt istmit den Parametern n und p. Setzen wir umfangreiche Stichproben voraus, was wir im folgenden stets tun wollen, so


529

folgt aus dem Grenzwertsatz von M oivre und Laplace unmittelbar, daB diese Zufallsvariable sogar als nahezu normalverteilt betrachtet werden kann mit dem Mittel- oder Erwartungswert E(X) == fJ == np und der Varianz Var(X) == (J'2 == np(1 - p). Dann aber ist die zugehorige standardisierte Zufallsvariable

u == _X_-_fJ == _X_-_n_p_

(111-129)

Jnp(1 - p)

(J'

ndherungsweise standardnormalverteilt. Als Schatzfunktion fur den unbekannten Anteilswert p (Parameter p der Binomialverteilung) verwenden wir die bereits aus den Abschnitten 3.2.5 und 3.3.2.1 bekannte Maximum-Likelihood-SchatzJunktion ~

X

p==-

(111-130)

n

Somit ist X == nP und die standardnormalverteilte Zufallsvariable U aus Gleichung (111-129) laBt laBt sich auch in der Form X - np U==-----

Jnp(1 - p)

nP - np

(111-131)

Jnp(1 - p)

darstellen. Die Grenzen des gesuchten Vertrauensintervalls werden nun so bestimmt, daB die Zufallsvariable U mit der vorgegebenen Wahrscheinlichkeit y == 1 - Li Werte aus dem symmetrischen Intervall - c ~ U ~ c annimmt (Bild 111-31).

o

-c

u

c

BUd 111-31 Zur Berechnung der Schranke c (die hellgrau'unterlegte Flache entspricht dem gewahlten Vertrauensniveau y = 1 - a, die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit «)

Aus der Bedingung

Pt. - c ~ U

~

c) ::;::: }' == 1 -

(111-1"32)

Li

la.Bt sich dann die Schranke c mit Hilfe von Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung) leicht bestimmen. Aus der Ungleichung -c

~

U

~

c

oder

-c~

nP - np

~c

(III-133)

Jnp(1 - p) erhalten wir dann nach einigen elementaren Umformungen eine entsprechende Ungleichung fur den Parameter p.


530

Sie lautet:

p-

~ Jnp(l - p) ~ p ~ n

p + ~ Jnp(l n

- p)

(111-134)

Die beiden Intervallgrenzen enthalten noch jeweils die Schatzfunktion P sowie den unbekannten Parameter p. Wir ersetzen diese Groben durch den aus der konkreten Stichprobe ermittelten Schdtzwert pund erhalten auf diese Weise eine brauchbare N dherung fur das gesuchte Vertrauensintervall des Parameters p: A

CJ np(l -

P- -

n

A

p) ~ p A

~

A

p

+ -CJ np(l A

n

A

- p)

(III-135)

Wir fassen die einzelnen Schritte wie folgt zusammen:

23)

Die Stichprobe wird als umfangreich angesehen, wenn der Stichprobenumfang n die Bedingung nfi(l - fi) > 9 erfiillt. fi ist dabei der aus der Stichprobe erhaltene Schdtzwert fur den unbekannten Parameter p.


531

Anmerkungen (1) Haufig wird auch die Irrtumswahrscheinlichkeit It vorgegeben (meist It = 0,05 = 5°1o oder It = 0,01 = 1°10). Das Vertrauensniveau oder die statistische Sicherheit ist dann y= 1-

(2)

It.

fi

Die Lange 1 = 2 (cln) des Vertrauensintervalls hangt noch vom Vertrauensniveau y = 1 - It, dem Stichprobenumfang n und dem Schatzwert p = kin fur den Anteilswert (Parameter) p ab (vgl. Bild III-32). Eine Verkiirzung des Intervalls laBt sich dabei stets durch eine entsprechende Vergriifierung des Stichprobenumfangs n erreichen.

Vertrauensintervall der Lange

1£ Vii" n

Bild 111-32 Vertrauensintervall fur den unbekannten Anteilswert p (Parameter p einer Binomialverteilung)

532 •

III Grundlagen der mathematischen Statistik Beispiel Ein bestimmtes mechanisches Bauelement wird in groBer Stiickzahl hergestellt. Mit Hilfe einer umfangreichen Stichprobe solI der Ausschufianteil pin dieser Produktion geschatzt werden. Zu diesem Zweck wurde der binomialverteilten Grundgesamtheit eine Stichprobe vom Umfang n == 500 entnommen. In ihr befanden sich k == 25 nicht [unktionsfdhige (also defekte) Bauelemente. Wir bestimmen nun fur den unbekannten Parameter (AusschuBanteil) p ein Vertrauens- oder Konfidenzintervall zum Vertrauensniveau y == 0,99 == 99°~, wobei wir schrittweise wie folgt vorgehen: 1. Schritt: Das Vertrauensniveau ist bereits vorgegeben: y == 0,99. 2. Schritt: Wir berechnen die Konstante c aus der Bedingung P( - c ~ U ~ c) == y == 0,99

(Bild 111-33). Unter Verwendung von Tabelle 2 im Anhang erhalten wir dann: P( - c ~ U ~ c) == ¢(c) - ¢( - c) == ¢(c) - [1 - ¢(c)] == ==

¢ (c) == 0,995

2 . ¢(c) - 1 == 0,99

----j.

c

== U O,995 ==

2,576

Die gesuchte Konstante ist demnach das Quantil mal verteilung.

U O,995

==

2,576 der Standardnor-

Bild 111-33

o

-c

3. Schritt: Mit n == 500 und k der folgende Schdtzwert:

==

c

u

25 ergibt sich fur den unbekannten AusschuBanteil

p

k

A

p == ~ ==

25 . 500 == 0,05

==

50/0

4. Schritt: Die Bedingung (111-138) fur eine umfangreiche Stichprobe ist hier erfiillt: L\

==

np(1 - p) == 500 . 0,05 (1 - 0,05) == 23,75 > 9

Zweckmalsigerweise berechnen wir jetzt zunachst die folgende HilfsgrofJe: k

c r; 2 576 r;;::;-;:;; v L\ == - ' - v 23,75 == 0,0251 n 500

== -


533

Das Vertrauens- oder Konfidenzintervall fur den unbekannten Ausschufianteil p lautet somit: p-k~p~p+k

0,05 - 0,0251

~

p

~

0,05

+ 0,0251

Der wahre Wert von p liegt daher mit einem Vertrauen von 990/0 zwischen rund 2,5% und 7,5%. •

3.4.6 Vertrauensintervalle fur den unbekannten Mittelwert Jl einer beliebigen Verteilung In den Abschnitten 3.4.2 und 3.4.3 haben wir uns ausfiihrlich mit den Vertrauensintervallen fur den unbekanten Mittelwert f1 einer normalverteilten Zufallsvariablen X beschaftigt. In den Anwendungen hat man es jedoch auch haufig mit Zufallsvariablen zu .tun, deren Wahrscheinlichkeitsverteilungen unbekannt sind. Wir gehen daher bei unseren weiteren Uberlegungen von einer beliebig verteilten Zufallsvariablen X aus. Fur den unbekannten M ittelwert f1 dieser (nicht naher bekannten) Verteilung solI nun naherungsweise ein Vertrauens- oder Konfidenzintervall bestimmt werden. Als Schdtzfunktion fur den Mittelwert u verwenden wir wiederum die bereits bekannte Stichprobenfunktion (111-140)

Xl' X 2' ... , X n sind dabei Zufallsvariable mit der gleichen Verteilung wie X (d. h. Mittelwert u, Varianz (J2). Bekanntlich besitzt dann die Schatzfunktion X den Mittelwert E(X) = f1 und die Varianz Var(X) = (J2jn. Die Art der Verteilung von X und damit auch von X ist und bleibt weiterhin unbekannt! Aus dem Zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung folgt jedoch, daB die Schatzfunktion X als anndhernd normalverteilt betrachtet werden kann mit dem Mittelwert fl und der Varianz (J2 [n, wenn nur der Umfang n der verwendeten Zufallsstichprobe hinreichend groft ist (Faustregel: n > 30). Dies aber bedeutet, daB wir die bereits in den Abschnitten 3.4.2 und 3.4.3 besprochenen Methoden zur KonstruktioIi von Vertrauensintervallen fur den Mittelwert fl einer normalvertcilten Grundgesamtheit als N dherungsverfahren auch auf beliebig verteilte Zufallsvariable anwenden diirfen. Mit anderen Worten: Die Schatzfunktion X kann als nahezu normalverteilt angenommen werden, obwohl keine normalverteilte (sondern eine beliebig verteilte) Grundgesamtheit vorliegt, sofern der Stichprobenumfang hinreichend groft ist.


534

Wir fassen diese fur die Anwendungen wichtigen Aussagen wie folgt zusammen:

Anmerkung Auch fur die unbekannte Varianz (J2 einer beliebigen Verteilung lassen sich Naherungsverfahren zur Bestimmung von Vertrauensintervallen angeben. Wir verweisen auf die spezielle Fachliteratur (siehe Literaturverzeichnis).

4 Statistische Priifverfahren fiir die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Parametertests") 4.1 Ein einfiihrendes Beispiel Wir interessieren uns fur den mittleren Benzinverbrauch eines bestimmten Autotyps und fuhren aus diesem Grund die stetige Zufallsvariable X = Benzinverbrauch eines Autos vom ausgewdhlten Typ

ein (alle Angaben iiblicherweise in "Liter pro 100 km").

4 Parametertests

535

Bei unseren weiteren Uberlegungen gehen wir dabei von der realistischen Annahme aus, daB der Benzinverbrauch X eine normalverteilte ZufalIsvariable mit dem Mittelwert Jl und der Varianz (J2 darstellt. Von Seiten des Automobilherstellers wird ein mittlerer Benzinverbrauch von Jl == Jlo angegeben. Diese Angabe solI nun durch ein geeignetes statistisches Verfahren auf der Basis einer Stichprobenuntersuchung iiberpriift werden. Dabei gehen wir schrittweise wie folgt vor: (1)

Zunachst formulieren wir die Angabe des Herstellers uber den mittleren Benzinverbrauch als sog. Nullhypothese: (111-141)

Mit anderen Worten: Wir gehen zunachst von der Annahme oder Vermutung aus, daB die Angaben des Herstellers tatsachlich zutreffen. Alternativ zur Nullhypothese H 0 stellen wir dann die Hypothese H 1 : Jl =j:. Jlo

(111-142)

zur Diskussion, Diese sog. Alternativhypothese besagt, daB der mittlere Benzinverbrauch Jl van Jlo verschieden, d.h. kleiner oder grofier als Jlo ist. Sollten wir namlich nach Durchfiihrung des Priifverfahrens zu dem SchluB kommen, daB die Angaben des Herstcllers (d.h. die N ullhypothese H 0) nicht haltbar sind, so diirfen wir mit ruhigem Gewissen davon ausgehen, daB die Alternativhypothese H 1 zutrifft. (2)

24)

25)

Um die Nullhypothese H o zu iiberpriifen, wahlen wir nach dem Zufallsprinzip n Testfahrzeuge aus, ermitteln ihren jeweiligen Benzinverbrauch Xi (i == 1, 2, ... , n) und vergleichen dann den hieraus gebildeten Mittelwert x mit der Angabe des Herstellers, d. h. mit dem Wert Jl == flo. Im Sinne der Statistik haben wir der normalverteilten Grundgesamtheit 24) eine Stichprobe vom Umfang n entnommen und daraus anschlieBend den Stichprobenmittelwert x berechnet. Dieser spezielle Wert ist eine Realisierung der ZufalIsvariablen X, d.h. der bereits aus Abschnitt 3.2.2 bekannten Schdtzfunktion fur den Mittelwert ii der Grundgesamtheit. X wird in diesem Zusammenhang auch als Testgroj3e oder Testvariable bezeichnet. Fiir verschiedene Stichproben werden wir dabei i.a. verschiedeneMittelwerte erhalten und diese wiederum werden vom hypothetischen Mittelwert Jl == Jlo mehr oder weniger stark abweichen. Wir miissen nun in der Lage sein anhand eines geigneten MaBes feststellen zu konnen, ob die beobachtete Abweichung des Stichprobenmittelwertes x yom hypothetischen Mittelwert Jl == Jlo zufallsbedingt oder aber signifikant ist, d.h. ihre Ursache in der falschen Nullhypothese H o hat. Um einen sinnvollen Vergleich des Stichprobenmittelwertes x mit der Herstellerangabe (Nullhypothese) Jl == Jlo zu ermoglichen, wahlen wir nun eine (kleine) sag. Signifikanzzahl a zwischen 0 und 1. Etwas spater werden wir dann sehen, daB diese Zahl die Wahrscheinlichkeit fiir eine bestimmte Fehlentscheidung darstellt, die man beijedem statistischen Priifverfahren ("Test") in Kaufnehmen muB. Die Signifikanzzahl rJ., wird daher auch folgerichtig als Irrtumswahrscheinlichkeit bezeichnet 25). Als Grundgesamtheit konnen wir beispielsweise die Menge aller in einem Monat produzierten Autos vom ausgewahlten Typ betrachten. Aus dem genannten Grund wird a in der Praxis klein gewahlt: Ubliche Werte sind z.B. a = 0,05 = 5% oder a = 0,01 = 1 % .

536 (3)

III Grundlagen der mathematischen Statistik Nach der Wahl der Signifikanzzahl (Irrtumswahrscheinlichkeit) rx HiBt sich nun eine Konstante c*, auch kritischer Wert genannt, so bestimmen, daB die Testgrofie X bei richtiger Nullhypothese H o mit der statistischen Sicherheit '}' = 1 - rx in das symmetrische Intervall J.10 - c * ~ X ~ J.10

+ c*

(111-143)

fallt (Bild 111-34). Die Intervallgrenzen J.10 - c* und J.lo + c* heiBen kritische Grenzen. Der kritische Wert c* wird dann aus der Bedingung P(J.lo - c* ~ X ~ 110

+ C*)H o =

'}' =

(111-144)

1 - rx

ermittelt, wobei man zuniichst die Testgrolle X standardisiert

(x

X -J.lo)

---->

u = (J/~

und anschlieBend die Tabelle 2 im Anhang verwendet (Tabelle der Quantile der Standardnormalverteilung)2 6).

Bild 111-34 Zur Berechnung der kritischen Grenzen

J.lo- c*

L (4)

J.lo

kritische Grenzen

/10+ c*

-

x

~

Wir sind nun in der Lage, eine Entscheidung zu fallen, sollten dabei jedoch nie vergessen, daB diese aufgrund eincr einzigen Stichprobenuntersuchung zustande kommt:

1. Fall: Fallt der aus einer konkretenStichprobe ermittelte Stichprobenmittelwert

xin dieses Intervall (auch nicht-kritischer Bereich oder Annahmebereich genannt), so

darf die Abweichung zwischen x und J.lo als rein zufallsbedingt angesehen werden, und die Nullhypothesewird beibehalten, d.h. sie kann nicht abgelehnt oder verworfen werden (Bild 111-35). Mit anderen Worten: Die Auswertung un serer Stichprobe liefert keinen Grund, an den Angaben des Automobilherstellers beziiglich des mittleren Benzinverbrauchs zu zweifeln. Wir konnen daher davon ausgehen, daB der mittlere Benzinverbrauch J.l tatsachlich J.lo betragt, ohne uns dessen jedoch absolut sicher zu seine Das verwendete Stichprobenmaterial spricht zumindest nicht gegen die Nullhypothese. Dies aber bedeutet keineswegs, daB H o richtig ist ~ die Nullhypothese kann sowohl richtig als auch falsch seine 26)

Die Varianz (j2 der normalverteilten Zufallsvariablen X wird dabei als bekannt vorausgesetzt. Andernfalls ist die t- Verteilung von Student zu verwenden (vgl. hierzu auch die nachfolgenden Abschnitte 4.5.1 und 4.5.2). Die Berechnung des kritischen Wertes c* erfolgt dabei immer unter der Voraussetzung, daB die Nullhypothese H 0: J1 = J10 auch tatsachlich zutrifft. Der Index "H 0" am Wahrscheinlichkeitssymbol P solI an diese Voraussetzung erinnern. Ausfiihrliche Einzelheiten zur Berechnung des kritischen Wertes c * erfolgen spater im Zusammenhang mit den speziellen Parametertests in Abschnitt 4.5.

4 Parametertests

537 Mitte/wert X der Stichprobe fallt in den nicht-kritischen Bereich

Y= 1-a

a/2

a/2

Jlo

ritischer

~

Bereich (Ablehnung)

-

-

x

nicht-kritischer Bereich (Annahmebereich)

x

kritischer Bere;;j (Ablehnung) I

Bild 111-35 Der Stichprobenmittelwert x fallt in den nicht-kritischen Bereich (Annahmebereich), die Nullhypothese H o : J1 = J10 wird daher beibehalten, d. h. nicht abgelehnt

2. Fall: Fallt der Stichprobenmittelwert x jedoch in den sog. kritischen Bereich oder Ablehnungsbereich, d. h. in das Intervall Ix- f.1o I > c*, so ist die Wahrscheinlichkeit dafur, daB die Abweichung zwischen x und f.1o rein zufallig ist, sehr gering, namlich gleich der kleinen Signifikanzzahl a (also z.B. gleich a = 5 % oder a = 1 0/0). Die Nullhypothese H o ist daher nicht haltbar und muB somit zugunsten der Alternativhypothese H 1 abgelehnt oder verworfen werden (Bild III -36). Mit anderen Worten: Wir konnen die Angaben des Automobilherstellers als falsch betrachten und davon ausgehen, daB der mittlere Benzinverbrauch f.1 gr6Ber oder kleiner als f.1o ist. Die Nullhypothese H 0: f.1 = f.1o wird somit auf dem Signifikanzniveau a zugunsten der Alternativhypothese H 1 : f.1 =1= f.1o verworfen.

Mitte/wert X der Stichprobe fallt in den kritischen Bereich

Jlo

@,

ritisch er Bereich (Ab/ehnung)

nicht-kritischer Bereich (Annahmebereich)

Jlo+ c*

-

x

-

x

kritischer Bere;;! (Ablehnung) I

Bild 111-36 Der Stichprobenmittelwert x fallt in den kritischen Bereich, die Nullhypothese H o : J1 = J10 wird daher zugunsten der Alternativhypothese Hi : J1 =1= J10 verworfen


538

Eines sol1ten wir dabei jedoch stets im Auge behalten: Absolut sichere Ruckschliisse von einer Zufallsstichprobe auf die entsprechende Grundgesamtheit sind grundsdtzlich nicht moglich. Es besteht daher immer die Moglichkeit eines Irrtums, d.h. einer falschen Entscheidung. Nehmen wir einmal an, daB die Angaben unseres Automobilherstellers tatsachlich zutreffen, der mittlere Benzinverbrauch u also wie behauptet flo betragt, Dann konnten wir beim Testen auf eine Zufallsstichprobe stoBen, deren Mittelwert x zufiilligerweise in den kritischen Bereich (Ablehnungsbereich) fallt und miiBten dann aufgrund unserer Kriterien die Nullhypothese fl == flo ablehnen, obwohl sie richtig ist (vgl. hierzu Bild 111-36). Damit aber wiirden wir (wenn auch unbewujJt) eine Fehlentscheidung treffen. Das Risiko fur eine solche aufgrund einer Stichprobenuntersuchung getroffene falsche Entscheidung ist dabei quantitativ durch die vor Testbeginn gewahlte Signifikanzzahl a gegeben. Damit ist a die Wahrscheinlichkeit dafiir, eine an sich richtige Nullhypothese ablehnen zu miissen. Die Signifikanzzahl a wird somit zu Recht als I rrtumswahrscheinlichkeit bezeichnet.

4.2 Statistische Hypothesen und Parametertests Unter einer statistischen Hypothese (kurz: Hypothese) versteht man irgendwelche Annahmen, Vermutungen oder Behauptungen iiber die Wahrscheinlichkeitsverteilung einer Zufallsvariablen oder Grundgesamtheit und deren Parameter. Ein Parametertest ist ein statistisches Prifverfahren fur einen unbekannten Parameter in der Wahrscheinlichkeitsverteilung einer Zufallsvariablen oder Grundgesamtheit, wobei die Art der Verteilung (d.h. der Verteilungstyp wie z.B. Binomialverteilung oder GauBsche Normalverteilung) als bekannt vorausgesetzt wird. Ein solcher Test dient der Vberprufung einer Hypothese iiber einen bestimmten Parameter der Verteilung mit Hilfe einer Stichprobenuntersuchung der betreffenden Grundgesamtheit. Die zu iiberpriifende Hypothese wird meist als N ullhypothese H obezeichnet. Ihr wird oft eine Alternativhypothese HI gegeniibergestellt. Es ist dann das erklarte Ziel eines Parametertests, eine Entscheidung dariiber zu ermoglichen, ob man die Nullhypothese H o beibehalten (d.h. nicht ablehnen) kann, da die Auswertung des verwendeten Stichprobenmaterials in keinem Widerspruch zur Nullhypothese steht oder ob man sie zugunsten der Alternativhypothese HI ablehnen oder verwerfen muB. Mit einem Parametertest kann also iiber Ablehnung oder Beibehaltung (Nichtablehnung) einer aufgestellten Hypothese ("Nullhypothese") entschieden werden. Allerdings: Wie auch immer die Entscheidung ausfallen sollte, sie kann richtig aber auch falsch sein. •

Beispiele

(1)

Beim Zufallsexperiment "Wurf einer Miinze" tritt das Ereignis A: "Zahl" mit der Wahrscheinlichkeit p == 0,5 ein, falls diese M iinze echt (d. h. unverfiilscht) ist. Wir priifen die Echtheit dieser Miinze, in dem wir der Nullhypothese H o : p(A)

== 0,5

die Alternativhypothese H 1 : p(A ) i= 0,5

gegeniiberstellen. Es handelt sich hierbei urn einen sog. zweiseitigen Parametertest, da die Alternativhypothese Parameterwerte nach beiden Seiten hin zulafst (sowohl p < 0,5 als auch p > 0,5 ist moglich),

539

4 Parametertests (2)

Ein Grobhandler bestellt direkt beim Hersteller einen grolseren Posten eines bestimmten elektronischen Bauelements und vereinbart dabei, daf die Ware einen maximalen Ausschufianteil von Po = 1% enthalten darf. Bei der Anlieferung der Ware wird er daher mit einem speziellen statistischen Test priifen, ob die vereinbarte maximale AusschuBquote auch nicht iiberschritten wurde. Der Grobhandler wird daher die N ullhypothese

Ho : p

~

Po = 1 0/0

gegen die Alternativhypothese HI: p > Po

= 10/0

testen (sog. einseitiger Parametertest, da hier die Alternativhypothese nur Werte p > Po zulafst), Sollte dabei die Testentscheidung zugunsten der Alternativhypothese HI ausfallen, so darf er davon ausgehen, daf der AuschuBanteil p grofJer ist als vereinbart, d. h. grofJer als 1 % ist. Er wird in diesem Fall die Annahme der gelieferten Bauelemente verweigern. Trotzdem kann die getroffene Entscheidung durchaus falsch sein! Denn aIle Testentscheidungen sind grundsatzlich mit einem gewissen Risiko verbunden (nahere Einzelheiten in Abschnitt 4.4). Die Wahrscheinlichkeit fur eine F ehlentscheidung ist jedoch in diesem Fall hochstens gleich der Signifikanzzahl o: und diese kann ja vor Testbeginn entsprechend klein gewahlt werden (z.B. rJ. = 0,01 = 10/0).

• 4.3 Planung und Durchfiihrung eines Parametertests In enger Anlehnung an unser einfiihrendes Beispiel aus Abschnitt 4.1 empfehlen wir, den Ablauf eines Parametertests wie folgt zu planen und durchzufiihren:


540

r-km;SCher I Bereich

nicht-kritischer Bereich

Bild 111-37 Die kritischen Grenzen vom nicht-kritischen Bereich 27)

28)

Cu

und

Co

kritische-; Bereich

-l

trennen den kritischen Bereich

In einfachen Fallen erweist sich dabei die ausgewahlte Testvariable T als eine Schdtzfunktion () des unbekannten Parameters 9. 1m allgemeinen jedoch gilt: Zwischen der Testvariablen T und der Schatzfunktion () des Parameters 9 besteht ein gewisser Zusammenhang. 1m nachfolgenden Abschnitt 4.5 werden wir fur spezielle Parameter zeigen, wie man mit Hilfe von bekannten Schatzfunktionen geeignete Testvariable erhalt, a ist die Wahrscheinlichkeit dafiir, daB der Wert der Testvariablen 'T aujJerhalb dieses Intervalls liegt.

4 Parametertests

541

y = 1-a

Prct- oder Testwert t

a/2

a/2

blehnUng

~

(kritischer Bereich)

Annahmebereich (nicht-kritischer Bereich)

--l

Ablehnung (kritischer Bereich)

Bild 111-38 Der Priif- oder Testwert i [aUt in den nicht-kritischen Bereich (Annahmebereich), die Nullhypothese H o : 9 = 9 0 wird daher beibehalten, d. h. nicht abgelehnt


542

PrOf- oder Testwert

t

PrOf- oder Testwert

t

a/2

~

blehnUng



-l


Bild 111-39 Der Priif- oder Testwert i fallt in den kritischen Bereich, die Nullhypothese H o : 8 = 8 0 wird daher zugunsten der Alternativhypothese H 1 : 8 =1= 8 0 abgelehnt

29)

30)

Die Moglichkeit eines Irrtums, d.h. einer Fehlentscheidung ist grundsatzlich immer gegeben. Die Irrtumswahrscheinlichkeit betragt hier o: (vgl. hierzu auch den nachfolgenden Abschnitt 4.4). Dies bedeutet, daB wir uns fur die Alternativhypothese H 1 entscheiden.

4 Parametertests

543

Anmerkungen (1) Die Test- oder Priifvariable T wird haufig auch als Test- oder PrufgrojJe, manchmal auch als Test- oder Priiffunktion bezeichnet. (2)

Man beachte, daB die Bestimmung der kritischen Grenzen nur moglich ist, wenn die Wahrscheinlichkeitsverteilung der Testgr6Be T bekannt ist. Beispiel: X sei eine normalverteilte Zufallsgr6Be. Dann ist die Testgr6Be X (d.h. die Schdtzfunktion fur den M ittelwert 11 der normalverteilten Grundgesamtheit) eben-

falls normalverteilt. (3)

In Abschnitt 4.5 werden wir uns mit den wichtigsten Parametertests vertraut machen und dabei zeigen, wie man fur spezielle Parameter unter Verwendung bereits bekannter Schatzfunktionen geeignete Testvariable mit bekannter Wahrscheinlichkeitsverteilung erhalt.

(4)

Neben dem hier ausfiihrlich besprochenen zweiseitigen Parametertest gibt es auch die Moglichkeit einseitiger Tests. Beispiel: Wir testen die Nullhypothese

(111-151) ("der Parameter 9 ist kleiner oder gleich 9 0 " ) gegen die Alternativhypothese H 1 : 9 > 90

(111-152)

("der Parameter 9 ist grojJer als 9 0 " ) , Es handelt sich hierbei urn einen einseitigen Test, da die Alternativhypothese nur Parameterwerte grojJer als 9 0 zulabt. Es gibt jetzt nur eine kritische Grenze c. Sie laBt sich aus der Bedingung P(T

~

C)Ho

= Y= 1- a

(111-153)

fur die verwendete Test- oder Priifvariable T mit Hilfe der entsprechenden Verteilungsfunktion leicht berechnen (Bild 111-40).

c

1---

Annahmebereich

Ablehnung

1

kritische Grenze

Bild 111-40 Annahmebereich bei einem einseitigen Parametertest (Abgrenzung nach oben)

544 (5)

III Grundlagen der mathematischen Statistik Haufig wird auf eine Alternativhypothese verzichtet. Falls dann keine signifikante oder (wie man auch sagt) statistisch gesicherte Abweichung vorliegt, wird die Nullhypothese H 0 beibehalten, d. h. nicht abgelehnt. Dies bedeutet aber keineswegs, daB H 0 als richtig angenommen wird, sondern besagt lediglich, daB das Ergebnis der Stichprobenuntersuchung in keinem Widerspruch zur Nullhypothese H o steht. Ein M usterbeispiel aus dem technischen Bereich liefert die Uberpriifung eines bestimmten Sollwertes (Hypothese: /1 == /10). Es interessiert dabei haufig nur, ob der Sollwert /10 eingehalten wird oder nicht.

4.4 Mogliche Fehlerquellen bei einem Parametertest Am Ende eines Parametertests ist stets eine Entscheidung zu fallen. Sie kann dabei zugunsten der Nullhypothese H 0 oder der Alternativhypothese HI ausfallen. In beiden Fallen werden gewisse Riickschliisse von einer Zufallsstichprobe auf die entsprechende Grundgesamtheit gezogen. Wir miissen dabei jedoch bedenken, daB es absolut sichere Schliisse grundsatzlich nicht gibt. Bei einer Testentscheidung besteht somit immer die Moglichkeit eines Irrtums, d.h. einer Fehlentscheidung. Mit anderen Worten: Bei jeder Testentscheidung besteht eine bestimmte Wahrscheinlichkeit dafiir, daft die getrofJene Entscheidung falsch ist. Dabei werden zwei Arten von Fehlern unterschieden:

In beiden Fallen wurde eine falsche Entscheidung gefallt! Wir erlautern nun die moglichen Fehler 1. Art und 2. Art etwas naher am Beispiel eines einseitigen Parametertest, bei dem die Nullhypothese H o:9

== 9 0

(111-154)

gegen die Alternativhypothese HI: 9 > 9 0

(111-155)

getestet werden solI.

Fehler 1. Art Die kritische Grenze c wird bekanntlich so bestimmt, daB die Testvariable T bei richtiger Nullhypothese Hound vorgegebener Signifikanzzahl a mit einer Wahrscheinlichkeit von a Werte annimmt, die in den kritischen Bereich oder Ablehnungsbereich fallen (dunkelgrau unterlegte Flache in Bild III -41). Wir haben dabei vorausgesetzt, daf 9 0 der wahre Wert

4 Parametertests

545

des Parameters 9 ist. Der Einfachheit halber nehmen wir desweiteren an, daf die verwendete Testvariable (Priifgrohe) T eine Schdtzfunktion des betreffenden Parameters 9 ist. Der Test- oder Prifwert von T ist dann identisch mit dem Schdtzwert § des Parameters.

--r


-J

Ablehnung (kritischer Bereich) kritische Grenze

Bild 111-41 Die dunkelgrau unterlegte .Flache lI. ist die Wahrscheinlichkeit dafiir, einen Fehler I . Art zu begehen, d. h. eine an sich richtige Nullhypothese verwerfen zu miissen

Fallt nun der aus einer konkreten Stichprobe berechnete Testwert § in den Ablehnungsbereich 9 > c, so miissen wir die an sich richtige Nullhypothese H 0: 9 == 9,0 irrtianlicherweise verwerfen und begehen damit genau einen Fehler 1. Art. Seine Grobe entspricht dabei der vorgegebenen Signifikanzzahl a, die daher auch folgerichtig - wie bereits erwahnt - als Irrtumswahrscheinlichkeit bezeichnet und durch die in Bild III -41 dunkelgrau unterlegte Flache reprasentiert wird. •

Beispiel

Ein Grobhandler bezieht direkt vom Hersteller einen grolieren Posten eines bestimmten elektronischen Bauelements. Bei der Anlieferung der Ware wird er eine sog. Abnahmekontrolle durchfiihren, urn zu priifen, ob die vereinbarten Lieferbedingungen (z.B. maximal 1% "AusschuBware") auch eingehalten wurden. Aus diesem Grunde entnimmt er der Lieferung eine Zufallsstichprobe. Fallt dabei der aus der Stichprobe berechnete Wert der Testgrolie (hier: Anteilswert .Ausschuli") in den nicht-kritischen Bereich (Annahmebereich), so wird der Grobhandler die angelieferte Ware auch abnehmen. Fallt der Testwert jedoch in den kritischen Bereich (Ablehnungsbereich), so wird er die Annahme der Ware verweigern. Die zwischen GroBhandler und Produzent vorher vereinbarte Signifikanzzahl rJ. ist dabei die Wahrscheinlichkeit dafiir, eine an sich einwandfreie Lieferung aufgrund einer ZufalIsstichprobe zuritckzuweisen, weiI der Wert der Testgrobe (hier also der Anteilswert "AusschuB") zufdlligerweise in den kritischen Bereich der Testgrolie fallt. Einen solchen Fehler 1. Art bezeichnet man daher in der Praxis haufig auch als Produzen-

tenrisiko.

•


546

Fehler 2. Art Ein Fehler 2. Art liegt vor, wenn eine Nullhypothese H o beibehalten, d.h. nicht abgelehnt wird, obwohl sie falsch ist. Bild 111-42 zeigt die als richtig angenommene Verteilung mit dem Parameterwert 9 0 und zugleich die tatsdchliche Verteilung mit dem wahren Parameterwert 9 1 31). In dieser Abbildung wird die Wahrscheinlichkeit f3 fur einen Fehler 2. Art durch die hellgrau unterlegte Flache dargestellt (Flache unter der Dichtefunktion der wahren Verteilung in den Grenzen von - 00 bis zur kritischen Grenze c). Die Grobe dieser Wahrscheinlichkeit hangt dabei noch von der Lage von 9 1 abo Den entsprechenden funktionalen Zusammenhang zwischen f3 und 9 1 bezeichnet man als Operationscharakteristik:

f3 = f3 (9 1) . tetsecntiche Verteilung

angenommene Verteilung

.········r·······. / I ••••••••••

•••

I

I

Fehler 2.Art

•••••

-.

........................

Fehler 1.Art

Bild 111-42 Fehler 1. und 2. Art

•

Beispiel Wir kommen nochmals auf das vorangegangene Beispiel zuriick (Abnahmekontrolle bei einer Warenlieferung). In diesem Beispiel ist f3 die Wahrscheinlichkeit dafiir, daf der Grobhandler die Lieferung der elektronischen Bauelemente annimmt, obwohl sie nicht den vereinbarten Bedingungen (hier: maximaler "AusschuBanteil" von 10/0) entspricht, weil die Lieferung insgesamt einen zu hohen Anteil an Ausschufrware enthalt (was der Grolshandler aber nicht weiB). Diese Fehlentscheidung tritt genau dann ein, wenn der aus der entnommenen Zufallsstichprobe berechnete Wert der Testvariablen (hier also der Anteilswert .Ausschulrware") zufdlligerweise in den nicht-kritischen Bereich (Annahmebereich) fallt, Daher wird ein solcher Fehler 2. Art haufig auch als Konsumentenrisiko bezeichnet.

•

Zusammenhang zwischen den Fehlern 1. und 2. Art Eine in der Praxis wichtige Fragestellung lautet somit: me lassen sich diese Fehler 1. und 2. Art moglichst klein halten?

Dazu betrachten wir eingehend Bild 111-43, in dem die als richtig angenommene Verteilung (Parameter 9 0 ) und die tatsdchliche Verteilung (Parameter 9 1 ) sowie die Fehler 1. und 31)

Dargestellt ist der Fall 8 1 > 8 0 •

4 Parametertests

547

2. Art anschaulich dargestellt sind. Diesem Bild konnen wir unmittelbar entnehmen, daB eine Verkleinerung von (1, automatisch eine Vergrofserung von f3 nach sich zieht (Ubergang von Bild a) zu Bild b)). Denn eine Verkleinerung von (1, (im Bild durch die dunkelgrau unterlegte Flache veranschaulicht) bedeutet eine Verschiebung der kritischen Grenze c nach rechts, wobei aber automatisch f3 (im Bild durch die hellgrau unterlegte Flache dargestellt) zunimmt. Umgekehrt gilt: Wird f3 verkleinert, so vergrofiert sich dabei (1, (dies entspricht einer Verschiebung der kritischen Grenze c nach links).

tetsechtiche Verteilung


a)

c

I I I I I


tetsecntiche Verteilung

c beschrieben (dunkelgrau unterlegte Flache in Bild 111-45). Die Berechnung des kritischen Wertes c erfolgt dann aus der Bedingung (III-162) mit Hilfe von Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung).

4 Parametertests

551

-c

r :i~cher

o

c

u


Bereich

Bild 111-45 Zur Bestimmung des kritischen Wertes c fur die standardnormalverteilte Testvariable U

(4)

Wir berechnen nun den Mittelwert x der vorgegebenen konkreten Stichprobe Die Testvariable U aus Gleichung (111-160) erhalt darnit den folgenden Test- oder Priifwert: Xl' X 2, ... , X n •

"

X -

flo

(III -163)

U=---

a/0z (5)

Testentscheidung: Fallt der Test- oder Prufwert (Annahmebereich), d.h. gilt

u in

den nicht-kritischen Bereich

-c~u~c

(111-164)

so wird die N ullhypothese H 0 : fl = flo beibehalten, andernfalls aber zugunsten der Alternativhypothese H 1 : u =1= flo verworfen. .Beibehalten" bedeutet dabei lediglich, daB die Nullhypothese H o aufgrund der verwendeten Stichprobe nicht ahgelehnt werden kann. Bild III -46 verdeutlicht diese Testentscheidung.

r

H o beibehalten

1-a

a/2

H

o

ablehnen

a/2

r

A blehnung (kritischer Bereich)

-c

o Annahmebereich (nicht-kritischer Bereich)

u

--l


Bild 111-46 Testentscheidung iiber Beibehaltung oder Ablehnung der NuUhypothese

H o : /1 = /10

552


Wir fassen diesen speziellen Parametertest wie folgt zusammen:

4 Parametertests

553

Anmerkungen

(1)

Bei der Riicktransformation U ~ X mittels der Transformationsgleichung (111-167) erhalt man fur die Schatzfunktion X den kritischen Wert c* == c (J / j";z und damit den nichtkritischen Bereich (Annahmebereich) J.1o - c * ~

x ~ J.1o + c *

(111-172)

(vgl. hierzu auch Bild 111-44). Die Testentscheidung lautet dann fur die Zufallsvariable X wie folgt: Fallt der aus der Stichprobe berechnete Mittelwert in dieses Intervall, so wird die Nullhypothese H o beibehalten, d.h. nicht abgelehnt, anderenfalls muf sie zugunsten der Alternativhypothese H 1 verworfen werden.

x

(2)

Analog verlaufen die einseitigen Parametertests. In diesen Fallen gibt es aber nur jeweils eine kritische Grenze c. Sie Ui13t sich aus den folgenden Bedingungen mit Hilfe von Tabelle 2 im Anhang leicht ermitteln: 1. Fall: Abgrenzung nach oben (Bild 111-47)

u.; J.1

~ flo

H 1 : fl > flo P(U ~ C)H o

== 1 -

rx

Annahmebereich: u

~

c

o

c

u 4

Annahmebereich

_1

Ablehnun;

kritische Grenze

Bild 111-47 Annahmebereich bei einem einseitigen Test (Abgrenzung nach oben)

1


554

2. Fall: Abgrenzung nach unten (Bild 111-48) H o: Il ~ Ilo HI: Il < Ilo

P(U 1,645 (Bild III-51). Die Nullhypothese H o : 11 ~Ilo == 10 muB daher auf dem Signifikanzniveau a == 5 % zugunsten der Alternativhypothese HI: 11 > 10 abgelehnt werden. Wir konnen somit davon ausgehen, daB der unbekannte Mittelwert 11 der normalverteilten Grundgesamtheit grofter ist als 10.

558


u=3,162


u

1,645

-~


u

Bild III-51 Der Testwert = 3,162 fallt in den kritischen Bereich, die Nullhypothese H 0 : 11:::;; 110 = 10 wird daher verworfen

• 4.5.2 Tests fur den unbekannten Mittelwert Jl einer Normalverteilung bei unbekannter Varianz (12 X sei wiederum eine normalverteilte Zufallsvariable. Neben dem Mittelwert u ist diesmal aber auch die Varianz (J2 unbekannt. Wir vermuten jedoch, daB der Mittelwert fl einen bestimmten Wert flo besitzt (fl = flo) und testen daher unter sonst ahnlichen Bedingungen wie im vorangegangenen Abschnitt 4.5.1 die N ullh ypothese H 0 : u = flo

(111-173)

gegen die Alternativhypothese H 1 : fl i= flo Testvariable ist diesmal wegen der unbekannten Varianz

X-IJ T = _ _1""_0

(111-174) (J

2

die Zufallsvariable (111-175)

s/0z Dabei ist S die bereits aus Abschnitt 3.2.4 bekannte Schdtzfunktion fur die (ebenfalls unbekannte) Standardabweichung (J und n der Umfang der Zufallsstichprobe, die diesem zweiseitigen Parametertest zugrunde gelegt wird. Die Testvariable T geniigt dann der t- Verteilung von Student mit J = n - 1 Freiheitsgraden. Bei der Berechnung des kritischen Wertes c bzw. der kritischen Grenzen c; = - c und Co = c ist daher diesmal die Verteilungsfunktion F(t) der t- Verteilung mit J = n - 1 Freiheitsgraden zu verwenden.

4 Parametertests Der zweiseitige Parametertest fur den M ittelwert f1 verlauft dann wie folgt:

559

560


-c

o

c

Bild III-52 Zur Bestimmung des kritischen Wertes c fur die einer t- Verteilung geniigende Testvariable T

H o beibehalten

H o ablehnen

I

a/2

-c Ablehnung (kritischer Bereich)


c

--l


Bild III-53 Testentscheidung iiber Beibehaltung oder Ablehnung der Nullhypothese H o : u = flo

4 Parametertests

561

Anmerkungen (1)

Bei der Riicktransformation T --+ X mittels der Transformationsgleichung (111-178) erhalt man fur die Zufallsvariable X den kritischen Wert c* == c s/~ und damit den nichtkritischen Bereich (Annahmebereich) flo -

c* ~

x ~ flo + c *

(111-183)

(vgl. hierzu auch Bild III-54). Fallt der aus der Stichprobe berechnete Mittelwert x in dieses Intervall, so wird die Nullhypothese H o beibehalten, anderenfalls muB sie zugunsten der Alternativhypothese H 1 verworfen werden. 1-a

110 - c*

~

110

-


-

x

110 + c*


--l


Bild III-54 Annahmebereich bei einem zweiseitigen Test fur den unbekannten Mittelwert J1 einer Normalverteilung (bei unbekannter Varianz 0'2)

(2)

Bei einseitigen Tests gelten sinngemaf die in Abschnitt 4.5.1 in Anmerkung (2) gemachten Bemerkungen, wobei bei der Berechnung der kritischen Grenze c die t-Verteilung von Student mit f == n - 1 Freiheitsgraden anstelle der Standardnormalverteilung zu verwenden ist.

(3)

Bei einer umfangreichen Stichprobe (Faustregel: n > 30) ist die durch Gleichung (III -178) definierte Testvariable T ndherungsweise standardnormalverteilt und wir diirfen daher das in Abschnitt 4.5.1 besprochene Testverfahren an wenden ((J2 ~ S2).

•

Beispiel Ein Hersteller produziert in groBen Mengen Zylinderscheiben mit einem Solldurchmesser von 20,2 mm. Urn die Einhaltung dieses Sollwertes zu iiberpriifen, wird aus der laufenden Produktion eine Stichprobe vom Umfang n == 16entnommen. Die Auswertung dieser Stichprobe ergibt dabei einen mittleren Durchmesser von x == 20,6 mm mit einer empirischen Standardabweichung von s == 0,5 mm. Unter Verwendung dieser Stichprobe testen wir die Nullhypothese

H o : fl ==

flo

== 20,2 mm

gegen die Alternativhypothese H1:

fl

=f.

flo

== 20,2 mm

562

III Grundlagen der mathematischen Statistik auf dem Signifikanzniveau a == 0,05 == 50/0. Der Test solI dabei zweiseitig durchgefiihrt werden, wobei der Durchmesser X der Zylinderscheiben als eine normalverteilte ZufalIsvariable angesehen werden kann. Wir losen diese Aufgabe jetzt schrittweise wie folgt: 1. Schritt: Das Signifikanzniveau ist bereits vorgegeben: a

==

0,05.

2. Schritt: Die Testvariable X - flo

T----- S/~ -

X - 20,2 mm

S/)16

X - 20,2 mm -----S/4

geniigt der t-Verteilung mit f == n - 1 == 16 - 1 == 15 Freiheitsgraden. Die Bestimmungsgleichung fur den kritischen Wert c lautet somit (Bild III-55): P( - c

~

~

T

C)H o == 1 - a == 1 - 0,05 == 0,95

Unter Verwendung von Tabelle 4 im Anhang erhalten wir (bei f den):

==

15 Freiheitsgra-

P( - c ~ T~ C)H o == F(c) - F( - c) == F(c) - [1 - F(c)] == ==

2 . F(c) - 1

f= 15

F (c) == 0,975

c ==

==

0,95

t(0,97 5; 15)

==

2,131

Bild III-55

o

-c

c

Damit ergibt sich der folgende nicht-kritische Bereich (Annahmebereich; vgl. hierzu auch Bild III-56): - 2,131

~

t

~

2,131

x

3. Schritt: Mit flo == 20,2 mm, n == 16, == 20,6 mm und s fur die Testvariable T einen Test- oder Priifwert von ~

x-

flo

t = = - - ==

s/~

(20,6 - 20,2) mm 0,5 mm/)16

==

==

0,5 mmerhalten wir

32 ,

4. Schritt (Testentscheidung): Der Testwert t == 3,2 fallt in den kritischen Bereich r] > 2,131 (Bild III-56). Die Nullhypothese H o : fl == flo == 20,2 mm ist somit abzu1

lehnen.

4 Parametertests


563

Annahmebereich (nlcnt-kritischer Bereich)

-l


Bild III-56 Der Testwert i = 3,2 fallt in den kritischen Bereich, die NulIhypothese H o : u = flo = 20,2 mm wird daher abgelehnt

Die Abweichung des Stichprobenmittelwertes x = 20,6 mm vom vorgeschriebenen Sol1wert /10 = 20,2 mm ist also signifikant und kann nicht mehr allein aus der Zufdlligkeit der verwendeten Stichprobe erklart werden. Der Produknonsprozef wird daher unterbrochen und die Fehlersuche eingeleitet.

•

4.5.3 Tests fur die Gleichheit der unbekannten Mittelwerte Pl und P2 zweier N ormalverteilungen (Differenzentests) 4.5.3.1 Abhangige und unabhangige Stichproben In der Anwendung stellt sich haufig das Problem festzustellen, ob die Mlttelwerte /11 und /12 zweier normalverteilter Grundgesamtheiten iibereinstimmen oder ob sie sich signifikant voneinander unterscheiden.Zii Priifzwecken entnehmen wir daher den beiden Grundgesamtheiten, die wir durch die Zufallsvariablen X und Y beschreiben, zunachst jeweils eine Zufallsstichprobe 33): bzw.

(111-184)

Unter Verwendung dieser Stichproben solI dann die

(111-185)

Nullhypothese H o : /11 = /12 gegen die

(111-186)

Alternativhypothese H 1 : /11 "# /12

getestet werden. Der Ablauf dieses zweiseitigen Tests hangt dabei noch ganz wesentlich davon ab, ob die verwendeten Stichproben voneinander abhdngig sind oder ob es sich um unabhdngige Stichproben handelt. Definitionsgemaf gilt: 33)

Die heiden Stichprohen konnen durchaus von unterschiedlichem Umfang sein (n 1

=1=

n2 ) .


564

Anmerkungen (1) Zwischen abhdngigen Stichproben besteht somit eine Kopplung. Man spricht daher in diesem Zusammenhang auch von verbundenen oder korrelierten Stichproben. (2)

Zwei Stichproben, die diese beiden Bedingungen nicht zugleich erfullen, heiBen dagegen voneinander unabhdngig tunabhdngige Stichproben). So sind beispielsweise zwei Stichproben von unterschiedlichem Umfang stets voneinander unabhdngig.

Wir erlautern diese Begriffe an zwei einfachen Beispielen. •

Beispiele

(1)

Der Vergleich zweier MeBverfahren oder zweier Meligerate fiihrt haufig zu abhdngigen oder verbundenen Stichproben, wie das folgende Beispiel zeigen soll: Aus einer Serienproduktion von Widerstanden mit einem bestimmten vorgegebenen Sollwert (der hier nicht naher interessiert) entnehmen wir wahllos n Widerstande, die wir der Reihe nach von 1 bis n durchnumerieren 'und durch die Symbole

kennzeichnen. Dann messen wir den Widerstandswert eines jeden dieser Widerstande mit zwei verschiedenen Meligeraten und erhalten somit fur den i-ten Widerstand R, genau zwei MeBwerte Xi und Yi (i == 1, 2, ... , n). Die beiden MeBreihen und sind vom gleichen Umfang und konnen dabei als Stichproben aus zwei normalverteilten Grundgesamtheiten aufgefaBt werden, die wir durch die Zufallsvariablen X und Y beschreiben. Offensichtlich handelt es sich dabei um zwei abhdngige oder verbundene Stichproben:

4 Parametertests

565

Die umkehrbar eindeutige Zuordnungsvorschrift lautet: (i == 1, 2, ... , n)

Zum Widerstand R, gehort somit das Wertpaar (Xi; (2)

yJ.

Ein Automobilhersteller produziert einen bestimmten Autotyp an zwei verschiedenen Standorten A und B. Um den mittleren Benzinverbrauch der Fahrzeuge in Abhangigkeit von ihrem Produktionsstandort miteinander vergleichen zu konnen, werden in beiden Werken Testjahrzeuge ausgewahlt und deren mittlerer Benzinverbrauch ermittelt:

Dabei bedeuten: Xi: Mittlerer Benzinverbrauch des i-ten Testfahrzeugs aus Werk A (i == 1, 2, ... , n 1 ) Yk: Mittlerer Benzinverbrauch des k-ten Testfahrzeugs aus Werk B (k == 1, 2, ... , n.2 )

Die beiden Stichproben sind offensichtlich voneinander unabhdngig, da keinerlei Zusammenhang zwischen den Fahrzeugen der beiden Werke erkennbar ist. Diese Aussage gilt auch im Sonderfall n 1 == n 2 , d.h. wenn aus beiden Werken gleichviele Testfahrzeuge ausgesucht werden.

• 4.5.3.2 Differenzentests bei abhangigen Stichproben Bei abhdngigen oder verbundenen Stichproben laBt sich der DifJerenzentest auf die in den Abschnitten 4.5.1 und 4.5.2 beschriebenen Parametertests fur den Mittelwert u einer normalverteilten Grundgesamtheit zuriickfiihren.

566


Wir beschreiben den zweiseitigen Differenzentest wie folgt:

4 Parametertests

567

Anmerkung Es wird also getestet, ob die durch Differenzbildung erhaltene Stichprobe z l' Z2, ... , Zn einer normalverteilten Grundgesamtheit mit dem Mittelwert f1 = 0 entstammt. Wir miissen dabei noch zwei Falle unterscheiden, je nachdem ob die Varianz (I2 dieser Grundgesamtheit bekannt oder unbekannt ist: 1. Fall: Die Varianzen (It und (I; der beiden Zufallsvariablen X und Y sind bekannt. Dann aber gilt 2 (It (II (It + (I; (I=-+-=--n n n

(III -195)

und wir konnen das in Abschnitt 4.5.1 besprochene Priifverfahren anwenden (die verwendete Testvariable ist in diesem Fall standardnormalverteilt). Diese Aussage gilt ndherungsweise auch bei unbekannten Varianzen, sofern die verwendeten abhangigen Stichproben hinreichend umfangreich sind (Faustregel: n > 30). In diesem Fall verwendet manals Schdtzwert fur die unbekannte Varianz (I2 die Stichprobenvarianz S2 (d.h. die Varianz der Stichprobe Zl, Z2, ... , zn). Inder Praxis wird man daher nach Moglichkeit immer auf umfangreiche abhdngige Stichproben zuriickgreifen. 2. Fall: Die Varianzen (It und (I; der beiden Zufallsvariablen X und Y sind unbekannt. Dann bleibt auch die Varianz (I2 unbekannt und wir miissen das in Abschnitt 4.5.2 dargestellte Testverfahren verwenden (die Testvariable gcniigt jetzt einer t-Verteilung mit f = n - 1 Freiheitsgraden). Dieser Fall tritt ein bei kleinen abhdngigen Stichproben mit n ~ 30.

•

Beispiel

Zwei verschiedene MeBmethoden fur elektrische Widerstande sollen miteinander verglichen werden. Aus diesem Grund wurden an 6 Widerstanden Parallelmessungen vorgenommen, die zu dem folgenden MeBprotokoll fiihrten (Xi: MeBwerte nach der Methode A; Yi: MeBwerte nach der Methode B; alle Werte in Q): i

1

2

3

4

5

6

Xi

100,5

102,0

104,3

101,5

98,4

102,9

Yi

98,2

99,1

102,4

101,1

96,2

101,8

Zu jedem der 6 Widerstande gehort genau ein Wertepaar (Xi; yJ. Es handelt sich also urn abhdngige Stichproben (MeBreihen). Durch Differenzbildung z, = Xi - Yi erhalten wir dann die folgende Stichpro be (alle Werte in Q):

2,3

2

3

4

5

6

2,9

1,9

0,4

2,2

1,1


568

1. Schritt: Das Signifikanzniveau ist vorgegeben: 2. Schritt: Wegen der unbekannten Varianz

Z -J.10

Z

s/0z

s/~

2

(J

r:J,

== 0,01.

miissen wir die Testvariable

T==--==--

verwenden, die der t-Verteilung mit f == n - 1 == 5 Freiheitsgraden geniigt. Den kritischen Wert c bestimmen wir dann aus der Bestimmungsgleichung P( - c

~

T

~

C)H o == 1 - a == 1 - 0,01 == 0,99

unter Verwendung von Tabelle 4 im Anhang (Bild III-57):

P( - c

~

T

~

C)H o = F(c) - F( - c) == F(c) - [1 - F(c)] ==

== 2 . F (c) - 1 == 0,99 F(c) == 0,995

f=5

c ==

t(0,995; 5)

== 4,032

Bild III-57

o

-c

c

Der nicht-kritische Bereich (Annahmebereich) lautet daher:

- 4,032 ~ t

~

4,032

569

4 Parametertests

3. Schritt: Wir berechnen nun den Mittelwert 2 und die Standardabweichung s der Stichprobe unter Verwendung der folgenden TabelIe:

_ Z

2,3

0,5

0,25

2

2,9

1,1

1,21

3

1,9

0,1

0,01

4

0,4

-1,4

1,96

5

2,2

0,4

0,16

6

1,1

-0,7

0,49

1

=_. 6

6

L z,

1

=

6° 10,8 o =

1,8 o

i= 1 6 S2

= _1_. \ 6-1

L

(z, -

2)2

= -51 ·4,08 0 2 = 0,816 0 2

i = 1

s = )0,8160 2 = 0,903 0

Damit erhalten wir fur die Testvariable T den folgenden Test- oder Prifwen: ~ 2 - Jlo (1,8 - 0) Q t=--= =4883 s/0z 0,903 0/)6 ,

t

4. Schritt (Testentscheidung): Der Testwert = 4,883 fallt in den kritischen Bereich It I > 4,032 (Bild III -58). Die N ullhypothese H 0 : Jl == Jlo = ist somit abzulehnen. Die beiden MeBmethoden konnen daher nicht als gleichwertig angesehen werden.

°


570

0,99

0,005

0,005

-4,032

~

°

-


4,032


t=4,883

--l


Bild III-58 Der Testwert i = 4,883 fallt in den kritischen Bereich, die Nullhypothese H o : fl = flo = 0 wird daher abgelehnt

• 4.5.3.3 Differenzentests bei unabhangigen Stichproben Wir testen jetzt die Nullhypothese H o: 111 == 112

(111-196)

gegen die Alternativhypothese H 1 : 111 i= 112

(111-197)

unter Verwendung von unabhdngigen Stichproben und

(III -198)

mit den Stichprobenumfangen n 1 und n 2 . Der Differenzentest hangt dabei noch ganz wesentlich davon ab, ob die Varianzen af und at der beiden zugehorigen normalverteilten Zufallsvariablen X und Y bekannt sind oder nicht. Wir unterscheiden daher noch zwei FaHe:

1. Fall: Differenzentest fur die Mittelwerte III und 112 zweier Normalverteilungen mit bekannten Varianzen u; und ui Trifft die Nullhypothese H o zu, gilt also 111 == 112 und sind die Varianzen af und at der beiden normalverteilten Grundgesamtheiten bekannt, so ist die Zufallsvariable Z == X - Y ebenfalls normalverteilt mit dem Mittelwert 11 == 0 und der Varianz (III -199) X und Y sind dabei die bereits aus Abschnitt 3.2.3 bekannten Schdtzfunktionen fur die beiden unbekannten Mittelwerte 111 und 112.

4 Parametertests

571

Als Testvariable eignet sich dann die standardnormalverteilte Zufallsvariable

z X-y u=-=-(J

(111-200)

(J

Die Nullhypothese (111-201)

H o : fJl = fJ2

wird dabei nur dann beibehalten (d.h. nicht abgelehnt), wenn die aus den beiden Stichprobenmittelwerten X und y gebildete Differenz X - Y nicht signifikant vorn Wert Null abweicht. Die kritischen Grenzen =+= c * miissen daher nach Vorgabe einer (kleinen) Signifikanzzahl (Irrtumswahrscheinlichkeit) rJ. so bestimmt werden, daB die Werte der Zufallsvariablen Z = X - Y mit der statistischen Sicherheit (Wahrscheinlichkeit) y == 1 - a in den nicht-kritischen Bereich (Annahmebereich) fallen (hellgrau unterlegte Flache in Bild III-59).

o

-c*

x-y

c*

Bild III-59 Zur Bestimmung der kritischen Grenzen

+ c* fur

die Zufallsvariable Z =

X- Y

Die Bedingung fur den kritischen Wert c* lautet somit:

P(-c*

~

~

X - Y

C*)H o == Y == 1 -

rJ.

(111-202)

Beim Ubergang von der Zufallsvariablen Z == X - Y zur standardnormalverteilten Test-

Z

X-Y

(J

(J

variablen U == - == - - - wird daraus die Bedingung

P(

c*

c*)

--~U~(J

(J

==y==l-rJ. H

(111-203)

o

die wir unter Verwendung der Abkiirzung c == c*/(J auch wie folgt schreiben konnen: P ( - c ~ U ~ c)H 0 == y == 1 -

rJ.

(III -204)

Die Konstante c, d. h. der kritische Wert fur die Testvariable U HiBt sich mit Hilfe von Tabelle 2 im Anhang bestimmen (Tabelle der Quantile der Standardnormalverteilung). Der Annahmebereich oder nicht-kritische Bereich liegt dann zwischen den beiden Grenzen c; == - c und Co = c (Bild 111-60).


572

r

-c

A blehnung (kritischer Bereich)

o

c

u

-.



Bild 111-60 Zur Bestimmung des kritischen Wertes c fur die standardnormalverteilte Testvariable U

Wir berechnen nun die Mittelwerte x und y der beiden vorgegebenen unabhangigen Stichproben und daraus den Wert der Testvariablen U: A

x-y

(111-205)

U==-(J

Es folgt dann die Testentscheidung: Fallt der Test- oder Prufwert 11 in das Intervall (111-206)

-c~u~c

(Annahmebereich), so wird die Nullhypothese H o: III == 112 beibehalten (d.h. nicht abgelehnt), anderenfalls aber zugunsten derAlternativhypothese H 1 : III -=1= 112 abgelehnt (Bild 111-61).

H o beibehalten

1-a

H o ablehnen

a/2

-c Ablehnung (kritischer Bereich)


c

u

-:


Bild 111-61 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : /11

= /12

4 Parametertests Wir fassen diesen Parametertest wie folgt zusammen:

573


574

Anmerkungen

(1)

Fur die Zufallsvariable Z = X - Y =

(J

U erhalt man somit den kritischen Wert

(111-215) Fallt die aus den beiden Stichprobenmittelwerten x und in den Annahmebereich - c*

~

X-

y gebildete Differenz x- y

Y ~ c*

(111-216)

so wird die Nullhypothese H o beibehalten (d.h. nicht abgelehnt), anderenfalls muB sie zugunsten der Alternativhypothese H 1 verworfen werden (Bild III-62).

-c*

blehnUng

~



c*

x-y

-l


Bild 111-62 Annahmebereich beim zweiseitigen Differenzentest fur Mittelwerte (bei bekannten Varianzen und Verwendung unabhangiger Stichproben)

4 Parametertests

575

(2)

Dieser Differenzentest UiBt sich auch fur einseitige Fragestellungen durchfuhren. In diesem Fall gibt es nut eine kritische Grenze (vgl. hierzu Anmerkung (2) in Abschnitt 4.5.1).

(3)

Bei umfangreichen Stichproben (Faustregel: n 1 , n2 > 30) diirfen die Varianzen af und at ndherungsweise durch ihre Schdtzwerte sf und st, d.h. durchdie Stichprobenvarianzen ersetzt werden, falls sie unbekannt sein sollten (vgl. hierzu das nachfolgende Beispiel).

•

Beispiel Mit dem DifJerenzentest soIl gepriift werden, ob die auf zwei verschiedenen Maschinen A und B hergestellten Gliihbimen im Mittel - wie vermutet wird die gleiche Lebensdauer besitzen. Dabei konnen wir davon ausgehen, daB die beiden Zufallsvariablen

x = Lebensdauer einer auf der M aschine A produzierten Gliihbirne und

Y = Lebensdauer einer auf der Maschine B produzierten Gliihbirne normalverteilt sind. Zu Priifzwecken entnehmen wir daher den beiden (normalverteilten) Grundgesamtheiten jeweils eine Stichprobe, deren Auswertung zu dem folgenden Ergebnis fiihrte (Angabe von Umfang, Mittelwert und Standardabweichung der jeweiligen Stichprobe):

x=

520 h,

Sl =

50 h

y=

500 h,

S2 =

45 h

Da die Stichprobenumfange hinreichend groft sind (n1 = 80 > 30, n2 = 50 > 30), diirfen wir die unbekannten Varianzen af und at der beiden Grundgesamtheiten ndherungsweise durch die Stichprobenvarianzen sf = (50 h)2 =2500 h 2 s5: = (45 h)2 = 2025 h 2 und

ersetzen. Wir testen jetzt die Nullhypothese H o : f11 =

f12

gegen die Alternativhypothese

H 1 : f11

=1= f12

schrittweise wie folgt: 1. Schritt: Wir wahlen als Signifikanzzahl (Irrtumswahrscheinlichkeit) a = 0,01.


576

2. Schritt: Berechnung der Varianz a 2 der Zufallsvariablen Z chung (111-199): a2

==

x - Y nach Glei-

af. + -a; ~ -sf + -s; == (2500 2025) 2 h - - + - - h == 71 75 2

== -

n2

»,

n2

»,

80

50

Die Standardabweichung betragt somit a == )71,75 h 2 Wert c fur unsere standardnormalverteilte Testvariable

X-y

'

==

8,471 h. Der kritische

X-y

u- - ---8,471 - -h a wird aus der Bedingung P( - c

~

U

~

C)H o

==

1 - a == 1 - 0,01 == 0,99

wie folgt unter Verwendung von Tabelle 2 im Anhang bestimmt (vgl. hierzu Bild 111-63): P(-c

~

U

~

C)H o == ¢(c) - ¢(-c) == ~

¢(c) == 0,995

==

¢(c) - [1 - ¢(c)] ==

2 . ¢(c) - 1 == 0,99 c ==

U O,995

==

2,576

Bild 111-63

o

-c

c

u

Der nicht-kritische Bereich (Annahmebereich) ist somit durch das symmetrische Intervall - 2,576

~ U ~

2,576

gegeben (Bild III -64).

3. Schritt: Mit x == 520 h, Y == 500 h und a ble U den folgenden Test- oder Prufwert: A

U

X-

Y

== - - ==

a

(520 - 500) h == 2361 8,471 h '

==

8,471 h erhalten wir fur die Testvaria-

4 Parametertests

577

u

4. Schritt (Testentscheidung): Unser Testwert = 2,361 fallt in den Annahmebereich, d.h. es gilt - 2,576 ~ u ~ 2,576 (Bild 111-64). Die Testentscheidung lautet daher: Aufgrund der verwendeten Stichprobe kann die Nullhypothese H o : III = 112 nicht abgelehnt werden. Wir konnen somit davon ausgehen, daB beide Maschinen Gliihbirnen von gleicher mittlerer Lebensdauer produzieren. Zumindest spricht das Stichprobenmaterial nicht gegen diese Annahme. 0,99

u=2,361 0,005

0,005

o

-2,576

~

2,576

u

_.

-~




Bild 111-64 Der Testwert u = 2,361 fallt in den Annahmebereich, die Nullhypothese H 0 : J11 = J12 wird daher beibehalten, d. h. nicht abgelehnt

• 2. Fall: Differenzentest fur die Mittelwerte III und 112 zweier N ormalverteilungen mit gleicher, aber unbekannter Varianz (a; = at) Bisher sind wir von normalverteilten Zufallsvariablen X und Y mit bekannten Varianzen alausgegangen. Etwas anders liegen die Verhaltnisse, wenn die Varianzen zwar als gleich angesehen werden konnen (af = al), jedoch unbekannt sind. In diesem Fall verwendet man (unter sonst gleichen Voraussetzungen) als Testgroj3e die Zufallsvariable

af und

T=

n l n 2 (n l

nl

+ n2 + n2

-

2)

X - Y

J(n l

-

l)Sf

(111-217)

+ (n2

-

l)Sl

die der t- Verteilung von Student mit J = n l + n 2 - 2 Freiheitsgraden geniigt 34). n l und n 2 sind dabei wiederum die Umfiinge der verwendeten unabhiingigen Zufallsstichproben, Sf und S1die bereits aus Abschnitt 3.2.4 bekannten Schdtzfunktionen fur die unbekannten Varianzen af und al.

34)

Unter der Voraussetzung, daB die Nullhypothese H o :111

= 112

zutrifft.

578


Der zweiseitige Parametertest verlauft jetzt nach dem folgenden Schema:

4 Parametertests

n

579

-c

kritischer Bereich (Ablehnung)

o nicht-kritischer Bereich (Annahmebereich)

c

-J

kritischer Bereich (Ablehnung)

Bild 111-65 Zur Bestimmung des kritischen Wertes c fur die einer t-Verteilung geniigende Testvariable T


580

H o beibehalten

H o ablehnen

n

o

-c


c


--l


I

Bild 111-66 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothcse

H o : /11 = /12

Anmerkungen (1) Bei gleichem Stichprobenumfang (n 1 = n2 = n) vereinfacht sich die Formel (111-225) zur Ermittlung des Test- oder Prifwertes wie folgt: t-- =

vrn

x-y 0

Jsf + si

=

[;f;

-2--2

Sl

+ S2

0

(x - jl)

(111-227)

(2)

Dieser Differenzentest HiBt sich auch fur einseitige Fragestellungen durchfiihren. In diesem Fall gibt es nur eine kritische Grenze (vgl. Anmerkung (2)in Abschnitt 405.1).

(3)

Wird die Nullhypothese H 0: f.11 = folgenden Beziehungen: f.11

=

f.12

f.12

beibehalten (doh. nicht abgelehnt), so gelten die

und

(111-228)

Die beiden unabhangigen Stichproben stammen somit aus der gleichen Grundgesamtheit.

•

Beispiel Durch eine Stichprobenuntersuchung solI die Leistung zweier Olpumpen miteinander verglichen werden. Wir setzen dabei voraus, daB die beiden Zufallsvariablen X

= Gefiirdertes Olvolumen pro Minute bei Pumpe A

und Y = Gefiirdertes Olvatumen pro Minute bei Pumpe B

normalverteilt sind und die gleiche, aber unbekannte Varianz besitzen (a-; = ai).

4 Parametertests

581

Eine konkrete Stichprobenuntersuchung erbrachte das folgende Ergebnis:

x == 50 Lrnin,

S1

== 4,2 l/min

y == 45 l/min,

S2

== 4,8 l/min

Konnen wir aus diesen unabhdngigen Stichproben schlieBen, daB die Pumpe B weniger leistet als die Pumpe A? Urn diese Frage beantworten zu konnen, fiihren wir einen einseitigen Differenzentest durch. Wir testen dabei die Nullhypothese

n.; 111

~ 112

gegen die Alternativhypothese H 1 : 111 > 112

schrittweise wie folgt: 1. Schritt: Als Signifikanzzahl (Irrtumswahrscheinlichkeit) wahlen wir rt == 0,05. 2. Schritt: Die Testvariable Taus Gleichung (III -221) nimmt dann mit der statistischen Sicherheit y == 1 - rt== 0,95 Werte aus dem einseitigen Intervall T ~ c an (Bild 111-67): 0,95

Bild 111-67

o

c

Aus der Bedingung P(T ~

C)H o

== 1 - rt == 1 - 0,05 == 0,95

bestimmen wir mit Hilfe der Tabelle 4 im Anhang die kritische Grenze c (Anzahl der Freiheitsgrade: f == n 1 + n 2 - 2 == 10 + 12 - 2 == 20): P(T ~

C)Ho

== F(c) == 0,95

f=20 ------+)

C

==

t(0,95;20)==

1,725

Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-68): t

~

1,725

3. Schritt: Aus den bekannten Mittelwerten und Varianzen der beiden unabhangigen Stichproben berechnen wir zunachst die HilfsgrofJe S2 nach Formel (111-224): S2

2

== (n 1 -1)sf + (n 2 -1)si == (9.4,2 + 11· 4,82)~ == 2061 ~ n1

+ n2

-

2

20

min 2

'

min?


582

Daraus erhalten wir den folgenden Test- oder Priqwert fur unsere Testvariable T:

~

_[gfln2

t-

nl

+ n2

X-

Y_

.---

N0'

12 (50 - 45) Ijmin_ -2,572 22 J20,611jmin

--.

s

4. Schritt (Testentscheidung): Der aus der Stichprobenuntersuchung erhaltene Testoder Prifwert t = 2,572 fallt in den kritischen Bereich t > 1,725 (Bild 111-68). Wir miissen daher die Nu11hypothese H o : 111 ~ 112 zugunsten der Alternativhypothese H 1: 111 > 112 verwerfen und konnen somit davon ausgehen, daB (bei einer Irrtumswahrscheinlichkeit von 50/0) die Pumpe B tatsachlich weniger leistet als die Pumpe A.

o

1,725

-~


Bild 111-68 Der Testwert

i=


2,572 fallt in den kritischen Bereich, die Nullhypothese

H o : 111 ~ 112 wird daher verworfen

• 4.5.4 Tests fur die unbekannte Varianz

(12

einer Normalverteilung

Urn beispielsweise die Gleichmdfiigkeit eines Produktionsablaufes oder die Genauigkeit eines MeBinstrumentes beurteilen und bewerten zu konnen, benotigt man Kenntnisse iiber die Varianzen der entsprechenden Zufallsgrolien. Diese aber sind in der Praxis meist unbekannt. Eine in den technischen Anwendungen daher haufig auftretende Aufgabe besteht darin, mit Hilfe einer Stichprobenuntersuchung zu priifen, ob die unbekannte Varianz (J 2 einer normalverteilten Zufallsvariablen X einen bestimmten Wert (J 6 besitzt, wie man z.B. aufgrund langjahriger Erfahrungen vermutet oder infolge einer speziellen Maschinen- oder Automateneinstellung erwartet. Bei der Losung dieser Aufgabe erweist sich die Zufallsvariable S2

Z

= (n -1)-

(111-229)

(J6

als eine geeignete Test- oder Prifvariable, wobei n der Umfang der verwendeten Stichprobe Xl' X 2 , .•. , x; und S 2 die bereits aus Abschnitt 3.2.4 bekannte Schdtzfunktion fur die unbekannte Varianz (J 2 sind. Die Testvariable Z geniigt dabei der Chi-Quadrat- Verteilung mit f = n - 1 Freiheitsgraden.

4 Parametertests Der zweiseitige Parametertest verlauft dann nach dem folgenden Schema:

583


584

Bild 111-69 Zur Bestimmung der kritischen Grenzen Chi-Quadrat-Verteilung geniigende Testvariable Z

1-a

At:~~Ung (kritischer Bereich)

C1

und

C2

fiir die einer

H o beibehalten


Ablehn~;;'l (kritischer Bereich)

Bild 111-70 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : (J2 = (J~

585

4 Parametertestas Anmerkungen

(1)

Der beschriebene Test ist zugleichauch ein Test fur die (ebenfalls unbekannte) Standardabweichung (J der normalverteilten Grundgesamtheit. Der Nullhypothese H 0 : (J == (J 0 fur die Standardabweichung entspricht dabei die Nullhypothese H 0 : (J 2 == (J 6 fur die Varianz.

(2)

Analog verlaufen die einseitigen Parametertests, bei denen es jeweils nur eine kritische Grenze c gibt. Diese liifit sich aus den folgenden Bedingungen mit Hilfe von Tabelle 3 im Anhang leicht bestimmen: 1. Fall: Abgrenzung nach oben (Bild 111-71) 1-a

P(Z ::::;; C)H o == 1 -

ri

Annahmebereich: z ::::;; c

o

c Annahmebereich

a

I_

Z

Ablehnu~g-1

kritische Grenze

Bild 111-71 Annahmebereich bei einem einseitigen Test (Abgrenzung nach oben)

2. Fall: Abgrenzung nach unten (Bild 111-72)

P(Z. < C)H o ==

ri

Annahmebereich: z

~ C

a

o 1-

c

-~

AbJehnung

z

Annahmebereich

kritische Grenze

Bild 111-72 Annahmebereich bei einem einseitigen Test (Abgrenzung nach unten)

586 •

III Grundlagen der mathematischen Statistik Beispiel

Bei der Serienherstellung von Schrauben mit einer bestimmten Lange kann die Zufallsvariable

x = Lange einer Schraube als eine normalverteilte Grobe betrachtet werden. Aufgrund langjahriger Erfahrungen weiB man, daB die Standardabweichung einen Wert von (50 = 1,2 mm besitzt. Eine zu Kontrollzwecken entnommene Zufallsstichprobe vom Umfang n = 25 ergab jedoch eine empirische Standardabweichung von s = 1,5 mm. Kann diese Abweichung noch durch zufdliige Schwankungen erklart werden oder ist sie signijikant?

Liisung: Urn eine Entscheidung treffen zu konnen, ob die beobachtete Abweichung zufallsbedingt ist oder nicht, fiihren wir hier sinnvoller Weise einen einseitigen Parametertest durch und testen daher die Nullhypothese H o : (52

~

(55

= 1,44 mm?


H1 :

(52

>

(55

= 1,44 mm?

schrittweise wie folgt: 1. Schritt: Wir wahlen das Signijikanzniveau rx

= 0,01.

2. Schritt: Die Testvariable Z

S2

S2

(56

1,44 mm '

= (n -1)- = 2 4 · - - -

geniigt dann einer Chi-Quadrat-Verteilung mit j = n - 1 = 24"Freiheitsgraden. Die Berechnung der kritischen Grenze c erfolgt dabei aus der Bedingung

P(Z

~ C)H o

= 1 - rx = 1 - 0,01 = 0,99

(Bild III-73). 0,99

Bild 111-73

o

c

z

Unter Verwendung von Tabelle 3 aus dem Anhang erhalten wir:

P(Z

~ C)H o

= F(c) = 0,99

f=24

c=

Z(0,99;24)

= 43

587

4 Parametertests Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-74): z ~ 43

3. Schritt: Mit n = 25, oder Priifwert

S2

= 2,25 mm? und (J6 = 1,44 mm ' erhalten wir den Test225 mm '

S2

Z = (n - 1) - = 24· ' = 37 5 (J6 1,44 mrrr' ' furdie Testvariable Z.

z

4. Schritt (Testentscheidung): Da der Test- oder Priifwert = 37~5 in den Annahmebereich z ~. 43 fallt, kann die Nullhypothese H a: (J2 ~ (J6 = 1,44 mm ' auf der Basis der verwendeten Stichprobe nicht abgelehnt werden (Bild 111-74). Die Abweichung der Stichprobenvarianz S2 = 2,25 mrrr' vom langjahrigen Erfahrungswert (J5 = 1,44 mm ' ist daher auf dem gewahlten Signifikanzniveau a =0,01 = 1 % als zufallsbedingt zu betrachten. Die gleiche Aussage gilt dann auch fur die Standardabweichung, d.h. wir konnen davon ausgehen, daB die Standardabweichung den Wert (J = (Ja = 1,2 mm besitzt.

0,99

o

H o beibehalten

z=37,5


z

43

-l


z

Bild 111-74. Der Testwert = 37,5 fallt in den Annahmebereich, die NulIhypothese H o : (J2 ~ (J6 = 1,44 mm ' wird daher beibehalten, d.h. nicht abgelehnt

•

4.5.5 Tests fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) In einer statistischen Qualitiitskontrolle hat man es haufig mit einer binomialverteilten Grundgesamtheit zu tun, deren Parameter p jedoch unbekannt ist. Ein Musterbeispiel dafiir ist der Ausschuj3anteil p bei der Serienfabrikation von speziellen Bauelementen, d. h. also der Anteil p an fehlerhaften Teilen in der Gesamtproduktion.

588


Wird in einem konkreten Fall dabeivermutet, daB dieser Parameter einen bestimmten Wert Po besitzt (p == Po), so HiBt sich diese Hypothese durch einen geeigneten Parametertest iiberpriifen: Mantestet dann mittels einer Stichprobenuntersuchung die Nullhypothese (111-238) gegen die Alternativhypothese (111-239)

H 1 : P =F Po nach dem bereits bekannten Schema schrittweise wie fogt: (1)

Wir wahlen zunachst wieder eine bestimmte (kleine) Signifikanzzahl (Irrtumswahrscheinlichkeit) rx (0 < rx < 1).

(2)

Als Schdtzfunktion fur den unbekannten Parameter p verwenden wir die MaximumLikelihood-Schdtzfunktion

-- X p==-

(111-240)

n

die uns bereits aus den Abschnitten 3.2.5 und 3.3.2.1 vertraut ist 35). Diese Zufallsvariable ist binomialverteilt mit dem Mittel- oder Erwartungswert ECP) == Po und der Varianz Var(P) == Po(l- po)/n (immer unter der Voraussetzung, daB die Nullhypothese H o: p == Po auch zutrifft). Bei Verwendung umfangreicher Stichproben 36) folgt dann aus dem Grenzwertsatz von M oivre und Laplace, daB sich die Schdtzfunktion P anndhernd normalverteilt verhalt und zwar mit dem Mittelwert u == Po und der Varianz (J2 == Po(1 - po)/n. Die zugehorige standardisierte Zufallsvariable

P-j1 U

P-p

== - ( J - = Jpo(1 ;:Opo) =

~--

-J~' (P -

Po)

(111-241)

ist dann ndherungsweise standardnormalverteilt und erweist sich als eine geeignete Testvariable fur diesen Parametertest. (3)

35)

Der weitere Ablauf dieses zweiseitigen Tests verlauft dann wie bereits in Abschnitt 4.5.1 ausfiihrlich beschrieben.

Die Zufallsvariable X

=

Anzahl der .Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments

ist normalverteilt mit dem Mittelwert E(X) = npo und der Varianz Var(X) = nPo(1 - Po) (vgl. hierzu Kapitel II, Abschnitt 6.1). Ais .Erfolg" wird dabei das Eintreten des Ereignisses A gewertet. 36)

Faustregel: Eine Stichprobe wirdals umfangreich betrachtet, wenn die Bedingung nPo(1 - Po) > 9 erfiillt ist.

4 Parametertests

589


590

-c

o

c

--l

Bild 111-75




u

Ho beibehalten

1-a

Ho ablehnen

a/2

-c

I I I

:;blehnUng (kritischer Bereich)


c

u

.:


Bild 111-76

4 Parametertests

591

Anmerkungen (1) Man beachte, daB dieser Parametertest nur fur umfangreiche Stichproben gilt, d.h. fur solche, die der Bedingung npo(1 - Po) > 9 genugen, Bei kleinem Stichprobenumfang ist diese Bedingung jedoch nicht erfiillt und das angegebene Priifverfahren daher nicht anwendbar. Wir miissen in diesem .Fall auf die Spezialliteratur verweisen (siehe Literaturverzeichnis). (2)

Analog verlaufen die einseitigen Parametertests. In diesen Fallen gibt es jeweils nur eine kritische Grenze c. Die naheren Einzelheiten sind in Abschnitt 4.5.1, Anmerkung (2) bereits ausfiihrlich beschrieben. Sie gelten sinngemiijJ auch fur diesen Parametertest.

•

Beispiel Der Hersteller eines bestimmten elektronischen Bauelements behauptet, daB seine Produktion hiichstens 4% AusschuB enthalte. Bei der Anlieferung eines gr6Beren Postens dieser Elemente wurde von Seiten des Abnehmers ein Giitekontrolle durchgefiihrt. Sie bestand in diesem Fall in einer Stichprobenuntersuchung von n = 300 Bauelementen. Unter ihnen befanden sich dabei k = 15 funktionsuntiichtige (d.h, defekte) Teile. Man iiberprufe die Angaben des Herstellers auf einem Signifikanzniveau von a = 0,01.

Liisung: Da in diesem Fall nur die Abweichungen nach oben interessieren 37\ wenden wir hier ein einseitiges Priifverfahren an und testen die N ullhypothese H o: p

~

Po = 0,04


H 1 : P > Po = 0,04 Die Voraussetzung einer umfangreichen Stichprobe ist dabei gegeben, da die Bedingung (111-242) erfidlt ist:

nPo(1 - Po) = 300· 0,04' 0,96 = 11,52 > 9 1. Schritt: Die Signifikanzzahl (Irrtumswahrscheinlichkeit) ist vorgegeben: a

= 0,01.

2. Schritt: Wir berechnen die kritische Grenze c der standardnormalverteilten Testvariablen

U

;;;-

~

= ~ ~. (P -

Po)

=

°, °,

300 ~ ~ 04 . 96 . (P - 0,04) = 88,388 (P - 0,04)

aus der Bedingung P(U ~ C)H o = 1 - a = 1 - 0,01 = 0,99

(Bild 111-77). 37)

Gegen einen AusschuBanteil unterhalb von 4% hat keineretwas einzuwenden!

III Grundlagen der mathematischen .Statistik

592

Bild 111-77

o

u

c

Unter Verwendung von Tabelle 2 im Anhang erhalten wir dann fur die unbekannte Schranke eden folgenden Wert: P(U ~

C)H

o

= ¢(c) = 0,99

-+

c=

U O,99

= 2,326

Der nicht-kritische Bereich (Annahmebereich) lautet damit(Bild 111-78): U ~

2,326

3. Schritt: Der Schdtzwert fur den unbekannten Parameter (Anteilswert) P betragt k 15 P = ;; = 300 = 0,05 A

Somit besitzt die Testvariable U den Test- oder Priifwert

11 = 88,388 (p - 0,04) = 88,388 (0,05 - 0,04) = 0,884 4. Schritt (Testentscheidung): Der Test- oder Prifwert 11 = 0,884 fallt in den Annahmebereich U ~ 2,326 (Bild III-78).· Die Nullhypothese H 0 : P .~ Po = 0,04 wird daher beibehalten, d.h. es gibt aufgrund der verwendeten Stichprobe keinen AnlaB, an den Angaben des Herstellers beziiglich eines maximalen AusschuBanteils von 40/0 zu zweifeln. Die Abweichung des aus der Stichprobe ermittelten Anteils p = 0,05 = 5% von dem vom Hersteller angegebenen Anteilswert Po = 0,04 = 40/0 ist bei dem gewahlten Signifikanzniveau von rJ, = 0,01 = 1 % nicht signifikant und somit zufallsbedingt.

Bild 111-78


2,326

u

-~

Ablehnung . (kritischer Bereich)

•

4 Parametertests

593

4.6 Ein Anwendungsbeispiel: Statistische Qualitatskontrolle unter Verwendung von Kontrollkarten Bei der Herstellung von M assenprodukten miissen fur bestimmte Grofien vorgegebene Sollwerte innerhalb gewisser Toleranzen eingehalten werden. Wir nennen einige einfache Beispiele: _

Beispiele

(1)

Bei der Serienproduktion von Kondensatoren wird fur die Kapazitdt ein bestimmter Sollwert flo vorgeschrieben.

(2)

M etallstdbe aus einer bestimmten Legierung sollen eine bestimmte Zugfestigkeit flo aufweisen, die nicht unterschritten werden darf.

(3)

Bei der Serienfertigung von Wellen wird fur den Durchmesser die Einhaltung eines bestimmten Sollwertes flo gefordert. -

Die Erfahrung lehrt jedoch, daB auch bei sorgfdltigster Fertigung und Verwendung hochwertiger Materialien stets Abweichungen vom vorgeschriebenen Sol1wert auftreten, die im wesentlichen durch -

lnhomogenitdten des verwendeten Materials, Abnutzungs- und Verschleij3erscheinungen bei den produzierenden Maschinen

-

und Automaten, und nicht zuletzt auch durch menschliche Unzuldnglichkeiten

bedingt sind. Urn die Qualitat des erzeugten Produktes zu sichern, ist es daher notwendig, die Produktion zu iiberwachen, urn gegebenenfalls regulierend eingreifen zu konnen. Unter statistischer Qualitdtskontrolle versteht man die permanente Uberwachung eines Produktionsprozesses mit Hilfe spezieller statistischer Methoden. Die Qualitatskontrolle dient somit der Einhaltung bestimmter vorgegebener Sollwerte oder Normen, wobei durch einen rechtzeitigen Eingriff in den FertigungsprozeB AusschuBware weitgehend vermieden oder zumindest auf ein Minimum beschrankt werden kann. Wir wollen uns jetzt mit einer typischen Aufgabe der statistischen Qualitatskontrolle naher auseinandersetzen: Bei der Herstellung eines Massenartikels solI fur den M ittelwert fl des dabei interessierenden Merkmals X ein bestimmter Sollwert flo eingehalten werden und zwar wahrend des gesamten Fertigungsprozesses 38). Mit Hilfe der statistischen Qualitatskontrolle sind wir dann in der Lage, diese Forderung zu erfiillen. Wir gehen dabei zunachst von der Annahme (Nullhypothese) aus, daB diese Forderung erfidtt ist, d.h. daB der Sollwert flo wahrend der gesamten Produktion tatsachlich eingehalten wird.

38)

Die Grolic X kann beispielsweise die Kapazitdt eines in Massen produzierten Kondensators sein. Es wird dann z. B. gefordert, daB die normalverteilte Zufallsvariable X

=

Kapazitdt eines Kondensators

wahrend der gesamten Produktion den konstanten Mittelwert J1

= J10

besitzt.

594


Unsere Nullhypothese lautet daher: H o: /l

(III-250)

= /lo

Wir testen sie dann gegen die Alternativhypothese (111-251)

H 1 : /l i= /lo

auf dem allgemein iiblichen Signifikanzniveau a = 0,01 = 1 % schrittweise wie folgt 39): (1)

Stichprobenentnahme aus der laufenden Produktion in regelmalligen Zeitabstanden In regelmdjiigen Zeitabstiinden (z.B. jede Stunde) wird der laufenden Produktion eine Zufallsstichprobe vom gleichbleibenden Umfang n entnommen und der jeweilige Stichprobenmittelwert x bestimmt.

(2)

Bestimmung des Toleranzbereiches Urn die ermittelten Stichprobenmittelwerte in sinnvoller Weise mit dem vorgegebenen Sollwert /lo vergleichen zu konnen, benotigen wir den zum Signifikanzniveau a = 0,01 = 1% gehorenden nicht-kritischen Bereich (Annahmebereich), der in" diesem Zusammenhang als Toleranzbereich bezeichnet wird. Bei einer normalverteilten Zufallsvariablen X ist dieser Bereich - wie wir etwas spater noch zeigen werden durch das symmetrische Intervall /lo - 2,576 . -

a

j;;

~

_ x ~ /lo

+ 2,576 . -

a

(111-252)

j;;

gegeben. Die kritischen Grenzen cu =

IJ

r

a o - 2, 576 . -j;;

und

Co

= /lo

+ 2,576 . -

a

j;;

(111-253)

heiI3en hier Toleranz- oder Kontrollgrenzen (Bild III -79). Dabei ist (J die als bekannt vorausgesetzte Standardabweichung der normalverteilten Grundgesamtheit und n der Umfang der entnommenen Stichprobe "?', Zur Herleitung des Toleranzbereiches

Der Toleranzbereich ist nichts anderes als der zum Signifikanzniveau a = 0,01 gehorige nicht-kritische Bereich der Zufallsgrofie X. Somit gilt (vgl. hierzu Bild 111-79): Pte; ~ X ~

CO)H o =

P(/lo - c* ~ X ~ /lo

+ C*)H o =

= 1 - a = 1 - 0,01 = 0,99

(111-254)

(c* ist der kritische Wert). 39)

Es handelt sich hier im wesentlichen urn den in Abschnitt 4.5.1 besprochenen zweiseitigen Test fur den Mittelwert f.1 einer Normalverteilung.

40)

Ist (J jedoch unbekannt, so kann man mit Hilfe einer sag. Vorlaufstichprobe einen Schdtzwert fur (J ermitteln. Man ersetzt dabei (J ndherungsweise durch die Standardabweichung s dieser Vorlaufstichprobe: (J ;:::::: s.

595

4 Parametertests

f;t~cher

kritische~I

Toleranzbereich (nicht-kritischer Bereich)

I;;~reich

Bereich r

Bild 111-79 Toleranzbereich bei der statistischen Qualitatskontrolle

Beim Ubergang von der normalverteilten Zufallsvariablen X zur standardisierten (und somit standardnormalverteilten) Zufallsvariablen X-II U= _ _r'_o

(111-255)

(J/~ geht die Gleichung (111-254) iiber in P( - c ~ U ~ C)H o = 0,99

(111-256)

wobei wir bereits die Abkiirzung

~

c=c*-

(J

bzw.

(111-257)

c*=c-

0z

(J

verwendet haben (Bild III -80).

-c

o

C

u

Bild 111-80 Bestimmung des kritischen Wertes c fur die standardnormalverteilte Zufallsvariable U

596

III Grundlagen der mathematischen Statistik Mit Hilfe von Tabelle 2 im Anhang erhalten wir aus dieser Beziehung schlieBlich den folgenden Wert fiir die gesuchte Konstante e: P(-e

~

U

~

e)H o = ep(e) - ep(-e) == ep(e) - [1 - ep(e)] ==

== 2 . ep (e) - 1 == 0,99 ~

ep(e) == 0,995

Ein Stiehprobenmittelwert gung )10 -

2,576 . -

a

~

~

e ==

U O,995

== 2,576

x fallt damit in den

_ x ~

(111-258) (111-259)

Toleranzbereieh, wenn er die Bedin-

a

)10

+ 2,576 . ~

(III-260)

erfiillt. (3)

Vergleich des Stichprobeomittelwertes .i mit dem Sollwert Entscheidungsflndung

uod

}to

Wir sind jetzt in der Lage, die Qualitat der laufenden Produktion zu beurteilen und eine Entseheidung dariiberzu fallen, ob der geforderte Sollwert u., auch eingehalten wird oder ob nieht tolerierbare Abweichungen auftreten.

1. Fall: Fallt der Stichprobenmittelwert x einer entnommenen Stichprobe in den nieht-kritisehen Bereich, d.h. in den Toleranzbereieh, so wird die Abweichung vom Sollwert )10 als zufallsbedingt angesehen und toleriert. Es besteht daher in diesem Fall kein Grund, in den laufenden FertigungsprozeB einzugreifen (Bild 111-81). Produktion unterbrechen, Fehlersuche einleiten 0,99

Produktion weiterlaufen lassen

x

j-;ritiSCher I ~ereich

-

x Toleranzbereich (nicht-kritischer Bereich)

x

kritisch:; Bereich

l

Bild 111-81 Fallt der Stichprobenmittelwert in den Toleranzbereich, so laBt man die Produktion weiterlaufen, anderenfalls wird diese unterbrochen und die Fehlersuche eingeleitet

4 Parametertests

597

2. Fall: Liegt der Mittelwert X der Stichprobe jedoch im kritischen Bereich (d.h. aujJerhalb des Toleranzbereiches), so kann die beobachtete Abweichung zum Sollwert J10 nicht mehr aus der Zufalligkeit der Stichprobe erklart werden, sondern muB als signifikant angesehen werden (Bild 111-81). Die Produktion wird in diesem Fall unterbrochen, man geht auf Fehlersuche und behebt schlieBlich die gefundenen Fehler (z.B. durch Neueinstellung der Maschinen und Automaten usw.). (4)

Kontrollkarten Der Verlauf eines Fertigungsprozesses HiBt sich in sehr anschaulicher Weise auf einer sog. Kontrollkarte wie folgt darstellen (Bild III -82):

Produktionsstop, Fehlersuche einleiten

obere Kontrol/grenze

Co

obere Warngrenze w 0

- - - Sol/wert /10

untere Warngrenze

Wu

untere Kontrol/grenze

I

I

23456

I

I

I

I

7

8

Cu

Ifd. Nr. der Stichprobe

Bild 111-82 Muster einer Kontrollkarte mit Kontroll- und Warngrenzen

Die in regelmdfiigen Zeitabstanden ermittelten Stichprobenmittelwertex werden dabei in der zeitlichen Reihenfolge der Stichprobenentnahme als Punkte in die Kontrollkarte eingetragen. Dann wird der Istzustand (Stichprobenmittelwert x) mit dem Sollzustand (Sollwert J1o) verglichen. Liegt ein Wert aujJerhalb des Toleranzbereiches (grau unterlegte Flache in Bild III -82), so wird die laufende Produktion zunachst gestoppt und die Fehlersuche eingeleitet. 1m Bild ist dies der Fall bei der Stichprobe Nr. 8. Zur zusdtzlichen Sicherheit werden haufig noch die sog. Warngrenzen eingezeichnet, die einem Signifikanzniveau von C/.. == 0,05 == 5% entsprechen. Sie liegen bei (J

w == u

1/

r«

-

1,960 . -J-;"

und

wo == J10

+ 1,960 . -

(J

J-;"

(111-261)

598


Fallt dabei ein Stichprobenmittelwert X in den dunkelgrau dargestellten Bereich zwischen Warn- und Kontrollgrenzen (im Bild gilt dies fur die Stichproben Nr. 4 und Nr. 6), so wird sicherheitshalber eine weitere Stichprobe entnommen (Wiederholung des Tests und gegebenenfalls Abbruch der Produktion und Fehlersuche).

5 Statistische Prufverfahrcn fur die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung (, Anpassungs- oder Verteilungstests ") 5.1 Aufgaben eines Anpassungs- oder Verteilungstests Mit den in Abschnitt 4 behandelten Parametertests lassen sichAnnahmen oder Hypothesen iiber unbekannte Parameter einer Grundgesamtheit iiberprufen, wobei die Art bzw. der Typ der Wahrscheinlichkeitsverteilung als bekannt vorausgesetzt wird. So haben wir z.B. spezielle Tests fur den Mittelwert /lund die Varianz (52 einer normalverteilten Grundgesamtheit kennengelernt. Ein Anpassungs- oder Verteilungstest dagegen dientder Uberprufung einer Hypothese iiber die Art der unbekannten Wahrscheinlichkeitsverteilung. Es wird somit der Versuch unternommen, einer Grundgesamtheit mit einer unbekannten Verteilungsfunktion F(x) eine bekannte Verteilungsfunktion Fo(x) "anzupassen". Die Nullhypothese H o lautet daher wie folgt: (111-262)

(, Die Zufallsvariable X geniigt einer Wahrscheinlichkeitsverteilung mit der Verteilungsfunktion E, (x)"). Ihr stellen wir alternativ die Hypothese (111-263)

gegeniiber. Sie besagt, daB Fo (x) nicht die gesuchte Verteilungsfunktion der ZufallsvariabIen X ist. Die Uberprufung einer solchen Hypothese iiber die Art der Verteilungsfunktion erfoIgt dann mit einem speziellen Anpassungs- oder Verteilungstest unter Verwendung einer ZuJallsstichprobe, die man der betreffenden Grundgesamtheit entnommen hat. Gepriift wird dabei, ob die aus der Stichprobe gewonnenen Informationen uber die unbekannte Verteilungsfunktion F (x) mit der angenommenen, d. h. theoretischen Verteilungsfunktion Fo(x) vertriiglicn sind. Verglichen wird dabei die beobachtete Verteilung der Zufallsgr6Be X in der entnommenen Stichprobe mit der theoretisch zu erwartenden Verteilung auf-

5 Anpassungs- oder Verteilungstests

599

grund der N ullhypothese H o- Der Anpassungs- oder Verteilungstest ermoglicht dann eine Entscheidung dariiber, ob man die Nullhypothese H 0: F (x) = Fo(x) beibehalten kann oder zugunsten der Alternativhypothese H 1 : 'F (x) =I=- Fo(x) verwerfen muB. Wir fassen zusammen:

5.2 Ein einfiihrendes Beispiel Beim Zufallsexperiment " Wiafeln mit einem homogenen Wiafel" erwarten wir, daB jede der sechs moglichen Augenzahlen 1,2, ... ,6 mit der gleichen Wahrscheinlichkeit auftritt: (i

= 1, 2, ... , 6)

(111-265)

(Pi: Wahrscheinlichkeit dafiir, bei einem Wurf die Augenzahl "i" zu erzielen). Somit lautet unsere Erwartung bei 120 Wiirfen wie folgt: Jede der sechs Augenzahlen tritt genau 20-mal auf Diese absoluten Haufigkeiten (i = 1, 2, ... , 6)

(111-266)

sind die theoretisch zu erwartenden Werte. Sie beruhen auf der Annahme, daB die Zufallsvariable X = Erreichte Augenzahl beim Wurf mit einem homogenen Wiafe!

tatsachlich einer Gleichverteilung geniigt, d.h. auf der Nullhypothese H o, daB alle Augenzahlen mit der gleichen Wahrscheinlichkeit auftreten.

600


In einem konkreten Fall (einer Zufallsstichprobe) ergab sich bei insgesamt 120 ausgefiihrten Wiirfen die folgende (empirische) Hdufigkeiisverteilung:

15

20

-5

2

19

20

-1

3

22

20

2

4

21

20

5

17

20

-3

6

26

20

6

Ein Vergleich zwischen den beobachteten und den theoretisch erwarteten Haufigkeiten zeigt zum Teil erhebliche Abweichungen, die auch in den zugehorigen Stabdiagrammen deutlich zum Ausdruck kommen (Bild 111-83):

30

30

20

20

10

~

10

23456 a)

-1

2

3

4

5

6

b)

Bild111-83 Haufigkeitswerte fur die "Augenzahl" beim Wurf mit einem Wiirfel a) Beobachtete Verteilung b) Theoretisch "erwartete" Verteilung

Wir stehen daher vor dem folgenden Problem: Ist die beobachtete H dufigkeitsverteilung im Widerspruch zur theoretisch erwarteten Gleichverteilung oder sind die festgestellten Abweichungen rein zufallsbedingt?


601

Mit anderen Worten: 1st die entnommene Stichprobe vom Umfang n == 120 in Einklang zu bringen mit der Annahme (Nullhypothese) (i == 1, 2, ... , 6)

(111-267)

oder widerspricht sie dieser Annahme? LaBt sich also diese Hypothese iiber die Gleichverteilung der moglichen Augenzahlen vertreten oder miissen wir sie aufgrund der Stichprobenuntersuchung zuruckweisen'l Wir mochten also eine spezielle Annahme (Nullhypothese) iiber die Art der Wahrscheinlichkeitsverteilung einer Grundgesamtheit uberprufenund dabei auf der Grundlage einer Zufallsstichprobe, die dieser Grundgesamtheit entnommen wurde, eine Entscheidung uber Beibehaltung oder Ablehnung der Nullhypothese fallen. 1m nachsten Abschnitt behandeln wir daher zunachst das wohl wichtigste Priifverfahren fiir die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung, namlich den 2 sog. Chi-Quadrat- Test (" X -Test "), und kommen im AnschluB daran nochmals auf dieses einfiihrende Beispiel ausfuhrlich zuriick,

5.3 Chi-Quadrat-Test (" l2 -Test") Wir behandeln in diesem Abschnitt den wohl bekanntesten und wichtigsten Anpassungs2 oder Verteilungstest, den sog. Chi-Quadrat- Test ("X - Test"). Er beruht auf einem Vergleich der aus einer Zufallsstichprobe Xl' X 2, •.• , x; gewonnenen empirischen Haufigkeitsverteilung mit der theoretisch erwarteten Verteilung, die man aus der als wahr angenommenen Verteilungsfunktion Fo(x) der Grundgesamtheit, aus der die Stichprobe stammt, berechnet hat. Wir testen dabei die Nullhypothese

u.; F(x) == Fo(x)

(111-268)

gegen die Alternativhypothese (111-269)

Planung und Durchfiihrung des Chi-Quadrat-Tests verlaufen dann schrittweise wie folgt: (1)

Unterteilung der Stichprobe in Klassen, Feststellung der absoluten Klassenhaufigkeiten (Besetzungszahlen) Die n Stichprobenwerte Xl' x 2 , ••• , X n werden in k Klassen (Intervalle) 1 1 , 12 , ••• , I k unterteilt (k < n). J ede Klasse sollte dabei erfahrungsgemaf mindestens 5 Stichprobenwerte enthalten. Dann werden die absoluten Klassenhdufigkeiten .(Besetzungszahlen) n l , n 2 , ••• , nk festgestellt, wobei (111-270) gilt (Spalten 1 und 2 in der nachfolgenden Tabelle 3).


602 (2)

Berechnung der theoretisch erwarteten absoluten Klassenhaufigkeiten

Aus der als wahr angenommenen Verteilungsfunktion Fo(x) berechnet man zunachst fur jede Klasse I, die zugehorige Klassenwahrscheinlichkeit Pi 41) und daraus die hypothetische, d. h. theoretisch zu erwartende Anzahl ni = nPi der Stichprobenwerte in I, (Spalten 3 und 4 in Tabelle 3). Tabelle 3: Chi-Quadrat-Test

2

(3)

n1

P1

ni = n p;

n 1 - ni

(n1 - ni)2 n*1

n2

P2

nI = nP2

n2 - nI

(n2 - nI)2 n*2

Festlegung eines geeigneten Ma8es fur die Abweichung zwischen der beobachteten und der theoretischen Verteilung

Ein geeignetes MajJ fur die Abweichung zwischen empirischer und hypothetischer Verteilung ist nach Pearson die MaBzahl

(111-271)

Sie wird gebildet, indem man zunachst klassenweise die Differenz Sn, = n, - ni zwischen der beobachteten und der theoretisch erwarteten absoluten Klassenhaufigkeit feststellt (Spalte 5), diese Differenz quadriert und durch die hypothetische Klassenhaufigkeit ni dividiert (Spalte 6) und dann anschlieBend die Beitrage aller Klassen aufaddiert (Summenwert der Spalte 6). Bei einer "guten" Ubereinstimmung zwischen den empirischen und den hypothetischen Werten erwarten wir kleine Abweichungsquadrate (~ni)2 und somit auch einen kleinen Wert fur das Abweichungsmafi X2 • 41)

Pi ist die Wahrscheinlichkeit dafiir, daB ein Stichprobenwert in die i-te Klasse fallt (immer unter der Voraussetzung, daB Fo (x) die wahre Verteilungsfunktion ist).

5 Anpassungs- oder Verteilungstests Die MaBzahl Z

X2

603

ist dabei ein spezieller Wert der Testvariablen oder PrufgrojJe k

*2

k

2

= X2 = \' (~-*ni) = \' (~- nPi) L n; L npi i

=1

i

(III-272)

=1

den diese Variable fur die vorgegebene konkrete Stichprobe annimmt. Dabei bedeutet N, die wie folgt definierte Zufallsvariable:

N, == Beobachtete Anzahl der Stichprobenwerte in der i-ten Klasse (empirische absolute Klassenhdufigkeiti

Die Testvariable Z == X2 geniigt fur grojJes n, d. h. bei Verwendung umfangreicher Stichproben (Faustregel: n > 50) ndherungsweise einer Chi-Quadrat- Verteilung mit f == k - 1 Freiheitsgraden, wenn alleParameter in der als wahr angenommenen Verteilungsfunktion Fo(x) bekannt sind 42). (4)

Wahl einer Signifikanzzahl ~ und Berechnung der kritischen Grenze c Wir wahlen jetzt eine kleine Signifikanzzahl a (in der Praxis meist a == 0,05 == 5 % oder a == 0,01 == 1 0;0) und bestimmen dann eine kritische Grenze c so, daB die Werte der Testvariablen Z == X2 mit der Wahrscheinlichkeit 'Y == 1 - a unterhalb dieser kritischen Grenze liegen. Somit gilt: P(Z ~ C)H o

== 'Y == 1 - a

(111-273)

(hellgrau unterlegte Flache in Bild III-84). 1-a

o

c

z


Bild 111-84 Zur Bestimmung der kritischen Grenze c fur die einer Chi-Quadrat-Verteilung 2 geniigende Testvariable Z = X

°

Die kritische Grenze c teilt dabei das Intervall z == X2 ~ in einen nicht-kritischen und einen kritischen Bereich und laBt sich mit Hilfe der Tabelle 3 im Anhang (Tabelle der Quantile der Chi-Quadrat- Verteilung) leicht bestimmen. 42)

Siehe hierzu Anmerkung (1) im AnschluB an die Zusammenfassung.

604 (5)


z

Berechnung des Test- oder Priifwertes = X2 und Testentscheidung Liegt der aus der Stichprobe berechnete Test- oder Priifwert = X2 der TestvariabIen Z = X2 unterhalb der kritischen Grenze c, d. h. gilt = X2 ~ C, so wird die Nullhypothese H o: F(x) = Fo(x) beibehalten, anderenfalls zugunsten der Alternativhypothese HI: F (x) i= Fo(x) abgelehnt (Bild 111-85). Die gewahlte Signifikanzzahl r:l ist dabei die Irrtumswahrscheinlichkeit, d. h. die Wahrscheinlichkeit dafiir, eine an sich richtige Nullhypothese H 0 abzulehnen (Fehler 1. Art).

z

z

H o beibehalten

o

A

Z


A

C

z

Z

-l


Bild 111-85 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : F(x) = Fo(x)

Wir fassen die einzelnen Schritte dieses wichtigen Chi-Quadrat- Tests wie folgt zusammen:

43)

Die Nullhypothese besagt: Fo(x) ist die wahre Verteilungsfunktion der Grundgesamtheit, aus der die Zufallsstichprobe Xl' x 2 , ••• , X n entnommen wurde.


44)

Gegebenenfalls miissen nachtraglich Klassen zusammengelegt werden.

605

606


Anmerkungen

(1)

Sind ein oder mehrere Parameter der als wahr angenommenen Verteilungsfunktion Fo(x) unbekannt, so muf man zunachst fur diese Parameter unter Verwendung der vorgegebenen konkreten Stichprobe Niiherungs- oder Schiitzwerte bestimmen (z.B. mit Hilfe der Maximum-Likelihood-Methode). Die Anzahl der Freiheitsgrade vermindert sich dabei urn die Anzahl der zu schdtzenden Parameter. Beispiel: Sind bei angenommener N ormalverteilung N (/1; a) sowohl /1 als auch a unbekannt und daher aus der Stichprobe mit Hilfe von Schatzfunktionen zu schiitzen, so ist die Anzahl der Freiheitsgrade gleich f == (k - 1) - 2 == k - 3. Allgemein gilt: f==(k-1)-r

(111-282)

r: Anzahl der unbekannten Parameter in der angenommenen Verteilungsfunktion Fo (x), die noch aus der Stichprobe geschiitzt werden miissen

(2)

Bei einer diskreten Zufallsvariablen X sind die Klassen die moglichen Werte selbst (siehe hierzu das nachfolgende Beispiel (1)).

607

5 Anpassungs- oder Verteilungstests •

Beispiele

(1)

Wir kommen auf das einfiihrende Beispiel aus Abschnitt 5.2 zunick. Bei n = 120 Wiirfen mit einem homogenen Wurfel erhielten wir das folgende Ergebnis (Hiiufigkeitsverteilung der 6 moglichen Augenzahlen): Augenzahl i

1

2

3

4

5

6

absolute Haufigkeit n,

15

19

22

21

17

26

Mit Hilfe des Chi-Quadrat- Tests solI jetzt gepriift werden, ob die Nullhypothese H 0: Alle 6 miiglichen Augenzahlen sind gleichwahrscheinlich

aufrecht erhalten werden kann oder ob man diese Annahme verwerfen muB. Mit anderen Worten: Wir wollen mit dem Chi-Quadrat-Test priifen, ob es sich bei unserem Wiirfelexperiment (wie vermutet) urn ein Laplace-Experiment handelt oder nicht. Wir Iosen diese Aufgabe nun schrittweise wie folgt: 1. Schritt: Wir haben k = 6 Klassen. Sie entsprechen den 6 Augenzahlen (Spaltel in der folgenden Tabelle). Die beobachteten absoluten H dufigkeiten n, bilden die 2. Spalte. 2. Schritt: Nach unserer Annahme (Nullhypothese H o) sind alle Augenzahlen gleichwahrscheinlich. Somit ist Pi = 1/6 (i = 1, 2, ... ,6; Spalte 3). Durch Multiplikation mit n = 120 erhalten wir daraus die Anzahl ni der theoretisch erwarteten Stichprobenwerte (Spalte 4):

»r = l

1 np·t = 120 . -6 = 20

(i = 1, 2, ... , 6)

1

15

1/6

20

-5

25/20

2

19

1/6

20

-1

1/20

3

22

1/6

20

2

4/20

4

21

1/6

20

5

17

1/6

20

-3

9/20

6

26

1/6

20

6

36/20

1/20


608

3. Schritt: Wir bilden jetzt die Difjerenzen Sn, == n, - ni (Spalte 5) und daraus die "AbweichungsmaBe" (Ani? (Spalte 6). Durch Summation der n~ l-

letzten Spalte erhalten wir den gesuchten Test- oder Prifwert unserer Testva2 riablen Z == X : 6

z== x2 ==

I

6

tn, - ni)2

L

ni

i = 1

2

~ (~nJ == 76 == 3 8

----

ni

20

'

i= 1

4. Schritt: Als Signifikanzzahl (Irrtumswahrscheinlichkeit) wahlen wir a == 0,05. Die Berechnung der kritischen Grenze c erfolgt dann aus der Bedingung P(Z ~

C)H

o

== P(X 2 ~

C)H

o

== 1 - a == 1 - 0,05 == 0,95

mit Hilfe von Tabelle 3 im f == k - 1 == 6 - 1 == 5): P(Z -~ c)H o

== F (c) == 0,95

Anhang f=5

(Anzahl c ==

der

Z(O,95; 5)

Freiheitsgrade:

== 11,07

Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-86): z==X2~11,07

z

5. Schritt (Testentscheidung): Der Test- oder Priifwert == X2 == 3,8 fallt in den Annahmebereich, d.h. es gilt == X2 ~ 11,07 (Bild 111-86). Die Nullhypothese H ° wird somit beibehalten, d.h. wir konnen sie aufgrund der verwendeten Stichprobe nicht ablehnen. Es gibt.somit keinen AnlaB, an der Gleichverteilung der Augenzahlen zu zweifeln. Es handelt sich also bei unserem Wiirfelexperiment (wie vermutet) urn ein Laplace-Experiment.

z

Ho beibehalten


z

-l


Bild 111-86 Der Testwert = 3,8 fallt in den Annahmebereich, die Nu11hypothese H o : "Beim Wurf mit einem Wiirfel handelt es sich urn ein Laplace-Experiment" wird daher beibehalten, d. h. nicht abgelehnt

5 Anpassungs- oder Verteilungstests (2)

609

Eine Stichprobenuntersuchung von n = 100 ohms chen Widerstanden aus einer Serienproduktion ergab die folgende H dufigkeitsverteilung, wobei die MeBwerte bereits in k = 6 Klassen mit der Klassenbreite ~x = 1 Q und den angegebenen Klassenmitten Xi eingeteilt wurden:

Q

48,5

49,5

50,5

51,5

52,5

53,5

5

11

35

29

13

7

Wir vermuten, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, deren Mittelwert u und Varianz (J 2 jedoch beide unbekannt sind. Daher testen wir diese Nullhypothese mit Hilfe des Chi-Quadrat- Tests schrittweise wie folgt: 1. Schritt: Die Stichprobenwerte sind bereits in k = 6 Klassen aufgeteilt, die beobachteten absoluten Hdufigkeiten n, sind bekannt. Jede Klasse enthalt dabei (wie gefordert)mindestens 5 Werte. 2. Schritt: Die Parameter der Verteilungsfunktion

Fo(x) = c/J (

X -

Jl und

(J

der angenommenen Normalverteilung mit

Jl)

-(J-

sind unbekannt und miissen daher zunachst aus der vorliegenden Stichprobe mit Hilfe der bereits aus den Abschnitten 3.2.3 und 3.2.4 bekannten Schatzfunktionen und der nachfolgenden Tabelle geschdtzt werden:

48,5

5

242,5

-2,55

32,5125

2

49,5

11

544,5

-1,55

26,4275

3

50,5

35

1767,5

-0,55

10,5875

4

51,5

29

1493,5

0,45

5,8725

5

52,5

13

682,5

1,45

27,3325

6

53,5

7

374,5

2,45

42,0175


610

I n.x,6

_ 1 Mittelwert: x = - .. 100

l

= -

1

100

l

. 5105 = 51 05

(in Q)

'

i= 1

Varianz:

8

2

1

1

I

6

= 99 .

ni(X i - X)2 = 99 . 144,75 = 1,4621

i= 1

Standardabweichung:

s = R = Jl,4621 = 1,2092

(in Q)

/l

Damit ergeben sich fur den Mittelwert und die Standardabweichung a der als normalverteilt angenommenen Grundgesamtheit die folgenden Schdtzwerte:

/l ~X = 51,05

~

a

und

s = 1,209

(beide Werte in Q). Mit der (angenommenen) Verteilungsfunktion

Fo(x)

=

¢(x a

/l) =

¢(x - 51,05) 1,209

berechnen wir jetzt unter Verwendung von Tabelle 1 aus dem Anhang die Wahrscheinlichkeii Pi dafiir, daB ein Wert in die i-te Klasse fallt und daraus schlieBlich die Anzahl ni = n p, = 100 Pi der theoretisch in der i-ten Klasse zu erwartenden Stichprobenwerte (i = 1,2, ... ,6). Weil X hier eine stetige Zufallsvariable ist, miissen wir bei der Berechnung von Pi die folgenden Klassengrenzen beriicksichtigen (Bild 111-87):

1.Klasse

2.Klasse

3.Klasse

-oo<X 20cm 3 .

An 40 Testfahrzeugen eines neuen Autotyps wurde der Benzinverbrauch X in Liter pro 100 km Fahr1eistung bestimmt, Die Urliste hatte dabei das fo1gende Aussehen (alle Werte in 1/100 km): 10,1 10,4 10,2 10,8 9,0 a) b)

10,6 10,1 10,5 9,9 10,0

10,9 10,8 9,4 10,5 10,5

10,0 9,2 10,2 10,6 10,4'

10,4 10,2 9,6 9,8 11,4

10,5 10,3 10,2 10,7 10,4

9,7 10,5 9,7 11,2 10,1

10,5 9,2 10,2 10,8 10,4

Gruppieren Sie diese Daten in 5 Klassen der Breite 0,5 und ermitte1n Sie die H dufigkeitsfunktion. Zeichnen Sie das zugehorige Histogramm.


636

Zu Abschnitt 2 1) 2)

Die Ubungsaufgaben 1) bis 7) in Abschnitt 1 beschaftigen sich mit den Haufigkeitsverteilungen von Stichproben. Bestimmen Sie die jeweiligen M ittelwerte, Standardabweichungen und Varianzen.

7)

8)

Xl' X 2, .•. , X n

sei eine beliebige Stichprobe. Zeigen Sie: Die Funktion n

S(c) =

L

(Xi - c)2

i= 1

nimmt fur c = Stichprobe).

x ihren

kleinsten Wert an

(x

ist der arithmetische M ittelwert der

Zu Abschnitt 3 1)

Die Lebensdauer T zahlreicher elektronischer und mechanischer Bauelemente HiBt sich in guter Naherung durch eine Exponentialverteilung mit der normierten Dichtefunktion fur

t ~

0

beschreiben (fur t < 0 verschwindet diese Funktion). Bestimmen Sie nach der Maximum-Likelihood-Methode einen Schdtzwert fur den unbekannten Parameter A > 0 unter Verwendung einer vorgegebenen Stichprobe t l , t 2 , · .• , t.; 2)

Die Lebensdauer T von Gliihlampen kann in guter Naherung als exponentialverteilt angesehen werden. Schdtzen Sie anhand der folgenden konkreten Stichprobe den unbekannten Parameter A der Verteilung:

i

1

2

3

4

5

6

7

8

t. h

250

210

400

320

190

210

240

292

--.!.

3)

Die Zufallsvariable X beschreibe die Anzahl der Gesprache, die von einer Telefonzentrale zu einer bestimmten Tageszeit pro Stunde vermittelt werden. X kann dabei als eine naherungsweise Poisson-verteilte Zufallsvariable betrachtet werden. Bestimmen Sie den unbekannten Parameter f.l dieser Verteilung anhand der folgenden Stichprobe:

h

1

2

3

4

5

6

160

145

155

136

140

152

Ubungsaufgaben 4)

637

X sei eine normalverteilte Zufallsvariable, deren Mittelwert u jedoeh unbekannt sei. Bestimmen Sie anhand der Stiehprobe i

1

2

3

4

5

6

7

8

9

10

Xi

140

162

128

132

136

148

140

128

135

158

ein Vertrauensintervall fur den Mittelwert f.1 bei bekannter Varianz a 2 = 9, bei unbekannter Varianz o ':

a) b)

Als Vertrauensniveau wahle man y =.' 95%.

5)

Der Durchmesser X der auf einer bestimmten Masehine hergestellten Sehrauben sei eine normalverteilte Zufallsvariable. Eine Stiehprobe vom Umfang n = 100, entnommen aus einer 'Tagesproduktion, ergab dabei das folgende Ergebnis: x = 0,620 em, s = 0,035 em. Bestimmen Sie die Vertrauensgrenzen fur den unbekannten Mittelwert u bei einer Irrtumswahrscheinlichkeit von a = 5%.

6)

X sei eine normalverteilte Zufallsgrolie mit dem unbekannten Mittelwert f.1 und der ebenfalls unbekannten Varianz (f2. Eine Stiehprobe vom Umfang n = 10 ergab den arithmetischen Mittelwert x == 102 und die empirische Varianz S2 = 16. Bestimmen Sie fur f.1 und (f2 jeweils ein Vertrauensintervall zum Vertrauensniveau y = 99%.

7)

Fur einen neuen Autotyp wurde ein bestimmter Motor weiterentwickelt, dessen Leistung X (in PS) als eine normalverteilte Zufallsvariable betrachtet werden kann. Eine Stichprobenuntersuchung an n= 8 wahllos herausgegriffenen Motoren brachte das folgende Ergebnis: 1

2

3

4

5

6

7

8

100,5

96,5

99,0

97,8

100,4

103,5

100,3

98,0

i -

Xi

PS

Bestimmen Sie jeweils ein Vertrauensintervall fur den unbekannten M ittelwert f.1 und die unbekannte Varianz a 2 bei einer vorgegebenen Irrtumswahrseheinlichkeit von a = 5%. 8)

Die Tragfdhigkeit X eines Balkens solI als eine normalverteilte Zufallsvariable betrachtet werden. Eine Stichprobenuntersuchung vom Umfang n = 16 ergab folgende Werte:

x=

12,54 kN,

s = 1,02 kN

Bestimmen Sie aufder Basis dieser Stichprobe jeweils ein Vertrauensintervall fur den unbekannten Mittelwert u und die unbekannteVarianz a ': Das Vertrauensniveau sci ;' = 95%.

638


9)

In einer Versuchsreihe wurde die Dichte X einer Eisenkugel insgesamt 20-mal gemessen, wobei nur 6 verschiedene MeBwerte mit der folgenden Hdufigkeitsverteilung auftraten: Xi

(in g/cm') absolute Haufigkeit n,

7,79

7,80

7,81

7,82

7,84

7,85

3

3

5

4

3

2

Bestimmen Sie anhand dieser Stichprobe ein Vertrauensintervall fur den unbekannten Mittelwert J.1 derals normalverteilt betrachteten Mebgrolse X (vorgegebenes Vertrauensniveau: 'Y = 99%). 10)

Bei der Qualitiitskontrolle eines bestimmten elektronischen Bauteils befanden sich in einer Zufallsstichprobe vom Umfang n = 500 genau k = 27 defekte Teile. Bestimmen Sie einen Schdtzwert fur den unbekannten .Ausschulsanteil" p der Gesamtproduktion und geben Sie ein Vertrauensintervall fur diesen Parameter zum Vertrauensniveau b)

'Y

= 99%

an. 11)

Beim Wiirfeln mit einem homogenen Wiirfel soIl das Auftreten einer geraden Augenzahl als .Erfolg'' gewertet werden. Bei n = 100 unabhangigen Wiirfen trat dieses Ereignis genau 55-mal ein. Schdtzen Sie die unbekannte .Erfolgswahrscheinlichkeit" p undo bestimmen Sie fur diesen Parameter ein Vertrauensintervall bei einer Irrtumswahrscheinlichkeit von a = 1%.

12)

Eine Urne enthalt schwarze und weiBe Kugeln, deren Anteile jedoch unbekannt sind. Urn den Anteil p an schwarzen Kugeln zu schatzen, wurde der Urne 100-mal eine Kugel mit Zuriicklegen entnommen. Dabei erhielt man das folgende Ergebnis: Farbe der gezogenen Kugel

schwarz

weiB

Anzahl der gezogenen Kugeln

68

32

Ermitteln Sie auf einem Konfidenzniveau von 'Y = 95% den unbekannten Parameter p. 13)

ein Konfidenzintervall fur

Aus einer Sonderpragung wutden n= 100 Munzen nach dem Zufallsprinzip ausgewahlt und ihre Masse X bestimmt. Man erhielt dabei einen Stichprobenmittelwert von = 5,43 g mit einer Streuung von S2 = 0,09 g2. Der Verteilungstyp der Zufallsvariablen X ist jedoch unbekannt. Bestimmen Sie mit Hilfe des Zentralen Grenzwertsatzes der Wahrscheinlichkeitsrechnung auf einem Vertrauensniveau von 'Y = 95% die Vertrauensintervalle fur den unbekannten Mitteiwert J.1 und die unbekannte Standardabweichung (J.

x

639

Ubungsaufgaben

Zu Abschnitt 4 1)

Ein Hersteller produziert in groBer Stiickzahl elektrische Widerstande mit dem Sollwert /10 = 100 Q. Der ohmsche Widerstand X kann dabei als eine anniihernd normalverteilte Zufallsvariable angesehen werden. Nach Angaben des Herstellers wird der vorgegebene Sollwert /10 = 100 Q auch eingehalten. Eine Stichprobe vom Umfang n = 10 ergab jedoch einen empirischen Mittelwert von = 102 Q. Man teste mit einer Irrtumswahrscheinlichkeit von a = 1°/0 die Nullhypothese H o : /1 = /10 = 100 Q gegen die Alternativhypothese H 1 : /1 =1= /10 = 100 Q. Aufgrund langjahriger Erfahrungen darf dabei von einer Standardabweichung (J = 3 Q ausgegangen werden.

x

2)

In einem Werk werden Gliihlampen hergestellt, deren Lebensdauer X als eine normalverteilte Zufallsvariable mit dem Mittelwert /10 = 1500 h und der Standardabweichung (J = 80 h betrachtet werden kann. Durch eine geringfiigige Materialanderung erhofft sich der Hersteller eine VergrojJerung der mittleren Lebensdauer. Eine Stichprobenuntersuchung an 50 Gliihlampen der neuen .Serie scheint dies zu bestatigen: Fiir die mittlere Lebensdauer erhielt man den Wert = 1580 h. Konnen wir aus dieser Stichprobe den SchluB ziehen, daB sich die Lebensdauer signifikant erhoht hat? Testen Sie bei einer Irrtumswahrscheinlichkeit von a = 1°/0 die Nullhypothese H o : /1 = /10 = 1500 h gegen die Alternativhypothese H 1: /1 > /10 = 1500 h. Bei dem Test wird vorausgesetzt, daB sich die Standardabweichung (J durch die Materialanderung nicht veriindert hat.

x

3)

Die ReijJlast X eines Seiles ist laut Hersteller eine normalverteilte Zufallsgrolie mit dem Mittelwert /10 = 5,20 kN. Eine Stichprobe vom Umfang n = 20 fiihrte jedoch zu den folgenden Kennwerten: = 5,02 kN; s = 0,12 kN. Priifen Sie mit einer Irrtumswahrscheinlichkeit von a = 5°1o, ob die aufgrund dieser Stichprobe geaufierten Zweifel an der Richtigkeit der Herstellerangabe /10 = 5,20 kN berechtigt sind.

x

4)

In einem Werk werden Schrauben produziert, deren Lange X eine normalverteilte Zufallsgrobe mit dem Mittelwert /10 = 21 mm sei. Eine Zufallsstichprobe fiihrte zu dem folgenden Ergebnis:

n = 25;

x=

20,5 mm;

s = 1,5 mm

Priifen Sie mit der. Irrtumswahrscheinlichkeit a = 1 °/0, ob die Abweichung des beobachteten Stichprobenmittelwertes = 20,5 mm vom Sollwert /10 = 21 mm signifikant oder zufallsbedingt ist.

x

5)

Ein Automobilhersteller bringt ein neues PKW-Modell auf den Markt, dessen Benzinverbrauch X (in Liter pro 100 km Fahrleistung) eine normalverteilte Zufallsvariable mit dem Mittelwert /10= 8,21/100 km sein soIl. Die Redaktion einer Fachzeitschrift uberpriift diese Angabe an n = 36 zufallig ausgewahlten Testfahrzeugen und kommt dabei zu folgendem Ergebnis:

x=

9,1 1/100 km;

s = 2,3 1/100 km


640

Der Stichprobenmittelwert X ist also deutlich hoher als der vom Hersteller angegebene Wert /10' Testen Sie mit der Irrtumswahrscheinlichkeit a = 5%, ob die Angabe des Hersteller bezuglich des Mittelwertes /1 noch Hinger aufrecht erhalten werden kann. 6)

Zwei verschiedene MeBmethoden fur Widerstande sollen miteinander verglichen werden. Vergleichsmessungen an 5 Widerstanden ergaben dabei das folgende MeBprotokoll: i

1

2

3

4

5

100,5

102,4

104,3

101,5

98,4

98,2

99,1

102,4

101,1

96,2

1. Methode:

MeBwert (in Q)

Xi

2. Methode:

MeBwert (in Q)

Yi

Testen Sie mit der Irrtumswahrscheinlichkeit a = 1 %, ob beide MeBmethoden als gleichwertig angesehen werden konnen oder ob die beobachteten Abweichungen signifikant sind.

7)

In zwei Werken A und B wird ein bestimmtes elektronisches Bauelement nach dem gleichen Verfahren hergestellt. Es wird jedoch vermutet, daB die imWerk B produzierten Teile eine hohere Lebensdauer besitzen. Die folgende Stichprobenuntersuchung scheint dies zu bestatigen:

Werk

Anzahl der getesteten Elemente

mittlere Lebensdauer (in h)

Standardabweichung (in h)

A

n1

= 100

x = 1540

Sl

= 142

B

n2

= 120

Y = 1600

S2

= 150

Testen Sie mit einer Irrtumswahrscheinlichkeit von a = 1 % die Behauptung, daB die im Werk B hergestellten elektronischen Bauelemente eine hohere Lebensdauer besitzen. Wir setzen dabei voraus, daB die Werte aus normalverteilten Grundgesamtheiten mit gleicher (aber unbekannter) Varianz stammen.

Ubungsaufgaben ~)

641

Die folgenden Stichproben stammen aus zwei normalverteilten Grundgesamtheiten mit gleicher (aber unbekannter) Varianz: i

1

2

3

4

5

Xi

5,98

6,02

6,10

5,82

6,04

Yi

6,06

6,08

6,12

6,00

5,94

Es wird behauptet, daB auch ihre Mittelwerte iibereinstimmen. Prifen Sie mit der Irrtumswahrscheinlichkeit a == 1%, ob diese Behauptung tatsachlich zutrifft. 9)

Eine Maschine produziert Wellen von hoher Prazision, Ais Genauigkeitsmaj3wird dabei die Standardabweichung (Jo des Wellendurchmessers X betrachtet. Die Maschine wurde dabei so eingestellt, daB (Jo == 0,2 mm betragt, Zu Kontrollzwecken wurde eine Zufallsstichprobe vom Umfang n == 12 entnommen. Ihre Auswertung ergab jedoch eine empirische Standardabweichung von s == 0,4 mm. MuB die Maschine neu eingestellt werden? Testen Sie daher mit einer Irrtumswahrscheinlichkeit von a == 50/0 die Nullhypothese H o : (J2 ::::; (J6 gegen die Alternativhypothese H 1 : (J 2 > (J5 und treffen Sie eine Entscheidung. Andert sich diese, wenn dieser Test mit der Irrtumswahrscheinlichkeit a == 1% durchgefuhrt wird?

10)

Der Hersteller eines Massenartikels behauptet, seine Ware enthalte einen AusschuBanteil von hochstens 3%. Bei einer Qualitdtskontrolle werden in einer Stichprobe von n == 400 Teilen genau 20 unbrauchbare Teile gefunden. Steht diese Untersuchung im Einklang mit der Behauptung des Herstellers? Treffen Sie eine Entscheidung, in dem Sie bei einer Irrtumswahrscheinlichkeit von a == 5% die Nullhypothese H o : p ::::; Po ==0,03 gegen die Alternativhypothese H 1: p > Po == 0,03 testen.

11)

Bei 200 Wiirfen mit einem Wiirfel erhielt man 88-mal eine gerade Augenzahl. Prufen Sie auf dem Signifikanzniveau a == 5%, ob es sich dabei urn einen "unverfalschten" Wiirfel handeln kann. Hinweis: Bei einem "unverfalschten" Wiirfel tritt eine gerade Augenzahl mit der Wahrscheinlichkeit Po == 1/2 auf.

III Grundlagen der rnathernatischen Statistik

642

Zu Abschnitt 5 1)

Beim Wurf einer Miinze erhielt man bei 150 Wiirfen 65~mal "Zahl". Testen Sie mit einer Irrtumswahrscheinlichkeit von r:x = 5 %, ob die aufgrund dieser Zufallsstichprobe geauberten Zweifel an der .Echtheit'' der Miinze berechtigt sind.

2)

Ein Wiirfel wurde 300-mal geworfen. Dabei erhielt man die folgende Hdufigkeitsverteilung fur die 6 moglichen Augenzahlen: Augenzahl i absolute Haufigkeit n,

35

2

3

4

5

6

39

70

62

56

38

Testen Sie mit Hilfe des Chi-Quadrat- Tests auf dern Signifikanzniveau r:x = 1 %, ob diese Zufallsstichprobe gegen eine Gleichverteilung der Augenzahl spricht. 3)

Es wird vermutet, daB die Zufallsvariable X einer Poisson- Verteilung mit dem unbekannten Parameter (Mittelwert) J1 geniigt. Zu welchem Ergebnis fiihrt ein auf dem Signifikanzniveau r:x = 5% durchgefiihrter Chi-Quadrat- Test, dem die folgende Stichprobe zugrunde gelegt wird: Xi

0

1

2

3

4

5

absolute Haufigkeit n,

27

31

22

12

6

2

(Stichprobenumfang: n = 100) 4)

Urn den mittleren Benzinverbrauch eines neuentwickelten PKW's zu bestimmen, wurden 100 Testfahrzeuge ausgewahlt und an ihnen der Benzinverbrauch X in Liter pro 100 km festgestellt. Die Stichprobenuntersuchung fiihrte zu dem folgenden Ergebnis (aIle Werte in 1/100 km): Klassenintervall

x0

u: Mittel- oder Erwartungswert der Grundgesamtheit (haufig auch "wahrer" Wert X w der Mefrgrofie X genannt: E(X) == f.l == x w ) 8 ) (J:

Standardabweichung der Grundgesamtheit ((J 2 ist die Varianz der Grundgesamtheit)

Wir gehen jetzt noch etwas naher auf die beiden Verteilungsparameter f.l und

(J

ein:

Mittel- oder Erwartungswert E(X) = Jl Angenommen, wir waren in der Lage, unsere Messung beliebig oft zu wiederholen. Dann wurde in der aus unendlich vielen MeBwerten bestehenden (hypothetischen) Me13reihe (IV-7) der spezielle Me13wert u mit der grojJten Haufigkeit (Wahrscheinlichkeit) auftreten. Die Dichtefunktion f (x) besitzt somit an der Stelle Xl == f.l ihr absolutes Maximum (Bild IV-4). Der Mittel- oder Erwartungswert f.l ist somit der .wahrscheinlichste" Wert der Zufallsgrobe (Meligrofie] X und wird daher zu Recht als eine Art M ittelwert der unendlichen M ejJreihe (Grundgesamtheit) angesehen. Standardabweichung

(J'

Die Verteilungsfunktion f (x) der Normalverteilung besitzt an der Stelle Xl == u ihr absolutes Maximum und symmetrisch dazu Wendepunkte an den Stellen X 2/ 3 == f.l ± a (Bild IV-4). Urn die Bedeutung der Standardabweichung (J besser erkennen zu konnen, betrachten wir den Verlauf dieser Funktion fur den speziellen Mittelwert f.l == 0 und verschiedene Werte des Parameters (J. Bild IV-5 verdeutlicht, daB die Standardabweichung (J im wesentlichen "Rohe" und .Brcitc" der Dichtefunktion f (x) bestimmt. tix)

0,8

...........

:/ :' 04

. .i ":

-2

8)

-1

(5=0 5

'\

Bild IV-5

'

Die Standardabweichung (J bestimmt "Hohe" (Maximum) und "Breite" der Normalverteilungsdichtefunktion I(x)

".

\.. .

2

x

Die Aussage "Mittelwert J1 = wahrer Wert x.," gilt nur, wenn keine systematischen MeBabweichungen auftreten, was wir jedoch verabredungsgemaf stets voraussetzen.

IV Fehler- und Ausgleichsrechnung

654

Je kleiner (J ist, urn so starker ist das Maximum ausgepragt und urn so steiler fallt die GauBsche Glockenkurve nach beiden Seiten hin abo Die Standardabweichung (J kann somit alsein geeignetes MaB fur die Streuung der MeBwerte Xi urn den .wahren" (aber unbekannten) Wert x., == 11 angesehen werden. Die Prdzision einer Messung wird somit ganz wesentlich durch den .Breiteparameter" (J bestimmt. Offensichtlich gilt die folgende Regel: kleines

(J

~

schmale Kurve

~

hohe Genauigkeit

groBes

(J

~

breite Kurve

~

geringe Genauigkeit

Die Wahrscheinlichkeit P(a ~ X ~ b) dafiir, daB der MeBwert in das Intervall [a; b] fallt, ist bekanntlich durch das Integral b

p(a~X~b)==ff(X)

b

dx==_l_·fe-

1

(x - fl)2

2 --;;-

dx

(IV-8)

J2;c(J

a

a

gegeben (grau unterlegte Flache in Bild IV -6).

f(x) P(a

«x s b)

f(x)

a

b

x

Bild IV-6 Die grau unterlegte Flache ist ein MaB fur die Wahrscheinlichkeit, bei einer Messung einen im Intervall [a; b] gelegenen MeBwert zu erhalten

Die Bedeutung der Standardabweichung (J als GenauigkeitsmafJ fur un sere Messungen wird auch deutlich, wenn wir die urn den Mittelwert 11 symmetrisch angeordneten Intervalle [11 - (J; 11 + (J], Lu - 2 (J; 11 + 2 (J] lind [11 - 3 (J; J1 + 3 (J] naher betrachten (Bild IV-7).

2 Statistische Verteilung der MeBwerte und MeBabweichungen ("MeBfehler")

655

In Kap. II, Abschnitt 6.4.4 haben wir bereits gezeigt, daB sich in diesen Intervallen der Reihe nach 68,3%, 95,5% und 99,7% aller MeBwerte befinden. Wir erwarten daher bei 100 Einzelmessungen, daB rund 68 MeBwerte urn hochstens eine Standardabweichung vom Mittelwert p: abweichen. Bei kleinem (J liegen also rund 68 % der MeBwerte in der unmiitelbaren Nahe des Mittelwertes /l (Bild IV -7, a)).

f(x) :::::68,3 %

a) o-Bereich urn den Mittelwert f1

x

f.l-a f.l f.l+a a)

f(x)

b) 2 a- Bereich urn den Mittelwert f1

f.l- 2 a

f.l

f.l+ 2 a

x

b)

f(x)

c) 3 c-Bereich urn den Mittelwert f1

f.l- 3 a

f.l+3a

x

c)

Bild IV-7 Zur Deutung der Standardabweichung a als MaB fur die Streuung der einzelnen MeBwerte Xi urn den Mittelwert f1

656


Wir fassen die wichtigsten Aussagen wie folgt zusammen:

9)

Die unendliche Grundgesamtheit besteht aus allen moglichen MeBwerten der Grobe X.

657

3 Auswertung einer MeBreihe

Anmerkungen (1)

Wir weisen der groBen Bedeutung wegen nochmals darauf hin, daB diese Aussagen nur fur zufdllige Mellabweichungen ("zufallige Fehler") gelten. Eventuell auftretende systematische Abweichungen ("systematische Fehler") werden daher stets als vernachldssigbar betrachtet.

(2)

Im Normalfall (d.h. in der Regel) geniigen die MeBwerte und MeBabweichungen ("MeBfehler") ndherungsweise einer Gaufischen N ormalverteilung. Man sagt dann: MeBwerte und MeBabweichungen ("MeBfehler") sind nach Gauf normalverteilt. Wir wollen aber nicht verschweigen, daf es sich hierbei streng genommen nur urn eine M odellverteilung handelt, die jedoch der Wirklichkeit oft sehr nahe kommt.

(3)

Es gibt auch MeBreihen, die keiner Normalverteilung folgen. Im konkreten Fa111aBt sich z. B. mit Hilfe des Wahrscheinlichkeitspapiers oder mit dem Chi-Quadrat- Test prufen, ob eine Normalverteilung vorliegt oder .nicht.

3 Auswertung einer Me8reihe 3.1 Mittelwert

ODd

Standardabweichung

Gegeben sei eine aus n MeBwerten bestehende MeBreihe Xl' X 2' ..• , X n , von der wir voraussetzen, daB sie die in Abschnitt 2 dargelegten Eigenschaften besitzt (Messungen gleicher Genauigkeit, unabhdngige Beobachtung der MeBwerte, normalverteilt nach GauB). Die Melrgrobe X geniigt dabei einer Normalverteilung mit dem Mittelwert J1 und der Standardabweichung (J (Bild IV-8). Beide Parameter sind jedoch unbekannt. Die Aufgabe der Fehlerrechnung besteht nun darin, aus den vorgelegten MeBwerten Xl' X 2, ... , X n .moglichst gute" Schdtzwerte fur diese Parameter zu bestimmen.

f(x)

I I

---T--I I

I I

I I x

Bild IV-8 Dichtefunktion der Gauf3schen Normalverteilung mit dem Mittelwert und der Standardabweichung (J

{l


658 Mittelwert X einer Me8reihe

Da die vorliegende MeBreihe irn Sinne der Statistik eine Stichprobe darstellt, ist bekanntlich der arithmetische M ittelwert n

i

I

(IV -11)

Xi

=1

der "beste" Schdtzwert fur den unbekannten .wahren" Wert (Mittelwert) f.1 der Mebgrobe X (vgl. hierzu Kap. III, Abschnitt 3.2.3). Zu diesem Ergebnis gelangt man auch durch Ausgleichung der streuenden MeBwerte nach der von GaufJ stammenden "Methode der kleinsten Quadrate" 10). Wir fiihren zu diesern Zweck zunachst die Abweichungen Vi der MeBwerte Xi vom (noch zu bestimmenden) Mittelwert i ein: (i == 1, 2, ... , n)

(IV-12)

Diese auch als "scheinbare Fehlcr" bezeichneten GraBen werden nun quadriert und anschlieBend aufaddiert. Wir erhalten dann die noch vorn (unbekannten) Mittelwert i abhangige Summe aller Abweichungsquadrate: n

S(x) =

n

I

2

Vi =

i= 1

I

(Xi -

(IV~13)

X)2

i= 1

Der nach GauB giinstigste Wert fur i ist dabei derjenige, fur den diese Surnrne ein Minimum annimmt: n

S(x) =

I

(IV-14)

(Xi - X)2 ---> Minimum

i= 1

Wir bestimmen i nun so, daB die Funktion S (i) die fur ein Minimum hinreichenden Bedingungen S' (i) == 0 und S" (i) > 0 erfiillt. Die dabei benotigten Ableitungen lauten:

== -

2 [(Xl - i)

+ (x 2 -

== -

2 [(Xl + X2

+ ... + x n ) -

i)

+ ... + (x,

- i)]

==

i

ni] == - 2 ( .

Xi -

nx)

(IV-iS)

1=1

S"(x) = 10)

:x [-2 (itt ~ nx)J 2n 0 Xi

=

>

(IV-16)

Diese Bezeichnung ist ungliicklich gewahlt. Es miifite besser heiBen: "Methode der kleinsten Quadratsumme", Dieses fur die Fehler- und Ausgleichsrechnung typische Verfahren Hifit sich mit Hilfe der 1\1aximum-Likelihood-Methode leicht herleiten (vgl. hierzu Kap. III, Abschnitt 3.3).

.3 Auswertung einer MeBreihe

659

Aus der notwendigen Bedingung Sf (X) folgt zunachst n

I

Xi -

nx =

(IV-17)

0

i= 1

und damit _

1

x == - '

(IV-18)

n i

=1

Wegen S" (X) == 2 n > 0 handelt es sich dabei ·um das gesuchte Minimum. Das arithmetische Mittel ist demnach der "beste" Schdtzwert fur den meist unbekannt bleibenden "wahren" Wert der Mebgrolie X, d.h. X ist der "beste" Schdtzwert fur den Mittelwert J1 der (normalverteilten) Grundgesamtheit, die aus allen moglichen MeBwerten besteht. Standardabweichung seiner Mefireihe Die Streuung der einzelnen MeBwerte durch die Standardabweichung

s==

1 n 2 - - ' . \ ' V i == n-1

L

i= 1

J

Xi

urn den arithmetischen Mittelwert

1 n - - ' \ ' (Xi -

n-1

L

x HiBt sich

(IV-19)

x)2

i= 1

charakterisieren (vgl. hierzu auch Kap. III, Abschnitt 2.1). Sie ist ein MaB fur die Zuverliissigkeit und Genauigkeit der Einzelmessung 11). Zugleich ist die Standardabweichung s der "beste" Schdtzwert fur die unbekannte Standardabweichung (J der normalverteilten Grundgesamtheit. Wir konnen somit erwarten, daf z.B. von 100 weiteren Einzelmessungen rund 68 MeBwerte in das Intervall mit den Grenzen x - s und x + s fallen (Bild IV-9). f(x)

x Bild IV -9 Rund 68,3 % aller MeBwerte unterscheiden sich vom Mittelwert J1 urn hochstens eine Standardabweichung (J ~ s

11)

~

x

Die Standardabweichung s wurde friiher auch als mittlerer Fehler der Einzelmessung bezeichnet.


660

Standardabweichung

si

des Mittelwertes i

Bei der Berechnung des arithmetischen Mittelwertes .x nach Formel (IV-18) werden alle n Einzelmessungen in gleicher Weise berucksichtigt. Wir diirfen daher zu Recht erwarten, daB das arithmetische Mittel x einen zuverldssigeren Schatzwert fur den unbekannten Mittelwert u liefert als jeder einzelne MeBwert Xi fur sich alleine genommen. Der arithmetisehe Mittelwert x laBt sieh namlich als eine Realisierung der normalverteilten Zufallsgroj3e (IV-20) i= 1

auffassen, die wir bereits in Kap. III. Absehnitt 3.2.3 als Schiitzfunktion fiir den Mittelwert f1 kennengelernt haben 12). Wenn wir die aus verschiedenen MeBreihen vom gleichen

Urnfang (jeweils n Einzelmessungen!) mittels der Schatzfunktion X bereehneten Mittelwerte x miteinander vergleiehen, werden wir feststellen, daf diese ebenso wie die einzelnen MeBwerte urn den .wahren" Wert (Mittelwert) f1 streuen. Wir werden sparer zeigen, daf diese Streuung mit der Standardabweichung

s-

== -

11

s

x~

==

n (n - 1)

L

(IV-21)

(Xi - X)2

i= 1

erfolgt, die daher als Standardabweichung des M ittelwertes x bezeiehnet wird. Sie liefert einen Schdtzwert fur die unbekannte Standardabweiehung (J x = (J/~ der Schatzfunktion X. Die Standardabweiehung Sx des Mittelwertes x kennzeiehnet die Genauigkeit des Mittelwertes und ist kleiner als die Standardabweiehung s der Einzelmessungen (Bild IV-10). Dies bestatigt un sere Vermutung, daf der arithmetische Mittelwert x sieher ein zuverldssigerer Schatzwert fur den .wahren" Wert u darstellt als ein einzelner MeBwert.

x

Bild IV-tO Die Standardabweichung des Mittelwertes x ist kleiner als die Standardabweichung der Einzelmess ung J1~X

12)

x,x

Wir erinnern: Die normalverteilten ZufaIlsvariablen Xl' X 2' ... , XII geniigen aIle der gieichen Verteilung wie die Metigrolie X. Sie besitzen daher jeweils den Mittelwert tl und die Standardabweichung (J. Die Zufallsvariable X ist dann normalverteilt mit dem Mittelwert tl x = tl und der Standardabweichung

(Jx = (J/Jn.

661

3 Auswertung einer MeBreihe Wir fassen diese Ergebnisse wie folgt zusammen:

Anmerkungen (1) Eine Kontrolle der Mittelwertbildung nach Gleichung (IV-22) ermoglicht die Summe der Abweichungen, die stets verschwindet: n

I

n

Vi

=

I

n

(Xi -

x)

=

i= 1

i= 1

I

i= 1

Xi -

i= 1

n

=

I

nx

=

I

n

i= 1

Xi -

n

(1

I

~.

n

i

=

Xi

)

=

1

n

Xi -

I

i= 1

Xi =

0

(IV-25)

662


(2)

Man beachte, daB die Standardabweichung s mit der Summe der Abweichungsquadrate gebildet wird. Diese besitzt fur den arithmetischen Mittelwert x ihren kleinsten Wert ("M ethode der kleinsten Quadrate").

(3)

Die Standardabweichung seiner MeBreihe wird sich nur geringfugig andern, wenn man die Anzahl n der Einzelmessungen vergrofiert. Daher gilt fur die Standardabweichung Sx des Mittelwertes ndherungsweise:

x

1

(IV-26)

s-""'-

Xj;;

Die Genauigkeit des MeBergebnisses HiBt sich daher prinzipiell durch eine Erhiihung der Anzahl n der Einzelmessungen verbessern. Aus Zeit- und Kostengriinden ist dies jedoch in der Praxis meist nicht moglich, (4)

Bei unseren Uberlegungen sind wir von einer N ormalverteilung der MeBwerte x; mit der Dichtefunktion

Xl' X 2, ... ,

1

f(x) = _1_. e-2

(x - 11)2 -(5-

(IV-27)

j2;c(J

ausgegangen. Der Mittelwert x ist dann als Schatz- oder N dherungswert des Mitteloder Erwartungswertes f.1 der Grundgesamtheit aller moglichen MeBwerte aufzufassen. Die Standardabweichung s der Einzelmessung liefert einen Schatz- oder N dherungswert fur die Standardabweichung (J der Normalverteilung, ebenso ist S2 ein Schdtzwert fur dieVarianz (J 2. Es gilt somit: f.1~X,

(5)

(J ~

s,

(IV-28)

Die Standardabweichung s der Einzelmessung wurde friiher auch als .mittlerer Fehler der Einzelmessung", die Standardabweichung Sx des Mittelwertes auch als .mittlerer Fehler des Mittelwertes" bezeichnet.

3 Auswertung einer MeBreihe •

663

Beispiele

(1)

Wir bestimmen anhand des folgenden MeBprotokolls einer Widerstandsmessung den arithmetischen Mittelwert R sowie die Standardabweichungen SR und sji der Einzelmessung bzw. des Mittelwertes:

151,5

1,2

1,44

2

149,7

-0,6

0,36

3

149,1

-1,2

1,44

4

150,3

5

151,3

°

°

6

150,9

0,6

0,36

7

150,6

0;3

0,09

8

149,8

-0,5

0,25

9

149,4

-0,9

0,81

10

150,4

0,1

0,01

1,0

1,00

Arithmetischer Mittelwert: _

1

10

1

R == _. \ R· == _. 1503 00== 1503 0 10 L l 10 - , , i= 1

Standardabweichung der Einzelmessung:

1

10

- _ . \ (R. - R)2 == 10 - 1 L l i= 1

Standardabweichung des Mittelwertes: SR

0,8 0

°

°

- == 25 Q ~ 3 0 ;;; == jiO' ,

sji == -

)1

-.5760 2 == 08 Q 9' ,

IV Fehler- und Ausgleiehsreehnung

664

(2)

In einem Versueh wurde der Durchmesser d einer zylindrisehen Scheibe insgesamt 6-mal mit gleieher Genauigkeit gemessen. Es ergaben sieh dabei die folgenden Werte: 5,61 em,

5,59 em,

5,50 em,

5,68 em,

5,65 em,

5,52 em

Man bereehne den Mittelwert des Durehmessers sowie die Standardabweichung der Einzelmessung und des Mittelwertes.

Losung: Aus den MeBdaten bilden wir die folgende Tabelle:

5,61

0,018

3,24

2

5,59

- 0,002

0,04

3

5,50

- 0,092

84,64

4

5,68

0,088

77,44

5

5,65

0,058

33,64

6

5,52

- 0,072

51,84

M ittelwert des Durchmessers: 6

Ld

1 d == _. 6

i

=

1

6. 33,55 em =

5,592 em ~ 5,59 em

i= 1


s = d

J_1_. L~ (d. 6-1

d)2 =

l

J~5 ·25084 . 10'

4

cm' = 007 em ,

i= 1

Standardabweichung des Mittelwertes: s(j

== -

Sd

0z

==

0,07 em

j6

== 0,03 em

•


665

3.2 Vertrauensbereich fur den Mittelwert Il, Mellunsicherheit, Me8ergebnis Der aus einer MeBreihe Xl' X 2, ... , X n ermittelte arithmetische Mittelwert Xist - wie wir inzwischen wissen - der "beste" Schatz- oder N dherungswert fur den (unbekannten) "wahren" Wert (Mittelwert) j1 der normalverteilten McligroheX. Wir konnen daher nicht erwarten, daf x und j1 iibereinstimmen, da der arithmetische Mittelwert x immer das Ergebnis einer Zufallsstichprobe ist und sich somit von Mebreihe zu MeBreihe (wenn i. a. auch nur geringfugig) verdndern wird. Die aus verschiedenen MeBreihen vom gleichen Umfang n bestimmten Mittelwerte streuen also urn den Mittelwert u, wie in Bild IV -11 verdeutlicht.

x

I I I

I I I I I

Bild IV-II

I I I

-

x

ttt ~tt Neheruriqswerte tiir J1 aus verschiedenen MeBreihen

Vertrauensbereich fur den Mittelwert

Die aus verschiedenen Mefireihen ermi ttelten Mi ttel werte -'~ streuen urn den (unbekannten) Mittelwert f.1 der normalverteilten MeBgr6I3e

}l

x

Wir sind jedoch in der Lage, ein urn den arithmetischen Mittelwert symmetrisches Intervall anzugeben, das den unbekannten Mittelwert J1 mit einer vorgegebenen (groBen) Wahrscheinlichkeit P = 1) itberdecki. Genau dieses Problem aber haben wir bereits in Kap. III, Abschnitt 3.4.2 und 3.4.3 ausfuhrlich erortert. Es handelt sich namlich urn die Konstruktion eines Vertrauensintervalles, in dem der unbekannte Mittelwert u mit einer vorgegebenen Wahrscheinlichkeit y vermutct wird 13). Bei unbekannter Standardabweichung (J der normalverteilten Gruhdgesamtheit (dies ist der N ormalfall) ergaben sich dabei die folgenden Vertrauensgrenzen (Bild IV -12): Untere Vertrauensgrenze:

_ X -

s t-

~

(IV-29)

_ s Obere Vertrauensgrenze: x + t -

.:

13)

Die vorgegebene Wahrscheinlichkeit wird in diesem Zusammemhang auch als Vertrauensniveau oder als st atistische Sicherheit bezeichnet.

666


j -

Vertrauensgrenzen

5

t

X

x-t-

vn

-

5

x+t-

X

vn

Bild IV-12

Vertrauensbereich fur den Mittelwert u

2t _5_

vn

s ist dabei die Standardabweichung der MeBreihe, n die Anzahl der Einzelmessungen und t ein Zahlenfaktor (Parameter), der noch von dem gewahlten Vertrauensniveau (hier haufig auch statistische Sicherheit genannt) P = y und der Anzahl n der Einzelmessungen abhangt 14). Die nachfolgende Tabelle 1 enthalt die benotigten Werte fur den Parameter tin Abhangigkeit von der Anzahl n der Einzelmessungen fur die statistischen Sicherheiten y

= 68,3%,

Y = 900/0,

y

=

95°~

und

y

= 99%.

Der Vertrauensbereich fur den unbekannten Mittelwert J1lautet damit:

_

s

_

s

x-t .J;t~f1~x+t.J;t

(IV-30)

Mit einem Vertrauen von y erwarten wir daher, daB der (unbekannte) .wahre" Wert J1 der Meligrobe X in diesem Intervallliegt. Me8unsicherheit und Me6ergebnis

In der Fehlerrechnung ist es iiblich, diesen Vertrauensbereich wie folgt anzugeben: _ s (MeBwert von X) = x ± t .J;t

14)

(IV-31)

t geniigt der Bedingung P( - t

~

T

~

t)

= y

Bild IV-13

f(t)

(grau unterlegte Flache in Bild IV-13). Dabei ist T eine Zufallsvariable, die der tVerteilung von Student mit f = n - 1 Freiheitsgraden folgt (siehe hierzu Kap. II, Abschnitt 8.2).

Dichtefunktion der t- Verteilung

r

-t


667

Verkiirzt schreiben wir dann fur das Mej3ergebnis: _

s

x==x+t-

(IV-32)

-0z

Tabelle 1: Werte fur den Zahlenfaktor (Parameter) t in Abhangigkeit von der Anzahl n

der MeBwerte und dem gewahlten Vertrauensniveau y

2

1,84

6,31

12,71

63,66

3

1,32

2,92

4,30

9,93

4

1,20

2,35

3,18

5,84

5

1,15

2,13

2,78

4,60

6

1,11

2,02

2,57

4,03

7

1,09

1,94

2,45

3,71

8

1,08

1,90

2,37

3,50

9

1,07

1,86

2,31

3,36

10

1,06

1,83

2,26

3,25

15

1,04

1,77

2,14

2,98

20

1,03

1,73

2,09

2,86

30

1,02

1,70

2,05

2,76

50

1,01

1,68

2,01

2,68

100

1,00

1,66

1,98

2,63


668

Die halbe Breite des Vertrauensbereiches, d.h. der Abstand zwischen der unteren bzw. oberen Vertrauensgrenze und dem arithmetischen Mittelwert wird als Mej3unsicherheit bezeichnet und durch das Symbol ~x gekennzeichnet (Bild IV-14) 15). Somit ist

x

s

~x==t-

oder auch

.:

~x

== t . s-x

(IV-33)

und das Mefiergebnis HiEt sich daher auch in der Form

x ==

x ± ~x

(IV-34)

angeben.

I ..MeBunsicherheit

,1: I ..

M eBunsicherheit

Lix_1 Bild IV-14

x

-

x

x-L1x

Zum Begriff der MeBunsicherheit

1st die Standardabweichung (J der normalverteilten Grundgesamtheit jedoch bekannt (z.B. aufgrund der Erfahrungen aus fruheren Messungen), so ist bei der Berechnung der Vertrauensgrenzen des Mittelwertes f1 statt der t- Verteilung von "Student" die Standardnormalverteilung zu nehmen. Der Faktor t in den Gleichungen (IV-32) und (IV -33) ist dann nur noch von dem gewahlten Vertrauensniveau P == y abhangig und entspricht daher dem "Grenzwert" too (d.h. dem t- Wert fur n ~ (0) in der letzten (grau unterlegten) Zeile von Tabelle 1. Das MejJergebnis lautet daher in diesem Sonderfall wie folgt (Bild IV-15):

x == X + ~x -

==

X+ t -

(J rn

(IV-35)

-

~~

Die M ej3unsicherheit betragt somit ~x

== t oo -

(J

(IV:'36)

~

MeBu nsicherheit L1x = too

MeBunsicherheit

(J

(J

{i1

L1x =

too {i1 Bild IV-IS Zur Angabe eines MeBergebnisses

x- L1x 15)

-

x

x

Die Me./Junsicherheit wird haufig auchdurch das Symbol u gekennzeichnet.

3 Auswertung einer MeBreihe Die wichtigsten Ergebnisse fassen wir jetzt wie folgt zusammen:

669

670


Anmerkungen (1) y ist die Wahrscheinlichkeit dafiir, daB der unbekannte Mittelwert

f1 innerhalb der angegebenen Vertrauensgrenzen X ± 8x liegt. In Naturwissenschaft und Technik verwendet man meist y == 950/0 oder y == 99%. Haufig setzt man auch y == 1 - a, wobei a die sog. Irrtumswahrscheinlichkeit bedeutet. Diese muft dabei in Kauf genommen werden, urn iiberhaupt ein Vertrauensintervall angeben zu konnen! Dabei gilt: Je kleiner die Irrtumswahrscheinlichkeit a ist, urn so breiter wird das Vertrauensintervall.

(2)

1st die Standardabweichung (J der Grundgesamtheit jedoch bekannt (z. B. aus friiheren Messungen), so ist der Zahlenfaktor t in Gleichung (IV-39) durch den "Grenzwert" too zu ersetzen (grau unterlegte letzte Zeile in der Tabelle 1).

(3)

Die Angabe des Mefiergebnisses in der Form x == X + 8x == -

s x -+ t -

(IV-42)

~

beruht auf der Voraussetzung, daB weder grobe Fehler noch systematische Abweichungen auftreten. In der Praxis jedoch lassen sich systematische MeBabweichungen nie ganz ausschlieBen. Werden diese aber als solche erkannt, so muB der arithmetische Mittelwert x durch ein Korrekturglied K berichtigt werden. Der sog. korrigierte oder berichtigte Mittelwert xK lautet damit:

x

K

==

X+ K

(IV-43)

Das endgidtige MeBergebnis wird dann in der Form x ==

xK ± 8x == (x + K) ± 8x

(IV-44)

angegeben, wobei 8x die M efiunsicherheit bedeutet, die sich aus einer ZuJallskompo-

' nente (Ax), == t - s un demer systematischen Komponente (zlx), zusammensetzt.

.;

Der .wahre" Wert f1 der Mebgrolie X wird dann mit der gewahlten Wahrscheinlichkeit P == Y in dem Vertrauensbereich mit den Grenzen K - 8x und K + 8x vermutet (Bild IV -16).

x

-------I

-------~-I-----..

I·

x

.1x

.1x

-

L

x

Xk

"wehrer" Wert J.1

Bild IV-16 Korrigiertes MeBergebnis

Der an naheren Einzelheiten interessierte Leser wird auf die DIN-NORM 1319 (Teil 3) verwiesen.

3 Auswertung einer MeBreihe (4)

671

Ist die Verteilung einer Melsgrobe jedoch unbekannt, so rst es nicht moglich, fur den Erwartungswert f1 einen Vertrauensbereich (verbunden mit einer Wahrscheinlichkeitsaussage) anzugeben. Man setzt dann meist fiir die M efJunsicherheit

Ax = (Ax}, =

s

.J;t

(IV-45)

und gibt das Mefiergebnis in der Form

_ _ _ s x = x + Ax = x + [Ax), = x + -

-

-

(IV-46)

-.J;t

an. (5)

In der Fehlerrechnung wird noch zwischen absoluten, relativen und prozentualen "Fehlern" (MeBabweichungen, MeBunsicherheiten) unterschieden. Absolute .Fehler" stimmen mit der Meligrolie X in Dimension und Einheit iiberein. Relative und prozentuale "Fehler" sind dagegen dimensionslose Grolsen. Sie werden wie foIgt berechnet: hI' Iabsoluter "Fehler" I . relativer "Fe er' = . I Mitte wert x

prozentualer "Fehler" = (relativer "Fehler") . 100%

•

Beispiele (1)

Fur die Schwingungsdauer T eines Fadenpendels ergaben sich folgende MeBwerte gleicher Genauigkeit: 1,254 s,

1,260 s,

1,250 s,

1,251 s,

1,245 s,

1,258 s

Wir berechnen zunachst den Mittelwert und die Standardabweichung dieser aus 6 Einzelmessungen bestehenden MeBreihe:

1,254

0,001

2

1,260

0,007

49

3

1,250

- 0,003

9

4

1,251

-0,002

4

5

1,245

- 0,008

64

6

1,258

0,005

25


672 Arithmetischer Mittelwert: 6

1 1 T == _. \' T == - . 7 518 s == 1 253 s , 6 L [ 6' i= 1


== 5,51 .10- 3 s

~

6 .10- 3

S

== 0,006 s

Wir bestimmen jetzt ein Vertrauensintervall fur den (unbekannten) .wahren" Wert der Mellgrobe T auf dem Vertrauensniveau y == 95%. Fur die MefJunsicherheit L1 T erhalten wir nach Formel (IV-39) mit s == 0,006 s, n == 6 und dem aus der Tabelle 1 entnommenen Wert t == 2,57: L1T == t -

s

~

0,006 s

== 2,57 . - - == 0,006 s.

J6

Die Vertrauensgrenzen liegen daher bei: Untere Vertrauensgrenze: T - dT == (1,253 - 0,006) s Obere Vertrauensgrenze: T

==

1,247 s

+ L1T == (1,253 + 0,006) s ==

1,259 s

Das M efiergebnis lautet damit wie folgt: T == (1,253

± 0,006) s

Der "wahre" Wert von T liegt daher mit einem Vertrauen von 95% zwischen 1,247 s und 1,259 s (Bild IV-17).

L1T=O,006 S 4 1

1,247

.1

L1T=O,OO6s 4

1,253

4

1 (2)

Vertrauensbereich fur Y= 95 %

·1 1,259

-I

T

s Bild IV-17

Die Kapazitdt eines Kondensators wurde 20-mal gemessen. Die Auswertung der MeBreihe ergab dabei eine mittlere Kapazitat von C == 56,8 J.lF und eine Standardabweichung von s == 1,9 ~lF.

3 Auswertung einer MeBreihe a) b)

673

Wie lauten die Vertrauensgrenzen fur den .wahren" Wert (Mittelwert) bei einer Irrtumswahrscheinlichkeit von a l = 1O/o? Wie dndern sich diese Grenzen, wenn man die grojJere Irrtumswahrscheinlichkeit a2 = 50/0 in Kauf nehmen will?

Losung: a)

Wir berechnen zunachst die MejJunsicherheit nach Formel (IV-39). Mit n = 20, s = 1,9 JlF und dem t-Wert t l = 2,86 (aus der Tabelle 1 entnommen fur 'Yl = 1 - a l = 99% und n = 20) erhalten wir: s 1,9 JlF I1C=t -=286·--=121IF 1

~

,

J20

'

r

Die Vertrauensgrenzen liegen damit fur das gewahlte Vertrauensniveau von 990/0 bei:

Untere Vertrauensgrenze: C - I1C = (56,8 - 1,2) JlF = 55,6 JlF Obere Vertrauensgrenze: C

+ I1C =

(56,8

+ 1,2) JlF = 58,0 JlF

Das M ejJergebnis lautet daher wie folgt (Bild IV -18): C = (56,8 b)

± 1,2) JlF

Bei der grojJeren Irrtumswahrscheinlichkeit a2 = 5% liegen die Vertrauensgrenzen ndher zusammen. Jetzt ist t 2 = 2,09 (aus der Tabelle 1 entnommen fur 'Y2 = 1 - a 2 = 95% und n = 20). Wir erhalten diesmal eine M ejJunsicherheit von s

1,9 JlF

yn

y20

I1C = t 2

- = 09 r= '209 . -~ , r-IIF

und damit das folgende MejJergebnis: C = (56,8

± 0,9) JlF

Die Vertrauensgrenzen .liegen jetzt bei 55,9 JlF und 57,7 JlF (Bild IV -18).

bei r=99 %

I_

~

55,6

Bild IV-I8

I-

bei r=95 %

I

I 55,9

-I

56,8

57,7

-I I

C J.lF

58,0

•


674

4 "Fehlerfortpflanzung" nach Gau8 4.1 Ein einfiihrendes Beispiel Die Schwingungsdauer T eines (reibungsfrei schwingenden) Federpendels hangt bekanntlich wie folgt von der Federkonstanten (Richtkraft) D und der Schwingungsmasse m ab (Bild IV~19):

r= 2 n

n

(IV-47)

Durch Auflosen nach D erhalten wir hieraus die Funktion D ==f(m; T)

== 4n

2

m

(IV-48)

.T2

aus der sich die Federkonstante berechnen HiBt, wenn die Werte fur Masse und Schwingungsdauer bekannt sind. Wir stellen unsdaher die folgende Aufgabe: Die unbekannte Federkonstante D des Federpendels solI aus Messungen der Schwingungsmasse m und der Schwingungsdauer T bestimmt werden. Die Federkonstante D wird also nicht direkt gemessen, sondern auf indirektem Wege aus den MeBwerten von m und T berechnet. Man spricht daher in diesem Zusammenhang auch von indirekter oder vermittelnder Beobachtung.

elastische Feder (Federkonstante 0)

Bild IV-19 Schwingungsmasse

m

Federpendel

1m Sinne der Statistik konnen wir die Meligroben m und T als voneinander unabhdngige

und normalverteilte Zufailsgrolsen auffassen. Masse m und Schwingungsdauer T werden nun unabhdngig voneinander mehrmals gemessen.

4 "Fehlerfortpflanzung" nach GauB

675

Die Auswertung der dabei erhaltenen MeBreihen liefert uns die folgenden Kennwerte:

m, T:

Mittelwerte der Mebgrofien m und T

sm' ST: Standardabweichungen der Einzelmessungen beider Mebgrofien sm' sf: Standardabweichungen der beiden Mittelwerte m und T Unser Interesse gilt dann den folgenden Problemen: (1) Wie berechnet man den Mittelwert 15 der unbekannten Federkonstanten D, d.h. den

Mittelwert D der von den beiden Meligroben m und T abhangigen Zufallsgrofie = f(m; T)?

D

(2) Wie laBt sich die Standardabweichung SD der abhangigen GroBe D aus den Standardabweichungen Sm und ST der beiden unabhangigen Melsgrolsen m und T bestimmen? (3) Welcher Zusammenhang besteht zwischen den entsprechenden Standardabweichungen der M ittelwerte? (4) Wie laBt sich die Unsicherheit des indirekt bestimmten Mittelwertes Unsicherheiten der Messungen von m und T ermitteln?

D aus den

Mit den soeben an einem konkreten Beispiel angeschnittenen Fragestellungen werden wir uns in den nachsten beiden Abschnitten ausfuhrlich auseinandersetzen.

4.2 Mittelwert einer "indirekten" MeBgroBe In den Anwendungen stellt sich haufig das Problem, den Wert einer Grobe Z zu bestimmen, die noch von zwei weiteren voneinander unabhdngigen und normalverteilten Grofien X und Y abhangig ist. Der funktionale Zusammenhang zwischen den drei Zufallsvariablen X, Y und Z sei bekannt und in Form einer expliziten Funktionsgleichung

Z=f(X;Y)

(IV-49)

gegeben. Die dann ebenfalls normalverteilte abhdngige Grobe Z solI jedoch nicht direkt gemessen werden, sondern auf indirektem Wege aus den MeBwerten der beiden unabhangigen Groben X und Y unter Verwendung der Funktionsgleichung Z = f(X; Y) berechnet werden. In vielen Fallen sind namlich die Groben X und Y der Messung besser zugdnglicli als die von ihnen abhangige Grobe Z = f (X; Y). Man spricht daher in diesem Zusammenhang auch von einer indirekten oder vermittelnden Beobachtung. Dabei sind X und Y die beiden Eingangsgroflen und Z = f (X; Y) die Ausgangs- oder ErgebnisgrofJe.

•

Beispiel Die Oberflache A eines (geschlossenen) Zylinders la13t sich durch Messung von Zylinderradius r und Zylinderhohe h anhand der Formel

A = f(r; h) = Z n r?

+ 2nrh

leicht bestimmen. Diese .Jndirekre'' MeBmethode ist dabei wesentlich bequemer als eine direkte Messung der Zylinderoberflache A, da die beiden Eingangsgroben r und h der Messung besser zuganglich sind als die von ihnen abhangige Ausgangsgrofle A. •


676

Wir wollen jetzt zeigen, wie sich der gesuchte Mittelwert zder Ausgangsgrolse Z aus den Mittelwerten x und Y der beiden Eingangsgrolien X und Y bestimmen HiBt. Dabei gehen wir von den MeBreihen X 1,X Z " " , X n

und

(IV-50)

Y1,Yz,···,Yn

aus, die den gleichen Umfang n besitzen 16). Ihre Mittelwerte xund Ysind dann durch die Gleichungen x

n

1 =_. n

I

und

Xi

Y

1 n

=_.

i= 1

n

I

(IV-51)

Yi

i= 1

definiert. Die einzelnen MeBwerte besitzen vom jeweils zugehorigen Mittelwert die folgenden Abweichungen (auch "scheinbare" Fehler oder "Verbesserungen" genannt): (IV-52)

und Diese Beziehungen losen wir nach

Xi

bzw.

Yi

auf: (IV-53)

und Durch Einsetzen der MeBwerte Xi' Yi in die Funktionsgleichung fur die abhangige Grobe Z insgesamt n .indirekte" M ejJwerte z, =f(xi;yJ =f(x

Z

= f (x; y) erhalten wir

+ ui;Y + vJ

(IV-54)

Ihre Differenzen zum Wert j' (x; y) betragen dann Wi

=

f(x; y) = f(x i ; yJ - f(x; y) = f(x

Zi -

+ u.; Y + vJ -

und diirfen fur kleine Abweichungen ("Fehler") u, und totalen DifJerentiale

Vi

f(x; y)

(IV-55)

in guter Naherung durch die

d z, =fx(x;y)u i + fy(x;y)v i

(IV-56)

ersetzt werden. Somit gilt also ndherungsweise Wi = d z., d.h. (IV-57) und damit weiter (IV-58) Wir bilden nun aus diesen n .Jndirekten" MeBwerten nach der Definitionsvorschrift

1

n

'r ; I

Zi

(IV-59)

i= 1

den Mittelwert z der abhdngigen Grobe Z und erhalten unter Beriicksichtigung von Gleichung (IV-58): 16)

Die hergeleiteten Formeln bleiben auch dann giiltig, wenn die beiden Mellreihen von unterschiedlichem U mfang sind.

677

4 "Fehlerfortpflanzung" naeh GauB

Z

n

1 n

== -' i

I

Zi

=1

1( ~1 n

= -;;

i

n

1 n

== -' i

I

=1 n

n

f(x; y) + fx(x; y). i ~1 ». + fy(x; y) . i ~1

'-..--"

~

°

n·f(x;y)

) Vi

=

~

°

1

== - . n . f (x; y) == f (x; y)

(IV-60)

n

Denn die Summe der Abweiehungen ("seheinbaren Fehler") verschwindet jeweils. Somit gilt zusammenfassend:

Anmerkung Fur eine von n unabhangigen direkt gemessenen Groben Xl' X 2' Grobe (Funktion) Y == f(X 1 ; X 2 ; •.. ; X n ) gilt analog:

... ,

X n abhangige (IV-62)

(Xi: Mittelwert von Xi' i == 1,2, ... , n; y: indirekt bestimmter Mittelwert der abhangigen GroBe Y).

•

Beispiel Die Oberflache A eines Zylinders liiBt sieh aus dem Radius r und der Hohe h naeh der Formel

A == f (r; h) == 2 n r 2

+ 2 ti r h

berechnen (Zylinder mit Boden und Deckel; Bild IV-20). Fur einen speziellen Zylinder ergaben sieh dabei aus voneinander unabhangigen MeBreihen folgende Mittelwerte:

r ==

10,5 em,

Ii ==

15,0 em

Fur den M ittelwert der Z ylinderoberfldche erhalten wir damit den Wert

A == f

(r;

Ii) ==

2 n (10,5 em):' + 2 tc (10,5 em) . (15,0 em) ==

== 1682,32 cm'

~ 1682 cm'


678

h

Bild IV-20

• 4.3 Gau8sches Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) Wir wenden uns jetzt dem wichtigen Problem der sog. Fehlerfortpflanzung bei einer "indirekten" Mebgrobe Z == f (X; Y) zu. Die Standardabweichungen s, und Sy der beiden voneinander unabhangigen Mebgroben X und Y charakterisieren bekanntlich die Streuung der einzelnen MeBwerte urn ihre Mittelwerte und bewirken damit, daB auch die "indirekten" MeBwerte z, == f (Xi; yJ der Ausgangsgrolse Z == f (X; Y) urn ihren Mittelwert
z

Wie wirken sich die Standardabweichungen Sx und Sy der beiden voneinander unabhdngigen M ejJgrojJen X und Y auf die Standardabweichung Sz der abhdngigen .indirekten" M ejJgrojJe Z == f(X; Y) aus? Eine Antwort auf diese Frage erhalten wir wiederum mit Hilfe des totalen Differentials. Zunachst aber bilden wir die Abweichungen der .Jndirekten" MeBwerte Zi == f (Xi; yJ vom Mittelwert z == f(.x; jl), wobei wir die Beziehungen aus Gleichung (IV-58) verwenden: (IV-63) Da die Grolsen u, und Vi sehr klein sind, diirfen wir die Abweichung w, ndherungsweise durch das totale Differential dz, == fx(.x; y) u, + fy(.x;

y) Vi

(IV-64)

ersetzen (Wi == dz J:

w, ==

Zi -

Z == fx(.x; y) u, + fv(.x; y) Vi

(IV-65)

679


Mit den (vorubergehenden) Abkiirzungen a == fx(x;y) und b == h(x; y) wird daraus: (IV-66) Die Summe der Abweichungsquadrate betragt dann: n

n

I

wl

i=1

n

I

=

i=1

n

I

(z, - i)2 =

ta.u, + bvd

i=1 n

= a

2

•

I

I

2=

+ 2ab·

i=1

2ul

+ Tab u.», + b 2vl) =

i=1 n

ul

(a

n

I

u.»,

+b

2

i=1

I

•

(IV-67)

vl

i=1

Bei umfangreichen MeBreihen fallen dabei die sehr kleinen Abweichungen ("scheinbaren Fehler") u, und Vi gleich oft positiv und negativ aus, sodaB die mittlere Summe in Gleichung (VI-67) als vernachldssigbar klein angesehen werden kann: n

I i

u.», ~O

(IV-68)

=1

Fur die Summe der Abweichungsquadrate gilt dann ndherungsweise: n

n

I

I

wl =

i=1

n

(z, - i)2 = a 2 .

i=1

n

I

+

ul

b2 .

i=1

I

Fur die Standardabweichung Sz der .Einzelmessungen" Definitionsformel (IV-40) den folgenden Ausdruck:

S=J_l .~w~= n-1

z

L

n-1

l

erhalten wir damit aus der

I

(z, - i)2 =

i= 1

n

a 2 . _1_ . ~ u.2 n-1 L l

a2.

Zi

n

i= 1

== J

(IV-69)

vl

i=1

n

+ b? . _1_. ~ n-1

L

V2 i

==

s; + b 2 . s; == J(fx(x; y))2 . s; + (f(x; y))2 . s; ==

== J(fx(x; y) . sx)2 + (fy(x; y) . Sy)2

(IV-70)


680

Dies ist das sog. GaujJsche Fehlerfortpflanzungsgesetz fur die Standardabweichung der Einzelmessung. Durch Quadrieren erhalt man daraus eine entsprechende Beziehung fur die Varianzen: (IV-71) Es handelt sich dabei urn das sog. Varianzfortpflanzungsgesetz fur voneinander unabhdngige Zufallsvariable X und Y. Bei der Herleitung eines entsprechenden Fehlerfortpflanzungsgesetzes (Varianzfortpflanzungsgesetzes) fur die Standardabweichung des M ittelwertes berucksichtigen wir, daB zwischen den Standardabweichungen sx' Sy und Sz der Einzelmessungen und den Standardabweichungen sx' Sy und Sz der Mittelwerte die folgenden Beziehungen bestehen:

Sx s-=-'

Xj;;

Sy s-=-,

Yj;;

Sz s-=-

Zj;;

(IV-72)

Aus Gleichung (IV-71) folgt dann, wobei wir vorubergehend wieder die Abkiirzungen a = fx(x; y) und b = fy(x; y) verwenden:

= J(fx(x; y) . sx)2 + (h(x; y) . Sy)2

(IV-73)

Dies ist das GaujJsche Fehlerfortpflanzungsgesetz fur die Standardabweichung des M ittelwertes. Durch Quadrieren erhalt man hieraus eine entsprechende Beziehung zwischen den Varianzen, namlich das sog. Varianzfortpflanzungsgesetz fur die Varianz des M ittelwertes bei voneinander unabhdngigen Zufallsvariablen X und Y: (IV-74)

Wir fassen nun die wichtigsten Ergebnisse wie folgt zusammen:

681


Anmerkung Das GaujJsche Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) HiBt sieh ohne Sehwierigkeiten aueh auf Funktionen von mehr als zwei Variablen ausdehnen. Sind Xl' X 2' ... , X n voneinander unabhdngige und normalverteilte Melsgrolsen mit den Mittelwerten Xl' X2 , ... , Xn und den Standardabweiehungen sX 1 ' SX2' , sX so gilt fur die Standardabweichung der .Jndirckten" Melsgrolie Y == f (X l; X 2; ; X n ) das folgende Gesetz: n

Sy ==

J (fx

1

. sx 1 )2 + (fx 2 . sx 2 )2 + . . . + (fx n . sx n )2

'

(IV-77)

In die partiellen Ableitungen L; fX2' ... , t.. sind dabei die M ittelwerte der direkt gemessenen Eingangsgrolien Xl' X 2' ... , X n einzusetzen. Ersetzt man in Gleiehung (IV-77) die Standardabweiehungen der Einzelmessungen dureh die entspreehenden Standardabweichungen der Mittelwerte, so erhalt man das GaujJsche Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) fur die Standardabweichung des Mittelwertes bei n voneinander unabhangigen Variablen.

•

Beispiel Wir kehren zu dem Beispiel des vorherigen Absehnitts zuruck iOberfldche eines Z ylinders). Fur Radius r und Hohe h des Zylinders liegen folgende MeBergebnisse vor: Radius r:

r == 10,5 em,

s., == 0,2 em

Hohe h:

h == 15,0 em,

sTz

== 0,3 em


682

Fur den Mittelwert der Zylinderoberflache A erhielten wir bereits aus der Formel A

= f(r; h) = 2nr 2 + 2nrh

den Wert "It = 1682 em 2. Wir interessieren uns jetzt fur die Standardabweichung SA dieses Mittelwertes. Sie liiBt sieh aus dem Gauj3schen F ehlerfortpflanzungsgesetz (IV-76) bereehnen. Die dabei benotigten partiellen Ableitungen 1. Ordnung der Funktion A = f(r; h) lauten:

oA

-=4nr+2nh, or

oA

-=2nr oh

Fur r und h setzen wir noeh die Mittelwerte

oA

-

oA

-

- (r; h) or oh (r; h)

r = 10,5 em und h = 15,0 em ein:

= 4 n(10,5 em) + 2 n(15,0 em) = 226,19 em = 2n(10,5 em) = 65,97 em

Aus dem Gaufischen Fehlerfortpflanzungsgesetz (IV-76) folgt dann fur die Standardabweichung des Mittelwertes "It = 1682 cm' der folgende Wert:

s- = A

J(OAor .S_)2 + (OAoh .S_)2 = h

r

= J(226,19 em . 0,2 cmr'

= 49,38 cm '

+ (65,97 em . 0,3 em)2 =

~ 49 cm '

4.4 Me8ergebnis fur eine "indirekte" Me8gro8e Das Mefiergebnis fur eine .Jndirekte" Meligrofie Z = f (X; Y)

•

besteht dann aus der Angabe des Mittelwertes z = f (x; y)und der aus dem GauBsehen Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) bereehneten Standardabweichung Sz dieses Mittelwertes, die im Rahmen der .Fehlerrechnung" als ein geeignetes Genauigkeitsmafi fur den Mittelwert und somit aueh als Mafi fur die Unsicherheit Az des "MeBergebnisses" Z = f (x; y) betraehtetwird.


683

Daher gilt:

Anmerkungen (1) Fur eine von n unabhangigen Grolien Xl' X 2' ... , X n abhangige "indirekte" MeBgrolie Y ==! (X 1; X 2; ... ; X n ) lautet das MefJergebnis entsprechend: y

== y ± ~y

(IV-83)

Dabei ist

y = !(X 1 ; X2 ; · · · ; Xn )

(IV-84)

der Mittelwert und (IV-85)

die Standardabweichung und damit die Meflunsicherheii dieses Mittelwertes. Die MeBergebnisse fur die unabhangigen Meligroben sind dabei in der iiblichen Form (IV-86)

684

IV Fehler- und Ausgleichsrechnung vorgegeben (Xi ist der M ittelwert, ~Xi == SXi die Standardabweichung und damit die M efJunsicherheit fur die direkt gemessene Grobe Xi' i == 1, 2, ... , n). Die partiellen Ableitungen fX1' fX2' ... , L, sind dabei stets fiir die Mittelwerte zu bilden.

(2)

Unter sehr speziellen Voraussetzungen HiBt sich auch ein Vertrauensintervall fur den unbekannten "wahren" Wert (Mittelwert) /lzder "indirekten" Meligrobe Z == f (X; Y) angeben. Im Rahmen dieser einfiihrenden Darstellung konnen wir auf dieses Problem nicht naher eingehen (siehe hierzu auch DIN-NORM 1319, TeiI4).

Fur einige in den Anwendungen besonders haufig auftretende Funktionen lassen sich fertige Formeln fur die MeBunsicherheit (Standardabweichung) des Mittelwertes herleiten. Wir haben sie in der nachfolgenden Tabelle 2 zusammengestellt.

Tabelle 2: MeBunsicherheit (Standardabweichung) des Mittelwertes fiir einige besonders haufig auftretende Funktionen (C E lR)

Anmerkungen zur Tabelle 2 (1) Die angegebenen Formeln erhalt man unmittelbar aus dem GaufJschen Fehlerfortpflanzungsgesetz (IV-76). (2)

Man beachte: Die Groben Ax, (absolute "Fehler"), die Groben

~y

und L\z sind absolute MeBunsicherheiten

I~XI,

lA/I

und

IA:I

dagegen relative oder

prozentuale MeBunsicherheiten. (relative oder prozentuale .Fehler''). (3)

Analoge Formelnlassen sich herleiten fur Summen, Differenzen und Potenzprodukte mit mehr als zwei Summanden bzw. Faktoren.

4 "Fehlerfortpflanzung" nach GauB •

685

Beispiele

(1)

Bestimmung einer Federkonstanten (Federpendel)

Die Federkonstante D der elastischen Feder eines Federpendels HiBt sich nach der Formel m D = f(m; T) = 4n 2 . T 2 = 4n 2 . m· T- 2

aus der Schwingungsmasse m und der Schwingungsdauer T berechnen (vgl. hierzu Bild IV-19). In unabhangigen Versuchen wurden m und T zehnmal wie folgt gemessen:

i m

-

g T -

s

1

2

3

4

5

6

7

8

9

10

198

199

203

200

202

198

201

197

203

199

2,01

2,04

1,96

1,98

2,00

2,05

1,97

1,98

2,04

1,97

Anhand der folgenden Tabelle berechnen wir zunachst die benotigten Mittelwerte m und T und deren Standardabweichungen (Unsicherheiten) sm und sf:

198

-2

2

199

-1

3

203

3

4

200

5

202

°

6

198

7

201

8

197

-3

9

203

3

10

199

-1

2

-2

2,01

0,01

2,04

0,04

16

9

1,96

- 0,04

16

°

1,98

-0,02

4

4

2,00

0

4

2,05

°

4

0,05

25

1,97

-0,03

9

9

1,98

-0,02

4

9

2,04

0,04

16

1,97

-0,03

9


686 10

1 10

1 . 2000 g 10

m == - ' \' m, == -

c.

==

200 g

i= 1

~ ~ ·42 g2 =

1 . \' im, ~ m)2 = 10 . (10 - 1) . ~ 10

1=

90

1

0,68 g

~ 0,7 g

10 1 1 T==-· 1; = 10 . 20,00 s = 2,00 s

I

10

i= 1

1 I

10

.

Sy==

10 . (10 - 1).

-

(T - T)

)1

r------~'

2

==

-

90

l

1=1

==

0,0105 s

~

.

100 . 10- 4s2

==

0,01 s

Das MeBergebnis fur die beiden Mebgronen m und T lautet damit (in der ublichen Schreibweise): m

==

m ± Sm == m± sm == (200 ± 0,7) g

T == T

± ~T==

T

± Sy== (2,00 ± 0,01) s

Fur die Federkonstante D erhalten wir den folgenden M ittelwert:

-

-

D == f(m' T) == 4 n 2

,

.

200 g , == 19739 g/S2 ~ 1 974 kg/s' == (2,00 S)2 ' ,

== 1,974 Nzm

Die fur die .Fehlerfortpflanzung" benotigten partiellen Ableitungen der Funktion D == f(m; T) lauten:

aD ==

-

aT

aD, -

- 8 n 2 . m' T- 3 == - 8 n 2

4n 2

-(m'T)== ' ==98696s- 2 am' (2,00 S)2 '

aD(m.Y)= -8][2. 200g = -19739g/s3

aT '

(2,00 S)3

'

m

'3

T

687


Damit erhalten wir .aus dem Gauflschen Fehlerfortpflanzungsgesetz (IV-76) die folgende M eflunsicherheit (Standardabweichung) fur den Mittelwert 15:

AD = sv=

J(~Amr + (~AT

= J(9,8696 s - 2 . 0,68 g)2

r

+ (- 1973,9 g . s - 3 . 0,0105 S)2 =

= 21,79 g/S2 = 0,0218 kg/s' ~ 0,022

Nzm

Das M efiergebnis fur die .Jndirekte'' Mefigrofie D lautet somit D

= 1,974 N/m,

Sf)

= 0,022 N/m

oder (in der im teehnisehenBereieh iiblichen Sehreibweise) D = D

± I1D =

D

± sf) =

(1,974

± 0,022) Nzm

Die prozentuale MeBunsieherheit der abhangigen Grobe D betragt

-~D I = 0,022 N/m '100% = 11%

I 15

1,974 N/m

'

Anmerkung Da D = 4 ti 2 . m . T - 2 ein Potenzprodukt der Melsgroben m und T ist, konnen wir fur die Bereehnung der MeBunsieherheit der abhangigen Grobe D aueh die in der Tabelle 2 angegebene fertige F ormel verwenden (mit C = 4 tt 2, = m, Y = T, a = 1 und f3 = - 2). Wir erhalten natiirlich das bereits bekannte Ergebnis:

X

2

1 . _0,6_8_g 1 1 200 g

2

+ 1_ 2 . _0,0_1_05_s 1 2,00s

= 0,0110 ~ 1,1%

(2)

Dichte einer Eisenkugel Masse m und Durchmesser d einer Eisenkugel wurden aus unabhangigen MeBreihen wie folgt bestimmt: Masse:

m=

560,7 g,

Durehmesser:

d ==

S/11

= 0,5 g

5,11 em,

Sd == 0,02 em

Die Dichte Q laBt sieh dann wie folgt aus den beiden Meligroben m und d bereehnen: Q=

j (m; d)

m

6 m

= - = - .- 3 V tc d

6

= - . m . dtc

(V = ~ d 3 ist das Volumen der Kugel).

3


688

Somit erhalten wir fur die Diehte den folgenden Mittelwert:

o- == f

6 (m; d) == -

560,7 g 3 == 8,025 g/cm tt (5,11 ern}' 0

Fur die Bereehnung der Mej3unsicherheit (d.h. der Standardabweiehung des Mittelwertes g) benotigen wir noeh die partiellen Ableitungen 1. Ordnung der Funktion 0 == f (m; d). Sie lauten:

00 6 -4 == -n . m( - 3 d )== od

m d4

18

-_o-

n

Wir setzen die Mittelwerte mund

d ein

und erhalten:

00 6 1 -(m·d)==-· ==00143em- 3 om' tc (5,11 em}' '

oQ (m d) = _ 18 ° 560,7 g = _ 47116 g/cm" od' ti (5,11 em)" ' o

Das

GauBsehe

F ehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz)

(IV -76) liefert uns dann den folgenden Wert fur die M ej3unsicherheit von 0:

!1Q = s- = Q

J(

(0

0 oQ !1m)2 + om od

== J(0,0143 em -3 ·0,5 g)2

J1d)2

+ (- 4,7116 g . em -4

0

0,02 ern)? ==

== 0,095 g/cm' Das M ej3ergebnis fur die Diehte der Eisenkugel lautet dann wie folgt:

g ==

8,025 g/cm',

sQ

== 0,095 g/cm'

oder

o == g ± J10 == g ± sQ == (8,025 ± 0,095) g/cm' (3)

Reihenschaltung von ohmschen Widerstanden Bild IV -21 zeigt eine Reihenschaltung aus drei ohmsehen Widerstanden, die wie folgt gemessen wurden: R 1 == (100

± 2) Q,

R 2 == (150

± 2) Q,

R 3 == (50

± 1)Q

Bild IV-21

Reihenschaltung aus drei ohmschen Widerstanden

689


Den Gesamtwiderstand R dieser Schaltung erhalt man nach den Kirchhoffschen Regeln als Summe der Einzelwiderstande: R = f(R 1 ; R z ; R 3 ) = R 1

+ R: + R 3

Der Mittelwert der .Jndirekten'' Mebgrolse R betragt somit: R = j'(R 1 ; «; R 3 ) = 100 Q + 150 Q + 50 Q = 300 Q Wir berechnen nun die Standardabweichung dieses Mittelwertes, d.h. die Mej3unsicherheit L1.R des Gesamtwiderstandes unter Verwendung von Tabelle 2 (Verallgemeinerung der Funktion Z = f (X; Y) = X + Y fur drei Summanden). Somit gilt: L1.R = J(L1.R1)Z + (L1.R z)Z + (L1.R 3)Z = J(2 Q)Z + (2 Q)Z + (1 Q)Z = 3 Q Damit erhalten wir fur den Gesamtwiderstand R das folgende Mej3ergebnis: R = R

± L1.R = (300 ± 3) Q

Die prozentuale MeBunsicherheit betragt 3Q % -L1.RI = --.100 = 10/0

I Ii

300Q

•

5 Ausgleichs- oder Regressionskurven In den naturwissenschaftlich-technischen Anwendungen stellt sich haufig das Problem festzustellen, ob zwischen zwei Variablen (Zufallsvariablen) X und Y irgendeine Beziehung oder Abhdngigkeit besteht und welcher Art diese gegebenenfalIs ist. In Kap. III, Abschnitt 6 haben wir dieses Problem bereits angeschnitten und dort die Begriffe Korrelation und Regression kennengelernt. In diesem Abschnitt werdenwir nun zeigen, wie man in der Praxis aus einer aus n MeBpunkten bestehenden Stichprobe eine Regressionsoder Ausgleichskurve ermitteln kann, die den Zusammenhang zwischen den beiden VariabIen in "optimaler" Weise beschreibt.

5.1 Ein einfiihrendes Beispiel Zwischen zwei physikalisch-technischen Grolsen X und Y solI auf experimentelIem Wege ein [unktionaler Zusammenhang hergestellt werden. Die aufgrund verschiedener Messungen erhaltenen n Wertepaare (Xi; yJ konnen dann als Punkte Pi = (Xi; yJ in einer X, yEbene bildlich dargestellt werden (i = 1, 2, ... , n). Die Aufgabe der Ausgleichsrechnung besteht nun darin, eine Kurve y = f (x) zu bestimmen, die sich diesen MeBpunkten .anoglichst gut" anpaBt. Aus dieser Regressions- oder Ausgleichskurve laBt sich dann zu einem vorgegebenen Wert X der unabhangigen Grobe X der zugehorige Wert y der von X abhangigenGrofie Y schdtzen.


690

Wir wollen dieses Problem zunachst an einem einfachen Beispiel naher erlautern, In einem Experiment solI die Temperaturabhdngigkeit eines ohmschen Widerstandes R in einem bestimmten Temperaturintervall untersucht werden. Dazu wurde der Widerstand bei acht verschiedenen Temperaturen jeweils genau einmal gemessen. Das MeBprotokoll hatte dabei das folgende Aussehen: i

1

2

3

4

5

6

7

8

~

20

25

30

40

50

60

65

80

16,30

16,44

16,61

16,81

17,10

17,37

17,38

17,86

°C

Ri

-

Q

Die acht Wertepaare (~; RJ fiihren dann zu acht MeBpunkten Pi == (i == 1, 2, ... , 8), die nach Bild IV-22 nahezu auf einer Geraden liegen.

(~;

RJ

R Q

18

17 Bild IV-22 Zur Temperaturabhangigkeit eines ohmschen Widerstandes: Die MeBpunkte liegen nahezu auf einer Geraden

16

15 --+----+------l---l----4---f---+-----+---f--

10

20

30

40

50

60

70

80

-

T

DC

Es gelingt nun ohne groBe Schwierigkeiten, .frei nach AugenmaB" eine Gerade einzuzeichnen, die sich diesen MeBpunkten "besonders gut" anpaBt (Bild IV-:-22). Die Streuung der MeBpunkte urn den geradlinigen Verlauf fuhren wir dabei auf die unvermeidlichen "Zufallsfehler" (zufalligen MeBabweichungen) zuruck. Aus dem MeBprotokollentnehmen wir z.B., daB bei einer Temperatur von 50°C ein Widerstandswert von 17,10 Q gemessen wurde. Wiirden wir jedoch bei dieser Temperatur die Widerstandsmessung mehrmals wiederholen, so erhielten wir infolge der unvermeidlichen zufiilligen MeBabwei-


691

chungen stets etwas voneinander abweichende Widerstandswerte 17). Die Gerade in Bild IV -22 wurde dabei so gelegt, daf sie die Streuung der Mefipunkte nach beiden Seiten hin .moglichst gut ausgleicht". Allerdings ist die Auswahl einer solchen Ausgleichs- oder Regressionsgeraden subjektiv bedingt. Verschiedene Personen werden namlich i.a. zu einem unterschiedlichen Urteil kommen und daher verschiedene Geraden als "besonders gut angepalit" ansehen. An dieser Stelle setzt nun die Ausgleichsrechnung ein. Sie liefert uns mit der von Gauj3 stammenden "Methode der kleinsten Quadrate" ein objektives Hilfsmittel zur Losung der gestellten Aufgabe. Wir erhalten nach dieser Methode eine eindeutig bestimmte Gerade, wie in Abschnitt 5.3 noch ausfiihrlich dargelegt wird.

5.2 Ausgleichung nach der "Gau8schen Methode der kleinsten Quadrate" Wir formulieren die Aufgabe wie folgt: Mitden Methoden der Ausgleichsrechnung soll aus n gemessenen Wertepaaren (Mej3punkten) (Xi; yJ (i = 1, 2, ... , n) ein miiglichst einfacher funktionaler Zusammenhang zwischen den Mej3groj3en X und Y hergeleitet werden. Als Ergebnis erwarten wir dabei eine Funktion y = f (x), die sich den MeBpunkten .moglichst gut" anpalst und daher in diesem Zusammenhang als Ausgleichs- oder auch Regressionskurve bezeichnet wird. 1m Bereich der Technik wird dabei meist unterstellt, daf die als unabhangige Variable betrachtete Mefrgrobe X .fehlerfrei" gemessen wird, d. h. die unvermeidlichen zufdlligen MeBabweichungen der x- Werte werden im Vergleich zu denen der y- Werte als vernachldssigbar klein angesehen. Dies aber bedeutet, daf wir die unabhangige Meflgrolie X als eine gewohnliche Variable auffassen diirfen, deren feste Werte auch bei Versuchswiederholungen unverdndert bleiben. Die von der (gewohnlichen) Variablen X abhangige Mebgrolse Y ist dagegen eine Zufallsvariable, da die bei festem X = x in Versuchswiederholungen erhaltenen Werte dieser Variablen infolge der unvermeidlichen zufdlligen Mebabweichungen ("Zufallsfehler") urn einen Mittelwert streuen. Als Maj3 fiir die (zufallsbedingte) Abweichung zwischen Mebpunkt und Ausgleichskurve fiihren wir den vertikalen Abstand, d.h. die Ordinatendifferenz ein (Bild IV-23). Der Abstand des Mefipunktes Pi = (Xi; yJ von der gesuchten (aber noch unbekannten) Ausgleichskurve y = f (x) betragt damit 18) (IV-87)

1 7)

18)

Streng genommen sind auch die Temperaturangaben .fehlerhaft". Wir unterstellen aber, daB die MeBungenauigkeiten der Temperaturwerte im Vergleich zu den entsprechenden MeBungenauigkeiten der Widerstandswerte vernachldssigbar klein sind. Die unabhangige Melsgrolse T wird somit wie eine gewohnliche Variable behandelt, deren Werte in kontrollierbarer Weise "exakt" eingestellt werden konnen. Dagegen wird die von. T abhangige MeBgroBe R als eine Zufallsvariable betrachtet. Wir konnen namlich aufgrund der unvermeidlichen zufalligen MeBabweichungen nicht exakt vorhersagen, welchen Wert der Widerstand R bei fest vorgegebener Temperatur T tatsachlich besitzt. Liegt der MeBpunkt Pi oberhalb (unterhalb) der Ausgleichskurve, so ist Vi > 0 (Vi < 0).

IV· Fehler- und Ausgleichsrechnung

692 y

• = (Xi; y;)

Pi

•

Ausgleichskurve Y= f(x)

Bild IV-23 MeBpunkte Pi = (Xi; yJ mit .Ausgleichskurve" X

Xi

Eine objektive Methode zur Bestimmung der "giinstigsten" Kurve, eben der Ausgleichskurve, liefert die Gaufische Methode der kleinsten Quadrate. Danach paBt sich diejenige Kurve den vorgegebenen MeBpunkten "am besten" an, fur die die Summe der Abstandsquadrate aller n MeBpunkte ein Minimum annimmt: n

S=

n

I

Vi2 =

I

(Yi -

f

(Xi))2

->

Minimum

(IV-88)

i= 1

i= 1

Wie man dieses Minimum mit den Hilfsmitteln der Differentialrechnung bestimmt, zeigen wir etwas sparer. Von groBer Bedeutung fur die Losung der gestellten Aufgabe ist dabei die Wahl eines geeigneten Funktionstyps, der der Ausgleichsrechnung zugrunde gelegt werden solI. Der Losungsansatz fur eine Ausgleichskurve ist naturgemaf von Fall zu Fall verschieden. Eine Entscheidung fur einen bestimmten Funktionstyp laBt sich daher stets nur am konkreten Einzelfall treffen, z.B. aufgrund theoretischer Ubcrlcgungen oder aber anhand der Punktwolke, die die n MeBpunkte im Streuungsdiagramm bilden. Liegen die MeBpunkte beispielsweise nahezu in einer Linie, so wird man einen Losungsansatz in Form einer linearen Funktion vom Typ y

== ax

+b

(IV-89)

wahlen (Ausgleichsgerade; Bild IV-24). Fur eine Punktwolke wie in Bild IV-25 ist eine solche lineare Ausgleichung dagegen wenig sinnvoll. Hier wird man sich zu Recht fiir einen quadratischen Losungsansatz in Form einer Ausgleichs- oder Regressionsparabel vorn Typ y == ax'

+ bx + c

(IV-90)

entscheiden. In beiden Fallen lassen sich dann die Kurvenparameter (a und b bzw. .a, b und c) so aus der vorgegebenen Stichprobe (Xi; Yi) bestimmen, daB die jeweils ausgewahlte Kurve sich den MeBpunkten "optimal" anpaBt.


693

y

Ausgleichsgerade

Bild IV-24 Ausgleichsgerade

x

y

• Ausgleichsparabel

•

Bild IV-25 Ausgleichsparabel

x

Lineare Funktionen treten dabei in den technischen Anwendungen besonders haufig auf. Man spricht daher in diesem Zusammenhang auch von linearer Ausgleichung oder linearer Regression. Aber auch Parabeln, Polynomfunktionen hoherer Ordnung, Potenz-, Exponential- und Logarithmusfunktionen sowie einfache gebrochen-rationale Funktionen spielen eine groBe Rolle bei der Festlegung des Funktionstyps einer Ausgleichskurve. Die in diesen Funktionen enthaltenen Parameter sind dann jeweils so zu bestimmen, daB das Gaufische M inimierungsprinzip (IV-88) erfiillt wird. In Tabelle 3 haben wir einige besonders einfache, aber haufig auftretende Losungsansatze fur Ausgleichskurven zusammengestellt. Die jeweiligen Kurvenparameter sind ebenfalls angegeben.

Im konkreten Fall geht man nun folgendermaBen vor: Zunachst muB man sich aufgrund der genannten Uberlcgungcn fur einen bestimmten Liisungsansatz y == f (x) fur die gesuchte Ausgleichs- oder Regressionskurve entscheiden, wobei das Streuungsdiagramm, d.h. die bildliche Darstellung der n MeBpunkte (Xl; Yl)' (x 2; Y2)' ... , (x n; Yn) als Punktwolke, eine wesentliche Entscheidungshilfe liefert.

694


Dann werden die im Losungsansatz enthaltenen Funktionsparameter a, b, ... so bestimmt, daB die von diesen Parametern abhangige Summe der Abstandsquadrate n

L (Yi - f(XJ)2

S(a; b; ...) = i

(IV-91)

=1

ein Minimum annimmt. Nach den Regeln der Differentialrechnung ist dies der Fall, wenn die partiellen Ableitungen 1. Ordnung von S (a; b; ...) verschwinden 19):

as

aa == 0,

as

(IV-92)

ab == 0, ...

Aus diesem Gleichungssystem lassen sich dann die Parameter a, b, ... und damit die Ausgleichskurve eindeutig bestimmen. Die Gleichungen (IV-92) heiBen N ormalgleichungen. Sie sind i.a. nicht-linear und daher meist nur numerisch unter erheblichem Rechenaufwand zu losen. Nur in einfachen Fallen erhalt man ein (quadratisches) lineares Gleichungssystem, daB mit Hilfe des Gauj3schen Algorithmus gelost werden kann. Tabelle 3: Einfache Losungsansatze fur Ausgleichs- oder Regressionskurven

y==ax 2 + b x + c

a,b,c

a,b

19)

y

== a . e bx

a,b

y

== a . In (bx)

a,b

ax + b b y==---==a+x x

a,b

a y==x+b

a,b

ax y==x+b

a,b

Die Gleichungen (IV-92) sind notwendig, jedoch keinesfalls hinreichend fur die Existenz eines Minimums. Man mull dann von Fall zu Fall entscheiden, ob tatsachlich ein Minimum vorliegt.


695

Wir fassen die Ergebnisse zusammen:

Anmerkungen (1)

Die MeBwertepaare (Xl; Yl)' (X2; Y2)' ... , (Xn; Yn) reprasentieren eine zweidimensionale Stichprobe, die man der (X; Y)-Grundgesamtheit entnommen hat. Die als unabhdngig angesehene Variable X ist dabei in den technischen Anwendungen meist eine gewohnliche Variable, wahrend die abhdngige Meligrolre eine Zufallsvariable darstellt (X ist eine .Jehlerfreie", Y dagegen eine mit zufdlligen M efJabweichungen versehene MeBgroBe).

(2)

Eine Ausgleichung ist nur moglich, wenn die Anzahl n der MeBpunkte grofJer ist als die Anzahl der Kurvenparameter. Die Anzahl der Normalgleichungen, aus denen die Parameter berechnet werden, entspricht dabei stets der Anzahl der Parameter.

Konkrete Beispiele fur Ausgleichsprobleme folgen in den nachsten Abschnitten.

696


5.3 Ausgleichs- oder Regressionsgerade Wir behandeln in diesem Abschnitt den in den Anwendungen besonders haufig auftretenden und zugleich einfachsten Fall einer linearen Ausgleichskurve Y == ax + b, die als Ausgleichs- oder Regressionsgerade bezeichnet wird.

5.3.1 Bestimmung der Parameter einer Ausgleichsgeraden Fur den vertikalen Abstand Vi zwischen dem MeBpunkt Pi == (Xi; der Ausgleichsgeraden

y

==

f

(x)

ax

==

yJ (i == 1,2, ... , n) und

+b

(IV-95)

gilt dann nach Bild IV-26:

Vi

==

Yi - j'(xJ

==

Yi - (ax i + b) == Yi - aX i - b

(IV-96)

y

•

Ausgleichsgerade

Bild IV-26

Zur Bestimmung der Ausgleichsoder Regressionsgeraden x

Die Parameter a und b werden dabei nach der Gauj3schen Methode der kleinstenQuadrate so bestimmt, daf die Summe der Abstandsquadrate 11

S(a; b) =

I

(Yi - ax, -

W

(IV-97)

i= 1

ihren kleinsten Wert annimmt. Dies ist nach (VI-94) der Fall, wenn die partiellen Ableitungen 1. Ordnung

as oa = 2·

I

11

i= 1

I (11

(Yi - ax, - b) . (- Xi) = 2·

XiYi

+ ax? + bx;)

(IV-98)

i= 1

(IV -99)

verschwinden.

697

5 Ausgleichs- oder Regressionskurven Wir erhalten daraus die N ormalgleichungen

(IV -100)

die ein lineares Gleichungssystem mit zwei Gleichungen und zwei Unbekannten reprasentieren 20). Das System besitzt genau eine Losung, da die Koeffizientendeterminante nicht verschwindet:

D=

=

IX

i

n.

I x? - (I x)

2

1

n

1

=

~ .I

I (Xi ~ xy > 0

(IV-l01)

J

Mit den beiden Hilfsdeterminanten

(IV-l02)

und

(IV-l03)

erhalten wir nach der Cramerschen Regel die folgende Losung:

I XiYi - (I x) (IYi)

n· D1 1 1 1 a = - = ----------D 2 n . Xi -

I 1

20)

(I xy

(IV -104)

1

Wir lassen im folgenden bei vielen Zwischenrechnungen die Summationsgrenzen weg. Der Summationsindex (meist i; manchmal auch j) lauft dabei stets von 1 bis n.


698

(IV-l05)

Auch das fur ein Minimum hinreichende Kriterium (Gleichung (IV-80) aus Band 2) ist erfiillt. Mit (IV-106)

und

folgt namlich

(IV-107)

Die Ausgleichsgerade y == ax

+ b ist

damit eindeutig bestimmt.

Unter Verwendung der aus den x- bzw. y-Komponenten der MeBpunkte gebildeten M ittelwerte

_ 1 x = ~.

IX

(IV-l08)

und

i

lassen sich die soeben hergeleiteten Berechnungsformeln fur die Steigung a, auch empirischer RegressionskoefJizient genannt, und den Achsenabschnitt b der Ausgleichsgeraden y == ax + b auch wie folgt umformen:

Steigung (RegressionskoefJizient) a: n: a

(Ix) (~Yi) I n . I xf - (I x)

~ XiYi l

n:

l

l

== - - - - - - - - - -

i

XiYi - (nx)(ny)

I XiYi - nxy i

2

l

l

(IV-109)

699

5 Ausglcichs- oder Regressionskurven

Achsenabschnitt b:

b

(I =

(Ix) (I n. I xl ~ ( I x)

l

Xi ) (IY) -

1

1

1

XiY)

1

1

1

(I

1

l) ny- (nx)

Xi

(I

1

XiY)

1

(I xl)Y - x(I 1

XiYi)

1

(Im Zahler wird der Term nx 2 y addiert und gleichzeitig wieder subtrahiert)

(L\ 2) Y-- x-(\L Yi) + nx-2 Y-- nx-2 YXi

Xi

1

1

(I xl - nXl) y - (I 1

XiYi -

nxy)x

I XiYi -

nxy

1

x=

-

=y-

x

= y- - ax-

(IV-110)

'-v-'

a Der Parameter b HiBt sich daher aus dem RegressionskoefJizient a nach der F ormel

b=

Y-

berechnen.

ax

(IV-111)


700

Mit Hilfe dieser Beziehung HiBt sich die Ausgleichs- oder Regressionsgerade auch auf die folgende symmetrische Form bringen: y -

y=

a(x - x)

Denn aus y = ax

+ b folgt

(IV-112) unter Verwendung der Formel (IV-111) unmittelbar:

y=ax+b=ax+y-ax=a(x-x)+y

=>

y-y=a(x-x)

(IV-113)

Die Ausgleichsgerade verlauft somit durch den "Schwerpunkt" S = (x; y) der Punktwolke (Xl; Yl), (x 2; Y2)'···' (x n; Yn) (Bild IV-27).

Wir fassen die bisherigen Ergebnisse wie folgt zusammen:

70J

5 Ausgleichs- oder Regressionskurven y

•

• •

Ausgleichsgerade

-

y

"Schwerpunkt" S

•

•

Bild IV-27 Die Ausgleichsgerade verlauft durch den "Schwerpunkt""

S = (x;y)

x

Anmerkungen (1)

Die Bestimmung einer Ausgleichsgeraden ist nur rnoglich, wenn mindestens drei MeBpunkte vorliegen (n ~ 3).

(2)

Die vorgegebenen n MeBpunkte sind im Sinne der Statistik als eine zweidimensionale Stichprobe (Xl; Yl)' (X2; Y2)' ... , (Xn; Yn) aufzufassen, die einer zweidimensionalen Grundgesamtheit (X; Y) entnommen wurde. Zwischen den Zufallsvariablen X und Y besteht dann die lineare Beziehung

Y - /ly = a*(X - /lx)

(IV-117)

Sie wird als Regressionsgerade der Grundgesamtheit bezeichnet, wo bei X als unabhiingige und Y als von X abhdngige Variable angesehen wird. /lx und /ly sind die Erwartungs- oder Mittelwerte der beiden Variablen: E(X) = /lx und E(Y) = /ly. Die Steigung a* ist der zugehorige Regressionskoeffizient. Der empirische Regressionskoeffizient a ist dabei euiSchdtz- oder N dherungswert fur den theoretischen Regressionskoeffizienten a*, d.h. a* ~ a.

•

Beispiel Wir kommen auf das zu Beginn behandelte einfuhrende Beispiel zuriick (Bestimmung der Temperaturabhdngigkeit eines ohmschen Widerstandes). Dort hatten wir bereits erkannt, daf die acht MeBpunkte nahezu auf einer Geraden liegen (vgl. hierzu Bild IV -22). Der lineare Ansatz R

=

R (T)

=

aT

+b

ist daher gerechtfertigt.

702

IV Fehler- und Ausgleichsrechnung Die Berechnung der noch unbekannten Koeffizienten (Parameter) a und b erfolgt dabei zweckmalsigerweise mit Hilfe der folgenden Tabelle:

20

16,30

400

326

2

25

16,44

625

411

3

30

16,61

900

498,3

4

40

16,81

1600

672,4

5

50

17,10

2500

855

6

60

17,37

3600

1042,2

7

65

17,38

4225

1129,7

8

80

17,86

6400

1428,8

Mittelwerte T und R:

I

8

-T = -1 . 8 i

T = -1 . 370°C = 46 25°C l 8 '

=1

I

8

-R = _. 1 8

R· = 1_. 135 87 Q = 1698375 Q l

8

'

.,

i= 1

Regressionskoeffizient a: 8

I

I;R; -

8TR

i= 1

a=-----8

I i

=

I;2_8T 2

=1

6363,4 °C Q - 8 (46,25 °C) (16,98375 Q) Q =002531120250 (OC)2 - 8 (46,25 °C)2 ' °C


703

Die Ausgleichsgerade lautet somit in der speziellen symmetrischen Form (IV-116) wie folgt: R-

Ii == a(T -

T)

,

Q

R - 16,98375 Q

== 0,025311 0C (T - 46,25 °C)

In der Hauptform erhalten wir

R

=

(0,o253

o~) .T + 15,8131 Q

(Bild IV-28). Die Kurvenparameter a und b besitzen somit die Werte Q

b == 15,8131 Q

und

a == 0,0253 0C

R Q

18

17

16 Bild IV-28 15-+--+----+--~--+----+--+-----+----f---I---

10

20

30

40

50

60

70

80

Mit Hilfe der Ausgleichs- oder Regressionsgeraden konnen wir jetzt im Temperaturbereich zwischen 20°C und 80°C vemiinftige Schiitzwerte fur den ohmschen Widerstand erhalten. Z.B. erwarten wir bei einer Temperatur von T == 45°C einen Widerstandswert von R (T

= 45°C) = (0,0253

o~)- 45°C + 15,8131 Q = 16,9516 Q ~ 16,95 Q

•

704


5.3.2 Streuungsma8e und Unsicherheiten bei der Parameterbestimmung Wir beschaftigen uns in diesem Abschnitt mit der Streuung der MeBpunkte (Xi; Yi) urn die Ausgleichsgerade Y == ax + b und den Unsicherheiten (Standardabweichungen bzw. Varianzen) der berechneten Parameter a und b.

Zusammenhang zwischen Regressionskoeffizient a und Korrelationskoeffizient r

Der RegressionskoeJfizient a der Ausgleichsgeraden Y

== ax + b

oder

y == a (x -

Y-

x)

(IV-118)

laBt sich auch durch den empirischen KorrelationskoeJfizienten r und die Standardabweichungen s, und Sy der x- bzw. y-Komponenten der MeBpunkte ausdriicken. Aus den Definitionsformeln 21)

Sxy

=

n~ 1 .

I

(Xi - x) (Yi -

y) = n ~ 1

1

[I

XiYi -

nxyJ

(IV-119)

1

und (IV-120)

folgen zunachst die Beziehungen (IV-121)

und (IV-122)

die wir dann in die Formel (IV-114) fur den Regressionskoeffizienten a einsetzen:

a==-----

21)

(n-1)sxy

(n - l)s;

(IV-123)

Es hande1t sich urn die Gleichungen (111-287) und (111-289) bzw. (111-19) und (111-20) aus Kap. III.


705

s s; . Sy fur den empirischen KorrelationskoefJizienten erhalten wir schlieBlich den gesuchten Zusammenhang:

Durch Erweiterung mit

Sy

und unter Berucksichtigung der Definitionsformel r =

~

(IV-124)

Regressionskoeffizient a und Korrelationskoeffizient r sind somit zueinander proportionale Grofien. Empirische Restvarianz

Die Parameter a und b im Losungsansatz y = ax + b fur eine Ausgleichsgerade haben wir gerade so bestimmt, daB die Summe der (vertikalen) Abstandsquadrate ihren kleinsten Wert annimmt. Diesen Minimalwert wollen wir jetzt berechnen. Unter Beriicksichtigung von b = Y- ax erhalten wir zunachst: Sea; b)min

=

I (Yi -

ax, -

W=

I (Yi - ax, -

y + ax)2 =

(IV-125)

Die in dieser Gleichung auftretenden Summen lassen sich mit Hilfe der DefinitionsforSy2 und SXy dabei noch wie folgt ausdriicken: meln fur

s;,

(IV-126)

I (Yi I

yf

= (n -

(Xi - x) (Yi -

(IV-127)

1)s;

y) = (n - 1)sxy

(IV-128)

Damit erhalten wir Sea; b)min =

I (Yi -

jl)2 - Z a-

I

(Xi - x) (Yi -

y) + a 2 .

I

(Xi - X)2 =

= (n - 1)s; - 2a(n - 1)sxy + a 2 . (n - 1)s; = (IV-129)

706


Setzen wir in diese Gleichung noch die aus (IV-123) gewonnene Beziehung ein, so folgt weiter: S(a; b)min == (n - 1) [s; - 2a(a· s;)

+ a2

.

Sxy

s;] == (n - 1) (s; - a 2 . s;)

==

a· s;

(IV-130)

Jetzt driicken wir noch den Regressionskoeffizienten a durch den Korrelationskoeffizienten r mit Hilfe der Beziehung (IV-124) aus und erhalten so schlieBlich:

Sea; b)min

= (n - 1)

(s; - a s;) = (n - 1) (s; - r :~ s;) = 2

2

•

•

•

(IV-131) Diese Summe der (vertikalen) Abweichungsquadrate verschwindet genau dann, wenn der empirische Korrelationskoeffizient den Wert r == - 1 oder r == + 1 annimmt. Alle n MeBpunkte (Xi; yJ liegen dann auf einer Geraden, namlich der Ausgleichsgeraden (Bild IV-29). Dieses Ergebnis aber ist uns bereits aus Kap. III, Abschnitt 6.1.1 bekannt. y

\

Ausgleichsgerade

Bild IV-29 Sonderfall: Samtliche MeBpunkte liegen auf der Ausgleichsgeraden

x

Varianz und Standardabweichung der berechneten Parameter 1m allgemeinen jedoch werden die MeBpunkte - wie in den Bildern IV-26 und IV-27 dargestellt - urn die Ausgleichsgerade streuen. Die durch die Gleichung 2 SRest

S(a; b)min == n - 2

(n-l)(1-r 2)s; n-2

(IV-132)

definierte empirische Restvarianz stellt dann ein geeignetes M ajJ fur die Streuung der MeBpunkte urn die Ausgleichsgerade dar. Die durch Wurzelziehen erhaltene Grobe SRest charakterisiert somit die Unsicherheit der MeBwerte Yl' Y2' ... , Yn- Die Restvarianz verschwindet dabei genau dann, wenn siimtliche MeBpunkte auf einer Geraden liegen und dies wiederum ist genau dann der Fall, wenn der empirische Korrelationskoeffizient den Wert r == - 1 oder r == + 1 annimmt.


707

Wahrend sich die Ordinatenwerte Yl' Y2' ... ,Yn der n MeBpunkte (Xi; Yi) von Stichprobe zu Stichprobe infolge der Zufallsstreuung veriindern, bleiben die Abszissenwerte Xl' X 2, •.. , x, unveriindert. Denn X ist eine gewohnliche Variable, Y dagegen eine Zufallsvariable! Daher veriindern sich auch die Parameter a und b der Ausgleichsgeraden Y == ax + b mit der Stichprobe. Regressionskoeffizient a und Achsenabschnitt b sind somit Funktionen der (streuenden) OrdinatenmeBwerte Yl' Y2' ... , Yn und folglich ebenfalls mit gewissen Unsicherheiten behaftet 22). Die Unsicherheiten bei der Bestimmung der Parameter a und b werden dabei durch die folgenden Varianzen bzw. deren QuadratwurzeIn beschrieben 23):

S2

==

n . siest

an'

I xl _ ( ~ x;y 1

sf

(1 - r

)

(n - 2)

s;

(IV-133)

s;

1

(I xl) . siest n.I xl _ ( ~ x) i

1

2

== 2

(n - 1) s;

n

+ ni 2

.s

2

(IV-134)

a

1

Wir fassen diese wichtigen Aussagen wie folgt zusammen:

22)

23)

Diese Unsicherheiten sind eine direkte Folge der Unsicherheit der y-MeBwerte. Es handelt sich hier also urn eine Fortpflanzung von "Fehlern" bzw. Varianzen. Sa und Sb sind die Standardabweichungen der beiden Parameter a und b.

708


709

5 Ausgleichs- oder Regressionskurven Anmerkung

Die empirische Restvarianz nach Gleichung (IV-137) erhalt man, indem man die minimierte Summe der Abstandsquadrate, also S (a; b)min, durch die Anzahl f der sog. Freiheitsgrade dividiert. Dabei gilt allgemein: (IV-140)

f=n-k

wobei n die Anzahl der MejJpunkte und k die Anzahl der zu bestimmenden Kurvenparameter im Losungsansatz bedeuten. Bei der Ausgleichsgeraden sind k = 2 Parameter (namlich a und b) zu bestimmen und somit gibt es in diesem Fall f = n - 2 Freiheitsgrade.

•

Beispiel 1m Beispiel des letzten Abschnitts hatten wir die Temperaturabhdngigkeit eines ohmschen Widerstandes aus acht MeBpunkten mit Hilfe einer Ausgleichsgeraden ermittelt. Wir erhielten dabei den folgenden Zusammenhang zwischen dem Widerstand R (in Q) und der Temperatur T (in °C):

R = (0,0253

o~) .T + 15,8131 0

(vgl. hierzu auch Bild IV-28). Wir fiihren dieses Beispiel nun zu Ende und wollen uns noch mit der Streuung der MeBpunkte urn die ermittelte Ausgleichsgerade und den Unsicherheiten der Parameter a und b beschaftigen. Die dabei benotigten Werte fur den empirischen Korrelationskoeffizienten r und die Varianzen s;. und s~ der Mellgrofien T und R sind aus Kap. III., Abschnitt 6 (Ubungsaufgabe 3) bereits bekannt:

s;. = 448,2149 (OC)2,

= 0,9974,

r

s~

= 0,2887 Q2

Damit erhalten wir nach Formel (IV-137) eine empirische Restvarianz von

_ (8 - 1) (1 - r 2 ) s~ _ 7 (1 - 0,9974 2) . 0,2887 Q2 _ 1""\2 - 0,0017 ~~ 8-2 6

2

SRest -

Der kleine Wert bestatigt dabei nochmals, daB die MeBpunkte in sehr guter Naherung auf einer Geraden liegen. Fur die Varianzen der Parameter a und b folgt unter Verwendung der Formeln (IV-138) und (IV-139) und unter Beriicksichtigung des Mittelwertes T = 46,25 °C: S2= a

(8 - 1)

2

Sb

Q2 (1 - r 2 ) S2 (1 - 09974 2) .02887 Q2 R= ' , =557.10- 8 - (8 - 2) s;. 6 . 448,2149 (OC)2 ' (OC)2

=

s;. + 8 y2 8

2

. Sa

=

7 . 448,2149 CC)2 + 8 . (46,25 °C)2 .

8

55,7

. 10- 8 ~ = 0001410 Q2 (0C)2'


710

Damit ergeben sich folgende Unsicherheiten fur Regressionskoeffizient a und Achsenabschnitt b: Sb

= 0,0375 Q

•

5.4 Ausgleichs- oder Regressionsparabel Liegen die in das Streuungsdiagramm eingetragenen n MeBpunkte Pi = (Xi;

yJ

(i = 1, 2, ... , n) nahezu auf einer Parabel, so wahlt man zweckmaliigerweise einen quadra-

tischen Losungsansatz in Form einer sag. Ausgleichs- oder Regressionsparabel Y =f(x) = ax? + bx + c

(IV-141)

(Bild IV-30). Der vertikale Abstand des i-ten MeBpunktes von dieser Parabel betragt dann Vi

= Yi -

f(xJ

= Yi -

+

(axf

b x,

+ c) = Yi -

ax? - b x, -

C

(IV-142)

y

Ausgleichsparabel =ax2 «bx +c

y

• f(x)

=ax j 2 + bx,

+c

Bild IV-30 Zur Bestimmung der Ausgleichsparabel

x

x,

Die zunachst unbekannten Kurvenparameter (Koeffizienten) a, b und c werden dabei nach der Gauj3schen Methode der kleinsten Quadrate wiederum so bestimmt, daB die Summe der vertikalen Abstandsquadrate alIer MeBpunkte von der Ausgleichsparabel ihren kleinsten Wert annimmt: n

S(a; b; c) =

I

(Yi - ax i2

-

bx, -

C)2

~ Minimum

(IV-143)

i= 1

Dazu miissen die drei partielIen Ableitungen 1. Ordnung von S(a; b; c) notwendigerweise verschwinden:

5 Ausgleichs- oder Regressionskurven n

as

oa =

711

2·

I

(Yi - axl- b x, - c)(-xl) == 0

i= 1

as ob = 2·

I

n

(Yi - ax? - b x, - c) (- x.) = 0

(IV-144)

i= 1

as oc = 2·

I

n

(Yi - ax? - b x, - c) (-1) = 0

i= 1

Wir erhalten damit drei lineare Gleichungen mit den drei Unbekannten a, b, c. Dieses quadratische lineare Gleichungssystem liiBt sich dann mit Hilfe der Cramerschen Regel oder durch Anwendung des Gaufischen Algorithmus Iosen.

Anmerkungen (1)

Eine Ausgleichskurve in Form einer Parabel ist nur moglich, wenn mindestens vier MeBpunkte vorliegen (n ~ 4).

(2)

Die drei Normalgleichungen (IV-146) erhalt man aus dem Gleichungssystem (IV-144) durch Auflosen der Summen und anschlieBendem Ordnen der Glieder.

712 •

IV Fehler- und Ausgleichsrechnung Beispiel

Bei einem bestimmten Autotyp soll der Zusammenhang zwischen dem Bremsweg s (in m) und der Geschwindigkeit v (in km/h) naher untersucht werden. Dazu wurde der Bremsweg bei fiinf verschiedenen Geschwindigkeiten gemessen. Man erhielt dabei die folgenden MeBwertepaare:

i

1

2

3

4

5

Vi

40

70

100

130

150

s,

14

39

78

120

153

Als Ausgleichskurve wahlen wir aufgrund des Streuungsdiagramms nach Bild IV-31 eine Parabel vom Typ s

== ao? + bv + c

Die Kurvenparameter a, b und c dieser Ausgleichsparabel bestimmen wir zweckmaliigerweise anhand der folgenden Tabelle (die Einheiten haben wir der besseren Ubersicht wegen weggelassen):

40

14

1600

64000

2560000

22400

560

2

70

39

4900

343000

24010000

191100

2730

3

100

78

10000

1000000

100000000

780000

7800

4

130

120

1690021970002856100002028000

15600

5

150

153

22500

22950

3375000

506250000

3442500

Die Normalgleichungen (IV-146) haben damit das folgende Aussehen: (I) (II) (III)

918430000· a + 6979000· b + 55900· c == 6464000

+ 55 900 . a +

6979000· a

55900· b +

490· c ==

49640

490 . b +

5 . c ==

404


713

s m 150

100 Ausgleichsparabel s=av 2+bv+c

• 50

Bild IV-31

Der Bremsweg s ist eine quadratische Funktion der Gesch windigkei t v ("Ausgleichsparabel")

100

50

150

v km/h

Wir losen dieses quadratische lineare Gleichungssystem z.B. mit Hilfe des Gaufsschen Algorithmus und erhalten die Parameterwerte

a = 0,004 399,

b = 0,437217,

c = -11,23

Die gesuchte Ausgleichsparabellautet somit 24):

s = 0,004399 . v 2

+ 0,437217 . v -

11,23

Ihr Verlauf ist in Bild IV-32 dargestellt. s m

150

100 Ausgleichsparabel

50

Bild IV-32 50

24)

100

150

v km/h

Die Geschwindigkeit v ist in der Einheit km/h, der Weg s in der Einheit m einzusetzen.


714

Mit Hilfe der Ausgleichsparabel konnen wir jetzt im Geschwindigkeitsbereich von 40 km/h bis hin zu 150 km/h den Bremsweg fiir eine vorgegebene Geschwindigkeit abschdtzen. So erwarten wir beispielsweise bei einer Geschwindigkeit von 90 km/h einen Bremsweg von s (v = 90) = 0,004399 . 90 2

+ 0,437217

. 90 - 11,23 = 63,75

Der Bremsweg betragt daher bei der Geschwindigkeit v

(in m)

= 90 km/h rund 64 m.

• 5.5 Nichtlineare Ausgleichsprobleme, die auf lineare Regression zuriickfiihrbar sind Viele nichtlineare Losungsansatze fur Ausgleichskurven lassen sich durch eine geeignete Transformation auf den rechnerisch erheblich einfacheren linearen Ansatz zuriickfiihren. Wir zeigen dies am Beispiel der Exponential- und Potenzfunktionen, die sich im halb- bzw. doppellogarithmischen Funktionspapier durch lineare Funktionen, d.h. durch Geraden darstellen lassen.

Exponentialfunktion y

= a · eb x

Durch Logarithmieren folgt zunachst: In y

= In (a . e bX) = In a + In (e bX) = In a + b x = b x + In a

(IV-147)

Wir fiihren jetzt die formale Transformation

u = x,

v

= In y

durch, setzen dabei noch c v = cu

(IV-148)

= b und d = In a und erhalten dann die Gerade

+d

(IV-149)

Durch diese Transformation wird also eine Exponentialfunktion in eine lineare Funktion iibergefiihrt : y

= a . e bx

u=x v

= In y

v

= cu + d

(IV-150)

(c = b, d = In a). Bildlich bedeutet dies: Wenn wir auf der vertikalen Koordinatenachse In y und auf der horizontalen Achse (wie bisher) x abtragen, erhalten wir eine Gerade (Bild IV-33). Die vertikale Achse wird also logarithmisch geteilt, wahrend die horizontale wie bisher linear geteilt bleibt. Ein entsprechendes Funktionspapier ist im Handel erhaltlich und heiBt halblogarithmisches Koordinatenpapier. Bei dieser Transformation gehen die Wertepaare (Xi; yJ in die neuen Wertepaare (ui; vJ = (Xi; In Yi) iiber, mit denen wir dann eine lineare Regression durchfiihren. Sie liefert uns die Werte der beiden .Hilfsparameter'' c und d, aus denen wir dann durch Riicktransformation die gesuchten Kurvenparameter a und b des Exponentialansatzes erhalten: In a

=d

=>

a = ed

und

b=c

(IV-151)

5 Ausgieichs- oder Regressionskurven

715

v

y

v = bu + Ina

=cu

+d

y=a. e b x

u

x b)

a)

Bild IV-33 Eine Exponentialfunktion (Bild a)) HiBt sich auf halb-Iogarithmischem Papier durch eine Gerade darstellen (Bild b))

Potenzfunktion y = a · x"

Durch Logarithmieren folgt zunachst: In y = In (a . x") = In a + In (x") = In a + b . In x = b . In x + In a

(IV-152)

Mit Hilfe der Transformation

u = In x,

v = In y

(IV -153)

erhalten wir hieraus die Gerade

v = cu

+d

(IV-154)

wohei wir noch c = b und d = In a gesetzt hahen. Mit anderen Worten: Wenn wir also auf beiden Koordinatenachsen die (natiirlichen) Logarithmen der Koordinaten x und y auftragen, erhalten wir eine Gerade (Bild IV -34). Beide Achsen werden also iogarithmisch geteilt, ein entsprechendes im Handel erhaltliches Funktionspapier heiBt daher doppellogarithmisch. Die heiden .Hilfsparameter" c und d erhalten wir wiederum durch lineare Ausgleichung, die mit den transformierten MeBwertpaaren (ui ; vJ = (In Xi; In yJ durchgefiihrt wird. Durch Ritcktransformation gewinnt man dann daraus die gesuchten Kurvenparameter a und b des Potenzansatzes: In a = d ~ a = e d

und

b=c

(IV-155)


716 v

y

v =bu + Ina

=cu

+d

y =a ·,xb

x

u

d=lna b)

a)

Bild IV-34 Eine Potenzfunktion (Bild a)) HiBt sich auf doppel-logarithmischem Papier durch eine Gerade darstellen (Bild b))

Nichtlineare Ausgleichsprobleme, die sich linearisieren lassen Zahlreiche nichtlineare Losungsansatze lassen sich mit Hilfe geeigneter (nichtlinearer) Transformationen auf ein lineares Ausgleichsproblem vom Typ v == cu + d zuriickfiihren. Tabelle 4 gibt einen Uberblick iiber die in den Anwendungen besonders haufig auftretenden Falle, Man beachte jedoch den Hinweis zu dieser Tabelle!

Tabelle 4: Transformationen, die einen nichtlinearen Ansatz fiir eine Ausgleichskurve auf ein lineares Ausgleichsproblem zuriickfiihren

v == cu + d

a == e",

-------

y

v==cu+d

a == c,

b==d

1/y

v==cu+d

1 a==- ,

d b==-

---1-i

1/x

I I I

b==c -----

1/y

---

v==cu+d

c

c

--------

1 a==d'

b=~

d


717

Wichtiger Hinweis zur Tabelle 4 Man beachte, daB nach der Linearisierung des vorgegebenen Ausgleichsproblems stets eine lineare Regression mit den transformierten MeBwertpaaren (ui ; Vi) durchgefuhrt wird, Diese Vorgehensweise ist zwar rechentechnisch gesehen elementar durchfiihrbar und daher in der Praxis sehr "beliebt", fiihrt jedoch nicht zu den tatsachlichen Werten der Kurvenparameter a, boo 0' sondern nur zu (meist jedoch vollig ausreichenden) N dherungswerten! Die exakte Bestimmung der Parameter kann nur iiber die Minimierung der eigentlichen Zielfunktion n

I

S(a; b; ...) =

(IV-156)

(Yi - f(XJ)2

i= 1

(Summe der vertikalen Abstandsquadrate) erfolgen, die mit dem gewahlten nichtlinearen Losungsansatz y == j (x) und den vorgegebenen MeBwertepaaren (Xi; yJ gebildet wird. Die exakten Parameterwerte sind dann allerdings nur mit erheblichem numerischen Rechenaufwand zu erhalten, so daB man in der Praxis oft den beschriebenen bequemeren Weg vorzieht.

Beispiele (1)

Die Entladung eines Kondensators mit der Kapazitat C tiber einen ohmschen Widerstand R erfolgt nach dem Exponentialgesetz t

u (t) == U o . e -

RC

(t

~

0)

(uo: Anfangsspannung zur Zeit t == 0). In einem Experiment wurden dabei folgende Werte gemessen (t i in s, u, in V): i

1

2

3

4

5

t,

1,0

4,0

7,0

10,0

15,0

u,

80,2

45,5

24,5

13,9

4,7

Wir berechnen aus diesen Daten die Anfangsspannung Uo und die Zeitkonstante RCo Das Exponentialgesetz fiihrt in der halblogarithmischen Darstellung zu der Geraden

t lnu==lnu - o

RC

1

oder

y

== at + b

und b == In Uo' Die MeBpunkte (t i ; yJ == (t i ; In uJ RC liegen daher in dieser Darstellung nahezu auf einer Geraden (Bild IV-35)o mit y

==

In u,

a == - -


718 u V 100

I!oo...

.........

6)

1. Liisungsweg:

=6

div (grad 4»

;

x

2y

A= ¢ F = ( -

.e

yZ )

x 3 . e YZ

x 2 z · e Yz

div A = div (¢

F) = (2 X Y -

+ X 2 + X 2 Y z) . e

X3Z

yz

2. Liisungsweg (nach Rechenregel (2) fur Divergenzen):

2x· e

grad ¢ = div

A=

div (¢

= eYZ

7)

YZ )

x 2 Z • e Yz ( 2 x y · e Yz

;

div

F=

F) = (grad ¢). F +

(:r~) .(-:) +

Die Divergenz des Zentralfeldes verschwinden:

-..

1

x

¢(div F) = 2

YZ

.

e ·1 = (2 xy

f =f

(r)

r=

- x

3 Z

(j i~~ :~)

+ x 2 yz + x 2 ) . e Yz

muB bei einem quellenfreien Feld

f (r) . z

a a a ax [f(r)· x] + -ay [f(r)· y] + -az [f(r)· z] = 0

div F = -

Es ist (unter Beachtung von r = (x 2

+ y2 + Z2)1 /2):

a [f(r)· x] = _. W x + 1 . f(r) = _. W x + f(r) ax ax ax

-

af df ar f ar - = - · - = f (r)·ax dr ax ax

(Kettenregel !)

a . 2 + y2 + Z2)1 /2 = _ar = -(x

ax ax

x (x 2

_

+ y2 + Z2)1 /2

x r

Somit gilt:

a [f (r) . x] = ff (r) . -x + f (r) ax r 2

-

Analoge Ausdriicke erhalt man fur die beiden iibrigen partiellen Ableitungen. Daher folgt:

-.. x2 y2 Z2 div F = t" (r) . - + ff (r) . - + ff (r) . - + 3 . f (r) = r r r

= F (r)

x2 +

y2

r

+

Z2

+ 3 .f

(r) = ff (r) . r + 3 . f (r) = 0

758

Anhang B: Losungen der Ubungsaufgaben Diese Differentialgleichung 1. Ordnung lost man durch "Trennung der Variablen". Die Losung lautet: canst. C f(r)=--=3 3

r

(C ER; r > 0)

r

grad ¢ = - b

3 vIr' ) = - rb (X) y = x/r

(

z/r

3

3

b

r3

r

z

canst. Das Gradientenfeld ist somit ein Zentralfeld vom Typ - 3- r und daher nach Aufgabe 7 r quellenfrei, d.h. div (grad ¢) = o. -+

9)

a)

rotF=-

-+

ez=-~ez

x 2 + y2 + X + 2 y (x 2 + y2)3/2 ez -+

rot F

c)

rot F = (y2 - 3x 2 y2) e z = y2 (1 - 3x 2) e z

rot v =

11)

a)

=

0 ~ v ist wirbelfrei.

rot

F= (

- 2 Y (X + Z))

- 2 z (1 + x)

b)

rotF=O

(F ist wirbelfrei)

2yz - x

rotF=(3(~=~~;()=o ~ {3~=~:~} ~ a=3, (a - 3) y2 Z

14)

(r=Jx 2+y2)

r

b)

10)

12)

1 Jx2 + y2

x-Komponente von rot

a- 3

b=1

=0

F:

y (rot F)x = aFz - aF = ~ [f(r)· z] az ay ay Mit

~ [f(r)· y] = z· ~ [fer)] - r ~ [fer)] az ay az

a df(r) ar a - [fer)] = - - ' - = f'(r)· -(x 2 + y2 + Z2)1 /2 = ay dr ay ay = f' (r) . (x 2 + Y 2 + z 2) -1/2 . y = f' (r) . ~ r

I Vektoranalysis

759

und analog

a

az [f(r)]

z f' (r) .;

=

folgt dann: Y

-+

z

(rot F)x = z . ff (r) . - - y . I" (r) . - = r r

r

°

=

°

F)y = (rot F)z = rot F = rot [f (r) r] = 0 => Fist wirbelfrei

Analog: (rot Somit:

15)

yz . f' (r) - yz . ff (r)

1. Liisungsweg:

A=

¢

F=

(::~:~:) x 2 yz "

2. Liisungsweg (nach Regel (2) fur Rotationen):

grad ¢ = rot

rot

(

x

Y

°0)

2

Z ) 2Z2

rot

;

2x 2yz

F= (

-x

A= rot (¢ F) = (grad ¢) x F + ¢ (rot F) = =

16)

2X

2 Y 2 X2 Z2 ) X Z ( 2x 2yz

F = (2~

X

-x

Z2

.. ~x)

2y - 2y

°0)

(XY) ( Y +X 2 y z2

=

(~) = 0

°

=>

=

2 2 2 ( X Z4 - 2x y Z ) 2x3y2z-2xyz4 2xy2z2_2x3yz2

Fist wirbelfrei

Die Vektorkomponenten von F sind demnach die partiellen Ableitungen 1. Ordnung eines (noch unbekannten) Skalarfeldes ¢ = ¢ (x; y; z): acjJ

-

= 2xz + y2

ax a¢ -=2xy

=>

¢ = x 2z + xy2 + C 1 ( y ; z)

ay

a¢ az

-=x

2

Liisung: ¢ = xy2

+ x 2Z + C

(C E JR.)

760

Anhang B: Losungen der Ubungsaufgaben

02 ¢

-r- 3+3 y2· r -

-=

Oy2

5.

'

02 ¢

-=

-r- 3+3z 2'r- 5

OZ2

f1¢ = (- r - 3 + 3 x 2 . r - 5) + (- r - 3 + 3 y 2 . r - 5) + (- r - 3 + 3 z 2 . r - 5) =

= -3r- 3+3r- 5(x 2+y2+ z2)= -3r- 3+3r- 3=0 '-v-"

r2

1 In der Ebene: ¢ = - = (x 2 + y2)-1 /2 r 1 2 -o¢ = _ -(x + y2)-3 /2. 2x = _ x(x 2 + y2)-3 /2

ox

2

02¢

02¢

-= - r - 3+3x 2·r- 5 . - = _ r - 3+3 y2· r ' ox 2 oy2 f1¢ = (- r - 3 = -

5

+ 3 x 2 . r - 5) + (- r - 3 + 3 y 2 . r - 5) =

2r- 3 + 3r- 5 (x 2 + y2) = - 2r- 3 + 3r- 3 = r- 3 #- 0 ~

r2

18)

Analog:

02 ¢ = 4(x 2 + 3 y2 oy2

02 ¢

+ Z2); -

=

OZ2

4(x 2 + y2

+ 3z 2)

+ Z2) + 4(x 2 + 3 y2 + Z2) + 4(x 2 + y2 + 3z 2) = + 5 y2 + 5 Z2) = 20(x 2 + y2 + Z2) = 20 r 2

f1¢ = 4(3x 2 + y2 =

4(5 x 2

Man erhalt die radialsymmetrische Funktion

f (r) = 20 r 2.

Abschnitt 6 1

-+

-+

F (r; cp) = - - eqJ r

F(r; cp) =

1)

a)

2)

H(r;cp)

3)

a)

divF(r;cp)=~;

rotF(r; cp) =

0

b)

div F (r; cp) = 3 r; rot F (r; cp) =

0

-+

I

=-

2nr

b)

-+

e qJ

r

r 2 • sin tp

e r

761

I Vektoranalysis 4)

rot

F(r; cp) = 0 => Fist wirbelfrei. Daher gilt F = grad ¢, d.h.

1 +.-. o¢.-. 1 o¢ .-. .-. e r +
cp

=

t

z = 2t

Somit gilt: Q= - e- t ,

ip = 1 und

z = 2.

762

Anhang B: Losungen der Ubungsaufgaben Geschwindigkeitsvektor in Zylinderkoordinaten:

v=

e- t eQ + e- t eqJ + 2 ez

-

Geschwindigkeitsbetrag:

Iv(t =

v = )2 e -2t + 4; °

10)

11)

1)1 = 2,0666

e + e" eqJ + ez

a)

grad ¢ = e"

b)

1 ..... 1 + ..... + ..... grad ¢ = - -Q2 eQ + -Q eqJ z eqJ + e" e

a)

div

Q

Z

Z

F(e; cp; z) = -~;

rot

Q

.....

.....

.....

z .....

rot F = - eQ + - ez

div F = 0;

b)

F(e; cp; z) = 0

(wirbelfreies Feld)

(quellenfreies Feld)

Q

12)

1 0 ( QO_ O¢) =0 11¢(Q)=_oQ oQ oQ

a)

~

const.

O¢

C

QO_=Qo¢'(Q)=const.=C 1 ~ ¢'(Q)=~ oQ Q

cjJ(e) = C l

.

f~de = C

1 02 ¢ 11¢(cp)=_o_=O Q2 Ocp2

b)

'lne + Cz

l

~

(C l , Cz ElR)

02 ¢ -=¢"(cp)=O Ocp2

Nach zweimaliger Integration: ¢(cp) = C 1 cp + C 2

(C 1 ,

c, E lR)

02¢

c)

11¢(z) =

fuT =

¢"(z) = 0

Nach zweimaliger Integration: ¢(z) = C 1 z + C 2 13)

F (r; 9; cp) =

a)

r sin 29 cos" cp °

°

°

15)

°

eqJ

..... 1 ..... F (r; 9; cp) = - e, r

b)

v(r; 9; cp) = rosin 9 eqJ Gesuchte Darstellungsform: v(r; 9; cp) = v,

er + Vf) ef) + vqJ eqJ

Aus den Transformationsgleichungen (1-320) folgt mit

x,

y

Vx

=

Vr

= X sin 9 cos cp +

"» = °

°

und

Vz

z:

=

Y. sin 9

°

sin

E

lR)

er + r(sin 3 cos 9 cos? cp - sin cp) ef) -

- r ° cos tp (sin 3 ° sin cp + cos 9)

14)

(C 1 , C 2

ip

+ z. cos 9

763

I Vektoranalysis

+ Y. cos 9 . sin tp -

vS = X. cos 9 . cos cp vq>

= -

z. sin 9

x. sin cp + Y. cos cp

Zwischen den kartesischen Koordinaten x, y, z und den Kugelkoordinaten r, 9, tp bestehen die Beziehungen x = r . sin 9 . cos cp, y = 'r . sin 8 . sin cp, z = r . cos 9. r, 9 und tp sind dabei Funktionen der Zeit t. Dann gilt:

x = r . sin 8 . cos cp + r . cos 9 . 9. . cos cp - r . sin 9 . sin cp . ip y = r . sin 9 . sin cp + r . cos 9 . 9. . sin cp + r . sin 9 . cos cp . ip i = r . cos 8 - r . sin 9 .9. Durch Einsetzen dieser Ausdrucke in die obigen Transformationsgleichungen erhalt man dann: Vs

vq> = r . sin 9 . ip

= r8,

Der Geschwindigkeitsvektor lautet somit in Kugelkoordinaten:

v(r; 9; cp) = r e

+ (r8) e s + (r . sin 9 . ip) eq>

r

16)

Aus r = const. = R und 9 = const. = 8 0 folgt dr = 0 und d9 = 0 und somit nach Gleichung (I-308) fur das Linienelement ds = R . sin 9 0 dip.

17)

rot ff (r; 9; cp) = e

S+

0 => ff ist wirbelfrei. Daher gilt ff = grad , d.h.

1 o -. -. q> (-.e +e-. + -1- e-. ) =o - e-. +-·-e + -1- - ·o -e r S sin 9 q> or r r 09 s r · sin 9 ocp q>

Daraus erhalt man die folgenden Beziehungen, die durch elementare Integration losbar sind: o= e s+ q> or o = r . eS+q> 09 o ocp

=

r . eS+q>

=>

= r . eS+q> + C 2 (r; cp)

=>

= r . eS+q>

+ C 3 (r; 9)

Liisung: =(r;9;cp)=r·e s+q>+C 18)

a)

div ff = (n

+ 2) r n -

(CElR)

1

Fur ein quellenfreies Feld ist div ff = O. Somit: div 1

-+

Losung: F = r - 2 e r = 2" e r r

ff =

(n + 2) r"- 1

=

0

=>

n=

-

2

ist quellenfrei

b)

Es gilt rot ff = 0 und zwar unabhangig vom Exponent n, d.h. jedes Vektorfeld vom Typ ff = r" e r ist wirbelfrei.

c)

div ff = 0 und rot F = 0 => n = - 2 (siehe Losung a)). Nur das spezielle Feld -. 1 F = r -2 e r = 2" e r ist daher quellen- und wirbelfrei. r

764

19)

Anhang B: Losungen der Ubungsautgaben

a)

114> (r)

=

(2

-e r . -84»

~

0

or

=

or

0

'-.,--!

const.

=

C1 4>' (r) =

oder

b)

= a~ (Sin 9 . : :)

tlcP (9) = 0

C

---+ r

=0

'--.-'"

const. = C 1 sin 9 . 04> = sin 9 . 4>' (9) = C 1 09 4>(9) = C 1

·

f

d9

- .-

SIn

9

~ SIn 9

4>' (9) =

oder

= C 1 ·In (tan (9!2)) + C 2

(C l' C 2

E

JR.; Integral Nr. 214)

c) Nach zweimaliger elementarer Integration folgt:

Abschnitt 7 1)

f

2

[ydx + (x 2 + xy) dy] =

C1

f

(2x + 6x 2) dx = 20

0 2

f

[ydx + (x 2 + xy) dy] =

C2

2)

a)

f

(x 2 + 2x 3 + 2x 4 ) dx =

352

15

0

~(2xy+4x)=~(X2_1)=2x; oy

4> (x; y) =

ox

X2

Y+ 2 x 2

-

Y+K

(K

04>=2xy+4x' ox ' E

04>=x 2_1 oy

JR.)

b)

o 0 04> 04> -(eY)=-(x'eY)=e Y' -=e Y' -=x'e Y' 4>(x;y)=x'e Y+K ' o x ' oy , oy ox

c)

o 0 04> -(3x 2 y + y3) = -(x 3 + 3 x y2) = 3x 2 + 3 y2; _ = 3x2 Y + y3 oy ox ox

~~=X3+3xy2;

cP(x;y)=X 3y+ x y3+K

(KElR)

(KEJR.)

765

I Vektoranalysis

3)

a

a

ay

ax

-(x) = -(y) = 0

a)

a¢

b)

a¢

ay=y;

ax=x;

c)

1 2+ y 2)+K ¢(x;Y)=2(X

(KElR)

Das Arbeitsintegral ist wegunabhdngig, hangt also nur vom Anfangs- und Endpunkt ab:

[J

r,

f- f P'dr=

(xdx+ydy)= ¢(x;y)

Pz

Pi

1 = [ _(X 2 + y 2) + K ]

2

(3;5)

=16,5

(1;0)

Pi

C

f

ist das Kraftfeld ji nicht-konservativ. Das Arbeitsintegral ji. dr hangt daher noch vom Verbindungsweg C der Punkte A und B ab: c

Oberer Halbkreis C 1 : x = cos t, Y = sin t

(0 ~ t

~ n)

tt

V nterer Halbkreis C 2: x = cos t, Y = sin t

f

-n

ji. dr = -

~.

Cz

5)

(t durchlauft alle Werte von 0 bis - n)

f

dt

=~

0

Weg C (Einheitskreis): x = cos t, Y = sin t

f

ji . dr =

f

(0 ~ t

~

2 n)

2n

(x + 2 y) dx = -

f

(sin t . cos t + 2 . sin 2 t) dt = - 2 n

c e o 6)

Die Integrabilitatsbedingung ist erfidlt:

o~C;)=OoT(~)=O Daher ist S (T; V)

as c,

as

R

sr = -T' -av = -v

-

und somit

= C v . In T + R . In V + K

(K

E

lR)

(K wird meist gleich Null gesetzt).

7)

f

(x Y2 dx -

C

2

X2

Yz d y + x Z 2 dz) =

f

(t 5

1

-

2 t 8 + 3 t 9) dt = 203,84

766

Anhang B: Losungen der Ubungsaufgaben 2n

8)

f . dr = (x y dx + dy + yz dz) = c e o

J

J

9)

F; = x,

Fy = y,

aF x ay

J(- sin? t . cos t + cos t + t . sin t) dt = - 2 n

F; = z

= aF x = aF y = aF y = aF z = aF z = 0 az

ax

az

ax

ay

Die Integrabilitatsbedingungen (1-374) sind somit erfidlt. Es ist

a¢ =

a¢ a¢ ax = x, ay = y

und

z und

az

J(x dx + y dy + z dz) = ~ (x 2 + y2 + Z2) + K

cf> (x; y; z) =

(K

E

JR.)

c

a

-

aF x ay

= - (x + x y + x z ) = 2 x y

aF

a = - (x 2 Y + y3

-y

ax

3

2

2

ay

ax

=>

+ yz2) = 2xy

or;

aF y -=-=2xy

ay

ax

Ebenso zeigt man, daB die beiden restlichen Integrabilitatsbedingungen (1-374) erfidlt sind: aF x aF z -=-=2xz·

az

ax

aF y aF z -=-=2yz ay

'az

Somit gilt:

a¢ ay

= Fy = x 2 Y + y3 + yz2

=>

a¢=F =X 2Z+y2 Z+ Z3 =>

az

z

¢=

1

1

1

2x 2 y2 + 4: r" + 2y2 Z2 + K 2 (x; z)

.rf...=~X2Z2+~y2Z2+~Z4+K (x·y) 2 2· 4 3'

~

Die Potentialfunktion lautet daher:

1

1

4

2

= _ (x" + v" + Z4) + _(x 2 y2 + x 2 Z2 + y2 Z2) + K = 1 = - (x 2 + y2 4

1 4 r +K 4

+ Z2)2 + K = -

(K

E

lR)

767

I Vektoranalysis 11)

Die Integrabilitatsbedingung (1-373) ist in der gesamten x, y-Ebene erfiillt:

sr, a

nt:

a

- = - (2 x + y 2) = - y = - (2 x y + Y 2) = 2 y ay ay ax ax Somit verschwindet das Linienintegral des Vektorfeldes Kurve: f[(2X 12)

a)

F langs

einer jeden geschlossenen

+ y2)dx + (2xy + y2) dy] = 0

aFx

aF

ay

aFx aF

y

y

- = y => - i = -

-=1'

'ax

ay

ax

Die Integrabilitatsbedingung (1-373) ist nicht erfiillt, das Vektorfeld daher nicht konservativ.

b)

aFx aF

•

y

-=-=2y'slnx ay ax Das Vektorfeld ist konservativ und es gilt:

a¢ ax =

Fx = y2 . sin x - 2x

=>

¢ = - y2 . cos

X -

x 2 + K 1 (y)

a=0

(A 2 )

y = r . sin cp;

r 2 . sin

ip

dr dip = 0

r=O

Gesamtflufi durch die geschlossene Oberflache der Halbkugel:

#(F . N)

dA

=

(A)

7)

If (F.N) + If (F' N) dA

(Ad

dA

=0+0= 0

(A 2 )

.. ty= (=;;)

tx= (2~X} ty= (2~Y}

x

Itxxtyl = J4(x 2 + y 2) + 1;

M=

If Itx tyl x

dydx

(A)

=

II

J4(x 2 + y2) + 1dydx

(A)

Integrationsbereich A ist die Kreisflache x + y2 ~ 2. Ubergang zu Polarkoordinaten: x 2 + y2 = r 2" dy dx = r dr dip 2

2n

j2

M= I I J4;2+1. q>=0

8)

-. 1 N=S

r dr df{!

=

1:

n

r=O

(X) -. -. 1 ~ ; F'N=S(2x

2-x

Y+

Z

2)=

= 5 (2 . sirr' 9 . cos? cp - sin? 9 . sin cp . cos cp + cos? 9) dA

=

25 . sin 9 d9 dip

If (F .N) ~)

2n

dA

= 125·

n

I I

q>=0

(2' sin ' [) . cos? tp -

9=0

- sin:' 1) . sin cpo cos tp + sin 9 . cos? 9) d9 dcp = 500 tt

772

9)


Das Vektorfeld besitzt Zylindersymmetrie. Daher folgt nach Formel (1-439) mit

f

a (Q) = -: Q

J( ... ...

Jf (F· N)

dA =f(R)' 2nRH

a

= R' 2nRH = 2naH

(A)

10)

Wegen der Kugelsymmetrie des Vektorfeldes konnen wir Formel (1-445) benutzen. Mit dann fur den VektorfluB durch die Kugelschale:

f (r) = r" folgt

#(F· N)

4~R2 = 4nR

dA = f(R)' 4nR 2 = R".

n

+2

(A)

Abschnitt 9

f f (A)

2)

x=O

(V)

(x + 3 y) dz dy dx

=2

z=O

Unter Verwendung von Zylinderkoordinaten gilt:

#(F .N) fff dA =

(A)

div

F dV

fff

= 2.

(V)

(x + z) dV

=

(V)

2n

2

q>=0

z=O

f f f

= 2· 3)

y=o

(e 2

. COS tp

+ ez) de dz dip = 36 n

Q=O

Berechnung des Volumenintegrals (in Kugelkoordinaten):

fff

div

F dV = 3 .

(V)

fff

2 (x + y2 + Z2) dV =

(V)

2n

R

f f f

=3'

q>=0

r 4 . sin 9 dr d90 dip =

12

-

5

nR 5

r=O

9=0

Berechnung des Oberfldchenintegrals (in Kugelkoordinaten):

(X) ; F·......N = R(x" +

... 1 N =R ~

J( ... ...

J1 (F . N)

1

dA

=

1 J(

y4

+ Z4)

R. Jf (x" + v" + Z4) dA

(A)

=

(A)

2n

=R

5

•

tt

f f

cp=O 9=0

(sin 5 9 ' cos" tp + sin" 9· sin" cp + sin 9· cos 4 9) d9 dip = 1; nR 5

I Vektoranalysis

773

Somit gilt:

fff div

--.

j{ --. --. 12 F dV = 'jf(F' N) dA = SnR 5

(V)

4)

(A)

Der Gauj3sche I ntegralsatz liefert fur

#(F .N) #

[(rot E)

dA =

(A)

5)

.N]

F = rot E:

dA =

IfI~)

(A)

dV = 0

0

(V)

Berechnung des Fldchenintegrals (in Polarkoordinaten):

II

div F dA =

(A)

If

2n

I I

3 x dA = 3·

(A)

2

qJ

=0

r

r

2.

cos

tp

dr dip = 0

=0

Berechnung des Kurvenintegrals (in Polarkoordinaten):

f(F .N)

2n

I

ds = 8·

c Somit gilt:

II

cos

tp

dip = 0

0

div

F dA = f(F. N)

(A)

6)

ds = 0

C

1. Liisungsweg (direkte Berechnung uber ein Oberfldchenintegral unter Verwendung von

K ugelkoordinateni:

--. --. (rot F) . N

3

= -

y2 Z

2

=

12 . sin? 9- . cos 9- . sin? cp

dA = 4 . sin 9- d9- dcp

If

[(rot F)

.N]

dA =

~.

(A)

If

2n

I I

Y 2 z dA = 48·

(A)

nl2

qJ

=0

8

sin 3 9 . cos 9 . sin 2

tp

d9 dip = 12 n

=0

2. Losungsweg (Verwendung des Integralsatzes von Stokes):

If

[(rot F)·N] dA =

fF' f(dr =

c

~)

y3 dx + yz2 dy + y2 Z dz)

C

Randkurve C (Kreis urn den Nullpunkt mit dem Radius r x = 2 . cos t, Y = 2 . sin t,

Z

I

C

0

2):

= 0, dx = - 2 . sin t dt, dy = 2 . cos t dt, dz = 0

2n

f F' dr = 16 '

=

sin4 t dt = 12 n


774

-+

dA dA (N· e z ) = - = dy dx -+

-+

J3

-x

1 = -

J3

(-

2 x - y + 3)

+2

I I x=0

(A)

(-2x-y+3)dydx=2

y=0

a)

Das Vektorfeld besitzt keine Radialkomponente. Daher ist der VektorfluB durch die Kugeloberflache gleich Null.

b)

Zum gleichen Ergebnis fiihrt der Integralsatz von Gauj3:

F = r . cot 9- . cos cp

div

#

(F'

N)

dA

I

= If

div F dV

I

= If

(V)

(A)

r : cot j} cos 0

tp

dV =

(V)

2n

n

R

I I I 9=0

o

0

CfJ

CfJ

f z' f(x) dx = A' f (2x + 1)· e- AX dx = 2 : A

o

0

CfJ

CfJ

Ilz = f z· f(x) dx = A' f x 0

14)

CfJ

2.e-

AX

dx =

;2

0

a)

E(Z)

= 1;

Var(Z) = 2

b)

E(Z)

= 1;

1 Var(Z) = - = 0,125 8

c)

E(Z)

= 20;

Var(Z) = 50

d)

E(Z)

= 2;

Var(Z) =

°


785

Abschnitt 6 1)

Stabdiagramm: Bild A-31

a)

x

f(x)

°

0,1678 0,3355 0,2936 0,1468 0,0459 0,0092 0,0011 0,0001

1 2 3 4 5 6 7 8

f(x)

0,4

0,3

0,2 Bild A-31

° 0, 1

~

P(X

~

P(l 2)

5) = f(5) X

~

234567

ax

+ f(6) + f(7) + f(8) = 0,0104

3) = f(l) + f(2) + f(3) = 0,7759

Die Zufallsvariable X ( = Anzahl .Zahl" bei 10 Wiirfen) ist binomialverteilt mit n = 10, p = 0,5 und q = 0,5: P(X = x) = f(x) =

3)

°

P(X = 0) =f(O) = 0,1678

b)

(~O) 0,5

a)

P(X = 0) = 0,0010

c)

P(X

~

4) = 1 - P(X

10

~

3) = 0,8281

b)

P(X = 2) = 0,0439

d)

P(X = 5) = 0,2461

Die Zufallsvariable X ( = Anzahl der .Erfolge" bei 5 Wiirfen) ist binomialverteilt mit n = 5 und = 1/3, q = 2/3 :

p

P(X=x)=f(x)=

3 (2)S-X 3 (x5)(l)X

P(X = 2) = 0,3292

a)

b)

P(X

~

3) = 0,2099

4)

Binomialverteilung mit n = 300 und p = 1/3. Mittelwert: u = np = 100.

5)

Ein "rotes As" wird im Einzelversuch mit der Wahrscheinlichkeit p = 1/16 gezogen. Die Zufallsvariable X (= Anzahl der gezogenen "roten Asse" bei n Ziehungen) ist daher binomialverteilt mit den Parametern n, p = 1/16 und q = 15/16: P(X

=

x)

=

Ereignis X

(xn)(161 )X (15)n-X 16 --

=

°

(kein .rotes As")

---+

P (X = 0) < 0,5

---+

15)n ( 16 < 0,5

---+

n

~

11

786 6)

Anhang B: Losungen der Ubungsaufgaben Binomialverteilung mit n = 250, p = 0,02 und q = 0,98: J1

7)

= np = 5;

2

= n p (1 - p) = 4,9;

(J

= 2,2136

Die Zufallsvariable X (= Anzahl Treffer bei 5 Schiissen) ist binomialverteilt mit n = 5, p = 1/3 und q = 2/3: P(X

c)crcr-

P(X

P(X

.3

= x) = f(x) = x

a)

8)

(J

= 0) = 0,1317

= x) =f(x) =

x

3

b)

P(X

= 3) = 0,1646

c)

P (X ~ 3)

= 0,2099

c)

P(X < 2)

= 0,6667

(:)-(3~X) 0

C3 ) a) 9)

P(X

= 0) = 0,1667

b)

= 0,8333

Die Zufallsvariable X ( = Anzahl der unvollstdndigen Packungen unter n gekauften Packungen) ist hypergeometrisch verteilt (N = 40; M = Anzahl der unvollstdndigen Packungen = 4): a)

N

= 40, M = 4, n = 1

P(X=x)=f(x)=

N = 40,

b)

P(X

10)

P(1 ~ X S 3)

M = 4,

(:)·C ~x) (~O)

n

= x) = f(x) =

--->

=

P(X=O)=O,9

10

(:) (103~ x) G~)

~ P(X

= 2) = 0,2142

Hypergeometrische Verteilung mit den Parametern N = 5, M = 3 (Anzahl der weifJen Kugeln) und n = 2:

P(X=x)=f(x)=

x

f

(x)

°

0,1

G)·C:J

C)

f(x)

(x

= 0, 1,2)

0,3

2 0,6

0,3

Stabdiagramm: Bild A-32

0,6

0,1

Bild A-32

°

2

x

787


11)

12)

3X P(X=x)=!(x)=-'e- 3

x!

a)

P(X = 0) = 0,0498

b)

P(X

c)

P(X > 3) = 0,3528

d)

P(1

~ ~

3) = 0,6472 X

~

5) = 0,8663

Die Zufallsvariable X ( = Anzahl der Brennelemente, die den Anforderungen nicht geniigen) ist binomialverteilt mit den Parametern n = 1500 und p = 10- 4 . Sie darf jedoch durch eine (rechnerisch bequemere) Poisson-Verteilung mit dem Parameter (Mittelwert) fJ = np = 0,15 ersetzt werden:

°

x

15 e-O,15 ~ P(X = 0) = 0,8607 P(X = x) = f(x) = -'-,-' x·

13)

14)

a)

P(U

~

1,52) = (1,52) = 0,9357

b)

P(U

~

- 0,42) = ( - 0,42) = 1 - (0,42) = 0,3372

c)

P(0,2

~

U

~

2,13) = (2,13) - (0,2) = 0,4041

d)

P( -1,01

~

U

~

e)

P (- 1 ~ U

~

1) = P (I U I ~ 1) = 2 . (1) - 1 = 0,6826

f)

P(I UI

~

- 0,25) = ( - 0,25) - ( -1,01) = (1,01) - (0,25) = 0,2451

1,69) = 2 . (1,69) - 1 = 0,9090

g)

P(U

~

0,95) = 1 - P(U

h)

P(U

~

- 2,13) = 1 - P(U

~

a)

(a) = 0,5 ~ a=O

b)

(a) = 0,3210 < 0,5 ~ a
( - 2,32) = 1 - 4>(2,32) = 0,0102

c)

P(X

~

- 1,68) = P(U

d)

P( - 0,5 ~ X ~ 4,5) = P( - 5 ~ U ~ 5) = 2 . 4>(5) - 1

e)

P( - 1,86) ~ X ~ - 0,24)

~

- 7,36) = 4>( -7,36) = 1 - 4>(7,36) =

=1

= 4>( - 7,72 ~ U ~ - 4,48) = = 4>(-4,48) - 4>(-7,72) = 4>(7,72) - 4>(4,48)

f)

P( - 3 ~ X ~ 3) = P( -10 ~ U ~ 2)

g)

P(IX/

h)

P(X

~

0,98) = P(U

a)

P(95

~

X

b)

P(98

=

°

= 4>(2) - 4>( -10) = = 4>(2) + 4>(10) - 1 = 0,9772

~

2,13) = 0,6026

~

~

- 2,04) = 1 - P(U

~

- 2,04) = 4>(2,04) = 0,9793

105) = P( - 1,25 ~ U ~ 1,25) = P(I UI = 2 . 4>(1,25) - 1 = 0,7888

AusschufJanteil: P = 1 - P(95

18)

°

~

X

~

105) = 0,2112

1,25) =

~

21,1%

U ~ 1) = 4>(1) - 4>(-0,5) = = 4>(1) + 4>(0,5) - 1 = 0,5328 Ausschuflanteil: P = 1 - P(98 ~ X ~ 104) = 0,4672 ~ 46,7% ~

X

~

104) = P(-0,5

~

Mindestpunktzahl: a

P(X

~

a) = 0,6

a 4- 20) = P(U -

P(X

~

a) = P ( U

P(U

~

c) = 1 - P(U

~

~

~

~

~

c) = 0,6

(c

=

a -4 20 )

c) = 1 - 4> (c) = 0,6

°

4> (c) = 0,4 < 0,5 ~ c < ~ Wir setzen c = - k: 4>(c) = 4>( - k) = 1 - 4>(k) = 0,4 4>(k) = 0,6 ~ k = 0,253 ~ c = - k = - 0,253 ~ a = 18,988 ~ 19 Daher: Die geforderte M indestpunktzahl betrug 19 Punkte. 19)

20)

X -75 U=-5 a)

P(69 ~ X ~ 80) = P( -1,2 ~ U ~ 1) = 4>(1) - 4>( -1,2) = 4>(1) + 4>(1,2) - 1 = 0,7262 Anzahl der Studenten: 5000· 0,7262 = 3631

b)

P(X> 80) = 1 - P(X ~ 80) = 1 - P(U ~ 1) = 1 - 4>(1) Anzahl der Studenten: 5000· 0,1587 = 794

c)

P(X < 65) = P(U ~ - 2) = 4>(-2) = 1 - 4>(2) = 0,0228 Anzahl der Studenten: 5000· 0,0228 = 114

=

0,1587

X-750 20

U=---

a)

P(X < 730) = P(U < - 1) = 4>( -1) = 1 - 4>(1) = 0,1587

b)

P(735

~

X

~

765) = P( - 0,75

~

U

~

0,75) = 2 . 4>(0,75) - 1 = 0,5468

II Wahrscheinlichkeitsrechnung 21)

789

Die (binomialverteilte) Zufallsvariable X (= Anzahl an Ausschufistiicken in einer Stichprobe vom Umfang n = 100) kann naherungsweise durch eine Poisson- Verteilung mit dem Parameter (Mittelwert) J.1 = np = 100 ° 0,01 = 1 ersetzt werden: e -1 P(X = x) =I(x) = -

x!

a) 22)

P(X

n=20,

= 2) = 0,1839

p=1/2,

q=1/2

X-10

u=

b)

J5 ;

~

P(X > 2)

J.1=np=10;

= 1 - P(X

(J2

~

2) = 0,0803

= npq = 5;

(J

=

J5

P*(8 ~ X ~ 12)

Stetigkeitskorrektur:

= P( -1,118 = 2 (1,118) - 1 = 0,7364

P*(8 ~ X ~ 12) ~ P(7,5 ~ X ~ 12,5)

~ U ~

1,118) =

°

Exaktes Ergebnis (Binomialverteilung): 0,7368

23)

n = 360,

u=

p = 1/3,

q = 2/3

X-120

~

J.1 = np = 120;

(J2

= npq = 80;

P*(100~X~140)

°

J80'

Stetigkeitskorrektur: P*(100 ~ X ~ 140) ~ P(99,5 ~ X ~ 140,5)

= P( - 2,292 24)

~

=

U ~ 2,292) = 2 ° ¢(2,292) - 1 = 0,9780

Die Zufallsvariable X (= Anzahl derjenigen Gerate in der Stichprobe yom Umfang n = 200, die einer Zuverlassigkeitspriifung nicht standhalten) ist binomialverteilt mit n = 200, p = 0,06 und q = 0,94, kann jedoch durch eine N ormalverteilung mit den folgenden Parametern ersetzt werden:

J.1 = np = 12;

(J2

X -12 u=-_o

= np(1 - p) = 11,28;

P*(10 ~ X ~ 15)

~'

Stetigkeitskorrektur:

= P(-0,744 ~ U ~ 1,042) = = ¢(1,042) - ( - 0,744) = ¢(1,042) + ¢(0,744) - 1 = 0,6229

P*(10 ~ X ~ 15) ~ P(9,5 ~ X ~ 15,5)

Abschnitt 7 1)

Verteilungen der Komponenten (Randverteilungen): 3

a)

11 (x.) J.1x = 2;

1/2

-2

4

1/2

3/8 2 (Jy

=

351

64

3/8

790

Anhang B: Losungen der Ubungsautgaben

b)

11 (xJ Jix

°

0,60

f2 (yJ

0,40

a; = 0,24;

= 0,40;

-2

-1

0,25

0,15

2 0,15

0,45

a; = 2,94

Jiy = 0,4;

2)

I, (x)

I2(Y) 3)

a)

11 (x)

f2(Y) b)

Xi

2

4

6

Yi

11 (xJ

0,40

0,20

0,40

f2(yJ

a; =

Jix = 4;

c)

4)

Jiy = 0,4;

a; =

11 (2) . f2 (0) = 0,4 . 0,7

=

0,28 = 1(2; 0)

11 (2) ·12 (1) = 0,4 . 0,2

=

0,08 = 1(2; 1)

11 (2) ·12 (2) = 0,4 . 0,1

=

0,04 = 1(2; 2) u.s.w.

a)

11 (xJ

5)

3,2;

1/4

= 2;

2

3

1/2

1/4

Var(X) = 0,5;

b)

E(X)

a)

Durch N ormierung folgt k = 2.

b)

II (x) = 2·

f y=o

f2 (yJ E(Y) = 1;

e- 2 x - y dy = 2 . e- z x ;

2

°

0,70

0,20

0,10

0,44

2

°

1/4

1/2 Var(Y)

Iz(Y) = 2·

f x=o

1/4

= 0,5

e- Zx - y dx = e- Y

c)

ja


c)

E(X)

f

= 2·

791

x . e- 2x dx = 0,5;

E(X 2) = 2·

o Var(X)

f

x 2.

e~2xdx = 0,5

o

= E(X 2) - (E(X))2 = 0,25;

E(Y)

fr

=

e- Y dy = 1

o E(y 2) =

f

Var(Y) = E(y 2 )

y2 . e- Y dy = 2;

-

(E(y))2

=1

o

d)

P(O

c

Liisung: 494,12 Q

~

= 5,88 R

~

(Tabelle 2 im Anhang, Teil A)

505,88 Q

Z = X + Y ist normalverteilt mit dem Mittelwert Jl = 30 und der Standardabweichung (J = 5. Die Dichtefunktion lautet somit: 1 1 (Z - 30)2 I(Z)=---'e- 2 - 5 -

5·)2;

(-oo

= 4,604

4,604

n = 5;

/10 = /11 - /12

=

°

H 0 wird beibehalten, d. h. nicht abgelehnt (Bi1d A-49).

s/J;z Aufgrund der verwendeten Stichprobe und des gewahlten Signifikanzniveaus a 1 % konnen wir von der Gleichwertigkeit derbeiden MeBmethoden ausgehen.

= 0,01 =


807

Testwert f=4,312 ~ H o beibehalten 0,99

Bild A-49

o

-4,604

7)

4,604

Die Stichproben sind voneinander unabhdngig. Wir fiihren einen einseitigen Test (Abgrenzung nach oben) wie folgt durch:

Nullhypothese:

n.;

/12 ~ /11

Alternativhypothese: H 1 : /12 > /11 Wegen n 1 > 30, n2 > 30 diirfen wir dabei die standardnormalverteilte Zufallsvariable

X-y

U = - - verwenden: a P(U ~ C)H o = 1 - r:J., = 0,99 ¢(c) = 0,99 ~

Annahmebereich: u

x = 1540 h; n1

=

2,326

C = U O,99 =

~

2,326

y=1600h;

n2 = 120

100;

(]'=

Testwert:

y-x u= - = 3,042

~

a

H o wird abgelehnt (Bild A-50).

u

Testwert = 3, 042 ~ H o ablehnen

I o

0,01

Bild A-50

2,326

u

Folgerung: Die im Werk B produzierten Teile haben - wie vermutet - eine groflere Lebensdauer. 8)

Wir testen die Nullhypothese H 0: /11 = /12 gegen die Alternativhypothese H 1 : /11 #- /12: P( - c

~

F(c)

0,995

=

T

~

C)H o = 2 . F(c) - 1 = 1 f=nl +n2-2=8

) c

Annahmebereich: - 3,355 ~ t

x= S2

5,992;

= 0,0081;

Y=

6,04;

s = 0,0898

=

~

r:J.,

t(0,995;8)

= =

0,99 3,355

3,355 Sl =

0,1055;

S2

= 0,0707;

808


~

Testwert: t = (Bild A-51).

x - y .yr;;:;;;- .-= ~--_\

n1

+

n2

0,845

=:>

. H 0 wird beibehalten, d. h. nicht abgelehnt

s

Folgerung: Die beiden Stichproben stammen aus derselben Grundgesamtheit. Testwert = -OJ845 ~ H o beibehalten

t

OJ99

-3

9)

Bild A-51

o

J355

3

Einseitiger Test (Abgrenzung nach oben): P(Z F(c) = 0,95

f=n-l=ll

~

Annahmebereich:

Z

s = 0,4 mm;

S2

Testwert:

z= (n -

) c=

Z(O,95;11)

J355

~

C)H o = 1 - a = 0,95

= 19,67

19,67

= 0,16 mm ':

n = 12;

0"5

= 0,04 mm?

S2

1) 2" = 44

=:>

0"0

H o wird abgelehnt (Bild A-52). Die Abweichung ist signifi-

kant, die Maschine mull neu eingestellt werden. Fur

ff.

= 1% erhalt man den Annahmebereich z ~ 24,73. Die Entscheidung ist dieselbe. Testwert ; 44 ~ H o ablehnen

=

OJ 95

Bild A-52

o 10)

19

z

J67

Die Bedingung (111-242) fur eine umfangreiche Stichprobe ist erfiillt: npo(1 - Po) = 11,64 > 9. Einseitiger Test (Abgrenzung nach oben): P(U ¢(c)

= 0,95

~

c=

Annahmebereich: u k = 20;

Testwert:

U O,95

~

n = 400;

~

C)H o = 1 -

ff.

= 0,95

= 1,645

1,645

P== 0,05;

u= .y~ ~(n) . (p -

Po)

Po = 0,03 =

2,345

=:>

n;

wird abgelehnt (Bild A-53). Die Stich-

probe widerspricht somit der Behauptung des Herstellers, d.h. der Ausschulsanteil ist grojJer als 3%.

809

III Grundlagen der mathematischen Statistik Testwert ~ =2,345 ~ H o ablehnen

Bild A-53

o 11)

u

1,645

Die Bedingung (111-242) fur eine umfangreiche Stichprobe ist erfullt: nPo(1 - Po)

=

50 > 9.

Zweiseitiger Test: Wir testen die Nullhypothese H o : P = Po = 0,5 gegen die Alternativhypothese Hi: p i= Po = 0,5. P( - c ~ U ~ C)H o

¢(c) = 0,975

---+

= 2 . ¢(c) - 1 = 1 - a = 0,95 U O,975 = 1,960

c=

Annahmebereich: - 1,960 ~ u k = 88; Testwert: Ii

~

1,960

P= 0,44;

n = 200;

= Jpo(1 ~ Po) . (ft -

Po) =

Po = 0,5

-

1,697

=0>

n;

wird beibehalten, d.h. nicht abge-

lehnt (Bild A-54). Die verwendete Stichprobe steht in keinem Widerspruch zu der Nullhypothese, daB der Wiirfel .unverfdlscht'' ist. Testwert u=-1,697 ~ H o beibehalten

-1,960

o

1,960

Abschnitt 5 1)

p = p (Zahl)

Nullhypothese H o : Gleichverteilung (p = Po = 0,5)

u

Bild A-54

810

Anhang B: Losungen der Ubungsaufgaben P(Z = X ~ 2

F (c) = 0,95

C)H

O

= 1-

f=k-1=1

Annahmebereich: z

=

)

= 0,95

(X

=

Z(O,95; 1)

~

3,84

C

X2

A A 8 Testwert: z = X2 = - = 2,667

3

=>

= 3,84

H o wird beibehalten, d.h. nicht abgelehnt (Bild A-55). Wir

konnen somit bei einer Irrtumswahrseheinliehkeit von 5 % .ziemlich sieher" sein, daB die Miinze "eeht", d.h. "unverfalseht" ist (die verwendete Stiehprobe steht zumindest in keinem Widersprueh zu dieser Hypothese).

z

Testwert = 2,667 ~ H o beibehalten 0,95

Bild A-55

o

2)

z

3,84

Nullhypothese H o : Gleiehverteilung (Pi = p(i) = 1/6 fur i = 1,2, ... ,6)

35

1/6

50

-15

225/50

2

39

1/6

50

-11

121/50

3

70

1/6

50

20

400/50

4

62

1/6

50

12

144/50

5

56

1/6

50

6

36/50

6

38

1/6

50

-12

144/50

P(Z = X ~ 2

F (c) = 0,99

C)H

o

= 1-

f=k-1=5

Annahmebereich: z 2

=

(X

= 0,99

) c= X2

~

Z(O,99; 5)

= 15,09

15,09

Testwert: 2 = X = 1070/50 = 21,4 "verfalseht".

=>

H o wird abgelehnt (Bild A-56). Der Wiirfel ist somit

811

III Grundlagen der mathematischen Statistik Testwert ;=21,4 ~ H o abJehnen

0,99

Bild A-56

o 3)

z

15,09

Nullhypothese H o : Poisson-Verteilung f(x)

= /lx . e-/L

x!

Schdtzwert fur den unbekannten Parameter (Mittelwert) u: u ~ {t =

Wir bilden 5 Klassen: X = 0, X = 1, X = 2, X = 3 und X

~

x=

1,45

4

Berechnung der theoretischen Wahrscheinlichkeiten:

°

Xi Pi

2

~4

3

0,2346

0,3401

0,2466

0,1192

0,0595

~

~

~

~

~

f(O)

f(1)

f(2)

f(3)

3

1-

L

f(i)

i=O

P(Z

27

0,2346

23,46

3,54

0,5341

2

31

0,3401

34,01

-3,01

0,2664

3

22

0,2466

24,66

-2,66

0,2869

4

12

0,1192

11,92

0,08

0,0005

5

8

0,0595

5,95

2,05

0,7063

= X2 ~ C)H = 1 - a = 0,95

°

F(c) = 0,95

f=k-l-r=3

Annahmebereich: z

z

=

) c

=

Z(O,95; 3)

= 7,81

X2 ~ 7,81

Testwert: = X2 = 1,7942 ~ H o wird beibehalten, d.h. nicht abgelehnt (Bild A-57). Die Zufallsvariable X geniigt einer Poisson-Verteilung mit dem (geschatzten) Parameter /l = 1,45 (Zumindest spricht die Stichprobe nicht dagegen).

812


z

Testwert = 1, 7942 ~ H o beibehalten

Bild A-57

o

4)

z

7,81

Nullhypothese

n;

Fo(x) = ¢ (

/1)

X -

-(j-

Die Parameter /1 und a sind unbekannt und werden aus der Stichprobe wie folgt geschdtzt: 8,81; a ~ s = 0,5563 (beide Werte in lj100km). Dabei wurden die folgenden Klassenmitten zugrunde gelegt: Xl == 7,75; 2 = 8,25; 3 = 8,75; 4 = 9,25; Xs = 9,75.

/1 ~ x =

x

x

Berechnung der Wahrscheinlichkeiten Pi (i

1. Klasse: P:

=

P(X < 8) = Fo(8)

2. Klasse: P2 = P(8

~

4. Klasse: P4 = P(9 5. Klasse: Ps

=

~

P(9,5

= 1, 2, ... , 5):

8 - 8,81) ¢ ( 0,5563 = ¢( -1,456) = 1 - ¢(1,456) = 0,0727

X < 8,5) = Fo(8,5) - Fo(8) = ¢(- 0,557) - ¢( -1,456) = 0,2160

X < 9) = Fo(9) - Fo(8,5)

=

¢(0,342) - ¢( - 0,557) = 0,3451

X < 9,5) = Fo(9,5) - Fo(9)

=

¢(1,240) - ¢(0,342) = 0,2587

~

3. Klasse: P3 = P(8,5

=

x

~ X

< (0)

=

1 - (Pl

+ P2 + P3 + P4) =

0,1075

8

0,0727

7,27

0,73

0,0733

2

20

0,2160

21,60

-1,60

0,1185

3

36

0,3451

34,51

1,49

0,0643

4

24

0,2587

25,87

-1,87

0,1352

5

12

0,1075

10,75

1,25

0,1453

P(Z =

X2

~

F (c) = 0,99

C)H

o

=

1 - rx = 0,99

f=k-l-r=2

) c=

Z(0,99; 2)

Annahmebereich: z = X2 ~ 9,21

=

9,21


813

Testwert: 2 = X2 = 0,5366 => H 0 wird beibehalten, d. h. nicht abgelehnt (Bild A-58). Der mittlere Benzinverbrauch X ist eine normalverteilte Zufallsgr6Be mit den (geschatzten) Parametern u = 8,811/100 km und (J = 0,55631/100 km (das Stichprobenmaterial gibt keinen AnlaB, diese Hypothese zu verwerfen). Testwert ; = 0,5366 ~ H o beibehalten

Bild A-58

o

Abschnitt 6 1)

a)

z

9,21

Sxy

y

= 1;

r = 0,6565

Streuungsdiagramm ("Punktwolke"): Bild A-59

• •

4

3 2

• • •

•

Bild A-59 2

b)

Sxy

= - 17,5;

r = - 0,9988

Streuungsdiagramm ("Punktwolke"): Bild A-60

3

4

5

x

y

20 15

•

• • •

10

•

5

Bild A-60

5

10

x


814 2)

r = 0,9866 Streuungsdiagramm: Bild A-61

y

kg

••

80

•• •

70

60

•

•

•• •

52

Bild A-61

170

165

si = 0,2887 Q2;

3)

s} = 448,21 CC)2;

4)

r = 0,9948 Streuungsdiagramm: Bild A-62

STR

180

175

= 11,34 °C Q;

r

L em

= 0,9974

L

Die Stichprobenpunkte liegen nahezu auf einer Geraden ~ Losungsansatz: L = aT + b

180

• •

150

•

•

100

• BUd A-62

70 20

5)

40

60

80

100

T

Die Randverteilungen (Wahrscheinlichkeitsfunktionen von X und Y) sind jeweils grau unterlegt. a)

'-v--'

12(Y)

III Grundlagen der mathematischen Statistik 1

1

1 1 E(Y) = - 1 . - + 1 . - = 0

E(X) = - 1 . - + 1 . - = O· 2 2 ' E(X' Y)

= -

815

2

2

1 1 1 1 1 . (-1) . 4: - 1 ·1 . 4: + 1 . (- 1) . 4: + 1 . 1 . 4: = 0

(JXY = E(X' Y) - E(X)' E(Y) = 0

~

Q= 0

X und Y sind somit unkorreliert. ( b)

~

12(Y)

322

2

E (X) = 0 . 5 + 1 . 5 = 5;

E(Y) =

322

o· 5 + 1 . 5 = 5;

E(X' Y) =

1

E(y 2 ) = 0 2

4

2 2

.2

+ 1 .5 = 5

32 2 + 12 . - = 555

. -

4

2

2

0·0· 3 + 0·1 '15 + 1 . 0'15 + 1 . 1 '15 = 15

(JXY = E(X . Y) - E(X) . E(Y) = 2

2 3

E(X ) = 0 . 5

2

2

~

15 -

2 2 2 5 . 5 = - 75

2 2 (2)2 6 5 =25;

(Jx=E(X )-(E(X)) =5-

(J 2 = E(Y 2) - (E(Y)) 2 = 2 - (2)2 = -6

5

y

5

25

2 (JXY 75 1 Q=--=--= -(Jx'(Jy 6 9

y

25 13

6)

= 1 ~ Sdmtliche MeBpunkte liegen aufeiner Geraden (Bild A-63).

r

10

Geradengleichung (Gerade durch zwei beliebige MeBpunkte!): y = 2x + 3 Ausgleichsgerade

5

Bild A-63 2

3

4

5

x

816


IV Fehler- und Ausgleichsrechnung Abschnitt 3 1)

a)

U = 80,9 V

b)

2)

a)

R

= 1140;

SR

Su = 0,35 V;

= 2,51 0;

S[J

SR=

=

Su J6 = 0,14 V

J8 = 0,89 n SR

Vertrauensintervalle: 11 = 950/0: R = (114 ± 2,1) 0 'Y2 = 990/0: R = (114 ± 3,1)0 b)

p=

1,012 bar;

Sp

Sp = 0,0009 bar

= 0,0026 bar;

Vertrauensintervalle: 11 = 950/0: p = (1,012 ± 0,002) bar 'Y2 = 99 %: p = (1,012 ± 0,003) bar

3)

9 = 9,81 m/s"; a)

Sg

a 1 = 5%, d. h.

11

= 0,02 m/s";

= 0,007 m/s?

Sg

= 95%

Vertrauensgrenzen:

± 0,017 m/s?

MeBunsicherheit: I1g = 0,017 m/s? ~ 0,02 m/s?

Mej3ergebnis: g = (9,81 b)

(X2

± 0,02) m/s '

= 10/0, d.h. 'Y2 = 990/0

Vertrauensgrenzen:

± 0,025 m/s?

MeBunsicherheit: I1g = 0,025 m/s? ~ 0,03 m/s '

Mej3ergebnis: g = (9,81 4)

SR

sR = ~

=0>

n>

± 0,03) m/s:'

(SR)2 sR = 49

Es sind also mindestens 49 Einzelmessungen durchzufiihren.

5)

Die Masse kann als eine normalverteilte Zufallsvariable X rnit dem Mittelwert f1 ~ iii = 105 und der Standardabweichung (J ~ Sm = 3 angesehen werden (beide Werte in g). Wir gehen zur

standardisierten Zufallsgrobc U

X -105

tiber und berechnen zunachst die benotigten 3 Wahrscheinlichkeiten nach Tabelle 1 im Anhang (Teil A). a)

=

Pi = P(103 ::;; X::;; 108) = P (

-~::;; U ::;; 1) = 1>(1) -1>(-D =

= 1>(1) + 1>(D - 1 = 0,5889

-+

npi = 58,89

~ 59

Rund 59 MeBwerte liegen zwischen 103 g und 108 g.

817


b)

pz =

=

P(X > 110)

~

np2 = 4,78

= p( D=

Mathematik fuer Ingenieure und Naturwissenschaftler

Mathematik fuer Ingenieure und Naturwissenschaftler

Mathematik fuer Ingenieure und Naturwissenschaftler