This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
0)
•
6.1.3 Darstellung von Gradient, Divergenz, Rotation und Laplace-Operator in Polarkoordinaten Die Differentialoperationen Gradient, Divergenz und Rotation sowie der Laplace-Operator lassen sich auch durch Polarkoordinaten ausdriicken. Sie besitzen dann die folgende Gestalt 11):
11)
Auf die Herleitung dieser Ausdriicke wollen wir verzichten und verweisen den an Einzelheiten interessierten Leser auf die Spezialliteratur (siehe Literaturverzeichnis).
6 Spezielle ebene und raumliche Koordinatensysteme
101
Anmerkung
Der in Polarkoordinationen ausgedriickte Laplace-Operator enthalt auch eine leitung im Gegensatz zur kartesischen Darstellung.
•
j
0
Ab-
Beispiele (1)
Wir berechnen die Divergenz des ebenen Ortsvektors Radialkomponente r besitzt:
r = r er, der nur eine
10 10 1 dlvr=dlv(r er)=-o-(ror)=-o-(r 2 )=-02r=2 0_
0
_
r or
r or
r
Zum gleichen Ergebnis kamen wir bereits in der kartesischen Darstellung (Beispiel (2) aus Abschnitt 5.102)~ (2)
Wir wollen zeigen, daB das Geschwindigkeitsfeld _ v
=
_() v x; y
=
1
x
2
+y
( 2
quellen- und wirbelfrei ist.
-
_ _) Y ex + x ey
102
I Vektoranalysis In Polarkoordinaten besitzt dieses Vektorfeld die folgende, besonders einfache Darstellung: _
_
1_ (r > 0)
v == v(r; r
(siehe hierzu das Beispiel im vorherigen Abschnitt 6.1.2). Fur die Divergenz und Rotation des Geschwindigkeitsfeldes erhalten wir dann:
. _ . (1r _)q> == -1r . -o
rot
v == 0
v
Wegen div == 0 und rot == 6 handelt es sich in der Tat urn ein quellen- und wirbelfreies Geschwindigkeitsfeld. (3)
Wir interessieren uns nun fur diejenigen Losungen der Laplace-Gleichung i1¢ == 0, die Rotationssymmetrie besitzen, d. h. nur von der Abstandskoordinate r abhangen: ¢ == 1(r). Die Laplace-Gleichung lautet in diesem Fall wie folgt:
Diese Differentialgleichung 2. Ordnung konnen wir auch in der Form 1
+ -' ¢'(r) == 0
¢"(r)
(cP/(r) =
r
~~)
schreiben. Wir losen sie mit Hilfe der Substitution u == ¢' (r),
u' == ¢" (r)
durch "Trennung derVariablen" (Band 2, Abschnitt V.2.2):
+ ~ . u == 0
u'
du dr
f
u
du
r
u
dU --; == - fdr --;:
In u
du dr
=>
u r
-+-==0
oder
r
dr r In u == - In r
+ In r == In (u r) == In C 1
+ In C 1
6 Spezielle ebene und raumliche Koordinatensysteme
103
Rucksubstitution und anschlieBende unbestimmte Integration ergeben dann: u = ep'(r) = C 1 r
Die rotationssymmetrischen Losungen der LapIace-GIeichung sind somit (im ebenen Fall) durch die logarithmischen Funktionen cjJ (r) = C 1 . In r
+ C2
(r > 0)
•
gegeben (C 1 , C 2 ElR).
6.1.4 Ein Anwendungsbeispiel: Geschwindigkeitsvektor bei einer glelchformlgen Kreisbewegung Ein MasseteiIchen bewege sich gleichfiirmig, d. h. mit der konstanten WinkeIgeschwindigkeit co auf einer Kreisbahn mit dem Radius R (BiId 1-77). Wir beschreiben diese Bahn durch den zeitabhdngigen Ortsvektor -+
r(t)
fur t
~
=
R· cos(wt) ex + R· sintoir) ey - + .
-+
t))
(COS(W R.. . sint«i t)
=
0 (Anfangslage zur Zeit t = 0: Punkt A).
y
A
x Bild 1-77 Gleichformige Kreisbewegung
(1-246)
I Vektoranalysis
104
Durch Differentiation nach dem Zeitparameter t erhalten wir daraus den Geschwindigkeitsvektor
~
-+
v(t)=r(t)=R
(-w,sin(wt)) (-sin(wt)) =Rw co . cos(wt) cos(wt)
(1-247)
Das Teilchen besitzt somit die kartesischen Geschwindigkeitskomponenten Vx
= - Rw' sin(wt)
"» = Rei cos(wt)
und
Wir interessieren uns jetzt fur die Darstellung des Geschwindigkeitsvektors koordinaten, d. h. fur eine Darstellung in der Form
(1-248)
v in Polar(1-249)
Beim Ubergang von den kartesischen Koordinaten zu den Polarkoordinaten transformieren sich die kartesischen Geschwindigkeitskomponenten V x und vy nach Gleichung (1-234) bzw. (1-238) wie folgt: (1-250)
Wir setzen noch fur V x und "» die Zeitabhangigkeiten ein und beachten ferner, daB bei der gleichformigen Kreisbewegung die Beziehung cp = cot gilt: Vr (
vq>
) =(
cos(wt) - sin(wt)
= Rw (
Sin(wt))RW(-sin(wt))= cos(wt) cos(wt)
cos(w t) - sin(wt)
sin(w t)) ( - sin(w t) ) cos(wt) cos(wt)
(1-251)
Nach Durchfuhrung der Matrizenmultiplikation erhalten wir fur die gesuchten Geschwindigkeitskomponenten u, und vq> dann die folgenden Ausdrucke: v, = Rio [- cos(wt)· sin(wt)
vq> = Rio [sin2(wt)
+ sin(wt)· cos(wt)] = 0
+ cos 2(wt)] =
Rw
(1-252)
6 Spezielle ebene und raumliche Koordinatensysteme
105
Das Masseteilchen besitzt also nur eine (konstante) tangentiale Geschwindigkeitskomponente vq> = Reo, in Ubereinstimmuug mit unseren Uberlegungen in Abschnitt 1.6. Der Geschwindigkeitsvektor lautet somit in der Polarkoordinatendarstellung wie folgt (Bild 1-78): (1-253)
y
x
Bild 1-78 Geschwindigkeitsvektor bei einer glcichformigen Kreisbcwegung, dargestellt im Polarkoordinatensystem
6.2 Zylinderkoordinaten 6.2.1 Definition und Eigenschaften der Zylinderkoordinaten Zylinderkoordinaten werden vorzugsweise bei raumlichen Problemen mit Axial- oder Zylindersymmetrie bzw. Rotationssymmetrie verwendet. Wir haben sie bereits in knapper
Form in Band 2 (Abschnitt IV.3.2.2.2) kennengelernt und beschranken uns daher auf eine kurze Zusammenfassung ihrer wichtigsten Eigenschaften.
106
12)
13)
I Vektoranalysis
Die Zylinderkoordinate (l gibt den senkrechten Abstand des Raumpunktes P von der z-Achse an und ist daher nicht zu verwechseln mit dem Abstand r desselben Punktes Yom' Koordinatenursprung 0, d.h. mit der Lange des Ortsvektors r = GP. Urn solche Verwechslungen zu vermeiden, verwenden wir hier ausschliefilich das Symbol (l fur die Abstandskoordinate. Fur die Punkte der x, y- Ebene besteht allerdings kein Unterschied zwischen r und (l. Daher hatten wir auch bei den Polarkoordinaten der Ebene das Symbol r fur den Abstand eines Punktes vom Koordinatenursprung gewahlt. Dieser Eigenschaft verdanken die Zylinderkoordinaten ihren Namen.
6 Spezielle ebene und raumliche Koordinatensysteme
107
z
Z
4.
"
",I
.,.'"
,
p = canst.
."..,.
"-
--- - r
!iiiii·~-~r---
qJ
......... .........
p
y
Y
I
.
...........
~
x
x
Bild 1-80
Bild 1-81
Koordinatenflache (Zylindermantel)
Q=
const.
Koordinatenflache tp = const. (Halbebene, begrenzt durch die z-Achse)
z
,
I I I I I I
Bild 1-82
."..,.----t--- . . . .
"
}-- - "-+--~
/
x
= canst.
y
Koordinatenflache z = const. (zur x, y-Ebene parallele Ebene)
108
I Vektoranalysis
p-Linie
t------I--
z- Lln ie Bild 1-83
Koordinatenlinien des Zylinderkoordinatensystems
x
6 Spezielle ebene und raumliche Koordinatensysteme
z
dqy
dz dA
= p do dz
pdqy
y
x
Bild 1-84 Flachenelement dA auf dem Zylindermantel
109
I Vektoranalysis
110
z
Volumenelement dV = dA dz = P ikp do dz dz
dA=pdcpdp dcp
p dtp
x
y
p+dp dA =pdcpdp
Bild 1-85 Volumenelement dV in Zylinderkoordinaten
6.2.2 Darstellung eines Vektors in Zylinderkoordinaten In einem raumlichcn kartesischen Koordinatensystem wird ein Vektor
ain der Form (1-260)
ex, e
e
dargestellt. Dabei sind y und z Einheitsvektoren in der positiven x, y- und z-Richtung. Sie bilden die Basis fur diese Vektordarstellung. Unsere Aufgabe besteht nun darin, den Vektor in Z ylinderkoordinaten darzustellen. Dazu benotigen wir aber zunachst drei geeignete Einheitsvektoren als Basisvektoren.
a
6 Spezielle ebene und raumliche Koordinatensysterne
111
Basisvektoren in Zylinderkoordinaten
Wir iibernehmen die beiden Basisvektoren der Polarkoordinaten, also die Einheitsvektoren eQund e und ez sind daher orthogonal, d. h. sie stehen paarweise senkrecht aufeinander.
e
e
e
Der Ubergang von der kartesischen Basis ex, ey, z zur "neuen" Basis e g , eq>' z laBt sich wie bei den ebenen Polarkoordinaten durch eine orthogonale Transforrnationsrnatrix A wie folgt beschreiben:
(. ~ee
eq>
)
=
(
c~s tp
-
(1-262)
SIn ' e z ' wie folgt darstellen: (1-265) Dabei sind ag , aq> und az der Reihe nach die mit einem Vorzeichen versehenen Projektionen von auf die drei Basisvektoren e g , eq> und e z • Diese (positiven oder negativen) skalaren Groben sind die Vektorkoordinaten oder skalaren Vektorkomponenten des Vektors im Z ylinderkoordinatensystem. Sie lassen sich wie folgt aus den kartesischen Vektorkoordinaten ax, ay und a, bestimmen:
a
a
ag = ax . cos
ip
+ ay • sin qJ (1-266)
6 Spezielle ebene und raumliche Koordinatensysteme
113
Die ersten beiden Transformationsgleichungen haben wir direkt von den Polarkoordinaten iibernommen, wahrend die dritte Vektorkoordinate a, unverdndert bleibt (denn sie wurde ja aus der kartesischen Darstellung iibernommen). Die Transformationsgleichungen (1-266) lassen sich auch in der M atrizenform darstellen:
c~s qJ sin tp a; ) ( aqJ = - SIn tp cos tp ( az 0 0
(1-267)
A
Wie bei den Polarkcordinaten gilt auch hier: Die Vektorkoordinaten eines beliebigen Vektors transformieren sich beim Ubergang von den kartesischen Koordinaten zu den Zylinderkoordinaten in der gleichen Weise wie die Basisvektoren. Umgekehrt erfolgt der Ubergang von den skalaren Vektorkomponenten a(J' aqJ' az des Zylinderkoordinatensystems zu den kartesischen Komponenten ax, ay , a z mit Hilfe der zu A inversen Matrix A-I:
a
(1-268)
Wir fassen die Ergebnisse wie folgt zusammen:
114
1 Vektoranalysis
Anmerkung
Die Riicktransformation, d. h. der Ubergang von den Z ylinderkoordinaten zu den kartesischen Koordinaten, erfolgt iiber die zu A inverse Matrix A-I. Sie lautet:
0)
- sin cp~ cos cp
(1-272)
o •
Beispiel Wir wollen das im kartesischen Koordinatensystem gegebene Vektorfeld
in Zylinderkoordinaten, d. h. in der Form F == F(Q; o; z) == Fg e g
darstellen (x
2
+ y2
+ FqJ
eqJ
+ r;
ez
#- 0).
Die gesuchten Vektorkoordinaten Fg , FqJ und F; lassen sich unter Verwendung von x == Q . cos sp •
y
==
Q.
sin cP,
z == z,
6 Spezielle ebene und raumliche Koordinatensysteme
1t5
aus den Gleichungen (1-271) wie folgt berechnen: . F Q == Fx . cos cp + Fy • SIn cp ==
1
Jx2 1
== -
(Q .
cos" cp
+ y2
+ Q . sin? cp) == cos"
cp
. (x . COS cp + Y . SIn cp) ==
+ sin'
cp == 1
Q
F
0 stets wirbelfrei. Denn das Feld besitzt nur eine einzige skalare Vektorkomponente in axialer Richtung und diese wiederum ist nur von g abhangig: (1-281) Die Rotation dieses Feldes verschwindet daher nach Gleichung (1-277): rot F = rot (f (g)
e =0
(1-282)
g)
(alle partiellen Ableitungen sind gleich Null). I
Dagegen ist ein zylindersymmetrisches Vektorfeld im allgemeinen nicht quellenfrei. Denn aus Gleichung (1-276) erhalten wir fur die Divergenz des Vektorfeldes den folgenden Ausdruck: . div F
~
1
a (g . F) = -1 . -a (g . f
- .-
g ag
e
g ag
(g))
(1-283)
6 Spezielle ebene und raumliche Koordinatensysteme Er kann nur dann verschwinden, wenn das Produkt (2 .
f
((2)
= const.
oder
f
((2)
(2 .
119
f((2) eine Konstante ist, also
= const.
(1-284)
(2
gilt. Dieser Sonderfall tritt also genau dann ein, wenn der Betrag des Feldvektors umgekehrt proportional zum Abstand (2 ist.
•
F
Beispiel Ein Musterbeispiel fur ein wirbel- und quellenfreies Vektorfeld mit Zylindersymmetrie liefert das elektrische Feld in der Umgebung eines homogen geladenen Zylinders (Bild 1-88).
Aquipotentialflache Bild 1-88
Zylinderquerschnitt
I Vektoranalysis
120 Fur die elektrische Feldstdrke
E gilt namlich 15):
_ QeI R 2 1_ E==E(Q)==--'- e
2 Go
Q
(Q ~ R)
g
Ladungsdichte; R: Zylinderradius; Go: elektrische Feldkonstante). Das E-Feld ist wegen der Zylindersymmetrie wirbelfrei und wegen
(QeI:
auch quellenfrei.
•
6.2.5 Ein Anwendungsbeispiel: Geschwindigkeitsvektor eines Massenpunktes in Zylinderkoordinaten Ein Massenpunkt bewege sich auf einer rdumlichen Bahnkurve mit dem zeitabhdngigen Ortsvektor
r(t) == x(t)
ex + y(t) e + z(t) e == x ex + y e + z e y
z
z
y
(1-288)
Der zugehorige Geschwindigkeitsvektor (1-289) mit den kartesischen Geschwindigkeitskoordinaten Zylinderkoordinaten, d. h. in der Form
Vx
==
x, vy == y und v; == i
solI nun in (1-290)
dargeste11t werden. Beim Ubergang zu den Zylinderkoordinaten gelten die Transformationsgleichungen (1-271). Sie lauten hier:
+ vy • sin
auch durch eine orthogonale Transformationsmatrix A wie folgt beschreiben:
er )
( ~.9eq>
(Sin:) . cos q> = cos 9 '. cos tp - SIn q>
sin 9 . sin q> cos:) . sin q> cos q>
(1-311)
A
Umgekehrt lassen sich die "alten" Einheitsvektoren aus den "neuen" Einheitsvektoren mittels der zu A inversen Matrix A-I bestimmen: ex ) (
~y
ez
(Sin 9 . cos q> =. sin 9 . sin qJ cos:)
cos 9 . cos q> cos S . sin qJ - sin 9
Vektordarstellung in Kugelkoordinaten
Ein im kartesischen Koordinatensystem gegebener Vektor (1-313)
HiBt sich in Kugelkoordinaten, bezogen auf die Basis e r , e 9 , eq>' wie folgt darstellen: (1-314)
Dabei sind a., a9 und aq> der Reihe nach die mit einem Vorzeichen versehenen Projektionen des Vektors auf die drei Basisvektoren e r , e 9 und eq>. Diese (positiven oder negativen) skalaren Groben sind die Vektorkoordinaten oder skalaren Vektorkomponenten des Vektors im Kugelkoordinatensystem. Sie lassen sich wie folgt aus den kartesischen Vektorkoordinaten ax, ay und az bestimmen:
a
a
+ ay • sin 9 . sin tp + az . cos 9 a9 = ax . cos 9 . cos qJ + ay • cos:) . sin qJ - az • sin :) aqJ = - ax . sin qJ + ay • cos qJ a, = ax . sin 9 . cos tp
(1-315)
Diese Transformationsgleichungen lauten in der Matrizenform:
(
a; ) a9
a.;
(Sin 9 . cos = . cos t) .. cos
- sm
tp
qJ qJ
sin 9 . sin tp cos:) . sin qJ cos qJ
(1-316)
A
a
Auch fur die Kugelkoordinaten gilt: Die Vektorkoordinaten eines beliebigen Vektors transformieren sich beim Ubergang von den kartesischen Koordinaten zu den Kugelkoordinaten in der gleichen Weise wie die Basisvektoren.
I Vektoranalysis
130
Umgekehrt erfolgt der Ubergang von der Darstellung in Kugelkoordinaten zur kartesischen Darstellung mit Hilfe der zu A inversen Matrix A -1 :
(
aax) == A - ( asa; ) y
a,
1
aqJ
cos 9 . cos qJ ( sin 9 . cos qJ == sin 9 . sin tp cos 9 . sin qJ - sin 9 cos 9v
A -1
Wir fassen nun die wichtigsten Ergebnisse zusammen:
- sin qJ) cos qJ
o
(
a; ) as aqJ
(1-317)
6 Spezielle ebene und raumliche Koordinatensysteme
131
Anmerkung Die Riicktransformation, d. h. der Ubergang von den Kugelkoordinaten zu den kartesischen Koordinaten, erfolgt tiber die zu A inverse Matrix A-I. Sie lautet: A-I ==
•
(
sin 9 . cos
qJ
.sin 9 . sin
qJ
cos 9 . cos qJ cos 9 . sin qJ - sin 9
cos 9
- sin qJ) cos tp
(1-321)
o
Beispiele (1)
Wie lautet die Darstellung des Feldvektors
F == F(x; y; z) == x ex + y ey + ez in Kugelkoordinaten?
Liisung: Der gegebene Feldvektor soll in der Form
F == F(r; 9; qJ) == F,.
+ t;
er
eij + F({J e({J
dargestellt werden. Die gesuchten Vektorkoordinaten F',., Fij und F({J lassen sich dann unter Verwendung von x
==
y == r . sin 9 . sin
r . sin [) . cos qJ,
qJ,
z == r : cos [)
aus den Gleichungen (1-320) wie folgt berechnen: F, == F; . sin [) . cos
== x . sin 9- . cos == r . sin 2 ==
2
[) .
qJ
+ F; . sin 9 . sin tp + F, . cos 9 ==
qJ +
cos 2
qJ
Y . sin [) . sin
+ r . sin 2 [)
2
2
r . sin 9 (cos qJ + sin qJ)
.
qJ +
sin 2
1 . cos 9- ==
+ cos [) ==
qJ
+ cos [) ==
r . sin 2
[)
+ cos 9-
1
Fij == F; . cos 9- . cos qJ + F; . cos [) . sin qJ - Fz . sin [) ==
== ==
x . cos [) . cos qJ + Y . cos r . sin
9- . cos [) . cos
== r . sin 9 . cos [)(cos 2
2
qJ qJ
9- . sin
+r
qJ -
1 . sin 9 ==
. sin [) . cos
+ sin 2 qJ) -
9- . sin 2
qJ -
sin [) ==
sin 9 ==
1
== r . sin [) . cos [) - sin 9- == (r . cos 9- - 1) . sin 9F({J == - Fx . sin qJ, + Fy • cos
== - r . sin [) . cos
qJ
qJ • sin qJ
== - x . sin
qJ
+ Y . cos qJ ==
+ r . sin [) . sin qJ . cos qJ == 0
132
1 Vektoranalysis Somit ist
ff = (r . sin 2 [) + cos [)) er + (r . cos [) -
1) . sin [)
e:J
die gesuchte Darstellung des Feldvektors in Kugelkoordinaten. Man beachte, daB diese Darstellung unabhdngig vom Winkel tp ist und keine Komponente in Richtung des Breitenkreises besitzt. (2)
Ein Massenpunkt bewege sich auf dem Breitenkreis einer Kugel mit dem Radius r (Bild 1-100). Die Bahn ist dann durch Angabe der Breitenkoordinate [) eindeutig festgelegt. Wir interessieren uns nun fur den Geschwindigkeitsvektor v des Teilchens, ausgedriickt in Kugelkoordinaten.
z
Breitenkreis
y
Bild 1-100 Zur Bewegung eines Massenpunktes auf dem Breitenkreis 9- = canst.
x
r
Dabei gehen wir zunachst von kartesischen Koordinaten aus. Ortsvektor und Geschwindigkeitsvektor lauten dann (beide sind zeitabhiingig):
v
r=r(t)=x v=v(t)=x
ex+y ey+z ez ex+Y ey+i ez
Der Geschwindigkeitsvektor
v besitzt in Kugelkoordinaten die Darstellung
Zwischen den "alten" und den "neuen" Geschwindigkeitskomponenten bestehen dabei nach den Gleichungen (1-320) die folgenden Beziehungen:
o, = = Vs
+ vy • sin [) . sin tp + Vz • cos [) = x. sin [) . cos qJ + Y. sin [) . sin qJ + i . cos [) Vx •
sin [) . cos tp
= o; . cos [) . cos qJ + vy . cos [) . sin qJ -
Vz .
sin [) =
x. cos [) . cos qJ + Y. cos [) . sin qJ - i . sin [) VqJ = - V sin qJ + v cos qJ = - x. sin qJ + Y. cos qJ =
x .
y •
6 Spezielle ebene und raumliche Koordinatensysteme
133
Wir driicken nun x, y und z mittels der Transformationsgleichungen (1-305) durch die Kugelkoordinaten r, :) und qJ aus und differenzieren die Gleichungen anschlieBend nach der Zeit t. Da auf dem Breitenkreis r und :) feste Grobe sind, gilt = 0 und :) = o. Unter Beriicksichtigung dieser Bedingungen erhalten wir dann:
r
x = r . sin :) . cos qJ
--+
y = r . sin :) . sin tp
--+
x = - r . sin :) . sin qJ . cP Y = r . sin :) . cos tp . cP
z = r . cos :)
--+
i
=
0
Damit nehmen die gesuchten Geschwindigkeitskomponenten Vr' V s und v({J die folgende Gestalt an: X . sin S . cos (p,+ Y. sin S . sin
Vr =
qJ
+ i . cos:) =
= - r . sin 2 :) . sin qJ • cos qJ • cP +
+r Vs
=
.
sin 2
:) •
sin
qJ • cos tp .
cP
+ 0 . cos :) =
x. cos:) . cos qJ + Y. cos:) . sin qJ -
= -
r . sin S . cos :) . sin
qJ • cos qJ •
cP
+ r . sin :) . cos :) . sin qJ • cos qJ • cP v({J
= -
0
i . sin S =
+ - 0 . sin :) = 0
x. sin qJ + Y. cos qJ =
+ r . sin :) . cos 2 qJ • cP = = r . sin :) . cP (sin2 tp + cos 2 qJ) = r . sin :) . cP
=
r . sin :) . sin 2
qJ • cP
Das Teilchen bewegt sich somit auf dem Breitenkreis mit dem Geschwindigkeitsvektor
v = r . sin [) . cP
e({J
Erfolgt die Bewegung mit konstanter Winkelgeschwindigkeit OJ, so ist qJ = OJ t und cP = OJ und wir erhalten das bereits aus Abschnitt 6.1.4 bekannte Ergebnis
v=
r . sin S . OJ e({J ,=
OJ r
. sin S e({J
= ROJ e({J
Dabei ist R = r . sin S der Radius des Breitenkreises aus Bild 1-100.
•
134
I Vektoranalysis
6.3.3 Darstellung von Gradient, Divergenz, Rotation und Laplace-Operator in Kugelkoordinaten Die Differentialoperationen Gradient, Divergenz und Rotation sowie der Laplace-Operator besitzen in Kugelkoordinaten das folgende Aussehen:
6 Spezielle ebeneund raumliche Koordinatensysteme
135
Anmerkung Der in Kugelkoordinaten ausgedriickte Laplace-Operator enthalt auch partielle Ableitungen 1. Ordnung (im Unterschied zum kartesischen Fall):
(1-328)
a¢. a2¢ a9a (a¢) sin 9. a9 = cos 9. a9 + SIn 9. a9 2 •
Beispiele (1)
Wir bestimmen den Gradient des skalaren Feldes ¢ = ¢(r; 9; == oir : sin 9 eq>.
Fur die Rotation des Feldvektors
verhalten wir dann nach Gleichung (1-326):
1 (a rot _ v == - - . - - (sin 9 . vq» r . SIn 9 a9
)_e, - -l(a-a· (r· .)_ vq» es ==
.2)-
== - -1. - (a - (wr . SfIl 9) er r . SIn
9 a9
1 r . SIn 9
== --.-. wr(2· sin
9· cos 9)
r
-
r
l(a- (wr r ar
-
2.)- == . SIn 9)
es
_1_ e, - _. w· sin 9· (2r) es == r
Der in der Klammer stehende Vektor ist aber nach Gleichung (1-312)genau der Einheitsvektor z . Somit gilt:
e rot v == 2 co e == 2 OJ . Dabei ist OJ == co e der in der positiven z-Achse liegende Vektor der Winkelgez
z
schwindigkeit. Das Geschwindigkeitsfeld auf einer rotierenden Kugel ist somit ein Wirbelfeld, ein Ergebnis, das wir bereits von einer rotierenden Scheibe her kennen (vgl. hierzu Abschnitt 5.2.2).
•
6.3.4 Kugelsymmetrische Vektorfelder (Zentralfelder) Ein kugel- oder radialsymmetrisches Vektorfeld, in den naturwissenschaftlichen Anwendungen meist als Zentralfeld bezeichnet, vom allgemeinen Typ (1-329) ist fur r #- 0 stets wirbelfrei. Denn das Feld besitzt nur eine Komponente in radialer Richtung und diese wiederum ist nur von r abhangig, nicht aber von den beiden Winkelkoordinaten 9 und tp:
F,. == f (r),
(1-330)
6 Spezielle ebene und raumliche Koordinatensysteme
137
Daher verschwinden in dem Formelausdruck (1-326) fur die Rotation samtliche partiellen Ableitungen, d. h. es gilt rot
F == rot (f (r)
e
r ) ==
0
(1-331 )
Ein Zentralfeld ist somit immer wirbelfrei. Es ist dagegen im allgemeinen nicht quellenfrei, da die Divergenz des Feldes nur in Sonderfdllen verschwindet. Nach Gleichung (1-325) gilt namlich fur die Divergenz: div F
10 2 . - (r . F,.) r 2 or
== -
10 2 . - (r . f (r)) r 2 or
(1-332)
== -
e
Die Divergenz des Zentralfeldes F(r) == f(r) r kann daher nur dann den Wert Null annehmen, wenn das Produkt r2 . f(r) eine Konstante ist, d.h. r 2 . f (r) == const.
oder
f( r)
const.
==2
r
(I-333)
gilt. Dies ist genau dann der Fall, wenn der Betrag des Feldvektors F umgekehrt proportional zum Quadrat des Abstandes r ist.
Wir fassen zusammen:
138
•
I Vektoranalysis
Beispiele (1)
Das Gravitationsfeld der Erde ist ein wirbel- und quellenfreies Zentralfeld. Nach dem Gravitationsgesetz von Newton erfahrt eine Einheitsmasse (m == 1) die folgende Anziehungskraft: -
M_ e,
(r > 0)
F == - y 2 r
(M: Erdmasse; y: Gravitationskonstante; Bild 1-103).
Fur den Betrag dieser Kraft gilt somit:
-I -_ M _ 1F Y r
y M _ const.
2 -
r
2-
r
2'
Bild 1-103
Gravitationsfeld der Erde (ebener Schnitt durch den Erdmittelpunkt)
(2)
Das elektrische Feld in der Umgebung einer (positiven) Punktladung Q ist ein wirbel- und quellenfreies Zentralfeld mit der elektrischen Feldstarke
Q E==---e 2 4n 8 0 r
(r > 0)
r
(Bild 1-104). Denn der Feldstdrkebetrag ist dem Quadrat des Abstandes umgekehrt proportional:
Q- == -Q- . -1 == (const.) . -1 == const. 1E-I == 4 8 r 4 tt 8 r r r tt 0
2
2
0
2
2
6 Spezielle ebene und raumliche Koordinatensysteme
139
-+-
E
•
Bild 1-104 Radialsymmetrisches elektrisches Feld in der Umgebung einer posiliven Punktladung Q (ebener Schnitt durch die Punktladung)
+Q
• 6.3.5 Ein Anwendungsbeispiel: Potential und elektrische Feldstarke in der Umgebung einer geladenen Kugel Eine homogen geladene Kugel mit dem Radius R und der (positiven) Ladung Q erzeugt in ihrer Umgebung ein kugel- oder radialsymmetrisches elektrisches Feld, dessen Potential U = U (~) der Laplace-Gleichung I1U
=
I1U(r)
=0
(r
~ R)
(1-337)
geniigt (Bild 1-105).
geladene Kugel
Bild 1-105 Radialsymmetrisches elektrisches Feld in der Umgebung einer positiv geladenen Kugel (ebener Schnitt durch den Kugelmittelpunkt)
I Vektoranalysis
140
Unter Beriicksichtigung der Kugelsymmetrie lautet diese Differentialgleichung 2. Ordnung dann wie folgt:
(2
au)
dU =
au). or
-12 . -a r . r or or
( u '(r) =
dr
== -1 . -d
r2 dr
2
(r . U (r) == 0 I
(1-338)
Die in dieser Gleichung auftretende Ableitung kann nur dann
verschwinden, wenn das Produkt r2 . U' (r) eine Konstante ist, d. h. wenn r2 • U (r) == const. I
==
C1
(1-339)
gilt. Wir losen diese Gleichung nach U (r) auf und integrieren anschlieBend unbestimmt: I
U'(r) = C21 r
U(r)
== C 1 ·
1 r
C1 r
f
2. dr == - -
+ C2
(1-340)
Das Potential wird dabei iiblicherweise so festgelegt, daBes im Unendlichen verschwindet. Aus der Bedingung U (r == 00) == 0 folgt dann:
U (r
==
00) == 0
C2
=>
==
0
(1-341)
Somit ist
C1
U(r)== - -
(1-342)
r
Die Konstante C 1 UiBt sich aus der Kapazitat C == 4ns oR der Kugel bestimmen (R: Kugelradius; so: elektrische Feldkonstante). Aus der Definitionsformel der Kapazitat
Q
C == - - == 4 tt Eo R U(R)
(1-343)
folgt dann fur das Potential U (R) auf der Kugeloberfldche: U(R)==-Q-
(1-344)
4nsoR
Zusammen mit der Gleichung (1-342) erhalten wir daraus eine Bestimmungsgleichung fur die Konstante C 1 : U(R)==
C1
Q
R
4ns oR
--==--
=>
(1-345)
6 Spezielle ebene und raumliche Koordinatensysteme
141
Das Potential im Auj3enraum der Kugel wird somit durch die kugelsymmetrische Funktion
Q U=U(r)=-4ne or
(r
~
R)
(1-346)
beschrieben. Die elektrische Feldstdrke E ist der negative Gradient des Potentials. Wegen der Kugelsymmetrie gilt dann nach Gleichung (1-324)
-
E = - grad U = -
au _
a;:
e, = -
dU _ e,
a;:
(1-347)
Mit der Ableitung dU
d (
a;: = dr
Q)
4 n Eo r
Q d -1 Q -2Q = 4 n Eo . dr (r ) = 4 n Eo ( - r ) = - 4 n Eo r 2
(1-348)
erhalten wir schlielilich den radial nach auj3en gerichteten Feldstarkevektor dU _ Q_ E=--e=---e dr r 4neor2 r
(r
~
(1-349)
R)
Der Betrag der Feldstarke nimmt dabei mit zunehmender Entfernung r vom Kugelmittelpunkt ab und zwar umgekehrt proportional zum Quadrat des Abstandes (Bild 1-106).
E(r)
E(R)
Bild 1-106 Verlauf der elektrischen Feldstarke in der Umgebung einer positiv geladenen Kugel
R
r
142
I Vektoranalysis
7 Linien- oder Kurvenintegrale 7.1 Ein einfiihrendes Beispiel Wir fiihren den Begriff eines Linien- oder Kurvenintegrals in anschaulicher Weise am Beispiel der physikalischen Arbeit ein, die von einer Kraft bzw. einem Kraftfeld beim Verschieben eines Massenpunktes verrichtet wird. Schrittweise gehen wir dabei wie folgt vor: Verschiebung lings einer Geraden durch eine konstante Kraft (Bild 1-107)
Der Massenpunkt wird durch eine konstante Kraft F langs einer Geraden urn den Vektor s verschoben. Die dabei verrichtete Arbeit ist definitionsgemaf das skalare Produkt aus dem Kraftvektor Fund dem Verschiebungsvektor s:
W=F's=P's'cosqJ
(1-350)
(vgl. hierzu auch Band 1, Abschnitt 11.3.3.5).
s
Bild 1-107 Zum Begriff der Arbeit einer konstanten Kraft beim Verschieben langs einer Geraden
Verschiebung lings einer Geraden durch eine ortsabhangige Kraft (Bild 1-108) Frs)
s
dss +ds
s
Bild 1-108 Zum Begriff der Arbeit einer ortsabhdngigen Kraft beim Verschieben langs einer Geraden
Die auf den Massenpunkt einwirkende Kraft ist jetzt von Ort zu Ort verschieden: F = F(s). Wir zerlegen das geradlinige Wegstiick in eine groBe Anzahl von sehr kleinen Wegelementen, Iangs eines jeden Wegelementes darf dann die einwirkende Kraft als nahezu konstant betrachtet werden. Die bei einer infinitesimal kleinen Verschiebung des Massenpunktes urn ds verrichtete Arbeit betragt dann definitionsgemaf
dW = F (s) . ds = F;;(s) ds
(1-351)
~(s) ist dabei die Kraftkomponente in Wegrichtung. Durch Integration erhalten wir die insgesamt von der Kraft F(s) langs des (geradlinigen) Weges von Sl nach S2 geleistete Arbeit.
143
7 Linien- oder Kurvenintegrale Sie fuhrt uns zu dem Arbeitsintegral
f ff
S2
W=
f
S2
dW =
S2
(s) . ds =
(1-352)
Fs(s) ds
(vgl. hierzu auch Band 1, Abschnitt V.l0.6) Allgemeiner Fall: Verschiebung lings einer Kurve in einem Kraftfeld (Bild 1-109)
Die bisher betrachteten Verschiebungswege waren ausschlieBlich geradlinig. Diese Einschrankung lassen wir nun fallen, wir wenden uns dem allgemeinen Fall zu: In einem ebenen Kraftfeld F(x; y) solI ein Massenpunkt vom Punkt ~ aus langs einer Kurve emit dem Ortsvektor r == r(t) in den Punkt ~ verschoben werden (t 1 ~ t ~ t 2 ) . Welche Arbeit wird dabei vom Kraftfeld an der Masse verrichtet? y
Bild 1-109 Zum Begriff der Arbeit in einem (beliebigen) ebenen Kraftfeld
x
Bei der Berechnung der Arbeit miissen wir beriicksichtigen, daB die auf den Massenpunkt langs der Kurve C einwirkende Kraft von Ort zu Ort variiert. Wir gehen daher analog vor wie in Fall 2 und zerlegen die Kurve C zunachst in eine groBe Anzahl von Wegelementen, wobei wiederum langs eines jeden Wegelementes eine nahezu konstante Kraft angenommen werden darf. Beim Verschieben des Massenpunktes von P aus urn ein infinitesimal kleines Wegelement dr in den Punkt Q verrichtet das Kraftfeld die Arbeit - _ (Fx(X; y)) . (dX) ==Fx(x;y)dx+F(x;y)dy dW==F·dr== Fy(x; y) dy y
(1-353)
(Bild 1-110). Die bei einer Verschiebung auf der Kurve C von ~ nach ~ insgesamt vom Kraftfeld aufzubringende Arbeit erhalten wir dann durch Integration: W=
f ff . f dW =
c
d'f =
c
(Fx(x; y) dx
c
+ Fy(x~ y) dy)
(1-354)
I Vektoranalysis
144 y
c
Bild 1-110 Zur Herleitung des Arbeitsintegrals
x
Da die Integration langs einer bestimmten Kurve, auch Weg oder Linie genannt, erfolgt, bezeichnet man ein solches Integral als Linien- oder Kurvenintegral und schreibt verabredungsgemaf das Kurvensymbol (hier: C) unten an das Integralzeichen. Bei der Berechnung des Integrals ist dabei zu beachten, daB das Kraftfeld noch von den Koordinaten x und y des Kurvenpunktes P abhangt. Diese jedoch sind keineswegs voneinander unabhangig, sondern tiber die Kurvengleichung miteinander verkniipft. Fiir die Koordinaten x und y setzt man daher die Parametergleichungen x (t) bzw. y(t) der Integrationskurve C ein. Die langs dieses Weges wirkende Kraft hangt dann nur noch yom Kurvenparameter tab. Das Wegelement dr ersetzen wir noch durch den Tangentenvektorr = ;(t) und das Differential dt des Parameters t. Es ist ~ dr r=-
und somit
dt
_
~ d r = r dt =
Das Arbeitsintegral (Linienintegral)
(x(t)) Y(t) dt
(1-355)
f
F . dr geht schlieBlich mit Hilfe dieser Substitu-
c tion in ein gewohnliches Integral iiber:
W=
t2
f
f
C
t1
F . dr =
(11 . -;) dt =
t2
=
f
fFx(x(t); y(t))· x(t) + Fy(x(t); y(t)) . y(t)) dt
(1-356)
t1
•
Beispiel
Wir berechnen die Arbeit, die das ebene Kraftfeld F(x; y) =
G~2)
Massenpunkt bei einer geradlinigen Verschiebung von Pi = (0; 0) nach verrichtet (Bild 1-111).
an einem ~
= (1;
1)
7 Linien- oder Kurvenintegrale
145
y
c Bild 1-111
x
P t = (0;0)
Der Integrationsweg C lautet in vektorieller Darstellung:
c: Fur
F, ;
r(t) =
C~:;) = (:)
und das Skalarprodukt
(0 ~ t ~ 1)
F.; erhalten wir dann:
Die vom Kraftfeld geleistete Arbeit betragt somit nach der Integralformel (1-356): 2
W
==
f t
t1
-.
~
(F· r) dt
==
fi (t 3 + t 2 ) dt ==
[1 t + -1t ] 7 -
4
4
3
3
1
0
== -
12
•
0
7.2 Definition eines Linien- oder Kurvenintegrals Die Berechnung der Arbeit eines ebenen Kraftfeldes an einer punktformigen Masse fiihrte uns zu dem Begriff eines Linien- oder Kurvenintegrals. Wir iibertragen diesen Begriff nun auf ein rdumliches Vektorfeld.
146
I Vektoranalysis
Anmerkungen (1) Das Linien- oder Kurvenintegrai (1-357) lautet in ausfiihrlicher Schreibweise wie folgt: t2
f
[FAx; y; z) dx
+ Fy(x; y; z) dy + FzCx; y; z) dz]
C
=
f
(Fx x + FyY
+ Fzz) dt
t 1
(1-358)
F(x; y) und
(2)
Die Definition (1-357) gilt sinngemaf auch fur ein ebenes Vektorfeld eine ebene Kurve == r(t).
(3)
Man beachte, daB der Wert eines Linien- oder Kurvenintegrals i. a. nicht nur vom Anfangs- und Endpunkt des Integrationsweges, sondern auch noch vom eingeschlagenen Verbindungsweg abhangt.
(4)
Wird der Integrationsweg C in der umgekehrten Richtung durchlaufen (symbolische Schreibweise: - C), so tritt im Integral ein Vorzeichenwechsel ein:
r
fl.
dr
= -
-c (5)
fl.
(1-359)
dr
c
Fiir ein Kurvenintegral langs einer geschlossenen Linie C verwenden wir das Symbol
fl.
dr oder auch
fl.
dr (Bild 1-112). Ein so1ches Kurvenintegral wird
c in den physikalisch-technischen Anwendungen auch als Zirkulation des Vektorfeldes F langs der geschlossenen Kurve C bezeichnet.
BUd 1-112 Geschlossener Integrationsweg C mit dem Anfangs- und Endpunkt Pi
c (6)
fl. fl. f(I.T)
Das Kurvenintegral
dr HiBt sich auch wie folgt ausdriicken:
c
dr
c
=
ds
(1-360)
c
Dabei ist T der Tangenteneinheitsvektor und ds das Linienelement der Kurve C (Bild 1-113). Integriert wird dann tiber die Tangentialkomponente des Vektorfeldes F langs der Kurve C.
147
7 Linien- oder Kurvenintegrale
Kurve C
Tang~ntialkomponente
von F
Bild 1-113 Zur Integration tiber die Tangentialkomponente des Vektorfeldes F
Analog HiBt sich auch ein Kurvenintegral tiber die N ormalkomponente von langs des Weges C definieren:
F
(1-361)
N ist dabei der
Hauptnormaleneinheitsvektor der Kurve C.
7.3 Berechnung eines Linien- oder Kurvenintegrals Die Berechnung eines Linien- oder Kurvenintegrals wird wie folgt vorgenommen:
148
•
I Vektoranalysis
Beispiele (1)
Wir berechnen das Linienintegral f (y . eX dx
+ eX dy)
langs des parabel-
c [iirmigen Verbindungsweges C: x = t, Y = t 2 der beiden Punkte 0 = (0; 0) und P = (1; 1) (Bild 1-114). y P
= (1 ;1)
Bild 1-114 Parabelformiger Integrationsweg C
o
x
Langs dieses Weges gilt: x = t,
.
x
dx dt
=- =1
dx = dt
'
. dy Y=dt=2t,
dy=2tdt
::s; t ::s; 1). Durch Einsetzen dieser Ausdriicke in das Linienintegral erhalten wir dann:
(0
1
f (y. e" dx
+ eX dy) =
C
f (t 2 • e' dt
+ e t • 2t dt) =
0 1
=
f (t 2 • c'
+ 2t· e') dt =
o 1
=
=
f t
1 2
•
c' dt
+ 2 . ft.
o
0
[(t2 - 2t + 2)·
etI
= (e - 2) + 2(0
c' dt =
+ 2[(t -
+ 1) = e -
2
1)·
etI
+ 2 = e = 2,7183
Die anfallenden Integrale haben wir dabei der I ntegraltafel der Formelsammlung entnommen (IntegraleNr. 313 bzw. Nr. 314).
7 Linien- oder Kurvenintegrale (2)
149
Welchen Wert besitzt das Linienintegral des raumlichen Vektorfeldes F(x; y; z) =
(2:2::2)
langs der Kurve C, die durch den Ortsvektor
x+z
r(t)
=(;2)
mit 0 :::;: t:::;: 1 beschrieben wird?
Liisung :
Es ist x = t, Y =
und z = t und somit
t? 4
_ F
=
(2t+t t5
)
,
2t
= (2 t + t 4 ) . 1 + t 5 . 2 t + 2 t . 1 = 2 t'' + t 4 + 4 t 87
35
•
Bei einem ebenen Problem, d. h. einem Linienintegral in der Ebene, liegt der Integrationsweg C haufig in Form einer expliziten Funktionsgleichung y = f (x) vor. Die Berechnung des Linienintegrals
fi
0
dr wird dann wie folgt vorgenommen: Man ersetzt
C
die Koordinate y durch die Funktionf(x) und das Differential dy durchf'(x)dx und erhalt auf diese Weise ein gewohnliches Integral mit der Integrationsvariablen x (die Integrationsgrenzen sind dabei die Abszissenwerte der beiden Kurvenrandpunkte):
fi
0
dr =
c
f
(FAx; y) dx
+ Fy(x; y) dy) =
c
f
X2
=
•
[FAx;f(x))
+ Fy(x;f(x)) of'(x)] dx
Beispiel Wir berechnen das Kurvenintegral
f
(x y2 dx
+ x y dy) fur
(1-362)
die in Bild 1-115 skiz-
c zierten Verbindungswege der Punkte 0 = (0; 0) und P =(1; 1).
150
I Vektoranalysis y P
= (1;1)
y=x 3 Bild 1-115
Drei verschiedene Verbindungswege der Punkte 0 = (0; 0) und P = (1; 1)
x
0=(0;0)
Integrationsweg C 1: Y = dy == 1 dx '
X,
0
~ X ~
1
dy == dx 1
f
(X
y2 dx
+ X Y dy) =
C1
f
1 (X .
2
x dx
+ X . X dx) =
0
f (x
3
+ x 2) dx
0
Integrationsweg C 2 : Y = x 3 , 0 ~
X
~
1
dy == 3x 2 dx 1
f(
x y2 dx
+ xy dy) =
C2
f
(X .
x" dx
+ X . x 3 • 3x 2 dx) =
0 1
f
[
== (x7 + 3 x 6 ) dx == -1 x 8 + -3 X 7 .
o
Integrationsweg C 3
= Ci + c;*
Teilweg Cf ldng« der y-Achse von 0 nach Q:
x == 0,
f Cf
dx == 0, 1
(X
y2 dx
+ X Y dy) =
f
0 dy = 0
0
8
7
J1 == -3156 0
=
151
7 Linien- oder Kurvenintegrale Teilweg Cj* ldngs der Geraden y = 1 von Q nach P: dy = 0,
y = 1,
Langs des Gesamtweges C 3 gilt somit:
Wir stellen fest: In diesem Beispiel hangt das Linienintegral nicht nur vom Anfangs- und Endpunkt des Weges, sondern auch noch von dem eingeschlagenen Verbindungsweg selbst abo Wir erhalten fur jeden der drei Verbindungswege einen anderen Wert.
•
7.4 Wegunabhangigkeit eines Linien- oder Kurvenintegrals. Konservative Vektorfelder Wir untersuchen in diesem Abschnitt die Voraussetzungen, unter denen der Wert eines Linien- oder Kurvenintegrals nur vom Anfangs- und Endpunkt, nicht aber vom eingeschlagenen Verbindungsweg der heiden Punkte abhangt, wobei wir uns zunachst auf ebene Vektorfelder beschranken wollen. Ein Linienintegral vom Typ
fi . f dr =
c
(FAx; y) dx
+ Fy(x; y) dy)
(1-363)
c
ist wegunabhdngig, wenn die lineare Differentialform
p. dr = Fx(x; y) dx + Fy(x; y) dy
(1-364)
vollstdndig ist, d. h. das totale oder vollstdndige Differential d¢ einer ortsabhangigen Funktion <jJ(P) = <jJ(x; y) darstellt: d¢ = F; dx
+ F; dy =
o¢
o¢
ox dx + oy dy
(1-365)
Dann namlich gilt:
fi . f dr =
c
(Fx dx
c
+ Fy dy) =
f(~~ c
P2
dx
+ ~~ dy) =
f
d¢ = [¢(P)J; =
Pt
(1-366)
152
1 Vektoranalysis
Das Linienintegral hangt in diesem Fall nur vom Anfangspunkt ~ == (Xl; Y1) und dem Endpunkt ~ == (x 2; Y2) des Integrationsweges abo Ein Vektorfeld mit dieser Eigenschaft wird in den Anwendungen als konservatives Feld oder Potentialfeld, die Funktion ¢(x; y) als Potentialfunktion oder kurz als Potential des Feldes bezeichnet.
Woran aber kann man nun erkennen, ob ein vorgegebenes (ebenes) Vektorfeld F(x; y) mit den skalaren Komponenten Fx(x; y) und Fy(x; y) konservativ ist oder nicht? Die Beantwortung dieser Frage ist in der Praxis von groBer Bedeutung. Falls F(x; y) konservativ, d. h. ein Potentialfeld ist und ¢ (x; y) die zugehorige Potentialfunktion 18), so gilt jedenfalls:
a¢
F ==x
ax
und
a¢
F ==y
ay
(1-367)
Die skalaren Komponenten des Feldvektors F(x; y) sind in diesem Fall die partiellen Ableitungen i.Ordnung der Potentialfunktion ¢(x; y), d.h. der Feldvektor F(x; y) ist der Gradient der Potentialfunktion ¢(x; y):
F(x; y) == grad ¢(x; y) ==
(1-368)
Die Wegunabhdngigkeit eines Linienintegrals bedeutet also, daB das Vektorfeld als Gradient einer Potentialfunktion darstellbar ist. Unter den Voraussetzungen des Schwarzschen Satzes gilt dann weiter: und somit
(1-369)
Diese Bedingung ist notwendig und zugleich hinreichend fur die Wegunabhangigkeit eines Linienintegrals vom Typ (1-363). Sie laBt sich auch durch die Gleichung rot
F == 0
beschreiben.
18)
Die Potentialfunktion ist bis auf ein konstantes Glied eindeutig bestimmt.
(1-370)
7 Linien- oder Kurvenintegrale
153
Denn bekanntlich verschwindet bei einem ebenen Feld F == F(x; y) sowohl die x-Komponente als auch die y-Komponente des Vektors rot F automatisch, wahrend die z-Komponente
-
oPy - -oPx ox oy
(rot P) == z
(I -371)
offensichtlich genau dann Null wird, wenn die Bedingung (1-369) erfullt ist:
-
(rot P)
oPy - -oP ox oy
== z
x
==
0
oPy == -oP ox oy
-
x
(1-372)
Fur ein rdumliches Verktorfeld ergeben sich analoge Beziehungen zwischen den partiellen Ableitungen 1. Ordnung der skalaren Vektorkomponenten. Auch in diesem Fall ist rot F == 0 eine notwendige und hinreichende Bedingung fur die Wegunabhdngigkeit.
I Vektoranalysis
154 Anmerkungen
(1)
Ein Bereich heiBt einfach-zusammenhiingend, wenn sich jede im Bereich gelegene geschlossene Kurve auf einen Punkt "zusammenziehen" HiBt. Ein ebener einfachzusammenhangender Bereich wird von einer einzigen geschlossenen Kurve begrenzt. Beispiele sind in Bild 1-116 dargestellt (rechteckiger bzw. kreisformiger Bereich).
,
.
".
-
"
J I I
.
.
'\
I
.
.
..
.
v
~
- -----x
x b)
a)
Bild 1-116 Eitifach-zusammenhangende Bereiche a) Rechteckiger Bereich b) Kreisformiger Bereich
innerer Rand iiuBerer Rand
Bild 1-117
Bild 1-118
Zweifach-zusammenhangender Bereich
x, y-Ebene mit einem "Loch" im Koordinatenursprung
Besteht der Rand eines Bereiches jedoch aus mehreren geschlossenen Kurven, so liegt ein mehrfach-zusammenhdngender Bereich vor. Bild 1-117 zeigt einen (ebenen) zweifach-zusammenhdngenden Bereich. Auch die x, y-Ebene ohne den Nullpunkt stellt einen zweifach-zusammenhdngenden Bereich dar (Bereich mit einem sog. "Loch"; Bild 1-118).
7 Linien- oder Kurvenintegrale
155
(2)
Die Bedingung (1-373) bzw. (1-374) wird auch als Integrabilitiitsbedingung bezeichnet.
(3)
Im FaIle der Wegunabhangigkeit verschwindet das Linienintegral langs einer geschlossenen Kurve. Sind namlich C l und C 2 zwei verschiedene Verbindungswege der Punkte Ii und ~ (Bild 1-119), so ist wegen der Wegunabhiingigkeit
f F' dr f F' dr
(1-378)
=
C1
C2
Bild 1-119 Im Falle der Wegunabhdngigkeit verschwindet das Linienintegral langs des geschlossenen Weges C l - C2 (C l und C 2 sind zwei von Pi nach P 2 orientierte Verbindungswege)
Fur die geschlossene Kurve C l - C 2 , die zunachst von Ii langs der Kurve C l nach P2 und von dort Iangs der Kurve - C 2 zuriick nach Pl fiihrt, gilt dann unter Beriicksichtigung der Gleichung (1-378):
fF .dr f F. dr f F' dr + f F' dr f F' dr - f F' dr =
=
C1
-
C2
=
-C 2
C1
(1-379)
=0
=
C1
C2
Wir hatten bereits erkannt, daB ein Linien- oder Kurvenintegral
fF. dr
genau dann
C
wegunabhiingig ist, wenn das (ebene oder raumliche) Vektorfeld ff als Gradient einer ortsabhangigen Funktion ¢, Potentialfunktion genannt, darstellbar ist: ff = grad ¢. Da die konservativen Vektorfelder in Naturwissenschaft und Technik eine iiberragende Rolle spielen, wollen wir ihre wichtigsten Eigenschaften wie folgt zusammenstellen:
156
•
I Vektoranalysis
Beispiele (1)
Das ebene Vektorfeld Potentialfeld, da
F(x; y) == 3 x 2 y
oF 0 2 2 - x == - (3 x y) == 3 x
oy
oy
ex + x 3 ey ist konservativ, d. h. ein
und
und somit die lntegrabilitdtsbedingung (1-373) erfiillt ist:
oFx
st;
-==-==3x
oy
2
ox
Das Linienintegral
ff . f
(3 Xl Y dx
dr =
C
c
+ x 3 dy)
7 Linien- oder Kurvenintegrale
157
ist daher wegunahhdngig, wobei C einen beliebigen Verbindungsweg zweier Punkte ~ und ~ bedeutet, d.h. es gilt: Pz
ff . f
+ x 3 dy)
2
(3 x y dx
dr =
~
C
Wir bestimmen nun die Potentialfunktion ¢(P) = ¢(x; y), deren partielle Ableitungen 1. Ordnung wir bereits kennen. Denn es gilt
F = grad ¢ und somit o¢
-
ox =
F = 3x Z y
und
x
o¢
- = F =X
oy
3
y
Wir integrieren oel> und beachten dabei, daB die Integrationskonstante noch
ox
von der Variablen y abhangen kann:
Durch partielle Differentiation nach y und unter Beriicksichtigung von o¢ = x3 erhalten wir daraus schlieBlich:
oy
o¢ =
-
oy
X
3
+ K ' (y) =
x
3
K'(y) = 0 ~ K(y) = const. = K o
Die Potentialfunktion lautet daher: ¢(x;y)=x 3 y + K o
Fiir einen beliebigen, von tionsweg C gilt somit:
(2)
~
= (Xl; Yl) nach
~
= (x z; yz) fiihrenden Integra-
Wir betrachten das folgende, in Polarkoordinaten definierte Vektorfeld: -+
-+
-+
F=F(r;({J)=r er
({J
+-
r
eq>
(r > 0)
158
I Vektoranalysis Die Rotation dieses Feldes verschwindet in jedem Bereich, der den Koordinatenursprung nicht enthalt, Denn mit
F,.
und
== r
folgt nach Gleichung (1-244) fur die z-Komponente der Rotation (die x- und y-Komponenten verschwinden bei einem ebenen Feld bekanntlich automatisch): (rot F) z
=;:1 . or0 (r . F'fJ) -
1 sr; ;: . ocp
=;:1 [0or (cp) -
0 ocp (r)
J=
0
Das Vektorfeld Fist somit fur r > 0 wirbelfrei. Jetzt berechnen wir das Linienintegral dieses Feldes langs des Mittelpunktskreises K mit dem Radius r (Bild 1-120).
y
-,
r
x
Bild 1-120 Zur Integration Iangs eines Mittelpunktskreises mit dem Radius r
Kreis K
Da der Vektor dr hier tangentiale Richtung hat und somit zum Tangenteneinheitsvektor (Basisvektor) eqJ parallel verlauft, laBt er sich in der Form
dr
==
ds eqJ
==
(r dqJ) eqJ
darstellen 19). Damit erhalten wir fur das Skalarprodukt druck
- d-r == (r -e; + -;: qJ F· eqJ) . d-r == (r -e, ==
r2 de: (er ' eqJ)
+ qJ dqJ
~
o 19)
ds = r dip ist das Linienelement des Kreises.
+ -;:qJ
eqJ) . (d r qJ -) eqJ
(eqJ' eqJ) == qJ dip '-...---'
1
F' ==
dr den Aus-
7 Linien- oder Kurvenintegrale
159
Das Linienintegral langs des Kreises K besitzt damit den folgenden Wert:
Wir erhalten somit langs der geschlossenen Kreislinie einen von Null verschiedenen Wert, obwohl die Rotation des Vektorfeldes F verschwindet. Diesen nur scheinbaren Widerspruch losen wir jetzt wie folgt auf: Die Integrationskurve K umschlieBt eine Singularitdt, namlich den N ull== 0, in dem der Feldvektor F nicht definiert ist. Unsere Kreislinie liegt somit nicht - wie im Kriterium (1-373) gefordert - in einem einfachzusammenhdngenden Bereich, sondern in einem zweifach-zusammenhdngenden Bereich (gesamte x, y-Ebene mit Ausnahme eines "Loches" im Nullpunkt). Diese Aussage gilt im iibrigen auch fiirjede andere geschlossene Kurve urn den Nullpunkt. Mit anderen Worten: Die Kreislinie K liegt in einem Bereich, in dem die Bedingung rot F == 0 nur fur r > 0 erfiillt ist. Das Kriterium fur die Wegunabhangigkeit eines Kurven- oder Linienintegrals ist somit in unserem konkreten Fall nicht anwendbar. punkt r
• 7.5 Anwendungsbeispiele aus Physik und Technik 7.5.1 Kugelsymmetrische Vektorfelder (Zentralfelder) Wie bereits bekannt, verschwindet die Rotation eines kugelsymmetrischen Vektorfeldes oder Zentralfeldes F == f (r) r in jedem Bereich, der den Nullpunkt r == 0 nicht enthalt:
e
rot
F == 0
(r > 0)
(1-384)
Daher ist ein Zentralfeld in jedem einfach-zusammenhangenden Gebiet, das den Nullpunkt ausschlieBt, konservativ. Da aber der Nullpunkt die einzige singulare Stelle im Raum ist, lafit sich jede geschlossene Kurve C ober- oder unterhalb des Nullpunktes auf einen Punkt zusammenziehen. Der Raum ohne Nullpunkt stellt also fur ein Zentralfeld einen einfach-zusammenhangenden Bereich dar. Somit gilt fur jede geschlossene Kurve C, die nicht durch den Nullpunkt verlauft: (1-385)
Mit anderen Worten: Ein kugel- oder radialsymmetrisches Vektorfeld (Zentralfeld) ist stets konservativ.
I Vektoranalysis
160
•
Beispiel
Sowohl das Gravitationsfeld der Erde als auch das elektrische Feld einer Punktladung sind Zentralfelder und somit konservative Vektorfelder.
•
7.5.2 Magnetfeld eines stromdurchflossenen linearen Leiters In der Umgebung eines stromdurchflossenen linearen Leiters existiert ein ringfiirmiges Magnetfeld mit der magnetischen Feldstdrke 1-+ H==-- e -+
2ng
(Q > 0)
(1-386)
qJ
(in Zylinderkoordinaten; I: Stromstarke; o: senkrechter Abstand des Punktes P von der Leiterachse; Bild 1-121). z
rinqtormiqes Magnetfeld
i~ I
magnetische Feldlinie K
elektrischer Leiter
Bild 1-121 Ringformiges Magnetfeld in der Umgebung eines stromdurchflossenen linearen Leiters
Bild 1-122 Zur Integration langs einer kreisformigen magnetischen Feldlinie
Wir interessieren uns nun fur das geschlossene Linienintegral
fifo dr liings
einer
K
kreisfiirmigen Feldlinie K urn den Leiter (Berechnung der "Zirkulation"; Bild 1-122).
7 Linien- oder Kurvenintegrale
161
Der differentielle Verschiebungsvektor dr liegt dabei in der Kreistangente und ist somit in der Form
== ds
dr
(1-387)
e d9 dip
(Ad
Die 1ntegrationsgrenzen lauten dabei wie folgt: 9-1ntegration: tp-Integration:
Von 9 =10 bis 9 =n/2 Von
R
fff
(1-468)
div if dV erhalten wir daher aufierhalb des geladenen
(V)
Zylinders keine Beitrage. Somit kann die Integration auf das Volumen Vz dieses Zylinders beschrankt werden. I nnerhalb dieses Bereiches gilt nach wie vor (1-469)
9 Integralsatze von GauB und Stokes
221
Wir erhalten dann aus dem Gaufischen Integralsatz die folgende Beziehung (Gleichung (1-464)): E(g)· 2n o! =
ffI
div i dV=
(~)
Iff ~:l
dV =
~:l
(~)
.Iff
dV =
~:l. nR
21
(1-470)
(~) ~
nR 2l
Im Aufienraum des geladenen Zylinders gilt daher: QeI R 2 1 E(g) == - _ . 2 Go g
(g
~
(1-471)
R)
D.h. die elektrische Feldstarke E(g) ist dart umgekehrt proportional zum Abstand g von der Zylinderachse, das Feld nimmt also nach auBen hin ab (Bild 1-172).
E(p)
E(R) E(R)
= Pel R 2£0
Bild 1-172
Im AuBenraum eines homogen geladenen Zylinders nimmt die elektrische Feldstarke nach auBen hin ab R
P
Gesamtfeld des geladenen Zylinders Insgesamt haben wir damit die folgende Feldstdrkeverteilung: gel. g _
2 Go E (Q)
==
fur Qel
R2.~
2 GO
g
Bild 1-173 zeigt den Verlauf dieser Verteilung.
(1-472)
222
I Vektoranalysis
E(p)
E(R)
R
p
auBen
innen
Bild 1-173 Verlauf der elektrischen Feldstarke bei einem homogen geladenen Zylinder in axialer Richtung (positive Ladungsdichte; Zylinderradius R)
9.3.2 Magnetfeld eines stromdurchflossenen linearen Leiters Ein sehr langer, linearer Leiter wird von einem konstanten Strom mit der Stromdichte i = io z durchflossen. Er erzeugt in seiner Umgebung ein ringfiirmiges Magnetfeld (Bild 1-174).
e
z
Bild 1-174 Ringformiges Magnetfeld eines stromdurchflossenen linearen Leiters Leiter
--1
magnetische Feldlinie
Der magnetische Feldstarkevektor jj tangiert dabei die kreisformigen Feldlinien und sein Betrag kann daher wegen der Zylindersymmetrie nur vom Abstand g von der Leiterachse abhangen. Bei Verwendung von Zylinderkoordinaten gilt somit:
jj = H(g)
s,
(1-473)
223
9 Integralsatze von GauB und Stokes
Wir stellen uns nun die Aufgabe, den funktionalen Zusammenhang zwischen der magnetischen Feldstarke und dem Abstand vom Leiter herzuleiten. Dabei verwenden wir den I ntegralsatz von Stokes. Er lautet hier:
f if . If dr =
e
(rot
if) . N dA
(1-474)
(A)
Dabei ist C eine kreisformige magnetische Feldlinie mit dem Radius g und A die eingeschlossene, in Bild 1-175 grau unterlegte Kreisflache.
Bild 1-175 Zur Integration langs einer kreisformigen magnetischen Feldlinie
Leiterquerschnitt kretstormiqe magnetische Feldlinie (Integrationskurve C)
Wir berechnen zunachst das Kurvenintegralim Stokes'schen Integralsatz. Da der Feldstarkcvektor H in die Tangentenrichtung fallt, d. h. zum Tangenteneinheitsvektor T == eqJ parallel ist, gilt
H· dr == (H· T)
ds ==
(H· eqJ)
ds == H(g) (eqJ· eqJ) ds == H(g) ds
(1-475)
'-y----I
1
und somit
f if . f dr =
e
H(g) ds = H(g) .
e
f
ds = H(g) . 2n g
(1-476)
e
'--.r--'
2ng Denn der Betrag H (g) der Feldstarke ist Iangs der magnetischen Feldlinie konstant und das verbliebene Kurvenintegral
f
ds beschreibt den Umfang U der kreisformigen Feld-
e linie, besitzt also den Wert U == 2 tt g.
224
I Vektoranalysis
Jetzt wenden wir uns dem Wirbelfluj3 im Stokeschen Integralsatz zu. Nach Maxwell besteht dabei zwischen der magnetischen Feldstarke if und der Stromdichte in jedem Punkt des Feldes der folgende Zusammenhang:
r
rot if ==
r
(I -477)
(es handelt si~h hierbei urn eine der vier Maxwellschen Gleichungen). Beim Fluj3 des Vektors rot H durch die in Bild 1-175 grau unterlegte Kreisflache beachten wir ferner, daB die Flachennormale N in die z-Richtung zeigt und somit mit dem Basisvektor (Einheitsvektor) z identisch ist. Dann aber gilt:
e
(rot if) . N ==
t ez == io (e z . ez) == io
(1-478)
"---v----'
1 Bei der Berechnung des .Wirbelflusses" mussen wir berucksichtigen, daB die Stromdichte auj3erhalb des Leiterquerschnitts uberall den Wert Null hat (Bild 1-176). Die Integration ist daher nur tiber die Ouerschnittsflache A * des Leiters zu erstrecken, unddort hat die Stromdichte den konstanten Wert i o.
magnetische Feldlinie C
Leitercuersctmittstteche A *
Flecbe A, berandet von der magnetischen Feldlinie C
Bild 1-176
Damit erhalten wir:
JJ (rot if) . N dA = JJ io dA (A)
(1-479)
(A*)
Das verbliebene Doppelintegral ist definitionsgemaf die (hier konstante) Stromstiirke I des Leiters. Der Wirbelfluj3 des Magnetfeldes betragt damit:
JJ (rot H) . N dA = JJ io dA = io . JJ dA = ioA* = (A)
(A*)
(A*)
A*
1
(1-480)
9 Integralsatze von GauB und Stokes
225
Der Stokes'sche Integralsatz fiihrt also zu dem folgenden Ergebnis: H(Q)
0
2nQ
=
(1-481)
I
Die magnetische Feldstarke H(Q) ist daher dem Abstand Q vom Leiter umgekehrt proportional, nimmt also nach auBen hin ab: I
1
(Q > 0)
H(Q)=_o2n Q
(1-482)
Diese Abhangigkeit wird in Bild 1-177 verdeutlicht.
H(p)
Bild 1-177
H(p) ~
Verlauf der magnetischen Feldstarke in der Umgebung eines stromdurchflossenen linearen Leiters
Lp
p
226
I Vektoranalysis
Ubungsaufgaben Zu Abschnitt 1 1) Wie lautet die vektorielle Darstellung der in Bild 1-178 skizzierten Wurfparabel (waagerechter Wurfmit der Anfangsgeschwindigkeit vo)? x(t)
x
yet)
Wurfparabel
Bild 1-178 y
2)
Beschreiben Sie die folgenden Kurven durch parameterabhdngige Ortsvektoren und bestimmen Sie den jeweiligen Tangentenvektor: a) Parabel y = 4x 2 , X ~ 0 b) Mittelpunktskreis (Radius R, positiver Umlaufsinn) c) Gerade durch den Ursprung mit der Steigung m = 2
3) Auf dem Bildschirm eines Oszillographen durchlaufe ein Elektronenstrahl eine Bahn mit dem zeitabhdngigen Ortsvektor r(t) = (.a . c~s(w t)) b . sin teo t)
a) b) c)
4)
(t
~
0)
Zeichnen Siedie Bahnkurve. Welche Bedeutung haben die Konstanten a, b und w? Bestimmen Sie den Geschwindigkeits- und Beschleunigungsvektor. Zeigen Sie: Der Beschleunigungsvektor (t) ist stets dem Ortsvektor (t ) entgegengerichtet.
a
r
Bestimmen Sie fur die folgenden Bewegungen eines Massenpunktes den Geschwindigkeitsvektor v(t) und den Beschleunigungsvektor a(t): a)
Kreisbahn: r(t) = (R . c~s(w t)) R . sln(w t)
(t
~
0)
b)
Zykloide:
(t
~
0)
r(t) = (R(t - sin t)) R(1 - cos t)
227
Ubuugsaufgaben 5)
Differenzieren Sie die folgenden, vom Parameter t abhangigen Vektoren zweimal nach t: a)
a(t)=(Sin~;t))
a(t)=(:=::t~::)
b)
cos(2t) 6)
Gegeben sind die folgenden parameierabhdngigen Vektoren:
b(t) =
(
t)
2 , cos 2. t
;:n
,
Berechnen Sie die 1. Ableitung der folgenden Skalar- und Vektorprodukte: a)
7)
a .b
b.c
b)
c)
a
xb
d)
a
xc
Gegeben ist die Raumkurve mit dem Ortsvektor
r(t) = 2· cos(5t)
ex + 2· sin(5t) e + lOt e
z
y
Bestimmen Sie den Tangenten- und Hauptnormaleneinheitsvektor sowie die Kriimmung der Kurve fur den Parameterwert t =
8)
r
Bestimmen Sie fur die Raumkurve (z) = ( :: ) die folgenden Groben: a) b)
9)
Bogenldnge im Intervall 0 ~ t ~ 1 Kriimmung und Kriimmungsradius fur den Parameterwert t = 1
Die Gleichung einer ebenen Bewegung laute:
r(t)= t ex + t e 2
a) b) c) d) e)
10)
n
"4'
( -
y
CfJ
0)
(r ist der Abstand des Punktes P == (x; y) vom Koordinatenursprung). Skizzieren Sie das Vektorfeld.
9)
Ein Masseteilchen bewegt sich in dem ebenen Geschwindigkeitsfeld v(x; y) == Wie lautet die Bahnkurve des Teilchens, wenn essich zur Zeit t == 0 im Punkt P == (0 ; 2) befindet?
ex + y eye
Anleitung: Das Teilchen bewegt sich auf einer Feldlinie, die hier als "Stromlinie" des Geschwindigkeitsfeldes bezeichnet wird.
232
10)
I Vektoranalysis Gegeben sind die folgenden physikalischen Vektorfelder: a)
Elektrische Feldstdrke
Q
E== 4 tt
80
r2
E in
Q
e== r
der Umgebung einer Punktladung Q:
4 ti
80
(80: elektrische Feldkonstante; Richtung des Ortsvektors r)
b)
M agnetische Feldstdrke ters:
if
~ I ~ H==-- e
2n 0 qJ
~
(r > 0)
r2 r
e
r:
Einheitsvektor in radialer Richtung, d.h. in
eines linearen, vom Strom I durchflossenen Lei-
(0 > 0)
(0: senkrechter Abstand von der Leiterachse; eqJ: Einheitsvektor in tangentialer Richtung)
Bestimmen und charakterisieren Sie die Flachen, auf denen der Betrag der jeweiligen Feldstarke einen konstanten Wert annimmt.
Zu Abschnitt 4 1)
Bestimmen Sie die N iveaulinien sowie den Gradient der folgenden ebenen Skalarfelder: ¢(x;y) == y b) ¢(x;y) == x 2 + y2 a)
2)
Welche ebenen Skalarfelder ¢ gehoren zu dem Gradientenfeld grad ¢ ==
yex + x e ? y
3)
Berechnen Sie den Gradient von ¢ sowie den Betrag des Gradienten im jeweiligen Punkt P: a)
¢(x;y;z)==10x2y3-5xyz2,
P==(1;-1;2)
b)
¢(x;y;z)==x2·eyz+yz3, ¢(x;y;z)==X 2+y2+ Z2,
P==(1;2; -2)
c) 4)
Zeigen Sie: Das skalare Feld ¢ = In r besitzt den Gradient grad ¢ = 12
J
(r == x 2 sprung).
5)
P == (2; 0; 1)
r
+ y2 + Z2
r
ist der raumliche Abstand des Punktes P == (x; y; z) vom Ur-
Gegeben sind die Skalarfelder ¢ == x 2 Y z + x . e " und fjJ == y . e", Bestimmen Sie den Gradient des Produktes U == ¢ . fjJ auf zwei verschiedene Arten.
233
Ubungsaufgaben 6)
Bestimmen Sie die Richtungsableitung von ¢ (x; y; z) = x y z des Vektors
a=
(
-
~) im Raumpunkt P
=
+ 3 X Z3
in Richtung
(1; 2; 1).
7)
Berechnen Sie die Richtungsableitung des ebenen Skalarfeldes ¢ in radialer Richtung im jeweiligen Punkt P: a) ¢(x;y) = x 2 _ y2, P = (3; 4) b) ¢(x;y)=4x 2+9 y2, P = (1; 0)
8)
Wie lautet die Fldchennormale der Bildflache von x 2 + (y - 1)2 - Z2 = 10 im Punkt P = (1; 2; 5)7
9)
Bestimmen Sie die Gleichung der Tangentialebene, die man im Punkt P an die Flache F(x; y; z) = anlegen kann: a) Zylindermantelflache 2\ + y2 - 5 = 0, ~ z ~ 10, P = (2; 1; 5) b) xy2z+6x2Z2_22=0, P=(2;1;-1)
10)
°
°
x
Das elektrostatische Potential in der Umgebung einer negativ geladenen Kugel lautet:
-Q
U(r)=-4n eor
(r
~
R)
(- Q: Ladung der Kugel; eo: elektrische Feldkonstante; R: Kugelradius). P sei ein beliebiger Punkt des elektrischen Feldes im AuBenraum der Kugel (r ~ R). In welcher Richtung von P nimmt das Potential U am stdrksten zu 7 Wie groB ist dieser M aximalwert ?
Zu Abschnitt 5 1)
Bestimmen Sie die Divergenz der folgenden ebenen Vektorfelder: a)
2)
b)
c)
In welchen Punkten der x, y-Ebene verschwindet die Divergenz des Vektorfeldes
_
F=
(
xy2
)
?
x 2 Y - 4y .
I Vektoranalysis
234
3)
Bestimmen Sie die Divergenz der folgenden raumlichen Vektorfelder:
a)
. . (2X F == x 2
3
-
Z2
Z2
)
xyz
4)
Berechnen Sie die Divergenz des Vektorfeldes
genden Punkten: P; == (2; 0; 1),
~ ==
F(x; y; z) ==
(1; 2; - 1),
11
xy2 ) 2 Y Z3 in den fol-
(
xyz
(3; 2; 3).
==
5)
Bestimmen Sie die Divergenz des cjJ(x; y; z) == (x - 1)2 + (y - 5)2 + Z2.
6)
Gegeben sind das Skalarfeld 4> = x 2 . eY Z und das Vektorfeld
Gradienten
stimmen Sie die Divergenz des Vektorfeldes 7)
Wie muB man die Funktion (r) rquellenfrei ist?
F == f 8)
f
der
skalaren
F=
A == cjJ F auf zwei
Funktion
( - : ) . Be-
verschiedene Arten.
(r) wahlen, damit das raumliche Zentralfeld
BestimmenSie den Gradient des radialsymmetrischen raumlichen Skalarfeldes
b
-
cjJ == a+ - und zeigen Sie, daB die Divergenz des Gradienten verschwindet (a, b: r
Konstanten; r> 0). 9)
Bestimmen Sie die Rotation der folgenden ebenen Vektorfelder: a)
10)
11)
1_(
F(X;y)== _ _ Jx2 + y2
y)
-
b)
F(x; y)
X
Zeigen Sie, daB das ebene Geschwindigkeitsfeld Ii = wirbelfrei ist.
1_(X -+ + 2) +
== _ _
Jx
Jx
1 2
+
y
y2
2
(- x
y2
Bestimmen Sie die Rotation der folgenden raumlichen Vektorfelder:
a)
F(x; y; z) =.... (
b)
F(x; y; z) ==
....
xy - Z2 ) 2xyz , x 2 Z - y2 Z .
1........-+ 2. 2 2 (x ex + y ey + z e z ) xi- y + z
X
Y- 1
ex - ye
y)
Ubungsaufgaben 12)
235
Wie sind die Parameter a und b zu wahlen, damit die Rotation des Vektorfeldes
F=
2XZ2 + y3 Z a x y2 z ( 2 2x z + b x y 3
)
iiberall verschwindet?
F=
xy3 ) 2x y2 z im Punkt P = (1; 2;1)? ( 2 x y - Z2
13)
WelchenWert besitzt die Rotation von
14)
Zeigen Sie: Das rdumliche Vektorfeld F = f (r) differenzierbare Funktion des Abstandes r).
15)
Es ist O. Berechnen Sie das Oberfldchenintegral
If (V (A)
x
F) . IV
2
+
y2
+ Z2
=
9,
dA
auf direktem Wege, mit Hilfe des I ntegralsatzes von Stokes. (A: Mantelflache der angegebenen Halbkugel mit kreisformiger Randkurve in der x, y-Ebene, Orientierung von Flache und Randkurve wie in Aufgabe 6, vgl. hierzu auch Bild 1-195). a) b)
249
II Wahrscheinlichkeitsrechnung
1 Hilfsmittel aus der Kombinatorik Wir beschaftigen uns in diesem Abschnitt mit den Permutationen, Kombinationen und Variationen. Diese aus der Kombinatorik stammenden Abzahlmethodcn sind ein wichtiges Hilfsmittel bei der Losung zahlreicher Probleme in der Wahrscheinlichkeitsrechnung und Statistik und lassen sich in sehr anschaulicher Weise anhand des Urnenmodells einfuhren.
1.1 U rnenmodell In einer Urne befinden sich n verschiedene Kugeln, die sich z. B. in ihrer Farbe voneinander unterscheiden. Wir wollen uns dann in den nachsten Teilabschnitten mit den folgenden, in der Wahrscheinlichkeitsrechnung haufig vorkommenden Fragestellungen beschaftigen: 1. Auf wieviel verschiedene Arten lassen sich diese Kugeln anordnen? Dies fuhrt uns zu dem Begriff "Permutation". 2. Aus der Urne werden nacheinander k Kugeln gezogen, wobei wir noch die folgenden Falle unterscheiden miissen: a) Ziehung ohne Zuriicklegen (Bild II-1):
Die jeweils gezogene Kugel wird nicht in die Urne zuruckgelegt und scheidet somit fur alle weiteren Ziehungen aus. Jede der n Kugeln kann also nur einmal gezogen werden.
10 Die gezogene Kugel scheidet aus
Bild 11-1 Ziehung einer Kugel ohne Zuriicklegen
II Wahrscheinlichkeitsrechnung
250
b) Ziehung mit Zuriicklegen (Bild 11-2): J ede Kugel darf mehrmals verwendet werden, d. h. daB jede gezogene Kugel vor der nachsten Ziehung in die Urne zuriickgelegt wird und somit bei der nachfolgenden Ziehung abermals gezogen werden kann.
Bild 11-2 Ziehung einer Kugel mit Zuriicklegen Die gezogene Kugel wird in die Urne zurOckgelegt
In beiden Fallen unterscheiden wir ferner, ob die Reihenfolge der Ziehung beriicksichtigt werden soIl oder nicht. Wir stoBen so auf die Begriffe "Variation" und .Kombination" . In der Statistik wird eine solche zufdllige Entnahme von k Kugeln als Stichprobe vom Umfang k bezeichnet 1). Sie heiBt geordnet, wenn die Reihenfolge, in der die Stichprobenelemente (hier: Kugeln) gezogen werden, berucksichtigt wird. Spielt die Reihenfolge jedoch keine Rolle, so liegt eine ungeordnete Stichprobe vor.
1.2 Permutationen Wir beschaftigen uns zunachst mit dem folgenden Problem: In einer Urne befinden sich n verschiedenfarbige Kugeln. Auf wieviel verschiedeneArten lassen sich diese Kugeln (beispielsweise nebeneinander) anordnen? Wir beginnen mit einem einfachen Beispiel. •
Beispiel Drei verschiedenfarbige Kugeln, z. B. je eine weiBe, graue und schwarze Kugel, lassen sich auf genau 6 verschiedene Arten wie folgt anordnen (Bild 11-3):
08e
oeo
oe eoe eo e 0
Bild 11-3 Drei verschiedenfarbige Kugeln lassen sich auf sechs verschiedene Arten (nebeneinander) anordnen
1)
•
Der in der Statistik grundlegende Begriff .Btichprooe aus einer Grundgesamtheit" wird in Kap. III, Abschnitt 1.2 noch ausfiihrlich erortert,
1 Hilfsmittel aus der Kombinatorik
251
Allgemein heiBt eine Anordnung von n verschiedenen Elementen (Kugeln) in einer bestimmten Reihenfolge eine Permutation der n Elemente (Kugeln). Wie viele Moglichkeiten gibt es dann, n verschiedene Elemente (Kugeln) anzuordnen? Wie groB ist somit die Anzahl der Permutationen von n Elementen? Wir Iosen dieses Problem nun wie folgt: Es sind n Platze vorhanden, die wir in der iiblichen Weise von 1 bis n durchnumerieren, und n verschiedene Kugeln, mit denen wir diese Platze besetzen wollen, Den Platz Nr. 1 konnen wir mit jeder der n Kugeln belegen. Ist diese Stelle jedoch einmal besetzt, so bleiben fur die Besetzung des 2. Platzes nur noch n - 1 Moglichkeiten, Denn jede der n - 1 iibriggebliebenen Kugeln kann diesen Platz einnehmen. Ist schlieBlich auch dieser Platz besetzt, so bleiben fur die Besetzung des 3. Platzes nur noch n - 2 Moglichkeiten iibrig u. s.w.. Fur die Besetzung der Platze 1, 2, 3, ... , n gibt es daher der Reihe nach n, n - 1, n - 2, ... , 1 Moglichkeiten, Bild II-4 verdeutlicht diese Aussage.
• • •
n
n-1
n-2
Platzziffer
Anzahl der moqtichen Besetzungen
Bild 11-4 Besetzungsmoglichkeiten fur die verschiedenen Platze
Die Anzahl der Permutationen von n verschiedenen Kugeln (oder allgemein: von n verschiedenen Elementen) ist daher
P(n)
==
n(n - 1) (n - 2) ... 1 == n!
(II-1)
Befinden sich jedoch unter den n Kugeln n 1 gleiche (z.B. n1 schwarze Kugeln), so fallen alle jene Anordnungen zusammen, die durch Vertauschungen der gleichen Kugeln untereinander hervorgehen (alle iibrigen Kugeln behalten dabei ihre Platze). Bild 11-5 verdeutlicht dies fur eine Anordnung von 5 Kugeln, unter denen sich 3 gleiche (namlich schwarze) Kugeln befinden. Werden diese untereinander vertauscht, was auf genau P (3) == 3! == 6 verschiedene Arten moglich ist, so entstehen dabei keine neuen Anordnungen. Vertauschung
In
eee o
Bild 11-5 Durch Vertauschung der schwarzen Kugeln untereinander entstehen keine neuen Anordnungen
252
II Wahrscheinlichkeitsrechnung
Bei n 1 gleichfarbigen Kugeln gibt es somit P (n1 ) = n 1! verschiedene Moglichkeiten, diese untereinander zu vertauschen. Daher gibt es genau (11-2)
verschiedene Anordnungsmoglichkeiten fur n Kugeln, unter denen sich n1 gleiche Kugeln befinden. Analog UiBt sich zeigen: Die Anzahl der verschiedenen Permutationen von n Kugeln, unter denen sich jeweils n 1 , n2 , ••• , nk gleiche befinden, ist P(n; n 1 , n2 ,
••• ,
n! nk ) = - - - - n 1!n2!···nk!
(11-3)
Wir fassen diese Ergebnisse nun in etwas allgemeinerer Form wie folgt zusammen:
2)
Die n Kugeln zerfallen somit in k verschiedene Klassen, wobei die Kugeln einer jeden Klasse gleichfarbig sind. Es treten somit nur k :::.:; n verschiedene Farben auf.
1 Hilfsmittel aus der Kombinatorik •
253
Beispiele
(1)
Auf einem Regal sol1en 5 verschiedene Gegenstande angeordnet werden. Es gibt dann P(5) == 5! == 120
verschiedene Anordnungsmoglichkeiten (Permutationen). (2)
Wir betrachten 6 Kugeln, darunter 3 weiBe, 2 graue und 1 schwarze Kugel (Bild II -6):
Bild 11-6
Es gibt dann genau P (6· 3 2 1) ==
, "
6! 3! 2! 1!
== 60
verschiedene Anordnungsmoglichkeiten (Permutationen).
•
1.3 Kombinationen Kombinationen ohne Wiederholung
Einer Urne mit n verschiedenen Kugeln entnehmen wir nacheinander k Kugeln ohne Zuriicklegen. Die Reihenfolge der gezogenen Kugeln soll dabei ohne Bedeutung sein, bleibt also unberiicksichtigt. Eine solche ungeordnete Stichprobe von k Kugeln (oder allgemein: von k Elementen) heiBt eine Kombination k-ter Ordnung ohne Wiederholung 3). •
Beispiel
Befinden sich in einer Urne drei verschiedenfarbige Kugeln (z.B. je eine weiBe, graue und schwarze Kugel) und ziehen wir nacheinander wahllos zwei Kugeln ohne Zurucklegen, so ist z. B. die folgende Ziehung eine von mehreren moglichen (Bild 11-7):
loe_
eS 1. Kugel
j •
Anordnung in der Reihenfolge der Ziehung:
oe
Bild 11-7
2. Kugel
3)
JedeKugel darf nur einmal verwendet werden und kann somit in der Stichprobe hochstens einmal vertreten sein.
II Wahrscheinlichkeitsrechnung
254
Spielt dabei die Reihenfolge, in der die beiden Kugeln gezogen werden, keine Rolle, so wird diese Ziehung nicht von der folgenden Ziehung unterschieden (Bild II-8):
10••
Io
~
Anordnung in der Reihenfolge der Ziehung:
eo
1. Kugel
2. Kugel
Bild 11-8
Die beiden Stichproben (Anordnungen) unterscheiden sich lediglich in der Reihenfolge ihrer Elemente und werden daher als ungeordnete Stichproben oder Kombinationen 2. Ordnung nicht unterschieden.
• Die Fragestellung lautet jetzt: Auf wieviel verschiedene Arten lassen sich k Kugeln aus einer Urne mit n verschiedenen Kugeln ohne Zuriicklegen und ohne Beriicksichtigung der Reihenfolge ziehen? Wie grof ist somit die Anzahl der Kombinationen k-ter Ordnung ohne Wiederholung bei n verschiedenen Kugeln (Elementen)? Zur Klarung dieser Frage ordnen wir die n verschiedenen Kugeln a 1 , a2 , ..• , an zunachst in einer Reihe an und kennzeichnen dann diejenigen k Kugeln, die wir gezogen haben, durch die Zahl 0, alle iibrigen n - k Kugeln durch die Zahl 1 (Bild II -9):
°
genau k-mal und die Zahl 1 genau In dieser Anordnung tritt somit die Zahl (n - k)-mal auf. Wir konnen nun unsere Fragestellung auch wie folgt formulieren: Wieviel verschiedene Anordnungsmoglichkeiten gibt es fiir die insgesamt n Zahlen, unter denen k-mal die Zahl und (n - k)-mal die Zahll vorkommt?
°
255
1 Hilfsmittel aus der Kombinatorik
Offensichtlich handelt es sich dabei urn die Permutationen von n Zahlen, die sich in zwei Klassen wie folgt aufteilen lassen (Bild II -10):
Bild 11-10
Daher gibt es nach Gleichung (II-5) genau
n'
(n)
C (n; k) == P (n; k n - k) == . == , , , k!(n-k)! k
(11-6)
verschiedene Moglichkeiten, aus einer Urne mit n verschiedenen Kugeln k Kugeln ohne Zuriicklegen und ohne Beriicksichtigung der Reihenfolge herauszugreifen. Kombinationen mit Wiederholungen Darf jedoch jede der n verschiedenen Kugeln mehrmals verwendet werden, so erhalt man Kombinationen k-ter Ordnung mit Wiederholung 4). Ihre Anzahl ist Cw(n; k) == (
n
+kk
1)
(11-7)
Dabei ist zu beachten, daB k jetzt auch grojJer als n sein kann. Auf die Herleitung dieser F ormel soIl verzichtet werden. Wir fassen die bisherigen Ergebnisse wiederum in etwas allgemeinerer Form wie folgt zusammen:
4)
Jede gezogene Kugel wird dabei vor der nachsten Ziehung in die Urne zuriickgelegt und hat somit die Chance, mehrmals gezogen zu werden (Ziehung mit Zuriicklegen).
II Wahrscheinlichkeitsrechnung
256
Anmerkung
Bei Kombinationen findet also die Reihenfolge oder Anordnung der Elemente grundsatzlich keine Beriicksichtigung. Sie konnen daher auch als ungeordnete Stichproben aufgefaBt werden, die man einer sog. Grundgesamtheit mit n Elementen entnommen hat. Die Urne mit ihren n verschiedenen Kugeln liefert ein sehr anschauliches Modell fur eine solche Grundgesamtheit 5) •
•
Beispiele
(1)
Einer Warenlieferung von 12 Gliihbimen solI zu Kontrollzwecken eine Stichprobe von 3 Gliihbirnenentnommen werden. Wieviel verschiedene Stichproben sind dabei moglich? Losung :
Da es bei dieser (ungeordneten) Stichprobe auf die Reihenfolge der gezogenen Gliihbirnen nicht ankommt und die Ziehung (wie in der Praxis allgemein iiblich) ohne Zuriicklegen erfolgt, gibt es genau 12)
C(12· 3) = ( , 3
=
12 . 11 . 10 = 220 1 ·2·3
verschiedene Moglichkeiten, aus 12 Gliihbirnen 3 auszuwahlen (Kombinationen 3. Ordnung von 12 Elementen ohne Wiederholung).
5)
Der Begriff "Grundgesamtheit" wird in Kap. III, Abschnitt 1.2 naher erlautert.
1 Hilfsmittel aus der Kombinatorik (2)
257
Fur die in Bild 11-11 dargestellte Parallelschaltung dreier Widerstande stehen uns insgesamt 5 verschiedene ohmsche Widerstande R 1 , R 2 , .•. .R; zur Verfiigung. Wieviel verschiedene Schaltmoglichkeiten gibt es, wenn jeder der 5 Widerstande a) hochstens einmal, b) mehrmals, d. h. hier bis zu dreimal verwendet werden darf?
Bild 11-11 Parallelschaltung dreier Widerstande
Losung: Aus 5 Widerstanden miissen wir 3 Widerstande auswahlen, wobei die Anordnung (Reihenfolge) im Schaltkreis keine Rolle spielt. Es handelt sich also urn Kombinationen 3. Ordnung von 5 Elementen (Widerstanden) 6) • a) Da jeder Widerstand nur einmal verwendet werden darf, haben wir es hier mit Kombinationen 3. Ordnung ohne Wiederholung zu tun. In diesem Fall gibt es somit
5)
C(5' 3) = ( , 3
b)
5 ·4·3 =. - = 10 1 ·2·3
verschiedene Parallelschaltungen. Jeder Widerstand kann bis zu dreimal verwendet werden. Es handelt sich daher diesmal urn Kombinationen 3. Ordnung mit Wiederholung. Wir haben somit
Cw(5; 3) =
3- 1)= (7)3 = ~ 7.6.5= 35 (5+ 3
verschiedene Moglichkeiten fur eine Parallelschaltung aus drei Wider-
standen.
6)
•
Der Gesamtwiderstand ist unabhdngig von der Reihenfolge, in der die Einzelwiderstande geschaltet werden.
II Wahrscheinlichkeitsrechnung
258
1.4 Variationen Variationen ohne Wiederholung Wir gehen von den gleichen Ubetlegungen aus wie im vorangegangenen Abschnitt, beritcksichtigen diesmal jedoch die Reihenfolge, in der wir die k Kugeln aus der Urne entnommen haben. Eine solche geordnete Stichprobe von k Kugeln heiBt dann eine Variation k-ter Ordnung ohne Wiederholung, wenn die Ziehung ohne Zurucklegen der Kugeln erfolgte. Jede der n verschiedenen Kugeln ist in solch einer Anordnung also hochstens einmal vertreten.
•
Beispiel In einer Urne befinden sich je eine weiBe, graue und schwarze Kugel. Wir ziehen nacheinander zwei Kugeln ohne Zuriicklegen und vergleichen die beiden folgenden miiglichen Ergebnisse miteinander (Bild 11-12):
t
0 1. Kugel
Ie
j 0
t
e 1. Kugel
Bild11-12 Ziehung zweier Kugeln ohne Zuriicklegen
2. Kugel
2. Kugel
Unter Beriicksichtigung der Reihenfolge der gezogenen Kugeln notieren wir das Ergebnis der beiden Experimente wie folgt: 1. Experiment: 2. Experiment:
e eo 0
Die beiden Anordnungen unterscheiden sich lediglich in der Reihenfolge ihrer Elemente und werden daher definitionsgemiifJ als zwei verschiedene Variationen 2. Ordnung ohne Wiederholung betrachtet.
•
Die Fragestellung lautet jetzt allgemein: Auf wieviel verschiedene Arten lassen sich k Kugeln ohne Zuriicklegen, aber unter Beriicksichtigung der Reihenfolge ziehen? Wie groB ist somit die Anzahl der Variationen k-ter Ordnung ohne Wiederholung bei n Elementen?
259
1 Hilfsmittel aus der Kombinatorik
Bei der Losung dieses Problems gehen wir zunachst von einer beliebigen Kombination k-ter Ordnung ohne Wiederholung aus. Sie enthalt genau k verschiedene Kugeln, die wir der Reihe nach mit a., a 2 , ••• , ak bezeichnen, in einer beliebigen Anordnung, z.B.
Da sich diex Kugeln auf k! verschiedene Arten permutieren lassen, erhalten wir aus dieser Kombination genau k! Variationen. Dies aber gilt fur jede Kombination k-ter Ordnung. Somit ist
n! V(n; k) = k! C(n; k)
n!
(11-10)
= k! k!(n _ k)! = (n _ k)!
die Anzahl der moglichen Variationen k-ter Ordnung ohne Wiederholung.
Variationen mit Wiederholung Darf dagegen jede der insgesamt n verschiedenen Kugeln in der Urne mehrmals verwendet werden, so erhalt man Variationen k-ter Ordnung mit Wiederholung. Jede gezogene Kugel muB daher vor der nachsten Ziehung in die Urne zuriickgelegt werden (Ziehung mit Zurucklegen), Die Anzahl der Variationen k-ter Ordnung betragt in diesem Fall
(II -11) Denn wir konnen jeden der k Platze in einer solchen Anordnung mit jeder der n verschiedenen Kugeln belegen, da Mehrfachziehung jetzt zuldssig ist (Bild II-13):
• • •
n
n
n
Platzziffer
n
Anzahl der moqttchen Besetzungen
BUd 11-13 Besetzungsmoglichkeiten fur die k vorhandenen Platze
Somit gibt es genau
n . n . n ... n == n" '-v-'
k-mal
verschiedene Anordnungen.
(II-12)
II Wahrscheinlichkeitsrechnung
260
Wir fassen die Ergebnisse in etwas allgemeinerer Form wie folgt zusammen:
Anmerkungen (1) Variationen unterscheiden sich somit von Kombinationen grundsatzlich dadurch, daB die Reihenfolge oder Anordnung der Elemente beriicksichtigt wird. Sie konnen daher auch als geordnete Stichproben aufgefaBt werden, die einer sog. Grundgesamtheit mit n Elementen entnommen wurden. (2)
Variationen k-ter Ordnung werden haufig auch als Kombinationen k-ter Ordnung unter Beriicksichtigung der Anordnung bezeichnet.
•
Beispiele
(1)
Beim Pferdetoto muB in der sog. Dreierwette der Zieleinlauf der ersten drei Pferde in der richtigen Reihenfolge vorausgesagt werden. Wieviel verschiedene Dreier-Wetten sind moglich, wenn 10 Pferde starten?
1 Hilfsmittel aus der Kombinatorik
261
Losung :
Drei der zehn Pferde erreichen in einer bestimmten Reihenfolge als erste das Ziel. Es handelt sich in diesem Beispiel somit um Variationen 3. Ordnung von 10 Elementen ohne Wiederholung. Daher gibt es V(10· 3) ==
,
10! 10! == - == 8 ·9·10 == 720 (10 - 3)! 7!
verschiedene Dreier-Wetten.
(2)
Beim gleichzeitigen Wurf zweier unterschiedlich gekennzeichneter homogener Wiirfel interessieren wir uns fur die dabei auftretenden Augenpaare. Wieviel verschiedene Augenpaare sind moglich? Losung:
Als Augenzahlen eines jeden der beiden Wiirfel kommen die Zahlen 1, 2, 3, 4, 5 und 6 infrage. Bei den Augenpaaren(i; j) handelt es sich dann um geordnete Zahlenpaare, da die Wiirfel unterschiedlich gekennzeichnet sind (z.B. ein weiBer und ein schwarzer Wiirfel) und somit um Variationen 2. Ordnung der 6 Zahlen 1 bis 6 mit Wiederholung. Es gibt daher
verschiedene Augenpaare, namlich
(1; 1), (1; 2), (1; 3), (2; 1), (2; 2), (2; 3),
, (1; 6) , (2; 6)
(6; 1), (6; 2), (6; 3), ... , (6; 6) (3)
Aus den Ziffern 1 bis 9 sollen dreistellige Zahlen gebildet werden. Wieviele Moglichkeiten gibt es, wenn jede Ziffer nur einmal verwendet werden darf? Losung:
9 Ziffern werden auf 3 Platze verteilt, wobei jede Ziffer nur einmal verwendet werden darf und die Anordnung der Ziffern von Bedeutung ist. Es handelt sich also um Variationen 3. Ordnung ohne Wiederholung. Ihre Anzahl betragt 9! V(9; 3) = (9 _ 3)!
9! 6!
6!· 7·8·9 6!
- - - == 7 . 8 . 9 == 504
•
262
II Wahrscheinlichkeitsrechnung
1.5 Tabellarische Zusammenstellung der wichtigsten Formeln Ungeordnete Stichproben sind Kombinationen, geordnete Stichproben dagegen Variationen. Tabelle 1 zeigt den Zusammenhang zwischen den Stichproben einerseits und den Kombinationen und Variationen andererseits und enthalt eine Zusammenstellung
wichtiger Formeln aus der Kombinatorik, die sich in der Wahrscheinlichkeitsrechnung und Statistik als sehr niitzlich erweisen.
Tabelle 1: Hilfreiche Formeln aus der Kombinatorik
2 Grundbegriffe 2.1 Einfiihrende Beispiele Wir beginnen mit drei einfachen Beispielen, die uns durch das gesamte Kapitel begleiten werden. Standardbeispiel1: Augenzahlen beim Wurf eines homogenen Wiirfels 7) Beim Wurf eines homogenen Wiirfels notieren wir die jeweils oben liegende Zahl, auch Augenzahl oder kurz Augen genannt. Dabei sind genau 6 verschiedene Ergebnisse oder Versuchsausgange moglich: Die Augenzahl wird stets eine der 6 Zahlen 1, 2, 3, 4, 5 und 6 seine Wir nennen ein solches Ergebnis ein Elementarereignis co. Die Elementarereignisse bilden in ihrer Gesamtheit die Ergebnismenge Q.
7)
Homogen bedeutet in diesem Zusammenhang: Der Wiirfel ist aus einem homogenen Material und geometrisch einwandfrei. Keine der 6 Seiten ist gegenuber einer anderen Seite in irgendeiner Weise bevorzugt. Diese Eigenschaften wollen wir bei allen weiteren Wiirfelexperimenten stets voraussetzen.
2 Grundbegriffe
263
Unser Wiirfelexperiment fiihrt demnach zu der Ergebnismenge Q
== {1, 2, 3, 4, 5, 6}
(II-15)
bestehend aus den 6 Elementarereignissen Wi == i (i == 1, 2, ... , 6). Es HiBt sich jedoch nicht voraussagen, welches der 6 Elementarereignisse bei einem bestimmten Wurf tatsachlich eintreten wird. Der Ausgang des Experimentes ist somit nicht vorhersehbar, sondern zuJallsbedingt. Wir sprechen daher in diesem Zusammenhang von einem Zu[allsexperiment. Erhalten wir z. B. bei einem bestimmten Wurf die Augenzahl ,,5", so konnen wir dieses Elementarereignis auch durch die Menge A == {5} beschreiben, die eine aus genau einem Element bestehende Teilmenge von Q ist. Ebenso beschreibt die Teilmenge B == {2} ein Elementarereignis, namlich das Wiirfeln der Augenzahl ,,2". Neben den Elementarereignissen sind aber noch weitere Versuchsausgange moglich, die wir ganz allgemein als Ereignisse bezeichnen wollen. Ein solches Ereignis ist z. B. das "Wiirfeln einer ungeraden Augenzahl". Dieses Ereignis laBt sich dann durch die Teilmenge
c == {1, 3, 5}
(11-16)
darstellen. Damit bringen wir zum Ausdruck, daB dieses Ereignis genau dann eintritt, wenn die erzielte Augenzahl entweder eine ,,1" oder eine ,,3" oder eine ,,5" ist. Das Ereignis C enthalt somit als Elemente genau 3 Elementarereignisse.Allgemein gilt: Ereignisse sind Teilmengen der Ergebnismenge Q.
Standardbeispiel2: Augenpaare beim Wurfmit zwei unterscheidbaren homogenen Wilrfeln
Wir wiirfeln gleichzeitig mit zwei unterscheidbaren homogenen Wiirfeln, z. B. mit einem weiBen und einem grauen Wiirfel und notieren dabei die erzielten Augenpaare. Ein mogliches Ergebnis ist dann beispielsweise
~ ~ 1. WOrfel (weiB)
(6; 1)
2. vvurtel (grau)
Augenzahl des grauen WOrfels
Augenzahl des weiBen WOrfels
II Wahrscheinlichkeitsrechn ung
264
Dieses Elementarereignis beschreiben wir durch das geordnete Zahlenpaar (6; 1). Insgesamt gibt es dann 62 == 36 verschiedene Augenpaare oder Elementarereignisse 8): Augenzahl des 2. Wiirfels
C/'J
~ $-;
(2; 1)
(2; 2)
(2; 3)
(2; 4)
(2; 5)
(2; 6)
(3; 1)
(3; 2)
(3; 3)
(3; 4)
(3; 5)
(3; 6)
:aco
(4; 1)
(4; 2)
(4; 3)
(4; 4)
(4; 5)
(4; 6)
I=:
(5; 1)
(5; 2)
(5; 3)
(5; 4)
(5; 5)
(5; 6)
(6; 1)
(6; 2)
(6; 3)
(6; 4)
(6; 5)
(6; 6)
:~
~ ~
C/'J ~
'"d N
~
on ~
~
Sie bilden in ihrer Gesamtheit die Ergebnismenge Q dieses Wiirfelexperiments: Q == {( 1;
1), (1; 2), (1; 3), ... , (6; 5), (6; 6)}
(11-17)
Wiederum gilt die Aussage: Es HiBt sich nicht vorausbestimmen, welches Elementarereignis (Augenpaar) bei einer bestimmten Durchfiihrung des Wiirfelexperiments tatsachlich eintritt. Das jeweilige Ergebnis ist rein zufallsbedingt. Es handelt sich also auch hier urn ein Zufallsexperiment. Neben diesen Elementarereignissen sind noch weitere Ereignisse moglich, die als Teilmengen der Ergebnismenge Q darstellbar sind. So wird z. B. das Ereignis A: Die Augenzahldes I, Wiirfels (weij3) ist eine ,,2" durch die 6 verschiedenen Elementarereignisse (2; 1), (2; 2), (2; 3), (2; 4), (2; 5), (2; 6)
realisiert und laBt sich somit durch die Teilmenge A
==
{(2; 1), (2; 2), ... , (2; 6)}
(11-18)
beschreiben. Das ebenfalls mogliche Ereignis B: DieAugensumme beider Wiafel ist gleich 4 wird durch die 3 Elementarereignisse (1; 3), (2; 2), (3; 1)
realisiert. 8)
Es handelt sich dabei urn Variationen 2. Ordnung der 6 Zahlen 1,2,3,4,5 und 6 mit Wiederholung.
2 Grundbegriffe
265
Daher gilt B == {(1; 3), (2; 2), (3; 1)}
(11-19)
Standardbeispiel 3: Ziehung von Kugeln aus einer U rne mit Zuriicklegen Eine Urne enthalte 5 Kugeln, darunter 3 weiBe und 2 schwarze Kugeln 9) (Bild 11-14):
1000H
Bild 11-14
Nacheinander ziehen wir ganz zufallig 3 Kugeln, wobei wir nach jedem Zug die jeweils gezogene Kugel in die U rne zuriicklegen, und notieren dabei die Farbe der gezogenen Kugeln. Es ergeben sich dann unter Beriicksichtigung der Reihenfolge, in der die Kugeln gezogen werden, die folgenden 8 Moglichkeiten (Elementarereignisse) (Bild 11-15):
000
ooe oee eee oeo eoe eoo eeo
Bild 11-15
Die Ergebnismenge Q dieses Zufallsexperiments enthalt daher genau diese 8 Elementarereignisse als Elemente: Q
==
{OOO, ooe, oeo, eoo, oee, eoe, eeo, eee}
Das Ereignis
(11-20)
A: Zwei der drei gezogenen Kugeln sind weijJ wird dabei durch die 3 Elementarereignisse
ooe, oeo, eoo realisiert und laBt sich somit durch die Teilmenge
A ==
{OOe, oeo, eOO}
(11-21 )
darstellen. Das Ereignis
B: Die drei gezogenen Kugeln sind gleichfarbig
9)
Die Kugeln unterscheiden sich lediglich in ihrer Farbe, sind ansonsten aber "baugleich" (d.h. gleicher Durchmesser, gleiches Material u. s.w.). Dies gilt auch fur aIle weiteren Urnenmodelle.
266
II Wahrscheinlichkeitsrechnung
dagegen wird nur durch zwei Elementarereignisse, namlich
000
und
eee
realisiert ("alle Kugeln sind entweder weiB oder schwarz"). Daher gilt: B == {OOO,
eee}
(11-22)
2.2 Zufallsexperimente In den einfiihrenden Beispielen haben wir den wichtigen Grundbegriff Zufallsexperiment bereits kennengelernt. Wir definieren ihn allgemein wie folgt:
•
Beispiele (1)
Erste Beispiele fur Zufallsexperimente haben wir bereits in unseren 3 Standardbeispielen aus Abschnitt 2.1 kennengelernt. So ist das Wiirfeln mit einem oder zwei homogenen Wiirfeln ebenso ein Zufallsexperiment wie die zufdllige Entnahme von Kugeln aus einer Urne.
(2)
Ein weiteres einfaches Beispiel liefert das Zufallsexperiment "Wurf einer homogenen Miinze" mit den beiden moglichen Ergebnissen (Elementarereignissen) "Zahl" und "Wappen". Das Ergebnis eines Miinzwurfs laBt sich jedoch nicht vorausbestimmen, sondern ist ausschlieftlich zufallsbedingt.
(3)
Urn die Qualitat zu sichern, wird der Hersteller eines M assenartikels die laufende Produktion einer sog. Qualitiitskontrolle unterziehen, in dem er in regelmdfiigen Zeitabstanden Stichproben entnimmt und diese dann auf die geforderten Merkmale hin iiberpriift. Auf diese Weise konnen eventuell festgestellte unzulassige Abweichungen von vorgegebenen Sollwerten durch einen Eingriff in die Produktion noch korrigiert werden.
•
2 Grundbegriffe
267
2.3 Elementarereignisse und Ergebnismenge eines Zufallsexperiments Bei einem ZuJallsexperiment sind stets mehrere Versuchsergebnisse moglich, die sich jedoch gegenseitig ausschliej3en. Dies fiihrt uns zu den wichtigen Grundbegriffen .Elementarereignis" und .Ergebrusmenge".
Anmerkung
Wir beschranken uns im Rahmen dieser Einfiihrung auf endliche bzw. abzdhlbar-unendliche Ergebnismengen: 1. Eine endliche Ergebnismenge Q enthalt nur endlich viele Elemente (Elementarereignisse): (11-23)
2. Eine abzdhlbar-unendliche Ergebnismenge Q enthalt dagegen unendlich viele Elemente, die wir aber wie die natiirlichen Zahlen durchnumerieren konnen: (11-24)
•
Beispiele (1)
Beobachten wir beim Zufallsexperiment "WurJ eines homogenen Wiafels" (Standardbeispiel 1) die erreichte Augenzahl i, so erhalten wir eine endliche Ergebnismenge mit genau 6 verschiedenen Elementarereignissen (i
= 1, 2, ... , 6)
Sie lautet demnach wie folgt: Q
(2)
= {1, 2, 3, 4, 5, 6}
Wir fiihren mit einem homogenen Wiirfel das folgende ZuJallsexperiment durch: Es wird solange gewiirfelt, bis erstmals die Augenzahl ,,6" erscheint. Dies kann bereits nach dem ersten, zweiten oder dritten Wurf der Fall sein. Es kann aber auch langer dauern, theoretisch sogar unendlich lange. Die Anzahl i der ausgefiihrten Wiirfe bis zum erstmaligen Auftreten der Augenzahl ,,6" kann somit irgendeine natiirliche Zahl sein. Die moglichen sich gegenseitig ausschlieBenden Ergebnisse oder Elementarereignisse sind daher in der Form (i
= 1, 2, 3, ...)
268
II Wahrscheinlichkeitsrechnung darstellbar. Die Ergebnismenge Q dieses Zufallsexperiments enthalt somit (abzahlbar) unendlich viele Elemente (Elementarereignisse): Q ==
{1, 2, 3, ...}
•
2.4 Ereignisse ODd Ereignisraum Durch Zusammenfassungen von einzelnen Elementarereignissen erhalt man Teilmengen der Ergebnismenge Q. Im einfachsten Fall enthalt eine Teilmenge genau ein Element und reprasentiert somit ein Elementarereignis. Wir verdeutlichen dies an einem Beispiel.
•
Beispiel Beim Zufallsexperiment "Wurf eines homogenen Wiirfels" (Standardbeispiel l ) erhielten wir die folgende Ergebnismenge: Q == {1, 2, 3, 4, 5, 6}
Aus ihr lassen sich 6 verschiedene Teilmengen mit genau einem Element bilden:
{1}, {2}, {3}, {4}, {5}, {6} Sie reprasentieren der Reihe nach die insgesamt 6 moglichen Ergebnisse (Elementarereignisse) beim Wiirfeln, namlich der Reihe nach das Auftreten der Augenzahlen 1, 2, 3, 4, 5 und 6. •
Allgemein beschreiben die Teilmengen von Q sog.· Ereignisse, d. h. Versuchsausgange, die bei der Durchfuhrung eines Zufallsexperiments eintreten konnen, aber nicht unbedingt eintreten miissen, Wir definieren daher:
Anmerkungen (1) Die moglichen Ereignisse eines Zufallsexperiments mit der Ergebnismenge Q werden somit durch die Teilmengen von Q beschrieben.
(2)
Ein Ereignis A ist dabei eingetreten, wenn das Ergebnis des Zufallsexperiments ein Element von A ist.
(3)
Zu beachten ist, daB sowohl die leere Menge 0 als auch die Ergebnismenge Q definitionsgemaf Teilmengen von Q sind und somit Ereignisse mit folgender Bedeu tung darstellen:
269
2 Grundbegriffe
0: Die leere Menge enthalt kein Element und symbolisiert das sog. unmogQ:
liche Ereignis, d. h. ein Ereignis, das nie eintreten kann. Die Ergebnismenge dagegen enthalt aIle Elementarereignisse und reprasentiert somit das sog. sichere Ereignis, d. h. ein Ereignis, das immer eintritt. Denn bei jeder Durchfiihrung des Zufallsexperiments tritt genau eines der Elemen tarereignisse ein.
(4)
Ein Ereignis A ist somit entweder das unmogliche Ereignis 0 (A enthalt dann kein Element der Ergebnismenge Q) oder ein Elementarereignis (A enthalt dann genau ein Element von Q) oder eine Zusammenfassung von mehreren Elementarereignissen (A enthalt somit mehrere Elemente von Q) oder das sichere Ereignis Q (A enthalt dann aIle Elemente von Q, d. h. es ist A == Q).
•
Beispiele
(1)
Beim Zufallsexperiment "Wurf eines homogenen Wiirfels" (StandardbeispieI1) lautet die Ergebnismenge Q fur die beobachtete Augenzahl bekanntlich wie folgt: Q == {1,2,3,4,5,6}
Wir bilden einige Teilmengen von Q und erlautern die zugeordneten Ereignisse:
A ==
{2}
Wiirfeln einer ,,2" (Elementarereignis)
B == {2, 4, 6}
Wiirfeln einer geraden Zahl
C == {3, 6}
Wiirfeln einer durch ,,3" teilbaren Zahl
D == {1, 3, 5}
Wiirfeln einer ungeraden Zahl
E
== {5, 6}
Wiirfeln einer ,,5" oder ,,6"
270
II Wahrscheinlichkeitsrechnung (2)
Bei unserem Urnenbeispiel aus Abschnitt 2.1 (Urne mit 5 Kugeln, darunter 3 weiBe und 2 schwarze) erhielten wir bei 3 nacheinander mit Zuriicklegen gezogenen Kugeln die folgende Ergebnismenge: Q ==
{OOO, ooe. oeo, eoo, oee, eoe, eeo, eee}
Die Teilmenge A ==
{OOe, oeo, eOO}
beschreibt dann das Ereignis .Unter den 3 gezogenen Kugeln befindet sich genau eine schwarze Kugel". Dieses Ereignis wird dabei durch 3 verschiedene Elemen tarereignisse realisiert, namlich:
ooe, oeo, eoo In allen drei Fallen werden jeweils 2 weiBe und eine schwarze Kugel gezogen (jedoch in unterschiedlicher Reihenfolge). Die Teilmenge B ==
{OOO, eee}
dagegen bedeutet das Ereignis "Die drei gezogenen Kugeln sind gleichfarbig". Es wird durch zwei Elementarereignisse realisiert (entweder sind aIle gezogenen Kugeln weijioder sie sind alle schwarz). Q selbst bedeutet das sichere Ereignis, das immer eintritt. Denn Q enthalt jedes mogliche Ergebnis (Elementarereignis) unseres Zufallsexperiments.
• 2.5 Verkniipfungen von Ereignissen Ereignisse sind, wie wir inzwischen wissen, Teilmengen der Ergebnismenge Q. Sie lassen sich daher wie Mengen verkniipfen. 'Man erhalt auf diese Weise neue Ereignisse, sog. zusammengesetzte Ereignisse. Die wichtigsten Verkniipfungen mit ihren Symbolen haben wir in der folgenden Tabelle zusammengestellt.
2 Grundbegriffe
271
Tabelle 2: Verknupfungen von Ereignissen und ihre Bedeutung (Q: Ergebnismenge eines Zufallsexperiments; A, B: Beliebige Ereignisse, d. h. Teilmengen von Q)
A
ua
Vereinigung der Ereignisse A und B: Entweder tritt A ein oder B oder A und B gleichzeitig
Symbolische Schreibweise: A u B
Ana
Durchschnitt der Ereignisse A und B: A und B treten gleichzeitig ein
Symbolische Schreibweise: A
r,
B
Zu A komplementdres Ereignis: A tritt nicht ein Symbolische Schreibweise: A
Anmerkungen zur Tabelle 2
(1)
Das Ereignis A u B wird auch als Summe aus A und B bezeichnet (symbolische Schreibweise: A + B).
(2)
Das Ereignis A n B heiBt auch Produkt .aus A und B (symbolische Schreibweise: A . B oder kurz AB).
(3)
A ist die
10)
Restmenge (Differenzmenge) von Q und A:
A=
Q\ A
Die hier verwendeten Verkniipfungen von Mengen wurden bereits in Band 1, Abschnitt 1.1.2 ausfiihrlich erortert,
272 (4)
II Wahrscheinlichkeitsrechnung SchlieBen sich zwei Ereignisse A und B gegenseitig aus, so gilt (Bild II -16): .Q
AnB==0
BUd 11-16 Die Ereignisse A und B schlieBen sich gegenseitig aus ("disjunkte" Mengen)
A und B sind sog. disjunkte Mengen. Ein wichtiges Beispiel liefern die Elementarereignisse eines Zufallsexperiments, die sich stets paarweise gegenseitig ausschlieBen.
•
Beispiele (1)
Beim "Wurf einer homogenen Miinze" sei A das Ereignis "Zahl liegt oben". Dann ist das Ereignis "Wappen liegt oben" das zu A komplementdre Ereignis A.
(2)
Beim Zufallsexperiment "Wurf eines homogenen Witrfels" wird die Augenzahl beobachtet. Die Ergebnismenge Q lautet dann: Q
== {1, 2, 3, 4, 5, 6}
Wir betrachten nun die folgenden Teilmengen (Ereignisse): A == {1, 3, 5}
(Wiirfeln einer ungeraden Zahl)
B == {2, 4, 6}
(Wiirfeln einer geraden Zahl)
Dann abergilt:
A == {2, 4, 6} ==
B
Wiirfeln einer geraden Zahl
B == {1, 3, 5} == A
Wiirfeln einer ungeraden Zahl
A u B == {1, 2, 3, 4, 5, 6} == Q
Sicheres Ereignis (tritt bei jedem Wurf ein)
AnB==0
Unmogliches Ereignis (tritt nie ein, da eine Zahl nicht zugleich gerade und ungerade sein kann)
2 Grundbegriffe (3)
273
Der in Bild II -17 dargestellte stromdurchflossene Schaltkreis enthalt drei Gluhlampchen L I , L 2 und L 3 • Mit Ai bezeichnen wir das Ereignis, daB das i-te Gluhlampchen L, durchbrennt (i == 1, 2, 3). Dann laBt sich das Ereignis B: Unterbrechung des Stromkreises
wie folgt als zusammengesetztes Ereignis darsteIlen: B == Al u (A z n A 3 )
Bild 11-17 Stromkreis mit drei Gliihlampchen
Denn der Stromkreis wird genau dann unterbrochen, wenn entweder L 1 durchbrennt (Ereignis A 1) oder gleichzeitig L z und L 3 (Ereignis A z n A 3 ) oder aIle drei Gliihlampchen gleichzeitig durchbrennen (Ereignis A 1 nA znA 3 ) ·
•
Zum AbschluB erwahnen wir noch die sog. De Morganschen Regeln, die sich beim Losen mancher Probleme in der Wahrscheinlichkeitsrechnung als sehr niitzlich erweisen:
274
II Wahrscheinlichkeitsrechnung
3 Wahrscheinlichkeit 3.1 Laplace-Experimente Wird ein Zufallsexperiment mit einer endlichen Ergebnismenge Q == {WI' W 2,· .. , W m } geniigend oft wiederholt und zeigt sich dabei, daB aile Elementarereignisse mit nahezu gleicher Haufigkeit auftreten, so spricht man von einem Laplace-Experiment 11). Bei einem solchen Experiment sind demnach alle Elementarereignisse "gleichmoglich", d. h. kein Elementarereignis ist in irgendeiner Weise gegeniiber den anderen Elementarereignissen bevorzugt oder benachteiligt. Wir geben hierzu zunachst zwei einfache Beispiele.
•
Beispiele (1)
Beim wiederholten Wurf einer (unverfalschten) Miinze erwarten wir, daB die beiden moglichen Ergebnisse (Elementarereignisse) "Zahl" und "Wappen" mit nahezu gleicher absoluter bzw. relativer Haufigkeit auftreten. Es handelt sich also beim Wurf einer Miinze im Idealfall urn ein Laplace-Experiment. Bei 1000 Wiirfen liegt unsere Erwartung somit bei je SOO-mal "Zahl" (Z) und "Wappen" (W). Mit zunehmender Anzahl n der Wiederholungen stabilisieren sich die relativen Haufigkeiten h; (Z) und h; (W) und werden sich dann nur noch unwesentlich vorn erwarteten Wert 1/2 unterscheiden (Bild 11-18 zeigt das zugehorige Stabdiagramm):
relative Heuiiqlcei:
(fur groBes n) 1/2
Bild 11-18 Stabdiagramm beim Miinzwurf (theoretisch "erwartetes" Ergebnis)
z
11)
w
Man unterscheidet noch zwischen absoluter und relativer Haufigkeit, Wird ein Zufallsexperiment n-mal durchgefiihrt und tritt dabei das Ereignis A genau n(A)-mal ein, so gilt definitionsgemdfi:
absolute Haufigkeit: n(A) relative Haufigkeit: hn(A) = n(A) n
3 Wahrscheinlichkeit (2)
275
In einer Urne befinden sich 5 Kugeln, darunter 3 weiBe und 2 schwarze (Bild 11-19):
1000"
Bild 11-19
Wir entnehmen rein zufallig eine Kugel, notieren ihre Farbe und legen sie dann wieder zuruck in die Urne (Ziehung mit Zuriicklegen). Wenn wir dieses Zufallsexperiment nur geniigend oft wiederholen, beispielsweise 1000 Ziehungen vornehmen, so erwarten wir in 3/5 == 60% aller Falle eine weifie Kugel und in 2/5 == 40 % aller Falle eine schwarze Kugel. Denn grundsatzlich besteht fur jede der 5 Kugeln die gleiche Chance, gezogen zu werden. Es handelt sich also auch hier urn ein Laplace-Experiment. Un sere "Erwartung" lautet daher bei 1000 Ziehungen (mit Zuriicklegen) wie folgt:
o e
600-mal 400-mal
In einer konkreten Versuchsserie vom gleichen Umfang wird man jedoch zufallsbedingt meist etwas abweichende Haufigkeitswerte erhalten. Bild 11-20 verdeutlicht dies in einem Stabdiagramm.
absolute Heuiiqkeit
600
-
--
400
-
-
-
dunner Balken: erwarteter Wert -
'- -
dicker Balken: beobachteter Wert
100
Bild 11-20
o
•
•
II Wahrscheinlichkeitsrechnung
276
Eine Ergebnismenge Q mit m gleichmiiglichen Elementarereignissen wird auch LaplaceRaum genannt. Einem Elementarereignis i», wird dabei definitionsgemaf die positive Zahl p(wJ
1
(i
==-
m
== 1, 2,
(11-27)
... , m)
als sog. Wahrscheinlichkeit zugeordnet 12). Die Wahrscheinlichkeit fur ein Ereignis A ist dann durch die Gleichung peA)
== ' \
!...J
p(wJ
==
1 g(A) . -
m
g(A)
== -
(11-28)
m
definiert, wobei g(A) die Anzahl der Elemente (Elementarereignisse) von A ist (summiert wird iiber aIle in A enthaltenen Elementarereignisse wJ. Wir fassen zusammen:
12)
Wir verwenden hier die Kurzschreibweise P( {mJ)
=
p(mJ.
3 Wahrscheinlichkeit
277
Anmerkungen (1) Man beachte, daf diese sag. klassische Definition der Wahrscheinlichkeit nur begrenzt anwendbar ist. Sie gilt nur fur Laplace-Experimente, d. h. Zufallsexperimente, bei denen folgende Voraussetzungen erfiillt sind: a) Die Ergebnismenge Q ist endlich; b) Aile Elementarereignisse (Ergebnisse) sind gleichwahrscheinlich. (2)
Die Definitionsformel (11-30) fur die Wahrscheinlichkeit P(A) eines Ereignisses A HiBt sich auch in der Form Anzahl g (A) der Elemente von A P ()A = - - - - - - - - - Anzahl m der Elemente von Q
(11-31)
angeben.
•
Beispiele
(1)
Beim Zufallsexperiment "Wurf eines homogenen Wurfels" (Standardbeispiel1) treten alle 6 moglichen Augenzahlen (Elementarereignisse) mit der gleichen Wahrscheinlichkeit auf 13): fur
i
= ·1,2, ... ,6
Denn fur jedes Elementarereignis gilt: Anzahl der gitnstigen Falle: g (i) = 1 Anzahl der moglichen Falle: m = 6 Bild 11-21 verdeutlicht diesen Sachverhalt in einem Stabdiagramm.
p(i)
1/6
-f-
Bild 11-21 Beim Wurf eines homogenen Wiirfels treten alle "Augenzahlen" mit gleicher Wahrscheinlichkeit auf (, Gleichverteilung")
2
13)
3
4
5
6
p(i) ist die Wahrscheinlichkeit fur das Elementarereignis "Augenzahl i" (i = 1, 2, ... , 6).
II Wahrscheinlichkeitsrechnung
278 Fur das Ereignis
A
==
{2, 4, 6}
(" gerade Augenzahl ")
erhalten wir somit nach Formel (11-30) die Wahrscheinlichkeit peA)
= g(A) = ~ = ~ m
6
2
Denn die Anzahl der fiir das Ereignis A giinstigen Falle ist 9 (A) == 3, da A durch genau drei Elementarereignisse realisiert wird (A tritt ein bei der Augenzahl ,,2" oder ,,4" oder ,,6"), wahrend die Anzahl der moglichen Falle m == 6 betragt (es gibt genau 6 Elementarereignisse). (2)
In einer Warenlieferung von 100 Gliihbirnen befinden sich 20 defekte (was dem belieferten Kunden jedoch unbekannt ist). Zu KontrolIzwecken wird der Lieferung wahlIos eine Gliihbime entnommen. Die Wahrscheinlichkeit fur das Z ufallsereignis
A: Ziehung einer defekten Gluhbirne ist dann P(A) == g(A) == ~ == 02 m 100 '
Denn jede der m == 100 Gliihbirnen hat die gleiche Chance (Wahrscheinlichkeit), gezogen zu werden, wobei es 9(A) == 20 fur das Eintreten des Ereignisses A giinstige Falle gibt. Es liegt also ein Laplace-Experiment vor. Das zum Ereignis A komplementdre Ereignis
A: Ziehung einer einwandfreien Gluhbirne hat dann die Wahrscheinlichkeit g(A) 80 P(A) == == == 08 m 100 '
Man beachte die (sogar alIgemein giiltige) Beziehung P(A)
(3)
+ P(A) == 0,2 + 0,8 == 1
Beim ZufalIsexperiment "Wurf mit zwei ·unterscheidbaren homogenen Wiirfeln" (StandardbeispieI2) interessieren wir uns fiir die Wahrscheinlichkeit des Ereignisses
A: Die Augensumme ist gleich 9 Die Ergebnismenge Q dieses ZufalIsexperiments enthalt 36 gleichmogliche Elementarereignisse: Q == {(1; 1), (1; 2), (1; 3), ... , (6; 5), (6; 6)}
Es handelt sich also urn einen Laplace-Raum, bei dem jedes Elementarereignis die gleiche Wahrscheinlichkeit p == 1/36 besitzt (Bild 11-22).
279
3 Wahrscheinlichkeit p 1/36
~
(1;1)
(1;2)
(1;3)
(6;6)
Elementarereignis
Bild 11-22 Beim Wurf mit zwei homogenen Wiirfeln treten alle geordneten .Augcnpaare" mit gleicher Wahrscheinlichkeit auf
Unter den 36 Elementarereignissen befinden sich genau 4 fur das Ereignis A giinstige Falle, da es genau 4 verschiedene Elementarereignisse gibt, die zur Augensumme 9 fiihren. Dies sind die Augenpaare (3; 6), (4; 5), (5; 4)
und
(6; 3)
Somit ist g (A) == 4 und m == 36. Die Wahrscheinlichkeit P (A) betragt daher peA) = g(A) = ~ = ~ m 36 9
Wir deuten dieses Ergebnis wie folgt: Wiirden wir dieses Laplace-Experiment z. B. 900-mal durchfuhren, so diirfen wir in nahezu 100 Fallen eine Augensumme von 9 erwarten.
•
3.2 Wahrscheinlichkeitsaxiome Der klassische Wahrscheinlichkeitsbegriff .1aBt sich nur sehr begrenzt, namlich ausschlieBlich auf Laplace-Experimente anwenden. In der modernen Wahrscheinlichkeitstheorie betrachtet man daher den Begriff der "Wahrscheinlichkeit eines zufalligen Ereignisses" als einen Grundbegriff, der gewissen Axiomen, den sag. Wahrscheinlichkeitsaxiomen, geniigt. Der Aufbau dieses Axiomensystems geschieht dabei in enger Anlehnung an die Eigenschaften der relativen Haufigkeiten von zufalligen Ereignissen, die man aus umfangreichen Versuchsserien gewonnen hat.
3.2.1 Eigenschaften der relativen Haufigkeiten Anhand eines einfachen Urnenbeispiels wollen wir uns zunachst mit den wesentlichen Eigenschaften der relativen Haufigkeiten von zufalligen Ereignissen naher vertraut machen.
II Wahrscheinlichkeitsrechnung
280
In einer Urne befinden sich 6 Kugeln, darunter 1 weiBe, 2 graue und 3 schwarze Kugeln. Wir entnehmen der Urne zufallig eine Kugel und beschreiben die dabei moglichen Ergebnisse (Elementarereignisse) durch die in Bild 11-23 naher beschriebenen Mengen A, B und C:
Bild 11-23 A=
II
A
B
{O}
Ziehung einer weiBen Kugel
=
C=
Ziehung einer grauen Kugel
{e}
Ziehung einer schwarzen Kugel
c
B
Dann ist Q == {O,
e} die Ergebnismenge dieses Zufallsexperiments.
Eigenschaften der relativen Haufigkeiten Bei einer n-fachen Ausfiihrung unseres Zufallsexperiments "Ziehung einer Kugel" treten die Ereignisse A, B und C der Reihe nach mit den absoluten Haufigkeiten n(A), n(B) und n(C) auf, wobei stets
n(A)
+ n(B) + n(C) == n
(II-32)
gilt. Die Werte der zugehorigen relativen Haufigkeiten hn(A) = n(A), n
hn(B) = n(B) n
und
hn(C) = n(C) n
(11-33)
liegen dann zwischen 0 und 1. Damit haben wir bereits eine erste Eigenschaft der relativen Haufigkeit erkannt: Die relative Haufigkeit n; (A) eines beliebigen Ereignisses A liegt stets zwischen 0 und 1. Wir beschaftigen uns jetzt mit dem Ereignis "Ziehung einer weijJen oder grauen Kugel". Es wird beschrieben durch die Menge
AuB=={O,
(11-34)
Da sich die Ereignisse A und B gegenseitig ausschliejJen, tritt das Ereignis A u B genau dann ein, wenn entweder A oder B eintritt. Der Fall, daB die Ereignisse A und B gleichzeitig eintreten, ist unter der gegebenen Voraussetzung hier nicht moglich. Somit erhalten wir bei den n Ausfiihrungen un seres Zufallsexperiments in genau n(A) + n(B) Fallen eine weiBe oder eine graue Kugel. Das Ereignis A u B tritt daher mit der relativen Haufigkeit hn(A u B)
= n(A) + n(B) = n(A) + n(B) = hn(A) + hn(B) n
ein.
n
n
(11-35)
3 Wahrscheinlichkeit
281
Diese Aussage HiBt sich wie folgt verallgemeinern: Fur zwei sich gegenseitig ausschliefJende Ereignisse A und B gilt stets:
(II-36) Damit haben wir eine weitere Eigenschaft det relativen Haufigkeit festgestellt. Eine dritte allgemeine Eigenschaft der relativen Haufigkeit beruht darauf, daB das sichere Ereignis Q = A u B u C immer eintritt. Daher gilt: h (Q) n
= hn(A u B u C) = n(A) + nCB) + nee) = ~ = 1 n
(11-37)
n
Stabilisierung der relativen Haufigkeit bei umfangreichen Versuchsreihen
Wir konzentrieren uns jetzt auf das Ereignis A = {O} ("Ziehung einer weifJen Kugel"). Die relative Haufigkeit hn(A) ist das Ergebnis eines Zufallsexperiments und hangt somit selbst vom Zufall abo Daher werden wir bei verschiedenen Versuchsreihen vom gleichen Umfang n im allgemeinen auch verschiedene Werte fur die relativen Haufigkeiten erhalten. Bei einer geniigend oft wiederholten Ausfiihrung unseres Zufallsexperiments "erwarten" wir jedoch, daB im Mittel jede 6. Ziehung eine weifJe Kugel bringt. Unser "Erwartungswert" fur die relative Haufigkeit hn(A) liegt somit bei 1/6. Die in der Praxis tatsachlich beobachteten Werte fur hn(A) werden jedoch als Zufallsprodukte mehr oder weniger stark urn diesen Wert schwanken. Die Erfahrung lehrt aber, daB die relative Haufigkeit eines Ereignisses bei sehr umfangreichen Versuchsreihen nahezu konstant ist. Mit zunehmender Anzahl n der Versuche werden sich daher im allgemeinen die beo bachteten Werte fur h; (A) immer mehr "stabilisieren ", wie in Bild 11-24 verdeutlicht wird.
1/6
•
50
100
150
200
250
300
350
400
450
n
Bild 11-24 Die Erfahrung zeigt: Die relative Haufigkeit eines Ereignisses ist bei umfangreichen Versuchsreihen nahezu konstant, "stabilisiert" sich also mit zunehmendem Umfang n
282
II Wahrscheinlichkeitsrechnung
Wir fassen die wichtigsten Aussagen zusammen:
3.2.2 Wahrscheinlichkeitsaxiome von Kolmogoroff Es liegt nun nahe, den Begriff der Wahrscheinlichkeit P(A) eines Ereignisses A als Grenzwert der relativen Haufigkeit hn(A) fiir n ~ 00 zu definieren. In der Tat ist dies auch versucht worden, fiihrte jedoch zu uniiberbriickbaren Schwierigkeiten, auf die wir im Rahmen dieser Darstellung nicht naher eingehen konnen, In der modernen Wahrscheinlichkeitstheorie verzichtet man daher auf die Definition des Begriffes "Wahrscheinlichkeit" und bctrachtct ihn vielmehr als einen Grundbegriff, der gewissen Axiomen geniigt. Die beobachteten Eigenschaften der relativen Haufigkeiten werden "idealisiert" und fiihren dann zu den folgenden Wahrscheinlichkeitsaxiomen von Kolmogoroff:
3 Wahrscheinlichkeit
283
Anmerkungen (1) Axiom 3 wird auch als Additionssatz fur sich gegenseitig ausschliefiende Ereignisse bezeichnet. (2)
Bei einem Laplace-Experiment Hif3t sich die Wahrscheinlichkeit P(A) eines zufalligen Ereignisses A nach der Definitionsformel (11-30) exakt berechnen (sog. klassische Definition der Wahrscheinlichkeit). Selbstverstandlich werden dabei alle Wahrscheinlichkeitsaxiome erfullt.
(3)
Die Wahrscheinlichkeitsaxiome enthalten keinerlei Aussagen daruber, wie man in einem konkreten Zufallsexperiment die Wahrscheinlichkeiten der dabei auftretenden Ereignisse ermittelt. Sie legen den Wahrscheinlichkeiten aber Bedingungen auf, die erfullt werden miissen und stellen somit in gewisser Hinsicht Rechenregeln fur den Umgang mit Wahrscheinlichkeiten dar. Mit der Ermittlung der (meist unbekannten) Wahrscheinlichkeiten in der Praxis werden wir uns im nachsten Abschnitt 3.2.3 noch beschaftigen.
Aus den Wahrscheinlichkeitsaxiomen lassen sich weitere Eigenschaften der Wahrscheinlichkeiten herleiten, die wir wie folgt zusammenstellen:
284
II Wahrscheinlichkeitsrechnung
3.2.3 Festlegung unbekannter Wahrscheinlichkeiten in der Praxis (" statistische" Definition der Wahrscheinlichkeit) Wir beschaftigen uns jetzt mit der fur die Praxis so auBerordentlich wichtigen, bisher aber offen gebliebenen Frage, wie man in einem konkreten Fall die unbekannten Wahrscheinlichkeiten der zufalligen Ereignisse festlegen bzw. ermitteln kann. 1m einfachsten Fall liegt ein Laplace-Experiment vor. Dann HiBt sich die Wahrscheinlichkeit P(A) eines Ereignisses A aus der "klassischen" Definitionsformel (11-30) sogar exakt berechnen, wobei die Wahrscheinlichkeitsaxiome von Kolmogoroff automatisch erfiillt sind. Bei vielen Zufallsexperimenten sind die Wahrscheinlichkeiten jedoch unbekannt und miissen dann erst festgelegt werden. Dies gilt insbesondere fur solche Experimente, die keine Laplace-Experimente darstellen. Als Grundlage fur die Festlegung der (unbekannten) Wahrscheinlichkeitswerte dient dabei die Erfahrungstatsache, daB sich die relativen Haufigkeiten der zufalligen Ereignisse bei umfangreichen Versuchsreihen im allgemeinen "stabilisieren" und sich mit zunehmender Anzahl n der Versuche immer weniger von einem bestimmten Wert unterscheiden (vgl. hierzu Abschnitt 3.2.1). Die Festlegung der unbekannten Werte der Wahrscheinlichkeiten erfolgt daher im Regelfall anhand der bei umfangreichen Versuchsreihen beobachteten relativen Hdufigkeiten. Man betrachtet dabei die relative Haufigkeit n;(A) eines Ereignisses A als einen N dherungs- oder Schdtzwert fur die unbekannte Wahrscheinlichkeit P (A), mit der das Ereignis A eintritt: (fur hinreichend grofles n)
(11-47)
Diese Art der Festlegung der Wahrscheinlichkeit wird daher auch haufig als "statistische" Definition der Wahrscheinlichkeit bezeichnet, obwohl es sich dabei urn keine Definition im mathematischen Sinne handelt. Somit gilt folgende "Regel":
3 Wahrscheinlichkeit
285
Anmerkung Man spricht bei dieser Art der Festlegung von Wahrscheinlichkeiten auch von den empirisch bestimmten Wahrscheinlichkeitswerten. •
Beispiel
Wir kehren zu dem Urnenbeispiel aus Abschnitt 3.2.1 zuriick (Bild 11-25). Aus umfangreichen Versuchsreihen erhalten wir fur die 3 Elementarereignisse A, B und C der Reihe nach die relativen Haufigkeiten hn(A) ~ 1/6, hn(B) ~ 2/6 == 1/3 und h; (C) ~ 3/6 == 1/2. Sie liefern geeignete Schdtzwerte fur die unbekannten Wahrscheinlichkeiten P(A), P(B) und P(C) (Bild 11-25).
I A
j B
prAy
~
h n (A)
prAy
=t
P(B)
~
hn (B)
P(B)
=t
P(C)
~
hn (C)
P(C) =
t
C
Bild 11-25 Schatzwerte fur die Wahrscheinlichkeiten der Ereignisse A, B und C
•
3.2.4 Wahrscheinlichkeitsraum In der Praxis geht man bei der Bestimmung der Wahrscheinlichkeiten oft so vor, daB man den Elementarereignissen eines Zufallsexperiments mit der Ergebnismenge Q == {Wi' W 2, W 3,···} Wahrscheinlichkeiten Pi ~ 0 so zuordnet, daB die sog. Normierungsbedingung 00
I
Pi = Pi
+ pz + P3 + ."
= 1
(11-49)
i = 1
erfullt ist. Die Wahrscheinlichkeit P (A) eines Ereignisses A aus dem zugehorigen Ereignisraum ist dann durch den Ausdruck (II-50) gegeben, wobei iiber alle in A enthaltenen Elementarereignisse co, summiert wird. Der Ereignisraum wird auf diese Weise zu einem Wahrscheinlichkeitsraum.
II Wahrscheinlichkeitsrechnung
286
Anmerkung
Bei einem endlichen Ereignisraum lauft der Index i von 1 bis n (n: Anzahl der Elementarereignisse in Q).
•
Beispiel Eine (unverfalschte) Miinze wird solange geworfen, bis erstmals "Zahl" erscheint. Dies kann bereits beim 1. Wurf der Fall sein, kann aber auch (theoretisch) unendlich lange dauern. Wir beschreiben die Elementarereignisse Ai: Beim i-ten Wurf erstmals "Zahl"
durch die Angabe der Anzahl i der Wiirfe bis zum erstmaligen Auftreten der "Zahl". Dabei kann i eine beliebige natiirliche Zahl sein. So tritt beispielsweise das Elementarereignis A 3 genau dann ein, wenn beim 3.Wurf der Miinze erstmals "Zahl" erscheint. Die Ergebnismenge Q enthalt somit unendlich viele Elemente: Q={1,2,3, ... }
Der auf dieser Ergebnismenge beruhende Ergebnisraum solI jetzt zu einem Wahrscheinlichkeitsraum erweitert werden. Dazu benotigen wir zunachst die Wahrscheinlichkeiten Pi der Elementarereignisse, die wir mit Hilfe des in Bild 11-26 dargestellten Diagramms wie folgt bestimmen konnen 14): 14)
Das Diagramm liefert ein erstes Beispiel fur ein sehr anschauliches graphisches Hilfsmittel, den sog. Ereignisbaum. Dieses Verfahren wird spater in Abschnitt 3.,7 noch naher erlautert.
3 Wahrscheinlichkeit 1. Wurf
287 2. Wurf
i-ter Wurf
3. Wurf
z z W
Bild 11-26 Ereignisbaum beim wiederholten Miinzwurf
z w W
z
w/
0, ansonsten ist
f
e (-
0: t
lJ
P
=
IX
fJ t f3 -
(t) = 0).
1.
e(-
0: t
l
P
•
5 Kennwerte oder Ma8zahlen einer Wahrscheinlichkeitsverteilung Die Wahrscheinlichkeitsverteilung einer (diskreten oder stetigen) Zufallsvariablen X laBt sich in eindeutiger und vollstandiger Weise entweder durch die Verteilungsfunktion F (x) oder aber durch die zugehorige Wahrscheinlichkeits- bzw. Dichtefunktion f (x) beschreiben. Die Verteilung kann aber auch durch bestimmte Parameter, die man als Kennwerte oder M aj3zahlen der Verteilung bezeichnet, charakterisiert werden. Zu ihnen zahlen u.a. der M ittel- oder Erwartungswert u, die Varianz (J 2 und die Standardabweichung (J. Sie sind wichtige Sonderfdlle einer Gruppe von Kennwerten, die als M omente einer Wahrscheinlichkeitsverteilung bezeichnet werden 20). Der M ittelwert j.1 kennzeichnet dabei .in gewisser Weise das Zentrum oder die M itte der Wahrscheinlichkeitsverteilung, wahrend die Varianz (J 2 und die Standardabweichung (J geeignete MaBzahlen fur die Streuung der Werte urn diesen Mittelwert darstellen.
20)
Im Rahmen dieser einfuhrenden Darstellung konnen wir auf die Momente einer Verteilung nicht naher eingehen und verweisen den Leser auf die spezielle Fachliteratur (siehe Literaturverzeichnis).
5 Kennwerte oder MaBzahlen einer Wahrscheinlichkeitsverteilung
333
5.1 Erwartungswert einer Zufallsvariablen 5.1.1 Ein einfiihrendes Beispiel Beim Zufallsexperiment "Wurf eines homogenen Wurfels" treten die 6 moglichen Werte 1, 2, 3, 4, 5 und 6 der diskreten Zufallsvariablen
X == Erzielte Augenzahl mit gleicher Wahrscheinlichkeit auf. Wenn wir dieses Experiment nur oft genug wiederholen, konnen wir "erwarten", daB die mittlere Augenzahl in der Nahe des arithmetischen Mittels aus den 6 moglichen Werten 1 bis 6 liegt. Wir "erwarten" somit bei hinreichend groBen Versuchsserien eine mittlere Augenzahl von nahezu X==
1+2+3+4+5+6 ==35 6 '
(11-96)
Dieser Wert ist der sog. Erwartungswert der Zufallsvariablen X in dem beschriebenen Wiirfelexperiment. Bei einer groBen Anzahl von Wiirfen konnen wir daher erwarten, daB wir pro Wurf eine mittlere Augenzahl von 3,5 erhalten.
5.1.2 Erwartungswert einer diskreten Zufallsvariablen In dem soeben beschriebenen Beispiel traten die moglichen Werte der diskreten Zufallsvariablen X ("Augenzahl beim Wurfeln") alle mit der gleichen Wahrscheinlichkeit auf. 1m allgemeinen jedoch sind die Werte einer diskreten Zufallsvariablen X nicht gleichverteilt. Bei der Berechnung des Erwartungswertes spielt daher die Wahrscheinlichkeitsfunktion f (x) eine entscheidende Rolle. Sie bestimmt in gewisser Weise die Gewichtungsfaktoren, mit denen die moglichen Werte Xi in die Berechnung eingehen. Den Erwartungswert der Zufallsvariablen X erhalt man dann als Summe der gewichteten Werte Xi· f (x.). Dies fuhrt zu der folgenden Definition:
Anmerkung In der Definitionsformel (11-97) wird uber alle moglichen Werte Xi summiert. Bei einer diskreten Zufallsvariablen mit abziihlbar unendlich vielen Werten wird dabei die absolute Konvergenz der Reihe in Gleichung (II-97) vorausgesetzt. Andernfalls besitzt die Verteilung keinen Erwartungswert.
II Wahrscheinlichkeitsrechnung
334
•
Beispiele (1)
Gegeben ist eine diskrete Zufallsvariable mit der Verteilungstabelle
1
f(xJ
8
2
3
3 8
3
1
8
8
4
Sie besitzt den folgenden Erwartungswert: 4 1 3 3 1 20 E(X) = ~ x·' f(x.) = 1 . - + 2 . - + 3 . - + 4 . - = - = 2 5 ~l t 88888' i= 1
(2)
Beim ; Wurf eines homogenen Wiirfels" ist die diskrete Zufallsvariable
x
=
Erzielte Augenzahl
gleichverteilt: 2
Xi
1
f(xd
1
4
3
5
1
6
-
-
-
1
1
-
-
-
6
6
6
6
6
6
1
Sie besitzt den folgenden Erwartungswert: 6
1
1
1
E(X) = ~ x··f(x.)=1·-+2·-+ +6·-= t 66'" 6
c:
i= 1
1
1
= - (1 + 2 + ". + 6) = - . 21 = 3,5 6 6
•
5.1.3 Erwartungswert einer stetigen Zufallsvariablen Im FaIle einer stetigen ZufaIlsvariablen X definieren wir den Erwartungswert E (X) wie folgt:
5 Kennwerte oder MaBzahlen einer Wahrscheinlichkeitsverteilung 00
Anmerkung
Es wird vorausgesetzt, daB das Integral die Verteilung keinen Erwartungswert.
•
f
335
Ix I . J (x) dx
existiert. Andernfalls besitzt
-00
Beispiel Die Lebensdauer T eines bestimmten elektronischen Bauelements kann in guter Naherung als eine exponentialverteilte Zufallsvariable mit der DichteJunktion
t 2 ein absolutes Maximum an der Stelle z 1 == n - 2 (Bild II -128).
(2)
Fur grojJe Freiheitsgrade n HiBt sich die Chi-Quadrat-Verteilungdurch eine Normalverteilung mit dem Mittelwert J1 == n und der Varianz (J2 == 2 n anndhern. Die hier meist verwendete Faustregel lautet: n> 100.
•
Beispiel 2
Z sei eine X -verteilte Zufallsvariable mit f == n == 10 Freiheitsgraden. Wie muB man die Intervallgrenze a wahlen, damit 950/0 aller Werte im Intervall Z ~ a liegen? Liisung: Wir miissen die Intervallgrenze a so bestimmen, daB die Bedingung P(Z ~ a)
==
F(a)
== 0,95
erfiillt ist (hellgrau unterlegte Flache in Bild 11-129). Aus der Tabelle 3 im Anhang entnehmen wir fur f == n == 10 Freiheitsgrade den gesuchten Wert der Konstanten a: F(a)
== 0,95
f= 10
a
==
Z(0,95;10)
== 18,31
Die Intervallgrenze a ist das Quantil Z(0,95; 10) der Chi-Quadrat-Verteilung. Die Zufallsvariable Z nimmt somit mit einer Wahrscheinlichkeit von 95% Werte an, die hochstens gleich 18,31 sind.
f(z)
Bild 11-129
•
II Wahrscheinlichkeitsrechnung
440
Spezielle Werte und Rekursionsformeln der Gamma-Funktion
r(~)
Die nachfolgende Tabelle 5 enthalt einige Werte der Gamma-Funktion sowie hilfreiche Rekursionsformeln, durch die die Berechnung der N ormierungskonstanten An in der Funktionsgleichung (11-294) ermoglicht wird.
Tabelle 5: Spezielle Werte und Rekursionsformeln der Gamma-Funktion r(a)
8.2 t-Verteilung von Student Eine weitere wichtige Testverteilung ist die sog. t-Verteilung von Student 38). Sie bildet die Grundlage fur bestimmte Parametertests in der mathematischen Statistik. Wir gehen dabei von den folgenden Voraussetzungen aus: X und Y seien zwei stochastisch unabhdngige Zufallsvariable, wobei X der Standardnormalverteilung und Y der Chi-Quadrat- Verteilung mit dem Freiheitsgrad n geniige. Die aus diesen Zufallsvariablen gebildete GroBe X T==--
(11-299)
~
ist dann eine stetige Zufallsvariable, die der sog. t- Verteilung mit der Dichtefunktion
f (t) == An . (
t 2 ) (n+1)/2
(-oo 0 und somit auch s > 0, sofern nicht aIle Stichprobenwerte gleich sind (in diesem Sonderfall ist S2 == 0 und somit auch s == 0).
8)
Die Angabe des Stichprobenmittelwertes x allein reicht zur Charakterisierung der Haufigkeitsverteilung nicht aus, da empirische Verteilungen mit demselben Mittelwert vollig verschieden aussehen konnen.
III Grund1agen der mathematischen Statistik
482
(4)
Es iiberrascht zunachst, daB bei der Bi1dung der Varianz die Summe der Abweichungsquadrate nicht (wie eigentlich nahe1iegend) durch die Anzah1 n der Stichprobenwerte, sondern durch die Zah1 n - 1 dividiert wird. Eine ausreichende Begriindung ist an dieser Stelle nicht moglich, wir reich en sie aber spater nach (vgl. hierzu Abschnitt 3.2.4).
(5)
Fur praktische Berechnungen der Varianz gleichwertige Forme1 2 8
=
n
~ 1 [.I 1
S2
ist die mit der Definition (111-19)
2
Xf -
n .x
(111-20)
]
=1
oft besser geeignet. •
Beispiel
Die Untersuchung des Wirkungsgrades X von 5 serieng1eichen Kesse1n einer 61Heizungsan1age eines bestimmten Fabrikats fiihrte zu der fo1genden Urliste: (alle Werte in 0/0)
92,4; 91,9; 92,0; 91,8; 91,9
Wir bestimmen Mittelwert X, Varianz S2 und Standardabweichung s dieser Stichprobe:
1
92,4
0,4
0,16
8537,76
2
91,9
-0,1
0,01
8445,61
3
92,0 91,8
-0,2
°
8464
4
°
0,04
8427,24
5
91,9
-0,1
0,01
8445,61
Fur den M ittelwert
x erhalten wir nach der
Definitionsforme1 (111-17): (in 0/0)
Die Berechnung der Varianz S2 und damit der Standardabweichung s soll zunachst nach der Definitionsforme1 (III -19) erfo1gen:
2 Kennwerte oder MaBzahlen einer Stichprobe 1 5- 1
I
1
5
S2 = - - '
(Xi - X)2 =
4: . 0,22 =
483
0,055 ~ 0,06
i = 1
, , s = ySt;i = )0055 = 0,235 ~ 024
(in %)
Die rechnerisch bequemere Formel (111-20) fiihrt natiirlich zum gleichen Ergebnis:
S2
= -15-1
[5~ x~ ~
i= 1
~
n.
]
1 . (42320 22 x2 = -4 '
5 . 92 2 )
= 0 055 ~ 006 "
(in 0/0 2 )
Der mittIere Wirkungsgrad der Heizkessel betragt somit X = 92%. Varianz ~ 0,06% 2 und Standardabweichung s ~ 0,24% kennzeichnen dabei die Streuung der Einzelwerte urn diesen Mittelwert. _
S2
2.2 Spezielle Berechnungsformeln fur die Kennwerte einer Stichprobe 2.2.1 Berechnung der Kennwerte unter Verwendung der Haufigkeitsfunktion f(x) sei die Hdufigkeitsfunktion der (geordneten) Stichprobe vom Umfang n mit der folgenden Verteilungstabelle:
M ittelwert
x und
Varianz S2 lassen sich dann wie folgt aus dieser Tabelle berechnen:
III Grundlagen der mathematischen Statistik
484
Anrnerkung Fur praktische Berechnungen der Varianz
S2
1 [.
= n:
±
1
xf·
f
S2
ist die gleichwertige Formel
2
(x;) - X
(III -23)
]
= 1
oft rechnerisch bequerner. •
Beispiel
Aus einer Serienfabrikation von Gewindeschrauben wurden wahllos 100 Schrauben entnommen und der je.weilige Durchrnesser bestimmt. Diese Stichprobe vom Umfang n == 100 fiihrte dabei zu der folgenden Verteilungstabelle: -
Xi
mm
f(xJ
3,50
3,51
3,52
3,53
3,54
3,55
3,56
3,57
0,03
0,08
0,22
0,30
0,18
0,10
0,06
0,03
Wir berechnen den M ittelwert .x:, die Varianz S2 und die Standardabweichung s dieser Stichprobe unter Verwendung der folgenden Tabelle:
3,50
0,03
0,1050
- 0,0321
10,3041
0,309123
2
3,51
0,08
0,2808
- 0,0221
4,8841
0,390728
3
3,52
0,22
0,7744
- 0,0121
1,4641
0,322102
4
3,53
0,30
1,0590
- 0,0021
0,0441
0,013230
5
3,54
0,18
0,6372
0,0079
0,6241
0,112338
6
3,55
0,10
0,3550
0,0179
3,2041
0,320410
7
3,56
0,06
0,2136
0,0279
7,7841
0,467046
8
3,57
0,03
0,1071
0,0379
14,3641
0,430923
Mittelwert: 8
I
X= i
=1
Xi·
f
(x;) = 3,5321 mm
~ 3,532 mm
2 Kennwerte oder MaBzahlen einer Stichprobe
485
Varianz:
Sl
==
100 8 . ~ (Xi 100 -.:. 1 L
X)l .
100 f(xJ == -99 .2,3659.10- 4 mm ' ==
i= 1
Standardabweichung:
s ==
R
== )2,39 .10- 4 mm? == 1,55 .10- 1 mm == 0,0155 mm ~ 0,016 mm
Die Schrauben in der entnommenen Stichprobe besitzen somit einen mittleren Durchmesser von == 3,532 mm. Die Streuung der Einzelwerte urn diesen Mittelwert wird durch die Standardabweichung s == 0,016 mm charakterisiert.
x
• 2.2.2 Berechnung der Kennwerte einer gruppierten Stichprobe
f (x)
sei die Klassenhdufigkeitsfunktion einer in k Klassen aufgeteilten Stichprobe vom Urn fang n mit der folgenden Verteilungstabelle:
x
Xl' Xl' ... , k sind dabei die Klassenmitten. E's gelten dann die bereits aus dem vorangegangenen Abschnitt bekannten Formeln fur den Mittelwert x und die Varianz Sl, wenn man dort die verschiedenen Stichprobenwerte Xl' Xl' ... , X k durch die Klassenmitten Xl' Xl' ... , Xk ersetzt.
486
III Grundlagen der mathematischen Statistik
Anmerkung In der Praxis verwendet man zur Berechnung der Varianz S2 meist die rechnerisch bequemere (und der Definitionsformel 111-25 gleichwertige) Formel (111-26)
•
Beispiel Wir kommen nochmals auf das Beispiel in Abschnitt 1.3.3 zuriick (Entnahme einer Stichprobe vom Umfang n = 50 aus einer Serienproduktion von ohmschen Widerstanden mit dem Sollwert 100 Q). Die Stichprobenwerte hatten wir dabei in 8 Klassen der Breite ~x = 1 Q mit den ganzzahligen Klassenmitten 97 Q, 98 Q, ... , 104 Q aufgeteilt. Diese Klasseneinteilung fiihrte dann zu der folgenden Klassenhdufigkeitsfunktion f (x) (vgl. hierzu auch das in Bild 111-13 dargestellte Stabdiagramm): Klassen-Nr. i
1
2
3
4
5
6
7
8
Klassenmitte Xi (in Q)
97
98
99
100
101
102
103
104
f(xJ
0,04
0,10
0,20
0,26
0,18
0,12
0,08
0,02
Wir bestimmen den Mittelwert X, die Varianz S2 und die Standardabweichung s dieser Stichprobe unter Verwendung der nachfolgenden Tabelle:
1
97
0,04
3,88
9409
376,36
2
98
0,10
9,80
9604
960,4
3
99
0,20
19,80
9801
1960,20
4
100
0,26
26,00
10000
2600,00
5
101
0,18
18,18
10201
1 836,18
6
102
0,12
12,24
10404
1248,48
7
103
0,08
8,24
10609
848,72
8
104
0,02
2,08
10816
216,32
3 Parameterschatzungen
487
Mittelwert: 8
X=
L Xi' f(x;)
= 100,22
o
i = 1
Varianz (nach der Formel (111-26) berechnet):
2 S
50 =50-1
8 -2 - -2] [.L "f(xi)-x Xi
1=
=
1
= 50 [10046,66 n 2 _ (100,22 n)2] = 2,6649 n 2 ~ 2,665 n 2 49
Standardabweichung:
s ==
p
== J2,6649 Q2 == 1,6325 Q ~ 1,633 Q
Die entnommenen Widerstande besitzen im Mittel einen Wert von x == 100,22 Q. Die mittlere Abweichung der einzelnen Widerstandswerte von diesem Mittelwert wird durch die Standardabweichung s == 1,633Q beschrieben.
•
3 Statistische Schatzmethoden fiir die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Parameterschatzungen") 3.1 Aufgaben der Parameterschatzung Eine Grundgesamtheit, deren Elemente wir hinsichtlich eines bestimmten Merkmals X betrachten, ist bekanntlich durch die Verteilungsfunktion F(x) der Zufallsvariablen X vollstdndig charakterisiert. Wir driicken diesen Sachverhalt kurz und knapp wie folgt aus: "Die Grundgesamtheit besitzt die Verteilungsfunktion F(x)". In den Anwendungen aber stellt sich dann haufig das folgende Problem: Die Verteilungsfunktion F(x) einer Grundgesamtheit ist zwar von der Art her bekannt, enthalt jedoch noch unbekannte Parameter. So hat man es in vielen Fallen mit Normalverteilungen zu tun, deren Parameter J1 und (J jedoch noch unbekannt sind. Es ergeben sich daraus dann folgende Fragestellungen: 1. Wie erhdlt man auf der Basis einer konkreten Stichprobe Schatz- oder Ndherungswerte fur die unbekannten Parameter? 2. Wie genau und wie sicher sind solche Schdtzwerte'l
488
III Grundlagen der mathematischen Statistik
Mit der ersten Frage werden wir uns in den nachfolgenden Abschnitten 3.2 und 3.3 auseinandersetzen und dabei sehen, wie man unter Verwendung einer konkreten Stichprobe mit Hilfe sog. Schdtzfunktionen Naherungs- oder Schatzwerte fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung erhalten kann. Die zweite Frage fiihrt uns dann zu den sog. Konfidenz- oder Vertrauensintervallen, die wir in Abschnitt 3.4 ausfiihrlich behandeln werden. Dort werden wir zeigen, wie sich durch Stichprobenuntersuchungen Intervalle bestimmen lassen, die einen unbekannten Parameter der Verteilung mit einer vorgegebenen (groBen) Wahrscheinlichkeit iiberdecken. Man bezeichnet daher diese auf Stichprobenuntersuchungen beruhenden statistischen Schatzmethoden als Parameterschdtzungen und unterscheidet dabei noch wie folgt zwischen einer Punkt- und einer Intervallschdtzung:
3.2 Schatzfunktionen und Schatzwerte fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Punktschatzungen") Wir beschaftigen uns in diesem Abschnitt mit der Schdtzung von unbekannten Mittelwerten, Varianzen und Anteilswerten ("Erfolgswahrscheinlichkeiten" einer Binomialverteilung). Ein Verfahren zur Gewinnung von Schatzfunktionen werden wir dann im nachsten Abschnitt kennenlernen (Maximum-Likelihood-Methode). Beginnen wollen wir aber mit einem anschaulichen Beispiel.
3 Parameterschatzungen
489
3.2.1 Ein einfiihrendes Beispiel Beim radioaktiven Zerfall eines bestimmten chemischen Elementes zerfallen die einzelnen Atomkerne auf natiirliche Art und Weise regellos undunabhiingig voneinander nach den Gesetzmalsigkeiten der mathematischen Statistik. Die diskrete Zufallsvariable X = Anzahl der Atomkerne, die in einem bestimmten Zeitintervall dt zerfallen
erweist sich dabei als eine geeignete Grobe zur Beschreibung dieses statistischen Vor.. gangs. Sie geniigt einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion flX
f(x) = P(X = x) = _. e"!'
(111-27)
(x = 0, 1, 2, ...)
x!
Der dabei meist unbekannte Parameter fl in dieser Verteilung ist der Erwartungs- oder Mittelwert der Zufallsvariablen X und gibt an, wieviele Atomkerne im Mittel in dem gewahlten Zeitintervall dt zerfallen. In der Praxis stellt sich dann die Aufgabe, diesen Parameter aus einer konkreten Stichprobe zu schdtzen. Wir gehen dabei wie folgt vor: In n aufeinander folgenden Zeitintervallen gleicher Lange dt messen wir mit einem Zahlgerat, wieviele Atomkerne in diesem Zeitraum jeweils zerfallen. Wir erhalten dabei der Reihe nach Xl' X 2, X 3, ... , x; Zerfalle:
Zeitintervall Nr. i
1
2
3
n
Anzahl Xi der Atomkerne, dieim i-ten Zeitintervall zerfallen sind
Xl
X2
X3
Xn
x
Es liegt dann nahe, den arithmetischen Mittelwert dieser Stichprobe als Schatz- oder Ndherungswert fiir den unbekannten Mittelwert fl der Verteilung zu betrachten:
L n
-
fl~x
1 n
=_.
i= 1
+
+ ... +
Xl x2 x; Xi = - - - - - - -
n
(111-28)
In Abschnitt 3.3.2.2 werden wir dann naher begrunden, warum der Stichprobenmittelwert in der Tat als Schdtzwert fur den Parameter fl geeignet ist. Der durch die PoissonVerteilung (111-27) charakterisierte radioaktive Zerfall ist damit durch die Naherung fl ~ vollstdndig und eindeutig beschrieben.
x
x
3.2.2 Schatz- und Stichprobenfunktionen Fur die Schdtzung der unbekannten Parameter einer Wahrscheinlichkeitsverteilung werden spezielle Funktionen benotigt. Sie ermoglichen die ndherungsweise Berechnung dieser Parameter unter Verwendung einer konkreten Stichprobe, die man der entsprechenden Grundgesamtheit entnommen hat. Wir wollen in diesem Abschnitt zunachst am Beispiel des Mittelwertes fl einer Verteilung die wichtigen Begriffe einer Schatz- und Stichprobenfunktion einfiihren, uns dann den besonderen Eigenschaften dieser Funktionen zuwenden und abschlieBend Kriterien fur .optimale" Schatzfunktionen aufstellen.
III Grundlagen der mathematischen Statistik
490 Schatzung des Mittelwertes
x
Es HiBt sich zeigen, daBder Mittelwert einer konkreten ZufaIlsstichprobe Xl' X 2, ... , x; als ein geeigneter Schatz- ·oder Ndherungswert fur den unbekannten Mittelwert /1 der Wahrscheinlichkeitsverteilung der zugehorigen ZufaIlsvariablen X betrachtet werden kann 9): A
_
n
~
1
L
/1~/1=x=~'
Xi
=
Xl +X 2
+ ... +
Xn
(111-29)
n
i= 1
Diesen Schatzwert fassen wir als einen speziellen Wert oder eine Realisierung der Funktion
Xl + X 2 + ... + X; Xi = - - - ---i= 1
(111-30)
n
auf. Xl' X 2' ... , X n sind dabei stochastisch unabhdngige ZufaIlsvariable, die aIle die gleiche Verteilung besitzen wie die Zufallsgrolie X (Mittelwert /1., Varianz (T2) und Xl' X 2, ••. , x; die Werte dieser ZufaIlsvariablen anhand der entnommenen konkreten Stichprobe. Die von den n ZufaIlsvariablen Xl' X 2' ... , X n abhangigeFunktion X ist dann ebenfalls eine Zufallsvariable und wird in diesem Zusammenhang als eine Schdtzfunktion fur den unbekannten M ittelwert /1 der Zufallsvariablen X bezeichnet. Stichprobenfunktionen Die ZufaIlsvariable X ist ein erstes Beispiel fiir eine sog. Stichprobenfunktion. Darunter versteht man in der mathematischen Statistik ganz allgemein eine Funktion (ZufaIlsvariable), die von n unabhdngigen ZufaIlsvariablen Xl' X 2' ... , X n abhangt, die aIle der gleichen Verteilungsfunktion F(x) geniigen, Die unabhdngigen Zufallsvariablen Xl' Xl' ... , X n konnen dabei auch als die Komponenten einer n-dimensionalen ZufaIlsgrebe (III -31) die haufig auch als Zufallsvektor X bezeichnet wird, aufgefaBt werden. Sie beschreibt (in sehr abstrakter Weise) eine sog. mathematische Stichprobe. Eine Stichprobenuntersuchung fiihrt dann stets zu einer konkreten Stichprobe mit den Stichprobenwerten (x J ' X 2, ••• , x.}, die wir als eine Realisierung der n-dimensionalen Zufallsgrolse (X1; X 2; ... ; X n) interpretieren: n-dimensionale Zufallsgrolle
(X 1; X 2; ... ; X n)
1 1 konkrete Stichprobe
1
(Xl; X 2;···; X n )
In den nachfolgenden Abschnitten werden wir noch weitere Stichprobenfunktionen kennenlernen.
9)
Schdtzwerte kennzeichnen wir durch ein .Dach''. Beispiel: (Mittelwert) 11.
p,
ist ein Schdtzwert fur den Parameter
491
3 Parameterschatzungen Besondere Eigenschaften der Schatzfunktion X
Wir kehren nun zu der Stichprobenfunktion X, der Schdtzfunktion fur den Mittelwert J.1, zuruck. Fur verschiedene Stichproben erhalten wir im allgemeinen verschiedene Stichprobenmittelwerte x und damit auch verschiedene Schatzwerte (t fur den unbekannten Mittelwert J.1 der Grundgesamtheit 10). Unsere Schatzfunktion X besitzt dabei drei besonders wiinschenswerte Eigenschaften, die uns z.T. bereits aus Kapitel II, Abschnitt 7.5.4 (1. Beispiel) bekannt sind: (1)
Die Schatzfunktion X besitzt den Erwartungswert J.1:
(111-32)
E(X) = J.1
Eine Schatzfunktion mit dieser Eigenschaft heiBt erwartungstreu. X ist somit eine erwartungstreue Schatzfunktion fur den unbekannten Mittelwert J.1 der Grundgesamtheit. (2)
Fur die Varianz Var(X) gilt bekanntlich: _
(52
Var(X) = n
(III -33)
Dies aber bedeutet, daf die Varianz der Schatzfunktion X mit zunehmendem Stichprobenumfang n abnimmt und fur n ~ 00 gegen Null strebt. Mit anderen Worten: Die Werte der Zufallsvariablen X streuen mit zunehmendem n immer geringer um den (unbekannten) Mittelwert J.1. Die Schatzfunktion X ist - wie man sagt - konsistent. Damit bringt man ganz allgemein zum Ausdruck, daB die Wahrscheinlichkeit dafiir, daB sich die Werte einer Schatzfunktion beliebig wenig von dem zu schatzenden (unbekannten) Parameter der Grundgesamtheit unterscheiden, fur n ~ 00 gegen den Wert Eins konvergiert. (3)
Unsere Schatzfunktion X ist aber nur eine von mehreren moglichen erwartungstreuen Schatzfunktionen fur den Mittelwert J.1. Es laBt sichjedoch zeigen, daB es bei gleichem Stichprobenumfang n keine andere erwartungstreueSchatzfunktion fur den Parameter J.1 mit einer kleineren Varianz gibt.Die Schatzfunktion X heiBt daher wirksam oder effizient.
Kriterien .fur eine "optimale" Schatzfunktion
Die Schatzung eines unbekannten Parameters 9- erfolgt also mit Hilfe einer geeigneten Stichprobenfunktion
(111-34) die in diesem Zusammenhang als Schdtzfunktion fur den Parameter 9- bezeichnet wird.
10)
Der Mittelwert X einer Stichprobe ist eine Funktion der n unabhangigen Stichprobenwerte x2'
0.
O'Xn0
Xl'
III Grundlagen der mathematischen Statistik
492
Eine solche Schatzfunktion wird als "optimal" betrachtet, wenn sie die folgenden Kriterien erfiillt:
Anmerkung
Ein Musterbeispiel fur eine "optimale" Schatzfunktion liefert die durch Gleichung (111-30) definierte Schatzfunktion X fur den M ittelwert 11.
3.2.3 Schatzungen fur den Mittelwert Jl Wie wir aus dem vorherigen Abschnitt bereits wissen, liefert der arithmetische Mittelwert X 2, .•. , x; einen geeigneten Schatz- oder N dherungswert {l, fur den unbekannten Mittelwert u der Wahrscheinlichkeitsverteilung der zugehorigen Zufallsvariablen X:
x einer Zufallsstichprobe Xl'
A
Jl ~ Jl =
_
X
1
n
~
= ;;. i....J i= 1
Xi
(III-38)
493
3 Parameterschatzungen Die zugehorige Schdtzfunktion istdie Stichprobenfunktion
(III -39)
die zu jeder konkreten Stichprobe einen "optimalen" Schatzwert fur den Mittelwert f.l liefert. "Optimal" bedeutet in diesemZusammenhang, daB diese Schatzfunktion unter allen moglichen Schatzfunktionen den jeweils "besten" Naherungswert fur f.l bringt. Wir werden sparer diese wichtige Schatzfunktion fur den unbekannten Mittelwert f.l einer Verteilung mit Hilfe der Maximum-Likelihood-Methode herleiten (Abschnitt 3.3.2.3).
3.2.4 Schatzungen fiir die Varianz
(12
Die Varianz S2 einer Zufallsstichprobe Xl' x 2, ... , x; liefert einen geigneten Schatz- oder N dherungswert 8 2 fur die unbekannte Varianz (J2 der Wahrscheinlichkeitsverteilung der zugehorigen Zufallsvariablen X: (111-40)
Die zugehorige Schdtzfunktion ist die Stichprobenfunktion (111-41)
Sie ist (ebenso wie X) erwartungstreu, d.h. es gilt:
E(S2) = (J2
(111-42)
Genau diese wichtige Eigenschaft der Erwartungstreue ist der Grund dafiir, daB in der Definitionsgleichung fur die Varianz S2 einer Stichprobe die Summe der Abweichungsquadrate nicht (wie naheliegend) durch die Anzahl n der Stichprobenwerte geteilt wird, sondern durch die Zahl n - 1 (vgl. hierzu Abschnitt 2.1). Vereinzelt wird auch die Stichprobenfunktion n
1.
'\'
-)2 S* =~. !....J (Xi-X 2
(111-43)
i= 1
als Schdtzfunktion fur die unbekannte Varianz (J2 verwendet 11). Sie hat jedoch den Nachteil, daB sie nicht erwartungstreu ist.
11)
Diese Schatzfunktion erhalt man, wenn man die Maximum-Likelihood-Methode auf eine normalverteilte Grundgesamtheit anwendet (vgl. hierzu den nachfolgenden Abschnitt 3.3.2.3).
III Grundlagen der mathematischen Statistik
494
Als Schatzfunktion fur die Standardabweichung (J der Grundgesamtheit verwendet man die Stichprobenfunktion S = )S2, d.h. die Quadratwurzel aus der Stichprobenvarianz S 2. Diese Funktion ist jedoch nicht erwartungstreu.
3.2.5 Schatzungen fur einen Anteilswert p (Parameter p einer Binomialverteilung) Bei einem Bernoulli-Experiment trete das Ereignis A mit der unbekannten Wahrscheinlichkeit p ein, das komplemenidre Ereignis A somit mit der Wahrscheinlichkeit q = 1 - p. Der Parameter p, auch Anteilswert oder ErJolgswahrscheinlichkeit genannt, laBt sichdann anhand einer Stichprobe vom Umfang n wie folgt schatzen: Das Bernoulli-Experiment wird insgesamt n-mal durchgefiihrt und dabei die Anzahl k der Erfolge festgestellt 12). Dann ist die relative Haufigkeit h(A) = kin, mit der das Ereignis A ("Erfolg") eingetreten ist, ein Schatz- oder N dherungswert fur den unbekannten Parameter p der binomialverteilten Grundgesamtheit, der diese Stichprobe entnommen wurde: p
~
A
p
=
h(A)
k n
=-
(III~44)
Die zugehorige Schdtzfunktion ist
'" X
p=n
(111-45)
wobei durch die Zufallsvariable X die Anzahl der .Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments beschrieben wird. Die Zufallsvariable X geniigt bekanntlich einer Binomialverteilung mitdem Erwartungsoder Mittelwert E(X) = J1 = np und der Varianz Var(X) = (J2= np(l - p) (vgl. hierzu Kapitel II, Abschnitt 6.1). Die Schdtzfunktion P = X In fur den Anteilswert p ist dann ebenfalls binomialverteilt mit dem Erwartungs- oder M ittelwert E (P) = p und der Varianz Var(P) = p(l - p)ln.
3.2.6 Tabellarische Zusammenstellung der wichtigsten Schatzfunktionen und ihrer Schatzwerte Tabelle 1 gibt einen Uberblick tiber die Schdtzfunktionen und die zugehorigen, aus einer konkreten Zufallsstichprobe gewonnenen Schdtzwerte fur die wichtigsten statistischen Parameter und Kennwerte einer beliebigen Grundgesamtheit:
12)
Das Eintreten des Ereignisses A werten ~ir als Erfolg, das Nichteintreten von A (und somit das Eintreten des komplementdren Ereignisses A) als M ij3erfolg.
3 Parameterschatzungen
495
Tabelle 1: Schatzfunktionen und zugehorige Schatzwerte fur die wichtigsten statistischen Parameter und Kennwerte einer beliebigen Grundgesamtheit
n
I
x=~, i
Mittelwert der konkreten Stichprobe Xl' X 2 , ••• , X n :
Xi
=1
n
8 2 == _1_. \' (Xi _ X)2 n-1 L i
-"
Varianz der konkreten Stichprobe Xl.' X 2, .•. , X n :
=1
X
p==n
X == Anzahl der "Erfolge" bei n-facher Ausfiihrung des BernoulliExperiments
Relative Haufigkeit fur das Ereignis A ("Erfolg") bei n-facher Ausfiihrung des Bernoulli-Experiments:
k p == h(A) == n k: Anzahl der Erfolge A
Anmerkungen zur Tabelle 1
P sind
P
(1)
Die Schatzfunktionen X, 8 2 und auch efJizient.
(2)
Die Zufallsvariablen Xi geniigen alle der gleichen Verteilung (Mittelwert 11, Varianz Sind sie auBerdem noch alle normalverteilt, so ist auch die Schatzfunktion X eine normalverteilte Zufallsgrobe mit dem Erwartungs- oder Mittelwert E (X) == 11 und der Varianz Var(X)== (J2 In.
erwartungstreu und konsistent, X und
(J2).
(3)
Bei beliebig verteilten Zufallsvariablen Xi mit E (XJ == 11 und Var(XJ == (J2 folgt aus dem Zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung (Kap. II, Abschnitt 7.6.1), daB die Schatzfunktion X ndherungsweise normalverteilt ist mit dem Mittelwert E (X) == 11 und der Varianz Var (X) == (J2 In.
(4)
Die binomialverteilte Zufallsvariable Pist bei umfangreichen Stichproben ndherungsweise normalverteilt mit dem Mittelwert E (P) == p und der Varianz Var (P) == p(1 - p)ln. Diese Aussage folgt aus dem Grenzwertsatz von Moivre und Laplace (Kap. II, Abschnitt 7.6.3).
496 (5)
III Grundlagen der mathematischen Statistik
JS2
ist eine Schdtzfunktion fur die StandardabweiDie Stichprobenfunktion S == (J der Grundgesamtheit. Sie ist jedoch nicht erwartungstreu, d.h. es gilt:
chung
E (S) =1=
(111-46)
(J
Tabelle 2 enthalt eine Zusammenstellung der Schatzwerte fiir die Parameter spezieller Wahrscheinlichkeitsverteilungen, die in den technischen Anwendungen eine besondere Rolle spielen:
Tabelle 2: Schatzwerte fiir die Parameter spezieller Wahrscheinlichkeitsverteilungen, ermittelt aus einer konkreten Stichprobe
k: Anzahl der "Erfolge" bei einer n-fachen Ausfiihrung des BernoulliExperiments
k p==n A
Mittelwert /1:
x: Mittelwert der Stichprobe
Parameter A:
x: Mittelwert der Stichprobe
a) Mittelwert /1:
x: Mittelwert der Stichprobe
b) Varianz
S2:
(J2:
Varianz der Stichprobe
Anmerkung zur Tabelle 2
Die Herleitung der angegebenen Formeln zur Berechnung der Schatzwerte erfolgt exemplarisch im nachsten Abschnitt mit Hilfe der sog. Maximum-Likelihood-Methode.
13)
Es ist die jeweilige Wahrscheinlichkeits- bzw. Dichtefunktion
f
(x) angegeben.
3 Parameterschatzungen •
497
Beispiele
(1)
Die Lebensdauer T eines bestimmten elektronischen Bauelements geniige einer Exponentialverteilung mit dem unbekannten Parameter A. Wir ermitteln einen Schdtzwert 1 fur diesen Parameter anhand der folgenden Stichprobe (8 Elemente wurden zufiillig entnommen und die jeweilige Lebensdauer t i in Stunden (h) bestimmt):
i ti
-
h
1
2
3
4
5
6
7
8
950
980
1150
770
1230
1210
990
1120
Die Stichpro be ergibt den M ittelwert
_ 1 t = 8·
1
I
8
tj =
8 (950 + 980 + ... + 1120)h =
1050 h
i= 1
Somit ist ~
1 t
1 1050 h
1 1050
A == -=- == - - == - - h -1
~
000095 h- 1 '
ein Schdtzwert fiir den unbekannten Parameter A der zugrunde gelegten Exponentialverteilung. Die mittlere Lebensdauer der elektronischen Bauelemente betragt daher ndherungsweise E(T) ~ t == 1050 h. (2)
Es solI der AusschujJanteil p einer Serienproduktion von Gliihbirnen mittels einer Stichprobenuntersuchung geschdtzt werden. Aus diesemGrunde wurde eine Stichprobe von n == 300 Stiick entnommen.wobeisich k == 6 Gliihbirnen als defekt erwiesen. Somit ist ~
p
k
6
== ~ == 300 == 0,02 == 2%
ein Schdtzwert fur den (unbekannten) AusschuBanteil pin der Gesamtproduktion.
•
3.3 Ein Verfahren zur Gewinnung von Schatzfunktionen Es gibt eine Reihe von Verfahren zur Gewinnung von Schdtzfunktionen fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung. Das wohl bedeutendste Verfahren ist die sog. Maximum-Likelihood-Methode, mit der wir uns in diesem Abschnitt ausschlieBlich beschaftigen werden.
498
III Grundlagen der mathematischen Statistik
3.3.1 Maximum-Likelihood-Methode Wir gehen zunachst von den folgenden Ubcrlcgungen aus: X sei eine diskrete Zufallsvariable, deren Wahrscheinlichkeitsfunktion f (x) noch einen unbekannten Parameter 9 enthalte, der aus einer Zufallsstichprobe mit n voneinander unabhangigen Stichprobenwerten Xl' X 2, ... , x; geschiitzt werden solI. Die Zufallsvariable X nimmt dabei die einzelnen Stichprobenwerte mit den folgenden Wahrscheinlichkeiten an:
Wegen der Unabhiingigkeit der Stichprobenwerte ist nachdem Multiplikationssatz der Wahrscheinlichkeitsrechnung (Kapitel II, Abschnitt 3.5 bzw. 3.6) die Wahrscheinlichkeit dafiir, eine Stichprobe zu erhalten, die gerade die speziellen Werte Xl' X 2, ... , x; enthalt, durch das Produkt (111-47) gegeben. Diese Funktion hangt somit von den n Variablen (Stichprobenwerten) Xl' X 2, ... 'X n ab, zusiitzlich aber auch noch von dem unbekannten Parameter 9 der Wahrscheinlichkeitsfunktion f (x) 14). Fur eine vorgegebene konkrete Stichprobe (d.h. fur feste Werte Xl' X 2' ... , X n ) kann daher L als eine nur vom Parameter 9 abhangige Funktion betrachtet werden. Man bezeichnet diese Funktion als Likelihood-Funktion und schreibt dafiir symbolisch (111-48) Der Parameter 9 wird nun so bestimmt, daB diese Funktion einen moglichst grojJen Wert annimmt. Wir unterstellen somit, daB die vorgegebene Stichprobe unter allen denkbaren (moglichen) Stichproben mit der grojJten Wahrscheinlichkeit auftritt. Man erhalt auf diese Weise einen Schiitzwert § fur den unbekannten Parameter 9. Er laBt sich leicht aus der fur ein (relatives) Maximum notwendigen Bedingung
oL
-=0
09
(111-49)
ermitteln und ist dabei durch die n Stichprobenwerte Xl' X 2, ... , x; eindeutig bestimmt 15). Im FaIle einer stetigen ZufaIlsvariablen X muB die Likelihood-Funktion (111-48) mit der entsprechenden Dichtefunktion f (x; 9) gebildet werden, die dann ebenfalls noch von einem unbekannten Parameter 9 abhangt.
14)
Der Wert der Wahrscheinlichkeitsfunktion hangt formal von x und 9 abo Wir schreiben daher ab sofort (x; 9) anstatt von f (x). Die Likelihood-Funktion L = L(9) hangt (formal betrachtet) auch noch von den n Stichprobenwerten Xl' X 2' .,., X n ab, die jedoch bei der Bildung der Ableitung als feste GraBen angesehen werden. Wir schreiben daher die Ableitung von L nach dem Parameter 9 als partielle Ableitung.
f 15)
3 Parameterschatzungen
499
Wir fassen diese Ergebnisse wie folgt zusammen:
Anmerkungen
(1)
Wir verweisen nochmals (urn Milrverstandnisse und Verwechslungen zu vermeiden) auf die unterschiedliche Bedeutung der folgenden Symbole: 9: Unbekannter Parameter
(2)
9:
Schdtzwert fur den unbekannten Parameter 9
e:
Schdtzfunktion (Stichprobenfunktion) fur den unbekannten Parameter 9, die fur jede konkrete Stichprobe einen Schatzwert 9 liefert
Man beachte die Bedeutung der Faktoren f (Xi; 9) in der Likelihood-Funktion (III-50):
? Wahrscheinlichkeitsfunktion bei einer diskreten Zufallsvariablen X
f(x;9)
~
Dichtefunktion bei einer stetigen Zufallsvariablen X
500 (3)
III Grundlagen der mathematischen Statistik Enthalt die Wahrscheinlichkeits- bzw. Dichtefunktion mehrere unbekannte Parameter 9 1 , 9 2 , ... , 9 n so hangt auch die zugehorige Likelihood-Funktion noch von diesen Parametern ab: (III-54) Die Schdtzwerte 91 , 92 , ... , 9r fur die Parameter werden dann aus den fur ein Maximum notwendigen Bedingungen
oL
09
= 1
0,
oL
as- = 0, 2
oL
. . . '09 = r
°
(III -55)
ermittelt. Man erhalt auf diese Weise ein Gleichungssystem mit r Gleichungen und ebenso vielen Unbekannten, aus dem sich dann die'Schiitzwerte fur die unbekannten Parameter in Abhangigkeit von den n Stichprobenwerten Xl' x 2 , .•. , x, berechnen lassen (Maximum-Likelihood-Schiitzfunktionen bzw. Schiitzwerte). (4)
Die Berechnung der Schatzwerte fur die unbekannten Parameter laBt sich meist wesentlich vereinfachen, wenn man die fur das gesuchte Maximum notwendigen Bedingungen auf die logarithmierte Likelihood-Funktion (III-56) anwendet. Dies ist erlaubt, da In L eine streng monoton wachsende Funktion von L ist und somit genau dort ein Maximum annimmt, wo L selbst maximal wird. Die notwendigen Bedingungen lauten dann wie folgt:
o
-(lnL) = 0,
09 1
o
--n-(lnL) = 0, 0l1'2
o
,--n(ln L) = Ol1'r
°
(III-57)
Regel: Die Likelihood-Funktion wird zunachst logarithmiert und dann nach den einzelnen Parametern 9 1 , 9 2 , ... , 9 r partiell differenziert. Diese Ableitungen werden schlieBlich alle gleich Null gesetzt. Aus dem erhaltenen Gleichungssystem lassen sich dann die unbekannten Parameter (naherungsweise) berechnen.
3.3.2 Anwendungen auf spezielle Wahrscheinlichkeitsverteilungen. 3.3.2.1 Binomialverteilung Bei einem Bernoulli-Experiment trete das Ereignis A mit der unbekannten Wahrscheinlichkeit p ein. Bei einer n-fachen Ausfiihrungdieses Experiments ist die Wahrscheinlichkeit dafiir, daB dabei genau x-mal das Ereignis A eintritt, durch die Wahrscheinlichkeitsfunktion (x = 0, 1, ... , n)
(III -58)
3 Parameterschatzungen
501
der diskreten Binomialverteilung gegeben. Urn den Wert des unbekannten Parameters p, haufig auch Anteilswert oder Erfolgswahrscheinlichkeit genannt 16), abzuschatzen, entnehmen wir der Grundgesamtheit wie folgt eine Stichprobe vom Umfang n: Das Bernoulli-Experiment wird n-mal unabhangig voneinander ausgefuhrt, wobei genau k-mal das Ereignis A ("Erfolg") und somit (n - k)-mal das komplementdre Ereignis A ("MiBerfolg") eintrete. Da das Ereignis A dabei jeweils mit der Wahrscheinlichkeit p, das komplementare Ereignis A jeweils mit der Wahrscheinlichkeit q = 1 - p eintritt, ist die Gesamtwahrscheinlichkeit fur k-mal .Erfolg" (Ereignis A) und (n - k)-mal "MiBerfolg" (Ereignis A) durch das Produkt pk «' = pk (1 _ p)n-k
(III-59)
gegeben. Dieser Ausdruck liefert zugleich die benotigte Likelihood-Funktion, die somit die folgende Gestalt besitzt: (111-60) (n und k sind dabei als feste Werte anzusehen). Zweckmalligerweise gehen wir nun zur logarithmierten Likelihood-Funktion L* = In Luber: (III -61)
Durch Anwendung elementarer logarithmischer Rechenregeln erhalten wir hieraus: L* = In o" + In (1 -
w:: = k . In p + (n -
k) . In (1 - p)
(111-62)
Wir differenzieren diese Funktion nun partiell nach dem Parameter p:
aL* = -a [k . In p + (n ap ap
-
k) . In (1 - p)] =
1 1 k n-k - - -p l-p p l-p
= k . - + (n - k) . - - . (- 1) =
(111-63)
Die notwendige Bedingung (III-51) bzw. (III-57) fur das gesuchte Maximum lautet daher: k
n-k
-;---,,=0 p 1- p
(111-64)
Durch Auflosen dieser Gleichung nach p erhalten wir fur den unbekannten Parameter p der Binomialverteilung den folgenden Ndherungs- oder Schdtzwert: " k p=n
(111-65)
Dieser Schatzwert ist somit nichts anderes als die empirisch bestimmte relative Hiiufigkeit p(A) des Ereignisses A bei einer n-fachen Ausfuhrung des Bernoulli-Experiments.
16)Wiederum gilt: Eintreten des Ereignisses A bedeutet Erfolg, Eintreten des komplementdren Ereignisses A daher Mif3erfolg.
III Grundlagen der mathematischen Statistik
502
Die zugehorige Schdtzfunktion ist die bereits aus Abschnitt 3.2.5 bekannte Stichprobenfunktion ~ X P=-
(111-66)
n
(die Zufallsvariable X beschreibt dabei die Anzahl der .Erfolge" bei einer n-fachen Ausfuhrung des Bernoulli-Experiments).
•
Beispiel
Urn den Ausschuj3anteil p in der Tagesproduktion von Gliihbirnen zu schatzen, wurde eine Stichprobe vom Umfang n = 120 entnommen. Dabei erwiesen sich k = 6 Gliihbimen als nicht brauchbar. Die Maximum-Likelihood-Methode liefert dann fiir den AusschuBanteil p den folgenden N dherungs- oder Schdtzwert: A
k
6 1 = 120 20
p = - = -
n
=
005 = 5%
'
Wir konnen somit davon ausgehen, daB im Mittel jede zwanzigste Gliihbirne in der Tagesproduktion unbrauchbar ist.
•
3.3.2.2 Poisson-Verteilung
Die Zufallsvariable X geniige einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion (x
= 0, 1, 2, ...)
(111-67)
Der unbekannte Parameter (Mittelwert) f.11aBt sich dann aus einer konkreten Stichprobe vom Umfang n mit den Stichprobenwerten Xl' x 2 , ••• , X n nach der Maximum-LikelihoodMethode wie folgt schatzen: Zunachst stellen wir die Likelihood-Funktion auf:
(111-68)
3 Parameterschatzungen
503
Durch Logarithmieren unter Verwendung elementarer Rechenregeln fur Logarithmen wird daraus:
(111-69) Die benotigte partielle Ableitung von L* nach dem Parameter f.llautet damit:
(111-70) Die fur das gesuchte Maximum notwendige Bedingung (III-51) bzw. (III-57) fiihrt damit auf die Gleichung
(111-71) aus der wir dann den folgenden Maximum-Likelihood-Schdtzwert fur den unbekannten Mittelwert f.l erhalten: A
f.l=
Xl
+
Xl
+ ... + n
Xn
-
(111-72)
=x
Der Schdtzwert {t erweist sich dabei als der Mittelwert f.l ~ {t
•
=
x.
x der
vorgelegten Stichprobe:
Beispiel Beim natiirlichen radioaktiven Zerfall zerfallen die Atomkerne vollig regellos und unabhdngig voneinander nach den Gesetzmalrigkeiten der mathematischen Statistik. Die Zufallsvariable
x
= Anzahl der Atomkerne, die in einem bestimmten Zeitintervall
At zerfallen
geniigt dabei naherungsweise einer Poisson- Verteilung mit der Wahrscheinlichkeitsfunktion (x = 0, 1, 2, ...)
Der noch unbekannte Parameter f.l beschreibt dabei die mittlere Anzahl der im (festen)Zeitintervall At stattgefundenen Zerfallc,
504
III Grundlagen der mathematischen Statistik In einem Experiment wurde in n == 200 aufeinander folgenden Zeitintervallen einer bestimmten (hier nicht naher interessierenden) Lange Llt die jeweilige Anzahl der zerfallenen Atomkerne eines speziellen radioaktiven Praparates mit einem Zahlgerat gemessen. Es ergab sich dabei das folgende MeBprotokoll (es wurden bis zu 10 Zerfalle pro Zeitintervall Llt gemessen):
4
0
16
16
2
31
62
3
40
120
4
38
152
5
33
165
6
19
114
7
10
70
8
5
40
9
3
27
0
10
10
Der M ittelwert dieser Stichprobe betragt somit
x=
1 200'
10.
Ln
i Xi
=
776 200 = 3,88
i=O
und ist zugleich ein N dherungs- oder Schdtzwert fur den unbekannten Parameter (Mittelwert) f.l der Poisson-verteilten Grundgesamtheit: fl ~ {t
==
x == 3,88
Somit zerfallen im Zeitintervall Llt durchschnittlich 3,88 Atomkerne.
•
505
3 Parameterschatzungen 3.3.2.3 Gau6sche Normalverteilung
Die unbekannten Parameter J.l und Dichtefunktion
(J
einer normalverteilten Grundgesamtheit mit der
(111-73) konnen nach dem Maximum-Likelihood-Prinzip aus einer konkreten Stichprobe vom Umfang n mit den Stichprobenwerten Xl' x 2 , , x; wie foIgt geschatzt werden: Wir stellen zunachst die Likelihood-Funktion L = L(J.l; (J) auf: L
= L(J.l; (J) = f = [
(Xl;
u; (J) --- f (x,; u; oJ =
~ . (J .e - (X~~/)] ... [ ~ .(J .e _(X;~/)] = (x
=(~'(J)"'(~'(J)-e- ~~2
(x, -
fl)2
"'e-
fl)2
2T
(111-74)
Der besseren Ubersicht wegen haben wir dabei die foigende (vorubergehende) Abkiirzung eingefiihrt: n
rx
= (Xl -
flf
+ ... + (x n -
fl)2
=
I
(111-75)
(Xi - fl)2
i= 1
Durch Logarithmierung der Likelihood-Funktion erhalten wir dann:
= - n -ln (J2;c -(J) - ~ = ~ n -In J2;c - n -In (J - ~ = 2(J2
2(J2
(111-76)
506
III Grundlagen der mathematischen Statistik
Die benotigten partiellen Ableitungen 1. Ordnung dieser Funktion lauten dann: n
oL*
1
o,u
2 (J2
n
1 ~ 2(x i-,u)·(-1)=-· ~ (xi-,u) L (J 2 L
-= --'
i = 1
(111-77)
i = 1
(111-78)
Die notwendigen Bedingungen (III-57) fur das gesuchte Maximum der Likelihood-Funktion fiihren damit zu dem folgenden Gleichungssystem: n
1
82
~
L (Xi -
'
A
,u) = 0
i= 1
(111-79)
Aus der ersten Gleichung folgt unmittelbar n
I
n
n
A)
(Xi -
i=l
=
I
Xi -
i=l
I
i=l
n
{1
=
I
Xi -
n {1 = 0
(111-80)
i=l
und somit
{1
=
n
I
~. i
Xi = X
(111-81)
== 1
Die Maximum-Likelihood-Schdtzung fur den Mittelwert J1 fiihrt somit auf den Mittelwert x der Stichprobe: u ~ A= x. Die zugehorige Schdtzfunktion ist die bereits aus Abschnitt 3.2.3 bekannte Stichprobenfunktion (111-82)
Einen Schdtzwert fur die Varianz (J2 der normalverteilten Grundgesamtheit erhalten wir aus der zweiten der Gleichungen (111-79) unter Berucksichtigung von A= x:
(rz=~.
n
I
(Xi -
X)2
i= 1
Die dieser Schatzung zugrundeliegende Maximum-Likelihood-Schiitzfunktion
(111-83)
507
3 Parameterschatzungen
S*2 =
n
I
~.
(111-84)
(Xi - X)2
i= 1
ist jedoch nicht erwartungstreu. Sie unterscheidet sich von der in Abschnitt 3.2.4 angegebenen erwartungstreuen Schatzfunktion S2 urn einen konstanten Faktor. Es gilt: 2 n- 1 2 S* =--'S
(III-85)
n
Fur groj3es n ist jedoch ndherungsweise S * 2 = S 2.
•
Beispiel X sei eine normalverteilte Zufallsvariable mit "den unbekannten Parametern f1 und (J (bzw. (J2), deren Werte aus der folgenden Stichprobe vom Umfang n = 10 mit Hilfe der M aximum-Likelihood-Schiitzfunktionen geschatzt werden sollen: StichprobenNr.i
1
2
3
4
5
6
7
8
9
10
Xi
248
250
251
251
247
252
248
250
248
255
Die Schdtzwerte (L und 8 2 lassen sich dann unter Verwendung der nachfolgenden Tabelle leicht berechnen:
248
-2
4
2
250
0
0
3
251
4
251
5
247
-3
9
6
252
2
4
7
248
-2
4
8
250
0
0
9
248
-2
4
10
255
5
25
III Grundlagen dermathematischen Statistik
508
Schdtzwert fur den M ittelwert J.1:
I
10
J.1 ~
1 J.1 == x == _. 10 A
-
i
=
1 x. == -·2500 == 250 I 10 1
Schdtzwert fur die Varianz (J 2: 10
(J2
~ 8 2 == ~. ~ L
10
i
(x. I
X)2
==
~ . 52 == 5 2
10
'
=1
Die Stichprobenwerte entstammen somit einer normalverteilten Grundgesamtheit mit dem Mittelwert J.1 ~ 250 und der Varianz (J2 ~ 5,2.
•
3.4 Vertrauens- oder Konfidenzintervalle fur die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Intervallschatzungen") 3.4.1 Vertrauens- oder Konfidenzintervalle und statistische Sicherheit In den vorangegangenen Abschnitten haben wir uns ausfiihrlich mit der ndherungsweisen Berechnung (Schiitzung) der unbekannten Parameter einer Wahrscheinlichkeitsverteilung beschaftigt und gezeigt, wie man aus einer konkreten Stichprobe mit Hilfe geeigneter Schatzfunktionen N dherungs- oder Schdtzwerte fur die betreffenden Parameter erhalt. Diese sog. Punktschdtzung ermoglicht jedoch keinerlei Aussagen iiber die Genauigkeit und Sicherheit der Schdtzung. Der aus einer Zufallsstichprobe gewonnene Schatzwert fur einen Parameter kann namlich noch erheblich vom tatsdchlichen (aber unbekannten) Wert abweichen, insbesondere bei kleinem Stichprobenumfang. Wir wollen uns daher im folgenden mit diesem wichtigen Thema naher auseinandersetzen. Die konkrete Fragestellung lautet dabei: Wie genau und sicher sind die aus Stichprobenuntersuchungen mit Hilfe von Schdtzfunktionen bestimmten N dherungs- oder Schatzwerte fur die unbekannten Parameter? Es liegt daher nahe, anhand einer konkreten Stichprobe ein Intervall [cu ; co] zu bestimmen,das den unbekannten Parameter mit Sicherheit enthalt (Bild 111-16):
Parameter 19
Zahlengerade
Bild 111-16 Interval!
fcu ; col
3 Parameterschatzungen
509
Ein solches Intervall kann es jedoch nicht geben, da absolut sichere Riickschliisse von einer Zufallsstichprobe auf die zugehorige Grundgesamtheit grundsatzlich nicht moglich sind 17). Auch der Versuch, ein Intervall [cu ; co] anzugeben, das den unbekannten Parameter 9- mit einer grojJen Wahrscheinlichkeit y enthalt, muB scheitern (0 < y < 1). Denn die Aussage (111-86)
("der Parameter 9-liegt zwischen den Schranken Cu und co") ist entweder richtig, dann aber gilt Pte; ~ 9- ~ co) = 1
(111-87)
oder sie ist falsch. In diesem Fall gilt Pic; ~ 9- ~ co) = 0
(111-88)
Der Fall (111-89)
mit 0 < y < 1 ist somit nicht moglichl Diese Uberlegungen zwingen uns nun, wie folgt vorzugehen: Wir bestimmen zwei ZufallsgrojJen e u und eo so, daB sie mit einer beliebig gewahlten, aber grojJen Wahrscheinlichkeit y Werte annehmen, die den wahren, aber unbekannten Parameterwert 9- einschliefien 18). Somit gilt (111-90)
Die Werte der beiden Zufallsvariablen e u und eo miissen sich dabei aus den Stichprobenwerten Xl' X 2, ... , x; einer vorgegebenen .konkreten Stichprobe berechnen lassen und variieren daher von Stichprobe zu Stichprobe. Die Zufallsvariablen e u und eo sind demnach Stichprobenfunktionen der n unabhdngigen Zufallsvariablen Xl' X 2' ... , X n» die alle die gleiche Verteilungsfunktion besitzen wie die Zufallsvariable X. Sie sind zugleich auch Schdtzfunktionen des Parameters 9. Sind die beiden Stichproben- oder Schdtzfunktionen (111-91)
und (111-92)
bekannt 19), so erhalt man aus einer konkreten Stichprobe vom Umfang n durch Einsetzen der Stichprobenwerte Xl' X 2, ... , x; in diese Funktionen zwei Werte c; und co: 17)
Von den trivialen Fallen wird abgesehen. Dazu zahlen wir Aussagen wie die folgenden: - .Der Parameterwert 9- liegt zwischen - 00 und + 00" - "Die Erfolgswahrscheinlichkeit p bei einem Bernoulli-Experiment liegt zwischen und 1"
18)
Man wahlt in der Praxis meist y = 0,95 oder y = 0,99, manchmal auch y
°
19)
=
0,999.
e u und eosind die Grenzen des Zufallsintervalls [e u ; eo], das den Parameter 9- mit der Wahrscheinlichkeit y iiberdeckt. Die Wahl der verwendeten Stichprobenfunktionen e u und eo wird in den nachsten Abschnitten am jeweiligen konkreten Problem naher erlautert.
510
III Grundlagen der mathematischen Statistik (III -93)
Sie bilden die Grenzen eines Intervalls, das in der Statistik als Vertrauens- oder Konfidenzintervall fur den unbekannten Parameter 9 bezeichnet wird. Die Intervallrandpunkte c; und Co heiBen daher auch Vertrauens- oder Konfidenzgrenzen (Bild 111-17) 20). ~ Vertrauensgrenzen
t Zahlengerade
Vertrauensintervall
~I
Bild 111-17 Vertrauens- oder Konfidenzintervall
Das aus der konkreten Stichprobe bestimmte Vertrauensintervall c; ~ 9 ~ Co ist eine Realisierung des Zufallsintervalls mit den Grenzen e u und eo. Die vorgegebene Wahrscheinlichkeit y heiBt in diesem Zusammenhang auch statistische Sicherheit oder Vertrauens- oder Konfidenzniveau. a = 1 - y ist die sog. Irrtumswahrscheinlichkeit. Das vor der Stichprobenuntersuchung gewahlte Vertrauensniveau y = 1 - a ist somit die Wahrscheinlichkeit dafiir, aus einer konkreten Zufallsstichprobe ein Vertrauens- oder Konfidenzintervall zu erhalten, das den wahren (aber unbekannten) Parameterwert 9 enthdlt. Man wird daher fur grojJes y (d. h. fur y = 0,95 oder y = 0,99 oder ahnlichc Werte) meist eine richtige Entscheidung treffen. Die statistische Sicherheit y = 1 - a kann namlich wie folgt sehr anschaulich gedeutet werden: Da die Intervallgrenzen (Vertrauensgrenzen) c; und Co noch von den Stichprobenwerten Xl' X 2 , •.. , x; abhangen und sich somit von Stichprobezu Stichprobe verdndern, erhalten wir fur jede Zufallsstichprobe ein etwas anderes Vertrauensintervall. Von 100 Vertrauensintervallen fur den unbekannten Parameter 9, die aus ebenso vielen Zufallsstichproben ermittelt wurden, enthalten dann ungefahr y . 100 Intervalle den wahren Parameterwert und nur ca. a . 100 dieser Vertrauensintervalle werden diesen Wert nicht enthalten. Mit anderen Worten: In rund y . 100 Fallen wird eine richtige und in rund a . (100 Fallen eine falsche Entscheidung getroffen. Die Bestimmung eines Vertrauensintervalls fur einen unbekannten Parameter 9 ist dabei nur moglich, wenn die Verteilungsfunktion der verwendeten Schatzfunktion fur 9 bekannt ist. Die Vertrauensgrenzen c; und Co lassen sich dann fur ein vorgegebenes Vertrauensniveau y = 1 - a aus der Bedingung (111-90) und unter Verwendung einer konkreten Stichprobe berechnen. Wie man in einem konkreten Fall ein Vertrauensintervall bestimmt, werden wir in den nachsten Abschnitten fur die Parameter jl und (52 einer Normalverteilung und den Parameter p einer Binomialverteilung noch ausfiihrlich zeigen.
20)
Die Stichprobenfunktionen
e
u
und
eo sind somit Schdtzfunktionen fiir die beiden Vertrauensgrenzen.
3 Parameterschatzungen
511
Zu beachten ist ferner, daB die Vertrauensgrenzen c; und Co nicht nur von den Stichprobenwerten Xl' X 2, •.. , x; abhangen, sondern auch noch von dem gewahlten Vertrauensniveau » == 1 - a. Dabei gilt: Je grafter)', umso ldnger (breiter) werden die Vertrauensintervalle. Mit anderen Worten: Will man eine grofte statistische Sicherheit )' (und somit eine geringe Irrtumswahrscheinlichkeit a) erreichen, so IDuB man dafiir ein relativ breites Vertrauensintervall in Kauf nehmen (Bild 111-18). Die Lange 1 == Co - c; des Vertrauensintervalls ist dann ein MaB fur die Genauigkeit der Parameterschatzung und verringert sich mit zunehmendem Stichprobenumfang n. Welches Vertrauensniveau in der Praxis gewahlt wird, muB dabei einzig und alleine am konkreten Problem entschieden werden. Wir fassen die wichtigsten Ergebnisse wie folgt zusammen:
512
III Grundlagen der mathematischen Statistik
I~
Vertrauensintervall tiir Y= 0,99
-----1-----+-----+-----+-------Zahlengerade
Vertrauensintervall fOr Y= 0,95
Bild 111-18 Die Vertrauensintervalle werden mit zunehmender statistischer Sicherheit y immer breiter
Anmerkung
Wir konnen somit davon ausgehen, daB die aus einer langen Serie von Zufallsstichproben ermittelten Vertrauensintervalle in etwa y . 100% aller Falle den unbekannten Parameter 9 enthalten und nur in etwa a . 1000/0 aller Falle diesen Parameter nicht enthalten. Wir treffen daher in y . 100% aller Falle eine richtige Entscheidung. •
Beispiel
Wir wahlen in einem konkreten Anwendungsfall ein Vertrauensniveau von y = 0,95 = 95%. Entnimmt man der betreffenden Grundgesamtheit 100 (voneinander unabhangige) Stichproben, so konnen wir darauf vertrauen, daB in etwa 95 Fallen der unbekannte Parameter 9 in das zugehorige Vertrauensintervall fallt und nur in etwa 5 Fallen auflerhalb des Vertrauensintervalls liegt. Die Irrtumswahrscheinlichkeit ist somit a = 1 - y = 1 - 0,95 = 0,05 = 5%. Wir treffen somit in etwa 95 Fallen eine richtige und in etwa 5 Fallen eine falsche Entscheidung.
• 3.4.2 Vertrauensintervalle fiir den unbekannten Mittelwert Jl einer Normalverteilung bei bekannter Varianz (12 Wir gehen von einer normalverteilten ZufaIlsvariablen X mit dem unbekannten Mittelwert (J 2 aus. Unter Verwendung einer konkreten Stichprobe Xl' X 2, ... , x; solI dann auf dem vorgegebenen Vertrauensniveau y = 1 - a das zugehorige Vertrauens- oder Konfidenzintervall fur den unbekannten Mittelwert J1 bestimmt werden. Als Schdtzfunktion fur den Mittelwert J1 verwenden wir die bereits aus Abschnitt 3.2.3 bekannte Stichprobenfunktion
J1 und der als bekannt vorausgesetzten Varianz
X =_X_l_+_X_ .._._+_X_n 2 _+_ n
1 n
n
(111-99)
X ist dabei bekanntlich eine normalverteilte ZufalIsvariable mit dem Mittelwert E (X) = J1 und der Varianz Var(X) = (J2 In (vgl. hierzu Abschnitt 3.2.2).
3 Parameterschatzungen
513
Dann ist die zugehorige standardisierte Zufallsvariable
x-
jl
(111-100)
U==--
(J/~
standardnormalverteilt (Mittelwert E(U) == 0; Varianz Var(U) == 1). Fur U und somit auch fur X HiBt sich schrittweise wie folgt ein Vertrauensintervall konstruieren: (1)
Wir wahlen zunachst ein bestimmtes Vertrauensniveau y == 1 - a (0 < y < 1). In den technischen Anwendungen iibliche Werte sind: y == 0,95 == 950/0 oder y == 0,99 == 99%. a ist dabei die Irrtumswahrscheinlichkeit.
(2)
Die ZufalIsvariable U solI dann mit der gewahlten Wahrscheinlichkeit y == 1 -a einen Wert aus dem symmetrischen Intervall - c ~ U ~ c annehmen (Bild 111-19). Somit gilt: P( - c
~
U
~
c) == y
== 1 - a
(III -101)
Den zugehorigen Wert fur die Schranke c entnehmen wir der Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung).
-c
o
c
u
Vertrauensintervall fur das Vertrauensniveau Y= 1-a
Bild 111-19 Zur Berechnung der Schranke c (die hellgrau unterlegteFlache entspricht dem gewahlten Vertrauensniveau y = 1 - a; die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit «)
(3)
Unter Verwendung der Beziehung (111-100) konnen wir das Intervall - c auch in der Form
~
U
~
c
(111-102) darstellen.
514
III Grundlagen der mathematischen Statistik Mit Hilfe elementarer algebraischer Umformungen HiBt sich hieraus schlieBlich eine Ungleichung fur den unbekannten Mittelwert f1 wie folgt herleiten:
x-
u
mit ~ multiplizieren
-c~--~c
(J/~
~
mit -1 multiplizieren
Seiten verta uschen
X addieren (J (J X-c-·~IJ~X+c-
(111-103)
~
.,'::
Die Bedingung (111-101) geht damit iiber in -
(J
(J)
-
P ( X-C~~f1~X+c~ =y=l-(J. '-v-"
'-v-"
eu
eo
(111-104)
oder
p(e u ~ f1
~
eo) == y ==
(111-105)
1- a
Die Zufallsvariablen -
e
(J
==X-c-
und
~
u
-
(J
eo ==X + c -
yf;z
(111-106)
sind dabei Schdtzfunktionen fur die gesuchten Vertrauensgrenzen c; und co. (4)
Die Berechnung dieser Vertrauensgrenzen erfolgt dann anhand einer konkreten Stichprobe Xl' X 2, ... , X n , in dem man in die Schatzfunktionen e u und eo fur X den aus der Stichprobe Xl' X 2, ... , X n berechneten Mittelwert Xeinsetzt. Das Vertrauensintervall fur den unbekannten Mittelwert f1 der normalverteilten Grundgesamtheit lautet damit wie folgt: _
(J
_
(J
(111-107)
x-c ~~f1~x+c~
Dieses Intervall mit den beiden Grenzen (Vertrauensgrenzen) c == u
_ X -
(J
c~
_
und
Co
==
X
(J
+ c~
(111-108)
3 Parameterschatzungen
515
und der Lange 1 = 2 C (J / yf;z enthalt dann mit einem Vertrauen von y . 100 % den wahren (aber unbekannten) Wert des Mittelwertes J1 (Bild 111-20).
Wir fassen dieses wichtige Ergebnis wie folgt zusammen:
III Grundlagen der mathematischen Statistik
516
-
-
x
Cu 4
1= 2c(J'
vn
1
X
Co
~I
Bild 111-20 Vertrauensintervall fur den unbekannten Mittelwert 11 einer N ormalverteilung (bei bekannter Varianz (J 2)
Anmerkungen (1) Bei vielen MeBinstrumenten, Maschinen und Automaten wird die Varianz reits vom Hersteller also eine Art Gerdtekonstante mitangegeben.
0'2
be-
(2)
Haufig wird auch die Irrtumswahrscheinlichkeit a vorgegeben (meist a == 0,05 == 5% oder a == 0,01 == 1 %). Das Vertrauensniveau oder die statistische Sicherheit ist dann y == 1 - a.
(3)
Das Vertrauensintervall besitzt die Lange [== 2 c a/j";z und. hangt somit noch von derStandardabweichung a, dem Stichprobenumfang nund dem Vertrauensniveau y == 1 - a ab (Bild 111-21) 21). Fur feste Werte von a und y gilt daher: 1
[r-..;-
(111-112)
j";z Dies aber bedeutet, daB eine Verkiirzung des Vertrauensintervalls stets durch eine entsprechende VergrojJerung des Stichprobenumfangs n erreicht werden kann.
r--
Vertrauensgrenzen ~
Zahlengerade
Bild 111-21
21)
Die aus Gleichung (III -109) berechnete Konstante c ist namlich noch von. dem gewahlten Vertrauensniveau y abhangig,
517
3 Parameterschatzungen •
Beispiele (1)
Die Ldngenmessung von 10 Schrauben, die nach dem Zufallsprinzip aus einem bestimmten Sortiment ausgewahlt wurden, fiihrte zu dem folgenden Ergebnis: i -
Xi
mm
1
2
3
4
5
6
7
8
9
10
10
8
9
10
11
11
9
12
8
12
Wir setzen dabei voraus, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit mit der Varianz (J2 =:= 4 mm" stammt und wollen fur den unbekannten M ittelwert u ein Vertrauensintervall zum Vertrauensniveau y == 0,95 == 95% bestimmen. Dabei gehen wir schrittweise wie folgt vor: 1. Schritt: Das Vertrauensniveau y ist bereits vorgegeben: y
==
0,95.
2. Schritt: Die Bestimmungsgleichung fur die Konstante c lautet damit (Bild 111-22):
Bild 111-22
o
-c
P(-c
~
U
~
u
c
c) == 0,95
Daraus folgt dann weiter: P( - c ~ U ~ c) == ¢(c) - ¢( - c) == ¢(c) - [1 - ¢(c)] == ==
2 . ¢ (c) - 1 == 0,95
Aus Tabelle 2 im Anhangerhalten wir schlieBlich: ¢(c) == 0,975
~
c
==
U O,975
==
1,960
Die gesuchte Konstante (Schranke) c ist somit das Quantil dardnormalverteil ung. 3. Schritt: Wir berechnen den Mittelwert
1 x == _ . 10
10
~
L
i= 1
1 (10 + 8 + 9 10
Xi == -
x der
U O,975
der Stan-
Stichprobe und erhalten:
+ ... + 12) mm
==
10 mm
III Grundlagen der mathematischen Statistik
518
4. Schritt: Mitn = 10, X = 10 mm und (J" = 2 mm berechnen wir zweckmalsigerweise zunachst die folgende Hilfsgrofie: (J" 2mm k = c= 1 960 . - - = 1 240 mm ~
,
J10
'
Das Vertrauensintervall fur den M ittelwert J1 der normalverteilten Grundgesamtheit .lautet damit:
(10 - 1,240) mm
~
J1
~
(10 + 1,240) mm
Wir konnen daher mit einem Vertrauen von 95% davon ausgehen, daB der wahre Wert von J1 in diesem Intervall der Lange 1 = 2 k = 2,480 mm liegt (Bild 111-23).
Bild 111-23
-
8,760
(2)
10
11,240
x
mm
Einer normalverteilten Grundgesamtheit mit der Varianz (J" 2 = 100 solI eine Stichprobe yom Umfang n entnommen werden. Wie groB muB man den Stichprobenumfang wahlen, damit das Vertrauensintervall fur den unbekannten Mittelwert J1 bei einem Vertrauensniveau von 'Y = 99% die Lange 1 = 2 besitzt?
Losung: Zunachst Iosen wir die Gleichung 1 = 2 c(J"/~ fur die Lange des Vertrauensintervalls nach n auf und erhalten:
Die noch unbekannte Konstante c laBt sich dabei aus der Bedingung P( - c
~
U
~
c) = 0,99
3 Parameterschatzungen
519
mit Hilfe der Tabelle 2 im Anhang wie folgt bestimmen (Bild III -24):
Bild 111-24
o
-c
P(-c
~
U
~
u
c
c) = cjJ(c) - cjJ(-c) = cjJ(c) - [1 - cjJ(c)] =
= 2 . cjJ(c) - 1 = 0,99 cjJ(c) = 0,995
~
c=
U O,995
= 2,576
Die gesuchte Konstante c ist somit das Quanti! U O,995 = 2,576 der Standardnormalverteil ung. Der gesuchte Stichprobenumfang betragt damit: 2C
0")2 = (2 . 2,576 . 10)2 = 25 76 2
n=(1
2
'
~
•
664
3.4.3 Vertrauensintervalle flir den unbekannten Mittelwert Jl einer Normalverteilung bei unbekannter Varianz (12 X sei eine normalverteilte Zufallsvariable mit dem unbekannten Mittelwert fJ und der ebenfalls unbekannten Varianz (J2. Anhand einer konkreten Stichprobe Xl' X 2 , ••• , x; solI fur ein (beliebig vorgegebenes) Vertrauensniveau y = 1 - rx das zugehorige Vertrauensoder Konfidenzintervall fur den unbekannten Mittelwert fJ der normalverteilten Grundgesamtheit bestimmt werden. Im Gegensatz zum vorangegangenen Abschnitt ist diesmal auch die Varianz (J2 und damit auch die Standardabweichung (J unbekannt. Bei der Herleitung eines Vertrauensintervalls fur den Mittelwert fJ muB daher die bisher verwendete standardnormalverteilte Zufallsvariable U = X - J1 durch die Zufallsgrolse
0"/0z
X-fJ
T=--
s/0z
(111-113)
ersetzt werden. S ist dabei die aus Abschnitt 3.2.4 bekannte Schatzfunktion fur die unbekannte Standardabweichung 0" der Grundgesamtheit. Es laBt sich zeigen, daB die Zufallsvariable T der t-Verteilung von Student mit f = n - 1 Freiheitsgraden geniigt. Die Grenzen des gesuchten Vertrauensintervalls miissen dabei so bestimmt werden, daB die Zufallsgrolse T mit der gewahlten Wahrscheinlichkeit y = 1 - rx Werte aus dem symmetrischen Intervall - c ~ T ~ c annimmt (Bild III -25).
III Grundlagen der mathematischen Statistik
520
Aus der Bedingung P( - c
~
T
~
c) == 'Y
==
1- a
(111-114)
HiBt sich dann die Schranke emit Hilfe von Tabelle 4 im Anhang leicht berechnen (Tabelle der Quantile der t-Verteilung). Wir erhalten damit das folgende Liisungsschema:
3 Parameterschatzungen
521
o
-c
Bild 111-25 Zur Berechnung der Schranke c (die hellgrau unterlegte Flache entspricht dem gewahlten Vertrauensniveau y = 1 - a, die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit (X)
c
Anmerkungen (1) Haufig wird auch die I rrtumswahrscheinlichkeit a vorgegeben (meist a = 0,05 = 5 0/0 oder a = 0,01 = 1 0/0). Das Vertrauensniveau oder die statistische Sicherheit ist dann y = 1 - a. (2) Das Vertrauensintervall besitzt die Lange 1 = 2 c s/~ und hangt somit noch von dem gewahlten Vertrauensniveau y = 1 - a, dem Stichprobenumfang n und der Standardabweichung s der Stichprobe ab (Bild 111-26). Fur feste Werte von y und s gilt somit: 1 It'o/-
(111-118)
~
Eine Verkiirzung des Vertrauensintervalls lafit sich daher stets durch eine entsprechende Vergrofierung; des Stichprobenumfangs n erreichen.
r-
Vertrauensgrenzen
I Zahlengerade
Bild 111-26
(3)
Bei unbekannter Varianz (J 2 sind die Vertrauensintervalle fur den Mittelwert J1 stets breiter als bei bekannter Varianz (bei gleichem Vertrauensniveau y und gleichem Stichprobenumfang n).
(4)
Bei umfangreichen Stichproben (Faustregel: n > 30) kann die unbekannte Standardabweichung (J der Grundgesamtheit durch die Standardabweichung s der Stichprobe geschdtzt werden: (J ~ s. In diesem Sonderfall darf man daher von einer normalverteilten Grundgesamtheit mit der bekannten Varianz (J2 ~ S2 ausgehen und das bereits im vorangegangenen Abschnitt 3.4.2 besprochene Verfahren zur Bestimmung eines Vertrauens- oder Konfidenzintervalls fur den M ittelwert J1 einer normalverteilten Grundgesamtheit anwenden 22).
22)
Wir erinnern: Die t- Verteilung von Student strebt fur n hierzu Kap. II, Abschnitt 8.2).
-+ CIJ
gegen die Standardnormalverteilung (vgl.
522 •
III Grundlagen der mathematischen Statistik Beispiel
Die Messung von 8 Widerstiinden, die rein zufallig einer laufenden Serienproduktion entnommen wurden, fiihrte zu dem folgenden MeBprotokoll: i Xi -
Q
1
2
3
4
5
6
7
8
100
104
98
96
101
104
98
99
Wir setzen dabei voraus, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, deren Mittelwert J1 und Varianz (J 2 beide unbekannt sind. Es solI ein Vertrauens- .oder Konfidenzintervall fur den M ittelwert J1 bestimmt werden. Wir losen die gestellte Aufgabe dann schrittweise wie folgt: 1. Schritt: Als Vertrauensniveau wahlen wir )' == 0,95. 2. Schritt: Die Bestimmungsgleichung fur die Konstante c lautet damit (Bild 111-27): P( - c
~
T
~
c) == 0,95
Bild 111-27
o
-c
c
Mit Hilfe von Tabelle 4 im Anhang erhalten wir hieraus fur f == n - 1 == 7 Freiheitsgrade den folgenden Wert fur c: P( - c
~
T
~
F(c) == 0,975
c) == F(c) - F( - c) == F(c) - [1 - F(c)] == 2 . F(c) - 1 == 0,95 f=7
c == t (0,97 5; 7) == 2,365
Die gesuchte Konstante c ist somit das Quantil t(0,975; 7) der t-Verteilung. 3. Schritt: Wir berechnen nun den Mittelwert
Stichprobe mit Hilfe der folgenden Tabelle:
x und die Standardabweichung s der
3 Parameterschatzungen
_
523
100
0
0
2
104
4
16
3
98
-2
4
4
96
-4
16
5
101
6
104
4
16
7
98
-2
4
8
99
-1
1 \
X =-'
8
i
1
= -·8000 = 1000 8
x.
/:
I
=1
1 S2 = _1_. \ (Xi _ X)2 = -7 .580 2 = 8,2860 2 8-1 i...J i
s=
R
=1
= )8,2860 2 = 2,8780
4. Schritt: Mit n = 8, c = 2,365 und s zunachst die folgende Hilfsgroj3e:
k = c-
s
= 2,878 0 berechnen wir zweckmalsigerweise
2,8780
= 2 365 . - - = 2406 0
J8
j;;'
'
Das Vertrauensintervall fur den unbekannten Mittelwert /1 der normalverteilten Grundgesamtheit lautet damit:
x-
k
(100 - 2,406) 0
~
/1
~
x -s-k
~
/1
~
(100 + 2,406) 0
Der wahre Wert von /1liegt daher mit einem Vertrauen von 95% in diesem Intervall der Lange I = 2k = 4,812 O.
•
524
III Grundlagen der mathematischen Statistik
3.4.4 Vertrauensintervalle fiir die unbekannte Varianz Normalverteilung
(12
einer
Urn die Gleichmafsigkeit eines Massenproduktes beurteilen zu konnen, benotigt man neben dem Mittelwert fl der interessierenden Zufallsgr6Be X noch zusatzliche Kenntnisse iiber deren Varianz (J 2, die ja als StreuungsmaB Aufschluf iiber die Groj3e der Schwankungen gibt, denen das Merkmal X unterworfen ist. Dieser Parameter ist jedoch in der Praxis oft unbekannt und muB daher geschdtzt werden. Ahnlich wie fiir den Mittelwert fllaBt sich auch fiir die Varianz (J2 einer normalverteilten Grundgesamtheit ein Vertrauens- oder Konfidenzintervall bestimmen. Beiunseren weiteren Uberlegungen gehen wir wiederum von einer normalverteilten Grundgesamtheit mit dem (bekannten oder unbekannten) Mittelwert fl und der unbekannten Varianz (J2 aus. Wir stellen uns dabei die Aufgabe,aus einer konkreten Zufallsstichprobe Xl' X 2, ... , X n ein Vertrauens- oder KonJidenzintervall fiir die unbekannte Varianz (J 2 zu bestimmen. Als Schdtzfunktion fiir die Varianz (J 2 verwenden wir die bereits aus Abschnitt 3.2.4 bekannte StichprobenJunktion S 2 und bilden mit ihr die Zufallsvariable (Stichprobenfunktion) S2 Z == (n - 1) (J2
(111-119)
die einerChi-Quadrat- Verteilung mit J == n - 1 Freiheitsgraden geniigt. Nach Vorgabe eines bestimmten Vertrauensniveaus y == 1 - a lassen sich dann zwei Schranken C l und C2 so bestimmen, daB diese Zufallsvariable mit der gewahlten Wahrscheinlichkeit y == 1 - a Werte aus dem Intervall C l ~ Z ~ C 2 annimmt. Die Berechnung der Intervallgrenzen erfolgt dabei aus der Bedingung
P (c 1 ~ Z
~ c 2) ==
Y == 1 - a
(111-120)
Der Flachenanteil der Irrtumswahrscheinlichkeit a wird dabei gleichmiij3ig auf beide Seiten der Dichtefunktion J (z) verteilt (Bild 111-28).
Bild 111-28 Zur Berechnung der Schranken c1 und c2 (die hellgraue Flache entspricht dem Vertrauensniveau y = 1 - If., die dunkelgraue der Irrtumswahrscheinlichkeit z)
Fiir die Intervallgrenzen C l und C 2 ergeben sich dann aus Bild 111-28 unmittelbar die folgenden Bestimmungsgleichungen:
(111-121)
P (Z
~
all c2) == F (c2) == 1 - - == 1 - - (1 - y) == - (1 + y) 222
3 Parameterschatzungen
525
Aus diesen Gleichungen lassen sich C l und C2 mit Hilfe der tabellierten Verteilungsfunktion F(z) der Chi-Quadrat- Verteilung mit J = n - 1 Freiheitsgraden leicht berechnen (Tabelle 3 im Anhang). Aus der Ungleichung oder
(111-122)
folgt dann eine entsprechende Ungleichung fur die Varianz
82
(n - 1) -
C2
~
0"2
~
82
(n - 1)-
0"2:
(111-123)
Cl
Fur die Schdtzfunktion 8 2 der Varianz setzen wir noch den aus der konkreten Stichprobe Xl' X 2, ... , x; ermittelten Schdtzwert S2 (d.h. die Stichprobenvarianz) ein und erhalten dann das gewiinschte Vertrauens- oder Konjidenzintervall fur die unbekannte Varianz 0"2 in der Form (111-124)
Wir fassen die wichtigsten Ergebnisse zusammen:
III Grundlagen der mathematischen Statistik
526
Anmerkungen
(1)
Haufig wird auch die Irrtumswahrscheinlichkeit rt vorgegeben (meist rt == 0,05 == 5% oder rt == 0,01 == 1%). Das Vertrauensniveau oder die statistische Sicherheit ist dann y == 1- a.
(2)
Man beachte: Die Vertrauensgrenzen sind eindeutig durch das vorgegebene Vertrauensniveau y == 1 - o. sowie den Umfang n und die Varianz S2 der vorgelegten Stichprobe bestimmt.
(3)
. 11 besi .. I Das Vertrauensinterva esitzt diIe Lange
==
(n - 1) (c2
-
c 1) S2 .
C1 C2
(4)
Aus dem Vertrauensintervall (111-128) fur die Varianz (J2 erhalt man durch Wurzelziehen ein entsprechendes Vertrauensintervall fur die Standardabweichung (J.
•
Beispiel Wir kommen nochmais auf das Beispiel des vorangegangenen Abschnitts zuruck (Messung von n == 8 ohmschen Widerstanden aus einer normalverteilten Grundgesamtheit, deren Mittelwert f1 und Varianz (J 2 beide unbekannt sind) und bestimmen nun ein Vertrauens- oder Konfidenzintervall fur die unbekannte Varianz (J2 bei einem vorgegebenen Vertrauensniveau von y == 0,95 == 95°~. 1. Schritt: Das Vertrauensniveau ist bereits vorgegeben: y == 0,95. Die Irrtumswahrscheinlichkeit betragt somit rt = 0,05.
3 Parameterschatzungen
527
2. Schritt: Die Konstanten
C 1 und gleichungen ermittelt (Bild 111-29):
1
1
werden aus den folgenden Bestimmungs-
F(c 1 ) =
2(1 -
F(c 2 ) =
2(1 + y) = 2(1 + 0,95) = 0,975
y) =
1
2(1 -
C2
0,95) = 0,025
1
Bild 111-29
Unter Verwendung von Tabelle 3 im Anhang erhalten wir fur 8 - 1 = 7 Freiheitsgrade die folgenden Werte: f=7
F(c 1 ) = 0,025
--~)
F(c 2 ) = 0,975
--~)
f=7
C 1 =Z(O,025;7)
= 1,69
C 2 =Z(O,975;7)
=
f
=
n- 1=
16,01
Die gesuchten Konstanten C 1 und C 2 entsprechen somit den beiden Quantilen = 1,69 und Z(O,975;7) = 16,01 der Chi-Quadrat-Verteilung mit f = 7 Freiheitsgraden.
Z(O,025;7)
3. Schritt: Die Varianz S2 der Stichprobe wurde bereits im Beispiel des vorangegan-
genen Abschnitts 3.4.3 zu s 2 = 8,286 0 2 ermittelt.
4. Schritt: Mit n = 8, S2 = 8,2860 2 , c1 = 1,69 und nachst die beiden Vertrauensgrenzen: k1 =
k2 =
(n - 1)s2
=
2 (8 - 1).8,2860 2 = 36230 16,01 '
=
(8 - 1) . 8,286 0 2 112 = 34 321 ~~ 1,69 '
C2
(n - 1)s 2 C1
C2
= 16,01 berechnen wir
zu-
Das Vertrauensintervall fur die unbekannte Varianz (J" 2 der normalverteilten Grundgesamtheit lautetdamit: k1
~
(J"2
~
k2
528
11.1 Grundlagen der mathematischen Statistik
Der wahre Wert der Varianz (J2 liegt dabei mit einem Vertrauen von 95% in diesem Intervall. Fur die Standardabweichung erhalt man damit das folgende Vertrauensintervall (bei einer Irrtumswahrscheinlichkeit von ebenfalls 5%):
J 3,623 Q2 ~
(J
~
J 34,321 Q2 •
3.4.5 Vertrauensintervalle fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) Auch fur den unbekannten Parameter p einer binomialverteilten Grundgesamtheit laBt sich auf dem vorgegebenen Vertrauensniveau 'Y = 1 - rx aus einer konkreten Stichprobe ein Vertrauens- oder Konfidenzintervall bestimmen, das mit einem Vertrauen von 'Y . 100% den wahren Wert des Parameters p enthalt. Wir gehen dabei von den folgenden Uberlegungen aus: p sei die unbekannte Wahrscheinlichkeit dafur, daB bei einem Bernoulli-Experiment das Ereignis A eintrete. Die Wahrscheinlichkeit fur das Eintreten des komplementdren Ereignisses A ist dann q = 1 - p. In Abschnitt 3.2.5 haben wir uns bereits mit der Schdtzung des Parameters p beschaftigt und dabei gezeigt, wie man aus einer konkreten Stichprobe einen Schdtzwert p erhalt, Eine solche Stichprobe besteht nun in einer n-fachen Ausfiihrung des Bernoulli-Experiments, wobei die Anzahl k der dabei erzieiten .Erfolge" festgestellt wird (das Eintreten des Ereignisses A werten wir wiederum ais .Erfolg", das Eintreten des komplementdren Ereignisses A ais "MifJerfolg"). Dann ist p= kin ein Schatz- oder Ndherungswert fur die unbekannte .Erfolgswahrscheinlichkeii (den Anteilswert) p. Fur diesen Parameter laBt sich nun unter gewissen Voraussetzungen auch ein Vertrauensoder Konfidenzintervall bestimmen, dessen Grenzen symmetrisch zumSchatzwert p = kin angeordnet sind (Bild III -30).
I
Vertrauensgrenzen ~
p"
>
-
k
n
Vertrauensintervall
Zahlengerade
Bild 111-30 Vertra uensin tervall fur den unbekannten An teilswert P, (Parameter p einer Binomialverteilung)
Bei der Herieitung des Vertrauensintervalls gehen wir von der Zufallsvariablen X = Anzahl deri.Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments aus, die nach Abschnitt 6.1 aus Kapitel II binomialverteilt istmit den Parametern n und p. Setzen wir umfangreiche Stichproben voraus, was wir im folgenden stets tun wollen, so
3 Parameterschatzungen
529
folgt aus dem Grenzwertsatz von M oivre und Laplace unmittelbar, daB diese Zufallsvariable sogar als nahezu normalverteilt betrachtet werden kann mit dem Mittel- oder Erwartungswert E(X) == fJ == np und der Varianz Var(X) == (J'2 == np(1 - p). Dann aber ist die zugehorige standardisierte Zufallsvariable
u == _X_-_fJ == _X_-_n_p_
(111-129)
Jnp(1 - p)
(J'
ndherungsweise standardnormalverteilt. Als Schatzfunktion fur den unbekannten Anteilswert p (Parameter p der Binomialverteilung) verwenden wir die bereits aus den Abschnitten 3.2.5 und 3.3.2.1 bekannte Maximum-Likelihood-SchatzJunktion ~
X
p==-
(111-130)
n
Somit ist X == nP und die standardnormalverteilte Zufallsvariable U aus Gleichung (111-129) laBt laBt sich auch in der Form X - np U==-----
Jnp(1 - p)
nP - np
(111-131)
Jnp(1 - p)
darstellen. Die Grenzen des gesuchten Vertrauensintervalls werden nun so bestimmt, daB die Zufallsvariable U mit der vorgegebenen Wahrscheinlichkeit y == 1 - Li Werte aus dem symmetrischen Intervall - c ~ U ~ c annimmt (Bild 111-31).
o
-c
u
c
BUd 111-31 Zur Berechnung der Schranke c (die hellgrau'unterlegte Flache entspricht dem gewahlten Vertrauensniveau y = 1 - a, die dunkelgrau unterlegte Flache der Irrtumswahrscheinlichkeit «)
Aus der Bedingung
Pt. - c ~ U
~
c) ::;::: }' == 1 -
(111-1"32)
Li
la.Bt sich dann die Schranke c mit Hilfe von Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung) leicht bestimmen. Aus der Ungleichung -c
~
U
~
c
oder
-c~
nP - np
~c
(III-133)
Jnp(1 - p) erhalten wir dann nach einigen elementaren Umformungen eine entsprechende Ungleichung fur den Parameter p.
III Grundlagen der mathematischen Statistik
530
Sie lautet:
p-
~ Jnp(l - p) ~ p ~ n
p + ~ Jnp(l n
- p)
(111-134)
Die beiden Intervallgrenzen enthalten noch jeweils die Schatzfunktion P sowie den unbekannten Parameter p. Wir ersetzen diese Groben durch den aus der konkreten Stichprobe ermittelten Schdtzwert pund erhalten auf diese Weise eine brauchbare N dherung fur das gesuchte Vertrauensintervall des Parameters p: A
CJ np(l -
P- -
n
A
p) ~ p A
~
A
p
+ -CJ np(l A
n
A
- p)
(III-135)
Wir fassen die einzelnen Schritte wie folgt zusammen:
23)
Die Stichprobe wird als umfangreich angesehen, wenn der Stichprobenumfang n die Bedingung nfi(l - fi) > 9 erfiillt. fi ist dabei der aus der Stichprobe erhaltene Schdtzwert fur den unbekannten Parameter p.
3 Parameterschatzungen
531
Anmerkungen (1) Haufig wird auch die Irrtumswahrscheinlichkeit It vorgegeben (meist It = 0,05 = 5°1o oder It = 0,01 = 1°10). Das Vertrauensniveau oder die statistische Sicherheit ist dann y= 1-
(2)
It.
fi
Die Lange 1 = 2 (cln) des Vertrauensintervalls hangt noch vom Vertrauensniveau y = 1 - It, dem Stichprobenumfang n und dem Schatzwert p = kin fur den Anteilswert (Parameter) p ab (vgl. Bild III-32). Eine Verkiirzung des Intervalls laBt sich dabei stets durch eine entsprechende Vergriifierung des Stichprobenumfangs n erreichen.
Vertrauensintervall der Lange
1£ Vii" n
Bild 111-32 Vertrauensintervall fur den unbekannten Anteilswert p (Parameter p einer Binomialverteilung)
532 •
III Grundlagen der mathematischen Statistik Beispiel Ein bestimmtes mechanisches Bauelement wird in groBer Stiickzahl hergestellt. Mit Hilfe einer umfangreichen Stichprobe solI der Ausschufianteil pin dieser Produktion geschatzt werden. Zu diesem Zweck wurde der binomialverteilten Grundgesamtheit eine Stichprobe vom Umfang n == 500 entnommen. In ihr befanden sich k == 25 nicht [unktionsfdhige (also defekte) Bauelemente. Wir bestimmen nun fur den unbekannten Parameter (AusschuBanteil) p ein Vertrauens- oder Konfidenzintervall zum Vertrauensniveau y == 0,99 == 99°~, wobei wir schrittweise wie folgt vorgehen: 1. Schritt: Das Vertrauensniveau ist bereits vorgegeben: y == 0,99. 2. Schritt: Wir berechnen die Konstante c aus der Bedingung P( - c ~ U ~ c) == y == 0,99
(Bild 111-33). Unter Verwendung von Tabelle 2 im Anhang erhalten wir dann: P( - c ~ U ~ c) == ¢(c) - ¢( - c) == ¢(c) - [1 - ¢(c)] == ==
¢ (c) == 0,995
2 . ¢(c) - 1 == 0,99
----j.
c
== U O,995 ==
2,576
Die gesuchte Konstante ist demnach das Quantil mal verteilung.
U O,995
==
2,576 der Standardnor-
Bild 111-33
o
-c
3. Schritt: Mit n == 500 und k der folgende Schdtzwert:
==
c
u
25 ergibt sich fur den unbekannten AusschuBanteil
p
k
A
p == ~ ==
25 . 500 == 0,05
==
50/0
4. Schritt: Die Bedingung (111-138) fur eine umfangreiche Stichprobe ist hier erfiillt: L\
==
np(1 - p) == 500 . 0,05 (1 - 0,05) == 23,75 > 9
Zweckmalsigerweise berechnen wir jetzt zunachst die folgende HilfsgrofJe: k
c r; 2 576 r;;::;-;:;; v L\ == - ' - v 23,75 == 0,0251 n 500
== -
3 Parameterschatzungen
533
Das Vertrauens- oder Konfidenzintervall fur den unbekannten Ausschufianteil p lautet somit: p-k~p~p+k
0,05 - 0,0251
~
p
~
0,05
+ 0,0251
Der wahre Wert von p liegt daher mit einem Vertrauen von 990/0 zwischen rund 2,5% und 7,5%. •
3.4.6 Vertrauensintervalle fur den unbekannten Mittelwert Jl einer beliebigen Verteilung In den Abschnitten 3.4.2 und 3.4.3 haben wir uns ausfiihrlich mit den Vertrauensintervallen fur den unbekanten Mittelwert f1 einer normalverteilten Zufallsvariablen X beschaftigt. In den Anwendungen hat man es jedoch auch haufig mit Zufallsvariablen zu .tun, deren Wahrscheinlichkeitsverteilungen unbekannt sind. Wir gehen daher bei unseren weiteren Uberlegungen von einer beliebig verteilten Zufallsvariablen X aus. Fur den unbekannten M ittelwert f1 dieser (nicht naher bekannten) Verteilung solI nun naherungsweise ein Vertrauens- oder Konfidenzintervall bestimmt werden. Als Schdtzfunktion fur den Mittelwert u verwenden wir wiederum die bereits bekannte Stichprobenfunktion (111-140)
Xl' X 2' ... , X n sind dabei Zufallsvariable mit der gleichen Verteilung wie X (d. h. Mittelwert u, Varianz (J2). Bekanntlich besitzt dann die Schatzfunktion X den Mittelwert E(X) = f1 und die Varianz Var(X) = (J2jn. Die Art der Verteilung von X und damit auch von X ist und bleibt weiterhin unbekannt! Aus dem Zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung folgt jedoch, daB die Schatzfunktion X als anndhernd normalverteilt betrachtet werden kann mit dem Mittelwert fl und der Varianz (J2 [n, wenn nur der Umfang n der verwendeten Zufallsstichprobe hinreichend groft ist (Faustregel: n > 30). Dies aber bedeutet, daB wir die bereits in den Abschnitten 3.4.2 und 3.4.3 besprochenen Methoden zur KonstruktioIi von Vertrauensintervallen fur den Mittelwert fl einer normalvertcilten Grundgesamtheit als N dherungsverfahren auch auf beliebig verteilte Zufallsvariable anwenden diirfen. Mit anderen Worten: Die Schatzfunktion X kann als nahezu normalverteilt angenommen werden, obwohl keine normalverteilte (sondern eine beliebig verteilte) Grundgesamtheit vorliegt, sofern der Stichprobenumfang hinreichend groft ist.
III Grundlagen der mathematischen Statistik
534
Wir fassen diese fur die Anwendungen wichtigen Aussagen wie folgt zusammen:
Anmerkung Auch fur die unbekannte Varianz (J2 einer beliebigen Verteilung lassen sich Naherungsverfahren zur Bestimmung von Vertrauensintervallen angeben. Wir verweisen auf die spezielle Fachliteratur (siehe Literaturverzeichnis).
4 Statistische Priifverfahren fiir die unbekannten Parameter einer Wahrscheinlichkeitsverteilung ("Parametertests") 4.1 Ein einfiihrendes Beispiel Wir interessieren uns fur den mittleren Benzinverbrauch eines bestimmten Autotyps und fuhren aus diesem Grund die stetige Zufallsvariable X = Benzinverbrauch eines Autos vom ausgewdhlten Typ
ein (alle Angaben iiblicherweise in "Liter pro 100 km").
4 Parametertests
535
Bei unseren weiteren Uberlegungen gehen wir dabei von der realistischen Annahme aus, daB der Benzinverbrauch X eine normalverteilte ZufalIsvariable mit dem Mittelwert Jl und der Varianz (J2 darstellt. Von Seiten des Automobilherstellers wird ein mittlerer Benzinverbrauch von Jl == Jlo angegeben. Diese Angabe solI nun durch ein geeignetes statistisches Verfahren auf der Basis einer Stichprobenuntersuchung iiberpriift werden. Dabei gehen wir schrittweise wie folgt vor: (1)
Zunachst formulieren wir die Angabe des Herstellers uber den mittleren Benzinverbrauch als sog. Nullhypothese: (111-141)
Mit anderen Worten: Wir gehen zunachst von der Annahme oder Vermutung aus, daB die Angaben des Herstellers tatsachlich zutreffen. Alternativ zur Nullhypothese H 0 stellen wir dann die Hypothese H 1 : Jl =j:. Jlo
(111-142)
zur Diskussion, Diese sog. Alternativhypothese besagt, daB der mittlere Benzinverbrauch Jl van Jlo verschieden, d.h. kleiner oder grofier als Jlo ist. Sollten wir namlich nach Durchfiihrung des Priifverfahrens zu dem SchluB kommen, daB die Angaben des Herstcllers (d.h. die N ullhypothese H 0) nicht haltbar sind, so diirfen wir mit ruhigem Gewissen davon ausgehen, daB die Alternativhypothese H 1 zutrifft. (2)
24)
25)
Um die Nullhypothese H o zu iiberpriifen, wahlen wir nach dem Zufallsprinzip n Testfahrzeuge aus, ermitteln ihren jeweiligen Benzinverbrauch Xi (i == 1, 2, ... , n) und vergleichen dann den hieraus gebildeten Mittelwert x mit der Angabe des Herstellers, d. h. mit dem Wert Jl == flo. Im Sinne der Statistik haben wir der normalverteilten Grundgesamtheit 24) eine Stichprobe vom Umfang n entnommen und daraus anschlieBend den Stichprobenmittelwert x berechnet. Dieser spezielle Wert ist eine Realisierung der ZufalIsvariablen X, d.h. der bereits aus Abschnitt 3.2.2 bekannten Schdtzfunktion fur den Mittelwert ii der Grundgesamtheit. X wird in diesem Zusammenhang auch als Testgroj3e oder Testvariable bezeichnet. Fiir verschiedene Stichproben werden wir dabei i.a. verschiedeneMittelwerte erhalten und diese wiederum werden vom hypothetischen Mittelwert Jl == Jlo mehr oder weniger stark abweichen. Wir miissen nun in der Lage sein anhand eines geigneten MaBes feststellen zu konnen, ob die beobachtete Abweichung des Stichprobenmittelwertes x yom hypothetischen Mittelwert Jl == Jlo zufallsbedingt oder aber signifikant ist, d.h. ihre Ursache in der falschen Nullhypothese H o hat. Um einen sinnvollen Vergleich des Stichprobenmittelwertes x mit der Herstellerangabe (Nullhypothese) Jl == Jlo zu ermoglichen, wahlen wir nun eine (kleine) sag. Signifikanzzahl a zwischen 0 und 1. Etwas spater werden wir dann sehen, daB diese Zahl die Wahrscheinlichkeit fiir eine bestimmte Fehlentscheidung darstellt, die man beijedem statistischen Priifverfahren ("Test") in Kaufnehmen muB. Die Signifikanzzahl rJ., wird daher auch folgerichtig als Irrtumswahrscheinlichkeit bezeichnet 25). Als Grundgesamtheit konnen wir beispielsweise die Menge aller in einem Monat produzierten Autos vom ausgewahlten Typ betrachten. Aus dem genannten Grund wird a in der Praxis klein gewahlt: Ubliche Werte sind z.B. a = 0,05 = 5% oder a = 0,01 = 1 % .
536 (3)
III Grundlagen der mathematischen Statistik Nach der Wahl der Signifikanzzahl (Irrtumswahrscheinlichkeit) rx HiBt sich nun eine Konstante c*, auch kritischer Wert genannt, so bestimmen, daB die Testgrofie X bei richtiger Nullhypothese H o mit der statistischen Sicherheit '}' = 1 - rx in das symmetrische Intervall J.10 - c * ~ X ~ J.10
+ c*
(111-143)
fallt (Bild 111-34). Die Intervallgrenzen J.10 - c* und J.lo + c* heiBen kritische Grenzen. Der kritische Wert c* wird dann aus der Bedingung P(J.lo - c* ~ X ~ 110
+ C*)H o =
'}' =
(111-144)
1 - rx
ermittelt, wobei man zuniichst die Testgrolle X standardisiert
(x
X -J.lo)
---->
u = (J/~
und anschlieBend die Tabelle 2 im Anhang verwendet (Tabelle der Quantile der Standardnormalverteilung)2 6).
Bild 111-34 Zur Berechnung der kritischen Grenzen
J.lo- c*
L (4)
J.lo
kritische Grenzen
/10+ c*
-
x
~
Wir sind nun in der Lage, eine Entscheidung zu fallen, sollten dabei jedoch nie vergessen, daB diese aufgrund eincr einzigen Stichprobenuntersuchung zustande kommt:
1. Fall: Fallt der aus einer konkretenStichprobe ermittelte Stichprobenmittelwert
xin dieses Intervall (auch nicht-kritischer Bereich oder Annahmebereich genannt), so
darf die Abweichung zwischen x und J.lo als rein zufallsbedingt angesehen werden, und die Nullhypothesewird beibehalten, d.h. sie kann nicht abgelehnt oder verwor- fen werden (Bild 111-35). Mit anderen Worten: Die Auswertung un serer Stichprobe liefert keinen Grund, an den Angaben des Automobilherstellers beziiglich des mittleren Benzinverbrauchs zu zweifeln. Wir konnen daher davon ausgehen, daB der mittlere Benzinverbrauch J.l tatsachlich J.lo betragt, ohne uns dessen jedoch absolut sicher zu seine Das verwendete Stichprobenmaterial spricht zumindest nicht gegen die Nullhypothese. Dies aber bedeutet keineswegs, daB H o richtig ist ~ die Nullhypothese kann sowohl richtig als auch falsch seine 26)
Die Varianz (j2 der normalverteilten Zufallsvariablen X wird dabei als bekannt vorausgesetzt. Andernfalls ist die t- Verteilung von Student zu verwenden (vgl. hierzu auch die nachfolgenden Abschnitte 4.5.1 und 4.5.2). Die Berechnung des kritischen Wertes c* erfolgt dabei immer unter der Voraussetzung, daB die Nullhypothese H 0: J1 = J10 auch tatsachlich zutrifft. Der Index "H 0" am Wahrscheinlichkeitssymbol P solI an diese Voraussetzung erinnern. Ausfiihrliche Einzelheiten zur Berechnung des kritischen Wertes c * erfolgen spater im Zusammenhang mit den speziellen Parametertests in Abschnitt 4.5.
4 Parametertests
537 Mitte/wert X der Stichprobe fallt in den nicht-kritischen Bereich
Y= 1-a
a/2
a/2
Jlo
ritischer
~
Bereich (Ablehnung)
-
-
x
nicht-kritischer Bereich (Annahmebereich)
x
kritischer Bere;;j (Ablehnung) I
Bild 111-35 Der Stichprobenmittelwert x fallt in den nicht-kritischen Bereich (Annahmebereich), die Nullhypothese H o : J1 = J10 wird daher beibehalten, d. h. nicht abgelehnt
2. Fall: Fallt der Stichprobenmittelwert x jedoch in den sog. kritischen Bereich oder Ablehnungsbereich, d. h. in das Intervall Ix- f.1o I > c*, so ist die Wahrscheinlichkeit dafur, daB die Abweichung zwischen x und f.1o rein zufallig ist, sehr gering, namlich gleich der kleinen Signifikanzzahl a (also z.B. gleich a = 5 % oder a = 1 0/0). Die Nullhypothese H o ist daher nicht haltbar und muB somit zugunsten der Alternativhypothese H 1 abgelehnt oder verworfen werden (Bild III -36). Mit anderen Worten: Wir konnen die Angaben des Automobilherstellers als falsch betrachten und davon ausgehen, daB der mittlere Benzinverbrauch f.1 gr6Ber oder kleiner als f.1o ist. Die Nullhypothese H 0: f.1 = f.1o wird somit auf dem Signifikanzniveau a zugunsten der Alternativhypothese H 1 : f.1 =1= f.1o verworfen.
Mitte/wert X der Stichprobe fallt in den kritischen Bereich
Jlo
@,
ritisch er Bereich (Ab/ehnung)
nicht-kritischer Bereich (Annahmebereich)
Jlo+ c*
-
x
-
x
kritischer Bere;;! (Ablehnung) I
Bild 111-36 Der Stichprobenmittelwert x fallt in den kritischen Bereich, die Nullhypothese H o : J1 = J10 wird daher zugunsten der Alternativhypothese Hi : J1 =1= J10 verworfen
III Grundlagen der mathematischen Statistik
538
Eines sol1ten wir dabei jedoch stets im Auge behalten: Absolut sichere Ruckschliisse von einer Zufallsstichprobe auf die entsprechende Grundgesamtheit sind grundsdtzlich nicht moglich. Es besteht daher immer die Moglichkeit eines Irrtums, d.h. einer falschen Entscheidung. Nehmen wir einmal an, daB die Angaben unseres Automobilherstellers tatsachlich zutreffen, der mittlere Benzinverbrauch u also wie behauptet flo betragt, Dann konnten wir beim Testen auf eine Zufallsstichprobe stoBen, deren Mittelwert x zufiilligerweise in den kritischen Bereich (Ablehnungsbereich) fallt und miiBten dann aufgrund unserer Kriterien die Nullhypothese fl == flo ablehnen, obwohl sie richtig ist (vgl. hierzu Bild 111-36). Damit aber wiirden wir (wenn auch unbewujJt) eine Fehlentscheidung treffen. Das Risiko fur eine solche aufgrund einer Stichprobenuntersuchung getroffene falsche Entscheidung ist dabei quantitativ durch die vor Testbeginn gewahlte Signifikanzzahl a gegeben. Damit ist a die Wahrscheinlichkeit dafiir, eine an sich richtige Nullhypothese ablehnen zu miissen. Die Signifikanzzahl a wird somit zu Recht als I rrtumswahrscheinlichkeit bezeichnet.
4.2 Statistische Hypothesen und Parametertests Unter einer statistischen Hypothese (kurz: Hypothese) versteht man irgendwelche Annahmen, Vermutungen oder Behauptungen iiber die Wahrscheinlichkeitsverteilung einer Zufallsvariablen oder Grundgesamtheit und deren Parameter. Ein Parametertest ist ein statistisches Prifverfahren fur einen unbekannten Parameter in der Wahrscheinlichkeitsverteilung einer Zufallsvariablen oder Grundgesamtheit, wobei die Art der Verteilung (d.h. der Verteilungstyp wie z.B. Binomialverteilung oder GauBsche Normalverteilung) als bekannt vorausgesetzt wird. Ein solcher Test dient der Vberprufung einer Hypothese iiber einen bestimmten Parameter der Verteilung mit Hilfe einer Stichprobenuntersuchung der betreffenden Grundgesamtheit. Die zu iiberpriifende Hypothese wird meist als N ullhypothese H obezeichnet. Ihr wird oft eine Alternativhypothese HI gegeniibergestellt. Es ist dann das erklarte Ziel eines Parametertests, eine Entscheidung dariiber zu ermoglichen, ob man die Nullhypothese H o beibehalten (d.h. nicht ablehnen) kann, da die Auswertung des verwendeten Stichprobenmaterials in keinem Widerspruch zur Nullhypothese steht oder ob man sie zugunsten der Alternativhypothese HI ablehnen oder verwerfen muB. Mit einem Parametertest kann also iiber Ablehnung oder Beibehaltung (Nichtablehnung) einer aufgestellten Hypothese ("Nullhypothese") entschieden werden. Allerdings: Wie auch immer die Entscheidung ausfallen sollte, sie kann richtig aber auch falsch sein. •
Beispiele
(1)
Beim Zufallsexperiment "Wurf einer Miinze" tritt das Ereignis A: "Zahl" mit der Wahrscheinlichkeit p == 0,5 ein, falls diese M iinze echt (d. h. unverfiilscht) ist. Wir priifen die Echtheit dieser Miinze, in dem wir der Nullhypothese H o : p(A)
== 0,5
die Alternativhypothese H 1 : p(A ) i= 0,5
gegeniiberstellen. Es handelt sich hierbei urn einen sog. zweiseitigen Parametertest, da die Alternativhypothese Parameterwerte nach beiden Seiten hin zulafst (sowohl p < 0,5 als auch p > 0,5 ist moglich),
539
4 Parametertests (2)
Ein Grobhandler bestellt direkt beim Hersteller einen grolseren Posten eines bestimmten elektronischen Bauelements und vereinbart dabei, daf die Ware einen maximalen Ausschufianteil von Po = 1% enthalten darf. Bei der Anlieferung der Ware wird er daher mit einem speziellen statistischen Test priifen, ob die vereinbarte maximale AusschuBquote auch nicht iiberschritten wurde. Der Grobhandler wird daher die N ullhypothese
Ho : p
~
Po = 1 0/0
gegen die Alternativhypothese HI: p > Po
= 10/0
testen (sog. einseitiger Parametertest, da hier die Alternativhypothese nur Werte p > Po zulafst), Sollte dabei die Testentscheidung zugunsten der Alternativhypothese HI ausfallen, so darf er davon ausgehen, daf der AuschuBanteil p grofJer ist als vereinbart, d. h. grofJer als 1 % ist. Er wird in diesem Fall die Annahme der gelieferten Bauelemente verweigern. Trotzdem kann die getroffene Entscheidung durchaus falsch sein! Denn aIle Testentscheidungen sind grundsatzlich mit einem gewissen Risiko verbunden (nahere Einzelheiten in Abschnitt 4.4). Die Wahrscheinlichkeit fur eine F ehlentscheidung ist jedoch in diesem Fall hochstens gleich der Signifikanzzahl o: und diese kann ja vor Testbeginn entsprechend klein gewahlt werden (z.B. rJ. = 0,01 = 10/0).
• 4.3 Planung und Durchfiihrung eines Parametertests In enger Anlehnung an unser einfiihrendes Beispiel aus Abschnitt 4.1 empfehlen wir, den Ablauf eines Parametertests wie folgt zu planen und durchzufiihren:
III Grundlagen der mathematischen Statistik
540
r-km;SCher I Bereich
nicht-kritischer Bereich
Bild 111-37 Die kritischen Grenzen vom nicht-kritischen Bereich 27)
28)
Cu
und
Co
kritische-; Bereich
-l
trennen den kritischen Bereich
In einfachen Fallen erweist sich dabei die ausgewahlte Testvariable T als eine Schdtzfunktion () des unbekannten Parameters 9. 1m allgemeinen jedoch gilt: Zwischen der Testvariablen T und der Schatzfunktion () des Parameters 9 besteht ein gewisser Zusammenhang. 1m nachfolgenden Abschnitt 4.5 werden wir fur spezielle Parameter zeigen, wie man mit Hilfe von bekannten Schatzfunktionen geeignete Testvariable erhalt, a ist die Wahrscheinlichkeit dafiir, daB der Wert der Testvariablen 'T aujJerhalb dieses Intervalls liegt.
4 Parametertests
541
y = 1-a
Prct- oder Testwert t
a/2
a/2
blehnUng
~
(kritischer Bereich)
Annahmebereich (nicht-kritischer Bereich)
--l
Ablehnung (kritischer Bereich)
Bild 111-38 Der Priif- oder Testwert i [aUt in den nicht-kritischen Bereich (Annahmebereich), die Nullhypothese H o : 9 = 9 0 wird daher beibehalten, d. h. nicht abgelehnt
III Grundlagen der mathematischen Statistik
542
PrOf- oder Testwert
t
PrOf- oder Testwert
t
a/2
~
blehnUng
(kritischer Bereich)
Annahmebereich (nicht-kritischer Bereich)
-l
Ablehnung (kritischer Bereich)
Bild 111-39 Der Priif- oder Testwert i fallt in den kritischen Bereich, die Nullhypothese H o : 8 = 8 0 wird daher zugunsten der Alternativhypothese H 1 : 8 =1= 8 0 abgelehnt
29)
30)
Die Moglichkeit eines Irrtums, d.h. einer Fehlentscheidung ist grundsatzlich immer gegeben. Die Irrtumswahrscheinlichkeit betragt hier o: (vgl. hierzu auch den nachfolgenden Abschnitt 4.4). Dies bedeutet, daB wir uns fur die Alternativhypothese H 1 entscheiden.
4 Parametertests
543
Anmerkungen (1) Die Test- oder Priifvariable T wird haufig auch als Test- oder PrufgrojJe, manchmal auch als Test- oder Priiffunktion bezeichnet. (2)
Man beachte, daB die Bestimmung der kritischen Grenzen nur moglich ist, wenn die Wahrscheinlichkeitsverteilung der Testgr6Be T bekannt ist. Beispiel: X sei eine normalverteilte Zufallsgr6Be. Dann ist die Testgr6Be X (d.h. die Schdtzfunktion fur den M ittelwert 11 der normalverteilten Grundgesamtheit) eben-
falls normalverteilt. (3)
In Abschnitt 4.5 werden wir uns mit den wichtigsten Parametertests vertraut machen und dabei zeigen, wie man fur spezielle Parameter unter Verwendung bereits bekannter Schatzfunktionen geeignete Testvariable mit bekannter Wahrscheinlichkeitsverteilung erhalt.
(4)
Neben dem hier ausfiihrlich besprochenen zweiseitigen Parametertest gibt es auch die Moglichkeit einseitiger Tests. Beispiel: Wir testen die Nullhypothese
(111-151) ("der Parameter 9 ist kleiner oder gleich 9 0 " ) gegen die Alternativhypothese H 1 : 9 > 90
(111-152)
("der Parameter 9 ist grojJer als 9 0 " ) , Es handelt sich hierbei urn einen einseitigen Test, da die Alternativhypothese nur Parameterwerte grojJer als 9 0 zulabt. Es gibt jetzt nur eine kritische Grenze c. Sie laBt sich aus der Bedingung P(T
~
C)Ho
= Y= 1- a
(111-153)
fur die verwendete Test- oder Priifvariable T mit Hilfe der entsprechenden Verteilungsfunktion leicht berechnen (Bild 111-40).
c
1---
Annahmebereich
Ablehnung
1
kritische Grenze
Bild 111-40 Annahmebereich bei einem einseitigen Parametertest (Abgrenzung nach oben)
544 (5)
III Grundlagen der mathematischen Statistik Haufig wird auf eine Alternativhypothese verzichtet. Falls dann keine signifikante oder (wie man auch sagt) statistisch gesicherte Abweichung vorliegt, wird die Nullhypothese H 0 beibehalten, d. h. nicht abgelehnt. Dies bedeutet aber keineswegs, daB H 0 als richtig angenommen wird, sondern besagt lediglich, daB das Ergebnis der Stichprobenuntersuchung in keinem Widerspruch zur Nullhypothese H o steht. Ein M usterbeispiel aus dem technischen Bereich liefert die Uberpriifung eines bestimmten Sollwertes (Hypothese: /1 == /10). Es interessiert dabei haufig nur, ob der Sollwert /10 eingehalten wird oder nicht.
4.4 Mogliche Fehlerquellen bei einem Parametertest Am Ende eines Parametertests ist stets eine Entscheidung zu fallen. Sie kann dabei zugunsten der Nullhypothese H 0 oder der Alternativhypothese HI ausfallen. In beiden Fallen werden gewisse Riickschliisse von einer Zufallsstichprobe auf die entsprechende Grundgesamtheit gezogen. Wir miissen dabei jedoch bedenken, daB es absolut sichere Schliisse grundsatzlich nicht gibt. Bei einer Testentscheidung besteht somit immer die Moglichkeit eines Irrtums, d.h. einer Fehlentscheidung. Mit anderen Worten: Bei jeder Testentscheidung besteht eine bestimmte Wahrscheinlichkeit dafiir, daft die getrofJene Entscheidung falsch ist. Dabei werden zwei Arten von Fehlern unterschieden:
In beiden Fallen wurde eine falsche Entscheidung gefallt! Wir erlautern nun die moglichen Fehler 1. Art und 2. Art etwas naher am Beispiel eines einseitigen Parametertest, bei dem die Nullhypothese H o:9
== 9 0
(111-154)
gegen die Alternativhypothese HI: 9 > 9 0
(111-155)
getestet werden solI.
Fehler 1. Art Die kritische Grenze c wird bekanntlich so bestimmt, daB die Testvariable T bei richtiger Nullhypothese Hound vorgegebener Signifikanzzahl a mit einer Wahrscheinlichkeit von a Werte annimmt, die in den kritischen Bereich oder Ablehnungsbereich fallen (dunkelgrau unterlegte Flache in Bild III -41). Wir haben dabei vorausgesetzt, daf 9 0 der wahre Wert
4 Parametertests
545
des Parameters 9 ist. Der Einfachheit halber nehmen wir desweiteren an, daf die verwendete Testvariable (Priifgrohe) T eine Schdtzfunktion des betreffenden Parameters 9 ist. Der Test- oder Prifwert von T ist dann identisch mit dem Schdtzwert § des Parameters.
--r
Annahmebereich (nicht-kritischer Bereich)
-J
Ablehnung (kritischer Bereich) kritische Grenze
Bild 111-41 Die dunkelgrau unterlegte .Flache lI. ist die Wahrscheinlichkeit dafiir, einen Fehler I . Art zu begehen, d. h. eine an sich richtige Nullhypothese verwerfen zu miissen
Fallt nun der aus einer konkreten Stichprobe berechnete Testwert § in den Ablehnungsbereich 9 > c, so miissen wir die an sich richtige Nullhypothese H 0: 9 == 9,0 irrtianlicherweise verwerfen und begehen damit genau einen Fehler 1. Art. Seine Grobe entspricht dabei der vorgegebenen Signifikanzzahl a, die daher auch folgerichtig - wie bereits erwahnt - als Irrtumswahrscheinlichkeit bezeichnet und durch die in Bild III -41 dunkelgrau unterlegte Flache reprasentiert wird. •
Beispiel
Ein Grobhandler bezieht direkt vom Hersteller einen grolieren Posten eines bestimmten elektronischen Bauelements. Bei der Anlieferung der Ware wird er eine sog. Abnahmekontrolle durchfiihren, urn zu priifen, ob die vereinbarten Lieferbedingungen (z.B. maximal 1% "AusschuBware") auch eingehalten wurden. Aus diesem Grunde entnimmt er der Lieferung eine Zufallsstichprobe. Fallt dabei der aus der Stichprobe berechnete Wert der Testgrolie (hier: Anteilswert .Ausschuli") in den nicht-kritischen Bereich (Annahmebereich), so wird der Grobhandler die angelieferte Ware auch abnehmen. Fallt der Testwert jedoch in den kritischen Bereich (Ablehnungsbereich), so wird er die Annahme der Ware verweigern. Die zwischen GroBhandler und Produzent vorher vereinbarte Signifikanzzahl rJ. ist dabei die Wahrscheinlichkeit dafiir, eine an sich einwandfreie Lieferung aufgrund einer ZufalIsstichprobe zuritckzuweisen, weiI der Wert der Testgrobe (hier also der Anteilswert "AusschuB") zufdlligerweise in den kritischen Bereich der Testgrolie fallt. Einen solchen Fehler 1. Art bezeichnet man daher in der Praxis haufig auch als Produzen-
tenrisiko.
•
III Grundlagen der mathematischen Statistik
546
Fehler 2. Art Ein Fehler 2. Art liegt vor, wenn eine Nullhypothese H o beibehalten, d.h. nicht abgelehnt wird, obwohl sie falsch ist. Bild 111-42 zeigt die als richtig angenommene Verteilung mit dem Parameterwert 9 0 und zugleich die tatsdchliche Verteilung mit dem wahren Parameterwert 9 1 31). In dieser Abbildung wird die Wahrscheinlichkeit f3 fur einen Fehler 2. Art durch die hellgrau unterlegte Flache dargestellt (Flache unter der Dichtefunktion der wahren Verteilung in den Grenzen von - 00 bis zur kritischen Grenze c). Die Grobe dieser Wahrscheinlichkeit hangt dabei noch von der Lage von 9 1 abo Den entsprechenden funktionalen Zusammenhang zwischen f3 und 9 1 bezeichnet man als Operationscharakteristik:
f3 = f3 (9 1) . tetsecntiche Verteilung
angenommene Verteilung
.········r·······. / I ••••••••••
•••
I
I
Fehler 2.Art
•••••
-.
........................
Fehler 1.Art
Bild 111-42 Fehler 1. und 2. Art
•
Beispiel Wir kommen nochmals auf das vorangegangene Beispiel zuriick (Abnahmekontrolle bei einer Warenlieferung). In diesem Beispiel ist f3 die Wahrscheinlichkeit dafiir, daf der Grobhandler die Lieferung der elektronischen Bauelemente annimmt, obwohl sie nicht den vereinbarten Bedingungen (hier: maximaler "AusschuBanteil" von 10/0) entspricht, weil die Lieferung insgesamt einen zu hohen Anteil an Ausschufrware enthalt (was der Grolshandler aber nicht weiB). Diese Fehlentscheidung tritt genau dann ein, wenn der aus der entnommenen Zufallsstichprobe berechnete Wert der Testvariablen (hier also der Anteilswert .Ausschulrware") zufdlligerweise in den nicht-kritischen Bereich (Annahmebereich) fallt, Daher wird ein solcher Fehler 2. Art haufig auch als Konsumentenrisiko bezeichnet.
•
Zusammenhang zwischen den Fehlern 1. und 2. Art Eine in der Praxis wichtige Fragestellung lautet somit: me lassen sich diese Fehler 1. und 2. Art moglichst klein halten?
Dazu betrachten wir eingehend Bild 111-43, in dem die als richtig angenommene Verteilung (Parameter 9 0 ) und die tatsdchliche Verteilung (Parameter 9 1 ) sowie die Fehler 1. und 31)
Dargestellt ist der Fall 8 1 > 8 0 •
4 Parametertests
547
2. Art anschaulich dargestellt sind. Diesem Bild konnen wir unmittelbar entnehmen, daB eine Verkleinerung von (1, automatisch eine Vergrofserung von f3 nach sich zieht (Ubergang von Bild a) zu Bild b)). Denn eine Verkleinerung von (1, (im Bild durch die dunkelgrau unterlegte Flache veranschaulicht) bedeutet eine Verschiebung der kritischen Grenze c nach rechts, wobei aber automatisch f3 (im Bild durch die hellgrau unterlegte Flache dargestellt) zunimmt. Umgekehrt gilt: Wird f3 verkleinert, so vergrofiert sich dabei (1, (dies entspricht einer Verschiebung der kritischen Grenze c nach links).
tetsechtiche Verteilung
angenommene Verteilung
a)
c
I I I I I
angenommene Verteilung
tetsecntiche Verteilung
c beschrieben (dunkelgrau unterlegte Flache in Bild 111-45). Die Berechnung des kritischen Wertes c erfolgt dann aus der Bedingung (III-162) mit Hilfe von Tabelle 2 im Anhang (Tabelle der Quantile der Standardnormalverteilung).
4 Parametertests
551
-c
r :i~cher
o
c
u
nicht-kritischer Bereich
Bereich
Bild 111-45 Zur Bestimmung des kritischen Wertes c fur die standardnormalverteilte Testvariable U
(4)
Wir berechnen nun den Mittelwert x der vorgegebenen konkreten Stichprobe Die Testvariable U aus Gleichung (111-160) erhalt darnit den folgenden Test- oder Priifwert: Xl' X 2, ... , X n •
"
X -
flo
(III -163)
U=---
a/0z (5)
Testentscheidung: Fallt der Test- oder Prufwert (Annahmebereich), d.h. gilt
u in
den nicht-kritischen Bereich
-c~u~c
(111-164)
so wird die N ullhypothese H 0 : fl = flo beibehalten, andernfalls aber zugunsten der Alternativhypothese H 1 : u =1= flo verworfen. .Beibehalten" bedeutet dabei lediglich, daB die Nullhypothese H o aufgrund der verwendeten Stichprobe nicht ahgelehnt werden kann. Bild III -46 verdeutlicht diese Testentscheidung.
r
H o beibehalten
1-a
a/2
H
o
ablehnen
a/2
r
A blehnung (kritischer Bereich)
-c
o Annahmebereich (nicht-kritischer Bereich)
u
--l
Ablehnung (kritischer Bereich)
Bild 111-46 Testentscheidung iiber Beibehaltung oder Ablehnung der NuUhypothese
H o : /1 = /10
552
III Grundlagen der mathematischen Statistik
Wir fassen diesen speziellen Parametertest wie folgt zusammen:
4 Parametertests
553
Anmerkungen
(1)
Bei der Riicktransformation U ~ X mittels der Transformationsgleichung (111-167) erhalt man fur die Schatzfunktion X den kritischen Wert c* == c (J / j";z und damit den nichtkritischen Bereich (Annahmebereich) J.1o - c * ~
x ~ J.1o + c *
(111-172)
(vgl. hierzu auch Bild 111-44). Die Testentscheidung lautet dann fur die Zufallsvariable X wie folgt: Fallt der aus der Stichprobe berechnete Mittelwert in dieses Intervall, so wird die Nullhypothese H o beibehalten, d.h. nicht abgelehnt, anderenfalls muf sie zugunsten der Alternativhypothese H 1 verworfen werden.
x
(2)
Analog verlaufen die einseitigen Parametertests. In diesen Fallen gibt es aber nur jeweils eine kritische Grenze c. Sie Ui13t sich aus den folgenden Bedingungen mit Hilfe von Tabelle 2 im Anhang leicht ermitteln: 1. Fall: Abgrenzung nach oben (Bild 111-47)
u.; J.1
~ flo
H 1 : fl > flo P(U ~ C)H o
== 1 -
rx
Annahmebereich: u
~
c
o
c
u 4
Annahmebereich
_1
Ablehnun;
kritische Grenze
Bild 111-47 Annahmebereich bei einem einseitigen Test (Abgrenzung nach oben)
1
III Grundlagen der mathematischen Statistik
554
2. Fall: Abgrenzung nach unten (Bild 111-48) H o: Il ~ Ilo HI: Il < Ilo
P(U 1,645 (Bild III-51). Die Nullhypothese H o : 11 ~Ilo == 10 muB daher auf dem Signifikanzniveau a == 5 % zugunsten der Alternativhypothese HI: 11 > 10 abgelehnt werden. Wir konnen somit davon ausgehen, daB der unbekannte Mittelwert 11 der normalverteilten Grundgesamtheit grofter ist als 10.
558
III Grundlagen der mathematischen Statistik
u=3,162
o Annahmebereich (nicht-kritischer Bereich)
u
1,645
-~
Ablehnung (kritischer Bereich)
u
Bild III-51 Der Testwert = 3,162 fallt in den kritischen Bereich, die Nullhypothese H 0 : 11:::;; 110 = 10 wird daher verworfen
• 4.5.2 Tests fur den unbekannten Mittelwert Jl einer Normalverteilung bei unbekannter Varianz (12 X sei wiederum eine normalverteilte Zufallsvariable. Neben dem Mittelwert u ist diesmal aber auch die Varianz (J2 unbekannt. Wir vermuten jedoch, daB der Mittelwert fl einen bestimmten Wert flo besitzt (fl = flo) und testen daher unter sonst ahnlichen Bedingungen wie im vorangegangenen Abschnitt 4.5.1 die N ullh ypothese H 0 : u = flo
(111-173)
gegen die Alternativhypothese H 1 : fl i= flo Testvariable ist diesmal wegen der unbekannten Varianz
X-IJ T = _ _1""_0
(111-174) (J
2
die Zufallsvariable (111-175)
s/0z Dabei ist S die bereits aus Abschnitt 3.2.4 bekannte Schdtzfunktion fur die (ebenfalls unbekannte) Standardabweichung (J und n der Umfang der Zufallsstichprobe, die diesem zweiseitigen Parametertest zugrunde gelegt wird. Die Testvariable T geniigt dann der t- Verteilung von Student mit J = n - 1 Freiheitsgraden. Bei der Berechnung des kritischen Wertes c bzw. der kritischen Grenzen c; = - c und Co = c ist daher diesmal die Verteilungsfunktion F(t) der t- Verteilung mit J = n - 1 Freiheitsgraden zu verwenden.
4 Parametertests Der zweiseitige Parametertest fur den M ittelwert f1 verlauft dann wie folgt:
559
560
III Grundlagen der mathematischen Statistik
-c
o
c
Bild III-52 Zur Bestimmung des kritischen Wertes c fur die einer t- Verteilung geniigende Testvariable T
H o beibehalten
H o ablehnen
I
a/2
-c Ablehnung (kritischer Bereich)
o Annahmebereich (nicht-kritischer Bereich)
c
--l
Ablehnung (kritischer Bereich)
Bild III-53 Testentscheidung iiber Beibehaltung oder Ablehnung der Nullhypothese H o : u = flo
4 Parametertests
561
Anmerkungen (1)
Bei der Riicktransformation T --+ X mittels der Transformationsgleichung (111-178) erhalt man fur die Zufallsvariable X den kritischen Wert c* == c s/~ und damit den nichtkritischen Bereich (Annahmebereich) flo -
c* ~
x ~ flo + c *
(111-183)
(vgl. hierzu auch Bild III-54). Fallt der aus der Stichprobe berechnete Mittelwert x in dieses Intervall, so wird die Nullhypothese H o beibehalten, anderenfalls muB sie zugunsten der Alternativhypothese H 1 verworfen werden. 1-a
110 - c*
~
110
-
Ablehnung (kritischer Bereich)
-
x
110 + c*
Annahmebereich (nicht-kritischer Bereich)
--l
Ablehnung (kritischer Bereich)
Bild III-54 Annahmebereich bei einem zweiseitigen Test fur den unbekannten Mittelwert J1 einer Normalverteilung (bei unbekannter Varianz 0'2)
(2)
Bei einseitigen Tests gelten sinngemaf die in Abschnitt 4.5.1 in Anmerkung (2) gemachten Bemerkungen, wobei bei der Berechnung der kritischen Grenze c die t-Verteilung von Student mit f == n - 1 Freiheitsgraden anstelle der Standardnormalverteilung zu verwenden ist.
(3)
Bei einer umfangreichen Stichprobe (Faustregel: n > 30) ist die durch Gleichung (III -178) definierte Testvariable T ndherungsweise standardnormalverteilt und wir diirfen daher das in Abschnitt 4.5.1 besprochene Testverfahren an wenden ((J2 ~ S2).
•
Beispiel Ein Hersteller produziert in groBen Mengen Zylinderscheiben mit einem Solldurchmesser von 20,2 mm. Urn die Einhaltung dieses Sollwertes zu iiberpriifen, wird aus der laufenden Produktion eine Stichprobe vom Umfang n == 16entnommen. Die Auswertung dieser Stichprobe ergibt dabei einen mittleren Durchmesser von x == 20,6 mm mit einer empirischen Standardabweichung von s == 0,5 mm. Unter Verwendung dieser Stichprobe testen wir die Nullhypothese
H o : fl ==
flo
== 20,2 mm
gegen die Alternativhypothese H1:
fl
=f.
flo
== 20,2 mm
562
III Grundlagen der mathematischen Statistik auf dem Signifikanzniveau a == 0,05 == 50/0. Der Test solI dabei zweiseitig durchgefiihrt werden, wobei der Durchmesser X der Zylinderscheiben als eine normalverteilte ZufalIsvariable angesehen werden kann. Wir losen diese Aufgabe jetzt schrittweise wie folgt: 1. Schritt: Das Signifikanzniveau ist bereits vorgegeben: a
==
0,05.
2. Schritt: Die Testvariable X - flo
T----- S/~ -
X - 20,2 mm
S/)16
X - 20,2 mm -----S/4
geniigt der t-Verteilung mit f == n - 1 == 16 - 1 == 15 Freiheitsgraden. Die Bestimmungsgleichung fur den kritischen Wert c lautet somit (Bild III-55): P( - c
~
~
T
C)H o == 1 - a == 1 - 0,05 == 0,95
Unter Verwendung von Tabelle 4 im Anhang erhalten wir (bei f den):
==
15 Freiheitsgra-
P( - c ~ T~ C)H o == F(c) - F( - c) == F(c) - [1 - F(c)] == ==
2 . F(c) - 1
f= 15
F (c) == 0,975
c ==
==
0,95
t(0,97 5; 15)
==
2,131
Bild III-55
o
-c
c
Damit ergibt sich der folgende nicht-kritische Bereich (Annahmebereich; vgl. hierzu auch Bild III-56): - 2,131
~
t
~
2,131
x
3. Schritt: Mit flo == 20,2 mm, n == 16, == 20,6 mm und s fur die Testvariable T einen Test- oder Priifwert von ~
x-
flo
t = = - - ==
s/~
(20,6 - 20,2) mm 0,5 mm/)16
==
==
0,5 mmerhalten wir
32 ,
4. Schritt (Testentscheidung): Der Testwert t == 3,2 fallt in den kritischen Bereich r] > 2,131 (Bild III-56). Die Nullhypothese H o : fl == flo == 20,2 mm ist somit abzu1
lehnen.
4 Parametertests
Ablehnung (kritischer Bereich)
563
Annahmebereich (nlcnt-kritischer Bereich)
-l
Ablehnung (kritischer Bereich)
Bild III-56 Der Testwert i = 3,2 fallt in den kritischen Bereich, die NulIhypothese H o : u = flo = 20,2 mm wird daher abgelehnt
Die Abweichung des Stichprobenmittelwertes x = 20,6 mm vom vorgeschriebenen Sol1wert /10 = 20,2 mm ist also signifikant und kann nicht mehr allein aus der Zufdlligkeit der verwendeten Stichprobe erklart werden. Der Produknonsprozef wird daher unterbrochen und die Fehlersuche eingeleitet.
•
4.5.3 Tests fur die Gleichheit der unbekannten Mittelwerte Pl und P2 zweier N ormalverteilungen (Differenzentests) 4.5.3.1 Abhangige und unabhangige Stichproben In der Anwendung stellt sich haufig das Problem festzustellen, ob die Mlttelwerte /11 und /12 zweier normalverteilter Grundgesamtheiten iibereinstimmen oder ob sie sich signifikant voneinander unterscheiden.Zii Priifzwecken entnehmen wir daher den beiden Grundgesamtheiten, die wir durch die Zufallsvariablen X und Y beschreiben, zunachst jeweils eine Zufallsstichprobe 33): bzw.
(111-184)
Unter Verwendung dieser Stichproben solI dann die
(111-185)
Nullhypothese H o : /11 = /12 gegen die
(111-186)
Alternativhypothese H 1 : /11 "# /12
getestet werden. Der Ablauf dieses zweiseitigen Tests hangt dabei noch ganz wesentlich davon ab, ob die verwendeten Stichproben voneinander abhdngig sind oder ob es sich um unabhdngige Stichproben handelt. Definitionsgemaf gilt: 33)
Die heiden Stichprohen konnen durchaus von unterschiedlichem Umfang sein (n 1
=1=
n2 ) .
III Grundlagen der mathematischen Statistik
564
Anmerkungen (1) Zwischen abhdngigen Stichproben besteht somit eine Kopplung. Man spricht daher in diesem Zusammenhang auch von verbundenen oder korrelierten Stichproben. (2)
Zwei Stichproben, die diese beiden Bedingungen nicht zugleich erfullen, heiBen dagegen voneinander unabhdngig tunabhdngige Stichproben). So sind beispielsweise zwei Stichproben von unterschiedlichem Umfang stets voneinander unabhdngig.
Wir erlautern diese Begriffe an zwei einfachen Beispielen. •
Beispiele
(1)
Der Vergleich zweier MeBverfahren oder zweier Meligerate fiihrt haufig zu abhdngigen oder verbundenen Stichproben, wie das folgende Beispiel zeigen soll: Aus einer Serienproduktion von Widerstanden mit einem bestimmten vorgegebenen Sollwert (der hier nicht naher interessiert) entnehmen wir wahllos n Widerstande, die wir der Reihe nach von 1 bis n durchnumerieren 'und durch die Symbole
kennzeichnen. Dann messen wir den Widerstandswert eines jeden dieser Widerstande mit zwei verschiedenen Meligeraten und erhalten somit fur den i-ten Widerstand R, genau zwei MeBwerte Xi und Yi (i == 1, 2, ... , n). Die beiden MeBreihen und sind vom gleichen Umfang und konnen dabei als Stichproben aus zwei normalverteilten Grundgesamtheiten aufgefaBt werden, die wir durch die Zufallsvariablen X und Y beschreiben. Offensichtlich handelt es sich dabei um zwei abhdngige oder verbundene Stichproben:
4 Parametertests
565
Die umkehrbar eindeutige Zuordnungsvorschrift lautet: (i == 1, 2, ... , n)
Zum Widerstand R, gehort somit das Wertpaar (Xi; (2)
yJ.
Ein Automobilhersteller produziert einen bestimmten Autotyp an zwei verschiedenen Standorten A und B. Um den mittleren Benzinverbrauch der Fahrzeuge in Abhangigkeit von ihrem Produktionsstandort miteinander vergleichen zu konnen, werden in beiden Werken Testjahrzeuge ausgewahlt und deren mittlerer Benzinverbrauch ermittelt:
Dabei bedeuten: Xi: Mittlerer Benzinverbrauch des i-ten Testfahrzeugs aus Werk A (i == 1, 2, ... , n 1 ) Yk: Mittlerer Benzinverbrauch des k-ten Testfahrzeugs aus Werk B (k == 1, 2, ... , n.2 )
Die beiden Stichproben sind offensichtlich voneinander unabhdngig, da keinerlei Zusammenhang zwischen den Fahrzeugen der beiden Werke erkennbar ist. Diese Aussage gilt auch im Sonderfall n 1 == n 2 , d.h. wenn aus beiden Werken gleichviele Testfahrzeuge ausgesucht werden.
• 4.5.3.2 Differenzentests bei abhangigen Stichproben Bei abhdngigen oder verbundenen Stichproben laBt sich der DifJerenzentest auf die in den Abschnitten 4.5.1 und 4.5.2 beschriebenen Parametertests fur den Mittelwert u einer normalverteilten Grundgesamtheit zuriickfiihren.
566
III Grundlagen der mathematischen Statistik
Wir beschreiben den zweiseitigen Differenzentest wie folgt:
4 Parametertests
567
Anmerkung Es wird also getestet, ob die durch Differenzbildung erhaltene Stichprobe z l' Z2, ... , Zn einer normalverteilten Grundgesamtheit mit dem Mittelwert f1 = 0 entstammt. Wir miissen dabei noch zwei Falle unterscheiden, je nachdem ob die Varianz (I2 dieser Grundgesamtheit bekannt oder unbekannt ist: 1. Fall: Die Varianzen (It und (I; der beiden Zufallsvariablen X und Y sind bekannt. Dann aber gilt 2 (It (II (It + (I; (I=-+-=--n n n
(III -195)
und wir konnen das in Abschnitt 4.5.1 besprochene Priifverfahren anwenden (die verwendete Testvariable ist in diesem Fall standardnormalverteilt). Diese Aussage gilt ndherungsweise auch bei unbekannten Varianzen, sofern die verwendeten abhangigen Stichproben hinreichend umfangreich sind (Faustregel: n > 30). In diesem Fall verwendet manals Schdtzwert fur die unbekannte Varianz (I2 die Stichprobenvarianz S2 (d.h. die Varianz der Stichprobe Zl, Z2, ... , zn). Inder Praxis wird man daher nach Moglichkeit immer auf umfangreiche abhdngige Stichproben zuriickgreifen. 2. Fall: Die Varianzen (It und (I; der beiden Zufallsvariablen X und Y sind unbekannt. Dann bleibt auch die Varianz (I2 unbekannt und wir miissen das in Abschnitt 4.5.2 dargestellte Testverfahren verwenden (die Testvariable gcniigt jetzt einer t-Verteilung mit f = n - 1 Freiheitsgraden). Dieser Fall tritt ein bei kleinen abhdngigen Stichproben mit n ~ 30.
•
Beispiel
Zwei verschiedene MeBmethoden fur elektrische Widerstande sollen miteinander verglichen werden. Aus diesem Grund wurden an 6 Widerstanden Parallelmessungen vorgenommen, die zu dem folgenden MeBprotokoll fiihrten (Xi: MeBwerte nach der Methode A; Yi: MeBwerte nach der Methode B; alle Werte in Q): i
1
2
3
4
5
6
Xi
100,5
102,0
104,3
101,5
98,4
102,9
Yi
98,2
99,1
102,4
101,1
96,2
101,8
Zu jedem der 6 Widerstande gehort genau ein Wertepaar (Xi; yJ. Es handelt sich also urn abhdngige Stichproben (MeBreihen). Durch Differenzbildung z, = Xi - Yi erhalten wir dann die folgende Stichpro be (alle Werte in Q):
2,3
2
3
4
5
6
2,9
1,9
0,4
2,2
1,1
III Grundlagen der mathematischen Statistik
568
1. Schritt: Das Signifikanzniveau ist vorgegeben: 2. Schritt: Wegen der unbekannten Varianz
Z -J.10
Z
s/0z
s/~
2
(J
r:J,
== 0,01.
miissen wir die Testvariable
T==--==--
verwenden, die der t-Verteilung mit f == n - 1 == 5 Freiheitsgraden geniigt. Den kritischen Wert c bestimmen wir dann aus der Bestimmungsgleichung P( - c
~
T
~
C)H o == 1 - a == 1 - 0,01 == 0,99
unter Verwendung von Tabelle 4 im Anhang (Bild III-57):
P( - c
~
T
~
C)H o = F(c) - F( - c) == F(c) - [1 - F(c)] ==
== 2 . F (c) - 1 == 0,99 F(c) == 0,995
f=5
c ==
t(0,995; 5)
== 4,032
Bild III-57
o
-c
c
Der nicht-kritische Bereich (Annahmebereich) lautet daher:
- 4,032 ~ t
~
4,032
569
4 Parametertests
3. Schritt: Wir berechnen nun den Mittelwert 2 und die Standardabweichung s der Stichprobe unter Verwendung der folgenden TabelIe:
_ Z
2,3
0,5
0,25
2
2,9
1,1
1,21
3
1,9
0,1
0,01
4
0,4
-1,4
1,96
5
2,2
0,4
0,16
6
1,1
-0,7
0,49
1
=_. 6
6
L z,
1
=
6° 10,8 o =
1,8 o
i= 1 6 S2
= _1_. \ 6-1
L
(z, -
2)2
= -51 ·4,08 0 2 = 0,816 0 2
i = 1
s = )0,8160 2 = 0,903 0
Damit erhalten wir fur die Testvariable T den folgenden Test- oder Prifwen: ~ 2 - Jlo (1,8 - 0) Q t=--= =4883 s/0z 0,903 0/)6 ,
t
4. Schritt (Testentscheidung): Der Testwert = 4,883 fallt in den kritischen Bereich It I > 4,032 (Bild III -58). Die N ullhypothese H 0 : Jl == Jlo = ist somit abzulehnen. Die beiden MeBmethoden konnen daher nicht als gleichwertig angesehen werden.
°
III Grundlagen der mathematischen Statistik
570
0,99
0,005
0,005
-4,032
~
°
-
Ablehnung (kritischer Bereich)
4,032
Annahmebereich (nicht-kritischer Bereich)
t=4,883
--l
Ablehnung (kritischer Bereich)
Bild III-58 Der Testwert i = 4,883 fallt in den kritischen Bereich, die Nullhypothese H o : fl = flo = 0 wird daher abgelehnt
• 4.5.3.3 Differenzentests bei unabhangigen Stichproben Wir testen jetzt die Nullhypothese H o: 111 == 112
(111-196)
gegen die Alternativhypothese H 1 : 111 i= 112
(111-197)
unter Verwendung von unabhdngigen Stichproben und
(III -198)
mit den Stichprobenumfangen n 1 und n 2 . Der Differenzentest hangt dabei noch ganz wesentlich davon ab, ob die Varianzen af und at der beiden zugehorigen normalverteilten Zufallsvariablen X und Y bekannt sind oder nicht. Wir unterscheiden daher noch zwei FaHe:
1. Fall: Differenzentest fur die Mittelwerte III und 112 zweier Normalverteilungen mit bekannten Varianzen u; und ui Trifft die Nullhypothese H o zu, gilt also 111 == 112 und sind die Varianzen af und at der beiden normalverteilten Grundgesamtheiten bekannt, so ist die Zufallsvariable Z == X - Y ebenfalls normalverteilt mit dem Mittelwert 11 == 0 und der Varianz (III -199) X und Y sind dabei die bereits aus Abschnitt 3.2.3 bekannten Schdtzfunktionen fur die beiden unbekannten Mittelwerte 111 und 112.
4 Parametertests
571
Als Testvariable eignet sich dann die standardnormalverteilte Zufallsvariable
z X-y u=-=-(J
(111-200)
(J
Die Nullhypothese (111-201)
H o : fJl = fJ2
wird dabei nur dann beibehalten (d.h. nicht abgelehnt), wenn die aus den beiden Stichprobenmittelwerten X und y gebildete Differenz X - Y nicht signifikant vorn Wert Null abweicht. Die kritischen Grenzen =+= c * miissen daher nach Vorgabe einer (kleinen) Signifikanzzahl (Irrtumswahrscheinlichkeit) rJ. so bestimmt werden, daB die Werte der Zufallsvariablen Z = X - Y mit der statistischen Sicherheit (Wahrscheinlichkeit) y == 1 - a in den nicht-kritischen Bereich (Annahmebereich) fallen (hellgrau unterlegte Flache in Bild III-59).
o
-c*
x-y
c*
Bild III-59 Zur Bestimmung der kritischen Grenzen
+ c* fur
die Zufallsvariable Z =
X- Y
Die Bedingung fur den kritischen Wert c* lautet somit:
P(-c*
~
~
X - Y
C*)H o == Y == 1 -
rJ.
(111-202)
Beim Ubergang von der Zufallsvariablen Z == X - Y zur standardnormalverteilten Test-
Z
X-Y
(J
(J
variablen U == - == - - - wird daraus die Bedingung
P(
c*
c*)
--~U~(J
(J
==y==l-rJ. H
(111-203)
o
die wir unter Verwendung der Abkiirzung c == c*/(J auch wie folgt schreiben konnen: P ( - c ~ U ~ c)H 0 == y == 1 -
rJ.
(III -204)
Die Konstante c, d. h. der kritische Wert fur die Testvariable U HiBt sich mit Hilfe von Tabelle 2 im Anhang bestimmen (Tabelle der Quantile der Standardnormalverteilung). Der Annahmebereich oder nicht-kritische Bereich liegt dann zwischen den beiden Grenzen c; == - c und Co = c (Bild 111-60).
III Grundlagen der mathematischen Statistik
572
r
-c
A blehnung (kritischer Bereich)
o
c
u
-.
Ablehnung (kritischer Bereich)
Annahmebereich (nicht-kritischer Bereich)
Bild 111-60 Zur Bestimmung des kritischen Wertes c fur die standardnormalverteilte Testvariable U
Wir berechnen nun die Mittelwerte x und y der beiden vorgegebenen unabhangigen Stichproben und daraus den Wert der Testvariablen U: A
x-y
(111-205)
U==-(J
Es folgt dann die Testentscheidung: Fallt der Test- oder Prufwert 11 in das Intervall (111-206)
-c~u~c
(Annahmebereich), so wird die Nullhypothese H o: III == 112 beibehalten (d.h. nicht abgelehnt), anderenfalls aber zugunsten derAlternativhypothese H 1 : III -=1= 112 abgelehnt (Bild 111-61).
H o beibehalten
1-a
H o ablehnen
a/2
-c Ablehnung (kritischer Bereich)
o Annahmebereich (nicht-kritischer Bereich)
c
u
-:
Ablehnung (kritischer Bereich)
Bild 111-61 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : /11
= /12
4 Parametertests Wir fassen diesen Parametertest wie folgt zusammen:
573
III Grundlagen der mathematischen Statistik
574
Anmerkungen
(1)
Fur die Zufallsvariable Z = X - Y =
(J
U erhalt man somit den kritischen Wert
(111-215) Fallt die aus den beiden Stichprobenmittelwerten x und in den Annahmebereich - c*
~
X-
y gebildete Differenz x- y
Y ~ c*
(111-216)
so wird die Nullhypothese H o beibehalten (d.h. nicht abgelehnt), anderenfalls muB sie zugunsten der Alternativhypothese H 1 verworfen werden (Bild III-62).
-c*
blehnUng
~
(kritischer Bereich)
o Annahmebereich (nicht-kritischer Bereich)
c*
x-y
-l
Ablehnung (kritischer Bereich)
Bild 111-62 Annahmebereich beim zweiseitigen Differenzentest fur Mittelwerte (bei bekannten Varianzen und Verwendung unabhangiger Stichproben)
4 Parametertests
575
(2)
Dieser Differenzentest UiBt sich auch fur einseitige Fragestellungen durchfuhren. In diesem Fall gibt es nut eine kritische Grenze (vgl. hierzu Anmerkung (2) in Abschnitt 4.5.1).
(3)
Bei umfangreichen Stichproben (Faustregel: n 1 , n2 > 30) diirfen die Varianzen af und at ndherungsweise durch ihre Schdtzwerte sf und st, d.h. durchdie Stichprobenvarianzen ersetzt werden, falls sie unbekannt sein sollten (vgl. hierzu das nachfolgende Beispiel).
•
Beispiel Mit dem DifJerenzentest soIl gepriift werden, ob die auf zwei verschiedenen Maschinen A und B hergestellten Gliihbimen im Mittel - wie vermutet wird die gleiche Lebensdauer besitzen. Dabei konnen wir davon ausgehen, daB die beiden Zufallsvariablen
x = Lebensdauer einer auf der M aschine A produzierten Gliihbirne und
Y = Lebensdauer einer auf der Maschine B produzierten Gliihbirne normalverteilt sind. Zu Priifzwecken entnehmen wir daher den beiden (normalverteilten) Grundgesamtheiten jeweils eine Stichprobe, deren Auswertung zu dem folgenden Ergebnis fiihrte (Angabe von Umfang, Mittelwert und Standardabweichung der jeweiligen Stichprobe):
x=
520 h,
Sl =
50 h
y=
500 h,
S2 =
45 h
Da die Stichprobenumfange hinreichend groft sind (n1 = 80 > 30, n2 = 50 > 30), diirfen wir die unbekannten Varianzen af und at der beiden Grundgesamtheiten ndherungsweise durch die Stichprobenvarianzen sf = (50 h)2 =2500 h 2 s5: = (45 h)2 = 2025 h 2 und
ersetzen. Wir testen jetzt die Nullhypothese H o : f11 =
f12
gegen die Alternativhypothese
H 1 : f11
=1= f12
schrittweise wie folgt: 1. Schritt: Wir wahlen als Signifikanzzahl (Irrtumswahrscheinlichkeit) a = 0,01.
III Grundlagen der mathematischen Statistik
576
2. Schritt: Berechnung der Varianz a 2 der Zufallsvariablen Z chung (111-199): a2
==
x - Y nach Glei-
af. + -a; ~ -sf + -s; == (2500 2025) 2 h - - + - - h == 71 75 2
== -
n2
»,
n2
»,
80
50
Die Standardabweichung betragt somit a == )71,75 h 2 Wert c fur unsere standardnormalverteilte Testvariable
X-y
'
==
8,471 h. Der kritische
X-y
u- - ---8,471 - -h a wird aus der Bedingung P( - c
~
U
~
C)H o
==
1 - a == 1 - 0,01 == 0,99
wie folgt unter Verwendung von Tabelle 2 im Anhang bestimmt (vgl. hierzu Bild 111-63): P(-c
~
U
~
C)H o == ¢(c) - ¢(-c) == ~
¢(c) == 0,995
==
¢(c) - [1 - ¢(c)] ==
2 . ¢(c) - 1 == 0,99 c ==
U O,995
==
2,576
Bild 111-63
o
-c
c
u
Der nicht-kritische Bereich (Annahmebereich) ist somit durch das symmetrische Intervall - 2,576
~ U ~
2,576
gegeben (Bild III -64).
3. Schritt: Mit x == 520 h, Y == 500 h und a ble U den folgenden Test- oder Prufwert: A
U
X-
Y
== - - ==
a
(520 - 500) h == 2361 8,471 h '
==
8,471 h erhalten wir fur die Testvaria-
4 Parametertests
577
u
4. Schritt (Testentscheidung): Unser Testwert = 2,361 fallt in den Annahmebereich, d.h. es gilt - 2,576 ~ u ~ 2,576 (Bild 111-64). Die Testentscheidung lautet daher: Aufgrund der verwendeten Stichprobe kann die Nullhypothese H o : III = 112 nicht abgelehnt werden. Wir konnen somit davon ausgehen, daB beide Maschinen Gliihbirnen von gleicher mittlerer Lebensdauer produzieren. Zumindest spricht das Stichprobenmaterial nicht gegen diese Annahme. 0,99
u=2,361 0,005
0,005
o
-2,576
~
2,576
u
_.
-~
Annahmebereich (nicht-kritischer Bereich)
Ablehnung (kritischer Bereich)
Ablehnung (kritischer Bereich)
Bild 111-64 Der Testwert u = 2,361 fallt in den Annahmebereich, die Nullhypothese H 0 : J11 = J12 wird daher beibehalten, d. h. nicht abgelehnt
• 2. Fall: Differenzentest fur die Mittelwerte III und 112 zweier N ormalverteilungen mit gleicher, aber unbekannter Varianz (a; = at) Bisher sind wir von normalverteilten Zufallsvariablen X und Y mit bekannten Varianzen alausgegangen. Etwas anders liegen die Verhaltnisse, wenn die Varianzen zwar als gleich angesehen werden konnen (af = al), jedoch unbekannt sind. In diesem Fall verwendet man (unter sonst gleichen Voraussetzungen) als Testgroj3e die Zufallsvariable
af und
T=
n l n 2 (n l
nl
+ n2 + n2
-
2)
X - Y
J(n l
-
l)Sf
(111-217)
+ (n2
-
l)Sl
die der t- Verteilung von Student mit J = n l + n 2 - 2 Freiheitsgraden geniigt 34). n l und n 2 sind dabei wiederum die Umfiinge der verwendeten unabhiingigen Zufallsstichproben, Sf und S1die bereits aus Abschnitt 3.2.4 bekannten Schdtzfunktionen fur die unbekannten Varianzen af und al.
34)
Unter der Voraussetzung, daB die Nullhypothese H o :111
= 112
zutrifft.
578
III Grundlagen der mathematischen Statistik
Der zweiseitige Parametertest verlauft jetzt nach dem folgenden Schema:
4 Parametertests
n
579
-c
kritischer Bereich (Ablehnung)
o nicht-kritischer Bereich (Annahmebereich)
c
-J
kritischer Bereich (Ablehnung)
Bild 111-65 Zur Bestimmung des kritischen Wertes c fur die einer t-Verteilung geniigende Testvariable T
III Grundlagen der mathematischen Statistik
580
H o beibehalten
H o ablehnen
n
o
-c
Ablehnung (kritischer Bereich)
c
Annahmebereich (nicht-kritischer Bereich)
--l
Ablehnung (kritischer Bereich)
I
Bild 111-66 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothcse
H o : /11 = /12
Anmerkungen (1) Bei gleichem Stichprobenumfang (n 1 = n2 = n) vereinfacht sich die Formel (111-225) zur Ermittlung des Test- oder Prifwertes wie folgt: t-- =
vrn
x-y 0
Jsf + si
=
[;f;
-2--2
Sl
+ S2
0
(x - jl)
(111-227)
(2)
Dieser Differenzentest HiBt sich auch fur einseitige Fragestellungen durchfiihren. In diesem Fall gibt es nur eine kritische Grenze (vgl. Anmerkung (2)in Abschnitt 405.1).
(3)
Wird die Nullhypothese H 0: f.11 = folgenden Beziehungen: f.11
=
f.12
f.12
beibehalten (doh. nicht abgelehnt), so gelten die
und
(111-228)
Die beiden unabhangigen Stichproben stammen somit aus der gleichen Grundgesamtheit.
•
Beispiel Durch eine Stichprobenuntersuchung solI die Leistung zweier Olpumpen miteinander verglichen werden. Wir setzen dabei voraus, daB die beiden Zufallsvariablen X
= Gefiirdertes Olvolumen pro Minute bei Pumpe A
und Y = Gefiirdertes Olvatumen pro Minute bei Pumpe B
normalverteilt sind und die gleiche, aber unbekannte Varianz besitzen (a-; = ai).
4 Parametertests
581
Eine konkrete Stichprobenuntersuchung erbrachte das folgende Ergebnis:
x == 50 Lrnin,
S1
== 4,2 l/min
y == 45 l/min,
S2
== 4,8 l/min
Konnen wir aus diesen unabhdngigen Stichproben schlieBen, daB die Pumpe B weniger leistet als die Pumpe A? Urn diese Frage beantworten zu konnen, fiihren wir einen einseitigen Differenzentest durch. Wir testen dabei die Nullhypothese
n.; 111
~ 112
gegen die Alternativhypothese H 1 : 111 > 112
schrittweise wie folgt: 1. Schritt: Als Signifikanzzahl (Irrtumswahrscheinlichkeit) wahlen wir rt == 0,05. 2. Schritt: Die Testvariable Taus Gleichung (III -221) nimmt dann mit der statistischen Sicherheit y == 1 - rt== 0,95 Werte aus dem einseitigen Intervall T ~ c an (Bild 111-67): 0,95
Bild 111-67
o
c
Aus der Bedingung P(T ~
C)H o
== 1 - rt == 1 - 0,05 == 0,95
bestimmen wir mit Hilfe der Tabelle 4 im Anhang die kritische Grenze c (Anzahl der Freiheitsgrade: f == n 1 + n 2 - 2 == 10 + 12 - 2 == 20): P(T ~
C)Ho
== F(c) == 0,95
f=20 ------+)
C
==
t(0,95;20)==
1,725
Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-68): t
~
1,725
3. Schritt: Aus den bekannten Mittelwerten und Varianzen der beiden unabhangigen Stichproben berechnen wir zunachst die HilfsgrofJe S2 nach Formel (111-224): S2
2
== (n 1 -1)sf + (n 2 -1)si == (9.4,2 + 11· 4,82)~ == 2061 ~ n1
+ n2
-
2
20
min 2
'
min?
III Grundlagen der mathematischen Statistik
582
Daraus erhalten wir den folgenden Test- oder Priqwert fur unsere Testvariable T:
~
_[gfln2
t-
nl
+ n2
X-
Y_
.---
N0'
12 (50 - 45) Ijmin_ -2,572 22 J20,611jmin
--.
s
4. Schritt (Testentscheidung): Der aus der Stichprobenuntersuchung erhaltene Testoder Prifwert t = 2,572 fallt in den kritischen Bereich t > 1,725 (Bild 111-68). Wir miissen daher die Nu11hypothese H o : 111 ~ 112 zugunsten der Alternativhypothese H 1: 111 > 112 verwerfen und konnen somit davon ausgehen, daB (bei einer Irrtumswahrscheinlichkeit von 50/0) die Pumpe B tatsachlich weniger leistet als die Pumpe A.
o
1,725
-~
Annahmebereich (nicht-kritischer Bereich)
Bild 111-68 Der Testwert
i=
Ablehnung (kritischer Bereich)
2,572 fallt in den kritischen Bereich, die Nullhypothese
H o : 111 ~ 112 wird daher verworfen
• 4.5.4 Tests fur die unbekannte Varianz
(12
einer Normalverteilung
Urn beispielsweise die Gleichmdfiigkeit eines Produktionsablaufes oder die Genauigkeit eines MeBinstrumentes beurteilen und bewerten zu konnen, benotigt man Kenntnisse iiber die Varianzen der entsprechenden Zufallsgrolien. Diese aber sind in der Praxis meist unbekannt. Eine in den technischen Anwendungen daher haufig auftretende Aufgabe besteht darin, mit Hilfe einer Stichprobenuntersuchung zu priifen, ob die unbekannte Varianz (J 2 einer normalverteilten Zufallsvariablen X einen bestimmten Wert (J 6 besitzt, wie man z.B. aufgrund langjahriger Erfahrungen vermutet oder infolge einer speziellen Maschinen- oder Automateneinstellung erwartet. Bei der Losung dieser Aufgabe erweist sich die Zufallsvariable S2
Z
= (n -1)-
(111-229)
(J6
als eine geeignete Test- oder Prifvariable, wobei n der Umfang der verwendeten Stichprobe Xl' X 2 , .•. , x; und S 2 die bereits aus Abschnitt 3.2.4 bekannte Schdtzfunktion fur die unbekannte Varianz (J 2 sind. Die Testvariable Z geniigt dabei der Chi-Quadrat- Verteilung mit f = n - 1 Freiheitsgraden.
4 Parametertests Der zweiseitige Parametertest verlauft dann nach dem folgenden Schema:
583
III Grundlagen der mathematischen Statistik
584
Bild 111-69 Zur Bestimmung der kritischen Grenzen Chi-Quadrat-Verteilung geniigende Testvariable Z
1-a
At:~~Ung (kritischer Bereich)
C1
und
C2
fiir die einer
H o beibehalten
Annahmebereich (nicht-kritischer Bereich)
Ablehn~;;'l (kritischer Bereich)
Bild 111-70 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : (J2 = (J~
585
4 Parametertestas Anmerkungen
(1)
Der beschriebene Test ist zugleichauch ein Test fur die (ebenfalls unbekannte) Standardabweichung (J der normalverteilten Grundgesamtheit. Der Nullhypothese H 0 : (J == (J 0 fur die Standardabweichung entspricht dabei die Nullhypothese H 0 : (J 2 == (J 6 fur die Varianz.
(2)
Analog verlaufen die einseitigen Parametertests, bei denen es jeweils nur eine kritische Grenze c gibt. Diese liifit sich aus den folgenden Bedingungen mit Hilfe von Tabelle 3 im Anhang leicht bestimmen: 1. Fall: Abgrenzung nach oben (Bild 111-71) 1-a
P(Z ::::;; C)H o == 1 -
ri
Annahmebereich: z ::::;; c
o
c Annahmebereich
a
I_
Z
Ablehnu~g-1
kritische Grenze
Bild 111-71 Annahmebereich bei einem einseitigen Test (Abgrenzung nach oben)
2. Fall: Abgrenzung nach unten (Bild 111-72)
P(Z. < C)H o ==
ri
Annahmebereich: z
~ C
a
o 1-
c
-~
AbJehnung
z
Annahmebereich
kritische Grenze
Bild 111-72 Annahmebereich bei einem einseitigen Test (Abgrenzung nach unten)
586 •
III Grundlagen der mathematischen Statistik Beispiel
Bei der Serienherstellung von Schrauben mit einer bestimmten Lange kann die Zufallsvariable
x = Lange einer Schraube als eine normalverteilte Grobe betrachtet werden. Aufgrund langjahriger Erfahrungen weiB man, daB die Standardabweichung einen Wert von (50 = 1,2 mm besitzt. Eine zu Kontrollzwecken entnommene Zufallsstichprobe vom Umfang n = 25 ergab jedoch eine empirische Standardabweichung von s = 1,5 mm. Kann diese Abweichung noch durch zufdliige Schwankungen erklart werden oder ist sie signijikant?
Liisung: Urn eine Entscheidung treffen zu konnen, ob die beobachtete Abweichung zufallsbedingt ist oder nicht, fiihren wir hier sinnvoller Weise einen einseitigen Parametertest durch und testen daher die Nullhypothese H o : (52
~
(55
= 1,44 mm?
gegen die Alternativhypothese
H1 :
(52
>
(55
= 1,44 mm?
schrittweise wie folgt: 1. Schritt: Wir wahlen das Signijikanzniveau rx
= 0,01.
2. Schritt: Die Testvariable Z
S2
S2
(56
1,44 mm '
= (n -1)- = 2 4 · - - -
geniigt dann einer Chi-Quadrat-Verteilung mit j = n - 1 = 24"Freiheitsgraden. Die Berechnung der kritischen Grenze c erfolgt dabei aus der Bedingung
P(Z
~ C)H o
= 1 - rx = 1 - 0,01 = 0,99
(Bild III-73). 0,99
Bild 111-73
o
c
z
Unter Verwendung von Tabelle 3 aus dem Anhang erhalten wir:
P(Z
~ C)H o
= F(c) = 0,99
f=24
c=
Z(0,99;24)
= 43
587
4 Parametertests Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-74): z ~ 43
3. Schritt: Mit n = 25, oder Priifwert
S2
= 2,25 mm? und (J6 = 1,44 mm ' erhalten wir den Test225 mm '
S2
Z = (n - 1) - = 24· ' = 37 5 (J6 1,44 mrrr' ' furdie Testvariable Z.
z
4. Schritt (Testentscheidung): Da der Test- oder Priifwert = 37~5 in den Annahmebereich z ~. 43 fallt, kann die Nullhypothese H a: (J2 ~ (J6 = 1,44 mm ' auf der Basis der verwendeten Stichprobe nicht abgelehnt werden (Bild 111-74). Die Abweichung der Stichprobenvarianz S2 = 2,25 mrrr' vom langjahrigen Erfahrungswert (J5 = 1,44 mm ' ist daher auf dem gewahlten Signifikanzniveau a =0,01 = 1 % als zufallsbedingt zu betrachten. Die gleiche Aussage gilt dann auch fur die Standardabweichung, d.h. wir konnen davon ausgehen, daB die Standardabweichung den Wert (J = (Ja = 1,2 mm besitzt.
0,99
o
H o beibehalten
z=37,5
Annahmebereich (nicht-kritischer Bereich)
z
43
-l
Ablehnung (kritischer Bereich)
z
Bild 111-74. Der Testwert = 37,5 fallt in den Annahmebereich, die NulIhypothese H o : (J2 ~ (J6 = 1,44 mm ' wird daher beibehalten, d.h. nicht abgelehnt
•
4.5.5 Tests fur einen unbekannten Anteilswert p (Parameter p einer Binomialverteilung) In einer statistischen Qualitiitskontrolle hat man es haufig mit einer binomialverteilten Grundgesamtheit zu tun, deren Parameter p jedoch unbekannt ist. Ein Musterbeispiel dafiir ist der Ausschuj3anteil p bei der Serienfabrikation von speziellen Bauelementen, d. h. also der Anteil p an fehlerhaften Teilen in der Gesamtproduktion.
588
III Grundlagen der mathematischen Statistik
Wird in einem konkreten Fall dabeivermutet, daB dieser Parameter einen bestimmten Wert Po besitzt (p == Po), so HiBt sich diese Hypothese durch einen geeigneten Parametertest iiberpriifen: Mantestet dann mittels einer Stichprobenuntersuchung die Nullhypothese (111-238) gegen die Alternativhypothese (111-239)
H 1 : P =F Po nach dem bereits bekannten Schema schrittweise wie fogt: (1)
Wir wahlen zunachst wieder eine bestimmte (kleine) Signifikanzzahl (Irrtumswahrscheinlichkeit) rx (0 < rx < 1).
(2)
Als Schdtzfunktion fur den unbekannten Parameter p verwenden wir die MaximumLikelihood-Schdtzfunktion
-- X p==-
(111-240)
n
die uns bereits aus den Abschnitten 3.2.5 und 3.3.2.1 vertraut ist 35). Diese Zufallsvariable ist binomialverteilt mit dem Mittel- oder Erwartungswert ECP) == Po und der Varianz Var(P) == Po(l- po)/n (immer unter der Voraussetzung, daB die Nullhypothese H o: p == Po auch zutrifft). Bei Verwendung umfangreicher Stichproben 36) folgt dann aus dem Grenzwertsatz von M oivre und Laplace, daB sich die Schdtzfunktion P anndhernd normalverteilt verhalt und zwar mit dem Mittelwert u == Po und der Varianz (J2 == Po(1 - po)/n. Die zugehorige standardisierte Zufallsvariable
P-j1 U
P-p
== - ( J - = Jpo(1 ;:Opo) =
~--
-J~' (P -
Po)
(111-241)
ist dann ndherungsweise standardnormalverteilt und erweist sich als eine geeignete Testvariable fur diesen Parametertest. (3)
35)
Der weitere Ablauf dieses zweiseitigen Tests verlauft dann wie bereits in Abschnitt 4.5.1 ausfiihrlich beschrieben.
Die Zufallsvariable X
=
Anzahl der .Erfolge" bei einer n-fachen Ausfiihrung des Bernoulli-Experiments
ist normalverteilt mit dem Mittelwert E(X) = npo und der Varianz Var(X) = nPo(1 - Po) (vgl. hierzu Kapitel II, Abschnitt 6.1). Ais .Erfolg" wird dabei das Eintreten des Ereignisses A gewertet. 36)
Faustregel: Eine Stichprobe wirdals umfangreich betrachtet, wenn die Bedingung nPo(1 - Po) > 9 erfiillt ist.
4 Parametertests
589
III Grundlagen der mathematischen Statistik
590
-c
o
c
--l
Bild 111-75
Ablehnung (kritischer Bereich)
Annahmebereich (nicht-kritischer Bereich)
Ablehnung (kritischer Bereich)
u
Ho beibehalten
1-a
Ho ablehnen
a/2
-c
I I I
:;blehnUng (kritischer Bereich)
o Annahmebereich (nicht-kritischer Bereich)
c
u
.:
Ablehnung (kritischer Bereich)
Bild 111-76
4 Parametertests
591
Anmerkungen (1) Man beachte, daB dieser Parametertest nur fur umfangreiche Stichproben gilt, d.h. fur solche, die der Bedingung npo(1 - Po) > 9 genugen, Bei kleinem Stichprobenumfang ist diese Bedingung jedoch nicht erfiillt und das angegebene Priifverfahren daher nicht anwendbar. Wir miissen in diesem .Fall auf die Spezialliteratur verweisen (siehe Literaturverzeichnis). (2)
Analog verlaufen die einseitigen Parametertests. In diesen Fallen gibt es jeweils nur eine kritische Grenze c. Die naheren Einzelheiten sind in Abschnitt 4.5.1, Anmerkung (2) bereits ausfiihrlich beschrieben. Sie gelten sinngemiijJ auch fur diesen Parametertest.
•
Beispiel Der Hersteller eines bestimmten elektronischen Bauelements behauptet, daB seine Produktion hiichstens 4% AusschuB enthalte. Bei der Anlieferung eines gr6Beren Postens dieser Elemente wurde von Seiten des Abnehmers ein Giitekontrolle durchgefiihrt. Sie bestand in diesem Fall in einer Stichprobenuntersuchung von n = 300 Bauelementen. Unter ihnen befanden sich dabei k = 15 funktionsuntiichtige (d.h, defekte) Teile. Man iiberprufe die Angaben des Herstellers auf einem Signifikanzniveau von a = 0,01.
Liisung: Da in diesem Fall nur die Abweichungen nach oben interessieren 37\ wenden wir hier ein einseitiges Priifverfahren an und testen die N ullhypothese H o: p
~
Po = 0,04
gegen die Alternativhypothese
H 1 : P > Po = 0,04 Die Voraussetzung einer umfangreichen Stichprobe ist dabei gegeben, da die Bedingung (111-242) erfidlt ist:
nPo(1 - Po) = 300· 0,04' 0,96 = 11,52 > 9 1. Schritt: Die Signifikanzzahl (Irrtumswahrscheinlichkeit) ist vorgegeben: a
= 0,01.
2. Schritt: Wir berechnen die kritische Grenze c der standardnormalverteilten Testvariablen
U
;;;-
~
= ~ ~. (P -
Po)
=
°, °,
300 ~ ~ 04 . 96 . (P - 0,04) = 88,388 (P - 0,04)
aus der Bedingung P(U ~ C)H o = 1 - a = 1 - 0,01 = 0,99
(Bild 111-77). 37)
Gegen einen AusschuBanteil unterhalb von 4% hat keineretwas einzuwenden!
III Grundlagen der mathematischen .Statistik
592
Bild 111-77
o
u
c
Unter Verwendung von Tabelle 2 im Anhang erhalten wir dann fur die unbekannte Schranke eden folgenden Wert: P(U ~
C)H
o
= ¢(c) = 0,99
-+
c=
U O,99
= 2,326
Der nicht-kritische Bereich (Annahmebereich) lautet damit(Bild 111-78): U ~
2,326
3. Schritt: Der Schdtzwert fur den unbekannten Parameter (Anteilswert) P betragt k 15 P = ;; = 300 = 0,05 A
Somit besitzt die Testvariable U den Test- oder Priifwert
11 = 88,388 (p - 0,04) = 88,388 (0,05 - 0,04) = 0,884 4. Schritt (Testentscheidung): Der Test- oder Prifwert 11 = 0,884 fallt in den Annahmebereich U ~ 2,326 (Bild III-78).· Die Nullhypothese H 0 : P .~ Po = 0,04 wird daher beibehalten, d.h. es gibt aufgrund der verwendeten Stichprobe keinen AnlaB, an den Angaben des Herstellers beziiglich eines maximalen AusschuBanteils von 40/0 zu zweifeln. Die Abweichung des aus der Stichprobe ermittelten Anteils p = 0,05 = 5% von dem vom Hersteller angegebenen Anteilswert Po = 0,04 = 40/0 ist bei dem gewahlten Signifikanzniveau von rJ, = 0,01 = 1 % nicht signifikant und somit zufallsbedingt.
Bild 111-78
o Annahmebereich (nicht-kritischer Bereich)
2,326
u
-~
Ablehnung . (kritischer Bereich)
•
4 Parametertests
593
4.6 Ein Anwendungsbeispiel: Statistische Qualitatskontrolle unter Verwendung von Kontrollkarten Bei der Herstellung von M assenprodukten miissen fur bestimmte Grofien vorgegebene Sollwerte innerhalb gewisser Toleranzen eingehalten werden. Wir nennen einige einfache Beispiele: _
Beispiele
(1)
Bei der Serienproduktion von Kondensatoren wird fur die Kapazitdt ein bestimmter Sollwert flo vorgeschrieben.
(2)
M etallstdbe aus einer bestimmten Legierung sollen eine bestimmte Zugfestigkeit flo aufweisen, die nicht unterschritten werden darf.
(3)
Bei der Serienfertigung von Wellen wird fur den Durchmesser die Einhaltung eines bestimmten Sollwertes flo gefordert. -
Die Erfahrung lehrt jedoch, daB auch bei sorgfdltigster Fertigung und Verwendung hochwertiger Materialien stets Abweichungen vom vorgeschriebenen Sol1wert auftreten, die im wesentlichen durch -
lnhomogenitdten des verwendeten Materials, Abnutzungs- und Verschleij3erscheinungen bei den produzierenden Maschinen
-
und Automaten, und nicht zuletzt auch durch menschliche Unzuldnglichkeiten
bedingt sind. Urn die Qualitat des erzeugten Produktes zu sichern, ist es daher notwendig, die Produktion zu iiberwachen, urn gegebenenfalls regulierend eingreifen zu konnen. Unter statistischer Qualitdtskontrolle versteht man die permanente Uberwachung eines Produktionsprozesses mit Hilfe spezieller statistischer Methoden. Die Qualitatskontrolle dient somit der Einhaltung bestimmter vorgegebener Sollwerte oder Normen, wobei durch einen rechtzeitigen Eingriff in den FertigungsprozeB AusschuBware weitgehend vermieden oder zumindest auf ein Minimum beschrankt werden kann. Wir wollen uns jetzt mit einer typischen Aufgabe der statistischen Qualitatskontrolle naher auseinandersetzen: Bei der Herstellung eines Massenartikels solI fur den M ittelwert fl des dabei interessierenden Merkmals X ein bestimmter Sollwert flo eingehalten werden und zwar wahrend des gesamten Fertigungsprozesses 38). Mit Hilfe der statistischen Qualitatskontrolle sind wir dann in der Lage, diese Forderung zu erfiillen. Wir gehen dabei zunachst von der Annahme (Nullhypothese) aus, daB diese Forderung erfidtt ist, d.h. daB der Sollwert flo wahrend der gesamten Produktion tatsachlich eingehalten wird.
38)
Die Grolic X kann beispielsweise die Kapazitdt eines in Massen produzierten Kondensators sein. Es wird dann z. B. gefordert, daB die normalverteilte Zufallsvariable X
=
Kapazitdt eines Kondensators
wahrend der gesamten Produktion den konstanten Mittelwert J1
= J10
besitzt.
594
III Grundlagen der mathematischen Statistik
Unsere Nullhypothese lautet daher: H o: /l
(III-250)
= /lo
Wir testen sie dann gegen die Alternativhypothese (111-251)
H 1 : /l i= /lo
auf dem allgemein iiblichen Signifikanzniveau a = 0,01 = 1 % schrittweise wie folgt 39): (1)
Stichprobenentnahme aus der laufenden Produktion in regelmalligen Zeitabstanden In regelmdjiigen Zeitabstiinden (z.B. jede Stunde) wird der laufenden Produktion eine Zufallsstichprobe vom gleichbleibenden Umfang n entnommen und der jeweilige Stichprobenmittelwert x bestimmt.
(2)
Bestimmung des Toleranzbereiches Urn die ermittelten Stichprobenmittelwerte in sinnvoller Weise mit dem vorgegebenen Sollwert /lo vergleichen zu konnen, benotigen wir den zum Signifikanzniveau a = 0,01 = 1% gehorenden nicht-kritischen Bereich (Annahmebereich), der in" diesem Zusammenhang als Toleranzbereich bezeichnet wird. Bei einer normalverteilten Zufallsvariablen X ist dieser Bereich - wie wir etwas spater noch zeigen werden durch das symmetrische Intervall /lo - 2,576 . -
a
j;;
~
_ x ~ /lo
+ 2,576 . -
a
(111-252)
j;;
gegeben. Die kritischen Grenzen cu =
IJ
r
a o - 2, 576 . -j;;
und
Co
= /lo
+ 2,576 . -
a
j;;
(111-253)
heiI3en hier Toleranz- oder Kontrollgrenzen (Bild III -79). Dabei ist (J die als bekannt vorausgesetzte Standardabweichung der normalverteilten Grundgesamtheit und n der Umfang der entnommenen Stichprobe "?', Zur Herleitung des Toleranzbereiches
Der Toleranzbereich ist nichts anderes als der zum Signifikanzniveau a = 0,01 gehorige nicht-kritische Bereich der Zufallsgrofie X. Somit gilt (vgl. hierzu Bild 111-79): Pte; ~ X ~
CO)H o =
P(/lo - c* ~ X ~ /lo
+ C*)H o =
= 1 - a = 1 - 0,01 = 0,99
(111-254)
(c* ist der kritische Wert). 39)
Es handelt sich hier im wesentlichen urn den in Abschnitt 4.5.1 besprochenen zweiseitigen Test fur den Mittelwert f.1 einer Normalverteilung.
40)
Ist (J jedoch unbekannt, so kann man mit Hilfe einer sag. Vorlaufstichprobe einen Schdtzwert fur (J ermitteln. Man ersetzt dabei (J ndherungsweise durch die Standardabweichung s dieser Vorlaufstichprobe: (J ;:::::: s.
595
4 Parametertests
f;t~cher
kritische~I
Toleranzbereich (nicht-kritischer Bereich)
I;;~reich
Bereich r
Bild 111-79 Toleranzbereich bei der statistischen Qualitatskontrolle
Beim Ubergang von der normalverteilten Zufallsvariablen X zur standardisierten (und somit standardnormalverteilten) Zufallsvariablen X-II U= _ _r'_o
(111-255)
(J/~ geht die Gleichung (111-254) iiber in P( - c ~ U ~ C)H o = 0,99
(111-256)
wobei wir bereits die Abkiirzung
~
c=c*-
(J
bzw.
(111-257)
c*=c-
0z
(J
verwendet haben (Bild III -80).
-c
o
C
u
Bild 111-80 Bestimmung des kritischen Wertes c fur die standardnormalverteilte Zufallsvariable U
596
III Grundlagen der mathematischen Statistik Mit Hilfe von Tabelle 2 im Anhang erhalten wir aus dieser Beziehung schlieBlich den folgenden Wert fiir die gesuchte Konstante e: P(-e
~
U
~
e)H o = ep(e) - ep(-e) == ep(e) - [1 - ep(e)] ==
== 2 . ep (e) - 1 == 0,99 ~
ep(e) == 0,995
Ein Stiehprobenmittelwert gung )10 -
2,576 . -
a
~
~
e ==
U O,995
== 2,576
x fallt damit in den
_ x ~
(111-258) (111-259)
Toleranzbereieh, wenn er die Bedin-
a
)10
+ 2,576 . ~
(III-260)
erfiillt. (3)
Vergleich des Stichprobeomittelwertes .i mit dem Sollwert Entscheidungsflndung
uod
}to
Wir sind jetzt in der Lage, die Qualitat der laufenden Produktion zu beurteilen und eine Entseheidung dariiberzu fallen, ob der geforderte Sollwert u., auch eingehalten wird oder ob nieht tolerierbare Abweichungen auftreten.
1. Fall: Fallt der Stichprobenmittelwert x einer entnommenen Stichprobe in den nieht-kritisehen Bereich, d.h. in den Toleranzbereieh, so wird die Abweichung vom Sollwert )10 als zufallsbedingt angesehen und toleriert. Es besteht daher in diesem Fall kein Grund, in den laufenden FertigungsprozeB einzugreifen (Bild 111-81). Produktion unterbrechen, Fehlersuche einleiten 0,99
Produktion weiterlaufen lassen
x
j-;ritiSCher I ~ereich
-
x Toleranzbereich (nicht-kritischer Bereich)
x
kritisch:; Bereich
l
Bild 111-81 Fallt der Stichprobenmittelwert in den Toleranzbereich, so laBt man die Produktion weiterlaufen, anderenfalls wird diese unterbrochen und die Fehlersuche eingeleitet
4 Parametertests
597
2. Fall: Liegt der Mittelwert X der Stichprobe jedoch im kritischen Bereich (d.h. aujJerhalb des Toleranzbereiches), so kann die beobachtete Abweichung zum Sollwert J10 nicht mehr aus der Zufalligkeit der Stichprobe erklart werden, sondern muB als signifikant angesehen werden (Bild 111-81). Die Produktion wird in diesem Fall unterbrochen, man geht auf Fehlersuche und behebt schlieBlich die gefundenen Fehler (z.B. durch Neueinstellung der Maschinen und Automaten usw.). (4)
Kontrollkarten Der Verlauf eines Fertigungsprozesses HiBt sich in sehr anschaulicher Weise auf einer sog. Kontrollkarte wie folgt darstellen (Bild III -82):
Produktionsstop, Fehlersuche einleiten
obere Kontrol/grenze
Co
obere Warngrenze w 0
- - - Sol/wert /10
untere Warngrenze
Wu
untere Kontrol/grenze
I
I
23456
I
I
I
I
7
8
Cu
Ifd. Nr. der Stichprobe
Bild 111-82 Muster einer Kontrollkarte mit Kontroll- und Warngrenzen
Die in regelmdfiigen Zeitabstanden ermittelten Stichprobenmittelwertex werden dabei in der zeitlichen Reihenfolge der Stichprobenentnahme als Punkte in die Kontrollkarte eingetragen. Dann wird der Istzustand (Stichprobenmittelwert x) mit dem Sollzustand (Sollwert J1o) verglichen. Liegt ein Wert aujJerhalb des Toleranzbereiches (grau unterlegte Flache in Bild III -82), so wird die laufende Produktion zunachst gestoppt und die Fehlersuche eingeleitet. 1m Bild ist dies der Fall bei der Stichprobe Nr. 8. Zur zusdtzlichen Sicherheit werden haufig noch die sog. Warngrenzen eingezeichnet, die einem Signifikanzniveau von C/.. == 0,05 == 5% entsprechen. Sie liegen bei (J
w == u
1/
r«
-
1,960 . -J-;"
und
wo == J10
+ 1,960 . -
(J
J-;"
(111-261)
598
III Grundlagen der mathematischen Statistik
Fallt dabei ein Stichprobenmittelwert X in den dunkelgrau dargestellten Bereich zwischen Warn- und Kontrollgrenzen (im Bild gilt dies fur die Stichproben Nr. 4 und Nr. 6), so wird sicherheitshalber eine weitere Stichprobe entnommen (Wiederholung des Tests und gegebenenfalls Abbruch der Produktion und Fehlersuche).
5 Statistische Prufverfahrcn fur die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung (, Anpassungs- oder Verteilungstests ") 5.1 Aufgaben eines Anpassungs- oder Verteilungstests Mit den in Abschnitt 4 behandelten Parametertests lassen sichAnnahmen oder Hypothesen iiber unbekannte Parameter einer Grundgesamtheit iiberprufen, wobei die Art bzw. der Typ der Wahrscheinlichkeitsverteilung als bekannt vorausgesetzt wird. So haben wir z.B. spezielle Tests fur den Mittelwert /lund die Varianz (52 einer normalverteilten Grundgesamtheit kennengelernt. Ein Anpassungs- oder Verteilungstest dagegen dientder Uberprufung einer Hypothese iiber die Art der unbekannten Wahrscheinlichkeitsverteilung. Es wird somit der Versuch unternommen, einer Grundgesamtheit mit einer unbekannten Verteilungsfunktion F(x) eine bekannte Verteilungsfunktion Fo(x) "anzupassen". Die Nullhypothese H o lautet daher wie folgt: (111-262)
(, Die Zufallsvariable X geniigt einer Wahrscheinlichkeitsverteilung mit der Verteilungsfunktion E, (x)"). Ihr stellen wir alternativ die Hypothese (111-263)
gegeniiber. Sie besagt, daB Fo (x) nicht die gesuchte Verteilungsfunktion der ZufallsvariabIen X ist. Die Uberprufung einer solchen Hypothese iiber die Art der Verteilungsfunktion erfoIgt dann mit einem speziellen Anpassungs- oder Verteilungstest unter Verwendung einer ZuJallsstichprobe, die man der betreffenden Grundgesamtheit entnommen hat. Gepriift wird dabei, ob die aus der Stichprobe gewonnenen Informationen uber die unbekannte Verteilungsfunktion F (x) mit der angenommenen, d. h. theoretischen Verteilungsfunktion Fo(x) vertriiglicn sind. Verglichen wird dabei die beobachtete Verteilung der Zufallsgr6Be X in der entnommenen Stichprobe mit der theoretisch zu erwartenden Verteilung auf-
5 Anpassungs- oder Verteilungstests
599
grund der N ullhypothese H o- Der Anpassungs- oder Verteilungstest ermoglicht dann eine Entscheidung dariiber, ob man die Nullhypothese H 0: F (x) = Fo(x) beibehalten kann oder zugunsten der Alternativhypothese H 1 : 'F (x) =I=- Fo(x) verwerfen muB. Wir fassen zusammen:
5.2 Ein einfiihrendes Beispiel Beim Zufallsexperiment " Wiafeln mit einem homogenen Wiafel" erwarten wir, daB jede der sechs moglichen Augenzahlen 1,2, ... ,6 mit der gleichen Wahrscheinlichkeit auftritt: (i
= 1, 2, ... , 6)
(111-265)
(Pi: Wahrscheinlichkeit dafiir, bei einem Wurf die Augenzahl "i" zu erzielen). Somit lautet unsere Erwartung bei 120 Wiirfen wie folgt: Jede der sechs Augenzahlen tritt genau 20-mal auf Diese absoluten Haufigkeiten (i = 1, 2, ... , 6)
(111-266)
sind die theoretisch zu erwartenden Werte. Sie beruhen auf der Annahme, daB die Zufallsvariable X = Erreichte Augenzahl beim Wurf mit einem homogenen Wiafe!
tatsachlich einer Gleichverteilung geniigt, d.h. auf der Nullhypothese H o, daB alle Augenzahlen mit der gleichen Wahrscheinlichkeit auftreten.
600
III Grundlagen der mathematischen Statistik
In einem konkreten Fall (einer Zufallsstichprobe) ergab sich bei insgesamt 120 ausgefiihrten Wiirfen die folgende (empirische) Hdufigkeiisverteilung:
15
20
-5
2
19
20
-1
3
22
20
2
4
21
20
5
17
20
-3
6
26
20
6
Ein Vergleich zwischen den beobachteten und den theoretisch erwarteten Haufigkeiten zeigt zum Teil erhebliche Abweichungen, die auch in den zugehorigen Stabdiagrammen deutlich zum Ausdruck kommen (Bild 111-83):
30
30
20
20
10
~
10
23456 a)
-1
2
3
4
5
6
b)
Bild111-83 Haufigkeitswerte fur die "Augenzahl" beim Wurf mit einem Wiirfel a) Beobachtete Verteilung b) Theoretisch "erwartete" Verteilung
Wir stehen daher vor dem folgenden Problem: Ist die beobachtete H dufigkeitsverteilung im Widerspruch zur theoretisch erwarteten Gleichverteilung oder sind die festgestellten Abweichungen rein zufallsbedingt?
5 Anpassungs- oder Verteilungstests
601
Mit anderen Worten: 1st die entnommene Stichprobe vom Umfang n == 120 in Einklang zu bringen mit der Annahme (Nullhypothese) (i == 1, 2, ... , 6)
(111-267)
oder widerspricht sie dieser Annahme? LaBt sich also diese Hypothese iiber die Gleichverteilung der moglichen Augenzahlen vertreten oder miissen wir sie aufgrund der Stichprobenuntersuchung zuruckweisen'l Wir mochten also eine spezielle Annahme (Nullhypothese) iiber die Art der Wahrscheinlichkeitsverteilung einer Grundgesamtheit uberprufenund dabei auf der Grundlage einer Zufallsstichprobe, die dieser Grundgesamtheit entnommen wurde, eine Entscheidung uber Beibehaltung oder Ablehnung der Nullhypothese fallen. 1m nachsten Abschnitt behandeln wir daher zunachst das wohl wichtigste Priifverfahren fiir die unbekannte Verteilungsfunktion einer Wahrscheinlichkeitsverteilung, namlich den 2 sog. Chi-Quadrat- Test (" X -Test "), und kommen im AnschluB daran nochmals auf dieses einfiihrende Beispiel ausfuhrlich zuriick,
5.3 Chi-Quadrat-Test (" l2 -Test") Wir behandeln in diesem Abschnitt den wohl bekanntesten und wichtigsten Anpassungs2 oder Verteilungstest, den sog. Chi-Quadrat- Test ("X - Test"). Er beruht auf einem Vergleich der aus einer Zufallsstichprobe Xl' X 2, •.• , x; gewonnenen empirischen Haufigkeitsverteilung mit der theoretisch erwarteten Verteilung, die man aus der als wahr angenommenen Verteilungsfunktion Fo(x) der Grundgesamtheit, aus der die Stichprobe stammt, berechnet hat. Wir testen dabei die Nullhypothese
u.; F(x) == Fo(x)
(111-268)
gegen die Alternativhypothese (111-269)
Planung und Durchfiihrung des Chi-Quadrat-Tests verlaufen dann schrittweise wie folgt: (1)
Unterteilung der Stichprobe in Klassen, Feststellung der absoluten Klassenhaufigkeiten (Besetzungszahlen) Die n Stichprobenwerte Xl' x 2 , ••• , X n werden in k Klassen (Intervalle) 1 1 , 12 , ••• , I k unterteilt (k < n). J ede Klasse sollte dabei erfahrungsgemaf mindestens 5 Stichprobenwerte enthalten. Dann werden die absoluten Klassenhdufigkeiten .(Besetzungszahlen) n l , n 2 , ••• , nk festgestellt, wobei (111-270) gilt (Spalten 1 und 2 in der nachfolgenden Tabelle 3).
III Grundlagen der mathematischen Statistik
602 (2)
Berechnung der theoretisch erwarteten absoluten Klassenhaufigkeiten
Aus der als wahr angenommenen Verteilungsfunktion Fo(x) berechnet man zunachst fur jede Klasse I, die zugehorige Klassenwahrscheinlichkeit Pi 41) und daraus die hypothetische, d. h. theoretisch zu erwartende Anzahl ni = nPi der Stichprobenwerte in I, (Spalten 3 und 4 in Tabelle 3). Tabelle 3: Chi-Quadrat-Test
2
(3)
n1
P1
ni = n p;
n 1 - ni
(n1 - ni)2 n*1
n2
P2
nI = nP2
n2 - nI
(n2 - nI)2 n*2
Festlegung eines geeigneten Ma8es fur die Abweichung zwischen der beobachteten und der theoretischen Verteilung
Ein geeignetes MajJ fur die Abweichung zwischen empirischer und hypothetischer Verteilung ist nach Pearson die MaBzahl
(111-271)
Sie wird gebildet, indem man zunachst klassenweise die Differenz Sn, = n, - ni zwischen der beobachteten und der theoretisch erwarteten absoluten Klassenhaufigkeit feststellt (Spalte 5), diese Differenz quadriert und durch die hypothetische Klassenhaufigkeit ni dividiert (Spalte 6) und dann anschlieBend die Beitrage aller Klassen aufaddiert (Summenwert der Spalte 6). Bei einer "guten" Ubereinstimmung zwischen den empirischen und den hypothetischen Werten erwarten wir kleine Abweichungsquadrate (~ni)2 und somit auch einen kleinen Wert fur das Abweichungsmafi X2 • 41)
Pi ist die Wahrscheinlichkeit dafiir, daB ein Stichprobenwert in die i-te Klasse fallt (immer unter der Voraussetzung, daB Fo (x) die wahre Verteilungsfunktion ist).
5 Anpassungs- oder Verteilungstests Die MaBzahl Z
X2
603
ist dabei ein spezieller Wert der Testvariablen oder PrufgrojJe k
*2
k
2
= X2 = \' (~-*ni) = \' (~- nPi) L n; L npi i
=1
i
(III-272)
=1
den diese Variable fur die vorgegebene konkrete Stichprobe annimmt. Dabei bedeutet N, die wie folgt definierte Zufallsvariable:
N, == Beobachtete Anzahl der Stichprobenwerte in der i-ten Klasse (empirische absolute Klassenhdufigkeiti
Die Testvariable Z == X2 geniigt fur grojJes n, d. h. bei Verwendung umfangreicher Stichproben (Faustregel: n > 50) ndherungsweise einer Chi-Quadrat- Verteilung mit f == k - 1 Freiheitsgraden, wenn alleParameter in der als wahr angenommenen Verteilungsfunktion Fo(x) bekannt sind 42). (4)
Wahl einer Signifikanzzahl ~ und Berechnung der kritischen Grenze c Wir wahlen jetzt eine kleine Signifikanzzahl a (in der Praxis meist a == 0,05 == 5 % oder a == 0,01 == 1 0;0) und bestimmen dann eine kritische Grenze c so, daB die Werte der Testvariablen Z == X2 mit der Wahrscheinlichkeit 'Y == 1 - a unterhalb dieser kritischen Grenze liegen. Somit gilt: P(Z ~ C)H o
== 'Y == 1 - a
(111-273)
(hellgrau unterlegte Flache in Bild III-84). 1-a
o
c
z
nicht-kritischer Bereich
Bild 111-84 Zur Bestimmung der kritischen Grenze c fur die einer Chi-Quadrat-Verteilung 2 geniigende Testvariable Z = X
°
Die kritische Grenze c teilt dabei das Intervall z == X2 ~ in einen nicht-kritischen und einen kritischen Bereich und laBt sich mit Hilfe der Tabelle 3 im Anhang (Tabelle der Quantile der Chi-Quadrat- Verteilung) leicht bestimmen. 42)
Siehe hierzu Anmerkung (1) im AnschluB an die Zusammenfassung.
604 (5)
III Grundlagen der mathematischen Statistik
z
Berechnung des Test- oder Priifwertes = X2 und Testentscheidung Liegt der aus der Stichprobe berechnete Test- oder Priifwert = X2 der TestvariabIen Z = X2 unterhalb der kritischen Grenze c, d. h. gilt = X2 ~ C, so wird die Nullhypothese H o: F(x) = Fo(x) beibehalten, anderenfalls zugunsten der Alternativhypothese HI: F (x) i= Fo(x) abgelehnt (Bild 111-85). Die gewahlte Signifikanzzahl r:l ist dabei die Irrtumswahrscheinlichkeit, d. h. die Wahrscheinlichkeit dafiir, eine an sich richtige Nullhypothese H 0 abzulehnen (Fehler 1. Art).
z
z
H o beibehalten
o
A
Z
Annahmebereich (nicht-kritischer Bereich)
A
C
z
Z
-l
Ablehnung (kritischer Bereich)
Bild 111-85 Testentscheidung tiber Beibehaltung oder Ablehnung der Nullhypothese H o : F(x) = Fo(x)
Wir fassen die einzelnen Schritte dieses wichtigen Chi-Quadrat- Tests wie folgt zusammen:
43)
Die Nullhypothese besagt: Fo(x) ist die wahre Verteilungsfunktion der Grundgesamtheit, aus der die Zufallsstichprobe Xl' x 2 , ••• , X n entnommen wurde.
5 Anpassungs- oder Verteilungstests
44)
Gegebenenfalls miissen nachtraglich Klassen zusammengelegt werden.
605
606
III Grundlagen der mathematischen Statistik
Anmerkungen
(1)
Sind ein oder mehrere Parameter der als wahr angenommenen Verteilungsfunktion Fo(x) unbekannt, so muf man zunachst fur diese Parameter unter Verwendung der vorgegebenen konkreten Stichprobe Niiherungs- oder Schiitzwerte bestimmen (z.B. mit Hilfe der Maximum-Likelihood-Methode). Die Anzahl der Freiheitsgrade vermindert sich dabei urn die Anzahl der zu schdtzenden Parameter. Beispiel: Sind bei angenommener N ormalverteilung N (/1; a) sowohl /1 als auch a unbekannt und daher aus der Stichprobe mit Hilfe von Schatzfunktionen zu schiitzen, so ist die Anzahl der Freiheitsgrade gleich f == (k - 1) - 2 == k - 3. Allgemein gilt: f==(k-1)-r
(111-282)
r: Anzahl der unbekannten Parameter in der angenommenen Verteilungsfunktion Fo (x), die noch aus der Stichprobe geschiitzt werden miissen
(2)
Bei einer diskreten Zufallsvariablen X sind die Klassen die moglichen Werte selbst (siehe hierzu das nachfolgende Beispiel (1)).
607
5 Anpassungs- oder Verteilungstests •
Beispiele
(1)
Wir kommen auf das einfiihrende Beispiel aus Abschnitt 5.2 zunick. Bei n = 120 Wiirfen mit einem homogenen Wurfel erhielten wir das folgende Ergebnis (Hiiufigkeitsverteilung der 6 moglichen Augenzahlen): Augenzahl i
1
2
3
4
5
6
absolute Haufigkeit n,
15
19
22
21
17
26
Mit Hilfe des Chi-Quadrat- Tests solI jetzt gepriift werden, ob die Nullhypothese H 0: Alle 6 miiglichen Augenzahlen sind gleichwahrscheinlich
aufrecht erhalten werden kann oder ob man diese Annahme verwerfen muB. Mit anderen Worten: Wir wollen mit dem Chi-Quadrat-Test priifen, ob es sich bei unserem Wiirfelexperiment (wie vermutet) urn ein Laplace-Experiment handelt oder nicht. Wir Iosen diese Aufgabe nun schrittweise wie folgt: 1. Schritt: Wir haben k = 6 Klassen. Sie entsprechen den 6 Augenzahlen (Spaltel in der folgenden Tabelle). Die beobachteten absoluten H dufigkeiten n, bilden die 2. Spalte. 2. Schritt: Nach unserer Annahme (Nullhypothese H o) sind alle Augenzahlen gleichwahrscheinlich. Somit ist Pi = 1/6 (i = 1, 2, ... ,6; Spalte 3). Durch Multiplikation mit n = 120 erhalten wir daraus die Anzahl ni der theoretisch erwarteten Stichprobenwerte (Spalte 4):
»r = l
1 np·t = 120 . -6 = 20
(i = 1, 2, ... , 6)
1
15
1/6
20
-5
25/20
2
19
1/6
20
-1
1/20
3
22
1/6
20
2
4/20
4
21
1/6
20
5
17
1/6
20
-3
9/20
6
26
1/6
20
6
36/20
1/20
III Grundlagen der mathematischen Statistik
608
3. Schritt: Wir bilden jetzt die Difjerenzen Sn, == n, - ni (Spalte 5) und daraus die "AbweichungsmaBe" (Ani? (Spalte 6). Durch Summation der n~ l-
letzten Spalte erhalten wir den gesuchten Test- oder Prifwert unserer Testva2 riablen Z == X : 6
z== x2 ==
I
6
tn, - ni)2
L
ni
i = 1
2
~ (~nJ == 76 == 3 8
----
ni
20
'
i= 1
4. Schritt: Als Signifikanzzahl (Irrtumswahrscheinlichkeit) wahlen wir a == 0,05. Die Berechnung der kritischen Grenze c erfolgt dann aus der Bedingung P(Z ~
C)H
o
== P(X 2 ~
C)H
o
== 1 - a == 1 - 0,05 == 0,95
mit Hilfe von Tabelle 3 im f == k - 1 == 6 - 1 == 5): P(Z -~ c)H o
== F (c) == 0,95
Anhang f=5
(Anzahl c ==
der
Z(O,95; 5)
Freiheitsgrade:
== 11,07
Der nicht-kritische Bereich (Annahmebereich) lautet somit (Bild 111-86): z==X2~11,07
z
5. Schritt (Testentscheidung): Der Test- oder Priifwert == X2 == 3,8 fallt in den Annahmebereich, d.h. es gilt == X2 ~ 11,07 (Bild 111-86). Die Nullhypothese H ° wird somit beibehalten, d.h. wir konnen sie aufgrund der verwendeten Stichprobe nicht ablehnen. Es gibt.somit keinen AnlaB, an der Gleichverteilung der Augenzahlen zu zweifeln. Es handelt sich also bei unserem Wiirfelexperiment (wie vermutet) urn ein Laplace-Experiment.
z
Ho beibehalten
Annahmebereich (nicht-kritischer Bereich)
z
-l
Ablehnung (kritischer Bereich)
Bild 111-86 Der Testwert = 3,8 fallt in den Annahmebereich, die Nu11hypothese H o : "Beim Wurf mit einem Wiirfel handelt es sich urn ein Laplace-Experiment" wird daher beibehalten, d. h. nicht abgelehnt
5 Anpassungs- oder Verteilungstests (2)
609
Eine Stichprobenuntersuchung von n = 100 ohms chen Widerstanden aus einer Serienproduktion ergab die folgende H dufigkeitsverteilung, wobei die MeBwerte bereits in k = 6 Klassen mit der Klassenbreite ~x = 1 Q und den angegebenen Klassenmitten Xi eingeteilt wurden:
Q
48,5
49,5
50,5
51,5
52,5
53,5
5
11
35
29
13
7
Wir vermuten, daB diese Stichprobe aus einer normalverteilten Grundgesamtheit stammt, deren Mittelwert u und Varianz (J 2 jedoch beide unbekannt sind. Daher testen wir diese Nullhypothese mit Hilfe des Chi-Quadrat- Tests schrittweise wie folgt: 1. Schritt: Die Stichprobenwerte sind bereits in k = 6 Klassen aufgeteilt, die beobachteten absoluten Hdufigkeiten n, sind bekannt. Jede Klasse enthalt dabei (wie gefordert)mindestens 5 Werte. 2. Schritt: Die Parameter der Verteilungsfunktion
Fo(x) = c/J (
X -
Jl und
(J
der angenommenen Normalverteilung mit
Jl)
-(J-
sind unbekannt und miissen daher zunachst aus der vorliegenden Stichprobe mit Hilfe der bereits aus den Abschnitten 3.2.3 und 3.2.4 bekannten Schatzfunktionen und der nachfolgenden Tabelle geschdtzt werden:
48,5
5
242,5
-2,55
32,5125
2
49,5
11
544,5
-1,55
26,4275
3
50,5
35
1767,5
-0,55
10,5875
4
51,5
29
1493,5
0,45
5,8725
5
52,5
13
682,5
1,45
27,3325
6
53,5
7
374,5
2,45
42,0175
III Grundlagen der mathematischen Statistik
610
I n.x,6
_ 1 Mittelwert: x = - .. 100
l
= -
1
100
l
. 5105 = 51 05
(in Q)
'
i= 1
Varianz:
8
2
1
1
I
6
= 99 .
ni(X i - X)2 = 99 . 144,75 = 1,4621
i= 1
Standardabweichung:
s = R = Jl,4621 = 1,2092
(in Q)
/l
Damit ergeben sich fur den Mittelwert und die Standardabweichung a der als normalverteilt angenommenen Grundgesamtheit die folgenden Schdtzwerte:
/l ~X = 51,05
~
a
und
s = 1,209
(beide Werte in Q). Mit der (angenommenen) Verteilungsfunktion
Fo(x)
=
¢(x a
/l) =
¢(x - 51,05) 1,209
berechnen wir jetzt unter Verwendung von Tabelle 1 aus dem Anhang die Wahrscheinlichkeii Pi dafiir, daB ein Wert in die i-te Klasse fallt und daraus schlieBlich die Anzahl ni = n p, = 100 Pi der theoretisch in der i-ten Klasse zu erwartenden Stichprobenwerte (i = 1,2, ... ,6). Weil X hier eine stetige Zufallsvariable ist, miissen wir bei der Berechnung von Pi die folgenden Klassengrenzen beriicksichtigen (Bild 111-87):
1.Klasse
2.Klasse
3.Klasse
-oo<X 20cm 3 .
An 40 Testfahrzeugen eines neuen Autotyps wurde der Benzinverbrauch X in Liter pro 100 km Fahr1eistung bestimmt, Die Urliste hatte dabei das fo1gende Aussehen (alle Werte in 1/100 km): 10,1 10,4 10,2 10,8 9,0 a) b)
10,6 10,1 10,5 9,9 10,0
10,9 10,8 9,4 10,5 10,5
10,0 9,2 10,2 10,6 10,4'
10,4 10,2 9,6 9,8 11,4
10,5 10,3 10,2 10,7 10,4
9,7 10,5 9,7 11,2 10,1
10,5 9,2 10,2 10,8 10,4
Gruppieren Sie diese Daten in 5 Klassen der Breite 0,5 und ermitte1n Sie die H dufigkeitsfunktion. Zeichnen Sie das zugehorige Histogramm.
III Grundlagen der mathematischen Statistik
636
Zu Abschnitt 2 1) 2)
Die Ubungsaufgaben 1) bis 7) in Abschnitt 1 beschaftigen sich mit den Haufigkeitsverteilungen von Stichproben. Bestimmen Sie die jeweiligen M ittelwerte, Standardabweichungen und Varianzen.
7)
8)
Xl' X 2, .•. , X n
sei eine beliebige Stichprobe. Zeigen Sie: Die Funktion n
S(c) =
L
(Xi - c)2
i= 1
nimmt fur c = Stichprobe).
x ihren
kleinsten Wert an
(x
ist der arithmetische M ittelwert der
Zu Abschnitt 3 1)
Die Lebensdauer T zahlreicher elektronischer und mechanischer Bauelemente HiBt sich in guter Naherung durch eine Exponentialverteilung mit der normierten Dichtefunktion fur
t ~
0
beschreiben (fur t < 0 verschwindet diese Funktion). Bestimmen Sie nach der Maximum-Likelihood-Methode einen Schdtzwert fur den unbekannten Parameter A > 0 unter Verwendung einer vorgegebenen Stichprobe t l , t 2 , · .• , t.; 2)
Die Lebensdauer T von Gliihlampen kann in guter Naherung als exponentialverteilt angesehen werden. Schdtzen Sie anhand der folgenden konkreten Stichprobe den unbekannten Parameter A der Verteilung:
i
1
2
3
4
5
6
7
8
t. h
250
210
400
320
190
210
240
292
--.!.
3)
Die Zufallsvariable X beschreibe die Anzahl der Gesprache, die von einer Telefonzentrale zu einer bestimmten Tageszeit pro Stunde vermittelt werden. X kann dabei als eine naherungsweise Poisson-verteilte Zufallsvariable betrachtet werden. Bestimmen Sie den unbekannten Parameter f.l dieser Verteilung anhand der folgenden Stichprobe:
h
1
2
3
4
5
6
160
145
155
136
140
152
Ubungsaufgaben 4)
637
X sei eine normalverteilte Zufallsvariable, deren Mittelwert u jedoeh unbekannt sei. Bestimmen Sie anhand der Stiehprobe i
1
2
3
4
5
6
7
8
9
10
Xi
140
162
128
132
136
148
140
128
135
158
ein Vertrauensintervall fur den Mittelwert f.1 bei bekannter Varianz a 2 = 9, bei unbekannter Varianz o ':
a) b)
Als Vertrauensniveau wahle man y =.' 95%.
5)
Der Durchmesser X der auf einer bestimmten Masehine hergestellten Sehrauben sei eine normalverteilte Zufallsvariable. Eine Stiehprobe vom Umfang n = 100, entnommen aus einer 'Tagesproduktion, ergab dabei das folgende Ergebnis: x = 0,620 em, s = 0,035 em. Bestimmen Sie die Vertrauensgrenzen fur den unbekannten Mittelwert u bei einer Irrtumswahrscheinlichkeit von a = 5%.
6)
X sei eine normalverteilte Zufallsgrolie mit dem unbekannten Mittelwert f.1 und der ebenfalls unbekannten Varianz (f2. Eine Stiehprobe vom Umfang n = 10 ergab den arithmetischen Mittelwert x == 102 und die empirische Varianz S2 = 16. Bestimmen Sie fur f.1 und (f2 jeweils ein Vertrauensintervall zum Vertrauensniveau y = 99%.
7)
Fur einen neuen Autotyp wurde ein bestimmter Motor weiterentwickelt, dessen Leistung X (in PS) als eine normalverteilte Zufallsvariable betrachtet werden kann. Eine Stichprobenuntersuchung an n= 8 wahllos herausgegriffenen Motoren brachte das folgende Ergebnis: 1
2
3
4
5
6
7
8
100,5
96,5
99,0
97,8
100,4
103,5
100,3
98,0
i -
Xi
PS
Bestimmen Sie jeweils ein Vertrauensintervall fur den unbekannten M ittelwert f.1 und die unbekannte Varianz a 2 bei einer vorgegebenen Irrtumswahrseheinlichkeit von a = 5%. 8)
Die Tragfdhigkeit X eines Balkens solI als eine normalverteilte Zufallsvariable betrachtet werden. Eine Stichprobenuntersuchung vom Umfang n = 16 ergab folgende Werte:
x=
12,54 kN,
s = 1,02 kN
Bestimmen Sie aufder Basis dieser Stichprobe jeweils ein Vertrauensintervall fur den unbekannten Mittelwert u und die unbekannteVarianz a ': Das Vertrauensniveau sci ;' = 95%.
638
III Grundlagen der mathematischen Statistik
9)
In einer Versuchsreihe wurde die Dichte X einer Eisenkugel insgesamt 20-mal gemessen, wobei nur 6 verschiedene MeBwerte mit der folgenden Hdufigkeitsverteilung auftraten: Xi
(in g/cm') absolute Haufigkeit n,
7,79
7,80
7,81
7,82
7,84
7,85
3
3
5
4
3
2
Bestimmen Sie anhand dieser Stichprobe ein Vertrauensintervall fur den unbekannten Mittelwert J.1 derals normalverteilt betrachteten Mebgrolse X (vorgegebenes Vertrauensniveau: 'Y = 99%). 10)
Bei der Qualitiitskontrolle eines bestimmten elektronischen Bauteils befanden sich in einer Zufallsstichprobe vom Umfang n = 500 genau k = 27 defekte Teile. Bestimmen Sie einen Schdtzwert fur den unbekannten .Ausschulsanteil" p der Gesamtproduktion und geben Sie ein Vertrauensintervall fur diesen Parameter zum Vertrauensniveau b)
'Y
= 99%
an. 11)
Beim Wiirfeln mit einem homogenen Wiirfel soIl das Auftreten einer geraden Augenzahl als .Erfolg'' gewertet werden. Bei n = 100 unabhangigen Wiirfen trat dieses Ereignis genau 55-mal ein. Schdtzen Sie die unbekannte .Erfolgswahrscheinlichkeit" p undo bestimmen Sie fur diesen Parameter ein Vertrauensintervall bei einer Irrtumswahrscheinlichkeit von a = 1%.
12)
Eine Urne enthalt schwarze und weiBe Kugeln, deren Anteile jedoch unbekannt sind. Urn den Anteil p an schwarzen Kugeln zu schatzen, wurde der Urne 100-mal eine Kugel mit Zuriicklegen entnommen. Dabei erhielt man das folgende Ergebnis: Farbe der gezogenen Kugel
schwarz
weiB
Anzahl der gezogenen Kugeln
68
32
Ermitteln Sie auf einem Konfidenzniveau von 'Y = 95% den unbekannten Parameter p. 13)
ein Konfidenzintervall fur
Aus einer Sonderpragung wutden n= 100 Munzen nach dem Zufallsprinzip ausgewahlt und ihre Masse X bestimmt. Man erhielt dabei einen Stichprobenmittelwert von = 5,43 g mit einer Streuung von S2 = 0,09 g2. Der Verteilungstyp der Zufallsvariablen X ist jedoch unbekannt. Bestimmen Sie mit Hilfe des Zentralen Grenzwertsatzes der Wahrscheinlichkeitsrechnung auf einem Vertrauensniveau von 'Y = 95% die Vertrauensintervalle fur den unbekannten Mitteiwert J.1 und die unbekannte Standardabweichung (J.
x
639
Ubungsaufgaben
Zu Abschnitt 4 1)
Ein Hersteller produziert in groBer Stiickzahl elektrische Widerstande mit dem Sollwert /10 = 100 Q. Der ohmsche Widerstand X kann dabei als eine anniihernd normalverteilte Zufallsvariable angesehen werden. Nach Angaben des Herstellers wird der vorgegebene Sollwert /10 = 100 Q auch eingehalten. Eine Stichprobe vom Umfang n = 10 ergab jedoch einen empirischen Mittelwert von = 102 Q. Man teste mit einer Irrtumswahrscheinlichkeit von a = 1°/0 die Nullhypothese H o : /1 = /10 = 100 Q gegen die Alternativhypothese H 1 : /1 =1= /10 = 100 Q. Aufgrund langjahriger Erfahrungen darf dabei von einer Standardabweichung (J = 3 Q ausgegangen werden.
x
2)
In einem Werk werden Gliihlampen hergestellt, deren Lebensdauer X als eine normalverteilte Zufallsvariable mit dem Mittelwert /10 = 1500 h und der Standardabweichung (J = 80 h betrachtet werden kann. Durch eine geringfiigige Materialanderung erhofft sich der Hersteller eine VergrojJerung der mittleren Lebensdauer. Eine Stichprobenuntersuchung an 50 Gliihlampen der neuen .Serie scheint dies zu bestatigen: Fiir die mittlere Lebensdauer erhielt man den Wert = 1580 h. Konnen wir aus dieser Stichprobe den SchluB ziehen, daB sich die Lebensdauer signifikant erhoht hat? Testen Sie bei einer Irrtumswahrscheinlichkeit von a = 1°/0 die Nullhypothese H o : /1 = /10 = 1500 h gegen die Alternativhypothese H 1: /1 > /10 = 1500 h. Bei dem Test wird vorausgesetzt, daB sich die Standardabweichung (J durch die Materialanderung nicht veriindert hat.
x
3)
Die ReijJlast X eines Seiles ist laut Hersteller eine normalverteilte Zufallsgrolie mit dem Mittelwert /10 = 5,20 kN. Eine Stichprobe vom Umfang n = 20 fiihrte jedoch zu den folgenden Kennwerten: = 5,02 kN; s = 0,12 kN. Priifen Sie mit einer Irrtumswahrscheinlichkeit von a = 5°1o, ob die aufgrund dieser Stichprobe geaufierten Zweifel an der Richtigkeit der Herstellerangabe /10 = 5,20 kN berechtigt sind.
x
4)
In einem Werk werden Schrauben produziert, deren Lange X eine normalverteilte Zufallsgrobe mit dem Mittelwert /10 = 21 mm sei. Eine Zufallsstichprobe fiihrte zu dem folgenden Ergebnis:
n = 25;
x=
20,5 mm;
s = 1,5 mm
Priifen Sie mit der. Irrtumswahrscheinlichkeit a = 1 °/0, ob die Abweichung des beobachteten Stichprobenmittelwertes = 20,5 mm vom Sollwert /10 = 21 mm signifikant oder zufallsbedingt ist.
x
5)
Ein Automobilhersteller bringt ein neues PKW-Modell auf den Markt, dessen Benzinverbrauch X (in Liter pro 100 km Fahrleistung) eine normalverteilte Zufallsvariable mit dem Mittelwert /10= 8,21/100 km sein soIl. Die Redaktion einer Fachzeitschrift uberpriift diese Angabe an n = 36 zufallig ausgewahlten Testfahrzeugen und kommt dabei zu folgendem Ergebnis:
x=
9,1 1/100 km;
s = 2,3 1/100 km
III Grundlagen der mathematischen Statistik
640
Der Stichprobenmittelwert X ist also deutlich hoher als der vom Hersteller angegebene Wert /10' Testen Sie mit der Irrtumswahrscheinlichkeit a = 5%, ob die Angabe des Hersteller bezuglich des Mittelwertes /1 noch Hinger aufrecht erhalten werden kann. 6)
Zwei verschiedene MeBmethoden fur Widerstande sollen miteinander verglichen werden. Vergleichsmessungen an 5 Widerstanden ergaben dabei das folgende MeBprotokoll: i
1
2
3
4
5
100,5
102,4
104,3
101,5
98,4
98,2
99,1
102,4
101,1
96,2
1. Methode:
MeBwert (in Q)
Xi
2. Methode:
MeBwert (in Q)
Yi
Testen Sie mit der Irrtumswahrscheinlichkeit a = 1 %, ob beide MeBmethoden als gleichwertig angesehen werden konnen oder ob die beobachteten Abweichungen signifikant sind.
7)
In zwei Werken A und B wird ein bestimmtes elektronisches Bauelement nach dem gleichen Verfahren hergestellt. Es wird jedoch vermutet, daB die imWerk B produzierten Teile eine hohere Lebensdauer besitzen. Die folgende Stichprobenuntersuchung scheint dies zu bestatigen:
Werk
Anzahl der getesteten Elemente
mittlere Lebensdauer (in h)
Standardabweichung (in h)
A
n1
= 100
x = 1540
Sl
= 142
B
n2
= 120
Y = 1600
S2
= 150
Testen Sie mit einer Irrtumswahrscheinlichkeit von a = 1 % die Behauptung, daB die im Werk B hergestellten elektronischen Bauelemente eine hohere Lebensdauer besitzen. Wir setzen dabei voraus, daB die Werte aus normalverteilten Grundgesamtheiten mit gleicher (aber unbekannter) Varianz stammen.
Ubungsaufgaben ~)
641
Die folgenden Stichproben stammen aus zwei normalverteilten Grundgesamtheiten mit gleicher (aber unbekannter) Varianz: i
1
2
3
4
5
Xi
5,98
6,02
6,10
5,82
6,04
Yi
6,06
6,08
6,12
6,00
5,94
Es wird behauptet, daB auch ihre Mittelwerte iibereinstimmen. Prifen Sie mit der Irrtumswahrscheinlichkeit a == 1%, ob diese Behauptung tatsachlich zutrifft. 9)
Eine Maschine produziert Wellen von hoher Prazision, Ais Genauigkeitsmaj3wird dabei die Standardabweichung (Jo des Wellendurchmessers X betrachtet. Die Maschine wurde dabei so eingestellt, daB (Jo == 0,2 mm betragt, Zu Kontrollzwecken wurde eine Zufallsstichprobe vom Umfang n == 12 entnommen. Ihre Auswertung ergab jedoch eine empirische Standardabweichung von s == 0,4 mm. MuB die Maschine neu eingestellt werden? Testen Sie daher mit einer Irrtumswahrscheinlichkeit von a == 50/0 die Nullhypothese H o : (J2 ::::; (J6 gegen die Alternativhypothese H 1 : (J 2 > (J5 und treffen Sie eine Entscheidung. Andert sich diese, wenn dieser Test mit der Irrtumswahrscheinlichkeit a == 1% durchgefuhrt wird?
10)
Der Hersteller eines Massenartikels behauptet, seine Ware enthalte einen AusschuBanteil von hochstens 3%. Bei einer Qualitdtskontrolle werden in einer Stichprobe von n == 400 Teilen genau 20 unbrauchbare Teile gefunden. Steht diese Untersuchung im Einklang mit der Behauptung des Herstellers? Treffen Sie eine Entscheidung, in dem Sie bei einer Irrtumswahrscheinlichkeit von a == 5% die Nullhypothese H o : p ::::; Po ==0,03 gegen die Alternativhypothese H 1: p > Po == 0,03 testen.
11)
Bei 200 Wiirfen mit einem Wiirfel erhielt man 88-mal eine gerade Augenzahl. Prufen Sie auf dem Signifikanzniveau a == 5%, ob es sich dabei urn einen "unverfalschten" Wiirfel handeln kann. Hinweis: Bei einem "unverfalschten" Wiirfel tritt eine gerade Augenzahl mit der Wahrscheinlichkeit Po == 1/2 auf.
III Grundlagen der rnathernatischen Statistik
642
Zu Abschnitt 5 1)
Beim Wurf einer Miinze erhielt man bei 150 Wiirfen 65~mal "Zahl". Testen Sie mit einer Irrtumswahrscheinlichkeit von r:x = 5 %, ob die aufgrund dieser Zufallsstichprobe geauberten Zweifel an der .Echtheit'' der Miinze berechtigt sind.
2)
Ein Wiirfel wurde 300-mal geworfen. Dabei erhielt man die folgende Hdufigkeitsverteilung fur die 6 moglichen Augenzahlen: Augenzahl i absolute Haufigkeit n,
35
2
3
4
5
6
39
70
62
56
38
Testen Sie mit Hilfe des Chi-Quadrat- Tests auf dern Signifikanzniveau r:x = 1 %, ob diese Zufallsstichprobe gegen eine Gleichverteilung der Augenzahl spricht. 3)
Es wird vermutet, daB die Zufallsvariable X einer Poisson- Verteilung mit dem unbekannten Parameter (Mittelwert) J1 geniigt. Zu welchem Ergebnis fiihrt ein auf dem Signifikanzniveau r:x = 5% durchgefiihrter Chi-Quadrat- Test, dem die folgende Stichprobe zugrunde gelegt wird: Xi
0
1
2
3
4
5
absolute Haufigkeit n,
27
31
22
12
6
2
(Stichprobenumfang: n = 100) 4)
Urn den mittleren Benzinverbrauch eines neuentwickelten PKW's zu bestimmen, wurden 100 Testfahrzeuge ausgewahlt und an ihnen der Benzinverbrauch X in Liter pro 100 km festgestellt. Die Stichprobenuntersuchung fiihrte zu dem folgenden Ergebnis (aIle Werte in 1/100 km): Klassenintervall
x0
u: Mittel- oder Erwartungswert der Grundgesamtheit (haufig auch "wahrer" Wert X w der Mefrgrofie X genannt: E(X) == f.l == x w ) 8 ) (J:
Standardabweichung der Grundgesamtheit ((J 2 ist die Varianz der Grundgesamtheit)
Wir gehen jetzt noch etwas naher auf die beiden Verteilungsparameter f.l und
(J
ein:
Mittel- oder Erwartungswert E(X) = Jl Angenommen, wir waren in der Lage, unsere Messung beliebig oft zu wiederholen. Dann wurde in der aus unendlich vielen MeBwerten bestehenden (hypothetischen) Me13reihe (IV-7) der spezielle Me13wert u mit der grojJten Haufigkeit (Wahrscheinlichkeit) auftreten. Die Dichtefunktion f (x) besitzt somit an der Stelle Xl == f.l ihr absolutes Maximum (Bild IV-4). Der Mittel- oder Erwartungswert f.l ist somit der .wahrscheinlichste" Wert der Zufallsgrobe (Meligrofie] X und wird daher zu Recht als eine Art M ittelwert der unendlichen M ejJreihe (Grundgesamtheit) angesehen. Standardabweichung
(J'
Die Verteilungsfunktion f (x) der Normalverteilung besitzt an der Stelle Xl == u ihr absolutes Maximum und symmetrisch dazu Wendepunkte an den Stellen X 2/ 3 == f.l ± a (Bild IV-4). Urn die Bedeutung der Standardabweichung (J besser erkennen zu konnen, betrachten wir den Verlauf dieser Funktion fur den speziellen Mittelwert f.l == 0 und verschiedene Werte des Parameters (J. Bild IV-5 verdeutlicht, daB die Standardabweichung (J im wesentlichen "Rohe" und .Brcitc" der Dichtefunktion f (x) bestimmt. tix)
0,8
...........
:/ :' 04
. .i ":
-2
8)
-1
(5=0 5
'\
Bild IV-5
'
Die Standardabweichung (J bestimmt "Hohe" (Maximum) und "Breite" der Normalverteilungsdichtefunktion I(x)
".
\.. .
2
x
Die Aussage "Mittelwert J1 = wahrer Wert x.," gilt nur, wenn keine systematischen MeBabweichungen auftreten, was wir jedoch verabredungsgemaf stets voraussetzen.
IV Fehler- und Ausgleichsrechnung
654
Je kleiner (J ist, urn so starker ist das Maximum ausgepragt und urn so steiler fallt die GauBsche Glockenkurve nach beiden Seiten hin abo Die Standardabweichung (J kann somit alsein geeignetes MaB fur die Streuung der MeBwerte Xi urn den .wahren" (aber unbekannten) Wert x., == 11 angesehen werden. Die Prdzision einer Messung wird somit ganz wesentlich durch den .Breiteparameter" (J bestimmt. Offensichtlich gilt die folgende Regel: kleines
(J
~
schmale Kurve
~
hohe Genauigkeit
groBes
(J
~
breite Kurve
~
geringe Genauigkeit
Die Wahrscheinlichkeit P(a ~ X ~ b) dafiir, daB der MeBwert in das Intervall [a; b] fallt, ist bekanntlich durch das Integral b
p(a~X~b)==ff(X)
b
dx==_l_·fe-
1
(x - fl)2
2 --;;-
dx
(IV-8)
J2;c(J
a
a
gegeben (grau unterlegte Flache in Bild IV -6).
f(x) P(a
«x s b)
f(x)
a
b
x
Bild IV-6 Die grau unterlegte Flache ist ein MaB fur die Wahrscheinlichkeit, bei einer Messung einen im Intervall [a; b] gelegenen MeBwert zu erhalten
Die Bedeutung der Standardabweichung (J als GenauigkeitsmafJ fur un sere Messungen wird auch deutlich, wenn wir die urn den Mittelwert 11 symmetrisch angeordneten Intervalle [11 - (J; 11 + (J], Lu - 2 (J; 11 + 2 (J] lind [11 - 3 (J; J1 + 3 (J] naher betrachten (Bild IV-7).
2 Statistische Verteilung der MeBwerte und MeBabweichungen ("MeBfehler")
655
In Kap. II, Abschnitt 6.4.4 haben wir bereits gezeigt, daB sich in diesen Intervallen der Reihe nach 68,3%, 95,5% und 99,7% aller MeBwerte befinden. Wir erwarten daher bei 100 Einzelmessungen, daB rund 68 MeBwerte urn hochstens eine Standardabweichung vom Mittelwert p: abweichen. Bei kleinem (J liegen also rund 68 % der MeBwerte in der unmiitelbaren Nahe des Mittelwertes /l (Bild IV -7, a)).
f(x) :::::68,3 %
a) o-Bereich urn den Mittelwert f1
x
f.l-a f.l f.l+a a)
f(x)
b) 2 a- Bereich urn den Mittelwert f1
f.l- 2 a
f.l
f.l+ 2 a
x
b)
f(x)
c) 3 c-Bereich urn den Mittelwert f1
f.l- 3 a
f.l+3a
x
c)
Bild IV-7 Zur Deutung der Standardabweichung a als MaB fur die Streuung der einzelnen MeBwerte Xi urn den Mittelwert f1
656
IV Fehler- und Ausgleichsrechnung
Wir fassen die wichtigsten Aussagen wie folgt zusammen:
9)
Die unendliche Grundgesamtheit besteht aus allen moglichen MeBwerten der Grobe X.
657
3 Auswertung einer MeBreihe
Anmerkungen (1)
Wir weisen der groBen Bedeutung wegen nochmals darauf hin, daB diese Aussagen nur fur zufdllige Mellabweichungen ("zufallige Fehler") gelten. Eventuell auftretende systematische Abweichungen ("systematische Fehler") werden daher stets als vernachldssigbar betrachtet.
(2)
Im Normalfall (d.h. in der Regel) geniigen die MeBwerte und MeBabweichungen ("MeBfehler") ndherungsweise einer Gaufischen N ormalverteilung. Man sagt dann: MeBwerte und MeBabweichungen ("MeBfehler") sind nach Gauf normalverteilt. Wir wollen aber nicht verschweigen, daf es sich hierbei streng genommen nur urn eine M odellverteilung handelt, die jedoch der Wirklichkeit oft sehr nahe kommt.
(3)
Es gibt auch MeBreihen, die keiner Normalverteilung folgen. Im konkreten Fa111aBt sich z. B. mit Hilfe des Wahrscheinlichkeitspapiers oder mit dem Chi-Quadrat- Test prufen, ob eine Normalverteilung vorliegt oder .nicht.
3 Auswertung einer Me8reihe 3.1 Mittelwert
ODd
Standardabweichung
Gegeben sei eine aus n MeBwerten bestehende MeBreihe Xl' X 2' ..• , X n , von der wir voraussetzen, daB sie die in Abschnitt 2 dargelegten Eigenschaften besitzt (Messungen gleicher Genauigkeit, unabhdngige Beobachtung der MeBwerte, normalverteilt nach GauB). Die Melrgrobe X geniigt dabei einer Normalverteilung mit dem Mittelwert J1 und der Standardabweichung (J (Bild IV-8). Beide Parameter sind jedoch unbekannt. Die Aufgabe der Fehlerrechnung besteht nun darin, aus den vorgelegten MeBwerten Xl' X 2, ... , X n .moglichst gute" Schdtzwerte fur diese Parameter zu bestimmen.
f(x)
I I
---T--I I
I I
I I x
Bild IV-8 Dichtefunktion der Gauf3schen Normalverteilung mit dem Mittelwert und der Standardabweichung (J
{l
IV Fehler- und Ausgleichsrechnung
658 Mittelwert X einer Me8reihe
Da die vorliegende MeBreihe irn Sinne der Statistik eine Stichprobe darstellt, ist bekanntlich der arithmetische M ittelwert n
i
I
(IV -11)
Xi
=1
der "beste" Schdtzwert fur den unbekannten .wahren" Wert (Mittelwert) f.1 der Mebgrobe X (vgl. hierzu Kap. III, Abschnitt 3.2.3). Zu diesem Ergebnis gelangt man auch durch Ausgleichung der streuenden MeBwerte nach der von GaufJ stammenden "Methode der kleinsten Quadrate" 10). Wir fiihren zu diesern Zweck zunachst die Abweichungen Vi der MeBwerte Xi vom (noch zu bestimmenden) Mittelwert i ein: (i == 1, 2, ... , n)
(IV-12)
Diese auch als "scheinbare Fehlcr" bezeichneten GraBen werden nun quadriert und anschlieBend aufaddiert. Wir erhalten dann die noch vorn (unbekannten) Mittelwert i abhangige Summe aller Abweichungsquadrate: n
S(x) =
n
I
2
Vi =
i= 1
I
(Xi -
(IV~13)
X)2
i= 1
Der nach GauB giinstigste Wert fur i ist dabei derjenige, fur den diese Surnrne ein Minimum annimmt: n
S(x) =
I
(IV-14)
(Xi - X)2 ---> Minimum
i= 1
Wir bestimmen i nun so, daB die Funktion S (i) die fur ein Minimum hinreichenden Bedingungen S' (i) == 0 und S" (i) > 0 erfiillt. Die dabei benotigten Ableitungen lauten:
== -
2 [(Xl - i)
+ (x 2 -
== -
2 [(Xl + X2
+ ... + x n ) -
i)
+ ... + (x,
- i)]
==
i
ni] == - 2 ( .
Xi -
nx)
(IV-iS)
1=1
S"(x) = 10)
:x [-2 (itt ~ nx)J 2n 0 Xi
=
>
(IV-16)
Diese Bezeichnung ist ungliicklich gewahlt. Es miifite besser heiBen: "Methode der kleinsten Quadratsumme", Dieses fur die Fehler- und Ausgleichsrechnung typische Verfahren Hifit sich mit Hilfe der 1\1aximum-Likelihood-Methode leicht herleiten (vgl. hierzu Kap. III, Abschnitt 3.3).
.3 Auswertung einer MeBreihe
659
Aus der notwendigen Bedingung Sf (X) folgt zunachst n
I
Xi -
nx =
(IV-17)
0
i= 1
und damit _
1
x == - '
(IV-18)
n i
=1
Wegen S" (X) == 2 n > 0 handelt es sich dabei ·um das gesuchte Minimum. Das arithmetische Mittel ist demnach der "beste" Schdtzwert fur den meist unbekannt bleibenden "wahren" Wert der Mebgrolie X, d.h. X ist der "beste" Schdtzwert fur den Mittelwert J1 der (normalverteilten) Grundgesamtheit, die aus allen moglichen MeBwerten besteht. Standardabweichung seiner Mefireihe Die Streuung der einzelnen MeBwerte durch die Standardabweichung
s==
1 n 2 - - ' . \ ' V i == n-1
L
i= 1
J
Xi
urn den arithmetischen Mittelwert
1 n - - ' \ ' (Xi -
n-1
L
x HiBt sich
(IV-19)
x)2
i= 1
charakterisieren (vgl. hierzu auch Kap. III, Abschnitt 2.1). Sie ist ein MaB fur die Zuverliissigkeit und Genauigkeit der Einzelmessung 11). Zugleich ist die Standardabweichung s der "beste" Schdtzwert fur die unbekannte Standardabweichung (J der normalverteilten Grundgesamtheit. Wir konnen somit erwarten, daf z.B. von 100 weiteren Einzelmessungen rund 68 MeBwerte in das Intervall mit den Grenzen x - s und x + s fallen (Bild IV-9). f(x)
x Bild IV -9 Rund 68,3 % aller MeBwerte unterscheiden sich vom Mittelwert J1 urn hochstens eine Standardabweichung (J ~ s
11)
~
x
Die Standardabweichung s wurde friiher auch als mittlerer Fehler der Einzelmessung bezeichnet.
IV Fehler- und Ausgleichsrechnung
660
Standardabweichung
si
des Mittelwertes i
Bei der Berechnung des arithmetischen Mittelwertes .x nach Formel (IV-18) werden alle n Einzelmessungen in gleicher Weise berucksichtigt. Wir diirfen daher zu Recht erwarten, daB das arithmetische Mittel x einen zuverldssigeren Schatzwert fur den unbekannten Mittelwert u liefert als jeder einzelne MeBwert Xi fur sich alleine genommen. Der arithmetisehe Mittelwert x laBt sieh namlich als eine Realisierung der normalverteilten Zufallsgroj3e (IV-20) i= 1
auffassen, die wir bereits in Kap. III. Absehnitt 3.2.3 als Schiitzfunktion fiir den Mittelwert f1 kennengelernt haben 12). Wenn wir die aus verschiedenen MeBreihen vom gleichen
Urnfang (jeweils n Einzelmessungen!) mittels der Schatzfunktion X bereehneten Mittelwerte x miteinander vergleiehen, werden wir feststellen, daf diese ebenso wie die einzelnen MeBwerte urn den .wahren" Wert (Mittelwert) f1 streuen. Wir werden sparer zeigen, daf diese Streuung mit der Standardabweichung
s-
== -
11
s
x~
==
n (n - 1)
L
(IV-21)
(Xi - X)2
i= 1
erfolgt, die daher als Standardabweichung des M ittelwertes x bezeiehnet wird. Sie liefert einen Schdtzwert fur die unbekannte Standardabweiehung (J x = (J/~ der Schatzfunktion X. Die Standardabweiehung Sx des Mittelwertes x kennzeiehnet die Genauigkeit des Mittelwertes und ist kleiner als die Standardabweiehung s der Einzelmessungen (Bild IV-10). Dies bestatigt un sere Vermutung, daf der arithmetische Mittelwert x sieher ein zuverldssigerer Schatzwert fur den .wahren" Wert u darstellt als ein einzelner MeBwert.
x
Bild IV-tO Die Standardabweichung des Mittelwertes x ist kleiner als die Standardabweichung der Einzelmess ung J1~X
12)
x,x
Wir erinnern: Die normalverteilten ZufaIlsvariablen Xl' X 2' ... , XII geniigen aIle der gieichen Verteilung wie die Metigrolie X. Sie besitzen daher jeweils den Mittelwert tl und die Standardabweichung (J. Die Zufallsvariable X ist dann normalverteilt mit dem Mittelwert tl x = tl und der Standardabweichung
(Jx = (J/Jn.
661
3 Auswertung einer MeBreihe Wir fassen diese Ergebnisse wie folgt zusammen:
Anmerkungen (1) Eine Kontrolle der Mittelwertbildung nach Gleichung (IV-22) ermoglicht die Summe der Abweichungen, die stets verschwindet: n
I
n
Vi
=
I
n
(Xi -
x)
=
i= 1
i= 1
I
i= 1
Xi -
i= 1
n
=
I
nx
=
I
n
i= 1
Xi -
n
(1
I
~.
n
i
=
Xi
)
=
1
n
Xi -
I
i= 1
Xi =
0
(IV-25)
662
IV Fehler- und Ausgleichsrechnung
(2)
Man beachte, daB die Standardabweichung s mit der Summe der Abweichungsquadrate gebildet wird. Diese besitzt fur den arithmetischen Mittelwert x ihren kleinsten Wert ("M ethode der kleinsten Quadrate").
(3)
Die Standardabweichung seiner MeBreihe wird sich nur geringfugig andern, wenn man die Anzahl n der Einzelmessungen vergrofiert. Daher gilt fur die Standardabweichung Sx des Mittelwertes ndherungsweise:
x
1
(IV-26)
s-""'-
Xj;;
Die Genauigkeit des MeBergebnisses HiBt sich daher prinzipiell durch eine Erhiihung der Anzahl n der Einzelmessungen verbessern. Aus Zeit- und Kostengriinden ist dies jedoch in der Praxis meist nicht moglich, (4)
Bei unseren Uberlegungen sind wir von einer N ormalverteilung der MeBwerte x; mit der Dichtefunktion
Xl' X 2, ... ,
1
f(x) = _1_. e-2
(x - 11)2 -(5-
(IV-27)
j2;c(J
ausgegangen. Der Mittelwert x ist dann als Schatz- oder N dherungswert des Mitteloder Erwartungswertes f.1 der Grundgesamtheit aller moglichen MeBwerte aufzufassen. Die Standardabweichung s der Einzelmessung liefert einen Schatz- oder N dherungswert fur die Standardabweichung (J der Normalverteilung, ebenso ist S2 ein Schdtzwert fur dieVarianz (J 2. Es gilt somit: f.1~X,
(5)
(J ~
s,
(IV-28)
Die Standardabweichung s der Einzelmessung wurde friiher auch als .mittlerer Fehler der Einzelmessung", die Standardabweichung Sx des Mittelwertes auch als .mittlerer Fehler des Mittelwertes" bezeichnet.
3 Auswertung einer MeBreihe •
663
Beispiele
(1)
Wir bestimmen anhand des folgenden MeBprotokolls einer Widerstandsmessung den arithmetischen Mittelwert R sowie die Standardabweichungen SR und sji der Einzelmessung bzw. des Mittelwertes:
151,5
1,2
1,44
2
149,7
-0,6
0,36
3
149,1
-1,2
1,44
4
150,3
5
151,3
°
°
6
150,9
0,6
0,36
7
150,6
0;3
0,09
8
149,8
-0,5
0,25
9
149,4
-0,9
0,81
10
150,4
0,1
0,01
1,0
1,00
Arithmetischer Mittelwert: _
1
10
1
R == _. \ R· == _. 1503 00== 1503 0 10 L l 10 - , , i= 1
Standardabweichung der Einzelmessung:
1
10
- _ . \ (R. - R)2 == 10 - 1 L l i= 1
Standardabweichung des Mittelwertes: SR
0,8 0
°
°
- == 25 Q ~ 3 0 ;;; == jiO' ,
sji == -
)1
-.5760 2 == 08 Q 9' ,
IV Fehler- und Ausgleiehsreehnung
664
(2)
In einem Versueh wurde der Durchmesser d einer zylindrisehen Scheibe insgesamt 6-mal mit gleieher Genauigkeit gemessen. Es ergaben sieh dabei die folgenden Werte: 5,61 em,
5,59 em,
5,50 em,
5,68 em,
5,65 em,
5,52 em
Man bereehne den Mittelwert des Durehmessers sowie die Standardabweichung der Einzelmessung und des Mittelwertes.
Losung: Aus den MeBdaten bilden wir die folgende Tabelle:
5,61
0,018
3,24
2
5,59
- 0,002
0,04
3
5,50
- 0,092
84,64
4
5,68
0,088
77,44
5
5,65
0,058
33,64
6
5,52
- 0,072
51,84
M ittelwert des Durchmessers: 6
Ld
1 d == _. 6
i
=
1
6. 33,55 em =
5,592 em ~ 5,59 em
i= 1
Standardabweichung der Einzelmessung:
s = d
J_1_. L~ (d. 6-1
d)2 =
l
J~5 ·25084 . 10'
4
cm' = 007 em ,
i= 1
Standardabweichung des Mittelwertes: s(j
== -
Sd
0z
==
0,07 em
j6
== 0,03 em
•
3 Auswertung einer MeBreihe
665
3.2 Vertrauensbereich fur den Mittelwert Il, Mellunsicherheit, Me8ergebnis Der aus einer MeBreihe Xl' X 2, ... , X n ermittelte arithmetische Mittelwert Xist - wie wir inzwischen wissen - der "beste" Schatz- oder N dherungswert fur den (unbekannten) "wahren" Wert (Mittelwert) j1 der normalverteilten McligroheX. Wir konnen daher nicht erwarten, daf x und j1 iibereinstimmen, da der arithmetische Mittelwert x immer das Ergebnis einer Zufallsstichprobe ist und sich somit von Mebreihe zu MeBreihe (wenn i. a. auch nur geringfugig) verdndern wird. Die aus verschiedenen MeBreihen vom gleichen Umfang n bestimmten Mittelwerte streuen also urn den Mittelwert u, wie in Bild IV -11 verdeutlicht.
x
I I I
I I I I I
Bild IV-II
I I I
-
x
ttt ~tt Neheruriqswerte tiir J1 aus verschiedenen MeBreihen
Vertrauensbereich fur den Mittelwert
Die aus verschiedenen Mefireihen ermi ttelten Mi ttel werte -'~ streuen urn den (unbekannten) Mittelwert f.1 der normalverteilten MeBgr6I3e
}l
x
Wir sind jedoch in der Lage, ein urn den arithmetischen Mittelwert symmetrisches Intervall anzugeben, das den unbekannten Mittelwert J1 mit einer vorgegebenen (groBen) Wahrscheinlichkeit P = 1) itberdecki. Genau dieses Problem aber haben wir bereits in Kap. III, Abschnitt 3.4.2 und 3.4.3 ausfuhrlich erortert. Es handelt sich namlich urn die Konstruktion eines Vertrauensintervalles, in dem der unbekannte Mittelwert u mit einer vorgegebenen Wahrscheinlichkeit y vermutct wird 13). Bei unbekannter Standardabweichung (J der normalverteilten Gruhdgesamtheit (dies ist der N ormalfall) ergaben sich dabei die folgenden Vertrauensgrenzen (Bild IV -12): Untere Vertrauensgrenze:
_ X -
s t-
~
(IV-29)
_ s Obere Vertrauensgrenze: x + t -
.:
13)
Die vorgegebene Wahrscheinlichkeit wird in diesem Zusammemhang auch als Vertrauensniveau oder als st atistische Sicherheit bezeichnet.
666
IV Fehler- und Ausgleichsrechnung
j -
Vertrauensgrenzen
5
t
X
x-t-
vn
-
5
x+t-
X
vn
Bild IV-12
Vertrauensbereich fur den Mittelwert u
2t _5_
vn
s ist dabei die Standardabweichung der MeBreihe, n die Anzahl der Einzelmessungen und t ein Zahlenfaktor (Parameter), der noch von dem gewahlten Vertrauensniveau (hier haufig auch statistische Sicherheit genannt) P = y und der Anzahl n der Einzelmessungen abhangt 14). Die nachfolgende Tabelle 1 enthalt die benotigten Werte fur den Parameter tin Abhangigkeit von der Anzahl n der Einzelmessungen fur die statistischen Sicherheiten y
= 68,3%,
Y = 900/0,
y
=
95°~
und
y
= 99%.
Der Vertrauensbereich fur den unbekannten Mittelwert J1lautet damit:
_
s
_
s
x-t .J;t~f1~x+t.J;t
(IV-30)
Mit einem Vertrauen von y erwarten wir daher, daB der (unbekannte) .wahre" Wert J1 der Meligrobe X in diesem Intervallliegt. Me8unsicherheit und Me6ergebnis
In der Fehlerrechnung ist es iiblich, diesen Vertrauensbereich wie folgt anzugeben: _ s (MeBwert von X) = x ± t .J;t
14)
(IV-31)
t geniigt der Bedingung P( - t
~
T
~
t)
= y
Bild IV-13
f(t)
(grau unterlegte Flache in Bild IV-13). Dabei ist T eine Zufallsvariable, die der tVerteilung von Student mit f = n - 1 Freiheitsgraden folgt (siehe hierzu Kap. II, Abschnitt 8.2).
Dichtefunktion der t- Verteilung
r
-t
3 Auswertung einer MeBreihe
667
Verkiirzt schreiben wir dann fur das Mej3ergebnis: _
s
x==x+t-
(IV-32)
-0z
Tabelle 1: Werte fur den Zahlenfaktor (Parameter) t in Abhangigkeit von der Anzahl n
der MeBwerte und dem gewahlten Vertrauensniveau y
2
1,84
6,31
12,71
63,66
3
1,32
2,92
4,30
9,93
4
1,20
2,35
3,18
5,84
5
1,15
2,13
2,78
4,60
6
1,11
2,02
2,57
4,03
7
1,09
1,94
2,45
3,71
8
1,08
1,90
2,37
3,50
9
1,07
1,86
2,31
3,36
10
1,06
1,83
2,26
3,25
15
1,04
1,77
2,14
2,98
20
1,03
1,73
2,09
2,86
30
1,02
1,70
2,05
2,76
50
1,01
1,68
2,01
2,68
100
1,00
1,66
1,98
2,63
IV Fehler- und Ausgleichsrechnung
668
Die halbe Breite des Vertrauensbereiches, d.h. der Abstand zwischen der unteren bzw. oberen Vertrauensgrenze und dem arithmetischen Mittelwert wird als Mej3unsicherheit bezeichnet und durch das Symbol ~x gekennzeichnet (Bild IV-14) 15). Somit ist
x
s
~x==t-
oder auch
.:
~x
== t . s-x
(IV-33)
und das Mefiergebnis HiEt sich daher auch in der Form
x ==
x ± ~x
(IV-34)
angeben.
I ..MeBunsicherheit
,1: I ..
M eBunsicherheit
Lix_1 Bild IV-14
x
-
x
x-L1x
Zum Begriff der MeBunsicherheit
1st die Standardabweichung (J der normalverteilten Grundgesamtheit jedoch bekannt (z.B. aufgrund der Erfahrungen aus fruheren Messungen), so ist bei der Berechnung der Vertrauensgrenzen des Mittelwertes f1 statt der t- Verteilung von "Student" die Standardnormalverteilung zu nehmen. Der Faktor t in den Gleichungen (IV-32) und (IV -33) ist dann nur noch von dem gewahlten Vertrauensniveau P == y abhangig und entspricht daher dem "Grenzwert" too (d.h. dem t- Wert fur n ~ (0) in der letzten (grau unterlegten) Zeile von Tabelle 1. Das MejJergebnis lautet daher in diesem Sonderfall wie folgt (Bild IV-15):
x == X + ~x -
==
X+ t -
(J rn
(IV-35)
-
~~
Die M ej3unsicherheit betragt somit ~x
== t oo -
(J
(IV:'36)
~
MeBu nsicherheit L1x = too
MeBunsicherheit
(J
(J
{i1
L1x =
too {i1 Bild IV-IS Zur Angabe eines MeBergebnisses
x- L1x 15)
-
x
x
Die Me./Junsicherheit wird haufig auchdurch das Symbol u gekennzeichnet.
3 Auswertung einer MeBreihe Die wichtigsten Ergebnisse fassen wir jetzt wie folgt zusammen:
669
670
IV Fehler- und Ausgleichsrechnung
Anmerkungen (1) y ist die Wahrscheinlichkeit dafiir, daB der unbekannte Mittelwert
f1 innerhalb der angegebenen Vertrauensgrenzen X ± 8x liegt. In Naturwissenschaft und Technik verwendet man meist y == 950/0 oder y == 99%. Haufig setzt man auch y == 1 - a, wobei a die sog. Irrtumswahrscheinlichkeit bedeutet. Diese muft dabei in Kauf genommen werden, urn iiberhaupt ein Vertrauensintervall angeben zu konnen! Dabei gilt: Je kleiner die Irrtumswahrscheinlichkeit a ist, urn so breiter wird das Vertrauensintervall.
(2)
1st die Standardabweichung (J der Grundgesamtheit jedoch bekannt (z. B. aus friiheren Messungen), so ist der Zahlenfaktor t in Gleichung (IV-39) durch den "Grenzwert" too zu ersetzen (grau unterlegte letzte Zeile in der Tabelle 1).
(3)
Die Angabe des Mefiergebnisses in der Form x == X + 8x == -
s x -+ t -
(IV-42)
~
beruht auf der Voraussetzung, daB weder grobe Fehler noch systematische Abweichungen auftreten. In der Praxis jedoch lassen sich systematische MeBabweichungen nie ganz ausschlieBen. Werden diese aber als solche erkannt, so muB der arithmetische Mittelwert x durch ein Korrekturglied K berichtigt werden. Der sog. korrigierte oder berichtigte Mittelwert xK lautet damit:
x
K
==
X+ K
(IV-43)
Das endgidtige MeBergebnis wird dann in der Form x ==
xK ± 8x == (x + K) ± 8x
(IV-44)
angegeben, wobei 8x die M efiunsicherheit bedeutet, die sich aus einer ZuJallskompo-
' nente (Ax), == t - s un demer systematischen Komponente (zlx), zusammensetzt.
.;
Der .wahre" Wert f1 der Mebgrolie X wird dann mit der gewahlten Wahrscheinlichkeit P == Y in dem Vertrauensbereich mit den Grenzen K - 8x und K + 8x vermutet (Bild IV -16).
x
-------I
-------~-I-----..
I·
x
.1x
.1x
-
L
x
Xk
"wehrer" Wert J.1
Bild IV-16 Korrigiertes MeBergebnis
Der an naheren Einzelheiten interessierte Leser wird auf die DIN-NORM 1319 (Teil 3) verwiesen.
3 Auswertung einer MeBreihe (4)
671
Ist die Verteilung einer Melsgrobe jedoch unbekannt, so rst es nicht moglich, fur den Erwartungswert f1 einen Vertrauensbereich (verbunden mit einer Wahrscheinlichkeitsaussage) anzugeben. Man setzt dann meist fiir die M efJunsicherheit
Ax = (Ax}, =
s
.J;t
(IV-45)
und gibt das Mefiergebnis in der Form
_ _ _ s x = x + Ax = x + [Ax), = x + -
-
-
(IV-46)
-.J;t
an. (5)
In der Fehlerrechnung wird noch zwischen absoluten, relativen und prozentualen "Fehlern" (MeBabweichungen, MeBunsicherheiten) unterschieden. Absolute .Fehler" stimmen mit der Meligrolie X in Dimension und Einheit iiberein. Relative und prozentuale "Fehler" sind dagegen dimensionslose Grolsen. Sie werden wie foIgt berechnet: hI' Iabsoluter "Fehler" I . relativer "Fe er' = . I Mitte wert x
prozentualer "Fehler" = (relativer "Fehler") . 100%
•
Beispiele (1)
Fur die Schwingungsdauer T eines Fadenpendels ergaben sich folgende MeBwerte gleicher Genauigkeit: 1,254 s,
1,260 s,
1,250 s,
1,251 s,
1,245 s,
1,258 s
Wir berechnen zunachst den Mittelwert und die Standardabweichung dieser aus 6 Einzelmessungen bestehenden MeBreihe:
1,254
0,001
2
1,260
0,007
49
3
1,250
- 0,003
9
4
1,251
-0,002
4
5
1,245
- 0,008
64
6
1,258
0,005
25
IV Fehler- und Ausgleichsrechnung
672 Arithmetischer Mittelwert: 6
1 1 T == _. \' T == - . 7 518 s == 1 253 s , 6 L [ 6' i= 1
Standardabweichung der Einzelmessung:
== 5,51 .10- 3 s
~
6 .10- 3
S
== 0,006 s
Wir bestimmen jetzt ein Vertrauensintervall fur den (unbekannten) .wahren" Wert der Mellgrobe T auf dem Vertrauensniveau y == 95%. Fur die MefJunsicherheit L1 T erhalten wir nach Formel (IV-39) mit s == 0,006 s, n == 6 und dem aus der Tabelle 1 entnommenen Wert t == 2,57: L1T == t -
s
~
0,006 s
== 2,57 . - - == 0,006 s.
J6
Die Vertrauensgrenzen liegen daher bei: Untere Vertrauensgrenze: T - dT == (1,253 - 0,006) s Obere Vertrauensgrenze: T
==
1,247 s
+ L1T == (1,253 + 0,006) s ==
1,259 s
Das M efiergebnis lautet damit wie folgt: T == (1,253
± 0,006) s
Der "wahre" Wert von T liegt daher mit einem Vertrauen von 95% zwischen 1,247 s und 1,259 s (Bild IV-17).
L1T=O,006 S 4 1
1,247
.1
L1T=O,OO6s 4
1,253
4
1 (2)
Vertrauensbereich fur Y= 95 %
·1 1,259
-I
T
s Bild IV-17
Die Kapazitdt eines Kondensators wurde 20-mal gemessen. Die Auswertung der MeBreihe ergab dabei eine mittlere Kapazitat von C == 56,8 J.lF und eine Standardabweichung von s == 1,9 ~lF.
3 Auswertung einer MeBreihe a) b)
673
Wie lauten die Vertrauensgrenzen fur den .wahren" Wert (Mittelwert) bei einer Irrtumswahrscheinlichkeit von a l = 1O/o? Wie dndern sich diese Grenzen, wenn man die grojJere Irrtumswahrscheinlichkeit a2 = 50/0 in Kauf nehmen will?
Losung: a)
Wir berechnen zunachst die MejJunsicherheit nach Formel (IV-39). Mit n = 20, s = 1,9 JlF und dem t-Wert t l = 2,86 (aus der Tabelle 1 entnommen fur 'Yl = 1 - a l = 99% und n = 20) erhalten wir: s 1,9 JlF I1C=t -=286·--=121IF 1
~
,
J20
'
r
Die Vertrauensgrenzen liegen damit fur das gewahlte Vertrauensniveau von 990/0 bei:
Untere Vertrauensgrenze: C - I1C = (56,8 - 1,2) JlF = 55,6 JlF Obere Vertrauensgrenze: C
+ I1C =
(56,8
+ 1,2) JlF = 58,0 JlF
Das M ejJergebnis lautet daher wie folgt (Bild IV -18): C = (56,8 b)
± 1,2) JlF
Bei der grojJeren Irrtumswahrscheinlichkeit a2 = 5% liegen die Vertrauensgrenzen ndher zusammen. Jetzt ist t 2 = 2,09 (aus der Tabelle 1 entnommen fur 'Y2 = 1 - a 2 = 95% und n = 20). Wir erhalten diesmal eine M ejJunsicherheit von s
1,9 JlF
yn
y20
I1C = t 2
- = 09 r= '209 . -~ , r-IIF
und damit das folgende MejJergebnis: C = (56,8
± 0,9) JlF
Die Vertrauensgrenzen .liegen jetzt bei 55,9 JlF und 57,7 JlF (Bild IV -18).
bei r=99 %
I_
~
55,6
Bild IV-I8
I-
bei r=95 %
I
I 55,9
-I
56,8
57,7
-I I
C J.lF
58,0
•
IV Fehler- und Ausgleichsrechnung
674
4 "Fehlerfortpflanzung" nach Gau8 4.1 Ein einfiihrendes Beispiel Die Schwingungsdauer T eines (reibungsfrei schwingenden) Federpendels hangt bekanntlich wie folgt von der Federkonstanten (Richtkraft) D und der Schwingungsmasse m ab (Bild IV~19):
r= 2 n
n
(IV-47)
Durch Auflosen nach D erhalten wir hieraus die Funktion D ==f(m; T)
== 4n
2
m
(IV-48)
.T2
aus der sich die Federkonstante berechnen HiBt, wenn die Werte fur Masse und Schwingungsdauer bekannt sind. Wir stellen unsdaher die folgende Aufgabe: Die unbekannte Federkonstante D des Federpendels solI aus Messungen der Schwingungsmasse m und der Schwingungsdauer T bestimmt werden. Die Federkonstante D wird also nicht direkt gemessen, sondern auf indirektem Wege aus den MeBwerten von m und T berechnet. Man spricht daher in diesem Zusammenhang auch von indirekter oder vermittelnder Beobachtung.
elastische Feder (Federkonstante 0)
Bild IV-19 Schwingungsmasse
m
Federpendel
1m Sinne der Statistik konnen wir die Meligroben m und T als voneinander unabhdngige
und normalverteilte Zufailsgrolsen auffassen. Masse m und Schwingungsdauer T werden nun unabhdngig voneinander mehrmals gemessen.
4 "Fehlerfortpflanzung" nach GauB
675
Die Auswertung der dabei erhaltenen MeBreihen liefert uns die folgenden Kennwerte:
m, T:
Mittelwerte der Mebgrofien m und T
sm' ST: Standardabweichungen der Einzelmessungen beider Mebgrofien sm' sf: Standardabweichungen der beiden Mittelwerte m und T Unser Interesse gilt dann den folgenden Problemen: (1) Wie berechnet man den Mittelwert 15 der unbekannten Federkonstanten D, d.h. den
Mittelwert D der von den beiden Meligroben m und T abhangigen Zufallsgrofie = f(m; T)?
D
(2) Wie laBt sich die Standardabweichung SD der abhangigen GroBe D aus den Standardabweichungen Sm und ST der beiden unabhangigen Melsgrolsen m und T bestimmen? (3) Welcher Zusammenhang besteht zwischen den entsprechenden Standardabweichungen der M ittelwerte? (4) Wie laBt sich die Unsicherheit des indirekt bestimmten Mittelwertes Unsicherheiten der Messungen von m und T ermitteln?
D aus den
Mit den soeben an einem konkreten Beispiel angeschnittenen Fragestellungen werden wir uns in den nachsten beiden Abschnitten ausfuhrlich auseinandersetzen.
4.2 Mittelwert einer "indirekten" MeBgroBe In den Anwendungen stellt sich haufig das Problem, den Wert einer Grobe Z zu bestimmen, die noch von zwei weiteren voneinander unabhdngigen und normalverteilten Grofien X und Y abhangig ist. Der funktionale Zusammenhang zwischen den drei Zufallsvariablen X, Y und Z sei bekannt und in Form einer expliziten Funktionsgleichung
Z=f(X;Y)
(IV-49)
gegeben. Die dann ebenfalls normalverteilte abhdngige Grobe Z solI jedoch nicht direkt gemessen werden, sondern auf indirektem Wege aus den MeBwerten der beiden unabhangigen Groben X und Y unter Verwendung der Funktionsgleichung Z = f(X; Y) berechnet werden. In vielen Fallen sind namlich die Groben X und Y der Messung besser zugdnglicli als die von ihnen abhangige Grobe Z = f (X; Y). Man spricht daher in diesem Zusammenhang auch von einer indirekten oder vermittelnden Beobachtung. Dabei sind X und Y die beiden Eingangsgroflen und Z = f (X; Y) die Ausgangs- oder ErgebnisgrofJe.
•
Beispiel Die Oberflache A eines (geschlossenen) Zylinders la13t sich durch Messung von Zylinderradius r und Zylinderhohe h anhand der Formel
A = f(r; h) = Z n r?
+ 2nrh
leicht bestimmen. Diese .Jndirekre'' MeBmethode ist dabei wesentlich bequemer als eine direkte Messung der Zylinderoberflache A, da die beiden Eingangsgroben r und h der Messung besser zuganglich sind als die von ihnen abhangige Ausgangsgrofle A. •
IV Fehler- und Ausgleichsrechnung
676
Wir wollen jetzt zeigen, wie sich der gesuchte Mittelwert zder Ausgangsgrolse Z aus den Mittelwerten x und Y der beiden Eingangsgrolien X und Y bestimmen HiBt. Dabei gehen wir von den MeBreihen X 1,X Z " " , X n
und
(IV-50)
Y1,Yz,···,Yn
aus, die den gleichen Umfang n besitzen 16). Ihre Mittelwerte xund Ysind dann durch die Gleichungen x
n
1 =_. n
I
und
Xi
Y
1 n
=_.
i= 1
n
I
(IV-51)
Yi
i= 1
definiert. Die einzelnen MeBwerte besitzen vom jeweils zugehorigen Mittelwert die folgenden Abweichungen (auch "scheinbare" Fehler oder "Verbesserungen" genannt): (IV-52)
und Diese Beziehungen losen wir nach
Xi
bzw.
Yi
auf: (IV-53)
und Durch Einsetzen der MeBwerte Xi' Yi in die Funktionsgleichung fur die abhangige Grobe Z insgesamt n .indirekte" M ejJwerte z, =f(xi;yJ =f(x
Z
= f (x; y) erhalten wir
+ ui;Y + vJ
(IV-54)
Ihre Differenzen zum Wert j' (x; y) betragen dann Wi
=
f(x; y) = f(x i ; yJ - f(x; y) = f(x
Zi -
+ u.; Y + vJ -
und diirfen fur kleine Abweichungen ("Fehler") u, und totalen DifJerentiale
Vi
f(x; y)
(IV-55)
in guter Naherung durch die
d z, =fx(x;y)u i + fy(x;y)v i
(IV-56)
ersetzt werden. Somit gilt also ndherungsweise Wi = d z., d.h. (IV-57) und damit weiter (IV-58) Wir bilden nun aus diesen n .Jndirekten" MeBwerten nach der Definitionsvorschrift
1
n
'r ; I
Zi
(IV-59)
i= 1
den Mittelwert z der abhdngigen Grobe Z und erhalten unter Beriicksichtigung von Gleichung (IV-58): 16)
Die hergeleiteten Formeln bleiben auch dann giiltig, wenn die beiden Mellreihen von unterschiedlichem U mfang sind.
677
4 "Fehlerfortpflanzung" naeh GauB
Z
n
1 n
== -' i
I
Zi
=1
1( ~1 n
= -;;
i
n
1 n
== -' i
I
=1 n
n
f(x; y) + fx(x; y). i ~1 ». + fy(x; y) . i ~1
'-..--"
~
°
n·f(x;y)
) Vi
=
~
°
1
== - . n . f (x; y) == f (x; y)
(IV-60)
n
Denn die Summe der Abweiehungen ("seheinbaren Fehler") verschwindet jeweils. Somit gilt zusammenfassend:
Anmerkung Fur eine von n unabhangigen direkt gemessenen Groben Xl' X 2' Grobe (Funktion) Y == f(X 1 ; X 2 ; •.. ; X n ) gilt analog:
... ,
X n abhangige (IV-62)
(Xi: Mittelwert von Xi' i == 1,2, ... , n; y: indirekt bestimmter Mittelwert der abhangigen GroBe Y).
•
Beispiel Die Oberflache A eines Zylinders liiBt sieh aus dem Radius r und der Hohe h naeh der Formel
A == f (r; h) == 2 n r 2
+ 2 ti r h
berechnen (Zylinder mit Boden und Deckel; Bild IV-20). Fur einen speziellen Zylinder ergaben sieh dabei aus voneinander unabhangigen MeBreihen folgende Mittelwerte:
r ==
10,5 em,
Ii ==
15,0 em
Fur den M ittelwert der Z ylinderoberfldche erhalten wir damit den Wert
A == f
(r;
Ii) ==
2 n (10,5 em):' + 2 tc (10,5 em) . (15,0 em) ==
== 1682,32 cm'
~ 1682 cm'
IV Fehler- und Ausgleichsrechnung
678
h
Bild IV-20
• 4.3 Gau8sches Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) Wir wenden uns jetzt dem wichtigen Problem der sog. Fehlerfortpflanzung bei einer "indirekten" Mebgrobe Z == f (X; Y) zu. Die Standardabweichungen s, und Sy der beiden voneinander unabhangigen Mebgroben X und Y charakterisieren bekanntlich die Streuung der einzelnen MeBwerte urn ihre Mittelwerte und bewirken damit, daB auch die "indirekten" MeBwerte z, == f (Xi; yJ der Ausgangsgrolse Z == f (X; Y) urn ihren Mittelwert
z
Wie wirken sich die Standardabweichungen Sx und Sy der beiden voneinander unabhdngigen M ejJgrojJen X und Y auf die Standardabweichung Sz der abhdngigen .indirekten" M ejJgrojJe Z == f(X; Y) aus? Eine Antwort auf diese Frage erhalten wir wiederum mit Hilfe des totalen Differentials. Zunachst aber bilden wir die Abweichungen der .Jndirekten" MeBwerte Zi == f (Xi; yJ vom Mittelwert z == f(.x; jl), wobei wir die Beziehungen aus Gleichung (IV-58) verwenden: (IV-63) Da die Grolsen u, und Vi sehr klein sind, diirfen wir die Abweichung w, ndherungsweise durch das totale Differential dz, == fx(.x; y) u, + fy(.x;
y) Vi
(IV-64)
ersetzen (Wi == dz J:
w, ==
Zi -
Z == fx(.x; y) u, + fv(.x; y) Vi
(IV-65)
679
4 "Fehlerfortpflanzung" nach GauB
Mit den (vorubergehenden) Abkiirzungen a == fx(x;y) und b == h(x; y) wird daraus: (IV-66) Die Summe der Abweichungsquadrate betragt dann: n
n
I
wl
i=1
n
I
=
i=1
n
I
(z, - i)2 =
ta.u, + bvd
i=1 n
= a
2
•
I
I
2=
+ 2ab·
i=1
2ul
+ Tab u.», + b 2vl) =
i=1 n
ul
(a
n
I
u.»,
+b
2
i=1
I
•
(IV-67)
vl
i=1
Bei umfangreichen MeBreihen fallen dabei die sehr kleinen Abweichungen ("scheinbaren Fehler") u, und Vi gleich oft positiv und negativ aus, sodaB die mittlere Summe in Gleichung (VI-67) als vernachldssigbar klein angesehen werden kann: n
I i
u.», ~O
(IV-68)
=1
Fur die Summe der Abweichungsquadrate gilt dann ndherungsweise: n
n
I
I
wl =
i=1
n
(z, - i)2 = a 2 .
i=1
n
I
+
ul
b2 .
i=1
I
Fur die Standardabweichung Sz der .Einzelmessungen" Definitionsformel (IV-40) den folgenden Ausdruck:
S=J_l .~w~= n-1
z
L
n-1
l
erhalten wir damit aus der
I
(z, - i)2 =
i= 1
n
a 2 . _1_ . ~ u.2 n-1 L l
a2.
Zi
n
i= 1
== J
(IV-69)
vl
i=1
n
+ b? . _1_. ~ n-1
L
V2 i
==
s; + b 2 . s; == J(fx(x; y))2 . s; + (f(x; y))2 . s; ==
== J(fx(x; y) . sx)2 + (fy(x; y) . Sy)2
(IV-70)
IV Fehler- und Ausgleichsrechnung
680
Dies ist das sog. GaujJsche Fehlerfortpflanzungsgesetz fur die Standardabweichung der Einzelmessung. Durch Quadrieren erhalt man daraus eine entsprechende Beziehung fur die Varianzen: (IV-71) Es handelt sich dabei urn das sog. Varianzfortpflanzungsgesetz fur voneinander unabhdngige Zufallsvariable X und Y. Bei der Herleitung eines entsprechenden Fehlerfortpflanzungsgesetzes (Varianzfortpflanzungsgesetzes) fur die Standardabweichung des M ittelwertes berucksichtigen wir, daB zwischen den Standardabweichungen sx' Sy und Sz der Einzelmessungen und den Standardabweichungen sx' Sy und Sz der Mittelwerte die folgenden Beziehungen bestehen:
Sx s-=-'
Xj;;
Sy s-=-,
Yj;;
Sz s-=-
Zj;;
(IV-72)
Aus Gleichung (IV-71) folgt dann, wobei wir vorubergehend wieder die Abkiirzungen a = fx(x; y) und b = fy(x; y) verwenden:
= J(fx(x; y) . sx)2 + (h(x; y) . Sy)2
(IV-73)
Dies ist das GaujJsche Fehlerfortpflanzungsgesetz fur die Standardabweichung des M ittelwertes. Durch Quadrieren erhalt man hieraus eine entsprechende Beziehung zwischen den Varianzen, namlich das sog. Varianzfortpflanzungsgesetz fur die Varianz des M ittelwertes bei voneinander unabhdngigen Zufallsvariablen X und Y: (IV-74)
Wir fassen nun die wichtigsten Ergebnisse wie folgt zusammen:
681
4 "Fehlerfortpflanzung" naeh GauB
Anmerkung Das GaujJsche Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) HiBt sieh ohne Sehwierigkeiten aueh auf Funktionen von mehr als zwei Variablen ausdehnen. Sind Xl' X 2' ... , X n voneinander unabhdngige und normalverteilte Melsgrolsen mit den Mittelwerten Xl' X2 , ... , Xn und den Standardabweiehungen sX 1 ' SX2' , sX so gilt fur die Standardabweichung der .Jndirckten" Melsgrolie Y == f (X l; X 2; ; X n ) das folgende Gesetz: n
Sy ==
J (fx
1
. sx 1 )2 + (fx 2 . sx 2 )2 + . . . + (fx n . sx n )2
'
(IV-77)
In die partiellen Ableitungen L; fX2' ... , t.. sind dabei die M ittelwerte der direkt gemessenen Eingangsgrolien Xl' X 2' ... , X n einzusetzen. Ersetzt man in Gleiehung (IV-77) die Standardabweiehungen der Einzelmessungen dureh die entspreehenden Standardabweichungen der Mittelwerte, so erhalt man das GaujJsche Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) fur die Standardabweichung des Mittelwertes bei n voneinander unabhangigen Variablen.
•
Beispiel Wir kehren zu dem Beispiel des vorherigen Absehnitts zuruck iOberfldche eines Z ylinders). Fur Radius r und Hohe h des Zylinders liegen folgende MeBergebnisse vor: Radius r:
r == 10,5 em,
s., == 0,2 em
Hohe h:
h == 15,0 em,
sTz
== 0,3 em
IV Fehler- und Ausgleiehsreehnung
682
Fur den Mittelwert der Zylinderoberflache A erhielten wir bereits aus der Formel A
= f(r; h) = 2nr 2 + 2nrh
den Wert "It = 1682 em 2. Wir interessieren uns jetzt fur die Standardabweichung SA dieses Mittelwertes. Sie liiBt sieh aus dem Gauj3schen F ehlerfortpflanzungsgesetz (IV-76) bereehnen. Die dabei benotigten partiellen Ableitungen 1. Ordnung der Funktion A = f(r; h) lauten:
oA
-=4nr+2nh, or
oA
-=2nr oh
Fur r und h setzen wir noeh die Mittelwerte
oA
-
oA
-
- (r; h) or oh (r; h)
r = 10,5 em und h = 15,0 em ein:
= 4 n(10,5 em) + 2 n(15,0 em) = 226,19 em = 2n(10,5 em) = 65,97 em
Aus dem Gaufischen Fehlerfortpflanzungsgesetz (IV-76) folgt dann fur die Standardabweichung des Mittelwertes "It = 1682 cm' der folgende Wert:
s- = A
J(OAor .S_)2 + (OAoh .S_)2 = h
r
= J(226,19 em . 0,2 cmr'
= 49,38 cm '
+ (65,97 em . 0,3 em)2 =
~ 49 cm '
4.4 Me8ergebnis fur eine "indirekte" Me8gro8e Das Mefiergebnis fur eine .Jndirekte" Meligrofie Z = f (X; Y)
•
besteht dann aus der Angabe des Mittelwertes z = f (x; y)und der aus dem GauBsehen Fehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz) bereehneten Standardabweichung Sz dieses Mittelwertes, die im Rahmen der .Fehlerrechnung" als ein geeignetes Genauigkeitsmafi fur den Mittelwert und somit aueh als Mafi fur die Unsicherheit Az des "MeBergebnisses" Z = f (x; y) betraehtetwird.
4 "Fehlerfortpflanzung" nach GauB
683
Daher gilt:
Anmerkungen (1) Fur eine von n unabhangigen Grolien Xl' X 2' ... , X n abhangige "indirekte" MeBgrolie Y ==! (X 1; X 2; ... ; X n ) lautet das MefJergebnis entsprechend: y
== y ± ~y
(IV-83)
Dabei ist
y = !(X 1 ; X2 ; · · · ; Xn )
(IV-84)
der Mittelwert und (IV-85)
die Standardabweichung und damit die Meflunsicherheii dieses Mittelwertes. Die MeBergebnisse fur die unabhangigen Meligroben sind dabei in der iiblichen Form (IV-86)
684
IV Fehler- und Ausgleichsrechnung vorgegeben (Xi ist der M ittelwert, ~Xi == SXi die Standardabweichung und damit die M efJunsicherheit fur die direkt gemessene Grobe Xi' i == 1, 2, ... , n). Die partiellen Ableitungen fX1' fX2' ... , L, sind dabei stets fiir die Mittelwerte zu bilden.
(2)
Unter sehr speziellen Voraussetzungen HiBt sich auch ein Vertrauensintervall fur den unbekannten "wahren" Wert (Mittelwert) /lzder "indirekten" Meligrobe Z == f (X; Y) angeben. Im Rahmen dieser einfiihrenden Darstellung konnen wir auf dieses Problem nicht naher eingehen (siehe hierzu auch DIN-NORM 1319, TeiI4).
Fur einige in den Anwendungen besonders haufig auftretende Funktionen lassen sich fertige Formeln fur die MeBunsicherheit (Standardabweichung) des Mittelwertes herleiten. Wir haben sie in der nachfolgenden Tabelle 2 zusammengestellt.
Tabelle 2: MeBunsicherheit (Standardabweichung) des Mittelwertes fiir einige besonders haufig auftretende Funktionen (C E lR)
Anmerkungen zur Tabelle 2 (1) Die angegebenen Formeln erhalt man unmittelbar aus dem GaufJschen Fehlerfortpflanzungsgesetz (IV-76). (2)
Man beachte: Die Groben Ax, (absolute "Fehler"), die Groben
~y
und L\z sind absolute MeBunsicherheiten
I~XI,
lA/I
und
IA:I
dagegen relative oder
prozentuale MeBunsicherheiten. (relative oder prozentuale .Fehler''). (3)
Analoge Formelnlassen sich herleiten fur Summen, Differenzen und Potenzprodukte mit mehr als zwei Summanden bzw. Faktoren.
4 "Fehlerfortpflanzung" nach GauB •
685
Beispiele
(1)
Bestimmung einer Federkonstanten (Federpendel)
Die Federkonstante D der elastischen Feder eines Federpendels HiBt sich nach der Formel m D = f(m; T) = 4n 2 . T 2 = 4n 2 . m· T- 2
aus der Schwingungsmasse m und der Schwingungsdauer T berechnen (vgl. hierzu Bild IV-19). In unabhangigen Versuchen wurden m und T zehnmal wie folgt gemessen:
i m
-
g T -
s
1
2
3
4
5
6
7
8
9
10
198
199
203
200
202
198
201
197
203
199
2,01
2,04
1,96
1,98
2,00
2,05
1,97
1,98
2,04
1,97
Anhand der folgenden Tabelle berechnen wir zunachst die benotigten Mittelwerte m und T und deren Standardabweichungen (Unsicherheiten) sm und sf:
198
-2
2
199
-1
3
203
3
4
200
5
202
°
6
198
7
201
8
197
-3
9
203
3
10
199
-1
2
-2
2,01
0,01
2,04
0,04
16
9
1,96
- 0,04
16
°
1,98
-0,02
4
4
2,00
0
4
2,05
°
4
0,05
25
1,97
-0,03
9
9
1,98
-0,02
4
9
2,04
0,04
16
1,97
-0,03
9
IV Fehler- und Ausgleichsrechnung
686 10
1 10
1 . 2000 g 10
m == - ' \' m, == -
c.
==
200 g
i= 1
~ ~ ·42 g2 =
1 . \' im, ~ m)2 = 10 . (10 - 1) . ~ 10
1=
90
1
0,68 g
~ 0,7 g
10 1 1 T==-· 1; = 10 . 20,00 s = 2,00 s
I
10
i= 1
1 I
10
.
Sy==
10 . (10 - 1).
-
(T - T)
)1
r------~'
2
==
-
90
l
1=1
==
0,0105 s
~
.
100 . 10- 4s2
==
0,01 s
Das MeBergebnis fur die beiden Mebgronen m und T lautet damit (in der ublichen Schreibweise): m
==
m ± Sm == m± sm == (200 ± 0,7) g
T == T
± ~T==
T
± Sy== (2,00 ± 0,01) s
Fur die Federkonstante D erhalten wir den folgenden M ittelwert:
-
-
D == f(m' T) == 4 n 2
,
.
200 g , == 19739 g/S2 ~ 1 974 kg/s' == (2,00 S)2 ' ,
== 1,974 Nzm
Die fur die .Fehlerfortpflanzung" benotigten partiellen Ableitungen der Funktion D == f(m; T) lauten:
aD ==
-
aT
aD, -
- 8 n 2 . m' T- 3 == - 8 n 2
4n 2
-(m'T)== ' ==98696s- 2 am' (2,00 S)2 '
aD(m.Y)= -8][2. 200g = -19739g/s3
aT '
(2,00 S)3
'
m
'3
T
687
4 "Fehlerfortpflanzung" naeh GauB
Damit erhalten wir .aus dem Gauflschen Fehlerfortpflanzungsgesetz (IV-76) die folgende M eflunsicherheit (Standardabweichung) fur den Mittelwert 15:
AD = sv=
J(~Amr + (~AT
= J(9,8696 s - 2 . 0,68 g)2
r
+ (- 1973,9 g . s - 3 . 0,0105 S)2 =
= 21,79 g/S2 = 0,0218 kg/s' ~ 0,022
Nzm
Das M efiergebnis fur die .Jndirekte'' Mefigrofie D lautet somit D
= 1,974 N/m,
Sf)
= 0,022 N/m
oder (in der im teehnisehenBereieh iiblichen Sehreibweise) D = D
± I1D =
D
± sf) =
(1,974
± 0,022) Nzm
Die prozentuale MeBunsieherheit der abhangigen Grobe D betragt
-~D I = 0,022 N/m '100% = 11%
I 15
1,974 N/m
'
Anmerkung Da D = 4 ti 2 . m . T - 2 ein Potenzprodukt der Melsgroben m und T ist, konnen wir fur die Bereehnung der MeBunsieherheit der abhangigen Grobe D aueh die in der Tabelle 2 angegebene fertige F ormel verwenden (mit C = 4 tt 2, = m, Y = T, a = 1 und f3 = - 2). Wir erhalten natiirlich das bereits bekannte Ergebnis:
X
2
1 . _0,6_8_g 1 1 200 g
2
+ 1_ 2 . _0,0_1_05_s 1 2,00s
= 0,0110 ~ 1,1%
(2)
Dichte einer Eisenkugel Masse m und Durchmesser d einer Eisenkugel wurden aus unabhangigen MeBreihen wie folgt bestimmt: Masse:
m=
560,7 g,
Durehmesser:
d ==
S/11
= 0,5 g
5,11 em,
Sd == 0,02 em
Die Dichte Q laBt sieh dann wie folgt aus den beiden Meligroben m und d bereehnen: Q=
j (m; d)
m
6 m
= - = - .- 3 V tc d
6
= - . m . dtc
(V = ~ d 3 ist das Volumen der Kugel).
3
IV Fehler- und Ausgleiehsreehnung
688
Somit erhalten wir fur die Diehte den folgenden Mittelwert:
o- == f
6 (m; d) == -
560,7 g 3 == 8,025 g/cm tt (5,11 ern}' 0
Fur die Bereehnung der Mej3unsicherheit (d.h. der Standardabweiehung des Mittelwertes g) benotigen wir noeh die partiellen Ableitungen 1. Ordnung der Funktion 0 == f (m; d). Sie lauten:
00 6 -4 == -n . m( - 3 d )== od
m d4
18
-_o-
n
Wir setzen die Mittelwerte mund
d ein
und erhalten:
00 6 1 -(m·d)==-· ==00143em- 3 om' tc (5,11 em}' '
oQ (m d) = _ 18 ° 560,7 g = _ 47116 g/cm" od' ti (5,11 em)" ' o
Das
GauBsehe
F ehlerfortpflanzungsgesetz (Varianzfortpflanzungsgesetz)
(IV -76) liefert uns dann den folgenden Wert fur die M ej3unsicherheit von 0:
!1Q = s- = Q
J(
(0
0 oQ !1m)2 + om od
== J(0,0143 em -3 ·0,5 g)2
J1d)2
+ (- 4,7116 g . em -4
0
0,02 ern)? ==
== 0,095 g/cm' Das M ej3ergebnis fur die Diehte der Eisenkugel lautet dann wie folgt:
g ==
8,025 g/cm',
sQ
== 0,095 g/cm'
oder
o == g ± J10 == g ± sQ == (8,025 ± 0,095) g/cm' (3)
Reihenschaltung von ohmschen Widerstanden Bild IV -21 zeigt eine Reihenschaltung aus drei ohmsehen Widerstanden, die wie folgt gemessen wurden: R 1 == (100
± 2) Q,
R 2 == (150
± 2) Q,
R 3 == (50
± 1)Q
Bild IV-21
Reihenschaltung aus drei ohmschen Widerstanden
689
5 Ausgleichs- oder Regressionskurven
Den Gesamtwiderstand R dieser Schaltung erhalt man nach den Kirchhoffschen Regeln als Summe der Einzelwiderstande: R = f(R 1 ; R z ; R 3 ) = R 1
+ R: + R 3
Der Mittelwert der .Jndirekten'' Mebgrolse R betragt somit: R = j'(R 1 ; «; R 3 ) = 100 Q + 150 Q + 50 Q = 300 Q Wir berechnen nun die Standardabweichung dieses Mittelwertes, d.h. die Mej3unsicherheit L1.R des Gesamtwiderstandes unter Verwendung von Tabelle 2 (Verallgemeinerung der Funktion Z = f (X; Y) = X + Y fur drei Summanden). Somit gilt: L1.R = J(L1.R1)Z + (L1.R z)Z + (L1.R 3)Z = J(2 Q)Z + (2 Q)Z + (1 Q)Z = 3 Q Damit erhalten wir fur den Gesamtwiderstand R das folgende Mej3ergebnis: R = R
± L1.R = (300 ± 3) Q
Die prozentuale MeBunsicherheit betragt 3Q % -L1.RI = --.100 = 10/0
I Ii
300Q
•
5 Ausgleichs- oder Regressionskurven In den naturwissenschaftlich-technischen Anwendungen stellt sich haufig das Problem festzustellen, ob zwischen zwei Variablen (Zufallsvariablen) X und Y irgendeine Beziehung oder Abhdngigkeit besteht und welcher Art diese gegebenenfalIs ist. In Kap. III, Abschnitt 6 haben wir dieses Problem bereits angeschnitten und dort die Begriffe Korrelation und Regression kennengelernt. In diesem Abschnitt werdenwir nun zeigen, wie man in der Praxis aus einer aus n MeBpunkten bestehenden Stichprobe eine Regressionsoder Ausgleichskurve ermitteln kann, die den Zusammenhang zwischen den beiden VariabIen in "optimaler" Weise beschreibt.
5.1 Ein einfiihrendes Beispiel Zwischen zwei physikalisch-technischen Grolsen X und Y solI auf experimentelIem Wege ein [unktionaler Zusammenhang hergestellt werden. Die aufgrund verschiedener Messungen erhaltenen n Wertepaare (Xi; yJ konnen dann als Punkte Pi = (Xi; yJ in einer X, yEbene bildlich dargestellt werden (i = 1, 2, ... , n). Die Aufgabe der Ausgleichsrechnung besteht nun darin, eine Kurve y = f (x) zu bestimmen, die sich diesen MeBpunkten .anoglichst gut" anpaBt. Aus dieser Regressions- oder Ausgleichskurve laBt sich dann zu einem vorgegebenen Wert X der unabhangigen Grobe X der zugehorige Wert y der von X abhangigenGrofie Y schdtzen.
IV Fehler- und Ausgleichsrechnung
690
Wir wollen dieses Problem zunachst an einem einfachen Beispiel naher erlautern, In einem Experiment solI die Temperaturabhdngigkeit eines ohmschen Widerstandes R in einem bestimmten Temperaturintervall untersucht werden. Dazu wurde der Widerstand bei acht verschiedenen Temperaturen jeweils genau einmal gemessen. Das MeBprotokoll hatte dabei das folgende Aussehen: i
1
2
3
4
5
6
7
8
~
20
25
30
40
50
60
65
80
16,30
16,44
16,61
16,81
17,10
17,37
17,38
17,86
°C
Ri
-
Q
Die acht Wertepaare (~; RJ fiihren dann zu acht MeBpunkten Pi == (i == 1, 2, ... , 8), die nach Bild IV-22 nahezu auf einer Geraden liegen.
(~;
RJ
R Q
18
17 Bild IV-22 Zur Temperaturabhangigkeit eines ohmschen Widerstandes: Die MeBpunkte liegen nahezu auf einer Geraden
16
15 --+----+------l---l----4---f---+-----+---f--
10
20
30
40
50
60
70
80
-
T
DC
Es gelingt nun ohne groBe Schwierigkeiten, .frei nach AugenmaB" eine Gerade einzuzeichnen, die sich diesen MeBpunkten "besonders gut" anpaBt (Bild IV-:-22). Die Streuung der MeBpunkte urn den geradlinigen Verlauf fuhren wir dabei auf die unvermeidlichen "Zufallsfehler" (zufalligen MeBabweichungen) zuruck. Aus dem MeBprotokollentnehmen wir z.B., daB bei einer Temperatur von 50°C ein Widerstandswert von 17,10 Q gemessen wurde. Wiirden wir jedoch bei dieser Temperatur die Widerstandsmessung mehrmals wiederholen, so erhielten wir infolge der unvermeidlichen zufiilligen MeBabwei-
5 Ausgleichs- oder Regressionskurven
691
chungen stets etwas voneinander abweichende Widerstandswerte 17). Die Gerade in Bild IV -22 wurde dabei so gelegt, daf sie die Streuung der Mefipunkte nach beiden Seiten hin .moglichst gut ausgleicht". Allerdings ist die Auswahl einer solchen Ausgleichs- oder Regressionsgeraden subjektiv bedingt. Verschiedene Personen werden namlich i.a. zu einem unterschiedlichen Urteil kommen und daher verschiedene Geraden als "besonders gut angepalit" ansehen. An dieser Stelle setzt nun die Ausgleichsrechnung ein. Sie liefert uns mit der von Gauj3 stammenden "Methode der kleinsten Quadrate" ein objektives Hilfsmittel zur Losung der gestellten Aufgabe. Wir erhalten nach dieser Methode eine eindeutig bestimmte Gerade, wie in Abschnitt 5.3 noch ausfiihrlich dargelegt wird.
5.2 Ausgleichung nach der "Gau8schen Methode der kleinsten Quadrate" Wir formulieren die Aufgabe wie folgt: Mitden Methoden der Ausgleichsrechnung soll aus n gemessenen Wertepaaren (Mej3punkten) (Xi; yJ (i = 1, 2, ... , n) ein miiglichst einfacher funktionaler Zusammenhang zwischen den Mej3groj3en X und Y hergeleitet werden. Als Ergebnis erwarten wir dabei eine Funktion y = f (x), die sich den MeBpunkten .moglichst gut" anpalst und daher in diesem Zusammenhang als Ausgleichs- oder auch Regressionskurve bezeichnet wird. 1m Bereich der Technik wird dabei meist unterstellt, daf die als unabhangige Variable betrachtete Mefrgrobe X .fehlerfrei" gemessen wird, d. h. die unvermeidlichen zufdlligen MeBabweichungen der x- Werte werden im Vergleich zu denen der y- Werte als vernachldssigbar klein angesehen. Dies aber bedeutet, daf wir die unabhangige Meflgrolie X als eine gewohnliche Variable auffassen diirfen, deren feste Werte auch bei Versuchswiederholungen unverdndert bleiben. Die von der (gewohnlichen) Variablen X abhangige Mebgrolse Y ist dagegen eine Zufallsvariable, da die bei festem X = x in Versuchswiederholungen erhaltenen Werte dieser Variablen infolge der unvermeidlichen zufdlligen Mebabweichungen ("Zufallsfehler") urn einen Mittelwert streuen. Als Maj3 fiir die (zufallsbedingte) Abweichung zwischen Mebpunkt und Ausgleichskurve fiihren wir den vertikalen Abstand, d.h. die Ordinatendifferenz ein (Bild IV-23). Der Abstand des Mefipunktes Pi = (Xi; yJ von der gesuchten (aber noch unbekannten) Ausgleichskurve y = f (x) betragt damit 18) (IV-87)
1 7)
18)
Streng genommen sind auch die Temperaturangaben .fehlerhaft". Wir unterstellen aber, daB die MeBungenauigkeiten der Temperaturwerte im Vergleich zu den entsprechenden MeBungenauigkeiten der Widerstandswerte vernachldssigbar klein sind. Die unabhangige Melsgrolse T wird somit wie eine gewohnliche Variable behandelt, deren Werte in kontrollierbarer Weise "exakt" eingestellt werden konnen. Dagegen wird die von. T abhangige MeBgroBe R als eine Zufallsvariable betrachtet. Wir konnen namlich aufgrund der unvermeidlichen zufalligen MeBabweichungen nicht exakt vorhersagen, welchen Wert der Widerstand R bei fest vorgegebener Temperatur T tatsachlich besitzt. Liegt der MeBpunkt Pi oberhalb (unterhalb) der Ausgleichskurve, so ist Vi > 0 (Vi < 0).
IV· Fehler- und Ausgleichsrechnung
692 y
• = (Xi; y;)
Pi
•
Ausgleichskurve Y= f(x)
Bild IV-23 MeBpunkte Pi = (Xi; yJ mit .Ausgleichskurve" X
Xi
Eine objektive Methode zur Bestimmung der "giinstigsten" Kurve, eben der Ausgleichskurve, liefert die Gaufische Methode der kleinsten Quadrate. Danach paBt sich diejenige Kurve den vorgegebenen MeBpunkten "am besten" an, fur die die Summe der Abstandsquadrate aller n MeBpunkte ein Minimum annimmt: n
S=
n
I
Vi2 =
I
(Yi -
f
(Xi))2
->
Minimum
(IV-88)
i= 1
i= 1
Wie man dieses Minimum mit den Hilfsmitteln der Differentialrechnung bestimmt, zeigen wir etwas sparer. Von groBer Bedeutung fur die Losung der gestellten Aufgabe ist dabei die Wahl eines geeigneten Funktionstyps, der der Ausgleichsrechnung zugrunde gelegt werden solI. Der Losungsansatz fur eine Ausgleichskurve ist naturgemaf von Fall zu Fall verschieden. Eine Entscheidung fur einen bestimmten Funktionstyp laBt sich daher stets nur am konkreten Einzelfall treffen, z.B. aufgrund theoretischer Ubcrlcgungen oder aber anhand der Punktwolke, die die n MeBpunkte im Streuungsdiagramm bilden. Liegen die MeBpunkte beispielsweise nahezu in einer Linie, so wird man einen Losungsansatz in Form einer linearen Funktion vom Typ y
== ax
+b
(IV-89)
wahlen (Ausgleichsgerade; Bild IV-24). Fur eine Punktwolke wie in Bild IV-25 ist eine solche lineare Ausgleichung dagegen wenig sinnvoll. Hier wird man sich zu Recht fiir einen quadratischen Losungsansatz in Form einer Ausgleichs- oder Regressionsparabel vorn Typ y == ax'
+ bx + c
(IV-90)
entscheiden. In beiden Fallen lassen sich dann die Kurvenparameter (a und b bzw. .a, b und c) so aus der vorgegebenen Stichprobe (Xi; Yi) bestimmen, daB die jeweils ausgewahlte Kurve sich den MeBpunkten "optimal" anpaBt.
5 Ausgleichs- oder Regressionskurven
693
y
Ausgleichsgerade
Bild IV-24 Ausgleichsgerade
x
y
• Ausgleichsparabel
•
Bild IV-25 Ausgleichsparabel
x
Lineare Funktionen treten dabei in den technischen Anwendungen besonders haufig auf. Man spricht daher in diesem Zusammenhang auch von linearer Ausgleichung oder linearer Regression. Aber auch Parabeln, Polynomfunktionen hoherer Ordnung, Potenz-, Exponential- und Logarithmusfunktionen sowie einfache gebrochen-rationale Funktionen spielen eine groBe Rolle bei der Festlegung des Funktionstyps einer Ausgleichskurve. Die in diesen Funktionen enthaltenen Parameter sind dann jeweils so zu bestimmen, daB das Gaufische M inimierungsprinzip (IV-88) erfiillt wird. In Tabelle 3 haben wir einige besonders einfache, aber haufig auftretende Losungsansatze fur Ausgleichskurven zusammengestellt. Die jeweiligen Kurvenparameter sind ebenfalls angegeben.
Im konkreten Fall geht man nun folgendermaBen vor: Zunachst muB man sich aufgrund der genannten Uberlcgungcn fur einen bestimmten Liisungsansatz y == f (x) fur die gesuchte Ausgleichs- oder Regressionskurve entscheiden, wobei das Streuungsdiagramm, d.h. die bildliche Darstellung der n MeBpunkte (Xl; Yl)' (x 2; Y2)' ... , (x n; Yn) als Punktwolke, eine wesentliche Entscheidungshilfe liefert.
694
IV Fehler- und Ausgleichsrechnung
Dann werden die im Losungsansatz enthaltenen Funktionsparameter a, b, ... so bestimmt, daB die von diesen Parametern abhangige Summe der Abstandsquadrate n
L (Yi - f(XJ)2
S(a; b; ...) = i
(IV-91)
=1
ein Minimum annimmt. Nach den Regeln der Differentialrechnung ist dies der Fall, wenn die partiellen Ableitungen 1. Ordnung von S (a; b; ...) verschwinden 19):
as
aa == 0,
as
(IV-92)
ab == 0, ...
Aus diesem Gleichungssystem lassen sich dann die Parameter a, b, ... und damit die Ausgleichskurve eindeutig bestimmen. Die Gleichungen (IV-92) heiBen N ormalgleichungen. Sie sind i.a. nicht-linear und daher meist nur numerisch unter erheblichem Rechenaufwand zu losen. Nur in einfachen Fallen erhalt man ein (quadratisches) lineares Gleichungssystem, daB mit Hilfe des Gauj3schen Algorithmus gelost werden kann. Tabelle 3: Einfache Losungsansatze fur Ausgleichs- oder Regressionskurven
y==ax 2 + b x + c
a,b,c
a,b
19)
y
== a . e bx
a,b
y
== a . In (bx)
a,b
ax + b b y==---==a+x x
a,b
a y==x+b
a,b
ax y==x+b
a,b
Die Gleichungen (IV-92) sind notwendig, jedoch keinesfalls hinreichend fur die Existenz eines Minimums. Man mull dann von Fall zu Fall entscheiden, ob tatsachlich ein Minimum vorliegt.
5 Ausgleichs- oder Regressionskurven
695
Wir fassen die Ergebnisse zusammen:
Anmerkungen (1)
Die MeBwertepaare (Xl; Yl)' (X2; Y2)' ... , (Xn; Yn) reprasentieren eine zweidimensionale Stichprobe, die man der (X; Y)-Grundgesamtheit entnommen hat. Die als unabhdngig angesehene Variable X ist dabei in den technischen Anwendungen meist eine gewohnliche Variable, wahrend die abhdngige Meligrolre eine Zufallsvariable darstellt (X ist eine .Jehlerfreie", Y dagegen eine mit zufdlligen M efJabweichungen versehene MeBgroBe).
(2)
Eine Ausgleichung ist nur moglich, wenn die Anzahl n der MeBpunkte grofJer ist als die Anzahl der Kurvenparameter. Die Anzahl der Normalgleichungen, aus denen die Parameter berechnet werden, entspricht dabei stets der Anzahl der Parameter.
Konkrete Beispiele fur Ausgleichsprobleme folgen in den nachsten Abschnitten.
696
IV Fehler- und Ausgleichsrechnung
5.3 Ausgleichs- oder Regressionsgerade Wir behandeln in diesem Abschnitt den in den Anwendungen besonders haufig auftretenden und zugleich einfachsten Fall einer linearen Ausgleichskurve Y == ax + b, die als Ausgleichs- oder Regressionsgerade bezeichnet wird.
5.3.1 Bestimmung der Parameter einer Ausgleichsgeraden Fur den vertikalen Abstand Vi zwischen dem MeBpunkt Pi == (Xi; der Ausgleichsgeraden
y
==
f
(x)
ax
==
yJ (i == 1,2, ... , n) und
+b
(IV-95)
gilt dann nach Bild IV-26:
Vi
==
Yi - j'(xJ
==
Yi - (ax i + b) == Yi - aX i - b
(IV-96)
y
•
Ausgleichsgerade
Bild IV-26
Zur Bestimmung der Ausgleichsoder Regressionsgeraden x
Die Parameter a und b werden dabei nach der Gauj3schen Methode der kleinstenQuadrate so bestimmt, daf die Summe der Abstandsquadrate 11
S(a; b) =
I
(Yi - ax, -
W
(IV-97)
i= 1
ihren kleinsten Wert annimmt. Dies ist nach (VI-94) der Fall, wenn die partiellen Ableitungen 1. Ordnung
as oa = 2·
I
11
i= 1
I (11
(Yi - ax, - b) . (- Xi) = 2·
XiYi
+ ax? + bx;)
(IV-98)
i= 1
(IV -99)
verschwinden.
697
5 Ausgleichs- oder Regressionskurven Wir erhalten daraus die N ormalgleichungen
(IV -100)
die ein lineares Gleichungssystem mit zwei Gleichungen und zwei Unbekannten reprasentieren 20). Das System besitzt genau eine Losung, da die Koeffizientendeterminante nicht verschwindet:
D=
=
IX
i
n.
I x? - (I x)
2
1
n
1
=
~ .I
I (Xi ~ xy > 0
(IV-l01)
J
Mit den beiden Hilfsdeterminanten
(IV-l02)
und
(IV-l03)
erhalten wir nach der Cramerschen Regel die folgende Losung:
I XiYi - (I x) (IYi)
n· D1 1 1 1 a = - = ----------D 2 n . Xi -
I 1
20)
(I xy
(IV -104)
1
Wir lassen im folgenden bei vielen Zwischenrechnungen die Summationsgrenzen weg. Der Summationsindex (meist i; manchmal auch j) lauft dabei stets von 1 bis n.
IV Fehler- und Ausgleichsrechnung
698
(IV-l05)
Auch das fur ein Minimum hinreichende Kriterium (Gleichung (IV-80) aus Band 2) ist erfiillt. Mit (IV-106)
und
folgt namlich
(IV-107)
Die Ausgleichsgerade y == ax
+ b ist
damit eindeutig bestimmt.
Unter Verwendung der aus den x- bzw. y-Komponenten der MeBpunkte gebildeten M ittelwerte
_ 1 x = ~.
IX
(IV-l08)
und
i
lassen sich die soeben hergeleiteten Berechnungsformeln fur die Steigung a, auch empirischer RegressionskoefJizient genannt, und den Achsenabschnitt b der Ausgleichsgeraden y == ax + b auch wie folgt umformen:
Steigung (RegressionskoefJizient) a: n: a
(Ix) (~Yi) I n . I xf - (I x)
~ XiYi l
n:
l
l
== - - - - - - - - - -
i
XiYi - (nx)(ny)
I XiYi - nxy i
2
l
l
(IV-109)
699
5 Ausglcichs- oder Regressionskurven
Achsenabschnitt b:
b
(I =
(Ix) (I n. I xl ~ ( I x)
l
Xi ) (IY) -
1
1
1
XiY)
1
1
1
(I
1
l) ny- (nx)
Xi
(I
1
XiY)
1
(I xl)Y - x(I 1
XiYi)
1
(Im Zahler wird der Term nx 2 y addiert und gleichzeitig wieder subtrahiert)
(L\ 2) Y-- x-(\L Yi) + nx-2 Y-- nx-2 YXi
Xi
1
1
(I xl - nXl) y - (I 1
XiYi -
nxy)x
I XiYi -
nxy
1
x=
-
=y-
x
= y- - ax-
(IV-110)
'-v-'
a Der Parameter b HiBt sich daher aus dem RegressionskoefJizient a nach der F ormel
b=
Y-
berechnen.
ax
(IV-111)
IV Fehler- und Ausgleichsrechnung
700
Mit Hilfe dieser Beziehung HiBt sich die Ausgleichs- oder Regressionsgerade auch auf die folgende symmetrische Form bringen: y -
y=
a(x - x)
Denn aus y = ax
+ b folgt
(IV-112) unter Verwendung der Formel (IV-111) unmittelbar:
y=ax+b=ax+y-ax=a(x-x)+y
=>
y-y=a(x-x)
(IV-113)
Die Ausgleichsgerade verlauft somit durch den "Schwerpunkt" S = (x; y) der Punktwolke (Xl; Yl), (x 2; Y2)'···' (x n; Yn) (Bild IV-27).
Wir fassen die bisherigen Ergebnisse wie folgt zusammen:
70J
5 Ausgleichs- oder Regressionskurven y
•
• •
Ausgleichsgerade
-
y
"Schwerpunkt" S
•
•
Bild IV-27 Die Ausgleichsgerade verlauft durch den "Schwerpunkt""
S = (x;y)
x
Anmerkungen (1)
Die Bestimmung einer Ausgleichsgeraden ist nur rnoglich, wenn mindestens drei MeBpunkte vorliegen (n ~ 3).
(2)
Die vorgegebenen n MeBpunkte sind im Sinne der Statistik als eine zweidimensionale Stichprobe (Xl; Yl)' (X2; Y2)' ... , (Xn; Yn) aufzufassen, die einer zweidimensionalen Grundgesamtheit (X; Y) entnommen wurde. Zwischen den Zufallsvariablen X und Y besteht dann die lineare Beziehung
Y - /ly = a*(X - /lx)
(IV-117)
Sie wird als Regressionsgerade der Grundgesamtheit bezeichnet, wo bei X als unabhiingige und Y als von X abhdngige Variable angesehen wird. /lx und /ly sind die Erwartungs- oder Mittelwerte der beiden Variablen: E(X) = /lx und E(Y) = /ly. Die Steigung a* ist der zugehorige Regressionskoeffizient. Der empirische Regressionskoeffizient a ist dabei euiSchdtz- oder N dherungswert fur den theoretischen Regressionskoeffizienten a*, d.h. a* ~ a.
•
Beispiel Wir kommen auf das zu Beginn behandelte einfuhrende Beispiel zuriick (Bestimmung der Temperaturabhdngigkeit eines ohmschen Widerstandes). Dort hatten wir bereits erkannt, daf die acht MeBpunkte nahezu auf einer Geraden liegen (vgl. hierzu Bild IV -22). Der lineare Ansatz R
=
R (T)
=
aT
+b
ist daher gerechtfertigt.
702
IV Fehler- und Ausgleichsrechnung Die Berechnung der noch unbekannten Koeffizienten (Parameter) a und b erfolgt dabei zweckmalsigerweise mit Hilfe der folgenden Tabelle:
20
16,30
400
326
2
25
16,44
625
411
3
30
16,61
900
498,3
4
40
16,81
1600
672,4
5
50
17,10
2500
855
6
60
17,37
3600
1042,2
7
65
17,38
4225
1129,7
8
80
17,86
6400
1428,8
Mittelwerte T und R:
I
8
-T = -1 . 8 i
T = -1 . 370°C = 46 25°C l 8 '
=1
I
8
-R = _. 1 8
R· = 1_. 135 87 Q = 1698375 Q l
8
'
.,
i= 1
Regressionskoeffizient a: 8
I
I;R; -
8TR
i= 1
a=-----8
I i
=
I;2_8T 2
=1
6363,4 °C Q - 8 (46,25 °C) (16,98375 Q) Q =002531120250 (OC)2 - 8 (46,25 °C)2 ' °C
5 Ausgleichs- oder Regressionskurven
703
Die Ausgleichsgerade lautet somit in der speziellen symmetrischen Form (IV-116) wie folgt: R-
Ii == a(T -
T)
,
Q
R - 16,98375 Q
== 0,025311 0C (T - 46,25 °C)
In der Hauptform erhalten wir
R
=
(0,o253
o~) .T + 15,8131 Q
(Bild IV-28). Die Kurvenparameter a und b besitzen somit die Werte Q
b == 15,8131 Q
und
a == 0,0253 0C
R Q
18
17
16 Bild IV-28 15-+--+----+--~--+----+--+-----+----f---I---
10
20
30
40
50
60
70
80
Mit Hilfe der Ausgleichs- oder Regressionsgeraden konnen wir jetzt im Temperaturbereich zwischen 20°C und 80°C vemiinftige Schiitzwerte fur den ohmschen Widerstand erhalten. Z.B. erwarten wir bei einer Temperatur von T == 45°C einen Widerstandswert von R (T
= 45°C) = (0,0253
o~)- 45°C + 15,8131 Q = 16,9516 Q ~ 16,95 Q
•
704
IV Fehler- und Ausgleichsrechnung
5.3.2 Streuungsma8e und Unsicherheiten bei der Parameterbestimmung Wir beschaftigen uns in diesem Abschnitt mit der Streuung der MeBpunkte (Xi; Yi) urn die Ausgleichsgerade Y == ax + b und den Unsicherheiten (Standardabweichungen bzw. Varianzen) der berechneten Parameter a und b.
Zusammenhang zwischen Regressionskoeffizient a und Korrelationskoeffizient r
Der RegressionskoeJfizient a der Ausgleichsgeraden Y
== ax + b
oder
y == a (x -
Y-
x)
(IV-118)
laBt sich auch durch den empirischen KorrelationskoeJfizienten r und die Standardabweichungen s, und Sy der x- bzw. y-Komponenten der MeBpunkte ausdriicken. Aus den Definitionsformeln 21)
Sxy
=
n~ 1 .
I
(Xi - x) (Yi -
y) = n ~ 1
1
[I
XiYi -
nxyJ
(IV-119)
1
und (IV-120)
folgen zunachst die Beziehungen (IV-121)
und (IV-122)
die wir dann in die Formel (IV-114) fur den Regressionskoeffizienten a einsetzen:
a==-----
21)
(n-1)sxy
(n - l)s;
(IV-123)
Es hande1t sich urn die Gleichungen (111-287) und (111-289) bzw. (111-19) und (111-20) aus Kap. III.
5 Ausgleichs- oder Regressionskurven
705
s s; . Sy fur den empirischen KorrelationskoefJizienten erhalten wir schlieBlich den gesuchten Zusammenhang:
Durch Erweiterung mit
Sy
und unter Berucksichtigung der Definitionsformel r =
~
(IV-124)
Regressionskoeffizient a und Korrelationskoeffizient r sind somit zueinander proportionale Grofien. Empirische Restvarianz
Die Parameter a und b im Losungsansatz y = ax + b fur eine Ausgleichsgerade haben wir gerade so bestimmt, daB die Summe der (vertikalen) Abstandsquadrate ihren kleinsten Wert annimmt. Diesen Minimalwert wollen wir jetzt berechnen. Unter Beriicksichtigung von b = Y- ax erhalten wir zunachst: Sea; b)min
=
I (Yi -
ax, -
W=
I (Yi - ax, -
y + ax)2 =
(IV-125)
Die in dieser Gleichung auftretenden Summen lassen sich mit Hilfe der DefinitionsforSy2 und SXy dabei noch wie folgt ausdriicken: meln fur
s;,
(IV-126)
I (Yi I
yf
= (n -
(Xi - x) (Yi -
(IV-127)
1)s;
y) = (n - 1)sxy
(IV-128)
Damit erhalten wir Sea; b)min =
I (Yi -
jl)2 - Z a-
I
(Xi - x) (Yi -
y) + a 2 .
I
(Xi - X)2 =
= (n - 1)s; - 2a(n - 1)sxy + a 2 . (n - 1)s; = (IV-129)
706
IV Fehler- und Ausgleichsrechnung
Setzen wir in diese Gleichung noch die aus (IV-123) gewonnene Beziehung ein, so folgt weiter: S(a; b)min == (n - 1) [s; - 2a(a· s;)
+ a2
.
Sxy
s;] == (n - 1) (s; - a 2 . s;)
==
a· s;
(IV-130)
Jetzt driicken wir noch den Regressionskoeffizienten a durch den Korrelationskoeffizienten r mit Hilfe der Beziehung (IV-124) aus und erhalten so schlieBlich:
Sea; b)min
= (n - 1)
(s; - a s;) = (n - 1) (s; - r :~ s;) = 2
2
•
•
•
(IV-131) Diese Summe der (vertikalen) Abweichungsquadrate verschwindet genau dann, wenn der empirische Korrelationskoeffizient den Wert r == - 1 oder r == + 1 annimmt. Alle n MeBpunkte (Xi; yJ liegen dann auf einer Geraden, namlich der Ausgleichsgeraden (Bild IV-29). Dieses Ergebnis aber ist uns bereits aus Kap. III, Abschnitt 6.1.1 bekannt. y
\
Ausgleichsgerade
Bild IV-29 Sonderfall: Samtliche MeBpunkte liegen auf der Ausgleichsgeraden
x
Varianz und Standardabweichung der berechneten Parameter 1m allgemeinen jedoch werden die MeBpunkte - wie in den Bildern IV-26 und IV-27 dargestellt - urn die Ausgleichsgerade streuen. Die durch die Gleichung 2 SRest
S(a; b)min == n - 2
(n-l)(1-r 2)s; n-2
(IV-132)
definierte empirische Restvarianz stellt dann ein geeignetes M ajJ fur die Streuung der MeBpunkte urn die Ausgleichsgerade dar. Die durch Wurzelziehen erhaltene Grobe SRest charakterisiert somit die Unsicherheit der MeBwerte Yl' Y2' ... , Yn- Die Restvarianz verschwindet dabei genau dann, wenn siimtliche MeBpunkte auf einer Geraden liegen und dies wiederum ist genau dann der Fall, wenn der empirische Korrelationskoeffizient den Wert r == - 1 oder r == + 1 annimmt.
5 Ausgleichs- oder Regressionskurven
707
Wahrend sich die Ordinatenwerte Yl' Y2' ... ,Yn der n MeBpunkte (Xi; Yi) von Stichprobe zu Stichprobe infolge der Zufallsstreuung veriindern, bleiben die Abszissenwerte Xl' X 2, •.. , x, unveriindert. Denn X ist eine gewohnliche Variable, Y dagegen eine Zufallsvariable! Daher veriindern sich auch die Parameter a und b der Ausgleichsgeraden Y == ax + b mit der Stichprobe. Regressionskoeffizient a und Achsenabschnitt b sind somit Funktionen der (streuenden) OrdinatenmeBwerte Yl' Y2' ... , Yn und folglich ebenfalls mit gewissen Unsicherheiten behaftet 22). Die Unsicherheiten bei der Bestimmung der Parameter a und b werden dabei durch die folgenden Varianzen bzw. deren QuadratwurzeIn beschrieben 23):
S2
==
n . siest
an'
I xl _ ( ~ x;y 1
sf
(1 - r
)
(n - 2)
s;
(IV-133)
s;
1
(I xl) . siest n.I xl _ ( ~ x) i
1
2
== 2
(n - 1) s;
n
+ ni 2
.s
2
(IV-134)
a
1
Wir fassen diese wichtigen Aussagen wie folgt zusammen:
22)
23)
Diese Unsicherheiten sind eine direkte Folge der Unsicherheit der y-MeBwerte. Es handelt sich hier also urn eine Fortpflanzung von "Fehlern" bzw. Varianzen. Sa und Sb sind die Standardabweichungen der beiden Parameter a und b.
708
IV Fehler- und Ausgleichsrechnung
709
5 Ausgleichs- oder Regressionskurven Anmerkung
Die empirische Restvarianz nach Gleichung (IV-137) erhalt man, indem man die minimierte Summe der Abstandsquadrate, also S (a; b)min, durch die Anzahl f der sog. Freiheitsgrade dividiert. Dabei gilt allgemein: (IV-140)
f=n-k
wobei n die Anzahl der MejJpunkte und k die Anzahl der zu bestimmenden Kurvenparameter im Losungsansatz bedeuten. Bei der Ausgleichsgeraden sind k = 2 Parameter (namlich a und b) zu bestimmen und somit gibt es in diesem Fall f = n - 2 Freiheitsgrade.
•
Beispiel 1m Beispiel des letzten Abschnitts hatten wir die Temperaturabhdngigkeit eines ohmschen Widerstandes aus acht MeBpunkten mit Hilfe einer Ausgleichsgeraden ermittelt. Wir erhielten dabei den folgenden Zusammenhang zwischen dem Widerstand R (in Q) und der Temperatur T (in °C):
R = (0,0253
o~) .T + 15,8131 0
(vgl. hierzu auch Bild IV-28). Wir fiihren dieses Beispiel nun zu Ende und wollen uns noch mit der Streuung der MeBpunkte urn die ermittelte Ausgleichsgerade und den Unsicherheiten der Parameter a und b beschaftigen. Die dabei benotigten Werte fur den empirischen Korrelationskoeffizienten r und die Varianzen s;. und s~ der Mellgrofien T und R sind aus Kap. III., Abschnitt 6 (Ubungsaufgabe 3) bereits bekannt:
s;. = 448,2149 (OC)2,
= 0,9974,
r
s~
= 0,2887 Q2
Damit erhalten wir nach Formel (IV-137) eine empirische Restvarianz von
_ (8 - 1) (1 - r 2 ) s~ _ 7 (1 - 0,9974 2) . 0,2887 Q2 _ 1""\2 - 0,0017 ~~ 8-2 6
2
SRest -
Der kleine Wert bestatigt dabei nochmals, daB die MeBpunkte in sehr guter Naherung auf einer Geraden liegen. Fur die Varianzen der Parameter a und b folgt unter Verwendung der Formeln (IV-138) und (IV-139) und unter Beriicksichtigung des Mittelwertes T = 46,25 °C: S2= a
(8 - 1)
2
Sb
Q2 (1 - r 2 ) S2 (1 - 09974 2) .02887 Q2 R= ' , =557.10- 8 - (8 - 2) s;. 6 . 448,2149 (OC)2 ' (OC)2
=
s;. + 8 y2 8
2
. Sa
=
7 . 448,2149 CC)2 + 8 . (46,25 °C)2 .
8
55,7
. 10- 8 ~ = 0001410 Q2 (0C)2'
IV Fehler- und Ausgleichsrechnung
710
Damit ergeben sich folgende Unsicherheiten fur Regressionskoeffizient a und Achsenabschnitt b: Sb
= 0,0375 Q
•
5.4 Ausgleichs- oder Regressionsparabel Liegen die in das Streuungsdiagramm eingetragenen n MeBpunkte Pi = (Xi;
yJ
(i = 1, 2, ... , n) nahezu auf einer Parabel, so wahlt man zweckmaliigerweise einen quadra-
tischen Losungsansatz in Form einer sag. Ausgleichs- oder Regressionsparabel Y =f(x) = ax? + bx + c
(IV-141)
(Bild IV-30). Der vertikale Abstand des i-ten MeBpunktes von dieser Parabel betragt dann Vi
= Yi -
f(xJ
= Yi -
+
(axf
b x,
+ c) = Yi -
ax? - b x, -
C
(IV-142)
y
Ausgleichsparabel =ax2 «bx +c
y
• f(x)
=ax j 2 + bx,
+c
Bild IV-30 Zur Bestimmung der Ausgleichsparabel
x
x,
Die zunachst unbekannten Kurvenparameter (Koeffizienten) a, b und c werden dabei nach der Gauj3schen Methode der kleinsten Quadrate wiederum so bestimmt, daB die Summe der vertikalen Abstandsquadrate alIer MeBpunkte von der Ausgleichsparabel ihren kleinsten Wert annimmt: n
S(a; b; c) =
I
(Yi - ax i2
-
bx, -
C)2
~ Minimum
(IV-143)
i= 1
Dazu miissen die drei partielIen Ableitungen 1. Ordnung von S(a; b; c) notwendigerweise verschwinden:
5 Ausgleichs- oder Regressionskurven n
as
oa =
711
2·
I
(Yi - axl- b x, - c)(-xl) == 0
i= 1
as ob = 2·
I
n
(Yi - ax? - b x, - c) (- x.) = 0
(IV-144)
i= 1
as oc = 2·
I
n
(Yi - ax? - b x, - c) (-1) = 0
i= 1
Wir erhalten damit drei lineare Gleichungen mit den drei Unbekannten a, b, c. Dieses quadratische lineare Gleichungssystem liiBt sich dann mit Hilfe der Cramerschen Regel oder durch Anwendung des Gaufischen Algorithmus Iosen.
Anmerkungen (1)
Eine Ausgleichskurve in Form einer Parabel ist nur moglich, wenn mindestens vier MeBpunkte vorliegen (n ~ 4).
(2)
Die drei Normalgleichungen (IV-146) erhalt man aus dem Gleichungssystem (IV-144) durch Auflosen der Summen und anschlieBendem Ordnen der Glieder.
712 •
IV Fehler- und Ausgleichsrechnung Beispiel
Bei einem bestimmten Autotyp soll der Zusammenhang zwischen dem Bremsweg s (in m) und der Geschwindigkeit v (in km/h) naher untersucht werden. Dazu wurde der Bremsweg bei fiinf verschiedenen Geschwindigkeiten gemessen. Man erhielt dabei die folgenden MeBwertepaare:
i
1
2
3
4
5
Vi
40
70
100
130
150
s,
14
39
78
120
153
Als Ausgleichskurve wahlen wir aufgrund des Streuungsdiagramms nach Bild IV-31 eine Parabel vom Typ s
== ao? + bv + c
Die Kurvenparameter a, b und c dieser Ausgleichsparabel bestimmen wir zweckmaliigerweise anhand der folgenden Tabelle (die Einheiten haben wir der besseren Ubersicht wegen weggelassen):
40
14
1600
64000
2560000
22400
560
2
70
39
4900
343000
24010000
191100
2730
3
100
78
10000
1000000
100000000
780000
7800
4
130
120
1690021970002856100002028000
15600
5
150
153
22500
22950
3375000
506250000
3442500
Die Normalgleichungen (IV-146) haben damit das folgende Aussehen: (I) (II) (III)
918430000· a + 6979000· b + 55900· c == 6464000
+ 55 900 . a +
6979000· a
55900· b +
490· c ==
49640
490 . b +
5 . c ==
404
5 Ausgleichs- oder Regressionskurven
713
s m 150
100 Ausgleichsparabel s=av 2+bv+c
• 50
Bild IV-31
Der Bremsweg s ist eine quadratische Funktion der Gesch windigkei t v ("Ausgleichsparabel")
100
50
150
v km/h
Wir losen dieses quadratische lineare Gleichungssystem z.B. mit Hilfe des Gaufsschen Algorithmus und erhalten die Parameterwerte
a = 0,004 399,
b = 0,437217,
c = -11,23
Die gesuchte Ausgleichsparabellautet somit 24):
s = 0,004399 . v 2
+ 0,437217 . v -
11,23
Ihr Verlauf ist in Bild IV-32 dargestellt. s m
150
100 Ausgleichsparabel
50
Bild IV-32 50
24)
100
150
v km/h
Die Geschwindigkeit v ist in der Einheit km/h, der Weg s in der Einheit m einzusetzen.
IV Fehler- und Ausgleichsrechnung
714
Mit Hilfe der Ausgleichsparabel konnen wir jetzt im Geschwindigkeitsbereich von 40 km/h bis hin zu 150 km/h den Bremsweg fiir eine vorgegebene Geschwindigkeit abschdtzen. So erwarten wir beispielsweise bei einer Geschwindigkeit von 90 km/h einen Bremsweg von s (v = 90) = 0,004399 . 90 2
+ 0,437217
. 90 - 11,23 = 63,75
Der Bremsweg betragt daher bei der Geschwindigkeit v
(in m)
= 90 km/h rund 64 m.
• 5.5 Nichtlineare Ausgleichsprobleme, die auf lineare Regression zuriickfiihrbar sind Viele nichtlineare Losungsansatze fur Ausgleichskurven lassen sich durch eine geeignete Transformation auf den rechnerisch erheblich einfacheren linearen Ansatz zuriickfiihren. Wir zeigen dies am Beispiel der Exponential- und Potenzfunktionen, die sich im halb- bzw. doppellogarithmischen Funktionspapier durch lineare Funktionen, d.h. durch Geraden darstellen lassen.
Exponentialfunktion y
= a · eb x
Durch Logarithmieren folgt zunachst: In y
= In (a . e bX) = In a + In (e bX) = In a + b x = b x + In a
(IV-147)
Wir fiihren jetzt die formale Transformation
u = x,
v
= In y
durch, setzen dabei noch c v = cu
(IV-148)
= b und d = In a und erhalten dann die Gerade
+d
(IV-149)
Durch diese Transformation wird also eine Exponentialfunktion in eine lineare Funktion iibergefiihrt : y
= a . e bx
u=x v
= In y
v
= cu + d
(IV-150)
(c = b, d = In a). Bildlich bedeutet dies: Wenn wir auf der vertikalen Koordinatenachse In y und auf der horizontalen Achse (wie bisher) x abtragen, erhalten wir eine Gerade (Bild IV-33). Die vertikale Achse wird also logarithmisch geteilt, wahrend die horizontale wie bisher linear geteilt bleibt. Ein entsprechendes Funktionspapier ist im Handel erhaltlich und heiBt halblogarithmisches Koordinatenpapier. Bei dieser Transformation gehen die Wertepaare (Xi; yJ in die neuen Wertepaare (ui; vJ = (Xi; In Yi) iiber, mit denen wir dann eine lineare Regression durchfiihren. Sie liefert uns die Werte der beiden .Hilfsparameter'' c und d, aus denen wir dann durch Riicktransformation die gesuchten Kurvenparameter a und b des Exponentialansatzes erhalten: In a
=d
=>
a = ed
und
b=c
(IV-151)
5 Ausgieichs- oder Regressionskurven
715
v
y
v = bu + Ina
=cu
+d
y=a. e b x
u
x b)
a)
Bild IV-33 Eine Exponentialfunktion (Bild a)) HiBt sich auf halb-Iogarithmischem Papier durch eine Gerade darstellen (Bild b))
Potenzfunktion y = a · x"
Durch Logarithmieren folgt zunachst: In y = In (a . x") = In a + In (x") = In a + b . In x = b . In x + In a
(IV-152)
Mit Hilfe der Transformation
u = In x,
v = In y
(IV -153)
erhalten wir hieraus die Gerade
v = cu
+d
(IV-154)
wohei wir noch c = b und d = In a gesetzt hahen. Mit anderen Worten: Wenn wir also auf beiden Koordinatenachsen die (natiirlichen) Logarithmen der Koordinaten x und y auftragen, erhalten wir eine Gerade (Bild IV -34). Beide Achsen werden also iogarithmisch geteilt, ein entsprechendes im Handel erhaltliches Funktionspapier heiBt daher doppellogarithmisch. Die heiden .Hilfsparameter" c und d erhalten wir wiederum durch lineare Ausgleichung, die mit den transformierten MeBwertpaaren (ui ; vJ = (In Xi; In yJ durchgefiihrt wird. Durch Ritcktransformation gewinnt man dann daraus die gesuchten Kurvenparameter a und b des Potenzansatzes: In a = d ~ a = e d
und
b=c
(IV-155)
IV Fehler- und Ausgleichsrechnung
716 v
y
v =bu + Ina
=cu
+d
y =a ·,xb
x
u
d=lna b)
a)
Bild IV-34 Eine Potenzfunktion (Bild a)) HiBt sich auf doppel-logarithmischem Papier durch eine Gerade darstellen (Bild b))
Nichtlineare Ausgleichsprobleme, die sich linearisieren lassen Zahlreiche nichtlineare Losungsansatze lassen sich mit Hilfe geeigneter (nichtlinearer) Transformationen auf ein lineares Ausgleichsproblem vom Typ v == cu + d zuriickfiihren. Tabelle 4 gibt einen Uberblick iiber die in den Anwendungen besonders haufig auftretenden Falle, Man beachte jedoch den Hinweis zu dieser Tabelle!
Tabelle 4: Transformationen, die einen nichtlinearen Ansatz fiir eine Ausgleichskurve auf ein lineares Ausgleichsproblem zuriickfiihren
v == cu + d
a == e",
-------
y
v==cu+d
a == c,
b==d
1/y
v==cu+d
1 a==- ,
d b==-
---1-i
1/x
I I I
b==c -----
1/y
---
v==cu+d
c
c
--------
1 a==d'
b=~
d
5 Ausgleichs- oder Regressionskurven
717
Wichtiger Hinweis zur Tabelle 4 Man beachte, daB nach der Linearisierung des vorgegebenen Ausgleichsproblems stets eine lineare Regression mit den transformierten MeBwertpaaren (ui ; Vi) durchgefuhrt wird, Diese Vorgehensweise ist zwar rechentechnisch gesehen elementar durchfiihrbar und daher in der Praxis sehr "beliebt", fiihrt jedoch nicht zu den tatsachlichen Werten der Kurvenparameter a, boo 0' sondern nur zu (meist jedoch vollig ausreichenden) N dherungswerten! Die exakte Bestimmung der Parameter kann nur iiber die Minimierung der eigentlichen Zielfunktion n
I
S(a; b; ...) =
(IV-156)
(Yi - f(XJ)2
i= 1
(Summe der vertikalen Abstandsquadrate) erfolgen, die mit dem gewahlten nichtlinearen Losungsansatz y == j (x) und den vorgegebenen MeBwertepaaren (Xi; yJ gebildet wird. Die exakten Parameterwerte sind dann allerdings nur mit erheblichem numerischen Rechenaufwand zu erhalten, so daB man in der Praxis oft den beschriebenen bequemeren Weg vorzieht.
Beispiele (1)
Die Entladung eines Kondensators mit der Kapazitat C tiber einen ohmschen Widerstand R erfolgt nach dem Exponentialgesetz t
u (t) == U o . e -
RC
(t
~
0)
(uo: Anfangsspannung zur Zeit t == 0). In einem Experiment wurden dabei folgende Werte gemessen (t i in s, u, in V): i
1
2
3
4
5
t,
1,0
4,0
7,0
10,0
15,0
u,
80,2
45,5
24,5
13,9
4,7
Wir berechnen aus diesen Daten die Anfangsspannung Uo und die Zeitkonstante RCo Das Exponentialgesetz fiihrt in der halblogarithmischen Darstellung zu der Geraden
t lnu==lnu - o
RC
1
oder
y
== at + b
und b == In Uo' Die MeBpunkte (t i ; yJ == (t i ; In uJ RC liegen daher in dieser Darstellung nahezu auf einer Geraden (Bild IV-35)o mit y
==
In u,
a == - -
IV Fehler- und Ausgleichsrechnung
718 u V 100
I!oo...
.........
6)
1. Liisungsweg:
=6
div (grad 4»
;
x
2y
A= ¢ F = ( -
.e
yZ )
x 3 . e YZ
x 2 z · e Yz
div A = div (¢
F) = (2 X Y -
+ X 2 + X 2 Y z) . e
X3Z
yz
2. Liisungsweg (nach Rechenregel (2) fur Divergenzen):
2x· e
grad ¢ = div
A=
div (¢
= eYZ
7)
YZ )
x 2 Z • e Yz ( 2 x y · e Yz
;
div
F=
F) = (grad ¢). F +
(:r~) .(-:) +
Die Divergenz des Zentralfeldes verschwinden:
-..
1
x
¢(div F) = 2
YZ
.
e ·1 = (2 xy
f =f
(r)
r=
- x
3 Z
(j i~~ :~)
+ x 2 yz + x 2 ) . e Yz
muB bei einem quellenfreien Feld
f (r) . z
a a a ax [f(r)· x] + -ay [f(r)· y] + -az [f(r)· z] = 0
div F = -
Es ist (unter Beachtung von r = (x 2
+ y2 + Z2)1 /2):
a [f(r)· x] = _. W x + 1 . f(r) = _. W x + f(r) ax ax ax
-
af df ar f ar - = - · - = f (r)·ax dr ax ax
(Kettenregel !)
a . 2 + y2 + Z2)1 /2 = _ar = -(x
ax ax
x (x 2
_
+ y2 + Z2)1 /2
x r
Somit gilt:
a [f (r) . x] = ff (r) . -x + f (r) ax r 2
-
Analoge Ausdriicke erhalt man fur die beiden iibrigen partiellen Ableitungen. Daher folgt:
-.. x2 y2 Z2 div F = t" (r) . - + ff (r) . - + ff (r) . - + 3 . f (r) = r r r
= F (r)
x2 +
y2
r
+
Z2
+ 3 .f
(r) = ff (r) . r + 3 . f (r) = 0
758
Anhang B: Losungen der Ubungsaufgaben Diese Differentialgleichung 1. Ordnung lost man durch "Trennung der Variablen". Die Losung lautet: canst. C f(r)=--=3 3
r
(C ER; r > 0)
r
grad ¢ = - b
3 vIr' ) = - rb (X) y = x/r
(
z/r
3
3
b
r3
r
z
canst. Das Gradientenfeld ist somit ein Zentralfeld vom Typ - 3- r und daher nach Aufgabe 7 r quellenfrei, d.h. div (grad ¢) = o. -+
9)
a)
rotF=-
-+
ez=-~ez
x 2 + y2 + X + 2 y (x 2 + y2)3/2 ez -+
rot F
c)
rot F = (y2 - 3x 2 y2) e z = y2 (1 - 3x 2) e z
rot v =
11)
a)
=
0 ~ v ist wirbelfrei.
rot
F= (
- 2 Y (X + Z))
- 2 z (1 + x)
b)
rotF=O
(F ist wirbelfrei)
2yz - x
rotF=(3(~=~~;()=o ~ {3~=~:~} ~ a=3, (a - 3) y2 Z
14)
(r=Jx 2+y2)
r
b)
10)
12)
1 Jx2 + y2
x-Komponente von rot
a- 3
b=1
=0
F:
y (rot F)x = aFz - aF = ~ [f(r)· z] az ay ay Mit
~ [f(r)· y] = z· ~ [fer)] - r ~ [fer)] az ay az
a df(r) ar a - [fer)] = - - ' - = f'(r)· -(x 2 + y2 + Z2)1 /2 = ay dr ay ay = f' (r) . (x 2 + Y 2 + z 2) -1/2 . y = f' (r) . ~ r
I Vektoranalysis
759
und analog
a
az [f(r)]
z f' (r) .;
=
folgt dann: Y
-+
z
(rot F)x = z . ff (r) . - - y . I" (r) . - = r r
r
°
=
°
F)y = (rot F)z = rot F = rot [f (r) r] = 0 => Fist wirbelfrei
Analog: (rot Somit:
15)
yz . f' (r) - yz . ff (r)
1. Liisungsweg:
A=
¢
F=
(::~:~:) x 2 yz "
2. Liisungsweg (nach Regel (2) fur Rotationen):
grad ¢ = rot
rot
(
x
Y
°0)
2
Z ) 2Z2
rot
;
2x 2yz
F= (
-x
A= rot (¢ F) = (grad ¢) x F + ¢ (rot F) = =
16)
2X
2 Y 2 X2 Z2 ) X Z ( 2x 2yz
F = (2~
X
-x
Z2
.. ~x)
2y - 2y
°0)
(XY) ( Y +X 2 y z2
=
(~) = 0
°
=>
=
2 2 2 ( X Z4 - 2x y Z ) 2x3y2z-2xyz4 2xy2z2_2x3yz2
Fist wirbelfrei
Die Vektorkomponenten von F sind demnach die partiellen Ableitungen 1. Ordnung eines (noch unbekannten) Skalarfeldes ¢ = ¢ (x; y; z): acjJ
-
= 2xz + y2
ax a¢ -=2xy
=>
¢ = x 2z + xy2 + C 1 ( y ; z)
ay
a¢ az
-=x
2
Liisung: ¢ = xy2
+ x 2Z + C
(C E JR.)
760
Anhang B: Losungen der Ubungsaufgaben
02 ¢
-r- 3+3 y2· r -
-=
Oy2
5.
'
02 ¢
-=
-r- 3+3z 2'r- 5
OZ2
f1¢ = (- r - 3 + 3 x 2 . r - 5) + (- r - 3 + 3 y 2 . r - 5) + (- r - 3 + 3 z 2 . r - 5) =
= -3r- 3+3r- 5(x 2+y2+ z2)= -3r- 3+3r- 3=0 '-v-"
r2
1 In der Ebene: ¢ = - = (x 2 + y2)-1 /2 r 1 2 -o¢ = _ -(x + y2)-3 /2. 2x = _ x(x 2 + y2)-3 /2
ox
2
02¢
02¢
-= - r - 3+3x 2·r- 5 . - = _ r - 3+3 y2· r ' ox 2 oy2 f1¢ = (- r - 3 = -
5
+ 3 x 2 . r - 5) + (- r - 3 + 3 y 2 . r - 5) =
2r- 3 + 3r- 5 (x 2 + y2) = - 2r- 3 + 3r- 3 = r- 3 #- 0 ~
r2
18)
Analog:
02 ¢ = 4(x 2 + 3 y2 oy2
02 ¢
+ Z2); -
=
OZ2
4(x 2 + y2
+ 3z 2)
+ Z2) + 4(x 2 + 3 y2 + Z2) + 4(x 2 + y2 + 3z 2) = + 5 y2 + 5 Z2) = 20(x 2 + y2 + Z2) = 20 r 2
f1¢ = 4(3x 2 + y2 =
4(5 x 2
Man erhalt die radialsymmetrische Funktion
f (r) = 20 r 2.
Abschnitt 6 1
-+
-+
F (r; cp) = - - eqJ r
F(r; cp) =
1)
a)
2)
H(r;cp)
3)
a)
divF(r;cp)=~;
rotF(r; cp) =
0
b)
div F (r; cp) = 3 r; rot F (r; cp) =
0
-+
I
=-
2nr
b)
-+
e qJ
r
r 2 • sin tp
e r
761
I Vektoranalysis 4)
rot
F(r; cp) = 0 => Fist wirbelfrei. Daher gilt F = grad ¢, d.h.
1 +.-. o¢.-. 1 o¢ .-. .-. e r +
cp
=
t
z = 2t
Somit gilt: Q= - e- t ,
ip = 1 und
z = 2.
762
Anhang B: Losungen der Ubungsaufgaben Geschwindigkeitsvektor in Zylinderkoordinaten:
v=
e- t eQ + e- t eqJ + 2 ez
-
Geschwindigkeitsbetrag:
Iv(t =
v = )2 e -2t + 4; °
10)
11)
1)1 = 2,0666
e + e" eqJ + ez
a)
grad ¢ = e"
b)
1 ..... 1 + ..... + ..... grad ¢ = - -Q2 eQ + -Q eqJ z eqJ + e" e
a)
div
Q
Z
Z
F(e; cp; z) = -~;
rot
Q
.....
.....
.....
z .....
rot F = - eQ + - ez
div F = 0;
b)
F(e; cp; z) = 0
(wirbelfreies Feld)
(quellenfreies Feld)
Q
12)
1 0 ( QO_ O¢) =0 11¢(Q)=_oQ oQ oQ
a)
~
const.
O¢
C
QO_=Qo¢'(Q)=const.=C 1 ~ ¢'(Q)=~ oQ Q
cjJ(e) = C l
.
f~de = C
1 02 ¢ 11¢(cp)=_o_=O Q2 Ocp2
b)
'lne + Cz
l
~
(C l , Cz ElR)
02 ¢ -=¢"(cp)=O Ocp2
Nach zweimaliger Integration: ¢(cp) = C 1 cp + C 2
(C 1 ,
c, E lR)
02¢
c)
11¢(z) =
fuT =
¢"(z) = 0
Nach zweimaliger Integration: ¢(z) = C 1 z + C 2 13)
F (r; 9; cp) =
a)
r sin 29 cos" cp °
°
°
15)
°
eqJ
..... 1 ..... F (r; 9; cp) = - e, r
b)
v(r; 9; cp) = rosin 9 eqJ Gesuchte Darstellungsform: v(r; 9; cp) = v,
er + Vf) ef) + vqJ eqJ
Aus den Transformationsgleichungen (1-320) folgt mit
x,
y
Vx
=
Vr
= X sin 9 cos cp +
"» = °
°
und
Vz
z:
=
Y. sin 9
°
sin
E
lR)
er + r(sin 3 cos 9 cos? cp - sin cp) ef) -
- r ° cos tp (sin 3 ° sin cp + cos 9)
14)
(C 1 , C 2
ip
+ z. cos 9
763
I Vektoranalysis
+ Y. cos 9 . sin tp -
vS = X. cos 9 . cos cp vq>
= -
z. sin 9
x. sin cp + Y. cos cp
Zwischen den kartesischen Koordinaten x, y, z und den Kugelkoordinaten r, 9, tp bestehen die Beziehungen x = r . sin 9 . cos cp, y = 'r . sin 8 . sin cp, z = r . cos 9. r, 9 und tp sind dabei Funktionen der Zeit t. Dann gilt:
x = r . sin 8 . cos cp + r . cos 9 . 9. . cos cp - r . sin 9 . sin cp . ip y = r . sin 9 . sin cp + r . cos 9 . 9. . sin cp + r . sin 9 . cos cp . ip i = r . cos 8 - r . sin 9 .9. Durch Einsetzen dieser Ausdrucke in die obigen Transformationsgleichungen erhalt man dann: Vs
vq> = r . sin 9 . ip
= r8,
Der Geschwindigkeitsvektor lautet somit in Kugelkoordinaten:
v(r; 9; cp) = r e
+ (r8) e s + (r . sin 9 . ip) eq>
r
16)
Aus r = const. = R und 9 = const. = 8 0 folgt dr = 0 und d9 = 0 und somit nach Gleichung (I-308) fur das Linienelement ds = R . sin 9 0 dip.
17)
rot ff (r; 9; cp) = e
S+
0 => ff ist wirbelfrei. Daher gilt ff = grad , d.h.
1 o -. -. q> (-.e +e-. + -1- e-. ) =o - e-. +-·-e + -1- - ·o -e r S sin 9 q> or r r 09 s r · sin 9 ocp q>
Daraus erhalt man die folgenden Beziehungen, die durch elementare Integration losbar sind: o= e s+ q> or o = r . eS+q> 09 o ocp
=
r . eS+q>
=>
= r . eS+q> + C 2 (r; cp)
=>
= r . eS+q>
+ C 3 (r; 9)
Liisung: =(r;9;cp)=r·e s+q>+C 18)
a)
div ff = (n
+ 2) r n -
(CElR)
1
Fur ein quellenfreies Feld ist div ff = O. Somit: div 1
-+
Losung: F = r - 2 e r = 2" e r r
ff =
(n + 2) r"- 1
=
0
=>
n=
-
2
ist quellenfrei
b)
Es gilt rot ff = 0 und zwar unabhangig vom Exponent n, d.h. jedes Vektorfeld vom Typ ff = r" e r ist wirbelfrei.
c)
div ff = 0 und rot F = 0 => n = - 2 (siehe Losung a)). Nur das spezielle Feld -. 1 F = r -2 e r = 2" e r ist daher quellen- und wirbelfrei. r
764
19)
Anhang B: Losungen der Ubungsautgaben
a)
114> (r)
=
(2
-e r . -84»
~
0
or
=
or
0
'-.,--!
const.
=
C1 4>' (r) =
oder
b)
= a~ (Sin 9 . : :)
tlcP (9) = 0
C
---+ r
=0
'--.-'"
const. = C 1 sin 9 . 04> = sin 9 . 4>' (9) = C 1 09 4>(9) = C 1
·
f
d9
- .-
SIn
9
~ SIn 9
4>' (9) =
oder
= C 1 ·In (tan (9!2)) + C 2
(C l' C 2
E
JR.; Integral Nr. 214)
c) Nach zweimaliger elementarer Integration folgt:
Abschnitt 7 1)
f
2
[ydx + (x 2 + xy) dy] =
C1
f
(2x + 6x 2) dx = 20
0 2
f
[ydx + (x 2 + xy) dy] =
C2
2)
a)
f
(x 2 + 2x 3 + 2x 4 ) dx =
352
15
0
~(2xy+4x)=~(X2_1)=2x; oy
4> (x; y) =
ox
X2
Y+ 2 x 2
-
Y+K
(K
04>=2xy+4x' ox ' E
04>=x 2_1 oy
JR.)
b)
o 0 04> 04> -(eY)=-(x'eY)=e Y' -=e Y' -=x'e Y' 4>(x;y)=x'e Y+K ' o x ' oy , oy ox
c)
o 0 04> -(3x 2 y + y3) = -(x 3 + 3 x y2) = 3x 2 + 3 y2; _ = 3x2 Y + y3 oy ox ox
~~=X3+3xy2;
cP(x;y)=X 3y+ x y3+K
(KElR)
(KEJR.)
765
I Vektoranalysis
3)
a
a
ay
ax
-(x) = -(y) = 0
a)
a¢
b)
a¢
ay=y;
ax=x;
c)
1 2+ y 2)+K ¢(x;Y)=2(X
(KElR)
Das Arbeitsintegral ist wegunabhdngig, hangt also nur vom Anfangs- und Endpunkt ab:
[J
r,
f- f P'dr=
(xdx+ydy)= ¢(x;y)
Pz
Pi
1 = [ _(X 2 + y 2) + K ]
2
(3;5)
=16,5
(1;0)
Pi
C
f
ist das Kraftfeld ji nicht-konservativ. Das Arbeitsintegral ji. dr hangt daher noch vom Verbindungsweg C der Punkte A und B ab: c
Oberer Halbkreis C 1 : x = cos t, Y = sin t
(0 ~ t
~ n)
tt
V nterer Halbkreis C 2: x = cos t, Y = sin t
f
-n
ji. dr = -
~.
Cz
5)
(t durchlauft alle Werte von 0 bis - n)
f
dt
=~
0
Weg C (Einheitskreis): x = cos t, Y = sin t
f
ji . dr =
f
(0 ~ t
~
2 n)
2n
(x + 2 y) dx = -
f
(sin t . cos t + 2 . sin 2 t) dt = - 2 n
c e o 6)
Die Integrabilitatsbedingung ist erfidlt:
o~C;)=OoT(~)=O Daher ist S (T; V)
as c,
as
R
sr = -T' -av = -v
-
und somit
= C v . In T + R . In V + K
(K
E
lR)
(K wird meist gleich Null gesetzt).
7)
f
(x Y2 dx -
C
2
X2
Yz d y + x Z 2 dz) =
f
(t 5
1
-
2 t 8 + 3 t 9) dt = 203,84
766
Anhang B: Losungen der Ubungsaufgaben 2n
8)
f . dr = (x y dx + dy + yz dz) = c e o
J
J
9)
F; = x,
Fy = y,
aF x ay
J(- sin? t . cos t + cos t + t . sin t) dt = - 2 n
F; = z
= aF x = aF y = aF y = aF z = aF z = 0 az
ax
az
ax
ay
Die Integrabilitatsbedingungen (1-374) sind somit erfidlt. Es ist
a¢ =
a¢ a¢ ax = x, ay = y
und
z und
az
J(x dx + y dy + z dz) = ~ (x 2 + y2 + Z2) + K
cf> (x; y; z) =
(K
E
JR.)
c
a
-
aF x ay
= - (x + x y + x z ) = 2 x y
aF
a = - (x 2 Y + y3
-y
ax
3
2
2
ay
ax
=>
+ yz2) = 2xy
or;
aF y -=-=2xy
ay
ax
Ebenso zeigt man, daB die beiden restlichen Integrabilitatsbedingungen (1-374) erfidlt sind: aF x aF z -=-=2xz·
az
ax
aF y aF z -=-=2yz ay
'az
Somit gilt:
a¢ ay
= Fy = x 2 Y + y3 + yz2
=>
a¢=F =X 2Z+y2 Z+ Z3 =>
az
z
¢=
1
1
1
2x 2 y2 + 4: r" + 2y2 Z2 + K 2 (x; z)
.rf...=~X2Z2+~y2Z2+~Z4+K (x·y) 2 2· 4 3'
~
Die Potentialfunktion lautet daher:
1
1
4
2
= _ (x" + v" + Z4) + _(x 2 y2 + x 2 Z2 + y2 Z2) + K = 1 = - (x 2 + y2 4
1 4 r +K 4
+ Z2)2 + K = -
(K
E
lR)
767
I Vektoranalysis 11)
Die Integrabilitatsbedingung (1-373) ist in der gesamten x, y-Ebene erfiillt:
sr, a
nt:
a
- = - (2 x + y 2) = - y = - (2 x y + Y 2) = 2 y ay ay ax ax Somit verschwindet das Linienintegral des Vektorfeldes Kurve: f[(2X 12)
a)
F langs
einer jeden geschlossenen
+ y2)dx + (2xy + y2) dy] = 0
aFx
aF
ay
aFx aF
y
y
- = y => - i = -
-=1'
'ax
ay
ax
Die Integrabilitatsbedingung (1-373) ist nicht erfiillt, das Vektorfeld daher nicht konservativ.
b)
aFx aF
•
y
-=-=2y'slnx ay ax Das Vektorfeld ist konservativ und es gilt:
a¢ ax =
Fx = y2 . sin x - 2x
=>
¢ = - y2 . cos
X -
x 2 + K 1 (y)
a=0
(A 2 )
y = r . sin cp;
r 2 . sin
ip
dr dip = 0
r=O
Gesamtflufi durch die geschlossene Oberflache der Halbkugel:
#(F . N)
dA
=
(A)
7)
If (F.N) + If (F' N) dA
(Ad
dA
=0+0= 0
(A 2 )
.. ty= (=;;)
tx= (2~X} ty= (2~Y}
x
Itxxtyl = J4(x 2 + y 2) + 1;
M=
If Itx tyl x
dydx
(A)
=
II
J4(x 2 + y2) + 1dydx
(A)
Integrationsbereich A ist die Kreisflache x + y2 ~ 2. Ubergang zu Polarkoordinaten: x 2 + y2 = r 2" dy dx = r dr dip 2
2n
j2
M= I I J4;2+1. q>=0
8)
-. 1 N=S
r dr df{!
=
1:
n
r=O
(X) -. -. 1 ~ ; F'N=S(2x
2-x
Y+
Z
2)=
= 5 (2 . sirr' 9 . cos? cp - sin? 9 . sin cp . cos cp + cos? 9) dA
=
25 . sin 9 d9 dip
If (F .N) ~)
2n
dA
= 125·
n
I I
q>=0
(2' sin ' [) . cos? tp -
9=0
- sin:' 1) . sin cpo cos tp + sin 9 . cos? 9) d9 dcp = 500 tt
772
9)
Anhang B: Losungen der Ubungsaufgaben
Das Vektorfeld besitzt Zylindersymmetrie. Daher folgt nach Formel (1-439) mit
f
a (Q) = -: Q
J( ... ...
Jf (F· N)
dA =f(R)' 2nRH
a
= R' 2nRH = 2naH
(A)
10)
Wegen der Kugelsymmetrie des Vektorfeldes konnen wir Formel (1-445) benutzen. Mit dann fur den VektorfluB durch die Kugelschale:
f (r) = r" folgt
#(F· N)
4~R2 = 4nR
dA = f(R)' 4nR 2 = R".
n
+2
(A)
Abschnitt 9
f f (A)
2)
x=O
(V)
(x + 3 y) dz dy dx
=2
z=O
Unter Verwendung von Zylinderkoordinaten gilt:
#(F .N) fff dA =
(A)
div
F dV
fff
= 2.
(V)
(x + z) dV
=
(V)
2n
2
q>=0
z=O
f f f
= 2· 3)
y=o
(e 2
. COS tp
+ ez) de dz dip = 36 n
Q=O
Berechnung des Volumenintegrals (in Kugelkoordinaten):
fff
div
F dV = 3 .
(V)
fff
2 (x + y2 + Z2) dV =
(V)
2n
R
f f f
=3'
q>=0
r 4 . sin 9 dr d90 dip =
12
-
5
nR 5
r=O
9=0
Berechnung des Oberfldchenintegrals (in Kugelkoordinaten):
(X) ; F·......N = R(x" +
... 1 N =R ~
J( ... ...
J1 (F . N)
1
dA
=
1 J(
y4
+ Z4)
R. Jf (x" + v" + Z4) dA
(A)
=
(A)
2n
=R
5
•
tt
f f
cp=O 9=0
(sin 5 9 ' cos" tp + sin" 9· sin" cp + sin 9· cos 4 9) d9 dip = 1; nR 5
I Vektoranalysis
773
Somit gilt:
fff div
--.
j{ --. --. 12 F dV = 'jf(F' N) dA = SnR 5
(V)
4)
(A)
Der Gauj3sche I ntegralsatz liefert fur
#(F .N) #
[(rot E)
dA =
(A)
5)
.N]
F = rot E:
dA =
IfI~)
(A)
dV = 0
0
(V)
Berechnung des Fldchenintegrals (in Polarkoordinaten):
II
div F dA =
(A)
If
2n
I I
3 x dA = 3·
(A)
2
qJ
=0
r
r
2.
cos
tp
dr dip = 0
=0
Berechnung des Kurvenintegrals (in Polarkoordinaten):
f(F .N)
2n
I
ds = 8·
c Somit gilt:
II
cos
tp
dip = 0
0
div
F dA = f(F. N)
(A)
6)
ds = 0
C
1. Liisungsweg (direkte Berechnung uber ein Oberfldchenintegral unter Verwendung von
K ugelkoordinateni:
--. --. (rot F) . N
3
= -
y2 Z
2
=
12 . sin? 9- . cos 9- . sin? cp
dA = 4 . sin 9- d9- dcp
If
[(rot F)
.N]
dA =
~.
(A)
If
2n
I I
Y 2 z dA = 48·
(A)
nl2
qJ
=0
8
sin 3 9 . cos 9 . sin 2
tp
d9 dip = 12 n
=0
2. Losungsweg (Verwendung des Integralsatzes von Stokes):
If
[(rot F)·N] dA =
fF' f(dr =
c
~)
y3 dx + yz2 dy + y2 Z dz)
C
Randkurve C (Kreis urn den Nullpunkt mit dem Radius r x = 2 . cos t, Y = 2 . sin t,
Z
I
C
0
2):
= 0, dx = - 2 . sin t dt, dy = 2 . cos t dt, dz = 0
2n
f F' dr = 16 '
=
sin4 t dt = 12 n
Anhang B: Losungen der Ubungsaufgaben
774
-+
dA dA (N· e z ) = - = dy dx -+
-+
J3
-x
1 = -
J3
(-
2 x - y + 3)
+2
I I x=0
(A)
(-2x-y+3)dydx=2
y=0
a)
Das Vektorfeld besitzt keine Radialkomponente. Daher ist der VektorfluB durch die Kugeloberflache gleich Null.
b)
Zum gleichen Ergebnis fiihrt der Integralsatz von Gauj3:
F = r . cot 9- . cos cp
div
#
(F'
N)
dA
I
= If
div F dV
I
= If
(V)
(A)
r : cot j} cos 0
tp
dV =
(V)
2n
n
R
I I I 9=0
o
0
CfJ
CfJ
f z' f(x) dx = A' f (2x + 1)· e- AX dx = 2 : A
o
0
CfJ
CfJ
Ilz = f z· f(x) dx = A' f x 0
14)
CfJ
2.e-
AX
dx =
;2
0
a)
E(Z)
= 1;
Var(Z) = 2
b)
E(Z)
= 1;
1 Var(Z) = - = 0,125 8
c)
E(Z)
= 20;
Var(Z) = 50
d)
E(Z)
= 2;
Var(Z) =
°
II Wahrscheinlichkeitsrechnung
785
Abschnitt 6 1)
Stabdiagramm: Bild A-31
a)
x
f(x)
°
0,1678 0,3355 0,2936 0,1468 0,0459 0,0092 0,0011 0,0001
1 2 3 4 5 6 7 8
f(x)
0,4
0,3
0,2 Bild A-31
° 0, 1
~
P(X
~
P(l 2)
5) = f(5) X
~
234567
ax
+ f(6) + f(7) + f(8) = 0,0104
3) = f(l) + f(2) + f(3) = 0,7759
Die Zufallsvariable X ( = Anzahl .Zahl" bei 10 Wiirfen) ist binomialverteilt mit n = 10, p = 0,5 und q = 0,5: P(X = x) = f(x) =
3)
°
P(X = 0) =f(O) = 0,1678
b)
(~O) 0,5
a)
P(X = 0) = 0,0010
c)
P(X
~
4) = 1 - P(X
10
~
3) = 0,8281
b)
P(X = 2) = 0,0439
d)
P(X = 5) = 0,2461
Die Zufallsvariable X ( = Anzahl der .Erfolge" bei 5 Wiirfen) ist binomialverteilt mit n = 5 und = 1/3, q = 2/3 :
p
P(X=x)=f(x)=
3 (2)S-X 3 (x5)(l)X
P(X = 2) = 0,3292
a)
b)
P(X
~
3) = 0,2099
4)
Binomialverteilung mit n = 300 und p = 1/3. Mittelwert: u = np = 100.
5)
Ein "rotes As" wird im Einzelversuch mit der Wahrscheinlichkeit p = 1/16 gezogen. Die Zufallsvariable X (= Anzahl der gezogenen "roten Asse" bei n Ziehungen) ist daher binomialverteilt mit den Parametern n, p = 1/16 und q = 15/16: P(X
=
x)
=
Ereignis X
(xn)(161 )X (15)n-X 16 --
=
°
(kein .rotes As")
---+
P (X = 0) < 0,5
---+
15)n ( 16 < 0,5
---+
n
~
11
786 6)
Anhang B: Losungen der Ubungsaufgaben Binomialverteilung mit n = 250, p = 0,02 und q = 0,98: J1
7)
= np = 5;
2
= n p (1 - p) = 4,9;
(J
= 2,2136
Die Zufallsvariable X (= Anzahl Treffer bei 5 Schiissen) ist binomialverteilt mit n = 5, p = 1/3 und q = 2/3: P(X
c)crcr-
P(X
P(X
.3
= x) = f(x) = x
a)
8)
(J
= 0) = 0,1317
= x) =f(x) =
x
3
b)
P(X
= 3) = 0,1646
c)
P (X ~ 3)
= 0,2099
c)
P(X < 2)
= 0,6667
(:)-(3~X) 0
C3 ) a) 9)
P(X
= 0) = 0,1667
b)
= 0,8333
Die Zufallsvariable X ( = Anzahl der unvollstdndigen Packungen unter n gekauften Packungen) ist hypergeometrisch verteilt (N = 40; M = Anzahl der unvollstdndigen Packungen = 4): a)
N
= 40, M = 4, n = 1
P(X=x)=f(x)=
N = 40,
b)
P(X
10)
P(1 ~ X S 3)
M = 4,
(:)·C ~x) (~O)
n
= x) = f(x) =
--->
=
P(X=O)=O,9
10
(:) (103~ x) G~)
~ P(X
= 2) = 0,2142
Hypergeometrische Verteilung mit den Parametern N = 5, M = 3 (Anzahl der weifJen Kugeln) und n = 2:
P(X=x)=f(x)=
x
f
(x)
°
0,1
G)·C:J
C)
f(x)
(x
= 0, 1,2)
0,3
2 0,6
0,3
Stabdiagramm: Bild A-32
0,6
0,1
Bild A-32
°
2
x
787
II Wahrscheinlichkeitsrechnung
11)
12)
3X P(X=x)=!(x)=-'e- 3
x!
a)
P(X = 0) = 0,0498
b)
P(X
c)
P(X > 3) = 0,3528
d)
P(1
~ ~
3) = 0,6472 X
~
5) = 0,8663
Die Zufallsvariable X ( = Anzahl der Brennelemente, die den Anforderungen nicht geniigen) ist binomialverteilt mit den Parametern n = 1500 und p = 10- 4 . Sie darf jedoch durch eine (rechnerisch bequemere) Poisson-Verteilung mit dem Parameter (Mittelwert) fJ = np = 0,15 ersetzt werden:
°
x
15 e-O,15 ~ P(X = 0) = 0,8607 P(X = x) = f(x) = -'-,-' x·
13)
14)
a)
P(U
~
1,52) = (1,52) = 0,9357
b)
P(U
~
- 0,42) = ( - 0,42) = 1 - (0,42) = 0,3372
c)
P(0,2
~
U
~
2,13) = (2,13) - (0,2) = 0,4041
d)
P( -1,01
~
U
~
e)
P (- 1 ~ U
~
1) = P (I U I ~ 1) = 2 . (1) - 1 = 0,6826
f)
P(I UI
~
- 0,25) = ( - 0,25) - ( -1,01) = (1,01) - (0,25) = 0,2451
1,69) = 2 . (1,69) - 1 = 0,9090
g)
P(U
~
0,95) = 1 - P(U
h)
P(U
~
- 2,13) = 1 - P(U
~
a)
(a) = 0,5 ~ a=O
b)
(a) = 0,3210 < 0,5 ~ a
( - 2,32) = 1 - 4>(2,32) = 0,0102
c)
P(X
~
- 1,68) = P(U
d)
P( - 0,5 ~ X ~ 4,5) = P( - 5 ~ U ~ 5) = 2 . 4>(5) - 1
e)
P( - 1,86) ~ X ~ - 0,24)
~
- 7,36) = 4>( -7,36) = 1 - 4>(7,36) =
=1
= 4>( - 7,72 ~ U ~ - 4,48) = = 4>(-4,48) - 4>(-7,72) = 4>(7,72) - 4>(4,48)
f)
P( - 3 ~ X ~ 3) = P( -10 ~ U ~ 2)
g)
P(IX/
h)
P(X
~
0,98) = P(U
a)
P(95
~
X
b)
P(98
=
°
= 4>(2) - 4>( -10) = = 4>(2) + 4>(10) - 1 = 0,9772
~
2,13) = 0,6026
~
~
- 2,04) = 1 - P(U
~
- 2,04) = 4>(2,04) = 0,9793
105) = P( - 1,25 ~ U ~ 1,25) = P(I UI = 2 . 4>(1,25) - 1 = 0,7888
AusschufJanteil: P = 1 - P(95
18)
°
~
X
~
105) = 0,2112
1,25) =
~
21,1%
U ~ 1) = 4>(1) - 4>(-0,5) = = 4>(1) + 4>(0,5) - 1 = 0,5328 Ausschuflanteil: P = 1 - P(98 ~ X ~ 104) = 0,4672 ~ 46,7% ~
X
~
104) = P(-0,5
~
Mindestpunktzahl: a
P(X
~
a) = 0,6
a 4- 20) = P(U -
P(X
~
a) = P ( U
P(U
~
c) = 1 - P(U
~
~
~
~
~
c) = 0,6
(c
=
a -4 20 )
c) = 1 - 4> (c) = 0,6
°
4> (c) = 0,4 < 0,5 ~ c < ~ Wir setzen c = - k: 4>(c) = 4>( - k) = 1 - 4>(k) = 0,4 4>(k) = 0,6 ~ k = 0,253 ~ c = - k = - 0,253 ~ a = 18,988 ~ 19 Daher: Die geforderte M indestpunktzahl betrug 19 Punkte. 19)
20)
X -75 U=-5 a)
P(69 ~ X ~ 80) = P( -1,2 ~ U ~ 1) = 4>(1) - 4>( -1,2) = 4>(1) + 4>(1,2) - 1 = 0,7262 Anzahl der Studenten: 5000· 0,7262 = 3631
b)
P(X> 80) = 1 - P(X ~ 80) = 1 - P(U ~ 1) = 1 - 4>(1) Anzahl der Studenten: 5000· 0,1587 = 794
c)
P(X < 65) = P(U ~ - 2) = 4>(-2) = 1 - 4>(2) = 0,0228 Anzahl der Studenten: 5000· 0,0228 = 114
=
0,1587
X-750 20
U=---
a)
P(X < 730) = P(U < - 1) = 4>( -1) = 1 - 4>(1) = 0,1587
b)
P(735
~
X
~
765) = P( - 0,75
~
U
~
0,75) = 2 . 4>(0,75) - 1 = 0,5468
II Wahrscheinlichkeitsrechnung 21)
789
Die (binomialverteilte) Zufallsvariable X (= Anzahl an Ausschufistiicken in einer Stichprobe vom Umfang n = 100) kann naherungsweise durch eine Poisson- Verteilung mit dem Parameter (Mittelwert) J.1 = np = 100 ° 0,01 = 1 ersetzt werden: e -1 P(X = x) =I(x) = -
x!
a) 22)
P(X
n=20,
= 2) = 0,1839
p=1/2,
q=1/2
X-10
u=
b)
J5 ;
~
P(X > 2)
J.1=np=10;
= 1 - P(X
(J2
~
2) = 0,0803
= npq = 5;
(J
=
J5
P*(8 ~ X ~ 12)
Stetigkeitskorrektur:
= P( -1,118 = 2 (1,118) - 1 = 0,7364
P*(8 ~ X ~ 12) ~ P(7,5 ~ X ~ 12,5)
~ U ~
1,118) =
°
Exaktes Ergebnis (Binomialverteilung): 0,7368
23)
n = 360,
u=
p = 1/3,
q = 2/3
X-120
~
J.1 = np = 120;
(J2
= npq = 80;
P*(100~X~140)
°
J80'
Stetigkeitskorrektur: P*(100 ~ X ~ 140) ~ P(99,5 ~ X ~ 140,5)
= P( - 2,292 24)
~
=
U ~ 2,292) = 2 ° ¢(2,292) - 1 = 0,9780
Die Zufallsvariable X (= Anzahl derjenigen Gerate in der Stichprobe yom Umfang n = 200, die einer Zuverlassigkeitspriifung nicht standhalten) ist binomialverteilt mit n = 200, p = 0,06 und q = 0,94, kann jedoch durch eine N ormalverteilung mit den folgenden Parametern ersetzt werden:
J.1 = np = 12;
(J2
X -12 u=-_o
= np(1 - p) = 11,28;
P*(10 ~ X ~ 15)
~'
Stetigkeitskorrektur:
= P(-0,744 ~ U ~ 1,042) = = ¢(1,042) - ( - 0,744) = ¢(1,042) + ¢(0,744) - 1 = 0,6229
P*(10 ~ X ~ 15) ~ P(9,5 ~ X ~ 15,5)
Abschnitt 7 1)
Verteilungen der Komponenten (Randverteilungen): 3
a)
11 (x.) J.1x = 2;
1/2
-2
4
1/2
3/8 2 (Jy
=
351
64
3/8
790
Anhang B: Losungen der Ubungsautgaben
b)
11 (xJ Jix
°
0,60
f2 (yJ
0,40
a; = 0,24;
= 0,40;
-2
-1
0,25
0,15
2 0,15
0,45
a; = 2,94
Jiy = 0,4;
2)
I, (x)
I2(Y) 3)
a)
11 (x)
f2(Y) b)
Xi
2
4
6
Yi
11 (xJ
0,40
0,20
0,40
f2(yJ
a; =
Jix = 4;
c)
4)
Jiy = 0,4;
a; =
11 (2) . f2 (0) = 0,4 . 0,7
=
0,28 = 1(2; 0)
11 (2) ·12 (1) = 0,4 . 0,2
=
0,08 = 1(2; 1)
11 (2) ·12 (2) = 0,4 . 0,1
=
0,04 = 1(2; 2) u.s.w.
a)
11 (xJ
5)
3,2;
1/4
= 2;
2
3
1/2
1/4
Var(X) = 0,5;
b)
E(X)
a)
Durch N ormierung folgt k = 2.
b)
II (x) = 2·
f y=o
f2 (yJ E(Y) = 1;
e- 2 x - y dy = 2 . e- z x ;
2
°
0,70
0,20
0,10
0,44
2
°
1/4
1/2 Var(Y)
Iz(Y) = 2·
f x=o
1/4
= 0,5
e- Zx - y dx = e- Y
c)
ja
II Wahrscheinlichkeitsrechnung
c)
E(X)
f
= 2·
791
x . e- 2x dx = 0,5;
E(X 2) = 2·
o Var(X)
f
x 2.
e~2xdx = 0,5
o
= E(X 2) - (E(X))2 = 0,25;
E(Y)
fr
=
e- Y dy = 1
o E(y 2) =
f
Var(Y) = E(y 2 )
y2 . e- Y dy = 2;
-
(E(y))2
=1
o
d)
P(O
c
Liisung: 494,12 Q
~
= 5,88 R
~
(Tabelle 2 im Anhang, Teil A)
505,88 Q
Z = X + Y ist normalverteilt mit dem Mittelwert Jl = 30 und der Standardabweichung (J = 5. Die Dichtefunktion lautet somit: 1 1 (Z - 30)2 I(Z)=---'e- 2 - 5 -
5·)2;
(-oo
= 4,604
4,604
n = 5;
/10 = /11 - /12
=
°
H 0 wird beibehalten, d. h. nicht abgelehnt (Bi1d A-49).
s/J;z Aufgrund der verwendeten Stichprobe und des gewahlten Signifikanzniveaus a 1 % konnen wir von der Gleichwertigkeit derbeiden MeBmethoden ausgehen.
= 0,01 =
III Grundlagen der mathematischen Statistik
807
Testwert f=4,312 ~ H o beibehalten 0,99
Bild A-49
o
-4,604
7)
4,604
Die Stichproben sind voneinander unabhdngig. Wir fiihren einen einseitigen Test (Abgrenzung nach oben) wie folgt durch:
Nullhypothese:
n.;
/12 ~ /11
Alternativhypothese: H 1 : /12 > /11 Wegen n 1 > 30, n2 > 30 diirfen wir dabei die standardnormalverteilte Zufallsvariable
X-y
U = - - verwenden: a P(U ~ C)H o = 1 - r:J., = 0,99 ¢(c) = 0,99 ~
Annahmebereich: u
x = 1540 h; n1
=
2,326
C = U O,99 =
~
2,326
y=1600h;
n2 = 120
100;
(]'=
Testwert:
y-x u= - = 3,042
~
a
H o wird abgelehnt (Bild A-50).
u
Testwert = 3, 042 ~ H o ablehnen
I o
0,01
Bild A-50
2,326
u
Folgerung: Die im Werk B produzierten Teile haben - wie vermutet - eine groflere Lebensdauer. 8)
Wir testen die Nullhypothese H 0: /11 = /12 gegen die Alternativhypothese H 1 : /11 #- /12: P( - c
~
F(c)
0,995
=
T
~
C)H o = 2 . F(c) - 1 = 1 f=nl +n2-2=8
) c
Annahmebereich: - 3,355 ~ t
x= S2
5,992;
= 0,0081;
Y=
6,04;
s = 0,0898
=
~
r:J.,
t(0,995;8)
= =
0,99 3,355
3,355 Sl =
0,1055;
S2
= 0,0707;
808
Anhang B: Losungen der Ubungsaufgaben
~
Testwert: t = (Bild A-51).
x - y .yr;;:;;;- .-= ~--_\
n1
+
n2
0,845
=:>
. H 0 wird beibehalten, d. h. nicht abgelehnt
s
Folgerung: Die beiden Stichproben stammen aus derselben Grundgesamtheit. Testwert = -OJ845 ~ H o beibehalten
t
OJ99
-3
9)
Bild A-51
o
J355
3
Einseitiger Test (Abgrenzung nach oben): P(Z F(c) = 0,95
f=n-l=ll
~
Annahmebereich:
Z
s = 0,4 mm;
S2
Testwert:
z= (n -
) c=
Z(O,95;11)
J355
~
C)H o = 1 - a = 0,95
= 19,67
19,67
= 0,16 mm ':
n = 12;
0"5
= 0,04 mm?
S2
1) 2" = 44
=:>
0"0
H o wird abgelehnt (Bild A-52). Die Abweichung ist signifi-
kant, die Maschine mull neu eingestellt werden. Fur
ff.
= 1% erhalt man den Annahmebereich z ~ 24,73. Die Entscheidung ist dieselbe. Testwert ; 44 ~ H o ablehnen
=
OJ 95
Bild A-52
o 10)
19
z
J67
Die Bedingung (111-242) fur eine umfangreiche Stichprobe ist erfiillt: npo(1 - Po) = 11,64 > 9. Einseitiger Test (Abgrenzung nach oben): P(U ¢(c)
= 0,95
~
c=
Annahmebereich: u k = 20;
Testwert:
U O,95
~
n = 400;
~
C)H o = 1 -
ff.
= 0,95
= 1,645
1,645
P== 0,05;
u= .y~ ~(n) . (p -
Po)
Po = 0,03 =
2,345
=:>
n;
wird abgelehnt (Bild A-53). Die Stich-
probe widerspricht somit der Behauptung des Herstellers, d.h. der Ausschulsanteil ist grojJer als 3%.
809
III Grundlagen der mathematischen Statistik Testwert ~ =2,345 ~ H o ablehnen
Bild A-53
o 11)
u
1,645
Die Bedingung (111-242) fur eine umfangreiche Stichprobe ist erfullt: nPo(1 - Po)
=
50 > 9.
Zweiseitiger Test: Wir testen die Nullhypothese H o : P = Po = 0,5 gegen die Alternativhypothese Hi: p i= Po = 0,5. P( - c ~ U ~ C)H o
¢(c) = 0,975
---+
= 2 . ¢(c) - 1 = 1 - a = 0,95 U O,975 = 1,960
c=
Annahmebereich: - 1,960 ~ u k = 88; Testwert: Ii
~
1,960
P= 0,44;
n = 200;
= Jpo(1 ~ Po) . (ft -
Po) =
Po = 0,5
-
1,697
=0>
n;
wird beibehalten, d.h. nicht abge-
lehnt (Bild A-54). Die verwendete Stichprobe steht in keinem Widerspruch zu der Nullhypothese, daB der Wiirfel .unverfdlscht'' ist. Testwert u=-1,697 ~ H o beibehalten
-1,960
o
1,960
Abschnitt 5 1)
p = p (Zahl)
Nullhypothese H o : Gleichverteilung (p = Po = 0,5)
u
Bild A-54
810
Anhang B: Losungen der Ubungsaufgaben P(Z = X ~ 2
F (c) = 0,95
C)H
O
= 1-
f=k-1=1
Annahmebereich: z
=
)
= 0,95
(X
=
Z(O,95; 1)
~
3,84
C
X2
A A 8 Testwert: z = X2 = - = 2,667
3
=>
= 3,84
H o wird beibehalten, d.h. nicht abgelehnt (Bild A-55). Wir
konnen somit bei einer Irrtumswahrseheinliehkeit von 5 % .ziemlich sieher" sein, daB die Miinze "eeht", d.h. "unverfalseht" ist (die verwendete Stiehprobe steht zumindest in keinem Widersprueh zu dieser Hypothese).
z
Testwert = 2,667 ~ H o beibehalten 0,95
Bild A-55
o
2)
z
3,84
Nullhypothese H o : Gleiehverteilung (Pi = p(i) = 1/6 fur i = 1,2, ... ,6)
35
1/6
50
-15
225/50
2
39
1/6
50
-11
121/50
3
70
1/6
50
20
400/50
4
62
1/6
50
12
144/50
5
56
1/6
50
6
36/50
6
38
1/6
50
-12
144/50
P(Z = X ~ 2
F (c) = 0,99
C)H
o
= 1-
f=k-1=5
Annahmebereich: z 2
=
(X
= 0,99
) c= X2
~
Z(O,99; 5)
= 15,09
15,09
Testwert: 2 = X = 1070/50 = 21,4 "verfalseht".
=>
H o wird abgelehnt (Bild A-56). Der Wiirfel ist somit
811
III Grundlagen der mathematischen Statistik Testwert ;=21,4 ~ H o abJehnen
0,99
Bild A-56
o 3)
z
15,09
Nullhypothese H o : Poisson-Verteilung f(x)
= /lx . e-/L
x!
Schdtzwert fur den unbekannten Parameter (Mittelwert) u: u ~ {t =
Wir bilden 5 Klassen: X = 0, X = 1, X = 2, X = 3 und X
~
x=
1,45
4
Berechnung der theoretischen Wahrscheinlichkeiten:
°
Xi Pi
2
~4
3
0,2346
0,3401
0,2466
0,1192
0,0595
~
~
~
~
~
f(O)
f(1)
f(2)
f(3)
3
1-
L
f(i)
i=O
P(Z
27
0,2346
23,46
3,54
0,5341
2
31
0,3401
34,01
-3,01
0,2664
3
22
0,2466
24,66
-2,66
0,2869
4
12
0,1192
11,92
0,08
0,0005
5
8
0,0595
5,95
2,05
0,7063
= X2 ~ C)H = 1 - a = 0,95
°
F(c) = 0,95
f=k-l-r=3
Annahmebereich: z
z
=
) c
=
Z(O,95; 3)
= 7,81
X2 ~ 7,81
Testwert: = X2 = 1,7942 ~ H o wird beibehalten, d.h. nicht abgelehnt (Bild A-57). Die Zufallsvariable X geniigt einer Poisson-Verteilung mit dem (geschatzten) Parameter /l = 1,45 (Zumindest spricht die Stichprobe nicht dagegen).
812
Anhang B: Losungen der Ubungsaufgaben
z
Testwert = 1, 7942 ~ H o beibehalten
Bild A-57
o
4)
z
7,81
Nullhypothese
n;
Fo(x) = ¢ (
/1)
X -
-(j-
Die Parameter /1 und a sind unbekannt und werden aus der Stichprobe wie folgt geschdtzt: 8,81; a ~ s = 0,5563 (beide Werte in lj100km). Dabei wurden die folgenden Klassenmitten zugrunde gelegt: Xl == 7,75; 2 = 8,25; 3 = 8,75; 4 = 9,25; Xs = 9,75.
/1 ~ x =
x
x
Berechnung der Wahrscheinlichkeiten Pi (i
1. Klasse: P:
=
P(X < 8) = Fo(8)
2. Klasse: P2 = P(8
~
4. Klasse: P4 = P(9 5. Klasse: Ps
=
~
P(9,5
= 1, 2, ... , 5):
8 - 8,81) ¢ ( 0,5563 = ¢( -1,456) = 1 - ¢(1,456) = 0,0727
X < 8,5) = Fo(8,5) - Fo(8) = ¢(- 0,557) - ¢( -1,456) = 0,2160
X < 9) = Fo(9) - Fo(8,5)
=
¢(0,342) - ¢( - 0,557) = 0,3451
X < 9,5) = Fo(9,5) - Fo(9)
=
¢(1,240) - ¢(0,342) = 0,2587
~
3. Klasse: P3 = P(8,5
=
x
~ X
< (0)
=
1 - (Pl
+ P2 + P3 + P4) =
0,1075
8
0,0727
7,27
0,73
0,0733
2
20
0,2160
21,60
-1,60
0,1185
3
36
0,3451
34,51
1,49
0,0643
4
24
0,2587
25,87
-1,87
0,1352
5
12
0,1075
10,75
1,25
0,1453
P(Z =
X2
~
F (c) = 0,99
C)H
o
=
1 - rx = 0,99
f=k-l-r=2
) c=
Z(0,99; 2)
Annahmebereich: z = X2 ~ 9,21
=
9,21
III Grundlagen der mathematischen Statistik
813
Testwert: 2 = X2 = 0,5366 => H 0 wird beibehalten, d. h. nicht abgelehnt (Bild A-58). Der mittlere Benzinverbrauch X ist eine normalverteilte Zufallsgr6Be mit den (geschatzten) Parametern u = 8,811/100 km und (J = 0,55631/100 km (das Stichprobenmaterial gibt keinen AnlaB, diese Hypothese zu verwerfen). Testwert ; = 0,5366 ~ H o beibehalten
Bild A-58
o
Abschnitt 6 1)
a)
z
9,21
Sxy
y
= 1;
r = 0,6565
Streuungsdiagramm ("Punktwolke"): Bild A-59
• •
4
3 2
• • •
•
Bild A-59 2
b)
Sxy
= - 17,5;
r = - 0,9988
Streuungsdiagramm ("Punktwolke"): Bild A-60
3
4
5
x
y
20 15
•
• • •
10
•
5
Bild A-60
5
10
x
Anhang B: Losungen der Ubungsaufgaben
814 2)
r = 0,9866 Streuungsdiagramm: Bild A-61
y
kg
••
80
•• •
70
60
•
•
•• •
52
Bild A-61
170
165
si = 0,2887 Q2;
3)
s} = 448,21 CC)2;
4)
r = 0,9948 Streuungsdiagramm: Bild A-62
STR
180
175
= 11,34 °C Q;
r
L em
= 0,9974
L
Die Stichprobenpunkte liegen nahezu auf einer Geraden ~ Losungsansatz: L = aT + b
180
• •
150
•
•
100
• BUd A-62
70 20
5)
40
60
80
100
T
Die Randverteilungen (Wahrscheinlichkeitsfunktionen von X und Y) sind jeweils grau unterlegt. a)
'-v--'
12(Y)
III Grundlagen der mathematischen Statistik 1
1
1 1 E(Y) = - 1 . - + 1 . - = 0
E(X) = - 1 . - + 1 . - = O· 2 2 ' E(X' Y)
= -
815
2
2
1 1 1 1 1 . (-1) . 4: - 1 ·1 . 4: + 1 . (- 1) . 4: + 1 . 1 . 4: = 0
(JXY = E(X' Y) - E(X)' E(Y) = 0
~
Q= 0
X und Y sind somit unkorreliert. ( b)
~
12(Y)
322
2
E (X) = 0 . 5 + 1 . 5 = 5;
E(Y) =
322
o· 5 + 1 . 5 = 5;
E(X' Y) =
1
E(y 2 ) = 0 2
4
2 2
.2
+ 1 .5 = 5
32 2 + 12 . - = 555
. -
4
2
2
0·0· 3 + 0·1 '15 + 1 . 0'15 + 1 . 1 '15 = 15
(JXY = E(X . Y) - E(X) . E(Y) = 2
2 3
E(X ) = 0 . 5
2
2
~
15 -
2 2 2 5 . 5 = - 75
2 2 (2)2 6 5 =25;
(Jx=E(X )-(E(X)) =5-
(J 2 = E(Y 2) - (E(Y)) 2 = 2 - (2)2 = -6
5
y
5
25
2 (JXY 75 1 Q=--=--= -(Jx'(Jy 6 9
y
25 13
6)
= 1 ~ Sdmtliche MeBpunkte liegen aufeiner Geraden (Bild A-63).
r
10
Geradengleichung (Gerade durch zwei beliebige MeBpunkte!): y = 2x + 3 Ausgleichsgerade
5
Bild A-63 2
3
4
5
x
816
Anhang B: Losungen der Ubungsaufgaben
IV Fehler- und Ausgleichsrechnung Abschnitt 3 1)
a)
U = 80,9 V
b)
2)
a)
R
= 1140;
SR
Su = 0,35 V;
= 2,51 0;
S[J
SR=
=
Su J6 = 0,14 V
J8 = 0,89 n SR
Vertrauensintervalle: 11 = 950/0: R = (114 ± 2,1) 0 'Y2 = 990/0: R = (114 ± 3,1)0 b)
p=
1,012 bar;
Sp
Sp = 0,0009 bar
= 0,0026 bar;
Vertrauensintervalle: 11 = 950/0: p = (1,012 ± 0,002) bar 'Y2 = 99 %: p = (1,012 ± 0,003) bar
3)
9 = 9,81 m/s"; a)
Sg
a 1 = 5%, d. h.
11
= 0,02 m/s";
= 0,007 m/s?
Sg
= 95%
Vertrauensgrenzen:
± 0,017 m/s?
MeBunsicherheit: I1g = 0,017 m/s? ~ 0,02 m/s?
Mej3ergebnis: g = (9,81 b)
(X2
± 0,02) m/s '
= 10/0, d.h. 'Y2 = 990/0
Vertrauensgrenzen:
± 0,025 m/s?
MeBunsicherheit: I1g = 0,025 m/s? ~ 0,03 m/s '
Mej3ergebnis: g = (9,81 4)
SR
sR = ~
=0>
n>
± 0,03) m/s:'
(SR)2 sR = 49
Es sind also mindestens 49 Einzelmessungen durchzufiihren.
5)
Die Masse kann als eine normalverteilte Zufallsvariable X rnit dem Mittelwert f1 ~ iii = 105 und der Standardabweichung (J ~ Sm = 3 angesehen werden (beide Werte in g). Wir gehen zur
standardisierten Zufallsgrobc U
X -105
tiber und berechnen zunachst die benotigten 3 Wahrscheinlichkeiten nach Tabelle 1 im Anhang (Teil A). a)
=
Pi = P(103 ::;; X::;; 108) = P (
-~::;; U ::;; 1) = 1>(1) -1>(-D =
= 1>(1) + 1>(D - 1 = 0,5889
-+
npi = 58,89
~ 59
Rund 59 MeBwerte liegen zwischen 103 g und 108 g.
817
IV Fehler- und Ausgleichsrechnung
b)
pz =
=
P(X > 110)
~
np2 = 4,78
= p( D=