uwe
w. Gehring . comena wei ns
Grundkurs Statisti k f ür Polito logen und Soziologen
Uwe W. Gehring . Corne lia Wei...
29 downloads
1988 Views
52MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
uwe
w. Gehring . comena wei ns
Grundkurs Statisti k f ür Polito logen und Soziologen
Uwe W. Gehring . Corne lia Weins
Grundkurs Statistik für Politologen und Soziologen 5., überarbeitete Auflage
III
VS VERLAG FÜR SOZIALWI SSEN SCHAFTEN
Bibliografisctle Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Interne t über http://dnb.d -nb,deabrufbar.
1. Auflage 1999 2. Auflage 2000 3. Auflage 2002 4. Auflage 2004 5., überarbeitete Auflage 2009 Alle Rechte vorbehalten
e VS verleg für Sozialwissenschaften I GWIJ Fachverlage GmbH, Wiesbaden 2009 Lektorat: Frank Schmdler VS Verlag für SOzialwissenschaften ist Teil der Fachverlagsgruppe Springer scence-ausness Media. www.vs-verlag.de Das Werk einschließlich aller seiner Teile ist urheberrech tlich geschützt Jede Verwertung außerhalb der engen Grenzen des Urheberrech tsgesetzes ist ohne Zustirnrnung des Verlags unzulässig und strafbar. Das gilt insbesondere für vervenäregungen, Übersetzungen, Mikroverfilrnungen und die Einspeicherung und Verarbeitung in elektronischen Systemen, Oie Wiedergabe von ceoraucnsnamen. Handelsriemen. Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme , dass solche Namen im Sinne der werenzecnen- und Markenschutz ·Gesetzgebung als frei zu betrachten w ären und daher von jedermann benutzt werden dürften , Umschlaggestaltung: xünkett c pka Medienentwicklu ng. Heidelberg Druck und buchbindensehe Verarbeitung: Kr ips b.v., Meppel Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier ennteo in me Netherlands ISBN 978.J.S31·16269.Q
Fü r Willy H. Eirmbte r
Vorwort zur 5. Auflage Die empirisch ausgerichteten Soxialwissenscbafteu verlangen YO II ihren Ab.. solventen einen siche ren Umgan g mit den Met boden (!,'T Dat enerhebung
lind Datena nillyst>. Auch im Studium der
Polit ikwüsefl,~ th flJt
und 111'[ So-
zio logie spielt die ßp sehäfti gllng mit de n Tech niken r!PT empirisr-lu-n Sozialtorschuug und der Statistik eine wichtige Rolle. Die .....nwcndung stetist iSr!W T Met hoden \\"' IH l" sicher nicht zuletzt durch die rasa nte Entwicklung leistungsfähiger Personalromputer un d einfa ch bedienbarer Statistikprogramnie IlPgüns tigt. Gr1l1ll lhW'llr].> St atisrikkenntnlsse sind jrdoeh nicht nur bei f'igP flf'1l Analvsen llnabdingb;u. Ein r rllehlieh er Teil de r sozialwissenschafrllr-hr-n Litera t ur kann oh ne diese Ke nntnisse nicht mohr nachvoll7.0g:P I\ werden. wie ma n, um nur zwei Beispiele 7.11 neunon. a n d (>11 Artikoln in der Politischen Vierteijahresschrift oder der K ötner Zeit.~ rhrift fü,' So ziologie un d So zialpsy cholOl}ie nachvollziehen kann . Xicht zuletzt stellen Sratistik keunmlsse - lind (\if' ß f'lwr rsd lllng entsprechender Soft warf' - f'iIW SchHissf'lqllalilika tion für den Arbeitsmarkt da r. Das Buch ist aus einem Manuskript out sta nden. das wir für dte Tetlnohnie rinnen lind Tctln-h mer unserer K urse"Einfüh ru ng in dil' Xlethoden de r empirischen Sozialforschu ng und Statistik" verfasst haben. Vom Umfang: lind I nhalt her ist da s Buch für einen Kurs von vier Semcsterwocbenstunden konzipie rt , Ziel ist d it>Vermit tlu ng grundlegender Kennt nisse in den Met hoden der Da tener hebung lind der Statisti k, dit' e int' l'jgellsländige ß eschäft ig ung mi t welterfllhrenden ~ 1('tll(Hlen e rlniiglk ht . ~la th elllatisdll' Vorkennt nisse \\'PHI('1l nicht vorausgesetzt. Das Buch gliedert sieh in die Teil e Methodenlehre (Ka pitel l - -I), Dcekri ptive S tat istik (Ka pitel 8 ) und 11lferenz..~tatist ik (Kapitel 9 - 12). ö
-
Methodenlehre
In Kapitel I werden
1J!iSM~ns chuftsth f:01'(~ti.~chc GnmdlfJgctl erläutert. Oll' Wa h l eines goeignot on F07'.~cJt1mg.~des l:gns, Kap itel 2, steht am Begin n einer Unt ers uch ung . In Ka pitel 3, Afes.~ ell, geht es um die Fragt', was unter ei ner Messung vers tanden wird , welche Gütekrite rien a n (' i1J(' Messung angeleg t werden könn en und wie man meh rere Messungen zu einem m-nen "k.~s instr umcnt zusammenfassen ka nn . In den Soxialwissensrhaften dominiert nach wie vor die Befra gung , (11'r fiir zwei met rische :\lnkwalt>; Kovarianz uurl Prod II k t - ~ Ioment- Kortela t ton Uhuugsaufgaben
7.-1
8 lineare Regression 8.1 Grundgeda nke der Rt>g rpssiousa na lyst> . 8.2 Das mathematische ~ [ ollell der linearen Regression 8.3 Bestimmung der Regressions funk t ion 8.-1 Qualität der Regresston . Übungsa ufgaben . . . . .
9 St ichproben ziehung
xiii
1;;3 l ;;G 161 16;; 17;;
177 177 178 179 18-1
192
193
9.1 Grundlagen , . , 19'1 9.1.1 Grundgesamtheit . Allswahlgf'sal1lth t'it und Stkhllrob f'19;; 9.1.2 ß efra gungs vorwoigerung 198 9.:1 Zu fall und \Yalll"1;dlPiulic-hkpit . 201 9.3 ZlIf1l(' . . 7.10 Ar!witst 9 K(l1T lide llzi nte rva Ile be i uuterschiedlichen S t ichprnln-nmütelwen en 2G2 I· Vertellungen in Ahhänglgkeit vom Freihe usgrad 2G5 Stirhpro be nmi llt' lwt'rlt'H'rteilungeJl mit 110 = 13,5 und nntorschiedlichen Standa rdfehlern (T t • • , • • • , , • • , , • , 278 ZWf'is Art und \\'(' ist' (nä mlich dnn-h Verallg emeinerung] erweitert wie der \\"isse nsehafl lt' r, ON mehrmals nach Zuga bt, einer Substanz zu ..tnor anderen die glt'id w eheunsehe Rea kt ion beobachtet und dara us ableitet, dass diese Reak t ion inunor statt finde t. Im Gegensatz zum Allt ags wisse n zeichnet sich \r i.Sst' lIsd laft jedoch durch einen höheren Abst ra ktionsgra d . ..in syst ematist:heres \ 'orgplwll lind vor a llem die kri tische Überprüfu ng rler ge wo nnene n Erkenntnisse aus. Leider ist es jedoch - wie wir später noch sehen werden - a ur-h mi t Hilft, von \\"isst'llschafl ni..ht möglich zu überprüfou , ob die gt'wo tllU'm 'll Erkenn t nisse wahr sind .
Il';s,. """,,:hafhlheurd isd,,, Gru"d'''9''''
2
\ r issr IlSrhal"t slllPor i,'1l (de r Plural zf'igt schon a n. dass PS mehrere gibt) sind A/l$.~fl!lf'nbiindd dariiber, mas Wi.~.H:ns rh aft ist und wie dtose \'01" 711gehen hat. Sie sind a lso noch keine Theorien über einen Ausschnit t eil ' ]" Rea lit ät [al so v: B. dir Stenn-ntstchung oder das \Yahlwrha lt t'u ). sondern Theorien iiber Theorien. die auc h Bis Mete theorien lu-a-irhm-t werden . \rissl'llsrhaftstllPorit'll hestlmmen a lso. wie rlie r-igr-nt lieh i lltl'rt>s.si!:'fpl](11'
Theorie iilwr dip Rt'alitiit auszusehen hat. Si\, IwS(:häft igl'll slch mit Fragen wlo: \r('tehe Auss agen sind in Theorien zulässi g, welebo Xlothoden werden angewendet , welche Ziele verfolgt \r issPllscha ft'! Sind nor ma t ive (wertende) Aussagen in der W is,rspred wlldr' ß m had lt llng reicht jt>dodl ans, 1I1lI eine gest'tzpsart igp Aussage zu wtdo rlogon (fai.~ ijizi rf'cn ) .
1.2,2 Fals ifikatio n sta tt Induktion \ r egell des Induk t ionsproblems sch lägt Po pper vor, a lle .,G eS(' tze" st rikt als Hypot hes en aufzufassen. Als Xlögliohkeit de r Fa lsi fika tio n von Hyp otln-sen kann das lf-O-ScJu:mu verwenrlet werden: Aus der Jlypot]It>S(' und den Ral ullH,di ngllllgell \\'(' I"I]f'1I nmhachtll ilgssä tzf' abgeleit et , die im kr itiS('hf'1I Hariou alis mus ßa,i tl' t wI'rdell. Ist t>inp Pl:'rSl JIl Arbeiter, dan n ist dle \\'ahrsd win lieh keit einer \\'a hll'llts dll' illllllg zugunste u der SP D (bei Gti lt igk('it der Hypot hese ] zwar hoch. twt räg t ahr-r nich t lOOY! . \Ypil d a,'; E xplanaudum n ur wahrscheinlich (nich t aber logisrh zwingend) ist , sprechen wir hier von einer iuduk tiv-sta ususcheu E rklärun g (vgl. Opp 2UOG, GGf.). Ein einzelner Ar beiter, der eint> f1ntlt> rt' Partei a ls die S P D wählt, widerleg t nicht d il' lly po t IH'SP. P robabillstische Hy pothesen können dah er nicht d urch einen einzi gen Fa ll falsi fizil' rt werden. \Yir sehen d ie Hypothes e j rdorh dann als "fals ifizipr t'· a n. wenn wir bei ei ner hi nreichend gro N'1l Za hl von Arbeitern beispielsweise einen böhoron P rozent sa t z a n C D U· ab an SP D-\\'ähll'ru feststellen wü rden . Diese A kzep ra uz einer .Falsifikation'' proba bilis tis rher Hypot hes en beruht jedoch auf 111:'1' Anunluue, lla~s d il:' pl'O ba bilist isdw Hypothese fiir j(';J im d""t~dJ' [-G ET AS. IU'IIII': lP SOS) in Harnburg gPlllt'illsa m durchgeführten S 0 7.1ALW!SSE:-.'SCHAFTE:-; ßUS ca. 400.000.- D:\[ W'kost t'l. :2 Dte Kosten einer Sekundära nal yse eines vergleichban-n Dat ensat zes. nämlich des von uns auch in diesem Lehrbuch imme-r wieder verwendeten ALLBL'S 1[J9 -1, beliefen sich da gegen nur a uf 17j,- D~ I [inklusive Codebuch]. F ür St udierende Ix-laufen sich die Kosten für eine AI.LßUS-Cmfra ge aktuell au f maxi mal Zj Euro
(Daten auf CD).
In Denrsehlanrl werden Sekund ärdaten
\'011 dpr Abteilung Dan-narchiv und Da tenana lyse der GESIS (Früh er: Zonrralarchlv für empirische Soaialforschung. ZA ) in Köln arc hiviert und gegen Ent gelt für Sekundäranalysen bereitgestellt . Der Dat c nbc.~t a fldskatalog list et mehrere ta usend
I Heut e: ('proH'r for Survov l)" sigll a nti ~ l ell ll}t l{)l"KY ( CS [) ~ I) der GES !S. 2 Der Su~ i:o l wisS('llsdm rl t'lIB u, wurde zwi"'!wlI 1985 um! 1998 ('im""l jährlit-IJ uurchgeführt.
17
für die wissenschaftliche Öffent lichkeit verfügbare Studien a uf. Ein!' R".. eherehe im Da tenbestandskatalog ist übor dio l nrern ets eirc der GESIS (ht t p; / / www. ge s i s. or g/di ens t l e i st ungen/ dat en/) möglich. Ülwr die GESIS können für WIS.-;('lIs("haftlid lf' ZWI'("kt> unter anderem die Daten des AU .nUS. des Politbaronu-ter und St udien 111 Bundes- und Landt agswahlen l.ovogon worden. Das Angebot ist nicht a uf deutsche St udien 1)('schränkt . Es umfasst 1l11("h tntern attonnlc Erhebungen wie den ISSP (Intemat ional Soda! Survey Programme). die E UfO ] H' 1l11 Valu f;';; St ud v oder das Euroba rometer. Sek undä rdat en sind auch bei a nderen Insti t ut ionell erhältlirh. Dip Statist isdlt'1l Landesämte r lind das Statistisd lf' Buudesa uu in \ \'i psbal]1'1l sind eine wichtige Quelk- für Sekundärdaten . Dort kann mall u. a . , r ahIund Volks aäh lungsda tr-n a uf unt erschiedlichen regionalen ElwllPIl (z. 13. für Verwal tun gseinheiten wie C cmoindcn und Kreiso. a ber a uch fiir Landtugswahlkreise IISW. ) in maschinenlosbarer Form erbalten. Vom Deu tsehen Instit ut für Wir tschaftsforschun g (DHr) in Betliu wird das Soxioökonomische Panel (SO EP ) a ufbereiter und eben falls für wisseusrhaftliehe 7.w('cke zur Verfügung gest ellt . Das Sovio- ökouomisrhe Panel beinhaltet unt er a nderem de tailliert e Indik a toren zur berufllcln-n und Einkornmcnssituation eh-r Befragten und is t daher eine wichti ge Da tenquelle zur .-\nal yst, sozia lpr Unglelchheit , Ein wicht iger Da teu gpllt'f ist auch das Forschungsdatenaentmm ( FDZ ) der Bundesagentur für Arbott im Inst it ut für Arbeits markt- und Ber nfssfc rschung (I.-\ß ) in Xürn bcrg. Das I.-\ ß stotlt Dat en zur Verfüg ung, die a us den Meldungen der Arbei tgeher a n die Sozialvcrsichorungsrräge r sta mmen. Solche für Verwa ltungszwecke erhobenen Daten nennt man a uch prozesspredusierte Date n . Da neben erhebt (las JAß auch selbst Dat en. wie das 13t't l"iehspa url. Die Da ten des 1:\13 eTmiiglieht'1l detaillierte .-\nal yst'll dvr Erwerbsbiogra phie von Personen .
2.2 Ebene der Untersuchungseinheit i\;J.t"h (II'T Ebene a uf der dip Dat en er hoben werrleu, wird häutig unt ersohleden zwischen :
• Individualda ten • Aggrega tdaten
18
I n dl vld u aldateu heinhalten Informat ionen über Perso nen bzw. indivl-
duolle Xlerk malo. ßrlspielr wären die ' Yah la bsitht oder das :\1IPI" von Personell . A ggreg atd a t e n heinhalten Informa t ionen Iiher G rllP PPIl bzw. Kollek ti ve, die a us der Zusammenfass ung (Aggregation) HJII Messwr-r teu rler Mitglieder dieser Kollektive ]IPru IIPl\ . 7 . dur ch Summenbildung. Prozentuierung oder «lne andere Rechenopera non. Boi Aggrogatrla ten handelt PS s ieh immer Ulll ,.abgp]eil r l r Da ten- [ Pappi 1977,81 ). Aggrega td a ten werden also nicht 1In den Kollek tiven selbst gewonnen. sondern an den Mitgliedern dieser Kollekt ive. Die Mitglieder der Kollek t ive können. müsson e her keine IIHli\"jf!UPIl sein. Die Stimmenanteile von Pa rteien oder (las Durr-hsr-lmi ttsalter der Bundesrleutsr-hen sind Aggrf'ga t llatf'll . dip aus rlen Individualda ten \Yahla bsieht. un d Alter geb ildet wurden. Da ten. die 'Üllm/ich aggregiert wur-len ('I. B. auf der Ebene von Gr'lllf'indl'n, \ Ya hlkrr iSl'll oder Staaten} . »onnt man auch ökolotli.~ch c Daten. l ndivldnaldate n stnmmon zumeist aus Umfragen, Aggrega tdate n worden hä ufig von der am tllchcn Stat istik bereitgestellt .
n.
Oeb-gen rlich werden a uch solche Dat en \'011 Kollekt iven als Aggreg atdaten bezeir-h net . clif' nicht auf Aggregation beru hen, wie v, ein Index zur :-' If's:'; llng von Bürgerrechten in Staaten [vgl. wtdmaier 1997, 10.\). Xach der Klassifikation \'011 Laxarsfeldund :-' Iellzl'l (1972, 228f.) ha ndelt PS skh hierbei lIlll ein globales Merkmal (!Jlolm/propcrly ) d l'S Kollekti vs. Ein anderes ß pispipl für ein globales Merkmal wii rl' das Rpgir rn ngs.-;ystf'In eines Staates. Globalo Mer kma le \\ '(' r ;]('11 direkt am Kollek t iv gemess en und besitzen nach der Vorstellung HlI\ Lasa rsfeld und :-' [ellz('1 (19, 2) kelne Ent sprech un g a uf der E1Jl'IH' der :\Iitglil'(k r des Koll ekt ivs. Aggregierte und globale xter km alc sin d eine Untergruppe der Kollektivmerkmale (vgl. dazu Pa ppi 19,7. S. 8Uf.).
n.
ü b Individualdaten fH11'r Da l PII für Kollektive erhoben werden. lu-stimmt sich aus der Fors chungs fra ge. Geht P S 11m ~ Ioti\"e der \Ya hlt'lltsd wi;]ung. so werden skh die Hypot hes en mög!i('hen l"t'isp au f Eigenschaft en (·iuZI'Iner \Yäh lpr wie deren Ka nzl erpräferen z ode r Pa rteildentif ikat ion richten. \\'(' 1111 alle int crcs sivrcndcn Xlerk male auf der Individualebene an gesiedel t sind . handelt ('S sirh um eine I ndividualhypot hese. Anders verhält ('S sieh dagegen. wenn eine Hypothese übe r 111' 11 Ein fluss des Ka th olikena nteils au f den Stimmenantei l der Chr istdemok ra ten in \\'a hlkncb t'1l formuliert wird (vgl. Ka pitel 8 ), Hier bezieht s irh d ip JlYPol ht'SI' au f Kollekt ive. Dips ist lnsbes oudero in der Vergleichenden Poli ti kwie...enschaft und der lnrerua tionalcn Polit ik (vgl. \\'idmait'r l!.l97) häufi g der Fal l. So beinhaltet lx-isplels-
weise da s viel dis kut iert e Theorem vom .Dcmokra tis chcn Frieden", da ss demok ra tische Staaten keim ' Kriege gcgcueinander führen {vgl. Teusch un d Kahl :WOl: Cha n 1997), Na türlich können sieh ll yp ofhf'SI'n a uch auf Kollekt.ive und Individuen boztehen. Etwa da nn, wenn die Thes e beinhal te t , dass d ie S timma bga be zug unsr en der C OU bei Kat holik e n mit zunehmendem Ka t holikenant eil in der Ge meinde s teig t. Od er wen n beh aupt et wird . dass Vorur teile nicht nu r von l ndivid ualmerkrualen wie Bild ung usw.. SO Jl(lern a uch de r Grük der Minderheit in l'i1WIIl Uebiet a b hängen. Es ha ndelt sich hier 11m :\11'hrl'hl' lJeu hy pot lll'sl'Il, wei] rlie Kollek tivmerkurale (Kat holikenant ell. G rüt:,1' de r Minderhei t ] lind individuelle Merk mal e (Konfl'ssion , Bild ung } als relevant zur Erkläru ng des Verhaltens [St tmma bga be] bzw. der Ein stellungen (Vorur teile] a ngesehen werden. Mehn-beuenunalySI '1I (vgl. Dit ton 1998: Snljders und ß osker 1999) erla uben d ir simultane An alysl' von Da ten a uf verschi edeneu Ebenen. Xlch rebcncnanalvson setze n veraus. dass hi nreic hend viele Ind ividu ell lind Kollektive un ters ucht werden. Nach Snijders und Bcskcr (1999, 1..\0. 150) soll te n a uf jeder EI)('ne mindestens :.10 Einlu-iren IIIl1l'fSIlChl \I"l'nlell. Bei Analysen in de nen Staat en (lil' Kollektive s ind, iSI d ips l' Bedingung für die Ebl'lll' de r Staaten hä ufig nich t erfüllt . Zudem muss sichergestellt sein, dass auch d ip Kotlektivmerkmale genügen d Vari anz au fweisen. So sollte sieh beis pielsweise de r Katholikenan teil in (INI nur ersuchten Kollek tiveuunterschelden. Aggrega tdaten könn en a uf eiuom untcrschiedllchcn A9yreglllioll$llivrau vorliegen: ß undcsr agswahlergcbnis«- beispielsweise a uf Ebene der Bundes tagswählkreise. auf Ebene der Bundesländer oder a uf Bundeebene. Von den St ut istis chcu Ar mern werden z. n. die urs pr üng lich als Individualdate n \'l)rl il>gelu!l't1 Volksvählungsdaten (Gl>:;('hll'thl . Hpligiollszilgehiirigkeit. ß l'ru fszuge hörigkl'it, Sehnlabschluss US \ \·,) au f verschie douon Ebe nen (C emetnden , Kr etso usw .) aggrl'giprt lind auch nu r in nggregicrter Form weite rgegeben. Au s na heliegenden Gründen werden a uch Wahldaten nur als Aggrega td a ten zur Verfügun g gestellt. :\Iit der Aggr ega tion is t ein Informut ions verlus t verbunden. Bezogen au f das Volkszäh lun gslx-ispiel: die agg regicm-n Volkszä hlun gsd a ten geben lediglich Ausk unft über die Anza hl der ~ Iä n n er, der Fra uen. der Menschen mir einem bes timmu-n Schula bsr-hluss usw. in eine m hestlnunten Gehil'l . \\'je vipll' Frauen und wie viele ~ Iii llll('r welchen Schulabschluss haln-n, lässt sich den agg regicrten Volkszählungsd at e n nicht mehr ent nehnu-n. Aus de n aggregterton Volk szähluugsdat en lassen sich die urspr ünglichen Individualda ten nicht mehr herstellen. eine Disaggrega tion der Da ten ist nicht möglich.
20
\\'i" da s Belsph-l der Volkszä hlu ngsda t t'1I zl'lgI, welche nur a ls Agg rega trla te u :l.Ilgä ngt ieh gemacht werden. kann ma n sieh nicht lmmor aussuchen , ob man mi t Individual- oder Aggrega tdaten a rbei tet. So ist die hist orische wahlfoochung weit gehend auf die Analvse von Agg rega tda ten a ugewieSI' II . da bis in d ip GOn Jahre des :W. J ahrhunderts Umfragedaten sphr rar sind . Fiir Anal ysen der \\'ah ll'll rlos Deutschon Reichs greift man a uf die Volkszähl ungs- und \\'a hlda l l'll z ur ück. die in dor Slati.~tik des Deutschen R ei chs ver öffentlicht wurden {vgl. exemplarisch \ r inkl.,!" 19U:i : Fa lt er 199 1). Es kan n a lso passiere n. dass man Aussa gen übe r Ind ivid uell t reffen möchte. ta tsik hlieh a ber Hili" Aggrega tdat en 7111" Verfügung stehen.
Ökolog ische r Fehlschluss In rllesem Zusammenhang mus s man darauf ach ten. keinen Fehl.·;chlliss zu IWgl' lw ll, Fchlschliisse entstehen im me r dann, wenn A u.~.~ ag t'd 1thc it un d U1l1cl'sllchungseinheit fl uf unt erschiedlichen Ebt'nen fl ny e,~ it'ddt sind . Schhcst ma n von Beziehungen a uf der Aggregatebene auf Boziehungeu der Individualebene [allgemein: ein er niedrigeren Ebene} . hpgt'hl man einen iikologi.~cJU'11 Feh/.~ chlu.~.~ . Schliest man im umgekehr te n Fa ll von ßI'zit'hangen auf ( 1(' 1' Individualebe ne a uf Beziehungen der Aggr ega tebeue, lipgt ein individualisti scher Fehlschluss vor . Für tlif' Sozia hvisst'IlSchaftf'n ist \'01' allem de r ökolo gis che Fe h ls chlu ss (vgl . Rohinso n 19;j()) von Bedeut ung . da die Da ten hiiufig in st ärkor a ggrogierter Form vorliegen. a ls ma n sio für d ip heabsichtigten Aussagen bräuehr e. So schlossen einige Histor iker (vgl . dto Lit r-ra tu r hinwr-ise bei Fa lt er et a l. 1983, i:i28) a us dem bei den Reichstagswahlen zwische n 193U und 19;32 zeit gleich erfolg ten Ans tieg der Arbeitslos igkeit und den Wah lerfolgen rler :'\SO AP a uf Reichsebene. da ss A1'1H'itslos t' iiht>rp rolltll't itHla l hä ufig für tlif' ;';SD .\ P ges tim rnt hä t ten. Au fgrund von Zusammenh äng en a uf der Reichs eb ene (Za hl der Arbcitslos en und ;';S DAP-S timllll' n) W U H II' II Aussagen über Zusammen hä nge auf de r individuellen Ebene (Arlwits losigke it ulld :'\SOA P -Sti llllll a bga be) getr offen. Dieser Schluss ist jedoch nirht Zl\ l ä.~sig und kan n s ieh a uch inha ltlich a ls falsch erweisen. nä mli ch dan n, wenn Arbeitslose nich t überpropertinna l häufig für die :\,SOAP gest immt haben ("gI. auch Frev und \Yt>t:k 1981, (i lind 2i:i ), Au f dE'1' l ndivlduale bene lässt sk h tipI' Zusammenhang nicht mehr nu rersuchen. Allerdings kann man den Zusammenbang a uf e inem II icd rigorcn Aggrega tionsni veau prii fen. So ste11ten Fa lte r 1'1 111. (1983)
21
fest . dass die :\SDAP in Krci$C1I mit ei nem hohen Anteil erwerbsloser Angestellter und Arbei ter durchschnit tlich keine höhe ren Stimmcnauwi11' l:'rzipltf'. Im G l'gp1Jt f'il: 111 K reis en mit einem hohen Erwerbslosenanu-ll schnitt. diE' i\SDA P durchschnittlieh sogar schlechter ah (vgl. Fal te-r et al. 198."3. ::i32). Die ErgehnisSf' von Falter Pt al. sprechen gegen den auf Reichs lind Bezlr ksobe no (vgl. Frey und W{'l'k 198 1) festgest el lten positiven Einfluss de r Erwerbslosigkeit a uf den Sthnmonzuwachs der :\SDA P zwischen 19;30 und HI:3:1. da die Er klär ungskraft auf Krpisl'b l'IIP höh er ist als a uf rler Ebene der l1l'zirke hzw. des gesamt en Reiches. Dennoch kann mall alleh von EII'II wenigl'r stark aggrogt-rten Kreisdaten nicht einfach auf das Wahlvorhalten von Arbeitslosen schlteten. Zwa r ist das Problem des ökologtsehen Fehlschlu sse, nic ht lös bar : ps sind jedoch statistische Verfuhren entwickelt worden (öko logische l n/ercnz ). mit deren Hilfe Zusammenhäng- dE'1" individuellen Ebene ,geschlitzt werEII'II können. ~ Ii t einer iJko!oyiHchert RC9rerg riii.f' (X) utn l rlen Leistungen (V) von Schülern, wie sie etwa mit rk-n PISA-Cutl'l'sudlll ngt'n erhoben werden. Oie Kiiqwrg rii k ist nicht ursärhlieh fiir d ie besseren Leist ungen. Vie lmeh r er klärt d as AItI'1" der Schüler (Drfttvariable Z ) sowo hl dere n Kiir peTg riii.t' als auch deren Leis t un gen {längere Sch ulbi ld ung ). Xach Kont ro ll!' de s A!t.,I"S müsst e der Zusammenhang zwischen der Kör p t'rgrüf,;' X un d den Leis t ungen ) ' verschwinden (Abbildung 2.3). ~ Ia n spr icht hier von einer S clieinsorrcuuiou (HI.'r b es-
ser von einer Seheinkau$alität. denn die Korrel ation zwischen X lind Y bes teht (ohne Kontrolle von Z ) ja tatsächlich. Ab bildung 1.:3: Scheinkausalit ät GröBe (X]
GröBe (Xl
Alter ( Z )
~Leist ung (Y)
Leistu ng (Y )
ohne Kontrolk-
"011
.>:
Z
mit Kontrolle
\'0 11
Z
ist a uch. das,'i X Z beeinfl usst lind Z wied erum V. X also einen indire kten Effekt a uf Y aus übt (X --- Z ....... V). Ein Beispiel ist der im sozi· alpsydlOlogisdlt'1I ~ lo,ll:'l1 des Wahlverha ltens postu lif'ftl:' Elnftuss der ab langfristig s tabil konzeptuallslerten Parteiidontifikat lon (P I) (vgl. Campbellet al. 1980). Dip Partoiidentiflkat ion dtent a ls Filter der Wahr nehmung de r Ka ndida ten (K) . Kandidaten der präferierten Par te i werde n posit iver wahrgenommen als Ka ndida te n andere r Pa rt efon. Dip Kandidat enpräferenz beeinflusst die Su mmabgabe (Wah l). Liegt eussehltejsltch ein mdtK ...... \rahl). dann verschwlndr-t auch hier der rek ter E ffek t vor (P I ursprüngliche Zusammenh an g zwischen der Par tr-iidomi fikation und der Wahb-nt-chcidung na ch Kont rolle der Kandidaten pr äferenz. "'ach dem sozialpsydlologisdll'll ~ 1()(!t'11 Ilht die Pan eiidenüfikation zudem eine n di rekt (' 11 Effekt auf die Wa hlt,ntsd wir!lIl1g aus (direkter lind indirekter Eff ekt ). Der Untersehh-d zwischen einem indirekten Etfek t und einer Scheinkurrelation läss t sich nur übr-r die zeitlichoA bfolge von .X und Z klären. Bei einer Schciuk orrelariou ist Z X un d }' kausal vorgelag ert, bei einem indirek ten Effekt ist Z uu r }' kausal vorgela gert. Von MuUikausalität ist die Red.., \\'('1111 sowoh l X ab a uch Zeinell eigenständigen Einfl uss auf die abhä ngige Variable Y ausübe n. Zwei zentrale Determ inan ten der Lohnhüll!' SilHI rlip sdl1llisdle/llf>f11l1iche Ausbildung un d d le Berufserfahrung. Schllr.slich kan n ein Zusammenhang erst bei Kom rolle oinor Dritt variablen auftauchen (,~cheinba re Nichtko rrelation, nicht abgobildet] . Die Kontrolle von Drit t variablen ist domnach auch sinnvoll. wenn keine Korrelat ton festgestellt wurde. Zur Kont rolle \ '011 Dritt variablen werde n in der Rl'ge1 TlIIII· tivanate Verfahren eillgr>sptz t. Xlultivariate Verfahren sind ; verelnfaeht ~liiglich
ausgedrückt - stat tsusche Met hoden zur Anal ysen von Zusammenhängen zwbdwil mehr a ls zwet Variablen. Indirekte Effekte lassen sich mi t Pfadmodellen quantifizieren (vgl. Reinec ke 2UIJ;:j). Einen Überblick übel" die st at istische Kontrolle \" 011 Dri ttvariableu bieten Agrost i und Finlay (20U8 , Kapit pl 10) und Bvnningha us (200j ).
Ahhil,lung 2.4: BpJit'hungell zwisdu,n drei Variablen
Scheinkausalität
Indirekt er Effekt
X-z ...... )·
"
X -
Direkter & indirekter Effekt
)'
7. /
Intera ktion
Mult ikausalität
Festst ellu ng der Kausalität existie rt in Ex-post-factoAn ord nungen ein wolter os Problem. Die G rüN> von ..Experi memal-" lind .Kontrollgruppe- kann nicht so gpziplt gesteuert worden , da im Gpgpnsatz zu Experimenten die G m pppuanf!pi!lIng erst bei der Datenauswertung erfolgt . Aus diesem Grunde kommt I' S in Ex-post-Iacto-Anordnungen vor. rias. nicht Q ud lc: Laxa rsfeld et al. ( l!.ltig, S.xxiii)
,
,
'9
Von Pa nclaualvs-n s pricht 1IIau nur da nn, wenn die Ver änderungen elor ~ terkmalsa Ilsp riigll ngen von Unt prSll(:hlln~pi nheiten im Zelt verlauf IlPtracht et werden. ß priicksit htigt ma n lpd iglk h Aggtegatwrän.lentngen. da nn handelt ps s ieh um eine Trenda nalysea uf de r Basis von Pa neldaten. Wertet man wie in Ta belle 2. 1 lediglich E'im ' Wl'1 le r-inos Panels a us . da un ist I' S eine Quersch nittana lyse. Aufg ru nd der durch die untvrschiedllchen ~ [ I's,1I können. Das Eurobarometer eigne t sirh se hr gut für vergleichende Analysen. da in jedem Land mit \\'l'itgpllI'nd demselben Fragph ogf>l\ gl'a rhl'it t'l wird . :\Iit Ausnahm e Luxemburgs werden in jedem Land ca . l. ()OIl Personen befragt . Politbar ometer Das Polit ba romr-ter wird im Auft ra g rIes ZDF seit 1977 von der F O[{SCIIU:"GSGIlIJ I'P E \YA IU. F.:" in Mannlu-im durchge fü h rt . Es handelt sich IIlll eine monatliche Qu-rschnittbefragung \ '011 rn . 1.2;)0 Personen. Einz elne Ergebnisse werden einmal im ~ l ollat im ZDF verbret te t und sind über Inrernot a brufba r. Dip e rhobenen DaH'1l werde n a n das Zcnt m larcluu Jür emp iri sche S ozialJof'llch ung (ZA) in Kühl weit ergegeben, \\"0 sie a ufbereitet und für wissensc haftflehe Zwecke zur Verfügun g gestellt werden . \\",'gf'll d es inuner gleichen Desig ns und der Verwendung derselben Fragen eig net sieh das PoIitba rometcr a usge zeichnet fiir Trendst udien. SOEP DHS Soxio-ö konomischc Panel (SOEP) ist d ie umfa ng reichst e PHm-lst udic in der Bundesrepublik. Es handelt sich umeine Ha ushaltssüchprobe, lw i de r all e :\Iit glil>dl'r eines Ha ushal t es bpfragt werden, d ie im Befragungsjah r mindes tens 17 J ah re alt sind oder werden. OI>ginTlt>IHI 1984, wurden ra. 12.000 Pers enon a us G.OOO Ha ushal tcn (Stichprobe A .Dcu tschc'' und B ..Auslä nde r") einmal jäh rlich
befragt , seit 1990 auch in Os rdout schland {St ich probe C). Ei]]1' Wl 'seurlichcr \ 'erteil des SOEP ist die grobe Ausländerstichprobe (St ichprobe ß ). d ie detaillierte Analysen ermöglicht , und lHe Erfassu ng der neueren Formen von Zuwanderung (St ichp roben 0 1/ 0 2). lna wtsehen wurde das SO EP 11 m weitero Suchproben ergänz t [vgl. TaIwIle 2.3) . Dur r-h die Auffrischu ng des Panels wird d ie Pan elmortali t ät aufg efangen. Die Auffrischung dien t zudem zur Sichers tellung der .Rcp räscnta tivi r ät'' des Panel s. da d ie ursprünglichen St ichprobon zwar die Becölkemng im Jahre 19S4 repriisentieren. de r Veräude rung der Bevölkerungsst ruktur aber nicht Rech nung tragen. Tabelle 2.3: Suchprobenstruktur des Soaio..ökonomischen Panels Stichprobe A \ Vt'sld cllltgplll [ nicht umgekehrtl]. Die Rpziphuugl'll zwisr-ln-n den Objekt eu werde n Plllpir isdws Rel a tiv gl'nanu r, die Boziehun gen zwischen den Zahlen uumertsehos Rela tiv (Beztehungen = Relat ionen}. ZUIll ~ Jpss\"Orgall g gehö ren damit drei Kompouenteu: Das e m p ir ische R e lativ , das numer ische R e la t iv und eine A b b ild ungsvo rsch ri ft , (li!' eine korrek te (st ruk rurt rouc] Zuordnung der Zahlen zu den Eigenschaften von Objektr-n ermöglicht (vgl. AbbilduugS.t ]. Diese drei Komponenten bilden eine Skala .
Abbildung 3.1;
~ 1t'SSI'1I -
Schematische Darstellu ng
....
.....
....
IIaup1S\:hule
.....-.
Real schule
Hauptschule
3 ~
GYIlHlasiurn
..
. Numer isches Relativ
.
Empirisches Relativ
Obj ekt e haben in der [{(>gr l viele Eigenschaften. anhand derer sio in 11,ziehung gesetzt werden können . Bei Personen können die.'; z. B. das Cesehll'cht , die Bildung. das Einkom men . d ie Stä r kt> des Politikinteres ses oder die \rahla hHit"ht sein. \ \'ill lllan da s Geschlecht IIl l '.sSI' Il , so könn te die
Skulc"" il'mu.s
Abbildun gs vorschrift lauten: O rdne don Merkmalsausprägun gen m ännlich und weiblich die Zahl r-n 1 und 2 W. Die konkret e Zuor dnung ist beliebig: Männlich kann 1 sein und weiblich 2 oder um gekehrt . Die Zuordnung muss ahe r innerhalb einer Untersuchung konstant I'rfolgl'll. Ülwr eine Ordnung marht dif' ohigt' .-\hbildllngsm fSehrift keine Aussa ge. da im empirischen Relativ kerne Ordnung vorliegt . Die Abbildungsvorsr-h rift für das Politiklnteresse würde dagegen la ut en: Ordne da- Za hlen so zu, dass die Rangfolge in der S tärke des Politikinteresses erhalten blei bt , also br ispil'ls\\'l'ist' be i keinem Int eres se U, schwa chem Interesse I und s ta rkem Interesse 2. Hier ist eine Ordnun g not wendig. UII1 d ie Beziehungen im empirischen Relativ struktur trr-u abzubilden. Das ht:'iM : Die Abbildungsvorschrift ist vo n d e r A rt des M er km als im empirisch e n R el ativ a b h än gig und best im mt das :\lt'Ssniwall bzw. Shaienniueau.
3.2
Skalenniveaus
In Anlehnung an SteH'IIS {19..\G) werden in den Soz la lwissons ch a ft en vier Skalenuiveaus (auch: ), lessni vr-a u ) unt erselneden:
I . Xonunalskala 2. Ordlnalskala 3. Inter valls kala -I. Ra t ioskala
Au i'>/'nll 'lll ist rlif' n/' rik ksiehtigun g einer weiteren Skal a sinnvoll: 5. Abso lutskala
Das niedrigste Xlessniveau weist die Xominulskala a uf, das höchste die Absolutskala. D ie h öhe ren Ska le n b e sitzen d ie E igen scha ften alle r n iedrige r en Skale n . Xominal- lind Ordiu alskalen werden auch als qualita.tive oder nicht-metrische Skalen bezeichnet, lnt ervall- , Ra tio- IIl1d Absolutskalen als q1j/m ti t(ll i lle oder metrieche SIvlI/'II . I . Nom inalska la . Können die .-\lIspräg uIlW'1l \'(1Il :\lt'rkmah'll )t'{liglith im Hinblk-k a uf G le ichheit oder U n g le ich heit umerschtoden werden . dan n lieg t nominales Skalenniveau \"1)1". T ypische Boispiele hierfiir si nd da s Geschlech t. die Pa rteip räferen z. die Haarfarbe oder die Rt'ligionszll gf'lliirigkr·it. \relche Zahlen welcher Aus prä gung zug-erd111' t werden. ist beliebig. sola nge fiir jode Xlerkmalsausprägung eine
eigone Zahl verwendet wird. Ob xlän ner m it I un d Fr auen mi t 2 oder erstere mit 20 und let ztere mit l i bozok-hnr-t werden. ist vollkommen unerheblich . Allerdings da rf nu r dio Ungleichheit zwisrhen den Zahlen interpretiert werden. Dip Aussagt' Frauen seien , ~ lo PIll'lt ~o g ut" wie Männe r. weil Fr ane u mit 2 und ;"lällul'r .nur- mit 1 kodiert wurden, ist sinnlos. da die Zahlenzuordnung Ill'lil'big ist. 2. O rd inalskala : \ 'OTI ordinalem Skalenniveau s pricht ma n, wenn dte Merkmalsausprägungen zllsä tz lieh zur GI"iehhl'it /Ungl"i ehllPit noch eine R e ih en folge aufweisen. Beka nnt ist 1I11r d ie Reihenfolge: ma n w('ib aber nich t . wie gro b die Ab~tä Jl(le zwischen den Merkmalsauspräguugeu sind. Es wurde be reits dle St ärke des Politikinte resse s genannt, andere ßl'ispielr für ordtualskaltorte Xler kmale stnd die Schnlbtldung und dil' Schulnot en. Die Reihenfolge der Merkmals aus prä guuge u muss sich in der Reihenfolge der Zahlen wide rs plogoln . D!c Zahlen müssen aber nich t un mittelbar aufeinander folgen. obwohl dies in der Regel wie Z. B. bei den Schulnoten - der Fa ll ist. ;3. I nt ervalls kala . Mer kmale sind intervallskalir-rt, wenn deren Aus p rägungen nicht nur eine Ra ngfolge (lind dami t auc h U u tf'l'S("hil'{lliehkeit ) aufweisen, sondern auc h Abstän d e zwischen A usp rägungen sinnvoll intorpretiert werden könnon . Typts ehe n r i ~ p i rlp stnd die Temperaturmessung in Celsius oder Fahrenheit und die Kaleuderz eit rechuung. Die Abstände zwtschcn aufetnanderfolgondon Ausprägun gen (d ie Int erva lle) s ind bei einer Inte rva llska la gleich g ro b (konsta nt) . 0 1'1' Altersuutorschied zwischen eine r Person. dir 1930 gebo ren wurde und eine r Per son. die 1929 zur \ \"dt kam, ist ge na uso g ro b wie die zwis chen d em Ocbu rtsjahrgang 19,i l und 1% 0. Interva lls kalen besitzen im Gegen-
satz zu den nachfolgend hesr-hriebenen Rat ioskalen aber keineunat ürliehen Xullpunkt , Aus diesem Grund sind \ '!:'rhält_nissE' zwisdu:'u rlen Za hlen auch nich t interprettorbar. Besonders rleurlich wird dlos an der Zeitrechnung: Als wir nach christlicher Zeitrechnun g {gregctianischer Kalender} den Jnlnrswochse l 2008 / 2009 beg angen ha ben, befanden wir uns nach jiidisehr-r Zeitrechnung mit ten im Jahr 5769 lind nach islamischer Zeit rechnung im Jahr 1430. Da s Ja hr 0 existiert zwar Ill'i allen drei Zcito-chnungcn. es sind jedoch rein de finitorische Fest legungen lind keine ,,f'("h tl' n" Xullpunkte. Der Beginn der Zeitrerhnuug ist im rhrtsrlir-hen Kale nder an der Gehu rt C h rist i orieutiert , wahrend die muslimisr-he Zeit rechnung mit der Auswanderung Mohamuuxls von Mek ka nach Xledina beginnt. K ün stliche Nullpunkte slnd leicht dar-
Skulc"" il'mu.s
an zu erkennen. d a ss das jt'lw iligl' xlor kma l negat ive A usprä gungen besitzen kan n. wie r, B . IOO() VOf' Christ us . 4. R a tios ka la : Das einfachste Erkennungszeichen ra t ioskalierrer Xlorkmale ist dle Existenz eines natürlichen (ec h t e n ) N u ll p u n k t es . ck-r erst 11('1l Vergleich von Verhält nissen zwischen Skal enwerten f'rmöglk-ht, Das Alt er (nicht Ge bn rtsj a hrl], das Einkomnu-n lind dte Temperatu rmessung in KI'I\" in (nk ht Celsius oder Faluouhett l} sind Eigenschaften au f Ra t ios kalenniveau. Hier können Vcrbältnlsso interpn-tiert werden: Ein ;jOjährigef ist doppelt so alt wie ein 2,jjährigt,r. Die Temperaturmessung nach Kel vin ist im GI'gt>nsatz zu Cel sius und Fahrenheit eine Ra tioskala . da dipS(' eine n natürlir-hen Nullpunkt hat (be i -273.15 "C}. Null Kelvin I lPi ~l : Abwesen heit non Temperatur bzw. ~ loll' klllarbe\\'l'g lln g, während 0 "Celsius l'iup de finitor ische Ff'st ll'gllllg durch den Gefri erpunkt des " 'asSl' n; ist. B..i :300 Kelvin ist es als o tatsächlich doppelt so warm wi .. hei 15(}Kelvin. Ratios kalier te Mer kmale können keine negativen Werte annehmen . Es gibt weder ein negatives Einkommen noch ein negative, Alter und auch keine neg ative Temporatur in Kelvin. R a t i l ~s kal i l'rte ~ ll'rkJnal p besitzl'll ..künstliche" Skaleneinheiten. was sieh a m Belspiel de, Elnkcuu mens gut verdeurllchen lässt , das his vor kurzem in D:'\ I und P fennig. neuerdings aher in Euro 1111d Cent gl'IHI'Ssen wird. Dies uuterschetdet Hatlos kah-n von Absolutskalen. 5 , A bsoluts kala. Absolutskalenbesi tzen zusätaltch z u den bisher rlis kuticr ten Eigenschaftell der anderen Ska len eint, n a t ürliche S kale n e inh e tt. Die Zuordnung der Zahlen ist durch die Beziehungen im empinsehen Rt'1Skalenniveaus immer mehr l nforma tioneu e nthalten als niedrlgere. Ha t mau das Alter der P rofes sur innen un d P rofessor en in Jahren gf>IlWSSI'II , so kan n man exa kt angeben, um wle viele Ja hre Profoss oryin X ält('l" als Professor /In }' ist , während dles bei den anderen botde n :\Ipssungen nicht möglic h ist. Zudem ist eine Verminderung des Skalenntveans im Nachhinein immer möglich. nicht aber eine Erhöhung. wählt man ein nipllrigPrI's Skalen niveau als miiglir:h, da nn reduz iert sieh von Vorm-, herein die Za hl dor ~uläss igl' ll stausttsehon verfuhren . GplpgPlltlkh kann es durchaus sinnvoll sein. auf einem niedrigeren Skalenniveau zu n \(' s.t hier gf'ra d t· die Abwesenheit von negativen Einst ellungen zu Ausl ände rn. Will m an positiv un d negativ formulierte Aussa gen Zll einer Ska la zusammenfassen. muss man darauf ar-luen , dass dies elbe Zah l dieselbe Einstellung n-präscntiert. Z, I3. indem ma n hei positi v formulierten Aussagen der Antwort ,.s ti mnw \·011 u nd ga nz zu" den WI>rl 1 (Abwesenheit H01l Ausländerfeindlichkei t ] und 01'1" Antwo rt .Sthutut- überhaup t nicht zu" den WI'rt 7 (Ausländerfein dlich keit] zuweis t lind die Abstufungen entsprechend rekodiert (umpolt).
Die Konstr ukt ton einer Likert -Skala läss t sich anhand der im ALLßUS 2Ull(i verwendeten Item s veranschaulichen. Zur Yen -infachnng \\"(>I"(II>u ausschlicsllch die 2.038 in \ r esld l>llts("h la nd befragten Personen bet mr-htet , die alle vier A ll s.sagen an f Iler sipbpnlil u figp\l Skala beau t wort Pt ha 11t'1l, also keinen ei nzigen fe h tonden \\'t>rt {kein e Anga be / m>ib 1l loht } aufweisen . I Bei dor Likort-Skala wird der Skalenwert au s d er Summe 1111('1" (gleich gepolten) 1t1' Ill S berechnet. Dip Addlt ion ist jedoch nur da nn gereehe fertigt. wenn die Items eine cinaigo Dimension messen. Aulrand der Item-Ana lyse wird entschieden. welche It t'11lS get'ig lle t sind und damit in d ie endgültige Skala eingehen.
Der ltem- Analyse liegen vwot Gedanken zug runde. :\1c'SSI>n die ltems dieSI'IIH' D imens ion . dann sollten sieh Unt erschiode a uf der Zll messenden Dimension auch in unterschiedlichen Antworten niodersehlugen. ZUI! I'1Il d ie Antworten der Befrag ten zu den r-inzolnen Sta teme nts dau n kons istent sein.
SlI I!It'Il
D;,o:;t.'s Yorgl'!Il'1l wird ,ulf"h
"ts list
52
Um zu überprüfen. ob sieh Un terschiede in der zu messenden Ein stellung auch in der Bea ntwortung der einzelnen Aussegen niederschla gen . teilt mall dir Befragten in E xtrem gr u ppen auf. ZUllikhst IH' rl'duwt mau fiir je de Pers on die S UIIl IllP II"r ,rerl E' über alle Items . Im fij' ispie l ist ([1'1' niedrigste möghche \\'1'1'1 der Summe 4 (wenn bei allen vier l tems ([1>1' Wort 1 vorliegt }. der höchs te mögliche ,r"fl bet rägt 28 {wenn Iwi alle n vier Itr-ms der , rer! 7 vorliegt ]. Man wählt d un 11 diejelli gl'n 25 % der ßefragte n au s. d ie die niedrigsten Wert e über alle lt ems aufweisen und diej-mgcn 25 % der ßd'ragtl' ll mit de n höchsten ,r('r!('I1. Fü r clie vier ALLß US-It '>l1ls habe n (He 25 % der Befra gten mit rlen niedrigst en , r "rt rll Wl'rll' n visdJ l'1I 4 und 11 (Gru ppe 1). Die 25 % der Bofragten mit den höch sten Wl' rlC'1I haben werte zwischen 18 und 28 (Gruppe 2). Danach vergleicht man die Ant wort en der belden Ex tremgruppen Z!J jedem ciasetuc n UC7/!. Br auchba r s ind diejonigen Items. bei den en sieh dle Antworten der Ex tremgruppen unterscheiden. Tabelle 3. 1 heinhaltet die Durchschnit tswerte der beiden Extremg r uppen (1' 1 lind 1'2) für die einzcltu-n Items. ß l'fragle mit extrem hohen Werten a uf a llen It P II\ S (G ru ppe 2) sollten auch jedem ein zelnen Item deutllrh s tä rker zus timmen als Befragte mit ex trem niedrigen werten auf allen Items (G ru ppe I). Dies ist a uch der Fall. Am s t ärksten unterscheiden sich die beiden G ruppe n in der Beantwort ung der Frage. ob man Ausländern je{le politische Bet ätigung iu Deut schla nd untersagen sollte. Am ger ings ten ist der Unterschied in ([1'1' Beurteilung der Aussage, Ausländer sollten ihren Lebensstil besser an den der Deutschon anpassen . ßp i (IPI' ..1,nalysr beschrankt man sich nicht auf einen Vergleich der ~ [jt telwerte. Vielmeh r wird für jNl rs ItPIIl ein Trennsch ärfe-Index lx-rechnet, (1('1' dem t-tes t für ~ litt elwert uut ersd li,'(11' ent spric ht (K api t el 12.3.1). Trennschärfe-Indizes grö!;pr als LG5 gelt en als ausreichend zu r Anna hme einos Unt erschiedes in de r Beantwortung der I tem s durch die, beiden Ext rcmgruppcn . W ie ma n sieht, sind die Trennschärfe-Indizes alle deutlich grÖN.'f als L {);'). Die l rr-ms scheinen dah er ein un d clipsl'!lw D imension zu messen und zur Kon struktion einer Skal a gel'igw' L Eine au rler(' Methode der lt ellJa nalyse ist d ie Bere-hnnug von Tre n nschärfe-Ko effiziente n . Messen alle Aussagen ein und dcnselhell Sachverhalt , da nn sollten clie' l tem s hoch miteinander korreltoron. Ein Befragter. der der Aussage .Die in Deut schlundlebenden Ausländer sollten ihre n Lebensstil ein bisscheu besser a n den der Deut s chen anpassen" stark
53
5kul i~'1I" !I.w elf
A r lH'itsplii tz(~
1.3
5,1
(sf -" 0 .636)
(·4= 1.6 14)
1.3
5/,
(si -" O.706)
( .~~ = 1.6()U)
Polit.ischc Jl('t äti gUllg
Ehepart ucr
Allzahl der Jll'fragl\'l\
G ru]>]>(' 2
l.l
·1.2
(si - 0 ,-178)
( s ~ = 2 . U 1)
M3
557
n ah'!. Alllms 2006 . \ \ . 'St rl( u t sd lt' . ;r
Difrpn'll~
.l'2 - ofl
,m t lllllt tl st ilt s ~ htt l l.
/· \\'\'rt
2.1
'je
3.8
51
4.2
57
3.1
as
-"
-' - \,m a llz
I
Posit io n eines Befr ag ten mus s a userdem rel at iv zu allen a nderen interpr otier t werden. Bei einem durrh srhni t tlichen Skalenwert W lII 14 is t lU ein nif'd rigpr Skaleuwert , Bei einem Durchschni tt swert vo n 9 ist ein Skalenwert vo n 10 da gegen rela t iv ..norma!-, Zudem muss Ilt'ri k kskhtigt worden, ob das Antwon vorhalton einer G ruppe eher ho moge ll oder hoterogen ist. 3 Auf einen Punkt muss hingewiesen werden: Um d ie Irr-manalvse durehfll hren zu köuu en. gdH'JI wir davon a ns . da ss die Abs t jind e zwischen den einzelnen Skalenpunk ten gleich grob sind . und da m it z. B. die Ext n-tua nt worten C,Stim uw überhaupt nicht zu", .Stimme vollu nd g..mz Z1I,,) gleuh weit von der ~litlp ent fernt sind . ' '' ir nehmen also a n. dass die zur Itomanalvso hera ngezogenen l tems mindestens tntorvalt skaliert si nd . Ohne dit'Sp Annahme dü rften wir arit hmetlsches )' lit lt'l. Varinnz, t-t est (Trenns chä rfeInde x] und Pea rson s r [T reunsc hä rfe-Koeffiz lcnt ] nicht lx-rechnen. O b die Abst ände zwischen den Ka u-gonen äq uidista nt sind. kann bei mehreren I tems mit Rati ngsk alen- For ma t geprüft werd e n {vgl. Rost 2004, Ka pitel 3).
111 der empirischen Sozialfo rsd l11ug werden häufig eine Rf'i!tt' \"011 Items a ls Likert-Skalen bezeirhnet , l\"Pil sit' fünfsruftge Ant wortalteruatlven hahell, Auch Sum rnr-niudizcs werden man chmal Likcn-S kak-n gena nnt . Um Llkert- Skalen handelt P S s ieh jedoch nu r dann , Wl ' lI 11 vor Addit ion de r " 'erto gt'priift wurde, oh die Skala eindimensional ist. Fak torena nal ysen sind eine alterna ti ve xl ethodo zu r P rü fung der Eindimenslonalltä t.
3.3.2 Guttman-Ska la Dip G utt man-Skala 1I 111t'r sehpillt't sich in d n Konst ruk tton llt'llt lich von der Likert-Skala. Durr-h dit' Guttman-Skalierung werden glpit"hzp itig Pt'l'so... neu und Aus....agen Jnnstchtlteh der zu messenden Dimens ion in ein e Ra ngfolgt, gebracht werden. Die Ska len für konventionelle lind unkon ventionelle Pa rti zipa tion der Politi ral Action Studie (vgl . Burnos ,'I a l. 1U7U) sind Beispiel,' für Cutunan-Skalen. Eine r Cuttman-Skala liegen Ite m s zug ru nde die hi n s k htlich der z u messende n Dime nsion im m er ext re mer werden. d. h. die Dimension 3
:'I lal1 k",lU di,' Slml,·nw,'rt(' sta",l,mlisi"r!'H , i"d"m mall "i", ' .:: -l'm Hsfon " " t i" u (vI'( I. GlpidlUlll'( 10. 13. S _ 2 ~2 ) durchführt . Dip c-wcn cgebcn dh- .-\hwt'ir hung df':; Ska !puwprh>;; pim'S B" fraK\.Pll "uno durd,sdllliu.li
59
5kul i~'1I" !I.welf des Ant wor tmus ters aus der Za hl bejahter Items 18.! Fehler gemacht . ßoi ein er ide alen Gnlt ma n-Ska la würden keine Fehtor auft ret en und unscre Vorhersagegenauigkeit botrüge IOU %. Der Anteil modellkonformer Antworten (= die 1.uliissigell Antwort mus ter] an allen Antworten wird als Rrprod llzierbark ritskorffi zieflt bezeich net. .
Rl'p.
I -
Anzahl de r Fehler :.:::c,:::.:;.;;:.::::.:::::..:. alle A ntworten
Tabelle ;3.:"): G ur tma n Ska la - P olirisr-h e Bet eil igung 1998
nr
UD 1111
' Y{'fl
Fphl('f Befragte
S umme der Fehler
Zllst illllllllllg
:lO % 10% :l %
-
-
+ + +
+ +
+
-
+
-
-
-
+
-
+ -
+ + +
II 1
1 ;j
1 1 2 2
II II II II
,, ,,
1;189 5tl5 Oll 4\
57
11 14 III
57 x 2
+ 11 x 2 + 14 x 2 + 10 x 2 _ 181
B[: Bü rgerinitiative; UI): ungenclnnigte Demons t rat ion: I{B; lI a ushl'sd t,lIlll!:. Bl'l';d zllug: von Fabri ken lind Ämt ern A L LIl US 19!.18. W( 'Str!{'t1tsdw BE'frag\('
Q tld lE ~ :
Anzah l der Fehler Rep. = 1 - -':::::C;;;-,;-::::ii:"",-:;::::-"",-:;-';:,",;:::,,::::::: Anzahl (Irr Br fragtt ·u x Anzahl dn Items Der lb-produvicrbar keirskocftixicnt ist also ein ;" Iab für die Güt e der Skala. Ein nhjektives Kriterium für d it, nOlwendige G rök dip s!'s Koeffizient en existiert nicht. Als Faus t regel hat sich ein Wert von 0.9 - also eine " 0 1'hersag ogen auigkoit von mindestens 90 % - ('ingt' bürw'r t. In unserem Beispiel ergibt steh:
18·1 Rep. = 1 - 211 7 x 3 = 0, 97 Odor a nders ausgedrückt: Im Beispiel lassen sieh 97 % de r Antworren au fgr und der Skalenwer te richtig vorhersagen. Die d rei verwendeten Items sind nach diesem ~ I1ist, "Iit diesem T her mometer er hält ma n keine zuverlässige n :i\ tess wt'rtf' . n l'id l' Uberpnifungsmethodr-n werden a uch im sozlalwlssenschaftlichen Bereich angewendet . zudem ka nn die inte rne Kon sist enz ein es " Ipssinsiru llll'ut ps gf'prii ft werden (vgl. auc h zu neueren " It,t hotlt'n Ros t 2004. 3 76-380 ): • Pa rallelt es t verfah ren • Test-Re test -Verfa h ren
• Interne Konsistenz Belm Paralleltestverfahren wird die Zll \"t'rläs,"iigkl'it d ur ch z\l't'i verschiedcne Messinstr umente gep rüft , d ie d asselbe messen sollen. Je stärke r Iwidl' :i\ leSSlll1gt'n nur einander kor relie ren (\'gl. Ka pite l 7). umsn höher ist dir- Reliabilit ät der :\l pssllngPll. \r pit·ht,u dle E rgl'llllisSf' stark voueinauder a b. dann sind die :1\lt'ssinstHIIIlt'u te nicht roltabol. A llerdings existieren nur s elten vergleichba re (= para llele] :1\ lt'Ssinstrtullt'ut e , Ei n T hermomet er ka nn andere :1\ lpssl' rgt'hn issp produzieren als ein Bim e tall. zumin dest ge.. nauere. BI'i soz ial wisst'lIst"haftlidw ll Fra gest ellungen s tellt sk-h di!'st's Pro... hlem 110ch viel g ra vierende r. So ka nn zum BI'ispit'1 ein Messinst rument fiir ..Xationalstolz- die Fra gt' sein: .Bind Sie stolz. Deutschor zu sein?". Ein a nderes Inst rument könnt e d ip Fra gt> sein: .Slnd Si!' st olz a uf Deut schlan d '!". Die unt erschiedlichen Fra geformulierungen könnten d er Gru nd für unt erschiedliche E rgeb nisse sein. :1\ la n ka n n anz weifel n, on die beiden Fra geu wir klich dasselbe lIH'SSt'tL selbs t wenn man davon a usgeht , dass Iwide
Fragen .Xationalstolz- erfassen. " fit dem Test -Retest- Verfahren wird d it' Reliahlht ä t durch die wiederhol te Anwe ndung d es Xlessiustr uments ge p riift. Führen z\\"l' i na cheinander erfolgte xlessu ngen mit demselben Inst ru men t zu untorsch todlichon E rgeh.. nissen. d an n misst da s xlessinsuumcnt nich t zllH' rlä~ig . Allerdings m uss
63
mall von der Stabilität des wahren I rfft e,~ (i m ehigen Beis piel die Tempera tu r) zwischen den zwei :\lt'ss zeit pullk t\'lI ausgehen . u m untcrschicdficbe ~ [\'SSt'tgf'bll isst' auf cHI' man gt' hul e Rr liah ilität de s lns t ruun-nn -s zurückführen zu könn en. Auf rlas ß l'ispi r l der :\!\,s,s ung von ,S a tio na lstoll' angrwendet, h i .,~p d n-s. dass die Fra ge .Sind S ie slolz, Deut scher zu soin" reliabel misst, wenn die An two rt en ZII unt orschiedllchen Zeitpunkten be i densel hcn Befragt en hoch miteinander kor relieren. Yo rall sgese tzt. der Nationalstolz hat sich zwischen boiden Zeit punkte n nich t ver ändert . UIIl dies zu ge wä hrlf'b l en, kan n ma n clie lwiclpil :\[f's,s llIlgpn Illiiglk hst z!'it llah durchfuhren. Erinnern sk-h d ie Befragten an ihr!' erxte Antwort und versuchen sie, mög lichst iiborelnsrimmond 7.1I a nt worten, dann wird d ie Hplia], ilitä t dos Inst rumen ts a llerdin gs überschätzt. Am IWSt1'll lässt s ieh die Reliabili t ät iihrrpriif(' ll. wen nein Messinst rumen t a us meh reren l ndik a tou-n besteht , die alle dieselbe Dimension messen solle n - SI) wie PS beis piels weise bei den oben genannte n vier l ndika tnreu zur ~ !1'S.HlIlIg ansländerfeindlicher Eiust cllungen a ns dem ALLßUS 200ü der Fall iSI. ß esteh t das Instrument aus meh reren Ind ika to ren , dan n ka nn die in t e r n e Ko n s is te nz der Ein zelmessungen iihprpriift worde n. Zur Ülwrpriifung der internon Konsist enz wird meistens Cronbachs (l verwendet , dessen Berechnung aber ebenfa lls intervallskaliorte hulikato ren vorausSI, tZ !. Der " 'f'rt von (l is t abhä ng ig von der mir tleren l ntor korrolatto» der Item s und der Za hl der Items. Je mehr ltems in die ß cn-chncn g t'inHieN'lI, umso höher ist Crouha ehs (l bei gleicher mittlen-r Inte r korrelat to n. Cronbachs (l so llt e gröjcr als 0,8 sein , in empirischen Analysen werden aber a uch geringere " 'erle akz ept iert (vgl. die Beispieh- bei Diek man n 2008,
2G4). Cronbachs 0 b\'t rä gt lär die vier ALLß US- h (' IllS O,Ü8 (Tabelle 3,2)." 111 rlen Zeilen der Ein velitems finden sich vurlom 1I0d l die \\'('rlE' von Cronbachs 0 , we nn das jeweilige Itr-m nicht in die Berechnung der Ska la eingingt', Xlan sieht , da ss die Relia bilitä t ein Skala ohne das l tem Lebensstila npassung
5
m- Formel zu r Hcrochuuug laut et : n =
--s- (1 I'
,
~ ) , P ist diI\(!Pt werden , heim Tes t- Retest- Verfah re n muss stehe-rgeste llt sein, dass der wah re \ \,pr t unverändert gehlleben ist. Zur Überprüfung der internen Kons isten z benötig t ma n keim' der beiden A n nahmen . Dips ist einer der ll aupt corteile, die flip ~ 1f'Ssll ng einer Dimension durc h mehrere Indi ka roren mit sich bringt.
3. 4.2 Validität \riillrPlIfj si1I technischen Aspek t etuer zieht, Iw t rilft dir Validität den inhaltlirhen Aspekt.
~ I pssun g
b('-
Am Beis piel d er P arteiident ifika t ion soll die Validität einer :\fr>ssllng \"('1'deu tficht werden (vgl. bereits Falter l !Jii), Unter der P arteiideutifikation wird in der \rahl fol'SchulIg eine la ngfristig stabile, p.~yd lOl ogi sdlt' Bindung a n eine Part pi verstanden (vgl. Campbell I't aI. 1980, 121), Die Par telidentiti kation wird in der Bundesrepublik d urch folgende Fra ge gemessen: ,,\ 'if>ll' Leute 1lI'ig\'11 in 111' 1' Bundesrepublik längere Zl it einer lx-st immten Pa rtei zu. obwohl sif> a uch a b u nd zu eine a ndere Part ..i \\'äh ll'lI, \\'il' ist da s bei I1l1l1'n : I\'pigpn Sie - ga nz allgemein gpsp rod H'1l - et nor bosr immteu Partot zu'! W"nn j a, welcher?-. Diese Frage so l1 la ngfrist igp Bindungen i111 eine Pa rtei messen, nicht a ber dio \\'i1hlabsicht . was in der Fra gt>durch den Zusat z "ohwohl sie a uch a b lind zu eine a ndere Pa rtei wählen- verdeutlicht wird , .\nd l'rIJ s ieh die An ga be n zur Fra ge d er Pa r teiidemifika rion hä ufig, dan n t1lPSSl'lI wir nicht mehr nur da s , was wir mes sen wollt e n (Iangfris tig l' Bindungen ], MJIld\'1"II zusä t zlich etwas anderes (k urzfris t ige P rä fere nzen ]. Nimmt IJ\'ispif>1s\I'pisp der Antei l de r Befragt en mit Pa rtettdenuftka uon in Wahljahren deutlich zu, da nn is t dles " in Ind iz d a fü r, d a ss mit di t's\'r Fra ge au ch kurzfris tige P räferenzen g\'nWSSI'Il worden . d a in \\'a hlk1l.lllpfzpit pll d i\' politische Mobilisierung de r Bürger steig t . Zu r Übe rprüfun g der Stabili tä t de I' Part eiidenti fikat ion sind Informat ionen über individuelle Ver änder ungell llotw{'u d ig. d .11. ma n benötigt Pa m-l- oder Ereignisda ten (l\a pit l'l 2...l ), 111 Deutschl and wird die Pa rteiident if ikation im Sozio-ö konomisrhen Panel erhoben. Die Analyse \'( J11 Schmit t- Beck Pt al. (200G) deutet a uf erhebliehe
Flukt ua t ionen in de n Pa rteiidon tlfikarkmen der Befragten übe r einen Zeitraum von 18 Jahren hi n. Mit dem SOEP lässt sich leider nicht prüfe n, ob die Pa rteiid ent ifikation - wie theorerisrh erwartet werden kann - st abiler ist als die Wahlabsicht und d ieser ta tsächlich zeitlich vora usgeht . woil dte Wahlabsteht nicht erhoben wird . An dk-sem Betspiel lässt sleh auch zeigen. dass die Validit ä t VO ll d e r R eliabili t ä t a bhängt , n icht j edo ch u m gekehr t d ie R eliabilit ät von d e r Va lid ität. Unsere :\1f'SSllng kann nämlich seh r zuwrlässig sein . wenn etwa kurzfrist ige Schwankungen in den Pa rteiprä ferenzen durch die Fragl' der Pa rteiidou ti fikation exa kt reg tstrtert lind , 7. \ras bedeuten die ß f'gr ilfl> Rf'IItY/(l lltierblH"kei l sl.:oejfizi ell t und ltetnA nal Y8e, lind in welchem Zusammenhang werden dic~c' gebraucht?
AuJ!J" oclI
ti!l
8. SiE' haben elnnoues Messinstrument zur Me-sung von Aus länderfei ndlichkeit entwickelt . Dieses führt bei wiederholtet Anwendung zu stahilen Ergehnissen. Zudem korreliert das IIt'lI I'lltwi(:kl'ltf' ~ Il'ssinstrn ment stark mi t ein er - bereits bewährten - Skala zur ~kSSllllg nlll Ausländerfeiudlh-hkeit. Deutr-n diPSE' Hesultate darauf hin. dass Ihr Messinstrument n-lialu-l. valide oller beides ist'? Begründ en Sie Ihre Antwort.
4 Erhebungsmethoden 4. 1 Befragung 4.2 Beobachtung 4.3 lnhaltsaualyse
71 91 96
In diesem Ka pite l gebt es darum . au f welche Ar t und \rpist' milli sich Infonuattonon über einen Ausschnitt der sozialen Hpa lil ä t beschaffen kann. \ \'0111'11 wir beis pir.lsweise wissen, wir' stark Fremdenfeindliche Tondonzen in der Polizei vertreten sind. so könnten wir Polizi st en befragen [vgl. Mletzko lind \ \'('ins 1999 ), wir könnten ab er auc h das vcrbulton von Polizisten gegenüber Ausländern un d Deutscheu in verschiedeneu Situationen (7. R bei Demonst ra t ionen] beobachten und darans Riicks Situation da r. VOII I'ÜWIll altt äglkheu Gl'Sprä rh 1111torscheidet sich ein Inte rview dadurch. da ss eine Pers ou {der Interviewe r] nur fragt , während die andere Perso n - einmal ab gesehen von Verständnisfragen - nu r an tworte t. Das ..Ges präch' hat da mit einen stark asym merrlsehen Charakter, Zudem soll die Befragun gsperson einem völlig fremden Menschen zum Teil sehr pl'rsüll lk hl' Oillgp IU"pisgl'lll'll . D ip Antworten sind also kt'ilu' an s ieh schon vorhandenen lnfonuationeu. sondern werden du rch da s Int erview ers t erzeugt. Aus diesem Grund wird d ie Bofragungsslt uati on auch als Stimulus-Response - oder Iiciz-Reattians-Schcma bezeichnet: Dip Fra ge ist der (kiinstl id lt') Rc'iz, di(' Antwort d ie (küns tliche] Rea ktion. Daher ist die Befragun g auch ein reaktives Xlessver fahren . d. h. die Da te n werden durch da s xlossinstrumcnt - die Befragun g - beein flusst . :\[it der Reaktivit ät von Befragungen sind vor allem zwei methodische P robleme verbunden: d if' Tendenz von Befragten. sozial erwtlnsr-ht zu a ntworten. und d ip Tendenz, Anssagen ullahhän gig von ihrem Inhalt zuzustimmen. Sozial erwünscht es Antwort verhalten (,;;oC"i al desirabilit y''] lit'gt vot , wenn die An twor t in Richtung der vermeint lieh vorn Interviewer IlZW " der Gr-e-llscha ft als posit iv b('wprl pll'n Antwort (dem Ort snziulcr Erwiillsrhtheit ) verzerrt ist. Dips wäre r, ß . der Fall, wenn ein Befragter vorhandene Irerndenfeindliche Eins tell un gen nicht ä ll ~(']"t oder abschwächt . weil r-r solehe Eins tellungen als unerwünscht an sieht. Eine Erklä rung sieht (li!' Ursache im Streben von Befragten nach sozial!'r Anerkennung. Bei einr-r wahre n (sozia l unerwiinxr-ht en] Antwor t entstehen für den Befragten durch den \ 'erzk-ht auf sozia[1' Anerkennung Kosten. die er durch so zial als erwünselu a ngt's;>hl' llf' Antworten vermeiden kann (vgl. Reinecke 1991)" Ant wortverzer rungen durch Soz iale Erw ünscht h eit sollte n vor allem lx-i sensiblen Fragen - Fragen, die dem Befragt en un an genehm sin d - und bei Pcrs oneu mit einem hohen Bed ürfnis nac h sozi aler Anerke nnun g sta rk ausgepr ägt sr-i n. Die gesa mte Vorurt eilsforschung ist mi t de m P roblem soxialcr Erwünschtheit konfrontiert . So wurden in den USA Zweifel a n der in Umfragen gemessenen Abnahme VOl l Vorurteilen gegPlliiht>r de r schwarZl'll ßI'\"ülkl'l"lIn g nach dem ZWl'itf' lI \r('ltkril'g lall t. Vermutet wurde. dass nicht die Vorurteile abgenom men ha tten, sondern led iglic h die Au~p run g von Vorur te ilen zurückgega ngen soi. weil die Akzept a nz von Vorurteilen
gegenüber der srhwarzon Bevölker un g ger inger sE'i als noch einige .Iahrzehnte zuvor (vgl. Dovidio lind C aert ner 19SG). Zur Vermeid ung oder Ab-chwächung soz ial erwünschten Antwortverbalsollten diE' FIngen möglichs t Tl ellt7l11 formuliert sein. Dami t versucht man die Rmktivitiit rle,~ Messinst ,.mn wtc.~ abzusr-hwärhen. In den USA wurden zusätzlk-h Zll den traditionellen Skalen zur ~lpssllll g vrm offenen Vorurteilr-n (hlatant prejudicu] Skalen en twk-kelt, dle wen iger reaktiv sei n sollen und auch subtilere Vorur teile er fass en (s ubtil' prt·j llf!ic('). Eint, andere St rategie besteht darin. die Anonymi tät der ß efru gun gssituat .i on zu erhöhen. Im ALLOUS 200G wurde ditoAnotlymitä t de r Befragung IlI'ipinigl'll Itoms zur Einstellung gegenübe r Ausländern (vgl. Abbildung 3.2, S. .19 ) für eine n zufällig ansgewählten TI'i! der Befragten erhöht. Dip Antworten wurden bei diesen Befragten nicht vom Interviewer erhoben. Vielmehr haben die Befragten ihre Antwort ru selbst (und für den ln rervlowe r nicht kontrollierba r] im Co mputer eingegeben (CASI-Sp[it, vgl. S. 23). Xlan sollte erwarten, dass sozia le Erwünschtheu hpi eigener Eiugube der Ant werten eine geri ngere Rolle s pielt als bei Abfr age dur ch den I nter viewer . Ankerdem k:lUII man sozial" Erwüuschthelt direkt ülu-r Sk:l11'1l erfassen (vgl. Rotnecke 1991). Dip Skalen beruhen auf der Annahme, dass sozial erwünschtes Antwortverhalten a us dem Bedürfnis der Befru gt eu nach sozial pr Anerkennung res ultiert . Im ALLOUS ZOOG wurde eine Kurzfo rm der deutschen Fassung der Marlowo-Crowne-Skala mi t zehn Items verwendet. OE'!· Elnffuss des Bedür fntssos nach sozialer Anerkennung a uf das Antwortvorhalten kann mit diesen Skalen direk t geprüft IW'H!en . t l'IIS
:\Iit z ustt m m uu gst e udena [Akquicsscux} ode r ..Ja-Sage- Tendenz- wird ein Verhalten von Befragten IWSl·hril'lwn, einer Frage unabhängig von ihrem Inhalt zuzustimmen. Zusthntuungsteudenzen lassen sich prüfen. wenn mehrere, negativ und posit iv for mulierte l t ems zur Mess ung einer Dirnensicn ver wand t I\"('H!('II. Befragt e, die negativ formulierten Items zustlmmen . sollten positiv fonnulk-r tc Itcms ablohnen und umgekehrt. ß -fragte, die s ieh unabhä ngig von de r Polung der Fra gt' immer zustimmend äubt'rtI. a nt wor ten unplausilx-l und können gegeb enenfalls aus der Alla lys!' ausgeschlossen \1·t' rIII'H , Die Zuxti uunungstendenz ist ein S pl'z ialfa ll eines response rezs. Rl'pollse s rt,~ hezeichnen allgemein die Xeignug von Befragten , Ite tns unabhä ngig von EI.'r zu IIwssl'udl'n Dimension in einer \lI'stillltll lt'n Art und \ \,pist' zu beantworten. Dazu zählen die Bevorzug ung oOP]" \ 'prnu-idung der Mit telkategorie 1'\)('IIS0 wie eine Prä ferenz für die Extremka-
lk f rugu H.'I
tcgoricn. Zur Kontrolle von Res ponse- Sets können in einem ersten Schritt die Ant wor t muste r der Befragt en ausgewertet werden. Selbst wenn de r ß efm gH' gewillt is t, korrekt Auskunft zu geben. lassen sich ~t l'ssfl' h l er nicht gällidi l"h vermeiden . "I. ß . aufg ruud von Erinnerungsfeblem. Allgotuvin kann mall rlavon ausgehen. dass Fragen zu demograph isrh en und biog raph ischen Mer km alen (Goschlochr , Ausbildung, Eintritt in eine Pa r tei. llei mt USII" . ) korrekter beantwortet 1I"1'[(I('n als Fragen zu m Verhalten {z. B. Teilnahme an Demcnst rationeu] lind diese wich-rum
korrekter als Fragen zn Einsu' Hungen ( ~ It'illll n g 1111ll Se-hwangerschafrsabbrurh. Parteildent ifi kat ion nsw.). wpi! demographische uud hiog rap hisdlf' Faktr-n dem Befragten st'lbst eher bp\\'llss t und \\"I'lligpr Hilchtig sind als \ e rhalteil und vor allem Einstellu ngen. Eine rotrospekt iw Frage nar-h III'Ill J ahr der EhpS('hlil'bung dürften die morsten Verheira t eren eiulgermaken korrekt beantworten. Es ist dahor nicht sinnvoll, weit zu riid di l'g{'lIClt, Einstellunge n mi t retrospektiven Fra ge n zu erfassen.
4.1.1 Formen de r Befragun g \ '011 ß efraguug sprechen. meinen wir in (Irr Rpgpl dip ntandardisierte bxw. quantit ativ e ß efmg ullg. 111 ihr ist der Verlauf dos Interviews du rch d ie exak te Formulierun g un d gena ue Abfolge der Fragen fcstg eleg t ., Ab\\'I'id l1lngf'1l davon sind nich t zulässig . Sind die Fra gen und / od er der Ahlanf der ß pfragllllg nicht fixiert . dann spricht mall von einer nicht standardisicrteti bzw. qualitativen fl rf m gung (vgl . Bortz und Dönng 20tlG. J()8- 321). Dip Grenzen zwischen beiden Fennr-n sind fli('h(>ml. Es kan n sieh bei eine r nicht-standardisierten Befrag un g z. n. II Ill ein Lcitfadellge'~lm"ich han deln . lwi dem der Interviewer nur eine Liste WlII T hemen hat , die er in beliebiger Reihenfelge a barbeit en krgissl man eme Fragt' zu st ellen. rlil' für den Untersur-lnmgszweck relevant ist. Xathträglieh kann ein solcher Fehler nicht mehr behoben werden. :\lan sollte s ieh deshal b vor der Entwicklung des Fragebogens nicht nur da rüber im Klaren sein. was ma n erklären will (z. B. fromdoufetndt fcho Etnstellungon \ '011 Polizisten), soudem s ich auc h gena u üborlegcu. welche Faktoren die abhä ngige Vari abl e beeinflussen könnt en (z. n. dieusülche Bolast unge n. da s Einxatzgohiet . die polirische Einst ellung. (!as Alter Oller da s Ocschlecht der Polixcibcamu-n ). \ reib man , welche Aspekt e er fasst werden solle n, SlI kau n man sich a n die Formulierung rler Fragen wagen un d schlil' b1i("h de n Fragebogen zusammonstollen. Boi der Formulierung der Frage n sollte ma n dip im Folgenden gen a nnt en As pek te herürksichtigeu (vgl. CIl[I\'I'(1;e lind Presser 1986: Sudman 1982).
4.1.2 Die Fragen Dip A 'ugejormlllienmg(,1! und die A ntw07t m iigli('hkcit cn prä gen da s Antwortverhalten der Befragten entscheidend {vgl. Sehnman und P resser 199ü). Aus diesem G rund sollte ma ll sieh bei der l nrer pn-ta tion von Umfrageer gebn iSSl'1I nicht 11m d ie \ 'cr tei Inng de r Ant wonen. sondern alieh d ie gt>stf'llten Fragen gerrau a nschauen. So stimmten in einer im Herbst 1995 durchgeführten Umfrage unter den Mltgliedem der rheinland-pfälzischen SPD erstaunliehe 7.t % der Befragten einem La usehang riff zu (Ka teg orien .•stimme HIli lind ga n z zu" 11m! .stimme eher zu"}, wie m a ll einer Er gcbni-dokumcntutk.n 1' IJIIH'h nw!l kan n. Dieses Ergebnis ist weit weniger erstaunlich. wenn man d ie - in der erwähnten Ergebnisdokr uuentution nicht berichtete - Frageformulierung berücksichtigt . Si!' la utete: .Bei der Verfolgung besonders sehwerer Straftaten soll das rechtsstaatlich gerege!to Abhören des gesproe!wlJ('lI \ rort l's zu Beweiszwecken verwenrk-t werrlon dürfen {sog . Lanschangr ttt ).': Dte Einschränkung au f .hesonders schwere
lkfruguH.'I
77
St raftaten' und der verweis a uf dio Recht sst aa tlu-hkeit des Verfa hren s trug sicher zu dieser ho hen Zust immung bei. I1I' i den meis ten Fr agen kann man die Antworten in eine WiE' a uch immer gpwünschtp Richtung beeinflussen. In manchen F älle n scheinen di p .Frager ' \\'Plligpr a n den tat sächlichen Meinungen. Einstellungen oder \ 'I'rha ltens -veisen der befrag te n P P I"SO UP ll interessiert zu soln als an einer 11estä ngung besti mmt er Posit ionen. Die Ergebnisse einer Umfrage könn en da nn x. B. in der politisrhen Ausein auderset zuug ZU I" Stützu ng d(~ cigc111'11 Sta ndpun ktes herangezogen werden (vgl. Dick ma nn 2008 , 4G8f. ). Regeln zur Frageformulierung
In wissenschafrlk-ln-n Umfragen spipl!:' n lJ(-'wus.~tp :-'lalli pll latiOllPn (in de r Regel) keine Rolle. ß l>i 11"1" P uhllka tion wissens chafthcher El"gel lllissp auf Basis von Umfragedat en worrlon d!e Formulierungen der Fragen hä utig m it veröffentlicht . Durch off unslehr llch oinseitig gestell t t' Fragen würde der \r issPJlsehaft1t'r die Glau bwürdigkeit seiner Erge bnisse von Vorn herr-in in Fra ge 1:;(('111'11. Unbeabsichtigt schleichen sieh da gegeu in jeder Umfrage Fonnullerungen ein. d ip sich au f das Antwo rtve rhalt en a uswirken. IIält ma n sieh an einige G rund regeln. kann man jedorh schwerwiegende Fehler vermeiden. Gene rell sollten die Fragen so formuliert sein. dass sil' den Befragten nicht ühe rfordem. Das l)('ibt : • kurze Fragen s tellen . • einfache und allgonn-invcrst äud hche ß cgriffo und Formul ier ungen ver.. wenden. • konk rete Dinge an sprechen. • eindeuüge Begr iffe henntzcn , • (doppelte) Vememungen (l\" pga t ioIlPn) verm eid en . • keine Suggestivfrage n st ellen. lind • keine mohrdimensionalen Fragen vorwenden. In der Frage sollten - wen n möglich - bereits all e Autwort aln-ma riven ..ausformuliert- sein, dami t keine Antwortalternative d ur ch dip XPIIIl1Ing in de r Fragt' bevorzugt wird. Soldll' Fr agen \\"(']"(1('11 a uch als "lmla lll·jn !t"·
Fragen bez eichnet. Es lässt sieh nä mlich zeigen, dass die Antwortalt emat tvo, die in der Fra gt' en th alten iSI, de ut lich meh r Zustimmung er häl t als r-iungenannte Anrwortalremative (vgl. die Beispiele bei Xocllc-Xeumann und Pet ersen 19%. 1:31 f. und 19,)1f.). Balanciert e Fragen sind natürlich nur he-i einer gl'ringt'tl Zah l VOll Aurworralternativen llIüAlic:h. Will man die Zustimmung oder A blehnung zu einer Posit ion messen. wie ps r. ß. bei Likert-Skalen der Fall ist, dann können keine "lmla udprten" Fonnulle-
1]('
rungen verwendet werden.
Man kan n vermuten. dass dip nhen genannten Antwor ten rler rheinlandpfälz isdwlI SP O-:-'litglil'{ll'r zum "g rok n La uschangriff" anders ausgefalII'n wären, wenn eiue ba hm t:ir rtf' Frage formuliert worden wäre. t>twa in dpr Art: ..Sind Sie der :-' Ieinung, dass bei der Verfolgung Iwso ndl' rs Sd lWPrer St raftat en das Abhören c\1'S gpsprodl('llrll \r ort l';; zu Bowetszweckou verwendet werden da rf oder sind Si!' der Xleinung, d ass bei der Verfotgung lx-sonders schwerer Straft at eu das Abhören des gesprochenen We rt os n icht verwendet werden darf". Als Antwortka tegorien könnt e man vorgeIWII ••sollt e nicht verwendet werden" und .•soll te ver wendet wr-rdr-n". Eine Skala von .•stimme stark zu" bis .Ielme stark ah- ist hier nicht mehr möglich, da die Frage ja mehrere Pos it ione n e nthält . Da rau f, dass die Schärfe der Formulierung ("b,'Sollllt'Th schwere Straftaten"] das Antwortverhalten hl'{';nlillssl, wnnle hnt'ils hingewiesen. G"llerpll gilt, dass dir- Fra ge n so kurz wie möglic h sein sollten. dami t der Befra gt e a m Ende des Satzes a uch noch weib. worum es geht. Dies ist bei mündl iche n un d telefonisch durchgefüh rten Int erviews wichtiger ab bei sch riftlichen Befragungen. in denen der Befragt e d ie :\Iög lichkt'it ha t, sich die Frage mehrmals d urchzulesen. \r icht ig ist Iwi bevölkerungsweiten Umfragen aurh , dass mall einfache und allgem ein ncrstiir ullichc ß egriffe vorwendet lind Fre md wörte r vermeidot , da man nicht bei allen Befragten von einem gtetch groson Wor tschatz ausgehen kann: Statt ..pa rt toll- schreibt man also besxer .jeilweiso'', und vers t ändlicher als , ~-\pplikatio ll" ist sieher .An wondung- . Versteht ein Befrng tor die Fra gt' nit-ht. , so besteht die Gefah r, dass er einfach irgendetwas ankreuzt oder die Antwort verweigert . Vor dieser Unannehmlichkeit kann man d if' Befragten in der Rpgt'1 uhuf' griii.t'rt> Probleme lx-wahr en. Die Sprache sollte der Ziplgruppt' der Unters uchung an ge messe n sein. Schon schwieriger ist die' Forderun g. nur nach konkret en Dingen zu fragen. d . h. abs trakte ßl'grifft' zu vormetden. In Umfragen findet sich z. ß .
lk f rugu H.'I
79
häufig die Fra gt' ..W it, zufrieden sind Sie mit der Demokratie?". Hier kann ma n den Antworten nich t viel abgewinnen . d a man nicht so gcnau \\"{'ii.. W fragt pr da rf sich 1I11l' in einer dpr vorgegf'lw tWII Ka tf'goril'lI wirxlerfimlen , d. h. die Ant wort möglichkeiten dürfen sich nir-ht überlappen. Bei IIfcJl,j arhalllwOIt ell wird den Befrngt en die ~ liigl kh kp il eingeräumt . mehrere Ka tegorien a nzuk reuz en . Dips steht nur sch einbar im ,r idt'fspnu-h zum P rinzip. dass sich die Ant wor talt cruat lven gegenseitig aussch lieN.'1I müssen. da hier mehrere Fra gen in einer Frage ( llJ(' i~ t a us Pl a tzgründen] zllsa mllll' llgpfilss t werden. ;"I it der in A bbildung 4. 2 da rgest plltPII Frage werrh-n ? B. Vereiusnutgtiedsrhaften ermit telt . Hier sind mehrore Nennungen möglich . Kreuzt ein Befragter ein Kästeheu a n, dan n 1)('deutet dies, da ss er ..~ li tglit'(I·· in einem bestlnuun-m Vereins typ iSI; wird nicht s a ngl:' krt' uzt . heil.t d it's, der Befragte ist .kein ~ litgli l'( I " . Diese Iwide n Antwort möglic hkeit en für jeden genan nten P unkt [hier: \ 'p rPi n ~l y p ) sehliPN' n s ieh als o gegenseitig a us. Dip ein zelnen Ant werten mÜSS1'1l jeweils als l'igPIlI' Ve rf able kodie rt werden. Als Ergebn is dies er Fra ge erh ält mall fiinf Variablen m it jeweils zwei Antworunö gfichkeitcn. Schnell 1'1 al. (20U8. :33:3 f.) sehl agpn zu r Feh le tvermeid ung vor, j ewei ls beide .-\ntwort mögl ichketten vor zugeben. In Abbildung 4.2 mü sst en pro Verein also j ('\\'Pi!s zwei Kästchen \'orgpgt'lwil werden , die mit ,, ~ li t gli l'( l" hzw. .kein ;"litglil'(I" 1)('schrtftet werden müssten.
Ein e besondere Form gesr-hlossencr Antwortkategorien sind Rat ing. For ma te, wie sie auch für die berei ts mehrfach verwendeten Aussagen zur ~ fpsSU llg ausländerfeindlicher Ei nstellungen im A LLß US 200ü verwendet wur den (Abbild ung ·C 3). Bei Rat ing-Formaten kön nen ßeffllgte lhre Beurteilung in a hgest ufte r For m vor nehmen (YnJ nlTlde Anrwor talteruar iven]. ßei den Al. Lß lj g- It ems wurde olne siPi,,'nstufigt', bi ,JO[lIre S ka la von stimme iiberh lJll1Jt nicht zu - 1 - bis sti m me voll und ganz zu - i - verwendet . ~ I i t der Zuord nun g de r Zah len wird hezweckt , dass die Abst ände zwischen den Skalenpun kten von den Befra gten als gleich
Befmyull.'l
Abbildung 4 2: Frage mit Mehrfachantworte n Sind Sie Mitg lied eines Vere ins? (Mehrfa chnennun gen möglich) 0 0 0 0 0
Gesa ngverein Sportverein Heimatverein Caritativer Verein Ande rer Verein
interpret iert werden und die Itoms da mit a uf Int ervn llskaleu niveau mesSI'II, Oil'se Ann ahme ist prüfba r {vgl. Rost 2UU4 ). Häu tig werden auc h fün fstufig e Antwortalternativeu verwendet . Die Za hl de r Antwort s tufen hängt davon ab , in welcln-r Differeuziertl u-it ma ll \'011 den Befragten eine Beurteilung erwarten kann. Die vorhandene Präfe re nz für Ra uug-For ma tc in Umfragen hän gt a uch da mi t zusammen. dass m it der Unt ers tellung gleicher Abstä nde vwische u den Skalenpun kten die Auswertung der Da ten vereinfacht wird. Abblldung 4.:3: Rating- For mat mi t sil'lH'lI Stufen Stim me Oberhau pt nic ht zu
,
St imme
,
1 2
, 3
~
vo ll und ga nz zu
,
;
,
6
7
Diskur ier t wird , oh mall eine gerad e oder - wir' im Ol'is pil:'l - ungeralle Za hl von Alltwort katf'gorie ll vorgibr . Bei gerader Zahl der Ka tegor t-u existiert h'ifll' mittlere Positio n; wodurch die Of'fragt f'll Zl1 einer Poslt ionierung in Hk-htung einer der beirlon Enden der S kala gezwungen werden. Für d ie Vorgabo eln or mlttb-ron Ka tegorie spr icht, dass man kognitiv sehr wohl " im' neu t ral e Position einnehmen kann. Xachtcilig wirkt ex sich allerd i ngs a us. wen Tl Befra gt r- d i(' mi tt IN!' 1\ategorie \\"iihlen, um 11usz udtücken , rlass sie keine Posi tio n zu rliescm ltem einnehmen. 111 diesem Fall miss t mall Pse udo..Metnungen ( Jlsewlo- opinio 71.~) . Durch die explizite Vorga be etnor ,,\Ye ib- nicht "- Ka tl'gor ip (vg l. das Bl'i spit'1 in A bbildung 4 .1) fü r ~l l'i-
nungslcsigkcit (non-attitude ), kann man dies verhindern. Dto ,.\\"eib-llicht"Ka te gorie sollte bei mehreren geordneten Anrwortnlrcrnarivon auf kein en Fa ll als Mittelkategorie verwendet werden. Ohne get re nnte Er fassung der ..\ \"t'il>-nidl t"-Ant \\"ort l'n kann man bpi der Auswertu ng de r Daten auch nicht mehr feststelh-n, ob t'i ue fehlende iII halt 1k-he Auga1)1' a 11 f ~ [ei unugslosigkolt (n on-atti tIJde ) ode r Antwortvorweige run g ( item-,w ll- f"esl'm~~e) 1)('ru ht. Es ist natürlich auch möglich. Befra gte ohne ~I "i llun g zu filtern. Zunächst wird dann gefrag t , ob eine ~kinung zu einem konkret en T I\{'um vorhanden ist. Ledi glich den Befra gten mi t eine r ~ Ie illlln g werden die Antworten vorgelegt . Eine Filte rführung für xlcinungslosigkeit zeig t den ß E'frag tell d ie {,l>git il1lilä t e iner solchen ß t'a utwort llug noch (It'lltlidwl" als eine Antwortkategorie "weil> nicht" (vgl. Sehnoll 1'1 al. 2008. 337). Andererseits InUS." be fürchtet werden. dass ~fpi llu1Jgsl osiv;k"i t durch einen Filter üherschä t at wird . Dor Fi lter s" IIJS t mag als Hin wels auf ein e S(·hwit'rigl' folgende Fra gt' interpretiert worden und auch ßt'frag tl>, Ilil' eine l\ll'iuuug haben. zu einer ,.\ \""ib-uieht"- Ant wor t lx-wegen. Die wahl der Antwortkategorien bestimmt das Mess niwe u lind damit die 7llIäs."i gl'lI Auswertungsverfahren. Gibt ma n a uf dip Frage .Sollte man Ihr er Melnung nach d ir- doPW111' St aatsbürgerschaft e rla uben oder solltc ma n die doppelte St ua tsbiirgerschaft nicht erlauben?' die Antwortaltemativen ,.';ol1te mall e rla ub r-n-, .sollte man nicht erlauben- und .,weit nicht" vor. da nu ist die Variable nominal skaliert , Ma n hä tt e aber auc h eine fünfstufige Antwortskala von .st imme \"011 und ga ll1. zu" bis .Iohne \·011 und ga nz ab- ab Antwortalternative wählen können. wobe i die Fra ge dann nur noch eine der beiden Positionen enthalten kann . etwa: .Dio doppelte Staat sbürgerschaft sollte erla ubt werden". Dieses Merk ma l wäre
ordlnal skaliert. 4.1.3 Der Frageb ogen Xach der Formulierung 11t'1" einzelnen Fragen muss iiJlt'r deren Anordnung im Fra gebogen nach gedach t werden. Nich t S,,!t I' 1I \1"('fllf' ..\.2: Interviewdauer hl'i AL LBUS- Umfragt'lI ~ li ll llten
20 bis 39 40 his 59 GO bis 74 75 his 99 mehr als 100 keine Angabe
(Befragte]
199..\
li %
..\-t % 22 % 12 %
2% 4% 1UU% (3..\50)
1998
9% 5..\ % 25 % 9%
1%
2% 10U %
(32341
Filtcrfruy cli dieneu dazu . das Interview ahzukflrzen. wenn auf den BI'fragten bes timmte Fragen nicht zutreffen. Fragen zum Ehepart ner kÖlIIlI'lI Iwispielswrisf' übersprungen worden , IH'Hn der Befra gt e nicht verheiratet ist. Ein Beis pie l für eim- Filter frage ist die Pa rteiident ifikation (vgl. ..-\Ir hilelling ..\A ). mit der eine la ngfrist ig st a bile psyd lOlogisd lt' Bind ung a n eine Pa rt ei gelllcsSI'n werden soll. Der Befragte soll zunächs t augobon, o b er überhaupt einer Pa rtr i zuneigt (Fr a ge 3D in Abbildung 4...\) . W it' man an hand der Angaben für den l ntervlowor am recht en Ra nd des Fragebegens sehen kann . geht de r Befragte bei ein er "Ja"-Ant wor t auf Fragt' 31. wo er die Pa rtpi angeben soll. verneint er die Fragt' :.m. sp ringt er da gcgcu au f Frag!' 32. In mün dlich en lind tel efonischen Befragungen lassen skh meh r und komph-xcre Filter einsetzen , da dioso Befragungen von In tervie we rn du rchgeführt werden, die dafür gesch ult sind. In SI'hriftlidl('1I Umfragen sollte dagegen mit F iltern sparsam umgegan gen werden. SiE' sollte n d un-h den Befr agten leicht ua chvolb-iehbar sein un d du rch ein enrspn-chendes Layou t des Fragebogens un ters tützt werde n. Der ALLOUS 1!)!)O, dem wir 11ll Sl ' H ' Bl'ispil'll' ent nommenhaben. wurde mündlich du rchg eführ t. Computergestützt f' ß pfragulIgPIl (a uch \\"eh-Sllr\"pYs ) erla uben den Einsatz komplexer Filter , weil d ie Software die Filterführung übernimmt. Vor &stwnml.... _ ....1
31 .
--
. . . _...-.
p."",
Noon •. , ... ,
,.,...
h>om;
_t/'>60 -
.
s-o Soll ..... 1>01I&"""'" "OCh, "_ p...... _; , 1~·",
••-!!.0' ' 000" .-.".-.-.-. -. ~ c c , o o, o " , . Q : :~ . !~ _
__ .·no".&8o
0"
. • • . . , .• ,
0-
~.
D;oGo-..-
'"
_ _ . .. . . • . • • .
.
~
SEW .. .. . .•.•••.•..•
-
D;o!'lopullllk_
. . . . .• , _
_ . _.und """
32 _
'lun '" """'"'~,...-...Thoomo
_s;,, _ _ """ ... "' ..........
D'
0-
00-
O·
~-,
gf>ns wichtig. Eine ülwrsithtli d w Gl'stalt llllg erleieluer t das Ausfüllen rles Fra gplmgf'lIs. Bei der PI'fSiilllichl'1l uurl telefonischen Befragun g spil'lt das Layo ut dagegen keine so grob!> Rolle, da (Ir r Inte rviewe r sich '·0 1" dor Befragung mi t rlem Pra gl'ho gl'll (in gedruckt er oder ele ktronischer Form) vert raut machen kann.
O b d ie Befra gten m it den Fragen un d dem Fragebogen zun-rht konmn-n. wird mi t Pn:te.~tn gl'tf'slf't werden. Dab f'i zeigt sich. oll tlie Filterflihrung und Kodierung der Variablen Iunk t ionlort , wolcho Fragon Xachfragen der Befragten verursachen, wie hoch die Antwortverweigerung ist , ob die Ant wer ten der Befragten variieren US\\', Die Süchprol»- sollte a us reh-hond grob sein. u m solche Probleme ft'StwSIt' I\n ktlnst.lk-he Beobachtungen. d. h. Hit, weisen nur eine geringe externe Validitä t auf. Dies e Unt ersdlt'id ungHkr it t'ri pnl aH,>wn sieh nun au f vielfältige Ar t lind \ \'t' izu unterschiedlichen TYIH>n \'011 ß ,>ollacht ll11gt'll kruubiuiereu. In de r P ra xis sind allerdings nur einige wenige Kombinar ionen von Interesse. Für Poli ti kwlssen schaftler komnu-n vor allem offene, svstematische Boobachtungen in nat ürlichen Umgcbungen in Fra g" . Möch te man Entscheidungsst ruk tun-n a uf Pa rn-ita gen ,IN unterschiedlichen Pa rt eien untersuchen. so ist es beispielsweise nicht notwendig. vordeck t zu ar beiten. Im folgenden werden wir uns - wie schon bei (11'r ß -fra gnu g - auf "im' strukturierte Er hebungsform lx-schr änk en.
Hf'
4,2,1 Kat egorienentwicklung \\'ä hrpnd d ip Messinstrumente bei oinor Befra gun g aus einer oder mehreren Fra gen ln-stehen, st ell t dip neolJ(lchtlJ719.~klltcg(Jri c das Xlessinstrument bei der Beoba cht un g da r. Als Xlessinsrrumout fiir dto Bet eilig ung \'011 Delegierten lind Vorst andsmitg liedern an einem Parteit ag könnten v, ß . die Beobacht ungska tegorien .Aueahl der Rede bott r äge \'Oll Deleg ier ten' lind .A nxahl der Redobeit räge VOll Vors tandsmitgliedern' hera ngezogen werden . Die Merkmalsausp räg ungen si nd bei diesen beiden Varia blen die lI ä ufigkeit . Zudem könnte die "Redelä ng(''' oder die .Reaktion de r Deleg iert en' erfasst werden. Die ~ Irkmalsa\lspräg\lllgen könnte n hipr r, d ie Länge in Xlinut en 1IzlI'. die Klassifizierun gen .zurückhaltend-...en t hus lasttsch- llS\\', Hein. F iir die Beobacht ungskat egonen gil t dasselbe wle für die Auewortvorga ben bei einer Befra gun g: Sie miissen sich gegenseitig ausschliescn lind vollstä ndig sein.
n.
Nehmen wir a n. wir interessieren uns dafür. oh sich d ip Bet eiligung von und Frauen im Seudlerendenparlament (i m folgt>IUII'1l Stu Pa ) nnt ersrheidet . Unter •.ß l'tPiligullg"' können wir die Anwesenheit. Rl'rlt,!>piträge nnd Zwtschenrufe in St ul'a-Sn-ungen verstehen. Da mit haben wir a lso drei abhäng ige Varia blen, die a ls Ind ikator für polit isch!' ß t>tt'iligllng im Stu Pa dienen. Als unab hängige Variable müs sen wir auf jeden Fa ll das ~ lällllPrn
tl4
Gp~ehlpcht heranziehen. Au ch hier ist nat ürlich wichtig. dass keine Beobachtungskatogorio (dies entspricht einer Frage im Fragebogen} vergessen wird. E~ könnt e ja sein . dass die Anwesenheit nich t nur vom Geschlecht , sondern au eh VOlt rler po l it i ~dH' ll Einordnung ah hängt . \ r ir köuuten r, B. vermuten. ,111.."-'; die ~lit g li etl"r der O ppo~ i t i on im Stuf'a in einem genngeren Um fang ihr :\Ian dat. wah rnehmen als die rogierendon Parteien . Wtr müssen also b{'i jf'dt' r lind jedem Anwesendon vermer kou. ob ps sich Uill eine Fra u oder einen Xla nu. ein :\Iit glit'l:i der Oppo sit ion oder der Koalit ion handel t . Auc h de r zweite Indika tor für poli tische Ik-t eifigu ng, die Redcbeit räge, könnten a uf diese Art und \reist, operatioualisiert werden . Zusätzlic h kiillltll'n wir hier Ilo("h die Lä ngt' für relevant erachten. \'il'lleicht gibt I' S zwar nicht mehr Rl'd plwit rägp von Männem als von Fra uen , Männer un d Frauen kiinn tpll sk-h jedorh in de r Da uer ihrer Rt'(lt>lwiträgl' unterscheiden. Ebenso wie die A nwesenholt und die Rf'dl'iJl'iträgl' könnten wir noch die Zwischenrufe na ch dem G I'Sl:ht('(~ht noticren.
Bereits die wenigen hier verwenden-n Ka tegor ien werde-n die A ufmerksamkeit des Beobachters in vollem Umfa ng in Anspruch nehmen. Zudem wird vorausgesetzt, dass Pr sich mit der Situation relat iv gilt auskennt . Um die politische Richt ung 7.U not ieren , muss der Beobacht er a lle im StuPa anwesenden ~[itglit'tll'r einordnen können. Sind im St u l'a viele Cruppierungen ver treten. so wird d iPS{' Einordnung sdlOn ziemlich schwierig, Dip gll'id l7.l'it igl' Erfass ung von Red ebeirrägon und Zwischenrufen ist für einen ('itl7.igt' tI Beobacht er alleine wohl nicht mehr durchfüh rba r. Schon a n diesem kleinen Beispiel wird deutlich, wartun ein Beobachtu ngsschema in der Regel weniger Ka tegorien cnt hält als ein Fragebogen Fra gen beinhaltet: Die Aufmerksamkeit tlf's Beobachters ka nn sieh immer nu r auf einige \H'lligl' Merkmale richten.
4.2.2 Beo bachtungssc hema .-\1l1' Beobacht un gs ka rogonen worden in einem ß robarh tlHlgS$chcm a bzw. Booba rht ungsprot okoll zusammengefasst . DI'Ill 0 1'0 bach tungs protokoll entspricht bei der Befragun g der Fragebogen. Anband dieses Beobachtun gsprot okolls wird die Beobacht un g durchgeführt,
Die Zusammenfassung der Beoll< ~l ., "
• • ,.h e.
_ H eh
.."".>Pre Einheiten (z. [3, Absii tzl' oder einz elne Abschnit te des Pa rteiprogra m ms ] ausgewä hlt werden. 0 ('11 Zähl einheit en entsprechen Ilf'i der Beobacht ung d ie Situationen. bei de r Befragung d ie Befragt en .
0 1'1' sdlWif'rigs tf' Toileiner 1nhahsanalyse Ilf'steh t d a rin, Kategorien zu entwickeln. di l' dip tllt'Ofetisdll'I1 nr' gri tfp m (';; SI'Il . An das f(lll rgm'iCll$ch emli sin d hie r die gletchon Anforde rung en zu stellen wie IIPi der Beo bacht ung : Sie müssen sich gegenseitig e usschlie jcn u nd vollstä ndig sein. Ka tegonen für de n Umersuchungsgeg enstand .Poli rikbor oiche- könnt en z, ß .. .Innenpolir ik'', ..A us r-npoliti k.., "Wir tsc ha fts politik'" Il S W . sein. Auch hier kan n eine Ka tegorie .Sonstigos' für nich t explizit gone nut e Ka tegorien sinnvoll v-in. O11 n l·ispil'1. Aus dif's"1ll G r und ist PS sinnvoll. erst " illlni einer Bewertungsanalvso der Pa rteiprogra mm a r.ik würde man a lso nicht nu r otne Aussage zur Gowerbea eucr als Aussago Will Politikbereich Wirtschaft kennzeichnen , sondern beriic ksichtigen, ob diese negativ Oller positiv bewert et wird . Dip Zuverlässigkeit de r Inhaltsa nalyse beinhaltet a uch hier wieder zwei As pl:'k ti': Dto l nlcr-Codcr-Rclillbilitiit ist hoch, wenn verschiedene "e rcodor d ieselben Analyseeinheiten in dieselben Ka tegor ien einordnen. Die llltm -Coder- Rcliubilität ist hoch , \I'{'I1 11 die Zuord nun g einer Analyseeinheit zu einer Kat egorie durch einen einxig-n Verrodcr s ta bil ist. Die InterCoder-Reliabilit ät lä s.en latoinischen Buchstaben bozek-hn et. llpispit'!s\\'piSl' soll es UIlI die \\"ahlabskht gehen . Dies e wird da nn a ls X bezeichnet. Dieses Slcrkmal X kann ga nz bes timmte :\Ierkmalsaus prägu llgt'll annehmen ("Cnu/ c su", ,,SPD" etc.] . Die Xlcrkmalsauspräguug-u werden als X k lu-zeichnet. wobei der JIlIIt'X k
IU I
eine fort laufende Xunuuerieruug der Mer kmalsausprä gungen (Ka tegorien) meint lind dementsprechend HlII I his zur max imalen Merkmalsausprägung 1Il lä uft . ~. wird deshalb als Laufvariable oder Laufindex hpzpidllwt und tlef ges tellt (vgl. Tabolle ö.t ). Talx-lle G,I : Not a t ion bei H äufigkeitsa us z ählungen
Ka tegor ie ( ~ It>rk m a !sa Ilspräg u ng)
ß pze it:h nun g
CD U/CSU
Il
SP D FDr
X2 ,I":j
;';PD rr gO/ GRÜN e
1'5
REr
.r6
And ere Partei \r ä hl t> nicht
J:i
\ 'p r\I'p i g p r t
.r9
\\"f' i ~ nicht Keine Angabo
I 4
XB
l"1O III
A b solu t e H ä u figke it en gt,bplI die A nz ah l der Xlerkmalsträ gcr wieder, rhe eine hest mimt e :\lerkmalsauspriiguug lIufwf'isen . .-\1 .solute Ilänbgkei! PII einer Xlerk malsausprä gung s ind oh ne r-ine Berücksich t igung der Cf'samtzahl de r Merkmals träger ulcht inter pr ct iorba r. Wcnu WO Befragte enu wäh len wollen. sagt das ga r nicht s über die Chancen der enu aus , wenn man nicht weib. wie viele Befragte ili$ycs(l7IIl eint' Wa hlabsicht gcä uMon ha ben. ~ Ia ll muss also wissen, welchen Anteil eine a bsolu te Häufigkeit a n allen Häufi gkeit en hat. Relative Häufigkeiten (Anteil der Mcd;mlll.~trii!ler in eine r hestlmmten Ka tegori e] oder Prozentwerte (rela rive H äufig keit x 1(0 ) werrlon berechnet. Indem dte absolute lI älltigkl'it einer Ka tt'go!"ie ins Verhält nis zur Cesamtzah l rlor Mer kmals trä ger 11 gesotzt wird. Xlerkmalsträgor werde n a uch als F ä lle bez eichne t . Absolute ll äufigkoitcn werden als !"'k bezeichnet (J steht für cngl. [mquency = Häufigkeit ]. F ür relative H äufigkeiu-n gibt es keine eigem- Notation . Prozent werte werden durch da s nach gestellte P rozt'lIt zf'id u' lI (W) kennt lieh gerua..ht.
1U2
Absolute lIiillfigkl'il =
f"
Prozentwert = Relatiw' Uä ufigkl'it x 100
Absolut e Häufigkelten können Werte zwischen 0 und -e co annehmen . DMa us folgt , dass relat ive Hä ufigkciten immer einen Bruch zwischen zwei positiven Zahlen darst ellen. \\'o !ll>i der Nenner imme r griiN'r 0111>1'gleich dem Zäh l!'r ist, da d if' a bsohue ll äufigkelt einer einzelnen :\lt'r kma lsr als dil' Gesamtzahl rk-r :\k r klllSt>t1 tats ächlich 11m rel a t tvo Hä uf i gkott en ( x 100) oder 1I lIl An ga ben der Gri)!'Pll verü ndc71m g handelt . Angaben der Grii!'PIln'l"ändt'rung lassen sieh nä mlich als Steigeru ngsrate oder als Differenz zwr-ier P roz entanga ben a usdrücken. So haben v, B. Bündnis 90/ G rüne bei der Bundest ags wahl 1990
1U4
1'"II..tI" " u nd Gmphi kell
Tabelle 5.3: llä ufi gkettsaus aählung der Wahlabsteht mit unterschiedltchcr Prozentuiorungsb asis Art der P Wl.t'nt uil' ru llh'S!Jasis
Wah la l",id ,t CDU-eS U SI'D FDP Hündnis OO/ Griilll' 1t"l'u hlikm "'f P DS
.-\JI(!t'rl' Partei W ürdl' uid" wählt'lI Y,'r wPig,>rt
\\ 'pi" lIit'lIt I\('i ll(' A ngabe
:'\id ,t w" lilh'wchtigl Summe
.-\1If' "bs . 11. G02 856 ZOO 316 72 120 42 ZI!'> . -li:> 570 36
156 3150
AbK. g ül t ig p Smnun-u llbs. lI. :IU.\ 602
"
8.';6 20U
:17.2 1'(7
316
\: U' :\.1
120 42
"" .2
za -
1.
. Iil Hilfe von Kn'uz !;lI)('1!I'!1 wird die .qemein.~a m e Vc,.teilllll,lj lIon zwei J fcrh na lr tl ;lbgf'bildt' l. Da mit Hilfe von K reuz t ubellen ein Zusammenhang zwischen Xlerkmalen festgestellt werden kann . spricht man nut'h von Kolltingcnztabdlen oder Kontmyrnztnjrm.
2
Di,' Gr ünen und , la.~ Biilld uis '00 traten zur Wa hl 1990 noch nk-ht "ls \'PI"l'i!It
Bildung
~ Iit
=
\ VahlalJl>ieht
Unabhä ngigc Variablc
A bhäugige Vari able
Erklä rend e VariablI:
Z u erkliircnsle Variable
d..r Unterscheidung von llllabhHllgigl'r und ahhHngigrr Yariabl e wird
ein ka usaler Einflns s der unabhä ugtgon a uf d ip abhä ngige variable JJIltcrs/elll : im Beispiel also, dass verschiedene Bildungsabsch lüsse ein un -
terschiedlichcs Wahlverhalten verursachen. In Ex-Post -Facto- Designs soll durch d ie Kontro lle Will Dritt variablen sicherges tellt werden. tim;. kausale ß pziph uu g gehalten wird (vg l. Ka pitel 1.3 ). Doshalb muss man sieh vor der Durchführung eine r Unt ersuchung. spiHestl'll s [edorh vor der Anal ysl:' bi- oder nurhlva ria ter Zusam menhän ge. Gedanken um miiglidlP .rl rin e' Elnfiussfaktoren auf dir zu erklärende Variable machen . O b eine bestimmte Variable als abhängig od er una bhängig betrachte t wird . kann \"011 Unters uchung ~11 Unt ers uchung und sel bs t in nerha lb ein er Unt ersuchung \\·J'I·hseln . Der eine Forscher miil"h lp die Wahlahsk ht durch die Bildung erklären (also: Rild lHlY -> Wahl(J b.~ i ch t ) , ein ande rer die Bildun g durch dplI sozial t'lI St at us des Elternhauses (al so: .~ozi (Jle7" Sta tus der
106
Eltern -. Bild ung ). Die Best immung dor abhän gigen Var iable resultier t a us dem Uutvr suchungsint eressc, die Best immung der una bhängigen Varia hlt'(ll) a us de r zngru lldp gplf'gtl'1l T heorie bzw. den Hypothesen . In emer 1\l"l'l1 zta lwlll' werden alle Kombinationen de r Merkmalsa uspräguugen zwotor Variablen a usge zählt. Es entste hen so Zeilen lind Spalten ein er Tu belle. In den deu tschen Sozlalwlsseuscha ftcn wird dle uu a bh ängige Variable no rmalerweise in den Spa lt en und die a bhängige Variable in d" 11 Zeilen ebget rug-n. Geradl' in St utist ikbüchcru (vgl. z. B. Agn-s ti lind Fiulay 20( 8) i ~1 alle rdings auch häufig!'r die ah hä ngigt· Variable in d" 11 Spalten und die un abhä ng ige in de n ZE'il,'1I zu finden. \richt ig ist . dass die zur Beantwort ung der Fragestellung richtigo P rozen t ulerung lx-rochuet wi rd. In Tabelle jA auf der gcgenüberhcg endeu Seih' ist ein e Kreua tubellierung de r Merk male Schul a bschluss (a b Ind ikato r fiir Blklung) lind \ra hlah.. sieht darges tell t . :3G7 Personen mit Haupt sr hulu bschluss (HS) wollen die CDU/CSU wä hleIl, ..j,.j3 d ie SP D IIS \\ ' . \ '011 den Befrag tenruit RealsrilUlahsehl"ss (RS ) II"Olll'll 182 di e CDU / CSU wählenund von den Befragte u tult Abit ur IIZW. Fachhochschulreife (Abit ur) äu sem 119 uine P räferonz für d ie C DU, Am Ende jeder Z.'iIE· und j l'der Spa lte ist die S umme dies er Zeile bz w. Spa lte wiedergegeben. Die Spa lte, die mit .S uu uue' äborsch rlebon is t, giht die llä uf i gkottsvorteiluug der a bh äng igen Vari a ble an ; rlies e wird a uch a b RandverteilulIg der abhängigen Variable bezeichnet . Die Ra ndver.. teilung der unabhängigen Variable findet s ieh in der let zten . mi t .S ummebesch riebenen Zt'ile, In der Ecke unten recht s s teht di e C osamtsmnme der Merkmalsträger. d ie in die Ta belle eingehen (2,218) , Hier sind ( OS die Befragten . die .' iIW Partei genannt haben und für die der Schula bschluss bekannt ist. Die a bsolut en Hä ufigkelten lassr-n s ieh a ber st' blech t vergleichen. Absolut gesehen. wollen zwar erheblieh mehr Befragte mi t Haupt schulabschluss Chris tdemokra ten und C hristsoz iale wählen (3G7) als Befragte mi t Realschulabsrhluss (182) bzw. Abit ur (119) . Allerdings gibt ( OS a uch wesent lich mehr Befragt e m it Ha up tschulabschluss (108G) als Befragte m it Realschulabsr-hluss (GGj ) hzw. ßl'fraglf' mit Abitur (-tG/) .
Übt die un abhän gige Variable einen Elnß uss auf die ahhängigl' Variable a us , dan n unterscheidet sich die pm zetllufl le Ver/eilung de r a bhängigen Variablen für j ede Ausprägun g der unabhän gi gen Variablen.
107
Tabel/e"
Tabelle 5.4: Kreuz tabelle der \ r ahlahsicht mit dem Schulabschluss - ah... solute Il äufigkciu-n Schlllab~,IIIIISS
Wahlahsicht CDU/ CSU SPD FDI' Biindnis 90 ,/ Griine Rr-pu blikancr
PDS Andere Partei Summe
HS 367 453 77 '9
"S
18'
244
Abitu r
SUlJll\I('
1I!) 131
Iili8
71
49
!.lU
125
'"
197 304
4:.\ 42 15
2(1
a
42
32
15
9
117 39
1086
6ü5
467
2218
1i5
S palte n-, Zeilen.. und Totalprozent e Man muss also auch hie r wieder die rela tiven Häuligkeiten hzw. P rozent . . WI'l" It, au gebeu. Dabei muss ma ll beachten. dass sich in einer Krt>llzlalwl1e
immer drei verschiedene Prozent mcrtc berechnen lassen : Zeilen- , Spalt en.. und To talpro:l(>ult'. Zur Berechnung VO ll Zeilen p r o ze n t en wird dit' Zt'ileusumme als P rozent ulerungshasls ( = 100 %) genommen; bei S pa lt e np ro ze nt en die S paltensumme (= 100 %). Schliesltch kann man die Hä ufigkeiten auf Basis der C esa mts umme prozr-ntuieren (T ot a lp r oz ente ). Dami t sind drei lnhalrlirh viillig verschiedene Allssa~wn verbunden. \ 't'rwendet man die Zeilens umme als P rozentuierungsba sis, bezeioluu-t der P roer-nt wert einen Anteil an de r Ausp rägung d,'s Merkmals in der Zeile. Vorwendet mim dir- Spa ltens umm e. bezeichnet der Pro zentwert einen Anteil a n der Aus pr ägung des Merkmals in de r Spa lt e. Y(,fI\"en rlel ma n d ie Gesamts um me, bezeichnet der P rozent wert einen Ante il a n allen Fällen. die in die Tabelle eingega ngen sind , In Tllbe1J(· ;jA lid,p sich der Antril der Bef ragten mit Haup tsehuiabechluss an fi liert potenticiicn CnUjCSU- It'iihlr m m it :lG7/üü8 x 100 = 3-t, 9 % I){'~ rechnen [Zeile np rozenre]. Der An /eil der /lfJtentie llclI cnu/ csu.. Wühler an allen Befm gtrn m it lla JJp / seh lllab$ rh lus.~ b-rechuot sich da gegen mit :.167/ 1086 x 100 = 33.8% (Spalte nproz ent e]. \'0 11 de n Befragten m it Hauptschulabschlus s wellen also 33 .8 % die cnu j CSU wäh len. 5.1.9 % der Befr agten mit einer CDU/CS U· Wa hlahsk ht haben einen Hauptsehnlab...
'"' schluss. Toralprozenre \1"('1"(\ (' 11 nicht so häu fig benöti gt ; von allen Bcfrn gtcn haben W'Ilrh al't der Grünen weist dagegen mit 41.1 % einen sta rk überdurchsclml rtlichen Anteil an Befragten mit Abitur a uf.
Tabelle 5.u: Kreuztabelle der \Yahlah.hnis (11'f Rl' kh st a gswa h l vom 14. September 19.'30 wit'(\,>rg t>gdJPII. Bit te ermit teln Si!' dip Wa hllJl' ll'ibgung un d den Anteil der ungültigen Sti mnwn . P rozontuloren Sip die Stimmen für die einzelnen Parteleu (a) auf Basis der gültigen Stimmen und (h) a uf Basis der Wahlbcre-htigt cn. waruni wi rd in der Regel a uf gült ige SI i 1Il men prozent 11 ir rt "? Tabolle 5.7: Ergeb nis der Retehsragswahl vom 14. Sepnunber 19:.\0 t fuhh:rgt:blli .~ Wa hlberechr igt o
42.957.G7;J
Abgegebem- Stimmen ungültige Stimmen
33 .22fl.I,j8
Cültigc Stimmen
:U. 970.85'
KPD CS PD
2;J-t.f)OI
.t.592.OUO
11.902
3r D
8.577.738
DDr
1.:322.:385
Zen t rum
-1.127.910
RYP
1.059.141
nvr-
1.609.77-1
D:'\YP
2.-Fi8.2,16
:\SD.-\P
6.-109.610
Son stige
-l.702.061
2. Bei der Reichst agswahl 1932 I'rzi('!te die :-;SD:\.P 3 7,:3% der gültigen Stimmen. Um wie viel P rozent lind um wie viele P rozent punk te st ieg der Ant eil der Nationalsozialisten im Vergleich zur Reichstags wahl von 19:30·! :3. Bitte s tellen Sie das Wahlergebnis der Reichstagswahl 19:30 graphisch dar! Wf'k hf' Dia gramme können zur Darstellung verwandt \H'rdl'll "!
119
AuJ!J" oclI
-I. Auf die im A LLOUS 199-1 gestellte Fragt '. .,Und wie wird Ihre ciqcnc wirt schaftl iche Lagc in einem Jahr sein ?;;. konnten dio Befragten von
"wesentli ch l!f:.~.~ e ,,'; bts -uxsentuch: schlechter" ant worten. In Tabelle ö.S s ind die Antworten getrennt. für west- und ostdeutsche Befragte wiedergegeben: Tabelle ;:;,8: Wi nschafrliche Ei nst ellungen im A I ,t OUS 199-1
\rest vesenrlteh hl'sspr etwas besser
gleichbleibeud etwas schlecbtor
wesentlich schlech ter
S 1I1ll llW
Ost
S1I11l11ll'
38
22
GO
:3-18
23 4
GU2
1388
üGl
2249
293
119
-112
23
21
229 0
1077
"
3:~G7
Bitte berochnon Sie Spalton-. Zeilen- und Totalprozente. Inn-rpret ioren Sie d ie Inhaltliche Aussa ge de r TalJI'II,,!
6 lage- und Streuungsmaße u.t Lagerna se . . . .... . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . ... 122 6.2 St rcunngs make ....... . •. .. . ....... . . . ••..... . . . . • . . . .... . •••••••• 131)
Im vora ngega ngene n Ka pitel wurden Jliiutigkf'itsn>rtl·jlungf'1l SI IWi t> deren Da rstellung d urch Tabellen lind Gra phiken behandelt . In diesem Kapitel werden IlU Il statistische Maßzahlcll vorgestollt , dio die zentrale Lage eine r Ver tei lu ng U1HI die St re u ung 111'1" Mess werte cha ra kt eris ieren. In TaIH']l!' Ii.I is t d ie St udienda uer von 11 Absolventen der Polit ikwissenschaft \\'il'{ll'rgr'gp!wll (das Of'ispiel ist fiktiv) . In de r linken Ta belle li"gl'll (\ie :>. Il:'s.-;wf'rte d PI einzelnen Personen als Urliet c \'01'. d. h. so . wie wir sie willkürlich nacheinander notiert haben. Um die Ubersichrlichkoit zu erhöIWH . wurden die Messwerte nach ihrer Gr öbp geordnet. Diese so genann te primäre Taf el ist in der rechten Ta belle wiedergegeben . Tabelle G.I: Semes ter zahl von Politologen : 1lllg rn p pit>rl P Dat en
Ur/iHle
prntuire Tnfel r
.r;
1 2
12
l'
,, l' 3
10
11 211 7 12 8 12 s 11 111 13 11 13
e
1 2 3
,, e 7 8
u 10
11
111 11 11 12 12 12 13 13 14
l'
20
Xlit i wird de r La ufindex für die ei nzelnen Mer kma lstr äg er (hier also Pcrsonen ] hezeirhnet, mit .!"; d ie konkrete Merk malsausprägu ng des i-Iell Mer kma ls t rägers [bzw. der i- tell Person). Allgemein nirnnu der Laufi ndex i
121
Wert e zwischen 1 und n an , wobcl 1l der Anzahl der Merkmalsträger ( Persoucn ) ent spricht . Im Beispiel .Jäuft.. der Index i als o von I bis 11. da dit' ~l esswert e - die Semesterzahl - bei 11 Perso nell erhoben wurden. :\lit i =·1 wird a lso der vierte !\!f'ss\\'prt bezek-hnet , mit x~ die konkrete :\!prkmalsaus prä gung de r vierten Pers on. I n de r Urlistc nim mt x~ den , rerl 15 a n, d. h. diese Person hat bis zur Magist erprüfung 15 Semester lan g s r udiert , In der primäre n Tefelulmmt dagege n x~ dCJI \\'e rl 12 IHI, d. h. der Laufindex wird bei der Sortierun g nicht berücksichti gt . Sowohl llf'i der e rliste als auch hl' i der primären Tafel werden clif' !\Iesswerte einzeln aufgefüh rt . es handelt sieh daher Ulll l11ty fll1l11irrte Date n. In einer Ifäuf i gkeitsta helle (Ka pit el 5.1.1) worden dagegen gletcho Messwerte zusammengefasst (gr uppierte Dllten ), Zwischen un gr up pierren un d gruppierten Da ten gibt I' S keinen I nfor ma t lonsverlust , da die Merkmalsausprägung einer jeden Person vollst ändig rep roduzierbar ist.
Tabelle G.2: Semesterzahl von Politologen: lTällligkpitst alwlh' k I 2 3
J,
f" I
%
,,
11
2
9.1 % 18.2 %
12 13
3
27, ;~ %
2
14
7
20
I I 1
18.2 % !.I.I % 9,1 % 9.1 % 100,1 %
u
L
10
"
11
kum. % 9.1 % 27.3 % 5-1 .6 % 72.8 % 8 1,9 % 9 1.0 % 100,1 % 100.1 %
Der La ufindex für die einz elnen Ka tegor ien wird mit k bezeichn et und 1/1. wobe i m der Zahl der Kalt'gor if'1I f'llts prkltt: in (!ie'sem ß pisp iel sind es sit'lwlJ. Der [,clll/ illllex f ür K uleg fl rtm k .'wIlte IlJI/ kein en Fall m it dem Lau/ iuda f ür Merk ma lstriiqer (hier: Personen] i ver, we(;h.~dt werden . Dip ~ lp llmal sallsJlrä glln g einer Ka tegori e wird mit Xl. bozeirhnet. r~ entspricht der Merkmalsansprä g un g 13 Semost er. Da dip Da ten zusammengefasst wurden. Ix-nötigen wir noch eine Anga be iibr-r die lIä ufigkf'it /"l mi t der dip ;\lprkmalsallsprägullgf'JI auftreten. / ". ist hier 2. W/lS hecleutet , dass I'wt'i Po!ito[OW'1I 13 Semester bis zum Abschluss beuöt igten. P rozen t ua l ausgedrtlr-kt haben 18.2 % der Studierenden (2 von
.Jäntr von 1 bis
122
11) 13 SI' llW~I(,1" bis zum Ab~('IJ I Il~~ des S tudiums ben öt igt . In der le t711'11 Spal te sind die kumulierten {addier ten] Prozente angegeben. 9.1 % der Studierenden II1lIll'1l 10 SP liWSIt>r bis ZIIllI Abschluss IH'uiiligt. 27.3 % c11'1" Studiorendon haben 11 oder 10 Semest er bt'niitigt , 5~ .(i% de r Studierenden nich t meh r als 12 SI' IlU'~It'I" , 73 % IH'nigPI" als 13 Semester II ~W. Die SIiITIIIW der P ro zent e addiert sich wegen R und un gsfehlern hier nich t ga nz exakt zu 100 %. Die Berechnun g kumulier ter Prozentwor te ist erst a b ordlnalskaliertem Skalennive au sinnvoll . weil die Mer kmals ausprägungen da zu nach der Grü!o,e sortiert wenlp ll müssen.
6.1 Lagemaße Xliuclwert e kennzeichnen die zent rale Lage einer Verteilung. '''('nil vom ?\ Ii1tel wert gesprochen wi rd. dann ist in der Regelein ~I)l'~ ieller ?\ Iit telwert . nämlich das arithmetische ?\riupl, geme int. Die drt'i wiehtigst t'lJ ~ litt t'hn'r te si nd: 1. Modalwert 2. Medi.m 3. Arithmetisches ?\litt el
" -eldwlI der drei Mitt elwerte ma n berechnet . hä ngt zum einem vom Skfllermivcau des Mertmole und zum anderen Hili der zu t reffenden inhalt fichen AIlSSllgt' ab. Ik-i nom ina l skalierten :-'krkmalen ko mmt der :-'IOIlalwer t in Fra gt'. hel ordiualen ?\ 1t'rkmalplJ wsät i'lich tlt' l' ?\tt'tlian lind bei metrischen Merkmalen läs~ t s ich a uch (las a rtt hmetische Mlt tel sinnvoll Interpre t ieu-n. Zwe i weitere xfiuelweru- fÜI" mindestens rar ioskalierte Xlerkma h-, da s
fl CO-
metrische und da s harmonische Mitt el, sind für 11I1~ \" 011 u ntergeordneter Bedeutung (vgl. Sachs 2UUu, S.7U -78). Das gt'OII11'trischt' Mit tel komtut bei pos itive n. ratios kallerten Daten zum Einsatz und ist in ha lt lich bei der Beroch llU ng du rehs ehn i t thchor '''achs t 11msfaktoren (UmsaTi', ZiIlSi'1I IlSI\·. ) an gemessen.
6.1.1 Moda lwert DI'I" Modalwe r t ist der M es swe rt . der in einer Verteilung am häufi gsten vorkommt. Ot'i einer graphischen Dars tellung ist der Modalwert also
der Gi pfl'l hZI\". da s Maximum der Verteilung. Die Beaeich nung für de n Modalwert ist nicht einheitlich. Wi r benutzen X'\/Q'
Kommen zwei !\tt';;. (J;" = 3 ) ist. (Das lH'if.1 aber nicht . dass die m eisten der elf Politologen 12 Semester bis zum S tudlenabsrhluss lx-nötigt habeu.} Modalwert e lasse n sich für all e Messu lveaus bestimmen. DeI" Xlodalwert der Relig ions zug-hörigkeit {nom inale, Merkmal . Tabelle G.3) ist hpi westdeutschen Befragte n .Evaugelisch / Freik irche". bei ostdeutschen Befragten .Keine Konfession-.
Tabelle G.3: Rt'ligion sm gf'hiirigkt'it \\ \'>;t,I"lItseII11\lI,1
Os td"utsd ll,,, u!
Häufi gkeit rel. Häufig. Willfigkl'it n-l. Häufi g. !}(l5 (lAU Evangelisch i Freikin-he 284 U.25 4.) Katholisch 1:131;\ U.37 U,U4 0,02 And ere christl. lloligion .':>li U.lJI l()!} Nicht ehristl. Hd igiull U.05 IU U.U I Keine Konfession 7(j5 377 u.te uus I Il !) Gesa mt 2285 I.UU I.UU AI.I.BCS 2006
"
,
6.1.2 Median Der M edian iSI der \ \'{'rt. der d!e nach der G riik a ufste igonrl sortierten xlossworto in zwei Hä tfron teilt. Der Xledlan iSI also der \ \'t' rt. der in der Mit te liegt. Der Median der drei Einkommen 1000 Euro. 1500 Euro lind 8000 Euro ist 1500 Eur o. Die Bexeir-hmmg des Xlcdians ist i,
Um den Xledian zu ermitteln, IIlIlSS man die ~ 1f'sS\n'l'l t> zunächst ordnen, d. h. dip pri märe Tafelerstellen. Ans (:hlit>f."IHI s ucht man den Wer t . der
124
in der Mit te liegt. Bei einor ungerade n Zahl von Messwerten exrsno rt gona u ein ~ I I'SS\\"t'f l, der in der ~ I i tt l' liegt , und zwar nn der Stolle n; ' . Der Media n ist d ie Merkmals ausp rägung de s Messwerts. der an der n~1 ten Stell e in der gl:'ord llPtl:'1l " Pftl' i1 ung Hl'g t:
(G.l)
i =;[ ~.
Im Beis pielzur Studiendauer. die für n = 11 St udi oronde erhoben wurde . lx-träg t tief xled lan
i
=
;[!Jf!
= I 6 = 12 Semester .
Bei 11 Mess werten liegt der sechste ~ (I'ssl\"('rt - ( ll + 1)/2 = Ii - in der ~ li tte der Verteilung. Die Merk malsausprägun g des sechsten Wert es ist .(6 = 12 SI'lllPsll' f. Dip mit t lere St udiendauer het fä gt a lso 1:1 Semester. Die Hä lfte der Studierenden benötigt bis zu m St udienabschluss weniger oder gleich 12 Semest er. die Hälfte mehr als 12 Semester. In dl' f ersten Hä lfte lll'tilld" 1l sieh bereits zwei Studiere nde , llip r lH'ufalls 12 Semes ter st udiert haben. Bpi d iesen beiden kann man nich t da von spre r-hen. dass sio .schneller' st udiert habon. Bei einer ger a d e n Zahl von Messwe r t e n existi eren zWl'i nuu ler e \refte, und zwar an den Su-Iten n und ~ + I. Bei 12 vless wert cn liegen der SI'eilste (!fl und der siebte (~ + I) i\[t'SSI\w t in der ~ Iitte. Es ha t sieh Iwi einer unge raden Zahl von ~ 1 1'SS\\'I' rt e ll eingebürgert , deu Xledian als arith nu-tisrhes ~ li tt pl der Morkmalsa usprägungen der belden in der ~ I i ttf' liegenden ~ reS;;l\"eft t' zu berechnen:
(G.') Würdo in unserem Beispiel noch ein Polit ologe mi t I ' 2 = 21 Semest ern hi nzu komm en (insges a mt sind t'~ da n11 n = 12 Personen). würde sleh der Media n wie folgt er mitt eln:
12J
~
1'6 +X7
12 +1325
--, - ~ - -, - = "2 = 12 ,5.
Die ~ I\'rk lllillsa llsp l'ägll llg dos sechsten ~f l'SS\H'I' IS ( 1'6) isr 12 Semesu-r. dip Merkmalsansprägun g des siebten Messwert s (X7) IWlräg l 13 Semoster. Das a rit hmetische Xlinel a us diesen beiden Wer ten ist 12.GSemester. Die m ittIf'rf' Studie ndauer he lräg t nun a lso 12.GSt:'lIlt'Sle]', Alt ernat iv kiillllPll auch d it' heirleu mit tleren wer te illlgt'gel )(>11 werden. was bei ordiualskalle rt en Merk malen angemessener ist . Die Berechnung des Media ns set zt ledi glich vora us. dass die ~ [ l'ss \\'(']' le in ein e Reihen folge geb racht werden können. Er ist deshalb für alle Daten a ngemessen . die mindes tens ordinalskalierr. si nd. Bei einer groteu Zahl von Beobacht ungen lä ss t sich der Xledian am einfachs t en
'"
Minimuni. I. Quartil. Median. 3. Quartil und Maxim um werden hä ufig zu r Cha rakterisicmng der Lage und Breite einer Vert eilung hcruugeaogeu und als fj - PllTlkt e -Zu.~(Imm cnf(j.~,~ lm.rJ eitler Vel·teil urlg (TlKkry 1977) bezeichnet. Ta belle G.G: Semesterzahl - ;) Pun kte-Zusa mmenfassung Mininuun I. Qua nil
10
:3. Quanil
11 12 14
~I axilll um
20
~1t'{li all
Grafisch wird die ö-Punkte-Zusammenfassung ein er Verteilung durch Boxand- \\, his kr r-P lots visualisiert ( A bt.tl.lnng G.3). Oie untere G rr llze de r Box ist (las 1. Quartil (11 Sem-ster), dir ohere Grenz(' rler Bl>X ist (las.1. Qu ani l (U Semester]. Dir Länge der Box entspricht dem Quantlabsrand JcI - 11 = 3 Semester]. Innerhalb der Box ist der ~ 'pdian (12 Semester ) durch eine Linie gekenn zeich net . ..... 11 der Box er kennt man deut lich. dass die Studiendauer linkssteil vert eilt ist. Oe)" Abstan d zw-ischen Xledian nnd :3, Quarril ist gröker ab der Abst a nd zwischen Median und I. Qu a rril .
Die Box winl du rch n H>i ZiilltH' (u1hi;;kcr ) na ch oben u ndnach unt en verlängert, Dip ZiilllH' eutsprechou dem Xfinlm um und Maximum der Vertel-
134
Lagc- and
Stn.,a ang~"'''ße
lung. sofern Xltn huum bzw. Ma ximum ketnc Ausrotsor sind . Ausn-üer sind ;" !f'ss\\'f'rtf' , die weiter a ls rle n 1,5fad lE'Il Qnarülabstand von der Box entfemt sind . Sie werden einz eln dar gestellt . Sind Ausn-ikor vorha uden. dann ist der Zaun a n der Stelle des kleinst en bzw. grökten ~fpss\H'rtes . der kein Ausr eisor ist. Der Q uartilabsta nd der Studiendauer lw triigt 3 Semester , der l, ;:;fa d }!> Q ua rtila bsta llll 1, 5(3) = .1. 5 Semester. Dip unt ere Grenze für Allsrl'ibt'l" ist denmach I . Quanil - I. 5(tQR ) = 11 - 1, 5(3) = G.5 Semester, die obere G W I\ Zf' für Ausrofser lH'trägt 3. Qu ar til + I, 5{IQ R) = 11 + L 5(3) = 15, 5 Semestor. Semes te rzahlen kleiner als G.5 und grö w-r als 15,:> sind Ausrei ser. Ausreiser nach un ten , das Iwibt St udiere nde. die weniger als ü.5 Semes ter bis zum Abschl uss lwniit igt ha ben . existieren nicht. Der unt ere Zaun e nts pricht desh 15.5 Sell1l"stl:'r ), nämlich 2USemester. Er ist einzeln in der Ab bildung \'islla1isiel"t. Der nhere Za un is t der griibH' \r ert de r Verteilung. der kein Ausreibl'r ist. nämlich 15 Semest er [vgl. Ta bolle ü.L ).
,
Abbildung G.3: Box-and-whisker-Ptot
.
-~
e
,
_~====c===::..:·:·:"""lwll (die glt> id ll' Verteilung wurde \H'fPits mi t Abbild ung 5.;) auf Spil l' 113 graphisch dargestell t ]. Bitte beror-hnen Sie die behandelten Mittel- und Streuungswerte nnd interpretieren SiE' diese inhaltlich!
I 19 I
2 20 ,
3
,
6
t
21 22 23 13 13 10
t
8 9 10 11 26 27 28 29
6
2
4. Das arithmetische xlitrol einer Verteilung beträgt -I, der Median G. Ist der Modalwert gfö Mo r als G, kleiner als lH'illt" oder liegt er zwischen 4 1I11d G'! c . Sle möch ten die Non-uvcrtcilung einer Kla usu r durch ein en Mit telwert cha ra kter isieren . \\"I'ldw(r) ~ditteh\"(,ftk ) is t/ sind a ngemessen
und warum'!
G. Im Mainzer Xlie tspiegel sind d ie mittleren Xlieren für jt'{lt' Wohnungsgr uppe an band des :\ft'tliillls ausgewiesen. \ raru lll'?
7 Zusammenhangsmaße 7.1 7.2 7.3 7.4 7.[, 7.6
Kreuztabellen uud st atistische Unabhängigkeit .1 42 Ma~l' für zwei dkhutUllll' Merkmale . . .. . . . . . ... ..• . . . . . . . . .... . . . 14& ~fal;l' für zwei uominalskalierte Merkmale 14!l /l.1al>l' für Zl',d ordinuls kaliertc Merk male 15U r.lall für eiu 1l00tlinalskaliel" k l< lind ein mctrisrhos Merkmal 161 l\fa t:.l' für zwei lJH'trisdll' Merkmale 16&
wen» wir WiS SI'1l wollen , ob Arbeiter da zu neigen. dit' srn zu wählt'lI. ob Vorur teile besonders bei aut orit äreu Persönlichkeite n zu findeu sind. uder ein gutes Abitur mit einem guten Studienahschluss einlH' rgl'llt, dann sind wir auf (\1>1' Suche nach einem Zusammen ha ng zwischen zwei Merkmalen. Zusamuu-nhungsm a j,e drücken die Stärke de" Bezieh lm g zwische n 1.1I'. >i Merkmalen au s. Es gibt eine Vtclzeh l \"011 Zusammenha ngsmalen (Tabe lle i .I ). Wpk hes ~ I ab angemessen ist, hängt in erster Linie \"0111 SkaJeuniveau der Merk male ab . Da sieh für j PI1I'.s Skalenniveau verschied ene 7.11sHmml'nha u/,,'S IlHlbf' hen-chnen lassen . muss man aujerdem ber ückstehug cu, dass nirht alle ~ la N> 1.11111 selben Ergebnis kommen. Da rüber hinaus haben alle Zusa nuuenha ngsma be bestimmte Vor- un d Nachteile, die bei ihre r l nt erpret ut .ion berücksichtigt \\"'1"III>n müssen. Ta lwllt, r.i. Zusammenhangsmate
I Merkmal 1 I Mnkmal2 I Zusammon ha ngs ma6. dichotom
dichotom
nominal
nominal ordinal
ordlnal
nomina l' metrisch ' llwt ris d l mr-rriseh • unabhängiges Me rkmal.
2 x 2-Ta hd lell: Proxonrsatxdifforouz. O,lds-[lat io. o {phi}, Yules Q Mehrfeldort ab ellcn:
I
Cramörs V, C,.\ [lamhda] (gannnu} . t all-~lal;l' (7),. Tel, P {rho ], S" llll'rs d [et a-Quadrat )
)
r ia rll.. P r, >nt Ilrhe ~ rabza h11'11, Eine ausführliche Darstellu ng findet s ich bei Benninghaus (2005) . Für da s \ '(' 1"sründnts multlvarlate r Anal yseverfahren ist die Kenntnis \ '011 Odds-Ratios.
z"~,, "'" ", ,,h,,"ys ,,,pe
142
fI
der Kovarianz lind der P roduk t-xlomcnt-Korrel arlon zentral. Logari th miort o Odds worden in logisrisclu-n Regr csslonsmodclk-n als abhängige Variable verwandt. Kova ria nz- und Ko rrelarionsnrau-izcn sind tIN A us-
gangspunkt für Strukturgh-nhungsn.od-lle und faktorenanalyusr-he Yt'rfah ren (vgl. Reinecke :WUG) .
7.1 Kreuztabellen und statistische Unabhängigkeit A ll g!'1l01ll1llf'1l wir milchte n hera usfinden . ob Os tdeutsche eine and!' r!' Einstellung ZUIll Schwangersr-haftsabbruch haben als Westdeutsche. Dazu habcu wlr die Merk male Eins t ellung zur A bt reibung (,\ Yelli l die Frau t's will") IIJld Erheb ungsgebiet [Befragung in \Yt,~ t de tl t sl:h l a Jld oder Ostdeut schland ) gekreuzt (Tal)('111' 7.2). Solche Tabellen werde n auch als Kont ingenzrabellen bezeichnet . weil sie dir- gemeinsame Verteilung awcier ~ I!'rk malt' wieder geben. Ik-ispielsweiselehuen in \Yt~ t d t'u tst·h l a n d I . 1 Ul von 21..18 Bt,Fragten einen Schwangerschaftxahbnu-h ab, in O Std l' UI schla ud lehnen ..I JO von JOSG Befragten einen S("hwangefSt:haftsabhfll("!I ab .
Tabelle 7.2: Einstellung zur Abtreibung nach Erhebu ngsgebiet (Häufigkeiten)
Gebiet Abtreibung? nein
\Yl'St
Os t
.no
Summt'
1401
J' Summe
747 21..18
676
1423 3234
tose
1811
.-\LLIlCS ".006
Dip a llgemeine Fo rm einer Kreuz tabelle ist in Tabelle T.:l auf der u är-hsten Seilt, dargestell t . Die Variable in den Spalten wird in der Regel mit X bezeichnet . die Var ia ble in den Zeilen mit Y [vgl. Kapitel G.1.2). Der Laufindex für OiE' Zellen läuft VOll i = 1 . . . /, der Laufindex für d ie Spaltr-u Hin j = 1 ... 111. In den Zellen stehen d ie H äufigkci ten [, fll gibt als o die H äu f ig kei t wieder, dio sich in der ersten Zl'ill' und ersten Spalte befindet .
143
THIIPIlf' 7.3: Allgemeine Form oinor Kre uztabelle X,
J:2
.. .
y,
In
In
...
y,
h,
[n
.. .
, y, Sl' altt'llsll rn1lI('
I"
,
In
,
...
Xm
Zeih-nsunnne
'" !lj I::
hm
j ;:ol m
hm
t.:
,
L I" i-I::I f i2 ... i-L I i.; i-I
I:: h j
j=1 m
,
I:: .,hj
m
L I:: /;j =Jl ;- 1 -,
Die b eobacht et e n H ä ufigkeit e n emer 7,1'1If' werden allgemein His fb (ij j be zeichne t . f steht auc h hir-r wieder für Häufigkelt en. b gibt an, dHS.~ es sich um die beobachteten ll äufi gketn-n handelt, i kennzeichnet die Zeile und j die Spalt I' . f bl. l 2 ) wäre also d lo beobachtete Häufi gkeit de r Zt'III', die in der ers ten ZI'il" und der zweiten Spalte steh t , und dies sirul im Beispiel ·11 0 P I'TSOIll'Il .
Um zu bestimmen wie die Einstellung zum Schwangerschaftsabbruch vom Erh ebungsgebiet abhängt. muss spaltenweise prozenmiert werden (Kapite-] G). 6G% der in \ \'psttlplltS(:hland Befragten ( H OI/2 1·18 · 100) Iehuen l"int' Abtreibung ab. jl'(IO(" h nur 38 'X (4 IOj IOS6 ' 100) tlPT nstrleutschen Befragten {Tabelle 7.4, Spaltenprozente in Klammern}. Tabelle 7.4: Beobach tete Häufigkotten und Spaltenprozente (Kon tingen ztabclle)
A br rei Il1IlIg"! nem
j' Gesam t
Gl 'bit' t \rl'St Ost 1401 .nu (38%) Wi %) i -li (3G%) 076 (62 %) 2 148 (100%) 1080 (100%)
Gesamt
1811 142:1 .'3234
(GG%) (·H%) (100 %)
A LLB loS 2006
Ost- und westdeu tsche Befragte un ters cheiden sich offensichtlich in ihren Elnstellnngen - es besteht ein Zusammenha ng l\\'isdn'II dem Erhebu ng», gebit't 1111(1 tief Emstellnng zur Abtrl'ihllllg.
z"~,, "'" ",,, h,,"ys
144
fI
"'ße
\ ri(' würde die Tabelle aussehen , wen n kein Zusam men hang zwischen den Merkmalen bes teh t . d. h. die boiden Morktuale stat istisch unabhängig l sind"? In diesen! Fa ll dü rften sich die Ein st ellu ngen \" 011 ost- lind westrleursr-hen Befragt en nirht um ersrheiden. Oil' prOZPlll lla!P Verteilung der ahhällgigt'1l Varia ble (EillSlt'lI11llg zur .\ ht fl'ih u ng ) wäre dann fiir jPd l' Auspräg ung der unabhängigen Varia ble (\\"I'SI , Ost) identisch [vgl. Ta belle 7.5). Die Ablehnung ('1111'S Schwange rschaft sabbruchs müsste \)('1 os t lind wes tdeutschen Befrag ten ;)ü % lx-tragen. die Zns rimmung ·U %. Dlo Häufigkelten. d ie dem ~[ode1 1 sta tist ischer Unabh äng igkeit entsprechen . werden Bis erwartete lläuJi.qkeiieli bezeichnet.
Die e rwa r teten H ä u figkeite n lassen sich ga nz ei nfa ch erm it teln , Indem man die Zeilens umm e mi t der Spalten sum me ruultiplizier-t lind diesen \rert durch rlie Gesamt za hl der Befragten (11 ) dividiert. Die e r warteten lIä ungkoiten werden mit f . (i j j bezeichnet.
1,
_ Zeill'IlSUmnle ' Spa!t ellslIm mc
.(ij) -
n
Im Beis piel ist d ie erwartete Häufi gkeit in der link en
r
J o( lI )
=
( 7.1)
otwn-n Zello a lso:
:l U 8 ·1 811 = I:102,D. 323 1
Ca . 12U:3 von 21-18 in \\'pshll'llt sr hi llnd befrag ten Personen müs sten einen Schwangerscha ftsa bbruch a blehnen , wenn kein Zusa mmenhang zwischen dem ErllPll1l n ~gl'hi t' t und der Eius tr-llnng ZUl U Sdl\\'angprsl"h aftsabhnwh lx-st änd e. Auf die in Gleichung 7. 1 besch riebene Ar t und \"" isl' ka nn ma u IlUIl auc h die erwa rt et en Il äufig kotten der ande ren Zellen ber echnen. Talx-llen , dto dto erwar teten Häuf t gkeiten beinhalten . werden a uch a ls l ndifforeuzt a 1)('1 Jeu bozek-lun-t .
na~ Kunz 1 bedeut et . dass die Odds fiir Grupp!' 1 gri) ~l' r sind a ls die Odds für Gruppe 2. Ein Odd s-R at io < 1 zeigt , dass die Odds für G rup p\' I klein er sind ab für Gruppe 2. J(' weit er der \Y.'rt von I entfernt ist, umso st ärker ist der Zu- amnu-nha ng zwischen den llt'idt'll :-, 1t·rkma lf'll. Ein Odds-Rat io von 4 giht einen st ärkeren Zusa mmo nha ng wieder a ls ein Odds- Rat io von L i. Ein Odds- Ra tio \"011 0,25 drüc kt einen stä rkoren Zusammenhang aus als ein Odd s-R atio VOll 0,.1 . Um dir- Stärke des Zusammenhangs von Odds- Hanos < 1 mi t Odds- Ra t los > 1 zu vergleichen. wird der Kehrwert der Odds-Ranos bet ra chtet, die kleiner 1 sind. Eine Od ds-R atio Hin 2 drück t einen gleich starken Zus ammen ba ng a us wie eine Odd s-Ra tio W lII 0,;:; (1/ U,5= 2) , allerdings in un terschiedlicher Richtu ng. Dies wird deut lich, weun ma ll den na tü rlichen Logar ithmu s der
Odds-Ratlos berechnet: In OJ> = - 0. 69 lllu\ln2
=
+ 0. 69.
Odrls-Ra t ios zä hlen zu de n sYlllnH't risdlPn Zusammonh a ngs ma sen. Dip GrUbt, der O dds-Ra tio häng t als o nicht da von ab. welche-s der beiden ?- IN kmale als ilbh ä ngig oder una hhä ng ig lu-tra cht et wird . Ein Kritikpu nk t a n Odds- Ra tlos bes teht da rin, dass sie nichts meh r über die Grübp der Odds (u nd Wah rschcinlichkeitc n] a ussagen: Eine OddsRat io von beispielsweise 2 kann da ra us res ultieren. dass die Odds für G rupp!' I 0.02 lind für G rup pe 2 U,Ul bet ragen (U.U2/0.01 = 2). Die Orlfls für das intf'H'Ssif'TI'lldp Ereig nis sind dan n für GruppE' 1 zwa r doppelt so hoch. alle rdings au f einem sehr ntodngen :\" i\'f'a u.
7,3 Maße für zwei nominal skalierte Merkmal e P rozent satzdifferenz und Odds-R at io sind ?- Iab t, für d ie Stä rke des Z1Ixanuuenhangs in 2 x 2-Tab d ll'n. In Mehr feldert abellen la;;.s!'" sich mehrore P rozen tsa t zdifferenz en und Odds- Hanos berechnen. Auch für Mehrfeldertabollen gibt l'S Masz ahlen. d ie den Zusa mmenh a ng zwischen zwei xle rkmalon in ein er einzigen Zahl ausd rücke n. Xomt nalskall erte Zusa mmcnh an gsm eje ha ben einen \Yerh,lwJ"{'ieh \'011 U bis 1. Xullbedeutet kr-in Zusammenhang: eine ein s giht PÜl perfekt en Zusammenbang a n. Sie sind
Maß e /Ur- zwei .",milwl,ka/ie.le Merkmale
l,l !)
vorzeichenlos. well die Ausprägungen nominals kalierter Merk ma le keine Ra ngord nung aufweisen .
7.3.1 Konti ngenzkoeffizient C und Crem ere V Cramers V und der Konringenz koeflixh-nt C sind y2-basil:'rtl' Zusammenhan gsmaf"l:'. Ansga ugspun kt zur Berechnung von \ 2 (c hi 2 ) sind die heobachteten Häufigkelt en fb (i j ) lind die Iwi staüst tscher Unahhäng jgken erwarteten l l äufigkoiten f €(ij ) , d ie in den Tabellen 7.,1 un d 7.;) a uf S. 1,1:3 dargestellt sind.
.1(' gr iit \'T (Jie Dilft'rr nz zwisdlP ll beohachteren lI11d erwart eten ll änfigkeltcn. umso st är ker weichen die Da ten vom Modell stat istischer Unab hängigkelt ah. \ \"ie man in Ta belle 7,4 sir ht .lehll!'l1 140 1 IH's tdl'llIsr!le ß t'fragte einen Sdl\\'angersd laftsahbrudl ab (lin ke ohere ZI'1I('). ß !'i statistischer Una bhängigkelt der belden Merkmale Erhebungsgebiet un d Einstellung ZU Ili Schwangerschaftsabbruch müssten ca. 1203 (1202.9 ) westd eutsche Befra gte einen Srhwangersrhnftsabbruch ablehnen {Tabelle 7.5). Die DlffeTt'IlZ zwischen den beobachteten un d (\1' 11 erwa rteten H äufigk-in-n bet rägt für die lin kt' ohrrf' Zf'ile f b(;j ) - f e(ii ) = H Ol - 1202.9 = lOS. I. Es habell meh r westdeutsche ßefragt.' (198.1) einen Schwangerschaftsabbruch abgelehnt , als wir t'!; bei statistischer Unabhängigkeit beider Xlerkmale er war ten würden. Die Differenz zwischen beobachteten lind erwarteten Hä ufigkotten muss für j{,lll' Zolle berechnet werde n. Die SUIIlIllf' dieser einfachen Ah\wi dlllllgl'll für alle ZI'Ilt'1l ist bei j eder Kreuz tabelle nullund deshalb als :-" Iai. der Abhängi gkeit. beider Merk male ungeeignet . Die Differenz zwischen erwarteten II l1d beobachteten Häufigketten wird deshalb qecdri ert: ( f b(;j ) - f~ l ;i ) ) 2 . D urch dir Quarlrlerung falle n dit> negat iwu Vorzelr-hen \wg. Zudem werden groso Abweichungen der beobacht eten VOll den erwarteten Hä ufi gketten stärker gowl-ht et als kleinen Abweichungen . Ob eine bes t immte Abwetdm ng a ls gro i. oder klein III bewerten ist , hängt au serdem davon a h, \\"il' groi, die erwa rtete I1ä ufigk.'il ist : Sowohl in der Zelle links oben (fll ) als auch in der Zolle rechts unt en (f22) bt't riigt die Difforeuz zwischen erwarteteu undbeobachteten ll äufigkeiteu 198,1. Dips.' Differenz fallt bei einer er wartet en Häufi gkeit HlII 1202 ,9 (links olwn) weniger stark ins Gewicht als bl'i einer erwart r-t PU 11auli gkei t von 477 .9 (rech ts II nt en]. Die qnad riert e Differenz (fb(ii ) - f t( ;j ))2 wird doshalb an der erwarteten Häufigkeit einer Zelle f . (ij ) relativk-rt:
l5U
ZU~d mnIC"lla "g, mt schule
74 1
21!) i;j 1ü4!J
4üll I ss
"
101 t
244 22!) 103 ü;j;j
Summe
310 662 1445 637 265 :j:J] !J
Q " d l,', ..\ LU ll·S Ifl'J·!
Ein Befra gter kann z, ß. einen .H a up tschula bschluss- und ..kein politisches Interesse- ha ben . ein anderer einen .Healsehulabsehluss'' und ,.wt'llig pol]-
MuP~
jü,- zwei onli"ul,ku/ie ft e
157
!Ifnk"'ul~
tisches l nreresse-. In der Logik des Paa rvergleichs wird diosos Paa r als ko n kord ant oder gle ichger ich t e t bozeichner , da der zweite Befragte einen höheren Schulabschluss und ein höheres politisches Int eres se hat als der t>r.-;tt' ß pfra gtt>. Ein P a a r wird als konkorda nt be ze k-hm-r, wenn c1it, Person. diE' einen höheren \ \"\'rt auf der einen Yariahlen aufweist . auch eiue u höhere n \\"I'rt auf der anderen Vanablen ha t . Konkordante Paare deu te n au f einen posiiincu. ZIL,~amm cn}Ulng zwischen zwet Yanu hlen hin. Insges amt gibt es 228 Personen mit .I la up tschulabsch tuss- und .keincm politischen l nteresse'': 2U9 Personen haben einen •• Rcelschulabschluss lind "w('nig poli tisches In reressc''. Al l" 2U9 Personen dieser ZellE' ha ben einen hiillPrpn Schulabschluss un d ein grii" erl'S polltlsches Interesse als die 228 P,' r.-;OIll'11. dir- in der Zelle links oben verortet si nd, d. h . si" wetson bet briden Merkmalen .nu-hr- auf Dip Auzal ll konk or danter Paare ( N~ ) dipsl'r belden Zellen berechnet sieh aus dor :-' Iultiplikation der Zellhäufigkeiten. als o 228 x 209 = ·t7 .0;:"J2 Paa re. dP1lI1 jeder Befra gte aus der einen Z(,][" bildet mi t jedem Befragt r-n der an deren Zelle ein Paa r. A II(' PI' [S(l IW l l, die sich in Z,'l1pJ] rechts ,m d un ter halb einer Ausgangszelle befinden, ha ben a uf beiden vlerkmalcn einen höheren \\"ert , Die Za hl der konkordanten Paa r" für (Hf' link!' oberl' Zf'I1 f' (228 Befra gt e) Iwr,,1"\1II1'1 sieh daher als 228· (209
+ 07 + 4GO + 24·1 + 189 + 229 + 87 + 103 ).
Zur E rmittlung der GCM17ntzuhl konkrmlrmt e,. ['UUf 'C wi rd jedp Zelle der Ta bo lle ein m a l zur Ausgangsz elle. Zu den Zollen in der un tersten Zeile sowie in der äUh('rstpn rechten Spalte existieren kelno Z"II(' II. die recht s und unterhalb liegen. Man fängt am besten in der linken oberen Zelle mit der Berechnun g a n: N~ :=
228· (20'J + ,16U + 11:\9 + 87 + ü7 + 2·14 + 22\J
+ 72, (67 + 24·1 + zas + 1O:~ ) + 3M· (-WO + 189 + 87 + 2-1 -1 + 229 + 1(3) + 2(>!=1 · (2·U + 229 + IO:J) + 741 · ( IS9 + 87 + 229 + 10.1) + -WO · (229 + 103) + :.1 19 · (1:\7 + W:J) + 189· (Im)
+ 103)
1699::;0 1
Es kann jedor-h vorkommen, {lass eine Person einen "Rpalsd llllabsl"hlllSS" erworben hat und nur .wenlg- politisch interessiert ist, eine andere Pers on
158
ZU~dmnIC"lla"g,m1erm it teln wir also 1.69!Lj U1 konkorrlame und 786 .5.1'i' diskordaure Paart>. Überwiegen in einer Tabelle ~ \\'il' in diesem Fall - dip kon korda nte n Paa re. so liegt ein pos it incr ZIJ sammenhang \ '0 1'. Der Zusa mmenhang zwischen zwei Variablen ist negativ, wenn P S meh r d iskordante als kon kordante Paart' giht. Zwischen beiden Variablen besteht keui Z uBammenhang, wenn die Zahl konkorda nte r und disk ordunter Paart' gleich grob ist.
Bei 111'1' ß I'rl'd ul1l11g des Ordtn atmase, i wird nun einfach IJjI' DiRn enz zwischen konkordanten lind dis kordant en Paaren ins \ 'prhiih llis zu allen konkordanten lind diskordant en Paaren ges etzt:
Maßt' für zwei orJillllls!; 11 = 11 2~ befragten Frauen belaufen sich die Xlathemarikkenn misse a uf durchsch nu rlieh 288.1-t Pu n kte be i einer Varia nz s'l \"011 lKI(i , ~6. Dte Frauen schneide n also gr ringfiigig (um 8 P unkte) schlechter ab als die Xlän ucr. Abbil dung 1.2: Kennt nisse in Alltagsmathematik nach Gt>sehl,'cht _
_
' M
Fra"""(""' __ · a ·1124j
!
••
"'
••
L\ LS. Deutschland 1991.
\ Yir prognostizieren nu n für :'. Iänlll' r 29G , 1 ~ P unkte und für Fra uen 288, !-t P unkte au f der Skala . Wie man in Abbildung 1.2 sieh t, weichen di e Mathematikkennmlsse de r Frauen und :'. Iätlllt'l" von lhn'm jt'1\"f'il igl'll G ruppennuttelwert ab. Dir Su mme der Abweichungsquadrate wird jetzt get rennt für Männor und Frauen berechnet:
164
Z!j~u",,,,,,,,I""'Y"fI"J.ße
,~
SAQM.innee =
2:) X;- 2% . 14 )2 =
210 36 17
lind
'= 1 112 1
SACh", ,,t n =
2:) Xi - 2SKi.t)2 =
20K6G59.
i od
Im Beispiel bet rägt die S.-\Q bei den xlä nnern 2.1U:J.G17 und bei den Frauen 2.08G.GG9. Di e Summe dieser beiden W('rh' entspricht (km Feh11' 1", der !ll'i (11'1" " orl wrsagt' t11'1" \ lat hPl1Iatikk('llntnisst' be i Ken ntnis (11's Geschlechts began gen wird (F('h lpl"2): SA Q~'at = 2 1036 17 + 20tiGG59 = ·1. 1HO.27f:i .
0 1'1' let zte Schrit t best eh t in der Ermit tlung des PR E- ~ l a bt 'S {Sch rit t 3) . Dip :-" Ia bza hl 1/2 be rechnet sich nun ein fach aus der Differen z von SAQ y-. und SAQ kat dividiert durch SAQyc.:
2 Fehler, - Fehler2 Tl =
SAQg,. - SAQkat
Feh ler,
17. 1'1
S AQy.-
Im Beispiel !:'rgih t sk h:
2
" ~
SA Qye. - S AQkat S 'Q , .-'
geo
~
·12229;') 6 - 4 190276
."""' (1 ;" """"vU
= 0 ,008 .
2 hat einen werteboreich von 0 (kei n Zusammenha ng ] bis + 1 [perfek ter Zusa mm enhang), E in Zusammenha ng der Stärke 0,00 8 ist zu vernachlässigt' Tl (kein Zusammenhang]. Da d as u nabhä n gige Merk mal nominalskaliert ist , is t '/ mrZt'id u'ulos. TJ2 ka n n - m it 100 multipliziert - prozentual mrer pretiert wen]P Il. Der Fehler bei \'or twfsagf' der Xlat bemat ikkeu nn tulsse wird durch die Kennt nis des Ge schlecht s der ßE'frag te ll u m O ,OO~ . IOO = 0, ~ % vorkloinert .
1/
C clcgen rlich wird auch di e Q uad rat wu r zel aus '12 als M a b der Stärkt, des Zusam menhangs angegeben:
M aßt' für zwei ", tlri~dle M crlmwlr : KUV(lf lUIl Z ,,11(/ P rud,,/;t-MulII"fll-Kurn:lul iufl lfilJ
T} =
R .
(7.1;))
7/ kann ebenfalls Werte zwischen U lind + 1 anneh men . Im Beispiel rosult icrt
Tl =
R
=
V O.0077 =
om.
Auch I} ist nahe null . Bei den Befragten des IALS 199.J ist da s Gl'sehlt'eht zur Erklärung unterschiedl ich guter Xlathemattkkenntnte«- bodeutuugslos.
7.6 Maße für zwei metrische Merkmale: Kovarianz und Produkt-Moment-Korrelation Kovarian z und P roduk t-Moment-Korrela tion UlI'SSt'1l die Stärke des linearen Zusam menhangs zwischen zwei mindestens intervalls kalier teu [motrisehen} Merkmalen. Die Produkt-Monu-n t-Korrelation wird nach dem Statistfker Ka r! Poarsou auch a ls Pea rsons r bezeichnet . \Ypu n ohne näh ere Angab- von Korr elati on gesprochen wird. dann ist meistens der Pea rson 'seht' Korrela t ionskoeth zteut gerneint. Auch hier soll die Berechnung wieder an einem ß eisp it'l verdeutllcht werden. Die C DU wurde nach dem Zweitr-n \\'t'lt kri pg ab üln-rkonfcssl onclle Partei gegründe t. Da sie das ..Erbe" der katholischen Zentrumspartei ant rat. liegt die Vermutung nahe, dass auch die e DU lx-sonders in katholischen Gebiete n veranker t ist , was sieh in den \ \"a hh>rgf'll1lissf'll nil'derschlagen müsst e. Unsere Il ypotht'st' lautet : .,J(' hi.lwr der Ant eil der Katholiken in einem Bundestagswahlkreis. umso höher ist der Stinuueuanteil dor C DU··. Die 1I ~· I)()l h ('S(' soll a nhan d der am thohen Ergehnisse der Bundesta gswahl 199" für dit' 16 rholnland- pfäl vischen Bundestagswahlkreise überprüft werden. :\lerkmalslriiger sind hier a lso nicht Personen. sondern \ r ahlkn'is('. Für jeden der l f Wahlkreise liegt «in :\I\'ss\\"f'rtpaar vor, das.~ a us dem Kat hollkenanteil (Xt) und dem Stimmenanteil de r enu (U,) besr eht, Da es sich hier lllll ProzPlItwt'rtl' handelt. slnd hehle Merkmalt' ranoskaltert ,
Hi6
ZU~dmnIC"lla"g,migt nicht . sondern sif' fallt mit zunehmendem \\"rr! von x . Dtc Steig ung der Ger aden liisst sich au ch imm e r als das Verhältn is einer Di fferenz zwcler Punkte auf der !I-..-\ehSt, zur Differen z derselben Punk te a uf dE'I" .r-Achse an geben . Bet racht en wir dazu die G erade recht s oben in Abbildung 8.1. Zwischen zwei P unk ten mit den Koordi na ten (rl; .IJ!) =
(2; 5) und (J'2: !l2) = (-1 : 10) liegt die Differenz a uf der y- :\thsp von Y2 - v. = 10 - ;) = 5 und auf der .r-Achse von I2 - X l = ., - 2 = 2. Eine andere
179
Bezeichnung für denselben Sachver halt ist ßY = 5 lind ß X = 2.2 Dies wird auch a ls .S teig un gsdu-ie-k' bezeiehnot , da der Quotient ß } '/ ß S di p Steigung der Ceraden an gibt , im Beis piel 5/ 2 = 2,5. Dips bedeutet, dass }' tuu 1,5 Einheiten a nstt>igt, wenn X UII1 eine Einheit steigt . Abbildung 8.1: Versehteck-no lineare Funkt ionell
::0,-f'~'-"~" '-----------,
ZD
"
"ro
v ~l,~,
,u" ;; vom ~lith'Jwert Cl/i - 1/) soll e rklärt werden. Si!' läs."t sic h a uft eilen in elit' Abw"id lllllg des bl'ob (lrhtt'tl'lI 'Y"rlt>;; \ '01\) St"h ätl l\1'r t rler Rl'grpssiollsgl'r at!i'n (Yi - Üi) mi/ i (lip Abweichung des Schät zwertos rler Rl'g rf'Ssiollsgl' ra d l'll Will Mlttelwert (!ij - V) . Die DiffPH'1l7. Yj - !I kann mit H ilfe de r Regresston von }' a uf .X erk l ärt werden. Die D ifferenz y, - Yi kann nicht anf X zurück gefüh rt werden , sil' bleibt uncrklärt.
+
f!:-:;.l!, ~r k läl1. ' Iab für die Güte der Regresston. H2,
(8.10)
Zur Verdeutlichu ng der
PR E- ~ I H b- L()gi k
kann man auch schreiben:
H2 = FehleI" , - Fehlt'1"2
Fehler j Gesilmt. S.-\Q.. . - UIlf'l"k läl"h '.S.-\Q.. . GI'Salll t-S.-\Q v
L:" (y, - ü1' - L:" (y, - .Vl' ~
O''---_"__
i, ..
"'O ~~ '
L:" (y, -
i: l
y)'
_
(8.11)
187
Die G('~alllt -S:\Q g in Gleichung 8. 11 ent s pricht den Fehlern bei der 1Ifsprünglichon P rognose (Feh len}, die Ulwrklä rtP-SAQy den Fehlern auf Basis der IWIWTl P rognose (Fehler-]. Die Differenz gibt die Verringerung der Fehler durch die IIillm ziphllug der lIuahhängigt-'lI Variable an. Die G ]pidl1lllgPII 8. 10 lind 8.11 sind na türlich identtsch. d a Gf'silmt-SAQ g Ul\prk lär t('-SAQ g = Er kliirtp-SAQg. .
hat " i1wJI \ \"t'rtf'I Wfpieh von 0 bis 1. H 2 nimm t den Wer t 0 a n. \\'('1111 die unabhä ngige variable X di e Vorhersago nk-ht verbessert. In dies em Fall ist auch b = 0, .le gröf,{'f J{2 ist , des to gröt-I'T ist de r Ant eil rh-r erkl är11'11 Varia ttou der ahhängigl>lI Variablen. ßpj J{2 = I liegen alle Messwerte auf der Rpgrrssi ollsgeradpll . Dip Unt erschiede in der ahhiillgigl'll Variable lassen sich dann vollständig (zu 100 %) auf die una bhäugt ge Variable zurückführen. j{2
Um die Berechnung von U2 in unserem Belspiel duroh mfüh ren . erwettort man Tabelle 7.lU (5. 171) IIIl1 die Spalten zur Berechnun g von y;, 11; - y;, (y;- y; )2. y; _ fj und (fi, _ y)2, Die entsprechende Tahelle s.r ist auf Seite 189 du rgestellt. Durch EinSl'tzpn der .r;-\\"el"tp in die Regrosslonsgtoichung lassen sieh die
y;- ,,"prte berechnen. Die Summe der quadrierten Abweichuugen 2: (Yi - iiJ 2
ist die une-klärte S:\Q von }', di r Summe der quadrierten Abweichungen L: (üi - y)2 ist d ie er klä rte S:\Q \ '011 V. Dip unorklärtc S:\Q b(,triigt 85,..19, die erklärte S:\Q 23 l.(l5 und di e gesamte SAQ 3 15,87.3 H2 lässt sich na ch G leichung 8.10 wie folgt berechnen:
hZI\". alternativ nach Gleichung 8.11:
3
Allfjq llllli u m Bu nd ll"" sll"" ,'nmü" k"il"" "Bls!,ridl!. dip Sn ", " ,,' allS ,·rkliir!.,·r " ",I uncrklärter 8 ..tq y (K ,._I' 1 + 2:11.(1" = :Illi.!" :l) uk'ht exak t der G(,>;mnl-Scl q y (:l 1!';,X? ). SPSS " nniu"l t 'll"' rklär tt' S AQg VOll X' ,, !';21'l , pin!' "rk liirw SAQ . \'011 2:1O, :11I 1illd eine G" Stzt metrische fJbhällg ige Me rk mo l e \ "O I"llUS. I n den Sozlalwis sens r-haften haben wir jedoch häufi g: keine metrischen Xlcrkmnle. Etwa dan n , wenn wir die Wahlabsicht von Befra gten (nominal), die Erwerbs tätigkeit VOll Fra uen {dichot om] oder die Stärke des polit jschen Intf> l'f'sSl's (on linal) erklären möchten. Auch für kategor iale Dat !;,11 extsüeH'II Regressionsmodelle . Eine leicht verständliche Einführ ung findet sieh bot Andre], Pt ,,1. (1997. Ka pite l 5).
Aufgaben zu Linearer Regression l. Wt>1chf' Frages tr.llungen könne n mit Hilfe de r RI'g rf's." io n 1l1'a nt wortf't wf'rdl' u'? (Bit te lu-ant worten Sie dil' Fra gl' iu ma xim al 2 Sä tZf'Il). 2. Sie möchten W iSS!'Il. welchen Ein fluss der Ant eil der Ka t holiken auf da s wa hk-rgebnis de r SP O bei de r Bundestagswahl 19!)-l in RheinlandPfalz ha ue. In der Ta belle sind für jeden rheinland- pfälaiseln-n Wahlkreis de r Ant eil der Katholiken X i lind das \Yahlergehll is der SP O lIi wierIt'rg('gl'h('lI. ß iu (' be rechnen Sit' dip Rpgressiollsgprade! Ist die ennittelte Regn-ssionsfunkt lon eine gut e Schä tzung des Wa hll'rgPlmisSI's de r SP O'! Borechnen Sie zu r Bea ntwort ung d ies er Fra ge das ß es t inunt heltsmas R 2 ! Inter pretieren Sie alle errechneten :-. rabe inhalt lich!
! \Vahlkn'is Neuwird Ahr weiler Kuhlenz
Cocla-m Kreuznach Bit h Ufl-: "l'rier Mout aba ur
Muinz \\'Ol"lIIs
Frnnkent ha I Ludw igshafon Ncust ad t -SIJl·}...-r Kaiserslauter n Pinuasens
Südpfalz
r ! I I55.55 4U.96 ./I;
8 1.(19 7:.1. 14 7U,78 :.1 2,60 !H ,40 87.97 50.76 51.36 :.12.81 :.1 1.98 38.01 45.61 34.89 45,!l8 55.07
3-1.17 :l7.9:.1 :.12.84 44.01 32.72 39.60 42.21 :lü.55 42.42 43.1ü 40.8:.\ 3M 9 46.70 41.66
ae.ca
3. Berechnen Sio für das obtgo ßt'ispi p] den Korrelarlouskoefttztenten au s den r-inzolru-n xlesswcn on und aus dem ßea im nuhettsmas!
9 Stichprobenziehung 9.1 9.2 9.3 9.4
Gr undlageIl Zufallund Wahrscheinlichkeit Zufallsges teuerte Answahlverfahren Nicht zufallsgeste ue rte Auswahlverfahren
.
195 201 20~
2 1!J
Um Angaben tlhe r die St ru kt ur der ß f'völkrr llilg zu erhalten . werden von amt lieber Seit,' r('g(' l m ä~i g Volkszählungen durchgefüh rt. Dip let zte Volkszä hl ung ist scholl eine Weile her . Sie fand in d er B undesrepublik im J a hr 1987 un d in der DDR im Jah r U181 statt. Erhebt ma n die Da ten wie im Fa lle von Volksz ählu ngen bei allen int eressierenden Unu-rs uchu ngsemheiten - hier a lso bei de r gesamt en ß evi\1 kpfl mg eines Staa t!:';; - , dann spru-ht man von einer Vollcrhclnmg. Eine bedil ke rnll~wf' it e E rhebun g wie (lif' Volkszählung ermöglicht unt er anderem fein gf'glit'llertf' reg tona le A ualvsen . Die Kehrsone der Medaille ist allo rdlngs. d ass bevölkerungsweite \ ·01lerh ebungen se hr kosten- und zeitintensiv si nd . Nach Angaben \ ·011 Dick mauu (200S. ;375) kost et e die Volkszählung i 9S7 11ll'h r als I Xlillia rde 0 \ 1. Die Aus gaben fü r ei ne IWU , ' Volkszählung in Deutschla nd werden noch weit a us hiilwr \"f'l"allsdlla gt . Das Stat ist ische Bundesamt sc hä t zt dif' K os ten a uf r-a . 1AG Mrd. E uro , d as Deutsr-he Inst itut für \rir tsch aftsfo!'Schllllg a uf r-a. 1 Mrd. Eu ro (B unrlesmin ist r-ri um des Irinern 2011G: Wag ner 200G). .Aus Kostengrü nde n wird der näe hstt, Zt' llSUS im Jahr 211 11 da her keine tradi tionelle Volksz ä hlu ng me hr sein . Staudes sen wird ein re9L~terYlesst> nicht rk hli g notiert wurde. Zu einer Minderung der Stich prob enqu alit ät führen dagegen nicht st ichprobenneut rale bz w. syM emati.~ehe A usfälle tNon- Iiesponse E rr o r' s, Dit,SI' werden d urch das Unt ers uchun gsth ema «der das Unn-rs udl ungslles ign verursacht. Ein sys h'lIlatisdH'r A usfall I.ä gt' r. B. dann vor . IVI>nn im Ha ushalt nie j em and anget roffen wird , weil alle Ha ushaltxan gehörigcn berufstätig si nd , oder Berufst ätige häufiger Il US Zeit gründon das Interview verweigern. Ein syst Plttat isd wr Ausfallbestände auch dann. wenn vnr allem Bofragu- mit rechtsext remen Einstellungen eine ß efra guu g zum T hema Iiccht sext rcm ismus a blehnen. In beiden Fälle n wäre n in der St ichprobe bes tim mte G r uppen - Ber ufst ät igo bzw. Befr ag te mit recht sextreII WIl polirischen Einstellungen - im Vergleich zu r G rund- bz w . Aus wahlgesa mt hei t unterrepräsen tiert . Die Stichproben würden syxtt-ma t ist-h YO II
der Gnnulgesamr heit abwelrhen . O b ein Ausfall stichp rohenne utra l ist oder nicht . lässt sieh nur sr-hwt-r feststellen. Bei mündlichen und telefonischen Befrag ungen können die l ntcr vicwer na chfra gen. warum eine Pe rson die Teilnahm t' a n der Uuters urhung ab lehnt. In Tabelle 9.2 a uf der gegen überheg enden Seite sind d ie Ausfälle YOIl Befra gungspersonen bei m ALLß US 20(J{i wiedergegeben. Wie man sieht , gibt es nur sehr wenige s tichpr obenneut rale Au sfalle , zu denen Xicht-Befraguug aufgr und falscher Adressen, Wo h UllUgS\\'f'{'hspl und T od gezä hlt werden. Personen, d ir nic-ht in Privath aushalten wohnen , zäh [P li qu a Dofinltion nicht zur G rundgesamtheit . Br.lm A LLß US 200Glu-lief sich der Ante il st ichprobenneutraler Ausfällc a n der Brut tos tichprobe a uf 11 %
IUU
G nm dluY" 1l
in wcst- und 9.2 % Ostdeut schland . Dte systema tisch e n Ausfallt' rosult leTI'II ZUIll gröst en Teil aus lJej ra guIl H.51!t'T w ci.qcn m rJf 1l. Dies e werden zu den syxtemat.isa-hen Ausfällen gl'zählt. II'l'il man davon ausgeht , dass sich dil' P I' ThOIll' U. die eine Teilnahme ver weiger n. von den teilnahmebereiten Personeu unter scheiden (vgl. Dickma nn 2008, .l22). Ein sys te ma tischer Ausfall liegt nar ilrlich a uch da nn vor. wenn eine Person nicht in der Lagt' ist. ein Interview in deutscher Sprache zu führen. Dips!' Ausfällo füh ren zu eiIW f Unterrepr äsent a tion Will Xügrauu-n in der Stichprobe. Migranten. die FfagPIT in deutscher Spra che beantworten kiinuen. unterscheiden sich Spllf wahrscheinlich auch in a nderen :\It'rkmall'll \'011 Mig runt en. d il' dazll llit:ht in de r Lage sind (z. ß . im Bildungsniveau ]. Ta belle 9.2: Ausschöpfung heim ALLß lfS 200G W e >;t u
Ursprüugli..he Brut tru;! ichprobe
Zus ätzlich eingesetzte Adres sen als En;.at~ fiir ~tid'l'roh"ml('utr!\le AusmII" Bruttostichprobe S,iehprolwm'{·llt fi,I,· AusfiiH,' ill~I!;''S(2 oder-t m\t'r 6) = 1'(2U4 U6) =
3
1
G= "2 =
0.5 . (9.2 )
Dem entspricht die Addition der Einzelwahrscheinlirhkeiteu (Add it ions-
theorr-m ], weil sich l\it· mög lichen Ereignisse des Zufa Jlsexpt'rinll'llt s .einmaligen Werfons eines Wür fels
1>(2) + 1'(4) + 1'(6)
1
gq~t' n s{'i t ig a ll ssth l it' ~t' ll :
11
:11
= Ü + (1 + (3 = "6 = :2 = 0.5 .
(9..1 )
Die Wahrschetnltch keit des Wurfs einer geraden Zahl lx-trägt also 0,3. :-' Ian kann auch da nach fragen . wie wahrscheinlich t'S ist , zweima l hin tereinander eine 6 zu werfen , also pillE' 6 /l1HI noch einmal elne 6. 1>(6 n 6 ). Insgl'Salll t ha t das Expemnent Z\wim alißI'S \rl'rfl'll piJll'S \riirfl'ls :36 EIementarereign isse (Talw111' 9.3). Das g ill1s t igt' F:feign is ist (G. 6). Eines der ;3(; möglichen Erei gnisse ist das zweimalige \ rt'rfpn r-inor G. also ist di e Wahrscheinlichkeit p(G n 6) = 1/ :36. Die wah rschoinllch keit lässt sich a us dr-t Multiplikation tief Einzelwah rsrheinlich kei ten [Xlultiplikationsrheon-rn für unabhängig- Ereignisse) berechnen:
2U4
Slj{'hplVlH: 'flZ j~J.Il"!I
Ta belle 9.3:
~ löglidll'
Ereig nisse lu-im zwelmal igen Wor fon eines \\" iirf,'ls Er gebnis
-') ' i
dE'S
I. Wu rfs
-4GG
(1,1)
(2,1)
(3,1)
1',1)
(5,1)
(G.I )
2
(1.2)
(2,2)
(3,2)
(4.2)
(G.2)
(G,2)
3
(1,3)
(2,3)
(3,3)
1',3)
(5,3)
(G,3)
(I ,')
(2,')
(3A)
(',')
(5,.l)
(G,')
(1,0)
(2,0)
(:1,5)
(',0)
(G,5)
(G,O)
(I.G)
(2,G)
(3,G)
(' ,G)
(5,G)
(G,G)
G
1' (6) x P (6)
= ~ . ~ = a~i = 0,027 .
(9" )
Die \Ya hrsd winlichkl'it. zweimal nachei na nder ein e G zu werfen. Iw trägt also 1;''3 6 bvw. 0.027.
\\"pi! man beim \\"iirfpln hä utig an hohen Zahlen inte ressiert ist, könnte man aueh fragen. mi t welcher \Yahrsehpinlichkl'it man zweimal hintereinand er ein.. Zah l größe,- als .. wir ft. Diese \Ya hr.;c1winlichkeit lässt sich d urch Auszä hlen leicht hes nmnu-n (Ta be lle 9.3) . Sie be trägt 4/ 36 = 1/9 = 0.11. \nl' werden im nächst en Kapitel 1I0di einen anderen. den Irrquentis tlsehen, \Yah r.;d u'illiiehkf'itslwgr ilr kennen ler nen. Eln e üla-rsich t hcho Einftthrung in die \\"a hrst:heilliit hkl'itst h,'orip findet sich l)f'j Kühnel und Krebs (20(}7, 107-127).
9 .3 Zufallsgest euerte Auswahlverfahren Ein Auswahlverfa hren wird als zufällig bezeichnet. wcnu j ndr- Einheit der Auswahlgesamt heit ein e gleiche bzw. rine ungebbm-e lVahrschrinlichkeit
gr öscr null hat , in die Srichp robo zu gelangen. Die gleich e oder be kannte Chance wird durch Zufallsverfahren realisiert . Wollen wir eine Stiidwt:'t sein llIUS.1' Grumlge-amt heit gf'wählt, rlann spricht ma ll von einer proportional ge.~ch ichtetell St ichJllVbc.
212
5 ti1'/,JIIV ocnzit "!l"!J
In der Hl'gt'l e ntscheid et ma n sieh jedoch für geschichtete Stichproben. wenn eint' (1(11'1' meh rere Auspr ägungen r11'S Schichtmerkmals bei einer einfachen Zufallsauswahl nicht in hinreichender Zahl in der St iehpro lw vert roten wären. In solchen F ällen zieht man ('iw' düpmpOlt ior llll ye,w:hich td e Stichprob e. in 111'1' die Ant eile der einzelnon Schichten fl i cht den Anteilen in dor Grundges amtheit cutsprechen. Dip Interessierende Schicht wird überrepräsen tiert. Im Gq ;ensa tz zu den zuvor besprochenen einfachen Zufallsauswahlen hat hier jPdes Element nicht meh r d ie gb-ichc, sondern nur noch eine Ilfkm m t e bzw. all gc b!m7'C Chance. in di,' Stidlprohe zu gelangen. Im ALLßUS wird für \\"est- und Ostdenr schlanrl die Stichprobenziehung gp.. trennt vorgenommen. lind zwar so. dass dle np \"Ül kefl lllg Ostdeutschland s in 111'1" Gesumtstk-hprobe im Vergleich ZUI" G rundges am t heit ülx-rrepräseut iert ist. Durch die disproportfonale Schtchmng wird er re icht, dass die Fallzahlen für separate Analysen der ostdeutschen Befragten a us reichend hoch sind . \\"I' I"let ma n boide Sti chprob en zusammen aus. dann muss die unterschiedliche Auswahlwa hrscheinlichkeit für Ost- und \\'I's t' !l'u tschp wieder rüc kgängig gent acht werden. Dips ges chieht durch eint' Design-Gewiclu uug (vgl. für den .-\ 19% wasmer et al. 19%. GI f.) . ß I'lI11 A wird Innerhalb der Schichten - in Ost- und \ \"l'sldl'u tsc hlan ,1 - eine mehrstufige Zufallsstichprobe gl'lOgt'n.
nnus
n nus
Gl's("hichll'l p Zufallsa uswahlen set zen voraus. dass rlie Verteilung ,II'S Schicht merkmals in der Grundgesamtheit beka nnt is t. Auserdcm muss für jede Auswahleinholt das Schicht ungsmerkmal feststellbar sein.
Klumpen auswahlen KIllIllPI'llstid lprolll' 1l hieten sich immer rlaun an , wenn man den Kontext . als o G ruppenz usa mmenh änge. untersuchen möchte. D ie Auswahl bezieht sich nicht auf Unters uchun gscinln-iteu , sondern a uf Aggregate VOll Ur!· tersucbunqseiulieiten: so genannte Klumpen. Von einer Klumpena uswah l sp richt man nur da nn, wenn alle E It 'IIlI'IlIt' eine, Klumpens in die Stichprobe gelangen IlIHI die Element e des Klumpens die Unn-r suchungscinhein-n sind. \\"pun wir dir' Vermutung haben, dass d ip Studlenwünsche der einzelnen Abiturienren von de n Smdienwtlnschen ih rer ~ fi ts(: hiill'r abhängen, wäre eine Klum pens tichprobe a ngem essen . Die Klum pen wären in diesem Fall Schulklassen. Es würde also ein e Ausw ahl von Schulklassen get roff en. Alle Schüler der a usgewä hlt en Klassen wären in der Sti chprobe.
213
Klu mpena uswahlen haben bei gb-ichor St ichprohengrük in der Regel einen grüb"n·n Stich probenfehl er als einfa che Zufalls a u swahlen. \ 'or all em dann. wenn die Klumpen in sich sehr Itolllogl'n snul. sieh a ber stark voneinando r unt erscheiden. Wärou die Gymnasien l)f' i~ p i pls wp isp stark fach lieh ausgerichtet [u-chuische Gymnasien, , r irt Sl'ha ftsgylllu asipn, Gy mnasi um mi t fremds prachig em Schwerpunkt] . dann dü rften sich die St udienwünsche \" 011 Abit uri enten von Gymnasie n mit verschiedenen Schwer punkten sta rk unterscheiden. , rU n!" z. B . eine Kl11SSp eines "'i rtsdlll ft ~g)"m ll aH iu m ~ a nsgl'wä hlt. dann könnu - ma n an nehmen, rlass sich d it' S tlu1il'llwiinsd w der Schüler erheblich zugunst en \\" i rt s("h a ft ~ \I' i ssr ll sdJ a ft lid lt'r Stlll ]jl' IlZ wf'igl' von allen Schülern untersr-helden. " 'ir hä t ten a lso eve ntuell eiueu für die Grundges am theit .untvpis ehcn' Klumpen gezogen. Da alle Schüler dieser Kla sse in dto Suchprob e gelangen. fä llt die Abweichung erheblich ins GI'wicht.
Mehrstufige Zufallsauswahlen Mehrst ufige Auswa hlen sind r-iue Reihe nacheinander dun:hgcfülwtcr Zu[ allsc usumhlcn. Au f de r ersten Stufe wird eine Stichprobe a us Gf 'Up1JClI
Vall
Elementen: den Pri mö reinnedc n, gezogen. P rtmä n-inheitcn sind häufi g rcgionale Einheit en wif' Gf'lllpindf'1l oder Stitumbezirke. Aus rlen Ele me nt en der ausgewählten P rimä re inheil en wird da nn eine weite n' Stichprobe gpzogen. Diese Elemente sind d ie Scbmdärei7lhcitcn. Dip a usgewählt en Sck uudärclnhciten kön nen Gru nd lage ein er weiteren S tichprobe nzb-hung sein . ..... uf der let zten Auswahlst ufe werden Ehe Unt ers urhungsein hciteu ausgewäh lt . Das " orgplll'n soll zunä chs t am ß l'is pie1 de r St udienwünsche rheinlandpfälzisdH'r Schiller verdeutliebt werde n: " ' ir könn ten zunächst eine St ichpr obe a us allen Schulen ziehen, die " in 13. Schuljahr a nbiet en (G vm nasicn . int egrierte Gesamtschulen] . Dir' ..... uswahlgcsamt heil besteht a uf der ersten St ufe a us den 1..l (j Schulen. an denen d11S ..... bitur er wor ben werden kann (Primärem hei tcn} . Aus den ausgewählten Schulen we rde n da nn a uf rh-r zweiten St ufe Schüler [Sekuudärelnheiteu] allsg('wiihIt . ' \"it' viple Schüler wir P fO Schule lluswäh lpll miiss eu, UtH eine Stkh prollPllgrii t,E' von GOO Schülern zu err eich en , hän gt davon ab, wie viele Schulen a uf der ersten St ufe a usgewä hlt wurden. , renn wir GO Schulen a uswäh len. müss ten pro Schule 10 Schüler a usgewählt werden: wählen wir 2ii Schulen a us. da nn er höht sieh d ie Za hl der Schüler a uf :W.
214
5 ti"hpTlJm:nzid , u II!I
Der Xarhteil mehrstuf iger Auswahlverfuh ren besteht darin. dass man a uf jeder Auswahlstufe einen Stichprobenfehler begeht und sich diese Stichprobcnfehlcr addieren. Der St ichp rotwnfehlcr wir d umso kleiner, je grük r (HI' Stidlprolw uud jl' geringer d ie Var ianz des lnt eressiereurlen :\Ipf kmals in der Auswahlgesamtheit ist. Um den Sth-hprobenfehler au f der ersten Auswahlstufe klein zu halten, müsste n also möglichst vie le Gruppen bzw . P rim äreinheiten ausgewählt worden. Ebenso kann ma ll den St k-hprobouFehler der zweiten Stufe minimieren. Ind em möglichst viele Sck uudärelnheiten a usgewä hlt werden . Im Beispiel müssten zunächst möglichs t viele Schulen a usgewä hlt werden und ans diesen Schulen wieder um möglichst vi!'lp Schüler. In diesem Fall nuuinuert man hl'illl' Fehler durch dle \'I'fgröserung der Stichprobe. Bei gpgplwlwr Süchprobengröse, d ie bl'i uns 500 bet ragen soll, ist I'S jP" doch unmö glic h. gleichzeit ig beide Stichprobenfehler ZII minimieren: J\' mehr Schulen ausgewä hlt werden . umso weniger Schüler IIIÜ~St'1I pro Schule befragt werden und umgekehr t . And ers a usged rück t : Indem man deu Stichprobenfehler einer Stu fe rednziert , erhöht mall den Stichprolx-nfehlcr auf einer anderen St ulp.
Aus dieser Zwickmühle kann ma n sich jedoch befreien, wenn ma n ausät zlieh dil' Homogenit ät der Auswahlgesamtheit berücksichtigt . Die Schüler einer Schule si nd einander ähnliche r als die Schüler verschiedener Sehnleu. \r ä hlpll wir nur wouige Schulr-n aus . I)('st" ht eine gröke re Gefa hr, da ss die ausgewählten Schüler uutvpisch für alle Schüler sin d, als wenn wir mögliehst viele Schul en in de r Stichprobe berücksichtigen . d iese jedoch immer nu r durch wellige Schüler repräsent iert werden. E ine möglichst hohe Zahl an auszuwählenden Primä reinheiten schmälen alll'rllillgs den Effizlvnzvortei l mehrstufiger Srichprolx-n, da wir dann wiederum mehr Schulen Illll Schülerltsten bitten lIliiS~I'II. die Int erviewer [wenn wir d il' Befragung mündlieh vornehmen] woitcro \rl'gt, zurücklogen müssen usw. Xlan wägt in der Regel die Effizienz vorteile weniger Primär einheiten gegl'll die Nachteile einer ungenaueren St ichprobe an und wird einen :\li u\'III,t'g beschn-i teu . Da die Pli m äreinheite7l - im Boispie l Schulen - in der Regel untersch iedlieh gw h sind. müsse n dies e mi t einer Wa hrscheinlichkeit ausgewählt 11'1 '1'den . dle pmj!urtim lld zur ihrer Gl'iiße ist. Man hezpichllPI rlleses D!'sig n auch als PPS..Des ig n (probahili ry proport ional to sizf'), Nehmen wir 1111. wir haben UIl S en tschieden. 500 Abit urleun-u auszuwählen. Au f der ersten S tu ft' SOI1P ll 25 Schulen a usgewählt werd en. au f der zweite n
Stuft' jeweils :ZO Abitu rient en. Die Berech nun g der Auswahlwahrscheinlirhkei t soll nun für ~ wl'i verschiedene Sch ulen verdeutli ebt werden: SchuhA hat 189 Ahiturlenu-n . Schule II 49. \\'ürdpll wir auf der ers ten Stuft' dit, Schulen nicht entsprechend ihrer Criibp a uswählen. so h ät ten beide Sr-huh-n eine Auswahlwahrschelnlk-hkeit \"0 11 25 x 1/ 146 = 25/146 = 0.171, da PS I·tu Schulen p;ibt un d wir 25 Schulen a uswähle n. Auf der zweit en Stufe hä tte ein Ablturh-nt innerhalb der Sehuk- A die Cha nce 20 / um = 0.100 a usgewä hlt zu werden. inn erh al b de r SeImIt· II wäre di e Chance für einen Abi turienten :20/ ·19 = 0.·108. Die Gesamtwahrscheinlichkei t kann man lIC'IW:hneu. indem d i,' Wahrscheiulichkeiteu lwiclpr Stufen tnultipliviert werden . Die Chance , da ss ein Ab it urient der Schul, ' A in die Stichprobe gelangt , würde insgesamt also 0.018 (0.171 x O. 10Ü) be tragen , während ein Abl turient der Schule II mit einer \rahr sch"in!irhkei t von 0 ,07 (0, 171 x 0,.108) in der Aus wahl vertreten sein wür de . \\"il' man sieht . resultieren d ie ungleichen Auswahlwahrscheinlichkeiten der Schüle r aus de r nntersrhiedlichen Zahl rler Abiturienten a n den beiden Schule n. Um dip unterschiedlichen Auswahlwa hrscheinlirhkeiten auf der zweiten St ufe auszugleichen . mu ss eine Schule mit 189 Abiturienten eine grö bere \ r a hrselwinlit hkt'it erh alt en. in die Stichprobe zu gela ngen . als eint' Schule m it 49 Abiturienten. Dip Auswahl eine r Schulp ll\ USS proport ional zu ihrer G riibl' erfolgen. wobei die Grübe einer Schule ihrem Anteilan a llen Abiturienten entspricht:
Za hl der Abiturienton einer Schule Zahl aller Abit urienten in Rheinl and-P falz "
FÜI" Schule A bedeutet dies . dass ihre Auswahlwahrschcin liehkcit \" 011 15 x 1/ 14G = 25/ 1·16 = 0.171 a uf 25 x 189/9700 = 0,48 7 st eigt, für Schule B. dass ihre Auswahlwahrscheinlichkeit von 2;) x 1/14 G = 25/ 146 = 0.171 auf 25 x ·19/9700 = 0 , 126 sinkt [vgl. Tabelle 9.3). Dip \ra hrM'lwill1ichkpit, da ss ein Ahituriont der Schule A in die Stichprobe gela ngt. beträgt jetzt 0.051 (DAS7 x 0.10Ü): die eine s Abi tunent en der Schule II beträgt ebe nfalls Ü,051 {O.l 26 x O..IOS). I Die Wahrschetnltchkct t in die St ichp robe zu gela ngen, ist für (die klein ere) Schule II zwar viel AhWl'id ll llll{l'lI kÜlll11'r\il uf/lfUlUl " uu RUlidulI /ll' ll l' lIt,t ,·hl'lI. B \·j, Jl ;'\",,,:lon 'd ll l\'l1 hiu". llllKl'f1ll 1d" t l' \\"l'f lt'
1·\·rW(·II
2Hi
5 tifhplv b Rl'gion /\·t>fl llitt lu ngs. (Gl t'id lllng 10.1). Beim t üe-maltgen Wprft'll emes W iirr!'1s sollte jl'dt> Augenzahl llugf'rah r Hi oder 1i ~ I a l auft ret en. de nn dip Wahrschf'inlir:hkf'it für jl'd p der 6 Zahlen bf'trägt I j G = O,I G lind 100 x O,l G = lU,G . Bei 1.000 \r iirfl'll sollten deutnach ea. !Gi Würfe aufeine Augenzahle nt fallen. Eine Vorausscr xung des ß eru oulllT heorems ist , d ass eine unendlich häufi ge W it'(ll'rholun g theoreuscb möglieh ist.
P(A ) = tim fPI. llällfigkpit (A )
"- X
(10.1)
Das Bornoullf- T heor em läss t sir-h an ha nd ein es Experime nts illus trteren. \r ir bezeichnen dieses Expenmcnt als Experiment I , d a wir Spä tl'f weite.... re Zufallsexper iment e durchfüh ren werden. Ein P rogra m m , das Zufallszählen erzeugt. ers et zt dabei den Wü rfel . Ein solcher .Z ufallsza hh-ugenerator' lässt sieh so kon st ruieren , dHSS er eine Iwlid)igl' Za hl innerhalb eines gp" gPbt>llf> ll Inte rvalls mit einer lx-stimmten \\'allnieht'inlirhkf>it prodnviert . \\'ir lassen uns eine de r Za hlen 1 bis Gerzeuge n. l\'olJl'j jf'd t' dleser Zahlen glt'i der Stkh prnbf' mit der der Grun dgesa mthei t ÜIll'l"f'i n. Diese \ erlet zung rler \ 'ora USSf't mug rles n e Tl101IIli - Theorems - eine unendliche \\' iedprholllng des Zufallsexp-nments eutspneht einer Vcr grö terung der St ichp robe ins Unendliche - ist aber nur dann relevant. wenn dto Grundgesamthei t nicht besonders groll, ist oder um gekehrt die zu ziehende Stich probt, sehr groh ist. "'t'llIl die Crundgesatut heit die St ichpro1)(' Ulll den Faktor 100 Übersteigt , falIt d ie \ 'erlet zuug di escr \ 'or ausset zung schon nicht mehr ins Gewicht.
Rdat it'~
227
If ijufigkeit u"d Wahrn 'hcil.9 li6. I 90.6 9-1.9
96.'
9~2
9~.2
91J.. 91JI:l 9!l'J
99.' 99.t' 99.H
'000
100.0
1.000
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
2:JU
Abbildung 10,2: Anteilswerte der Zahl 6 IlI'i 100 würfen und 1.00U \ Yiedr-rholu ngen
" .------------------,
"ro
,a
, a
,t
J~ , ,
z
.r · l> 7 R
'"'I rL ..
91011 1~1)14151l>17IRI9~~I22n~425~l>~7~829;o
n lind () zut rifft" gt'II'SI.'11. n Ist d ie Zahl 111'1' Wiederholu ngen des Ik-ruoulhExperimentes (hier: 100 W ürfe), 0 (t heta) = P (A ) ist die Wa hrschei nlichkeit dos int eressierenden Ereignisses (hie r: 1/6 für das ..... uftret en der G), n lind () s ind d ie Pa ramet er de r Biuomialverteilung. J: gibt d ie Hä ufigkeit HII , mit der d HS interes sierende Ereign is eintritt . Die G lt'idlll ng kann leicht hergeleitet werden. Da zu Fragen wir, wir- wahrsehr-inlieh es ist , dass die Zahl 6 bei lOU W ürft' n 20-mal a uftritt. A kennzeichnet das interessierende Ere ignis - das .....uftrcrcn einer 6, A das G('.. gencrcignis - das Auftreten ein er anderen Za hl. \ri r betrachten zunjichst
eine konk rete Sti chprobe
~) . A , ; . " il) . s-mal
(1l -z}-mal
Dip ersten J: Elemente der Srichprobe s ind das interessierende Ereignis. die letzten {n - x) Elemente da s Gegt' rIl' rl' ignis. Beispielsweise könnte in den 20 erst...n \rürf...n ...ine 6 aufr reren . in 11t'1I letzten 80 Würfen eine endere Zah l.
Hiiufi9ktil ~ u
uu d
A IlI ~ilc
231
jn Slid'l!lvbClI
Die einzelnen W ürfp sind voneinander un a bhä ngig. D ie wa hrsdn-i nllchkeit dieser Reihenfolge lässt sich daher durch Multiplikation der Wahrschelullr-hkeiten ermit teln. mit 11"r dif' eillzf'hll't1 Ereignisse auftreten (vgl. Gleichung 9.4. S. 20'}).
L,3 ....mal
,(I - 0 ) . .. . . (1 - 0 ). ~ 0' . ( l - 0)'" - 11 und Anteile in eiufacln-n Zllfallss tit:hprohpn mit Zurücklegen - kennen. kÖIIlH' n wir d te Ab weichungen der St ich pro benkenn wert e vom Parameter der G rundg esanu hoit berechnen. Erwartun gswert und Vari anz
Auch \ \'a hrsd win!ichkeit sn ' rh 'illillgf'n lass en s ieh d urch ~ la bza h l f'lI ln-.. SI:hrl'ih plJ. In Kapitel f haben wir das arith nwt isd H' ~li ttpJ und die Varianz zur ßf'sf"hl'{'i blln g eine r empirisrhen Verteilung a ngpgt' lw ll. Aualo g daz u bezeichnen der E rwartungswe r t und die Varia nz ein er Zuralts vartablcn rlie zentrete Lage und d!e Streuung einer Wahrscheinlichkeit sverteil ung. Erwartungswen und Varianz der Wahrschetnüchkett sver teilung der Ilfiufiykcit e1! können einfach du rch folgt,tu!e Formeln ermittelt werden:
I'; (X ) = 11, 0
und
V(lr ( X ) = 11 ·0 · (1 - 0).
(10.4)
(IU,5)
Der S ta nda rd fehler gibt die St an d ardabweich ung der \\'ahrsd l('inl it:hkpitsvr-rteilung a n lind berochnot sieh a ls I Var (X ). In II IlSl'H'1ll Beispiel resultiert nach Gleichung 10.4
E (X ) =
11 •
0
= IOO·O .I G = 16.6
Hiiufi9ktil ~ u
uu d
A IlI ~ilc
jn Slid'l!lvbClI
233
und nach Gleichung 10.;-)
Va r(X ) = /1 · 0(1 - 0) =
100·0.16 ·0.8:)
= la.s .
Wi f erwarten also bei eiur-m Exper iment . das s "011 100 \Yiifft'IJ durchschnlttlk-h W.G-mal die G fällt DiE' Varianz di PSPS Wer tt's lH'i all en Ex perimcntcn beträ gt la.g. die Standardabweichung / 13.8 = a. 7. Wir haben die Hä ufigkciten des Auftrcteus eines bost tmtutcn E reign isses oben bereits in Anteile umgerechnet . Erwartungswe rt und Varianz de r Ver teilung der Zufallsvariableu P - Antrilswrrtr - ergeben sich nach
E(l' ) =
.!.n . E (.X) = 0 1
.
und
I' ar(p ) = 2" ' \ ar (X ) = n
0( 1 - 0) . n
(10.6)
(10.7)
Die S tanda rdabweichung der Anteilswerteverteilung Lorechnet s ieh au s de r Q uadra twurzel d er Varianz
a, ~ V~. ~
(10.8)
Die Sta ullanla!Jwridl1lng
\ '01 1 Zufallsvariablen. d it' zur Schätzung \ '(1) Parametern der Grundgesamtheu verwandt worden , nen nt ma ll St arldardfchier bz w. Standardschätzfehler. a p ist rlor Srandardfohler des Anrotlswortes. Stan d a rdfehler messen die G rübe des S tich probenfehlcrs. Der Sta ndardfehler d ps Anteils wird uurso kleiner, ie griib!'f der Srichprolx-numfang 1l ist , wie man 11 n For mel 10.8 sehen kann.
0(1 -0 ) gibt
llit'
Varlanv rles Anteils iu der Gruudgesatut beit an. wenndas
Interessierende Ereignis A mit tnnd da s GPgl'lwff'ig nis li mit 0 kodiert ist.
\{'ah "~{."" i" I i('hJ.-ci I~ VI:" ('i/ u"
234
.'f""
Die Var ianz des Ant eils in der Grundgesamtheit ist a m gröktcn, wenn 0 = 0. 5 ist. J (' weiter 0 \" 011 0,5 ent fernt ist. je kleiner die Var ianz des Ant eils in der Grundgesaruthoit . Der Standardfehler des Anteils in Stichpro bon steigt mit de r Varianz des Anteils in der G rtllldgl'sa mt ll.>it .
Im ß pispiel er hä lt ma n für Ant eils von
E(l' ) ~ = =
eine Va rian z
11
=
100 \rür f eine n E rwa rtungs wert
1\ der Grundgesamt heu X 111'1ll \ \"I'rt 1 a n. Ist der Quotien t aus de m Umfan g der Grundgesann heu und dem St ichp ro benumfang
gröbPI" a ls 20, N /n > 20, kann der Korrekturfa ktor (N - n )/ (N - 1) vernaehl ässigt werden. Dips ist in der P ra xis häufig der Fall .
10.3 Stichproben mittelwerte Unser n .'ispipl bezog sich bisher auf den Fall. dass wi r t's mit einer lUSkr eten Zufallsvariablen zu tun haben. Eine st etige Zufallsvariable wäre das Merkmal Alter in einfachen Zufallastichproben. Stetige :\lt'l" kma le ba1);'11 nicht abzählba r viele Ausprägungen. Da gegen wäl"(' das Mer kmal GI.... schlecht eine diskrete Zufallsvariable . da es nu r l}if' Aus prägungen ..Xlanu'' und .Fra u-' besltzt , Im Kapite1 IU.2.I haben wir ein Exper imen t (lUU-mal Wü rfeln ) mehrmals wiederholt. In der P raxis ent sp richt dies ([1'1lI Ziehen mehrerer St ichpro bell der Stiehprolwngriibe 100. ß r'i jed em Expermn-nt haben wir festgehal ten. wie oft dip G gf'filllf'n ist, was de r Fe-rstellnn g der Häufigkeit - lind darans abg eleitet - des Anteilswertes in einer Stichprobe entsp rlr-ht. Wir führe n nu n ein neues Experlruent durch. Exper i ment 111 lwst f'ht darin , a us der Alt ers vert eilung der bun desdeutschen Bovölker nng im J ah r 197,1 r-infar-he Zufallss uchprobe n (ohne Zurücklegen] mit jP\\"pi ls 1.000 Be.. fragt en Zll ziehen. Insgesamt ziehe n wir 1.000 verschiedeue St ichp roben. Für jede Srichprolx- lx-rechnen wir den Altersdurchschnitt .1'. Dip St ichprolx-nxichung simulieren wir m it dem P rogram m ALTM IHI aus GSTAT (vgl . n iikn 1993). GSTAT ent hält rlie Alt ers verteilung 11,'1' hUtlllesdplltsdll'1l nl"\'iilkl'fllllg im Jahr 197,1. Der Altersdu rchschnit t in de r hundesdeutschen
236
Il'a ll,.~d",j fllit hkd I~ oen t ilUflgen
Bevölke rung lag 1974 bei 11 = ;17.27 Jahre, d ie Varianz betrug (12 = 50,1. 45, 11 (spr ich : mii) und (12 [spr ich: sigmu-Quadra t] kennzeichnen den Mittelwert un d die Varianz de r Grundgt'Sa llltlu'it. IIiilltigkpitsausziihlullgl'lI s tf'tigpr Variablen werden dargest ellt. indemman dir- Merk malsansprägungen in Intervalle zusammenfasst und die Häufigkeit der werte in diese n Intervallen berichtet. Die Vert eilun g der :\1tt'I'Sdurchschnitte wird in Inter valle der Breite 0,1 eingeteilt. Jedes Int erva ll ha t eine 1II1lt'n' un d oben ' Grenze, r, n. reic ht das erste Interval l von 34,75 bis :34,85 Jahre. Statt de r Intervallgrenzen kan n als I\ at pgorip auch einfach die lntorvatlmtne an gegel.on \\'I'[(Il']1, wie das in de r folgenden Ta belle 10.4 zu sehen ist. Das ers te Int erval l hat z. B. die :\littl' :3·1.8 Ja hre. In dieSI' S Inter vall fällt der Mittelwert einer etnetgen Sti chprobe, was bei 1,000 Stichproben zur relaüvcu Hä ub gkou 0,001 füh rt (bz w. zur prozentualen H äufig keit 0,1 '!c). Xlan sieht. dass manche Altersdurchschnitte deu tlich häufi ger ermit telt werden ab andere. Besomh-rs hiilliig treten Stichproben auf deren :\1tersdurchsclmitt i nah am \\,prt de r Grundgesamtheu JI liegt , GriihPre Abweichungen vom Pa ramete r rlcr Grundgesamthei t sltul also auc h hier, wie schon in Tubelle 10.3 au f Seilt, LW , selten , da gegen sind klein ere Ab.. weichungeu häufiger . In Abbildung 10.3 ist d ie Verteilung der Altersdurchschnit te in den 1.000 Such proben als Histogramm dargest ellt . Die ges trichel te Linie in Abbildung W.:3 ist die W ahrsche lrrllch ke it sfunk tio n d er N ormalv er tellu n g . \ \-ie man sieht, ist di e Verteilung der Altersdurchschnit te in de n 1,000 St ichproben (Ilistflgram lll) annä hern d normalverteil t (gesl rlchelt e
Linie] . \renn wir viele Stirbproben ein es hinreirhcnd groken Um fangs 11 ziehen. dann verteilen sieh die arithmetischen :\litt d dieser Stichprobenwene normal. In der Praxis ist die Ziehu ng vieler Srirhp robon nicht notwendig, Xlit dem Zentralen Grrllzwerlsatz läss t sieh theo reti sch begrün den , Ilass die Zufallsvariable 5,: - Mittelwerte in Stichproben - normalverteilt ist. Und zwar unab hängi g von der Verteilung des :\!erkmaJs in der G rundgesamtheit . \ \'ir werden auf die Verteilun g \ '0 11 Srirhprobenmittelwerten und den Zentralen G renzwertsatz zurück kom men . Zunächst aber zur Xormalverteilung.
237
St;e'/'pfVbc"",itldw«rtc
Tabelle 10.4: Altcrsdurchschnitte bei 1.UOO Stichproben der G rü~e l. UOO H äufig keit
lute rvalhnitte
absolut
:\\.1_ :1,0.1 :1". :1
I I I I
:\" .7
3 7
m.n
:1"1. !'i
:I',.!J
m.u
:\li. 1 :lli.2 :\li.:l :Il>.-! :11•.:, :11•.1. :lli.7 :W.1l :ll' .!J
:17.11 :17. 1 :17.2 :17.:1 :17.-1 :11.'; :I7.l' :17.7 :17.1' :17.!J :1x.11 :11'.1 :11'.2
as.s
:1...,4 :11'.!j :IK(' :11'.7 :Ix,!< :IK!J
:m.1I :1!1.1 :1!1. 2 :1!1.:l
9
13 13 16 20 23
10 35
11 52 52
in
"
•
kum. Häufi gkeit absolut lu
uto
I
(J.I 0
O. ](J
2 3
11.20 IUO H.-IO lI.70 I AO 2.:1O :l.liO J .!JO li.;'O
urn
0 .10 0.:10 O.7U O.!H) 1.:10 1.:10
36 19
U~)
65
I
7
"
23
2.IH) 2.:10 -I.IH )
85 108 118
:I.:~)
183
U O ',.20 " .20
227 2 79 331
.rua
!'i. :~ )
!O.IlU H,!'iO
1....:10 22 .70 27 .!JO aa.t 0
·IO.:lIl HIO
72
7.:'W
38
:1.1l0
Hl
60
1 ' .I ~ )
s.io ',.20 ". 70 J .!JO
;:'01 552
m ]()
51
60'
l iO.-1O I>li. 1O r U H)
52 57
19 10
JJ~)
15
J .:~ )
30
:I.lK) :\.t,0 ;\.1 0 :l.IK)
3,') 31 20 16
10 22
10 8 9
G 2
2 I 3
U~)
l.IH) 2.20 I.IK)
o.so
O.!JO (U~)
0.20 0.20 0.10 O.:lO
661 7 10 750 795 825
8GO
891 911 927 937 9!j9 909 9 77
986 992 99 1 996 997 1000
ns.ao
;:,.(K)
i H.:,O
1'2.:,0 1'l1i.lH) 1'l!1.1O !JI. IO !J2.7n !1:l.70 !1f,.!JO !Il'.!JO !17.70 !JIt.l'() !I!I.20 !m.-IO !I!I.('O !J!I.70 IIK).IJ()
2:.18
Il'ahrschc;,, /i cH~ ils t'~rteilu"!I~ "
A l,l,ild u llg 10..3: Alrcrsdurchschnlr te Iw i 1.000 Sr ichpmlx-u der 1.000
GrÜ~l '
.,-- - - - - - - - - - - - ------,
, ,
.,
.. .!
1;
.dlllitt ,e,t'sd ll'll haben. A uscrdr-m könuon vioh- Verteilungr-u durch die xcnnulverteiluug a ngl'uiilll'rt werden. Unt er ln-st imnm-n Voraussot zuugeu ge-ht IlI'ispi ('lsWl'isl ' dip Biuomialvcrtc-ilun g iu I'illl' Xor rnalvorte-ilun g über, wir-
2:J!l
Stidlp1V&t:/lm itldwt rt e
wir a m E nd e des Ka pitels sehen worden {vgl. die Übersicht bei Bleymüllr-r et al. :WO-l, Kapitel ll ). Dip Normalvert eilungsfunktion für ein pmpirisrhf'S Merk mal in rk-r SI ichprobe lautet:
1 - e-'', '..... - ',' . f", (x lx;s a) = - s · ,j2ii
(JU. ll)
Ih re beiden Pa ra nwterz - das ist das a rit h metische Mittel de r Verteilung :,;2 - da s ist (lip Varianz de r Verteilung - hestimmen dabel die Lage u nd Breite der Kurve. Um eine Normalverteilung zu cha ra kter isieren. rek-ht die' A llgalw des Mittelwer tes und der Varianz daher a us. Ans die>.. sem Grunde werden Normalverteilungen meistens mit N (.rls2 ) hezeirhnet. Boxleh r sich die Xormalvertetlung an f ein Mer km a l de r G rundgesa mt he it . d a n n werden die g riechischen Bezeich n ung en für d as a r it hmetische Mit tol und die Vertanz - 11 U Jl(1 a 2 - verwendet: N (l tla 2 ) .
- und
Die Funktton gibt di p \\'ahrs(:lwin lkhkl'itsdichtl' a n. Zur Verdentlirhung sind in Abbildung 10.'1 auf der näch sten Seite mehrere Ncrmalvertetlungm mit verschiedenen Paramet er n .r und s 2 dargestellt . :\lal1 kann er kennen . d a ss die Ver teilung mit grü N' r werdender Varianz .~2 breiter un d hpi kle iner \w'nll'lull'r Va ria nz S2 scluualer wird. \\'ird df' r Mlt relwert i' g riibpl", so vorschiebt sich d ie Verteilung a u f d er r- ..... chse nach
recht s. wtrd der Mit t elwert
j'
kleiner, so verschiebe s ie sieh nach lin ks .
D ie Xormalverteilung ha t mehrere Eigenscha ften . d ie m an sich bei d er Anwe ndung in EI('r l n fer enz st a tist ik zunutze machen kann:
• Sie ist s vmm et risch lind r ing ipfl ig , wobei ihr Ma ximum bei .r liegt. Arithmorlsches ~ li tt l'L Modalwert un d Media n sind au s diesem Gru nd Ident isch. • S ie nähert sie h usvmpt o tisch d er r-Achsc, d . h. d e m ' \""[ 1 null. wen n I gegen + <JO oder - 00 strebt. Sie wird jedoch nie g leich 111111 (a uch wenn es in de r ..... bbildung so a ussehen soll te ). • Ihre Wendepu nkte • die steilst en St ellen - liegen bei x - 8 u nd x + s. • Da die Verteiluug s vuuue trisch ist, lwfilUh'll sich 30 % de r Fläd H' link s W JIl
i'
und 30 ljt recht s von
j- .
24U
\{'ah "~{."" i"I i('hJ.-ci I~ VI:" ('il u"
.'f""
Abbildung 10.4: Xcrmal verteiluugcu mit vorschiedcucn Pa ranu-tern l" lind :,'1
ca
7 e;
"' ""cs "'0..1 oz
"' ".s
,
,
Die Fläche unterhalb der Xonnalvcrteilu ng gibt 1111. wie viele x- werte sich in einem bestimmten Ben-ich der Verteilung befinden. Zwischen X l = - = und I2 = -l- cc befinden sich l1]]P .r- \\'erte . also IOU% , di e da zugehörige Fliid lt, beträgt demnach 1. W ir können beliebige F lächen un te r der Xormalverteilring bes timmen. Am einfachsten g('};(:hieht dles. indem wir 11llS ([l 'r Staudanluormal vert t'i lnng bedIonen. Die Standa rd normalverteilung ist ein e Xormalverteilun g, de ren ~ li ttI'1 1I"t'rt nullund den-n Varianz eins ist. Gleich un g lU.ll vcreiufarh t sich zur D ic ht efu nktion d er Sta n d a r dnor m a lvert e ilun g:
(10.12)
Die \\"('rt t' der Staurlardnormalvertellung werden als z- w er te IH>zpirh-
net , da man die \\'('rtr j eder bellebigen Normalverteilung mit tels einer zTra n sformatio n in eine Sr a ndardnormalveneilung überführen kann. Das Besondere der Stand a rdn ormalverteilung besteht darin . dass die Worto der
St;('/'pfVbc"", itl dw«rt c
241
Vert eilungsfunktlon in vielen Statistikbiichom in tabellierter For m vorliegou {vgl. Anhang A. S. 308 ). Dlo \ 'ertcilungsfun kIlon F\" (e) dor S tandardnonnalvcrteilung gibt die 'Yispil'ls\\"pisc' gpht aus der c-T ahelle im Anha ng A hervor, Ila;;s links VOIll z-Wn t 0 dip Fläche U,G hvw, GO % liegt . Da es sich 11m ei ne Will Mi ttelwert osYlllnlf'trisch.>Verteilung handel t, ist die Flächp, die s k h lin ks vom Wf'rt o hefindet ge na uso g rob wie d ip Fläche rechts vom Wprt ll. Links vom zwert + 2 ,G befinden sieh 99,38 % der Fläche. lin ks vom z~Wer t - 0 .!J5 sind p;; 17.11CX . ' Yt'nn man wissen möchte. welcher Fl ächeuan rctl sich rechts vom a-Wert befin det , kann ma n sich die Ta tsache zunutze machen. d as. ,~ - 't>w Zwischen - 1.03 und + 2 befinden steh a lso < I'zo - '1" 1 = 0.977 2 - 0 . 1515 = 0.8257 = 82,5 7 % der Fläche.
Dip F täehenbero-hnnn g ist in de n Abblldnngen 10.5 a ) bis 10.5 d) vtsualisiert. Abbildung 10.5 a ) zeigt dl.. Fl äeho links vom z-, y.. rt -1 2.5, Abbildun g 10.5 h ) links von - O,!J5. Ab bildung 10.5 c] zeigt d le Fläche rechts von + 1,.49 11 nd Abbildun g 10.5 d ) schlicklieh die Fläche zwisch en de n a-wert on - 1.0:3 1l1l{1 + 2 ,
242
\{'ah "~{."" i" I i('hJ.-ci I~ VI:" ('i/ u"
.'f""
Abbildung 1O.;j; Flächen unt er der Standardnormalverteilung • , -2.5
'
E 099J~
b , - "()95
, - 0 1711
Für die Intervalle 1lI1\ den Xliuelwert ( - U ). (- 2:2) und (-3:3) laSsl'1l sieh folgende Flächen fcsthalten: 1. Zwischen - L und + 1 liegen ü8.2i % der Fläche hzw. der a-Wer te. 2. Zwischen - 2 und + 2 liegl'll 9,j ,4;j 'X der Fläche hzw. der a-Wer te. 3 . Zwischen - 3 und + 3 1if'gl'll 99.i3 1i(, der Flik lw hzw. der Z· \ rl 'rt l' .
Da jed e No rmalverteilung du rch ein e a-Tr a nsfor m a t ton in eine Stall' da rdno rmalvcru-ilung überfü hrt werden kan n. können wir auch für jede 11I'lit'hi gf' Xormalveru.ilung m it Hilfe e!t'l' a-Tahelle Fl äe-heuantelle lJt'st illlmen. wenn wir zuvor (11'n ent sprechenden x· " ·(' r t z-t ra ns fornuert haben. Eln \rr r( einer 1Jf'l ir big(' n Verteilung wird a- t ran sformiert (u nd da mit standardisiert}. indem von diesem \ \"I'rl 111'11 ~ l it t t'l \n'rt der \ 'ert oilung s ubtra hier t II lId d as Ergebnis durch die Stand ar dabweichung dividiert wird " .f i - i Zi = - - - ·
,
(10. 1.1)
\ \"('lIn jeder \\"t' ft einer beliebigen Normalverteilu ng a- t ransfonuiert wird , l'fh äl t ma u eine Sta nda rdnonualvcrteiluug mi t den P a r a met er n .r = 0 IIl1d
243
St;"/'pfVbc"", itldw«rt c
2
= s = 1. Ihro .r,-\\"l'rtE' sind jet zt Zj-\\"('rtl', Sie wird dos halb auch " zVerteilung" genannt . Au f dem um gekeh rten Wog k1lJ1Il jede a-Verteilung in eine beliebige Verteilung mit den Puram etem f und S2 überfüh rt werden: 3
.rj = J: + z; , s
(10.14)
Da auch jede A'o1"1lwlve1"leihmg über die Umkehrung de r a-Transfor ma tion gpmät Glpid l1l11 g (1O.1-t) a us der a-Vertellung ableitbar i ~t , lässt sieh anhand der rabelllerten a-we rte die Flächenberechnung für jed e No r-
malve rteilung durch führen. Um bomuszufinden, wie viel Prozent der Fläche bei ei ner beliebigen Normalvnteilu ftg zwisc hen noci r - Wert en liegt a-standa rdisiort man zunächst die Ix-iden .r- wenc, U lll dann dio Flächen fiir d ie standardisierten werte aus de r a-Tabcllc abzulesen:
n, flit' mit Zurücklt'gPll gezogen wu rden und für Suchproben ohne Zurücklegen. in denen der Umfa ng der G rundgesamtholt N min des te ns das 20-fadw des Umfan gs der St ichprobe ent spricht, ~ > 20. Dies ist im ß eispil'l - Stichproben des Umfan gs II = 1.000 aus der bundesdeut schen Bevölker un g - der Fall. Der Erwartungswert des Durchschnittsah e rs in den Stichproben vom Umfang 1I = I.OOO ist
8 (.'\ ) = 11 = 37, 27 Juhre . Varianz lind Standardfehler
2 (1%- =
(12 -;
50 1, 45 1000 = 0, 506 lind
~ ---
50·1.45
1000 = O. 71 .
(\ I'S
Xlttt elwort es botragen
246
\{'ah " ~{'"'' i " I i('hJ.-ci I~ VI:" ('il u"
.'f""
Wlr erwa rten also durchschnittlieh einen Srichprobom mt tel wert . der dem Parameter dor Grundgesamt heit ent spr icht . nämlich 37, 3 Jahre. Der Stenda rdfehlor des Mittelwertes Iwt rägt 0.71 Jahre. Ist in Stk-hproben olme Zurikklt'gpl\ .; :5 20, da nn muss die Varia nz mit dem Korrekturfaktor für t'lullidw Crundgesamtheit en multipliziert \\'1:'1'den, de n wir bereits in Ka pite l 10.2.2
k pl\IWII
gelernt haben.
Die FOrJIlt'11l für Vertanz und Standard fehler lx-im Ziehen ohne Zurücklogen und ;\'/ 11 :5 20 sind
\'
UI
ur ( .\ ' )
a
=
\'
i - 1l :2 =(J- ' (Jt --
n
X - 1
lind
_ ~ . j A' - rl
- .;n
,V - I .
(10.18)
( 10. 19)
\ \'i r werden den Korrekt urfaktur für endliche Gpsamtlwitf'll in den nächst eu Kapiteln vernachlässigen, weil X/ tl bei bevölkerungsweiten Umfragen gröbe r als 20 ist. Immer wenn X /li :5 20 hzw. 71 /"" 2:: 0.05 müssen die
Standardfehler entsprechend korrigiert werrlen. Wahrscheinlichkeit sfunktion
11 ist der Erwart ungswert der Stirhprollt'nlllit tt'lw('r! .'H·r t1'ilnng, o » die Sraudardabwetchung, (Iip als Standardfehler bf'zpid l1lt't wird. Die Gh-ichung dpl" St ichprob enmitte lwe r t ever t e il u n g laute-t:
(10.20)
Anband dil'st'r Formel kann nun rlie \r a hrsrht'inlit hkt'it sdichle alt der StelIr .r hestimmt werden. DI'f Mittelwert der Al ters vert eilung in der bu ndes deu tschen Bevölker ung lx-trug 197.. exak t JI = 37.2GK Ja hre, der Sta ndardfehlcr de s Mit telwerts (J~ = 0.7102 5. Diese \\"('1'11' werden als Pa ra met er in die Gleichung (10.20) einget ragen. Die Wahrscheinlichkeitsdichte Iw triigt dann 1.. für Xi = 37.2 J ahre
n.
247
St;('/'pfVbc"", itl dw«rt c
= 0.5591 . Dieser \\"nt ist 1' ( I mndgesamthelt vormutet wird . werden als Vertrauens- odr-r Ko nfid e nzinte rvalle bezeichnet . Die Bildung von Konfidonzlnturvallon erfolg t im P rinzip ebenso wie die HlII \rahfse!wi nlichb'itsin tt'fvalll'll. Die untere G H'IIi't' - ZI - "1 lind die obere G l"l'ni' l' Z l _ ~ müssen wiederum für Z in die Ob-ichung z = ~ ~ pillgl'M'tzt werden. Da wir hie r den \\'I'rt /I suc hen, mÜSM'1l Ill'idf' Gl r ichuug en jl'doeh nach 11 l' ,]PS P rug ra lll1rls SIMKONOR alls GSTAT
wird das Konfidenzinter vall den Paramet er der Gr undgesa mtheit ent halten. \ r Pll ll wir - wie im RI'is pid - wiederholt Sti("hpro lwll vorn gleichen Umfang ziehen . so verdenlangfrisng. d. h. bei e iner gro sen Za hl von Stichproben . etwa g::i % der Konfidenzint ervalle den Mittelwert deI" Grundg esamtheit beinhalten. In ;'t\\"a ;; % der Stichprol H'u wird das 11111 den Stichprolu-nmittelwert geleg te Konfidenzintervall de n Pa ra meter 1I nicht ctus("hliI'M'll, lind wir irren U IlS lH'i der Schätzung - wie hier in 11('1" siebten Suchprobe. Aus diesem Grund wird (\ auch als Irrt.um s wahrsche inlichke it und 1 - (\ als Ve rt ranen s wah r sch eilllich kei t bezeichnet . Erhöhung der Vertrauen swahrscheinlichkeit
Ist UIIS dtese r Schluss zu unsicher. dann können wir die Vert ra uenswah rscheinliehkoit z. B. a uf I - 0 = O.ÜÜ. al so ÜÜ 7l , erh öhen. Die Irrtumswahrschoinlfchkoit be trä gt (\ = O. 0 I. Die z- \\"PI" tI' zu den Q uanrilen 0.05 lind O.!J\Xi sind ± :2 .5K
263
3S.1 1 +
as.n -
2,58 · 0.71
:::; JI :::;
JH.lI
:3G.28
s JI :::;
39 5J1
')') -IG
Z' I _0,", ) '
-s-
-~ v 1000
+ 2,5S · 0,71
D as Int erval l 1 :3G . 28 : 39 . 9~ I I)l'i ll h ö l t l,t mit 99'Yrigl'r Wahrscheinlichkeit das Durr-hsr-lmittsalter der bundesdeuts che n ß e\-(ilkpru llg. ~[it zuneh mender Vertrauenswahrscheinlichkeit wird das Konfide nzinterval l brei/er. DiE' höhe re Sicherheit beim Sehlit'N'n goh t also m it einer uugenaueren Schätzung de, unbeka nnten Mit telwer ts einher. Der Ex t remfall. dass wir unseren Schluss mi t lOO% ige r Sieherlu-ir tätigen wollten. würde d ie Int er vallgren zen auf - 00 bzw. + 00 aus deh nen. Die dazug-hön-ndc Aussa ge ..~ Iit 100'Xiger Wahrscheinlichkeit überdeckt dös Inter vall von - 00 bis + 00 den P a ram et er 11" ist allenl mgs nicht informativ.
Konfide nzinte rvall für den Mittelwert Ji bei unbe kannter Varianz der Grundgesamtheit Im vorangegan genen ß t'ispid sind wir von einer bekannt en Varianz 11 2 und Standardabwetchnng 11 der Grundgesa mtheit ausgegangen. Xorm alorwoise ist (1 jedoch nicht bekannt , lind damit kan n auch der St an dardfehler d E'S Mit t elwerts 11~ = (J / .J1i nicht lx-rechnet werden. Ab Schätzwert der Standardabweichung de r Grundgesamtheit (J verwendet man da nn die Stnndan.labweichllng der St ichprobe s. Die Varia nz in der Stichprobe ,52 ist allerdings kein erwartungstreuer Schätzer eh- r Var ianz in de r Cmndgesamtheit. Da lH'1" IllUSS ,~2 mit dem Fak tor 11/ (11 - 1) korrigiert werden, um den S("hiitll\'prt fiir die Vertanz der Grundgesamtheit 17 2 zu erh alten.
. 22
(1
= 8
n-
. 11 -
Dip Schätzung der (12
n 1
n
, 'BriBI\~
unterscheidet si ch
VOll
n -I
" (I j - .T)2 L: ;= 1
n
]
(11.6)
der G rundgesamrhelt auf Basis der Stidl pro!ll' der Sti0 ...
20 .7 .
JiIT
:J8.57 + i.uao- 2.3
Mit 95%igl'l' Sicherholt überdockt das Intervall [3.,1 Jahre: .,1,1 .Inh re] den Alte rsdurchschnit t in de r Grundgesa mthei t. \\'pil dte St u-hprobe so klein is t . ist der St an da rdfehler des Xlit relwertos grob. Das Konfid enzinrervnll fällt da her seh r breit a ns.
n.. i einer Stich prolll'llgriibe von 121 Befragten UJIII da mi t 120 Freiheitsgraden. Iwträgt der (-\\'Pl't fiir ein zWf'ispitigN; Konfidenzinterval l IH'i I'iner Vertrauenswahrscheinlh-hkeit von 9.j 'X. ( I - i ):I20 = 1 ,9 8 , während der
2ti6
zu die ser Vert raucnswubrscholntichkclt gehörende Z·\ r l'r t ZI _'} = 1,96 ist. Bei "iHN S tichprobe mit I .UUU Befra gten fäll t die Differenz zwischen [: und z-\ r pl"t bereits nicht meh r ins Gpwirht . r-Ta bellen beinhalten f - \ 'f' f t f' i ll1l1gl'lI bis zu 2UO Freiheit sg raden. ßpi gro Molll Süehprobenumfang UJl(1 gro N' r Za h t an Freih eitsgraden , ka nn die a- Vertellung vorwendet werden.
i
;,
(11.8 )
t Z( I _ ") ' -
2 ,fii
~
,,!>t.n.'
(;t'wohl in der Grundgesamt heit d ie Altcmauvhvpcthe«- vorliegt . dann begehen wir deu Fe hler 2 . Ar t bz w. den ß - Fe h le r . Die rkhtigf' Entscheidu ng t reffen wir, wenn die aus der Stichprobe g('folgerte Entscheidu ng m it der Gru ndges amt holt Iihcreinstiuuut. In Talx-l11' 12.1 sin d alle möglichen Entscheidungen aufgefüh rt . DiJ. wir die Urundges am t heit nicht ken nen , können wir n icht mlt Sicherh eit sagen . ob die Ent scheidung a uf Bas is der St ichprobe richt ig ist odt-r falsch. \ r ir kön nen aber di e Wa hrsd willliehkt'it lies 0- und ,ß -Fl'hlt'n; berechnen .
o -Fe hler Um den o - Fchler boree bn en zu können. müssen wir d ie Vert eilung der Stichprobeukeunwerte angeben . IWItIl in der Urundgesamtheit die Xullby-
274
JIYp<Jt" ~s~"p,iifu"!I
Taholte 12.1: Fehlor bei der ll ypor hosen prüfung
In der Gnmdg e.~amthrit
11.
II A
gilt :
Entscheidung aufgr und
110
richtig
ß - Fphlr T
der St ich p robe:
1I.~
c -Fchler
rieb t ig
potlu-se g ilt. Durch den Zentralen G n'llz IH"rtsa lz WiSSI'1l wir llf'ispie1s \\'l'isr , (lass slr-h Xltu olwert e in Sti chprobon normal vertollen. OE']" :-' li U"] II'f' l"t dor Verteilung ist bei Gii]tigkpi l der /10 der durch die Jl rJ postulir-rte Para-
metor. Dip Breit e der Xlitt elwerteverteiluu g lässt sich aus de r Stichprobe schä tzen. Ist die Wah rscheinlichkeit Fiir einen vorliegenden Srk-hprobeukennwer t 011(']" einen noch weiter von der Ho abweichenden Kennwert g' 'rin g, so wirrl d ip ~ l1ll hy pot h ('Sf' verworfen. In der \riSSf'llse!laft haben sich C reuzon ein gebürgert , ab wann ciu St ichprobenkennwert Ilt'i Gii lti gkl,it der 110 als unwahrscheinlich einzustufen ist. Die Gronven befinden steh l)pi () = 5 % bxw. () = 1%" Ist dle " "ahrschetnlichkett für !I"II r-nnittelteu Stichprobenkennwert I'l' i Gii lti gkpit der 110 geringer als 5 % hZII". 1 %, wird die Ho abgelehnt .
Bei dieser Ent scheidun g können wir un s irren. Die wahrscheiulichkel t fÜ I" den ermit telten Stichprobenkennwert be i G ült igkeit der 110 ist zwar gcringer als 5 % hzw. 1 % - wir könn en jl'doth nicht allMwhlil'kn , dass wir eine sehr weit von de r Gr undgesamthalt abweu-hendc Suchprobe gezogen ha ben. () gibt daher die Wahrschetulteh kett an, mit rlr-t- wir uns bl' i Ablehnurig der Xullhyputhoso irren ( Jr1"twll$w (lh r.~rheinlichkeit) . ß- Fe hler BI,i der EnilittllWg de$ ß - Fehler« lautet die Frage: " "ie wahrscheinlich ist das Stithprohl'llngl'l mis, wenn in (11'r G ru utlgl'sallltiwi t die Alte rna tivhypotlll'sl' gilt"? IIiI' r er mitteln wir dip Verteilung de r St.ichprobenketmwer11' bei Gültigkett der Alt emativhvpothese. Ist d!e \Yah rsd winlkhkpit fies Stichprobeu kcn nwcrts lx-i Gült igkeit der HA gering , so verwerfen wir die
Te,t
ci"",
Jfittdwe,t,
27&
Alterna üvhvpor he,e. Auch bet dor Ablehnung der Alt eruativhvpotheso können wir un s irren. d. h. die Alternativhypothose zu Unrecht ablehnen. Die wahrschcinlichkeit für unse-r Stichprobenergebnis oder eine noch g röN'rl' Ahwt'idlll llg von der HA gibt die Griif..\> des ß -Fe hlt' rs an. Ein ß -Fehlt>r wird als akzepta bel a llgl'St'hpn. wenn er kleiner als 20 % ist.
n-Fchler und ß -Fe hlpr verhalten sir-h gegl'nlällfig . .Ji' klei ner der o- Fehler, umso gröN'r de r ~1- F"h l t'r. .Je sicherer wir sein wollen, dass wir die Nullhypo t hl'SP nicht zu Unrecht ablehnen. UI11S0 ehe r lehnen wir die AltomatiYhypo thpSt, zu Unrecht a b.
In der n pgpl wird allerdings nur versucht, di p Wa!l I'M:hpin!ic!lkpit des
0:-
Feh lers gering zu hal ten. Den n 11m d le Kenn wertevert eilung ang eben zu kiinlLl'll. muss Ulan etne präzis!' Annahme iilwl' llit' P a r ameter EIt'r Grundgpsamtlwit ma chen. Dips ist he i der Xullhvpotheso sehr einfach: ste besagt nä mhch uorm a lenl'i'isp, (lass der Zusa m menhang hz w. der U nterschied null ist. In der Alter na t ivhypothese kom m t dagegen meis t IIUf eine ullpräzist, Ann ahme zum Ausdruck. So wird ein Zusanuueuhang postulir-rt. , nicht treuung sei ldenrisr-h. Diese Beha up t ung beinhalt et die Xullhypothose. In diese m Boispiel liegt ein e ungr richtrle Altrrnatil'h ypothe$e bzw. ein e
zwe ise it ige Fragest ell u ng vor. da keine Aussage über die Richtung des Unt e rschieds get roff en wird . "Oll einer grrichtrlCll Alten w til'h ypothesr bzw. einer ei nse it ige n Fragestell un g würde mall dagegen sprerhen , \\"1'1111 e twas übe r die Richt ung des Unterschieds ausgesagt wärdo. Dips wär e z. B. dor Fall, wenn wir behaupt en würden , rlass im Pilot proj ek t betreute St udioronde schneller ihr St udi um abschlir-sen. Die Fra ge, ob (' S sich tun eine gel"ichte te od er eine unge rk hte te llvpotheso bxw. eine "inoder zweisc'itigp Fragestellung handelt . wird später fiir die Bestimmung des Ablehnu ngsbereiches wichtig. \\'ie wir vom Studentensekretariat er fahren ha ben. beträ gt rlir- durchsdlllittlidl!' Studiendauer im Fach Po Jitikwissl'lIsr:hal"t hisher im Schnitt 13,5 Semester (J1o) UII(I dit' Stundardahweichung 3.2 Semester (rT ). Die Angaben des Studentensekreta riates sind di e Pa ram et er der Gruudgesa mtholt 1wi bis heri ger Betreuung. Nicht bekannt ist der Mittelwert der O rundges a nu hcit bei anderer Betreuu ng 11. Mlt der Ifo und /JA werden nun unterschiedliche Beha upt ungen iiber den unbeka nnt en Pa ra met er 11 au fgl's tt'11 t .
Nach der r\ullhy!Hlthf'S1' dauert das Studium anders bet reuter Studierender durchschntu tich genauso lange \\'it> bisher:
110
:
11
1' 0
I:L5 Semesu-r.
Te,t
ci"" ,
277
J!ittdweft ,
Die Alt cma t tvhvpot hes o dass anders bet reute Studierende nicht so viel oder mehr Zeit ab bisher zum Erwerb des Examens benötigen , kann man ausdrücken ab:
I/ A :
Jt
f-
/10
i
13,5
Semester.
Getestet wird die lI o. Gepriift wird. ob - bei einer bestimmten Irrtnmswahrschetnlichkeit - das ermit telte Stichprobenergebnis (hle r: durchschnitt.liehe Studlendauor i bt' i neuer Betreuung im P i lol proj pkt ) mit der ;\'1l11hypOlhl'st' ("wa h f!''' durchschnit tliche Studiendauer Ill'i anderer Betreuung beträgt Jl = 13. ;) Semester] vereinbart werden kann. S prich t das ermittelte S tichprobenergebnis gegen die Xullhypothese da nn verwer fen wir diese zugunsren der Alternativhypothese. Lässt sic h das Stichprobent'rgpbnis mi t der :\ullhy potll l'Sf' vereinbaren. dann lehnen wir lhp Xullhypotlll'SI' nicht ab. Ab welchem St ichprobenorgebnls die 1If) verworfen wird. hängt davon ab, welche Irrt ums wahrscheinlich kelt (c-Fehler) bei der Entsr-heldung in Ka uf genom men wird . Denn auch bei G iilti gkl'it der 1/0 kann - anfgmnd der zufälligen Abwetchnng der St ichprobe von der Gnmrlge s amthelt - etn Stichprobonergebnts vorkommen , das weit vom Pa ramotor der G rundgesam theit abweicht (a uch wenn d ies unwahrscheinlich iSI). I n den Sozialwissenschaften ist l'~ üblich. dPJ] o-Fehler nicht griibt' r als O.OG hzw. 5 t;{: werden zn lassen. x tan kann sich dann zu {tuindesteus] I - 0 = O. % hzw. 9G % sidll'f sein, die ;\ullhypot ht'!il:' nicht falschlidll'rweise zu verwerfen. 1 - 0 gtht die VCftmu cn.~l1!ah rsch eifllif"hkcit an. \ \','nll man ga nz sieher gehen will. l.'g t ma n die Irrt ums wah rschelnlichkeit mit ma ximal 1 % fest und kann sieh damit zu (mindes tens] 09 1ft. sicher sein, keinen Fehler zu lx-gehen. Diese Cn-nzwertc fiir die Irr t umswahrschei nlic hkeil {o- Fehler] werden auch a ls Signijika nznivCßu bezeichnet. Die Irrt uni sbzw. \'r'rtralleIlMv 11. 961 z :s:I I, 9tij
-. -.
I l o ahlp!lllPll 110 nicht ablehnen
In Ahhlldung 12.2 ist (11'r Ablehnnngsbereir-h durch d ip grau schraffierte FlJdw dargf'S tPIlt.
Abbi\(lung 12.2: ?wpisr it iger Ablehnnngsbereirh (gra u schralfierte Fläche) bei einem Signifikanzniveau von 5 % in der SIanda rd nor mal vert ei lu ng
z - ·I %
I
z - I .%
I
o +--f'''---+-,---+--,---+--'''' .,....---1 .. c
.,
,
2~2
HyjXJtllt 8fUl"ii/t"'Y
4 . Prüfgr öße berechnen und Entsch eidung üb er die Nu llhypothese t reffe n Die 3::1 im R a hmen der Pilotstudio anders betreuten St udiorendon studicrten im Durchschnitt 12 Seme-u-r. also l, :j Semester welliger als bei bisheriger Betreuu ng. ' \"ir berechnen nun d ie Prüfgröse. um angehen zu können . an welcher Stelle der S ta nd a rdnortualverteiluug d er in der Sti chprobt' ermittelte j' -\rf'r t !if'gt:
12 - 1:1.5 = - 2 3 .2
;r,;
rt
• I.
Fällt die P rüfgröje in den Ablehnungshereich der Xullhypothese. kan n diese a bgeleh nt bzw. .verworfcn': werden. Ik-i Gültigkeit der Nuflhypothe.. SI> ist es dann sehr unwahrsr-heinlich. eine Stkh proh e mit der Ill'o barht t't t'1l Prüfgrö bf' zu erha lten. Fällt dip P r üfg riii.f' da gogon in den .Annahmebereir'h", kan n die Xullhyputh rse nicht verwerfen \\·f'I"(I(>II . Da - 2,77 kleiner als - 1,9G ist, wird die X ull hypotl l('sl>verwo rfen. Der in der Stichprobe ermittelte '\"f'rl ist damit signifikan t.
Hätt en wir in der Stichprobe einen :-' \"(>rt zwischen - I, HG und L !JG ermit telt. dann würden wir di e Xullhvpothose nicht ontetmcn: Das Iwibt jedoch nicht. dass wir dan n d il' ;"\ullhYJlotht 'S(' ann ehmen könnten . ..-\ llM>r der 110 komnu-n a nrh a ndere Pa ramet er der G ru udgl'!;a tut hei t als Erzeuger rles S tichprobenuuttelwer ts in Frage. G l'na u dil's{' lnfonnat icn l iefe r n uns Konfidenz int ervalle.
Konfidenzinte rvall und Sig nifika nzte st Das Konfi denzinterval l für einen St ichpro benmit tel we rt i: lx-rech net sieh bei bekannter Sta ndardabweichung in der Grundgesamtheit o nach G lt>ichung l l. ,j (vgl. Ka pit el 1L S. :WU). In der Stichprobe dvr a nders bet reuten Studierenden wurde eine durchschnittliehe St udienda uer von 12 Semesteru (x ) fpsIgf's l ell t. Gpfra gt wird , 11"0 die d urchschnttt bcbe St ndiondauer 11 ht' i anderer Bet reuun g in de r Grundgesamtheit ltogt , Bei einer Vert raueuswahrscheinlichkeit \"011 !J:j % [bzw. ein er Irrt um swahrs cheinlichkeit von 5 %) result iert
283
Tn t ti,ws Milttlwnts
12 -1.96·
3,2
,ß5 lO.()·l
~ I I-S;
12 -1.96·
s,
!3.0G.
1
~
3, 2
~
Das Intervall [lOH \; 1:1.061 üb erdeckt mit 9:'Yr"iger Wah rscheinlichkeit die durchschnitttlche Studiendauer in der Grundgesamt heit . Das Konfiden zintcrvall uruschliest also nicht den im Signifikanztest durch die Ho pos tulierteu \Yf'rt von 13.5 Semesrem. Wird die Ho in einem Slgnifikanatest bei einem bestimmten Signitikauznlveau () abgeloh nt . dann iibordeckt das für eine Venrauouswahrschetnllchkelt von l - () ber echnete Konfi denzintervall auch nicht den HJI1 der Ho postuli..rten Wert der G rund gesam theit . \YisSl:' n wir auf Basis des Sign ifikauztests nur. dass (bei gegebener Irrt ums wahrscheiulichkeit ] der St ichprobenmit telwert (bei neuer Bet reuung] von 12 Senn-ste rn nicht mit der XulJhypotheSf' vereinbar ist, so gib t uns (las Kontidenzintervall zusätvlich die Informa tion. in welchem Bereich die durchschnitt.liehe Studiendauer bot anderer Bet reuun g in rlr-r Grundgesam theu {bei einer gogobonou Vert ranenswa hrscheiuliehkei t ) Iiegt .
Einseitige Fragestellung Eine einseitige Fragestellung liegt vur, wenn die Alrcrnativhvpothc«- lautet., dass die 11r teilullg breit er als die z- Vertellung ist , sind di" krit ischen Wf>rl E' hir-r gröse r. Bei groseu Stichproben nähern sieh di e krit ischen , r erte beider Verteilungen a n, Bel St ichproben kleiner a ls" = :~o müssen die Mer kmale in der Grundgesamtheit normalverteil t sein .
12.3 Test s für Mittelwertunt erschiede :\Iit diesen Tests werden Hypothesen übor :\litt"lw.' rt ulIt r rschit'(I,' in der G run dges a mt heit ülwrpriifL Eine These wäre , dass der Umga ng mi t Zah leu Xllinnern leichter fällt als Frauen. Untersuchen können wir die These mit den Daten des IALS 1994. die herelts in Kaphel t,:> verwendet wurden. Wir besch ränken uns auc h hie r auf den deutschon Teil des IALS. Xlänner und Frauen können als zwei Stichproben aufgefasst werden. Eine wichtige Fra ge für di e Auswah l ist, ob t'S sieh um urw bhiingigc oder abhiiugiflc Stichprolx-n ha ndelt. Bei unabhängigen Sti ch pro ben beeinfl usst die Auswahl der Element e der einen Stichprobe die Auswahl (11'1' Elemente der anderen Stichprobe nicht. Bei xtäuner» un d Frauen im 1.-\LS handelt ps sich 1ll1l unabhängige Stichproben. weil (Ht' Answah l von xt äuner» un d Frauen unabhä ngig voneinander erfolgt e. Bei :lO lind 11 2 > :lO. Ist 11, :$ ao oder Jl 1; :5 ;30. dann müssen c!ir :'Ilprk mall ' in der Gnmd!Je.~ am t heit normalverteilt SPill, dam it dir- Mlnelwendtfferenzen in St ichproben norm alvert eilt sind. DE'r Sta nda rdfehler von .c, - 1:2 wird mi t 0 Ü , - .1', ) IWZI'idlllE'L Er gibt an . wie st ark di e Xlim-lwendtffcrouzcn in Stich proben von der Mit telwer tdifferenz der Grundges amtheit abweichen. Auch hier ist eine konkrete Abweichung (.c l- i 2) - ( /1, - /12) Ilt'i einer brelton Kennworteverteilung (grob" r Stu nda rdfehler] wahrscheinlicher als bei einer schm alen Kennwerteverteilung (klein er Standardfehler]. Dip Pnlfgröße z st andardisiert dip Abweichung der xüuelwendtfferenz 1:, - r 2 von dE'1" durch die Ho postulierten Mit telwertdifferenz der Crundgesanuhcit /1, - /12. indem durch de n Standard fohlcr 0 (1 , - 1 2 ) dividiert wird.
z ~ ,(r,,'_---Ci2,,)_---" {J,, "_-~I'"C'!.)
(". :l)
Da hei G iilt igkeit der gewählten Nullhypothese /11- /12 = 0 ist , vereinfacht sich die Form el zu:
.c, -
X2
(" A)
' ~--- .
° (.1' , - .1'2 )
DE' r St andard/ellter dPl' Mill e/wertdifferenz 0 (.1' , - .1', ) ber echnet sich aus den Verlanzen de, xlcr kmals für beid e Gruppen in der Grundges amtheit .
(12.3 )
Sind die Variauzen o i und o~ in ein Crundges aruthcit unbek annt , werden dlese du rch (li e' Srk-hp robe gf'Sf"hä tz t : = S AQ/(nl - I ) IIl1d a~ = 8 ,IQ/( 1I2 - I )) .
ö;
28!J
(12.0)
Setzt mall Cl cichung 12.0 in Gleichung 12..1 ein. erhä lt man ab Priify röß e:
.rl - .r2
, ~---
aü , -.t~ )
~
(i1 -r2)
~ +~
(12.7)
", ",
Da dit:' Prü fgrii~ t:' !lf>i gro~('1l StkhprollPll standardnormalverteilt ist. können die krit isr-hen Werte der z-Tabelle entnommen worden (\·gl. davu auch den A bschnlt t 7 U t- Tests auf S. 291 ). 3. Ablehnungsberekh der Nullh ypoth ese kennzeichnen Bei einem Signifikanzniveau H IIl 0 = 0, 05 = 5 %, einer 7weisI'itigeu Fra gestellung und einer a-verteilten Priifgrilbe müssen die Ix-iden \ r ,,!"te er mit t e!t werden , die lin ks und recbt s von der z- Verteilung jeweils U.1l25 bzw . 2.5 % der C esa mt fläche a bschneiden. Aus de r c-Talx-lte enrnhnmt man für d ie unten' Grenze 20.025 den \ \'ert - I,UÖ und für die ohere G rellzt' Zo.975 den Wert +1,%. Gilt d ie Ho. dann ist die \Yah rsdll' inlirhkPit. einen zWert in der Sti chprobe kleiner als - l, 9Goder gröscr a ls 1,96 m erhalt en, kleiner als 5 %. "' ir lehnen dif> Xullhy polhl'SI' da her a b, wenn d itOPrüfgröbe kleiner als - 1,9ü oder grösor a ls 1,9ü ist. Dip :\ ullhypothcse wird nicht verworfen . weil 11 die Prüfgröt,e zwischen - 1,U6 und 1.00 liegt.
4. Prü[größe berechnen und Entscheidung über die Nullh ypothese treffen
Die aus den Srichprohen geschä tzt e Varianz der Xlat ln-ma tikkr-n nt nisse bet rägt für xlän ner af = 22·t 5 IIl1d für Fra uen af = 1851( Setzt ma ll die Stic hprobenwerte in Gleichu ng 12.i ein. dann er hält man:
z = 2%. 1·1 - 288, 1·1 = 3.98 . 22·15 938
+ 18""
112~
2!.lU
H IIp1Jt" ts~ fll"ljf1J"!J
Da a.!J8 gröscr als + 1.!J{j ist . kan n die Nullhypot hese verworfen werden. Der Unt erschied in den Ma t hem a tik konnuussen H lII Xlänner u und Fra uen ist sig uifik;;t - geprüft werden. l Im Beispiel wird die An na hme gb-icher Varianzen c1.. r Xla rhcmat ikkcn nt uisse für ~[ällllt'r und für Fra uen in der GnuHIgI'Mmtlwit abgelr-hnt. Ist dip Annahme glt'iche r \ 'ar iallzPII gen'clu fertigt , da nn kann a- 2 für be irlt' Gruppen gemeinsam gpSdlätl t werden (AgH'sti lind Finlay 2008,197). Dip Er mitt lun g de r Freiheusgrado ist Iwi Annahme \'011 \ 'arianzhomogf'nität einfa ch (111 = 111 + n 2 ~ 2).
12.3.2 Te st für abhängige Stichproben Ein typisches Beis piel für a hhiingige Stichproben sind \ \"il'd l'rholllllgsllH'Ssungen a n ein und denselben PersOTwII. wie s ie r, n. vorliegen würden. wenn S t udie rende zu np gilln und Zlllll Ende eines St a tistikkurses eine Klau sur schreiben würden. F ür dteso Studierenden h ät te man dann j E'weils zwei Klausur noten. die man wiederum als zwoi Süchproben a uffass en kann - allerdings a ls fJbhiillgige oder gfJ!Ilflrl e Sti chprollCfl. ß .'i abhän gigpn Snrhprohen ist jhlt' der beiden Stirhprohen gleich gr o k rla der \\"I'rt in einer Stichprobe mit einem \\"ert a us der anderen St.ie-hprohe verbunden sein muss. Uns interessiert , o h Statistik kurse S tatistikkenntnisse verbes s er n. Zur Überprüfung der Hypothese haben wir aus a llen Stat jsrikku rsen - da s nl'ispi\'1 ist erfunde n - eine Zufallsstfr-hprohe von :12 Studierenden gezogeu. Zu Semesterbeginn als auch zum Abschluss des Semesters ha ben d il' 32 zufällig a usgewählten St udieren den eine Kla us ur gesch rieben. Als Ind ikat or fü r die Kennt nisse in Sta t istik wird die P unk teza hl in jt'{lt'r Kla usur her a ngezogen . Für j eden Studiorendon liegt " in Paa r H ili :-' 1t'ssIH'rtcn vur, für da s die Differenz d, berech net 1\'\'1"S1' Difft,ft'nz wird für alle :32 Studierenden ermittel t .
1
i
= I bis
~ Ia n kan n nun fiir die se gemessenen Differenzen d, das artt hmeüsche Mittel i"d berechnen und die Staudardabwcichuug für die G rundgesa mtheit i:rd sehät7.t'll.
_ Jd
" l:d, i~ 1
= - -
"
t (d; - i"d)2 t7d = '''~"'-,,--~-
(12.9)
(12.10)
Das ari thmetische Xlitt el lH't rägt im Beispiel 13 P un kte, die gf's('häl1 tf' Staudardabwetchung Ci P unkte , also Jd = J:3 und (jd = U. Durchschnittlieh wurden in der zweiten Kla usur also 1:3 P unkte llIP 11f erviolt als in der erst en Kla usur. Geprüft werden soll nun . ob aus der ennit telten durchsch n it t I icheu Difforcnz in der SIichprobe i"d a lieh au f eine durrhsch ni I t I irhe Differenz in 111'1" Crundg-sanu lu-it lid gesrhlossen werd en kan n.
1. Nulf- und Alternativhypothese formulier en , Signifikan zniveeu festl egen Die Alternativhypot hese lautet: .,Dir Statlxri kkennmisse werden durc h d ie Kursteil nahme verbessert .': Als Nullhypothese formuli eren wir: .Di e Stntistikkcnn misse werden d urch die Ku rsteilnahme nicht verbessert.' .Xich t verbesse rt- kann sowohl "gh'k h bll'i1Jf'II" als au ch .ve rscbbchr em- hedenten. Die Xullhypothese gibt hie r also einen Bereich a n. Dips ist im mer
der Fall. wenn die Alternativhypothese gerich tet ist . also eine r-inseirige Fra gest ellung vorlie gt.
Ho ;
J1d :5 0
HA ;
Jld >O
~ [i t li d wird hie r der Mitt elwett der Diff erenzen in de r Orundgcsaunheit bez('id l1lH (im Unterschied zur Diffn Cllz der Mitt eluxrte 111 - 111 heim Tes t fiir un ab hän gtgo Stichproben] .
\\'ir legen die l rrt ums wahrschcinlirh koit (Stgnifikanznivea u] mit a = 0.01 = I % fest. da wir bei einer Ablehnung der X ullhypothe,e sehr slcbcr gehen wolle n. Xlit der formu lierten Null hypothese Jld :5 0 sind meh re re Verteilungen d er G mndgesanuhelt vereinba r. So könntp tn Wahrln-it die durchsdmit t lidnDifferenz l id = 0 Sp ill , sio kiillntl' aber auch Jld = - I sein, Jld = - 2 od er li d = - :1$ 5 etc. lx-n-agen , also völlig lwliphigl' Wer te kleiner null annehmen . Um die kri tischen Wert e best lmnu-n zu können. lx-nötigen wir a ber eine konk rete Anna hme iiber li d. \\'('khl' konkrete Anna hm e iiber d ie G rund gesamthei t bei G ült igkeit diosor Ho soll nun gemacht wt'rd,'u "!
Einseit iger Ablehnungs berei ch Die Lös ung des P roblems is t einfach un d soll ganz allgemei n am Beispiel einer Xormalvert eilung veransrhaulu-ht werden. \\'ir betrarhu-n dle FHidlf' a m recht en Ra nd der Vorteilu ng. da die Alternauvhypothe«. im ß t'ispil'l j a \\"" rt t' griibl'r als nnll postu liert und der Abh-hnungsben-irh der Xullhvporhese (in Gröb" der l rrt um swabrschein li..hkeit o} am rechten Ra nd der Verteilung liegen IllU SS. Eine Grundg es a mtheit . in der 11 = 0 gilt , bewirkt in GO% aller St ichproben einen Mirtelwert grübl'r U. Eine G rundgesa mtheit da gegen , in der r, ß . 11 = - I gilt. produzier t dagegen in GO% aller St ichprohell einen \Yert grö b!.'r als - I. Dies bedeutet. dass (li,· Wahrs cheinlichkeit für einen \ \"prt griiN'r 0 bei der Grundgesa ruthelt mit 11 = 0 ;")0 % be trägt , hl'i de r Grundgesamtholt mi t 11 = - 1 aber geringer als GO% sein muss.
Abbildung 12.4 zeigt zwei Kcnuwertcvcrtcilu ngcn . eiI\(' basierend a uf der Annahme JI = 0 (durchgezogene Linie ). die andere für die' Anna hme
I/ = - 1 (gest richolro Linie). DiE' Wahrscheinlichkelt. lx-i 1I = - I einen Stichprobcnkennvo-r t zu erhalten. der gröbe r als 0 ist , ern spricht gellau de r ganz dunkel S(:h ra lfierlf'1l Fläd lp. Dip ga nz dunkle Fl äche gibt also die Irrt nms wah rscheinliehkett für Werto g rüber un d gle ich nul l an , wenn in de r Grundgesamt heit I/ = - 1 gilt, Bei 11 = 0 ents pricht die Irrtums wah rschelnliclrkelt für den \ r t'rl null aher der gesamten sch ra ffiert en F läche. Die Irrtums wah rscheinlichkelt iSI für einen gogclx-ncn St ichprobenkennwert in eine r Ken nwerteverteil ung mit 11 = 0 griilM'T als für jede Keuuwert everu-ilung in de r 1I < 0 ist.
Abbild ung 12A: IITI umswahrschein lich l e-iten für den \ Vert 0 Iwi vr-rschiedenen Xullhypot hosen 11 :::; 0
'.-, 0.3
\.
0.2
\ \
..... 3
Aus diesem Gru nd wird auch dann.
\\"1'1111
die :\ullhypot ht'Sl' eine n Bereich
a ngibt , dir 1\lllJhypothrS(' I/ = 0 gPt f'Stf't .2 Ge nau d ies ha ben wir bei dem
ein seitigen TE'St eines Xltt n-lwcrt s bon-lt s get a n. Do rt wurde ta tsä chlich die Nullh ypothese 11 = I:t ;i ge testet (vgt. S. 28.3).
2. Prüfgröße und Verteilung der Prüfgröße bestimm en Bpi hinreichend gro ~pn St h-hproben . rl. h. mehr als 3U ~ lpss\\·t'rt paarpn , verteilen sich die ;-j rit hmet Ischen ~ Ii t te l der Diti ere n ZPIl ;-jUS St ich proln-n .rd 2
Ui,'!; Kilt m,tlirli,.h auch fiir {'inp :'\ullhYI'0tllPs, ', di,' null (jl :::: 0) l' '-'''t uliNt .
P;lIPIj
WPrt grijl,c'r oder glp;,.h
2!.l6
H IIp1Jt" ts~ fll"ljf1J"!J
ann ähernd no rma l U111 das arit hmot isrhe ~ Ii tt "l der Differenz der Gru ndgesa mt heit Jl d mit einem Standardfehler VOll (71,,. Bei der Berechnung rler P riifgröw. wird berür-ksk-htigt , wir g ro ~ der ~[i t, telwert de r Differenzen Xd in der Stk-hprobe im \ 'prglt'k h ZUllI Mittelwert der Differen zen in der G rundgesamtheu Jl d (Iwi Giiit igh'i t rler Nullhypothese] ist. Der Unter schied zwischen dem Mi ttelwert der Differen zen in der Stichprobe und der G rundgesa mtheit 1'd - Jl d IIl USS auc h hier an der Breit e der Kennwert everteilung. dem Stnndardjchlcr t! ('S Xlinelwt-rts der Differenzen (11./, relativiert. werden. Ist (11' r St andardfehler U l ,l grot-. [z.B. weil dn StichprolwlIlllllfang gering ist ), dann sind gn lt-.t' Abweichungen .td - Jl d wahrscheinlicher als Iwi kleinem St andardfehler.
Da der Standardfehler (,I J au f Basis der Stichprobe gt>Sdl ät zt wird. ist die Prüfgröke (mit df = 11 - I Freiheitsgraden ) t-vertcilt:
1'd -
Jl d
(12.11)
t ~ -_- .
1Y1.,
Bei der hier gewä hlten Nullhypothese nung zu:
1'd - O
Xd
U :t ./
(11 ./
t ~ _ - ~ _ -
Jl d =
O. vereinfacht sich d ie Beroc h-
(12.12)
Der Standardfehler des ari th metischen Xlittels der Diffe renzen (1 1" beroch sich a us de-m Stichprobenumfang Tl und der Standard abweichung der Differenzen in der Grundgesamtheit .
net
(12.13)
\\'inl d ip Standardabweichung de r G rn ndg('slIllItJwit (1d wie hier du rch die Stir-hprobe gf'Schiitzt (,d (wobe i zur Berechnung von Gd die SAQd d urch 71 - 1 ~ 1f'sslI"prt pai'lr.' dividiert wird ), lautet dte Glf'idl1lllg:
Te,t, für
Mjltclwelt " f1le1", e"i{~le
2!)7
(12.1') Der gl'l:whät7te Standardfehler dl'~ arithmet ischen :\Iit t (,b der Differenzen nun in C leiclumg 12. 12 eingesetz t , womit wir d ie Prüfgriik 1)('rechnen können:
u:t" wird
(l 2.Ei)
3 . Ablehnungsb ereich der Nullh yp othese kennze ichnen I Frviheitsgrarleu r-verteilt . Die Irrtumswahr= 0.01 = 1% fp:-;l geS('tzt. Da die Altomativhypothese eine Vorbesserung der St attstikkennr ntsse lx-haupr et. IIlUs..hä ngig davon. \wkhl' (Iründe ste ha t. Das folgl'wip ß l'ispif'1 Iwst:!lrä nkt sich auf Wostdeu tschland.
1. Null- und Alternativh yp othese formulier en, Sig nifika nz niveau fest legen \ rie bei jedem Test werden nmächst ll vpot heen iilwl" die G rundgesamtheit - im ß pis piei also \\'f' stlIl'lltschian d - aufgestellt . \ n r vermuten. dass Frauen eher als xtänner der Meinung sind, r-in Schwangerschaftsablmu-h stIlle legal sein. Dies ist die Alternativhypothese 11,1 . (Hof' eine n Zusammenhan g zwtschon den Iw ir1('11 Merkmalen Geschlecht und Einstellung zum 3
j)" r hi", Iwh,lIId"lt" \ 2_1' '''1 ist "in TI",t für ll""hhillllliW ' Stid'l'rollrd inl,'S nur dann \ 2-\'f'rtpilt.. wenn die erwart eten Häufigkeitr-n l eW ) in de n Zellen gro ~ w'nug sind . Als Faustr egelwird angf'gf'bf'll, dass dir er wartete H äufigkeit ! . (iil in je der Zelle gr öße r a ls fü nf ist . Ist dirs nicht der Fall. da nn könne n - sofern dies slunvoll erscheint - Ka tegonen zusammengefasst werden. bevor der T est durchgerührt wird. Ans onsten sollte ein Test fÜI" kleine Zellbesetzungen vorwendet werde n (vgl. Ag rcs t i 1\)90 . S . :J\) -~;j ) .
3, Ablehnungsber eich der Nullhypoth ese kenn zeichn en Bei einem .\2~T(,s l ü;t die Frage, wie wahrscheinlich der beobachtete 011('1" ein noch grüN'r!']" .\ 2'\\'''l"t hei Gü lti gkeit der Xullhypothose ist. DeI" Ablehuungsbcreich hefiude t sieh im mer am recht en Ende der Verteil ung . G('sucht wird also der \ 2. W n l , der um rechten Rand eine F läche dl'l" G r(i~(' o a bsdlllridel. Links vom gesucht en Wf'rt lif'gt 1 - n der Fläche, Der _\ 2_Ta belle entnehmen wir für ein Slgniflkanznl veau von 0 = 0, 05 bei einer Verteilung mit einem Freihei tsgra d in der Spalte ..O.9;J" (I - 0) den \2_\yprt .'3.8 ~ . G ilt in der Grundgesa mtheit die Xullhvpothe,e, dann slnd
;j(J2
X 2_'Y~'rh' grii hl'r a ls 3.8-1 tlll\\'a h rsd ll'illlid ll'r als 5 '1L Oi~' ?'ll l1 hy po t h ~'SI' lohnen wir IH'i otnem Signiftkanznlvenu \'011 5 % und «tnor \ 'I 'r1 1,j[Ullg mit einem Frcihcitsgrnd also ab, wenn in der Stichprobe ein \ 2_Wort gfii N'f a ls :3.8-1 cnnit telt wird . k-hm-n di l' ?'ullhy p ot hl'S(' nicht nh, wenn der \2_ \\'('1'1 dr-r Stk-hprobe kletnor udor gleich 3.8..\ ist , Der Abh-lmuugsben-ich ist in A b bi ld un g 12,6 gruu schraffiert.
,nr
Ab bild ung 12,6: A blt'llllll11gsh l'l'l'id l ineinor x 2 - V~'r tf'iltlllg m it df = l bei ei nem Sig nifikanzniveau von 5 %
" c
X2> :L 8..\
--+
110 ublehnr-n
X2
--+
110 n icht ablehnen
::;
;3.8·1
4. PrüfgröGe berechnen und Entscheidung über d ie Nullh ypoth ese t reffen 12,2 gibt den Zusnmnn-nhang z\\'isd ll'll dom G ('S( '!IIl'd l l u m! drr Eiust elluug zu m Schwangerschuftsabbruch bei den wes t deutschen Bofrugtcn wieder. 35,6 % (377 Will 1058) der ~iiilltll 'r u nd 37,2 % (397 WHl 1067) der Frauen goben an. dass dor Schwangr.rschaftsabbrur-h unabhängig vo n don Motiven einer Fra u lega l sein sollte. In ihrer Eiusn-llu ng zum Schwangors r haftsahbruch unterscheiden sieh Männor uud Fr a uen in 111'1' Sti chprobe also nur gt' ringfiigig, ~ [it dem X2_ Test wird IHm geprüft, o b lwil!t' Xlcrkmalo in der (I rundgesamthcir unabhängig sind , TalH'I1 ~'
3U3
\ 2. T,'st auf U" " bllä" yigkrit
Tabelle 12.2: Kon t inge/lzta llt'lh' - Einstell ung zum Sc hwa ngprSl-:haftsallluuch und Gpschl pfh t
soll te legal sein sollte nicht legal sein
Summe
~ läl\llt'r
Frauen
377
397 G70 IOG7
OS I 1058
Summe 77.J 1351 2125
In Tabolle I:L3 sind d le er warreren Häufigkel ten wiedergegeben . die sieh na ch Gleichu ng 12.lG (5 . 299) lx-rechnen. ßci starist ischer Unabhängigkeit beider Merkmale müsst en 3GA % (38;'1, -1 von 1058) der Fra uen und 3G A % (388.G von IO(7) de r ~ lä n ll n die Mein ung vert reten. ei n Schwangerschaftsahbrnch solle ohne Anga ben \ '011 Grünelen legal soin. Ta belle 12.3: l nditferenzta bolh- ~ Eln stollung zum Schwangerschaftxab.. bruch lind G.'se hlef ht
Xlännor
sollte legal sein sollte nicht legal sei n Sum me Q ue lle: .\ Ll.I ll S I9!lG,
,,~.. td,
385.-1
Gn G 1058
Fra uen :388.u
S lllllllll'
G7S.-l 10G7
1351
77-1
2125
Llt sc h, Bs Konfiden zinter vall und int erpretieren Sle dieses. J. Sie möchten für Wt'Stde utst:hlalld un n-rsnchen . ob sieh Frauen und Mauner ideologisch un terschotden. Als I nd ika to r für dit' IH llitisdll' Ideologie zil'lwn Sie die Links-R echt s-Skala heran. die im ALLß US 199B ent halten ist , Auf einer zehnstufigen Skala konnten die Bcfragtcn sich \" 011 I (gunz links) b i,~ 10 (gunz rechts ) einordnen. " 'ir unterstl'lll,tl , dass d ie Links-Recht s-Skala intervallskallert ist , z\\'isdu'll den Skalenpunkten also glf'it:he Ahs tändf' best ehen. Für die 1.083 Frauen (nd wurde ein durchsclmir tlicher Skalenwort von .Tl = 5. DG bei einer Standardabweichung Crl = 1.58 Skalenpunkton ermittelt: fiir die 98i Xläuner (n2) wurde ein durchschult tlichor Skaleuwert von i" 2 = 5.:25 und eint' Standardabweichung \" 011 0- 2 = I. 7,1 Skalen PUlIk t en lx-rechm-t . a ) Formulieren Sie die Null- und Alternat ivhypothese. P rüfen Sie mit einem :;~ Test für ;"!itlt,!lI'I't"tllllh'rschiPll e, ob der Unterschied in de r ideolog ischen Selbs te instufung von Xlännem lind Frauen (.Tl - 1'2 = 0, IH) st atist tsch sig nifikant ist. Logen Sie ein Signiftkanz nivoau von 1 % zug runde. h ) Berech nen Sie au serdem das Konfidenz intervall für die Differen z lief ~ Iit te lwerte für eiHP \ 'ert ra ue nswa hrschei1\1 k-h ke it von 9!J%. 111
Aufg"lJe"
307
welchem Borelch lieg t de r ..wahre' Unterschied zwischen
~ liilllH'rn
und Frauen" c) Berochnon Si" TI!
-1. ßitte prüfen Sie mi t Hilfe des \2 _Tes ts , oh eh- r au f Spil l' 17G dar gp... stellt e Zusammenhang zwisdu' Jl rler Konfessi(ltlszllge hörigkpit 1Il111 (lpr \rilhla],sieht a uf einem Sign ifikanz niveau von (} = O,OG sign ifika nt ist. G. Sie ha ben einen Signifikanztest durchgeführt . E in St atis ti k-Programm gibt einen p-Wert HlII 0.02 1IIl, a ) \relche Entscheidu ng t reffen Sie bei einem Signifikanznivea u H lII Cl = O,O,'j '! Wenll (Hp Entsrheiduug falsch ist - welchen Feh ler hegehen Sie'! b) \reiche Em sehe ldung t re tfeu Sie bei einem Signifikanzniveau von Cl = O,O1"! Wenll (He Entsrheiduug falsch ist - welchen Feh ler hegehen Sie"?
Anhang A Ta b e lle n zur B erech n u ng d er Fläche unte r d e n \Vahrsch e in Iich ke it s vert e ilt1n gen
z-Verteilung ,. W, ,..... c.... ,..... 0. 00 19
O,OlH'
O. OO I ~
....
0.00111
0.0017
0.0016
.".
0.00.;.;
0,00:;·1
0.00.$
0.0003
0 .00 71
0.0122
O.OOll'Z 0.0101
O,OUH
o.Olll'l
0 ,0119
O.o U 6
0.0132
0,0129
0.012:>
0.0119
O,OIH
0 .0 110
O,OIli6
0.0162
,-.... ,.". Oh.lJli
,..... , o.o.l.j9
,.= ,,om, O.O'll\I
O.f)t ,.6
0.0016
0.(1(1;'&
oml , um: e.... ",m O,ll.lH
,,=~
,...... ,.... O.eHr.
ae'" ''''~ O,(l6....~
,...
0 ,07711
O.D-li/l
''"'' ..... Ob'"
0.0:;.16 0,000:.
0.06111
•
0 ,00 1:;
• , , ...,"'"
....
,
0.001:>
,~ ,
.".
... .... ,.~
0.00.'>'
G.oll6
O,OI:;tl
O.ol~
0.0 1:.0
,~~
0.0197
.... ,=
•
0 ,0014
,. ,.". ,..." ,esca, ,..... ,.,"". ,...,. ..... """" , ,,"". ,., , ,., 0.0111/
,
o.oou
"'''~
om-;o
Gm H
...,- ,.-
0.001')
.... ,,..... ...., ,.... O,00fl 7
O.D1I 3
0 .0110
OJH'6 O .o l~
0.0141 0.018.1
0.6314
0.031)7
, . . .t
,.."
,~
'''''' O.lD1l'
,
o.ow
omn
0.041':'
O.Q-lr.",
O~
0.0:;71
......
OJ)t %
O,07X>
'''''' 0.01'21
O,o.i0#C2
0.071);
,..... '''''' e....,
,.....
, .~
O,07!U
0.0764
0.0 7~
.1 ,3.
o.~
0 ,0').",1
O.Q91 11
O,O'JIOI
- 1,2.
O, IUl 0 ,13:,1
0, l 111 G,III" 0.1 0!l3 O.l3.l.; 0.1314 lI.l m
O .I 11' ~
0.10:;6
O, IO:RI
0 ,1020
0.1211
U2:>l
O.\:U O
0 , 12 10
0 . 1190
O . l~
0 . 1:>3')
0 . 15 1"
0,1492
0 . 1469
O.H-I(;
G. I II H
0 .1711II
0 .1762
0 .1736
0 . 17 11
0.168.;
O,I4Xl 0,1000
0.140 ' G. I6-}';
0.:106'
0 ,211.1.1
0,20(1:;
0 , 1922
0 ,1119 1
O.1ll(i7
0 .;1.1''''
0. 2321
, .~
,.-
O.I!H9
0.2171
0.21411
· l.~.
·1.1.
.1, 0.
.c.s
0.1"""
O.Ill-l1
,.-
~
0 , 1971
o.~l
O. loo.l
"'''''
0, 1110
O.13J"l1
0,1611
·0, 11.
0. 2 119
-0,1'. ·0 .6.
0 .2'20 O.21 U
0 .2 709
0.26 76
0.26-43
0.26 11
0. 2.,711
0.2:; 1()
,.O,Z:.U ""
O.2~ ll.1
0 ,2 4::'1
·0,::'.
O,J(ll\;,
0 ,:\0.'00
O .~1Il 1
0.29.\6
0 ,19 12
O.21177
O.2I1U
O,Ul0
0 .2776
·0 ,4.
O.31t6
O.3 1W
0.3013 0.3312
O.3.1.1ll 0.3.100
0 .32&1
O.3Z.!l
6
0 .3 12 1
0,.11121
O,3 1/l:1
O,31,ß
0 ,3 70,
O,Y>69
0,1632
O,3.YH
0 .3.>57
0 _1.;20
0,.14 113
-e.a.
O:2.lli'J
D.n.}/;
·0 .2.
11.4207
O,ll r>ll
O .~l 29
0,4000
0, 40.-.:2
O, ~O13
0 ..1971
0. 39 :\6
O,1lI97
O.:J/I.J9
-0, 1.
0,lr.o2
O . , l ",f,~
O ,~~Zl
0 ,11 /,9
z -We"
.0
0 ,0 .
0':>000
0':,01 0
0 .•,011(1
0 ,,';(20
O':,lr,o 0 ,,; 199 O,.W.l fl
0 , 1.
O, :;39~
O ,:; l~
O , :;47~
0,:;:; 17
0 ,:;:;:;7
0 ,:;,;%
0, 56.%
0.52711 0,,56;:;
0 ,:;711
0 ,:;;.">.1
0,2.
0 ,,;70·1
0':,~32
0 ,,; ~7 1
0,:;0 10
O, :;O\~
O, ,;0~ 7
0, _
O,G06,1
0 ,6 103
0,6 1,11
0,.1.
0 ,6 179
0,62 17
0.62~':;
0 .629:1
0,6331
0.63r~
0,6-!0Ii
0,6-1-13
0.6 ·1110
0.6 .'>17
0,.\ .
0,65.."-.1
0,6.'m
O.GG·l~
0 .666 1
0 ,6700
0.67:).6
0 ,6772
o.seoe
0, 68·11
0,6;170
0 ,:;.
0,691 5
0,69 ,',0
0 .691>.:>
0,70 19
O ,70~,~
0 .70AA 0 ,712.1
0.71:;7
0 .7100
0 ,7221
0, 6 .
O, 72~,7
0,73 2'1
0 ,7 3 ~,7
0 .7:;'19
0 ,7673
0.7-11>6 0,779,1
0,7 ;\7
0 ,7.'>1\0
0 .7 3X9 0, 770.1
0, 7422
0, 7 .
0.729 1 0,76 11
0,7 8.;2
0 ,773 '1
0 .7-1.-"1 0, 776 1
O, ,;3 1~
O, ~ .
0, 788 1
0,7910
0 ,7612 0 ,79.19
O,79!;7
0 ,7995
O,~02.1
0,&>,;1
O , W 7~
0,7 82:1 0, 8106
0 .9.
0 .81;\1 0,8 186
0 .82 12
0,82.lll
0.8U>1
0. 8289
0 ,&1 \;
0 ,8310
0 ,8:1Il.;
0 .&1.'19
1.0.
O,M l 3
0.8 1:J1\
0 .8161
0,8-18.;
o ,~';OO
0,8 ,;3 1
O,K»I
0 ,8,77
0 ,8599
O,~621
I, I.
0, 86 -1.1
O ,~&G.',
0 .~616 ' 1
0 ,9,;91
0,9 ,;99
0,9608
0,961 6
O , 96 2 ~,
0 ,%.1'1
O,(l(;.l l
0,9573 0.%,',(,
O , 9.; ~ 2
1.8.
0.91>6-1
0 .96 71
0.%71\
0 ..w o,m ,,.... , t ..... •, ,,.." , ..... ,,,, ...., "'00 '''' ,.on; "" ,..,,, " ,.... ''= o.... ,.", ,.... "" ,.." ,.." ,.... .... " '.m ,,,. '.- ,,,.., ''''' c..... "'" " " '.m ,.m ,.". ,.... ,...., ,~" ,... 0.1l61 " ,...., '.m c.es ,...., c... , "-n ,."" ,.", ,... ''''' "",; ,."" ,,... ,.... " " 00 0.6.',
0 .510 O.H.; O .U ~
.. ...
0 .1
1.3i6
0.61. 0 ,84
...
O.lll6 0 ,76.", 0 ,141
O .~H
OAo.l
u.•
I~ I
0 ,97/1 0 .9.41 , .~
0 ,:;''03
0 ,7111
0 ,.\49
0 .111 0 ,;06 0 ,700
.,~
0,.\1.1 ., ~
O,6'r.' 0.0'; 0 .6'1-1
, .~
O)ln OJl1O
, .~
O.6'J I
.
, ~,
o""u
0 _190
..
O..l')()
,. 00
"
00 00
'00 ' 00
m sec
,-
z- Wrn
... ...
O.6ll7
00
O.l!I9
0,3/17 0,3/1, 0 ..'11\7 0 .3117 0,:186
O.:J./IIi 0. lH6 0.3116 0 ,311.> O.:J/I.;
,~" 0 ";"11
0",,11 0 ,':;"'10
O,6l\.'
0 ,.• :16 0.526 0 .s2,;
0 ,681 0 ,619 0 .619 0 ,6; /1 0,6 711 0 ,677 0.677 0.676 0 .676
0....2... 0";1:, 0,,;11
0 .67'" 0.615 0.67 -1
, ,~
0 _;18 OSV
O ,~r.
0':;':16 0 .~ 1f,
O,ll.W O.ll-ioIl
O.&>' 0J!.i6 0.tL",.l 0.11-;1
O.lll9 0 ,11 11< OM7 O.lll6 0.11-16 O./lU 0.811 0 .8 U 0 .M 2 0.11-12 0 .811
0)32.110 1,036
5.99 7.111 9 .49
11.01'
0.975
1l.1t 12. S3
12..;9
0.9'l
1l.:H U .2lI
16 .81 18. -Ill
1~.601
"",
16.0 1 17.;3 19.0'1
1:;'99
18,31
~ .~
13 ,21
H~
19.68
"",
2 ~ ,73
1'>;'1
18..:>.1 19 .M 21,06
..
".~ 2:>.00
2U7 2;,.99
r..J/J 28,87
.20 2ll.H
30.14 31.41 32.61
..
"",
:'1,81
3.">,17 36 .t:l 37.65 -13.17 '>:;.76
63 . " n10
61,:;0 1'9.08
II:.~
» '"
32.01
96.~
101,57
10 1,811 113,l5
.
~
"",
2~ .Tt
26 .12
,.., " "'" n"
~
2 ~ .!H
r..10
..
0.9.,
2.0. 3.'1'SI
".., n "... 71,n n» "'" "'" "'" " ".., ".~::, " " :n.u " ... ".. :n .2l! "'" W." ~..,
." "'" " .» 'sc"
( 1-1
U~
13.1'0
I t,O l
FIi63. 1\,'.
I:lU 1 13.;, 8 1 19,J.21 219 ,4., ., 16 ,49
1.91",0
2.3 26
1.&15
16.n
:1l .27
12 1.3-1 11'9.:>11
1,:lM2
10.110 l V II
n .oo
106.63 118. 14 129 .:'>6 18.·• •110
118.50 11:l,.l8 2"l6.0 :l :H O,9 3
. .
, ,,,
0 .99.'".
2."~':16
""';,:l1 2 ,576
'",", ~d/~: ll l,' VO"ll" ht· O""" ~" ,' nt. p, k ht rl..r di t ). 3. nominal - erdmal - ra t io - ra tio - nominal - onli nal - ordtnal nomi nal - Intervall. -I. Ant wort (c) ist falsch . Bel Ordin als ka k-n kan n ma ll - im Gpgpnsa t z zu Intervallskalen - nicht davon ausgehen. dass die Abstände zwischen den ein zelneu Skalenwerten gleich grob sind. ;). Die Grüb e des Xlr-ssfehk-rs kan n herer-h net werden. o. Vgl. dazu ausfüh rlich Kap itel 3.3. I. Der Rt'IJr oduzierbllf'kcit.5h J('lJiziw t un d dilll' ~ I ('i llllll g hat o df'r v. , ß . de r ~ Ie inllll g ist , dass der ASTA tetlwotso die Metnnng der St udi orenden vert ritt. 1') Diese Frage ist pill' leut ig zu la ng und \'CIr alle m uunöt ig komplizit'rt fonnul tort. g) lüer st im mt alles.
Bel der \'orl if'gl,tult>n Anordnung der Fragen könnte ps zudem passipren. dass ,lif' Frage nach rler IWIII' der Ausbildungskost en ,Ht> Bea ntwortung der d a ra uffolg enden Frage - Einfü h ru ng
\ '011 St udlengehiihn-n beeinfl usst , 2. Gf'Schlos'sf'n e Fragen bieten sieh an . wenn die An twort möglichkeit en bekannt und /oder Iwgn 'n 'l.t sind. r. ß . bei m G l'sc hl,' (:ht (Xla n n ~ Fra u). OIft'IlI' Frage n bieteil sic h an . Wf'1lI1 mall no ch nich t \\'l'i b, welche Antworten kommen könnt en , wenn die Ant wor tmöglichkeiten zu zuhlreich wären "de r wen n ma ll prinzipiell dem Befra gten di e Celcgc uhcit geben möch te a usführlieber oder in Sf'iIWIl eigenen \ror tl'II zu antworten.
~
Tabellen und Graphiken 1. In der Regel werden die Stinuuanteile der Parteien a uf die gtiltigeu Stimmen proxeutuicrt, da dieser Anteil iibt'r d ie Sit zvert elluug im Pa rlamcnt entscheidet . 2. Der Anteil der Stinunen für die :\,SDAP stieg U Ill 103.5 1,;(; Prozr-nt (17.~;.~~.33) lvw. 18,97 P rozent punk te. J. [ in K reis-. Säulen- od er Balk endiag ra m m . da PS sir-h IIIl1 ein nominalskalicrtes Merk mal ha ndelt. 4. Os tdeutsche ßt'fragtP haben insgesamt posi ti ven' Erwartungen bezüglieh der eigenen wir tschaltliehen Lage in einem Ja hr als \\'t 'stdp u tsdll' n l>frag tf' (vgl. die Tabelle a uf Seite .'lIG).
315
lI a h/ergebnis
\\ ',,11 lberecht igtc A ug"K,·I,,·m· S t';nlll,,"Tl \\'HI,lbp(('iliK'ITlg
Ungültige St hurue u
% Ullgült. Sti llllllPll G ü lt ig" Sti lllllU'll K rD USP D SI'D DDI' ZPlIt rll rH
IJn'
DYI' D~ \"P ~SD.\P
SOlist iK"
(H)
·12 .9,j 7.67;; 3.j .225.758 82 % 2,,·1.901
(bi 100 %
o,n 'x
3 1.970.8.37 ~ . "92.ODO
11.902 8 .577.738 1.322 .38.3 t1 2i.9 10 1.0~9 . 1 1l
1.6.'i9.77·1 2.·I.j8.2 16 6A O!).61O -I.i 5:H l6 1
= I OO ~.
\ :1.1 :1 % lJ.o:I % 2 1.r,:I % :1.71''X. 11.1'0 % :\.():\% -1.7:; % i.o:I % \ 1'.:1:1%
I:U',9 '){.
IIU i!) 'x 11.11:1% 1!J.!l7 % :I.IIK% !Ui l 'x 2. 17% :I.l'li %
' ,.72 ')f, 1-1.92 % 11.1I1i %
Unt er den ß t'fra gtl:'lI. dif' ihr e Pigl'IU' wir tsr-haftllche Ll.D 11.11
17.~ l 17.~ l
lOO.O
cnx 4ifi .K
11.7
nu
II KI.lI
:12.n IIKl.1I
100.0 12 .2 1.:\ WO.O 1.:\ 1.:\ 100.0 1011,0
IiK.l)
:12.11
tcun
71.1 IV! 11.7 Ti2.:1
LU
wesentlich schhvhter
osn Summ.'
Vi
o.n
-17.7 i.n
Die Verteilung hat ZI\'t'i Xlodalwertc, nämlich 11 und 11 Jah re. Dip Hälfte de r Kurs teilnehmer hat das 11. Lebensjahr berei ts erreicht und im Durchschnit t sind die Teilneh mer 11.i5 J ahre a lt. Der älteste und der jüngst e Kursteilnehmer lil'gf'1l 10 J ahre ausoiuander . Die Streuung 11,'r \\,prtp Hogt I/pi 2.01 Jahren. 4. Da der Modalwert grüb,'r als das arithmetische Mlt tel ist , handelt es sieh um eine rechtssteile (Iink ssr-hiufc] Verteilun g. 5. Angemessen sind in diesem Fall Modohoert lind M edirl7l, da ,'S sich ]wi Klaus urnot en um eine ordinalekalierte Varinlile handelt . Dagegt'U ist d ie Berechnung d es arlthmet isrhen Mittels fü r Klaus urnoten im strengen Sinnt' utcbt zulässi g, da die Abstände z\\"isdlt'1l den einzelnen Xoren nicht gleich sind und damit kein Inter vallskalen niveau vorliegt . G. Das arithmet ische Mittel würde bei eine r linksst eil en Verteilun g "Oll .~.\usrt'iN'rn'· nach olx-n verzer rt werden , G ibt ,'S a lso einigt:' sehr hohe ~ Ii('tell, ist das ar ithmetische Xl lu el gr öser als de r Xlodien.
Zu sammenhangsmaße 1.
• Berechnung der P rozentwerte.
317
Zeilell]lI'Q u nte
". kath.
5]liil t ellp rozc71te
44.3 26 A 65.5 43.6 60.0 3U.0 56.8
CDUjCS U SI' D
AND ERE Summe
kat h.
Summe
ss.r
100.0
43.6 34.5 30.1 40.U 26.3 43.2 100.0
ioo.o
:J;J.!~
100.0
:J7.1l
IOU.O 2/:1.4 100.0
Von den Befrag ten . die eine P räferenz für C DU/ CSU ä uN.'rIen, sind ;);),7 % katholisch lind ·U .3 % nicht -ka tholisch. Im \ '(,I"gl('ieh zu allen Befragten (.t:i.1% Katholi ken ]. sind Kat holikenunter r! 1'1I CDU jCSU-Wählt'fn also üb errepräsentiert . 43.6 % alle r Katholiken gplwll an , CDU/ CSU wählen zu wollen. während von a llen Befragten lediglich :J3.8 % {'inp PräfnPlll fiir dir Union spa rt eien ä uM' rn . • Berechnung von \ 2, C, Cramers V 2
(:.?:\ü - ;302,5 1)2
X =
302.5 .1
+
(2\17 - 2:JO,.1ü)2 230..16
+
(:3\)0 - ;m ,7:3)Z 337.73
(:l0" - 2,,7 .27 )2 2;j 7.27
+
(:loS - 2,,3.7:1)2 2:j;1.7J
+
( 17!J - 193.27 j2 193,27
+
= ;'-1..11
c=
5-1.-11
,-,--;:;'-';";=
5-1.4 1 + 157,')
Cramers \ ' =
c'rn"" = V~ -2- = 0 , -10 -1 ~
= 0,18J:
_ 54,--t1 1»75 · (2
7, w i~l'h(,1l der Konfession und de r dWI" Zusammenhang. • Berechnung \"(JIl ),
1)
=
0.186
Wahlah~i ("h t
lH'sl{'ht ein sehwa-
318
A u!luIlylJ
Vorhersa ge der \ r llhla hs ieht durch die Konfess ion :
A = (5:l:3 + 447) - (n O + 268 (533
+ ·IH )
+ 20.5 + 179 )
980 - 888 = O.Om9 = 9.:m % 980 Durch die Ken ntni s der Konfession 1is ohne Kat holiken würde dip SP D .J7.37 P rozent der gülügou Stimmen e rhalten. b ) Berechnung dos Dcu-r mtn a rionskoeffizlenten [(2; Hili
.-.2
lt - =
Erk lärt t'- S.-\Q g Gf'salJlt-SAQ~
135,5:3 2G9.20
= -- =
0.50
Dif' nnterschir-dlh-hen \Yahlf'rfolgt> der SP D in den rheinlandpfälzisc hf'll \rahlkreist'n bei der Bundestags wa hl 1994 lassen sich zu 0{) % durch den Ka tholik ena nt eil erklären. (O bwohl dies immer nor-h ein relativ hohes R 2 ist , heg t der " 'N t demlieh uiedrigor als bei Schätzung des Cljlj-Antoils. Zu r Erklä ru ng der Wa hlerge bnisSl' der SP D ist der Ka t holiken a nt eil also ein schlccbteror P r ädik tor als zu r Erklä rung der CDU.Ergebniss('.)
321
,,
c,
,•o .s -;; ,
L ~ ~
=F R~ ~_. ~~ ~~ ~~
~ x ~ ~
==
~ ~ S tt ä ~ ~ ~ g ~ g g '~ ~
x ~
322
Au!luIly lJ
Wa hlkn'is
'i,
:>;ellwi" d Ahrwclh-r KoLI"IL 7.
:1!J.I2 :1!i.1 !l :\li.;; I
Cochem
:1(i. l«i
K n 'lI7.lIad , Bitburg Trier :\Iout alHlur :\hliu7. Wurms Frankenthai l \u lwil/;slta f"l l :\ eustnd t -Speyer Ka iserslau t,'n l Pirmasens Siillpf"l7.
Berechnu ng des Determi nac iOlISk'I{'!fi7.;"ll{ en (tt, (iJ, Ü,l / n, lid /'i.
·12.;;:1 :1:I.7!J
:U.:III
:m.I.53
• Berechnung a us de n Ein zclmesswcrtcn : SAP
JSAQ, . SAQ.
Irl =
- 910,;;9
7;:i'\:iR':iF',","'" J Gl:lü.70 ·2fi!J,20
= - O. 71
/ 0,50 = 0.7 1
Die Richtung des Zusanuneuhaugs [das Vorzeichen \'0 11 r!) muss bei der Borc-hnu ng a us U1 dein Iicgressionskucffizienten eut nommen werden.
5 tich pro benverfahr e n I . St ichpro bcn sind er hobt ieh schneller und kostengüusrigcr d II rch füh rhar als Vollerhebungen. schwan ken allerdings in ihrer Zusammenset zung zufällig und erla uben dahe r Sehliisse a uf die Grundg esamtheitnur mit ei nor bes t inunten \ Yah rschel nlIchkelt . 2. ~ [ p h rs tll figl's Auswahlverfahren
323
3.
• ß t:'grilft': G rUllllg"S;'llllt lwit = a lle :-. rainzl'r Studierende Auswahlgesamt heit = all e auf der Liste des Studentensekretariates vorzeichnet r-n St ud lorenden undercoveragc = Studierende, d ie sich nach Abfussuug der Liste immatri kuliert haben O\'pn:o\'pragt' = ~w isdll'1J zpit lieh exma trikulir-rt e SIndir-rende • \ 'o rg,' lwlls\l"t' ist' : Einfache, sys tematische Zufallssuch probe. d. h . zufiilligp Auswahl de , ers ten St udier enden. alle weiteren werden in einem bes timmten Intervall er mittel t. Das Stich probeninter vall bet r ägt ~~~ = 28.7:1I. Die zu bestimmende Zufallszahl mu], also zwischen I und 28 liegen (dann erhält man et was mehr als 1.000 St udierende] . W ün lp die ~1tfii1li g gezogene e rste Za hl ij laut e n, dann wiirdf' clpr ij . , der 33.. de r GI. Studierende usw. in dip Sl idlpro bp gelangen.
-1. Zufallsgrs renene \ erfahren bieten die Gewähr, dass j ed es Element der G rundgesamt heit (genauer: der Aus wahlgesam rhuit] die gleiche bzw. eine lx-kannte Wahrsclwinllcbkclt gröN.'1" null hat , in d ie Stichprobe zu gelangen. Ers t dadurch werden Schlüsse au f die Grundgesamtheit möglich.
Wahrse hei nIie hkeits verteilung en 1. Dip e-Tabellc findet sieh in Anh ang A.
z-\Ver t FUirhe lin ks Fliidl (' rechts
-2,78 O.()O27 0,9973
-0,10 OA6()2 0,[,398
1.96 u.an 0,81[,9 0.97[,0 0, 1841 1l.02['0
2. Gesucht: Antei l der z-\ \"t'rlt' zwischen - 2 11m] 2: l' (- '2 S z ::; '2 ) = 1>2 - '1> - 2 = 0,97 72 - 0.0228
= O.9:i·H = 95 ,4·] ';{. 3. Durch Mittelwert li nd Var ianz.
A u/i,m y B
324
-I. Zunächst müssen hier die boiden r - \Yl' rt E' LU und 23 a-r ra nsformiert worden. Alls der e-Ta bello kan n dann die Fläche zwischen den beiden e- t ra ns fomucrten \YI'rH'n ent nommen werden. Gesucht: GröN> der Fl iiche , d ip zwisd lPll 2U lin d 2:3 liegt:
1' (20 < X < 2:3) --
=
P (20 - 20 < Z < 23 -20 ) 4
-
-
4
= /' (0 ::; Z ::; 0,75) = Q'0.7r, - '1'0 = 0.773-1 - 0,5
= 0.273-1 = 27.:H % ~( it wachsendem Stichprobenumfang n. nä hert sich d ie Verteilung von St lr-h prol H'1Itn it t elwert e il einer ;'\ onnal vvrteilung 11. 11. Ü. Lösungsweg analog zu Au fga be -I. Da es s ieh 1111\ eine Stichpro... benmittclwertcvcncilung ha ndelt, muss hier Gl(' idlllllg 10.21 zur zT ra nsform a t ion her an gezogen werden . Ge sucht ; P rozentsa tz der Stichpro benmit telwerte i::, der zwisch en :.Iü.9 und 38,9 Ja hren liegt :
5.
:37,9)
I' (:W.!J < .\. < :.18.9) ~ I' ( :36,9 - :37.9 < Z < :J8.!I . 0.7 0,7
= /' (-t,.l:l ::; Z ::; 1A3) =
4>1,,13 -
_ u 3
= 0.U236 - 0.076·1 = 0,8.172 = 8·1,72 %
7. 11.) fa lsch. b) falsch. t-] fak-h. d ) richtig
Konfidenzintervall e I . Konf i den zlut cr valle sind Bereic he. dir' den gesuchten Pa ra nu-tor !I1'r Grundgesamtheit mi t einr-r gewis sen \Ya hrsd H'i nlich kd t überdecken. 2. • Das Konfi denzint ervall wird g rüN'1".
• Das Konfidenzintervall wird griit,er. • Das Konfidenzintervall wird kleiner .
325
3. Dir Var la nz de r Gru lldgpsalllt lll'it ist unbekannt IIlH! wird durch dip Stidlpro hl-tH!a tr ll W"Sc:hä tz t. Da d il>S tic:hp rollt' sehr grot.. ist, werden die G rt' nzpn a n ha nd einer z- Tabel le und nich t a nha nd einer t-Ta belle abgelesen. Die allgemeine Formellau tet da her :
Berechnun g des zweiseitigen Konfidenzintervalls IlI'i Cl = 0.05: 1477.6S . 1Hi.6S 1&1S,:m - z(l _ ~ ) ' ,,11 474 ~ 11 :5: IS.1s.:m + z(l _ ~ ) ' v' l -H4 1838,.19- 1.9ü· .18,-19 :5 I1 "5 18.18,.19
+ 1,96 · .18,49
1iü2,!.l'j :5: 11 :5: 191:3,8:3
4.
• 99 'Xigps Koufidenzlut ervall fü r den Anteil der e DU ICSU· Wä hler:
lJ. 12.'". · O."'.i,j
12;'11
• 99 'Xi gps Konfiden zinter vall fü r die P DS:
0.0:15 - 2."i'l ·
O.O.1.j ·O.% j Iin > 52 \ \'od wl1, /10 : 11 = 110 = 52 n = 0, 05. • Priifgrii ~t' und Verteilung der rrü fgrii~e besununen: Die StirhprolH:' ist luureichend gro~ (11 = 1,1-1). Da (1 durc h die Stichprobe geSl 'hiü~t werden muss (0- ), ist die P riifg rü ~(' mit dj = 11 - 1 = 1-13 Frelhet tsgraden t- ven eilt. • Ablehn ungs bereich der :\ullhYllot hpSl' fest legen: Weil die Alterna t .ivhvpothose ger ichtet ist lind g rö~('f(' \\'1'1'w pos tuliert , liegt der gesamte Ablehnungsbereich a m rechten Ftaud de r t-Ven cilung. Dt'1" kriti sche t-""Nt befindet sich da her an de r StPI1" IW.I-al' Den krit ische n I-"'prt entnehnu-n wir der r-Ven etluug mit 150 Freiheit sgr aden (da keine Verteilung mit 143 Freiheitsgraden im Anha ng tabelliert ist ): lOSO, i- o.or» = 1.1)55. Ist der "'nt der Priifgröl.!' grök>1' als I.G55, dan II wird die :\ullhY PollwSI' verworfen: ist der wert kleiner a ls I,G55, d ann wird die Nullhypothese nicht verworfen. • Prüfgrög e berec hnen und übel" die Nullhypothese entscheiden:
1=
67. 6 -,'"12 ' 6 1.5
"JITI
= 3. 0-14
Da 3. 0-14 grökcr a ls 1.655 ist. wird die Nullh ypot hese abgeDer Unterschied ist sta tisti sch signifikant .
11,11111.
b ) Konfidenzintervall (für Il bei unbekann tem (7) berechnen: 6 ~( ./- - 1,.9('l'/fJ:i Gl ,5 ::; /I $ 6-1, ~( + I . .()" 6 1, 5 h ' /fJ:i
57,7 :5 /1 :5 77. 7 ;3,
a)
einer Xfit telwertcdiffereuz bei una bhängigen Stichproben. • Xull- und Alt prn a ti vhypoth f'Sf' fpstl pgpn:
TI~t
Ho:
Il i
=
/1 2
lind
H:I:
Il i
f- 112.
(\ =
0. 01.
327
• P riifgriik un d Verteilung der P riifgriii'.e besuunnen: Dip Stir h proh" 1l sind hin reichend gro i'. . Dil:' P riifgrö i'. p ist hier a-verteilt (vgl. d ir- Anmerkungen in Kapit el 12 zu r-Tests], • Ablehnungsbereich der Xullhypothose bost lmnu-n: Fü r den zweispiligpll Ablehnungsboreich eilt nimm t ma ll für Cl = 0,01 der a-Talx-lh- a n d" 11 Stellen Zo.01 j2 und ZI_0.01/2 die kritischen \\'(']" te - 2. ;) 1S und :1.5~. Die Nullhypot hese wird also a bgelehnt , wenn in der SI ich probe ein z- \\,prt kleine r als - :1. 58 oder grö bpr als 2,58 er mittelt wird. • Prüfgr öko berechnen und üb er die Nullhypo these entscheiden:
_"ce;"0;";, e-,,;5~,:2;,;-', 1.",,2 l0Il3
+ I. n2
=
- 2, 59
9R7
Da de r in de r Stichprobe omu t tclre z-\ r prl - 2. 59 kletner als de r kr itisc he z- \\'I'rl - 2,58 is t [wenn au ch seh r kna pp) . wird die Nullhypothese ab gelehnt . Der Unterschied in der ideelogtsehen Einstellung von Mä nnem lind Fra uen ist also stat istisch sehr signi fikant . h) Konfidenzi ntervall für due ~ li ttelWt'rt l'd i ffl' rl' n z : Die Differenz bt,trägt in den St ir-hproben Xl - X2 = 5. OÜ - 5. 25 = - 0. 19: das Konfiden xlnt orvallberechner sieh nach :
- 0, 19 ± 2. 58 ·
j - ' - + -_i ·t 1 58 2 1083
2 1 98i
Da raus result iert: - 0. 379 1 ::5
11I -
112
::5 - 0, 0009
Die obere G renz e des 9!.1\1f igen Konfidenzintervalls is t ga nz na h am \ r ert der We rt der :\" ll llhy po t hpSl~ ! c) Zur Berechnung von 'I wird d ie Summe eil'!" Abweichungsquad rate für Xlä nner und Frau en (= SAQ9'.' ) und die Sum mt' d er Abweirhuugsqnadrate für Xlänner und Frauen getrennt benöt igt . Da rr = jS AQ /u I ist . ist S AQ = (j 2 . (71 - I ): S AQ!J' . = I. ßG2 • 20 n9 = 5 i Ol . :3:Jß-l S AQ~"rau('n = 1';,8 2 .1082 = 2701. 1048 S AQ.\ länner = 1, 7 ,}2. g,s6 = 2985. 2 136 S A Q~·al = S'AQ ~"rau('n + SAQ'l anm., = 5686.318·}
328
A u!luIlylJ
'I = .fij = j O, 0026 = 0, OJ
Der Zusammenhang zwischen Ix-iden Merkmalen is t zu vern achlässigen! .,I.
:\1111- und Al ternativhypothese fes tlegen: llo: Es gibt kotnon Unters r-hiod im Wahlvorhalt en zwtsehon Katholiken und Nicht- Ka thollkeu. /l A: Die Konfession ha t einen Einfluss auf das Wahlverbal ten. Cl = 0.05 • Pr üfgröj-- lind Verteilung der Priifgfü~t' festl egen: Die P rüfgrük .\2 berechnet sich nach Gleichung 7.8 und ist mit df = (3 - 1)( 2 - 1) = 2 Ffl'i1u'it sgrat h'n .\2-\"l' rt f'ilt . • Ablehnungsbereich der Xullhvporhe«. kenuzeiclmen: Der krttlsebe \ \"er l für ein Signifikanznivea u \"( )J\ O.tl::i lil'gt in einer Verteilung mi t zwei Fn 'ihpitsgl'a dl'll Iwi .\~ ril = 5.!)!1 (Anhang A t' 1lI 1lt' hmen !). •
.\ 2 ::::
.\ 2 >
,\ ~ rl t
:dri'
===?
/10 nicht a blohnen
===?
Ho ab lehnen
• Berechnung der Prüfgröke ,\ 2: Alle erwarteteu \ \"I'ftt' sind gröber als ii , d. h. der Test dar f a ngewendet werden. Vgl. die Berechnung auf S. 3 17.
\ 2 = 5.t4 1 • Entscheidung übvr die X ullhvpothe,e: Da rler gemessene \ 2_\\"l'ft G.t ,.tl griik l' als der kritische \ 2_\\",'r t G.99 ist , wird die ;'\llllhypot lll'sl' verworfen .
5. a ) 1/0 ablohnen. da p p > 0.01. ß -FI' hl{,f
jl!f'J lll'rg: Springer, -I. Auflagt'.
Braun, ~ rkhae! und Puter Ph . ~ l lJh l r r , Hrsg. (199-1 ): ß1icklJ1w kt Ge.~r1lschaft 3. Eillstcllungm und Verhalten der B nndesbilrqer. Opladen : \\'estd put sdwr Verla g.
Braun . ~ Iil'haf'l und Pctcr P h. xlohlcr. Hrsg. (1998): ß1icklJ1m kt Gesellschaft 4. So ziale Ungleichh eit in Desüschlcnd. Opladen: Wes tdeu tscher " erlag. Brosins. Felix (2UU6): S PSS 14. Dünn:
~ II Tr.
Bundesm inisterium de s Innom (20UG): Deutschland beteiligt sich mit einer rcgi.~t Clye.~tiitztcn Ziihlu1tg Im der komm en den Volkszähltmg.~'·lmdc der EU 2U1O/2 011. Pressemitteilunq vom 29. A ugust 2UU6. Bür klm. Wi\lII'! m und Xlarkus Klein (19!.l8) : Wahlen lind Wiihlerverhalten. Ein e Einf ührung. Op1
+ ß ud r ich. S . -173
::i06.
G ESI S . Hrsg. (2007): AUßUS. DIll enhandbuch 2UUG. ZA-A'r, 45UU. Köln
und Xlauuheim. Grümer, Ka rl- Wilholru (l97-1): Beobachtu llg. St u ttgart: Teubner.
Gschwond. Thonras (200::i) : Ökologische Infen!7lZ, in: .Ioachim Bchnk e ct al., H rsg.: Methoden der Poli l ikll'i.~s cnsch aft. N euc rc qualitalille und quantitative Verfahren. Baden- Baden: Nomos. S. 22; - 2] 7. Gschwe nd. Themas und Mare lI o og lw (2008) : SJw uld I Sl ag or Shanld I Go? A ll RXIJ(Ti m elltal Stlilly Oll Voter Rf\~IJ() llsrs ta Prc-electoral Conliti07I$, in: Europeon Journal of Potiucot Research. -I7(;j ), S . 536 - 3;;. Hai sken -D ex ew. .lohn P. und Joachim R. Frick. H rsg. (200::i): DTC. Desktop ComlHmion to the Germa n S ocio-E couomic Panel St udy (GSOE?) . Ve r.~ i o n 8.0 (U' Jdated 10 Wnlle U). Bor ltn: Deutsches Instit ut fü r \\ 'irt sch aftsfcrschu ng.
Hanefeld, VIf' (1987): Das S ozio-ök(!1l1nnische PIl1/c1. GI111ullfl.rJf'ft Imd K ons cptum. Fra nkf1ll"t / X(>\\' York : Cam p us.
l, ittmtunwl"Zt' idmis
ll arkness. J uncr ...... . Fons vun de Vijvr-r lind Pr-tor Mohk-r . Hrsg. (2003): Cross Cultuml Survey Mcihods. Hobok en . :\.1: Wiley. lläder, Sahillf' und ..... xel Glemser (200G) : Stid1lJnJ/u:nz ichun y jiir Tdf/O 71lltllfmYrrl in nc ltt.~ chl(md, tu: ..... nrlreas Diecktunnn, llrsg.: M rthodw der Sl]zialfOl~~ehllllg (Sonderhef t 44 tier K ötner Zcit.~ chrift fü r So ziolo.IJie und Sozialp.~yeho I09ie). Wiesbaden: \ 'S Verlag , 5 .1 48 -1 71.
Häder, Sabine lind Perer Lynn (20U7): Hr nn Rcp res cn totioe ean 11 MultiN ation S ll7'I.lCY bel', in: Rnger Jowell Pt al.. t1rsg.: M caSltri1l9 A tt itudes Cro.~ 8- !\lrlt icm lllly. [,e.58011.5 from th r F,ll ropf'fm 5'odll! Sll nwy. T hons and Oak s
11.
a.: Sage, S. 33 -52.
Ilempel. Carl G. und Paul Oppen hr.lm (1948): Studies in the l,ogie of F,xlllm w ti on , in: Philo.501lhy of Scicncc 15, S. IJ ;j-175. Ingfehart , Honuld (1977): Thc S ilent Revolution. P r tnceton: P duceron University P ress.
.la("01I, Rüdiger 1lI1l1 \\"illy 11. Eirmlu er (200U): A llgemeine Beviilkcn.mgsumfragm. :-' lündH' Il/ Wi E'lI: (Jlrlr-nhourg.
.Ia nctz ko. Dtct mar (UmU) : Stat i.~tiseh c A n wend ungen im Intern et. In Netzumgebmlgcn Dat en erhe ben, ausunrtcn lind praescniicrcn: Xlünchen: Ad dl son- \\"t'sley. King, Gar y S. (1997): A Sol ution to the Ecologieal Infcrcncc Problem. Reconstructinq Indivi dual B r hnoior from A!l,IIregate Da tu. P riuceton. Xew Jersey: P rim-et on Univcrsitv Press.
Kor-h. Achim (1991): Z um Z'lSllIIlfIu." tlum y vrlJl 11Iter vi cul('rmcr /.:1111l1cll 1l111i A 'l.~s ch öJljll ngsq u o t e n, in: Z UMA -Na chriehtcn 15(28), S. 41-;j:.t
Koch. ..u-him (1993): Sozialer lVuudcl als A d ejakt urä cceducatichcr A ussch öpjung. Z um Einfl uß von Verändcn m !lCfl der A ussehöpfungsquot c auf die Zeitrcihm des ALLß US. in : Z UAftl -Nach"ieh tcll 17, S. 8J -113.
Koch...Achhn (1995): G cfiiL~ ch t e Interviellw: E'~J c bn iM,e der l iucroiciocrkOrttmUe heim ALr.n CS 19 94, in: Z UM A -N ll chri cht cll 19 (:30 ) , S . 89 · l U5.
:J:J6
Lit~rulunJe rzeicl'lli~
Koch. Ar-hirn. Sicgfned Gabler lind ~ I iehad Bra un (l99-l): K onzeption un d Dlirchj iihnm g der "A llgem eineIl ß rvölkcn m asltmjm gc der So zialwi.w:rw:}lIIjtcn" (A Un US ) 1994. ZU1\ I:\-.-\rbeitsberir-ht 9-l/11 , 7. U ~L-\ , ~ lan nheim.
Koch , Achim ('I al. (1999): Konzeption und Durchj iihn m g der "Allgemeinen n evölkeru ngMlmj rage der Sozialwiss cn.~chaftell" (A LLn US) J998, ZU ~L\- :\rl ll' il slw r ieh t
99 /0 2,
Z U~ I A ,
Ma nn helm.
Kolrler-, Ulri ch (20U6): Schät zer f ür komplcu Sticlunnb en: in: .loarhim Behnk e et al.. Hrsg.: Methoden der Polit ikwisser~~ cJUljt . Neucrc qualitati ve und IJllImtitativ e Verjahre n. Baden- Baden: Nomos. S. 309 320. Kohler, Ulrich und Fran k!' Kreuter (2008): D a t e rw nllly.~ c m it 5t ata. A llgemrine K onzept e der Dlltew m alyse und ihre pmkti.~ch e A nwendung. ~ 1 (j Il('h t'll/ \ri t'll : O ldcnbourg. 3. Aufl age.
Krämer, walrer (1991): So lilat man mit Statistik. Frankfun / Xcw York: Campus .
Krämer, \\'al tt>r (I99-l): So überzeugt man mi t
Stati.~ tik.
Frankfur t j Now
York : Cam pus .
Krtigener , Sonja (2006 ):
- A ktueller Stllndund in: Fra nk Faulbaum und Chris lo f \\'olf. ll rsg. : Stichpmbenqualitiit in ßevölkeru ng.~ /l mfmge n. Bcnn: rz, S. ;);) GI. RC!J i.~ te1'!Jest iitzt er Zelk~ ".~
En t wi ckl1mgspcr.~pekt ivC1l.
Kromrey. Helmut (200G): Empirische N Luciu s. 11. Auflage.
Sozialfor' Ia)'rin g, P hilipp (2007): Qua litnt ive Inhaltsallalyse. Gnlfl d /Ilgcn und Tec hniken. \\'l'inh eim: Deutscher Studienverlag. 9. Au flage. Xlr l ver • .lohn P. und Edward G . Carmiucs ( 1982 ): Uuidiniensional S caliug. Lonrkm: Sage . 2. Auflagt' .
:>. 1('rt('l1 . Klaus (199;; ) : InhaILr. Gen G. (:!UUG): Di e Macht der Zahlen: in : 360 Gmd. Fcchmaq asin für das Mana gem ent im öffentlichen S CHOf' (5), S. 1.l -15. Wallace. waltcr L . (1971): Tbe Logic of S cien ce ill Soci%gy. Chicago /Xew York: Aldine-At berton. \\'asnw r, ~ la rt i na et al. (HJ96) : h'om el!tiofl lind Durchf ühn l1tg rief' ..All.t]em cin efl ß evölken tflYMlmf m ge der So zifJlw is,~ en~ clwfl e n " (A {,{,D US) 1996. 7.U:'II.\-Arllf'itsherj("ht % / 08. ZU:'Il.\ . Xlannhehn. Wasmcr. Xlnrti na. Evl Schob lind :1I 1l'r 2. Art. . . . . .• id ,,· /l- Fl' hll'r . .. 20 H'1I1srhlüs w . Fil terfrll!': p. . . . . . . ... 86
Fo rsd llllll'N(rUppe \\"ah l(·I1 . . . . . . . 3i Forschungsgruppe \\"a hl('11 (f G \\·) . . 39 Fr,'il l"itsgrll,I,' \ 2_Tl'st \ 2_\ 'l'rw ih uIK t-Test . I' Yl'fI,()iluul':
300 300
292,206 26 1
G am ma h). .. . . . 156 G"lmartt· S t idl l' ro hl' n ... . 202 G{·rkht,·te lI ypOlh{'S\' . . . . . 2i 6 Ges rli idltl'!l' Stirbprobe 2 11 GI'SrlilosSl'ue FWf(l' . . . . . . . .. i O 22 1 G,'St't z gro~"r Zahlen G ESIS. Abteilung Dat\'lI a IThi\" und D,,t l'lHlIlillysl' 30 G('wklit ulll': I)l.,;i ;(Tll':(·wid lt l1 lJg . . . .. 212 Itt',jresSllll'ut . . . . . .. 200 G nl·G ETAS . .. . .. . 16 G flllld W'Sililltl ll'it . . . 105 GUlI lllllu·SlGll a 5.':; H-O-Sd wllla . .••. . Hiiufigl....it.,"u ' ziihJullg . .. H" lu-- Elf(·kt . H i, to grillll m • .
Hyhr idfn lW' . .
Ilypothp"t'
.
,1. 6 100 . . . 85 .. 113 . . . . 80 .. .... . 2i2
h ui" x
.
18
Imk x quulltntiver \ 'aria tioll lnditlerenatab ellc , ,. Individualdan-n
130 . . 111
huli \"ithw liSliSl'lll'r Ft'llisd llllSS
20 _6 . 10
lnduktiuu
li
IlIf"rI·m "ta ti"ti k . . . . . . 19,) IUltillts\"" litlit ät . . 65 lnstltur für Arbeitsmarkt- mal Berufs-
forschung
1j
llllt'r-Codillz . . . . . 160 Kn·isdi>i"';Tam lll . . 112
Kn' UZla l)(·!I(' . . . Kl'it prillllls\"alidit ä t . . . . .
IlH. .
1 ~2
65
Kritischer 1{" tiOlwlislllUS •. . .•••.•... -I
Krilisch er \\'(·rt . ..
... •. 280
Ui"KS""1'1,ittd "si ;;lt Llllnbda (J.).
... . 31 . . . . 153
Laufi ndex . .
.. 101, 120 . 1 12
l.ik" rt , 5kal;, . List" llw"i"" r Fa ll'Hl ss"]'l" ,,s Llstwise ,leIPlioll \ Iatd ,illg . . . . \ "' u ia n \ l phrfad ll"·1l1 ' 1111 ~'I1 . . . . .
. .. ... 18 . . 201 ... . . 20 1
. .. 23 123 . 82 , . . 213 . .... 15 16, 56 .. 15 . .. 16
\1PI1 rstufiw' Zu fa ll"a uswah l . \ ! ~ lillrlll't'f1
:r.S. 2..."6
rillf'li HI'lU'
ior.,k.,,·flizirnt.... . JQ;) \ ·UfJt"I...., ••••• •• ••••••••••• . . . 2:-3
T''''' · 1(.1 t · \ ·..n..,,"'', T''''I~I ..' i., l ik
TI".,""
62 ~.thr
!' rü f,;n1k
11
Ti .." I60 Tul .. II.ru:t:' '1 II.· ••• . .••••••• •••• . . •• "rh.. I' "lll'I 'llli" rll l '~ I" '" i~ Tr'·lI, ItI,,,,i~lI .... . ... .. •.. ......... .. 31 ·J)-'·lIl,,,·llli rf,..K, ltili t • .••...• ••.• 52 Tu rnll.·' ·r 11 UIIl,hhii"KiK" \ ·" r;,.I,],· ... . •• •.. ••.. 105 Ulld' ·n 1l\"'·I'IlK' · ••. . .•• . . .. . .••. . .• • I !lG
UllK,·ridill 't,· Hn'"'I,,·"' .....,,.... 2:-G
u,mn,·
l lll il ' -'\" ll rl"'l'" tl"'" ••.••• ~idU' .-\ l ll1' l'r, n" I," tlK",'ill ll,'i t , , • . ••• . . • I:';. 19:-
l' rlisl" . .......... . .. . . . . • . . . . . . .. . 120 \ "a1idi tä, 61 \'ariab"' I:i ' ·arianz . . . . . . . .. . . . . . . . . . . . • . 135. 263 \ 'arianz " hl"I" Z ufal ls,-arial>Iom .•... 232 \ 'arianzaufklaru fll! Ar Dl1 l'n11 inal ~"'1 \ 'ariatioo>'k rM'ffizinli , ••• 138 \·~ ..'l:"itl"
131 , .. , ••••... 3S \M ~ '" Koo.6dl-n zinlt"n"a1l " ~~liriI kftt . 2'62. \·~~ , M \ foriow&1al Pn
2"
.-\~ \'~ \'~
,. I93 I93
W~ nfjdJ kIl'il
12 I
fn-qumtiooti'idl Uplaa-
m
W~rscborinlich klE'ibinlt"n..n
WtÜ-nid ll · Kal~
2.J6 tU
I 3
\\-~
: -T rawJormar
M , 2 10. 2 12. 2 1:213 Ar
: · \ "-'naIun,; ZrilPnpro:. ·ut01"
Prozmtl.Ji,prull~'--i.
7....,tra1ardli\· fiir ('Jnpin..ri... Sutialfur· scilUlll! (Z.\ l . . ... . . .... . • •rM G f:SIS m 'lraier Grt'loz ..-rt""'1J' •••••• 236. 2:-S Zio.-ln lTiab'" h r .\lJI..illKiK'· ' ·" ria hf.. Zufall ..... . •• ••• . ••••• •, •• •••••••• 201 ZufaIlSOi'x J!"-nrIl"lI l •• ••••• •• •••• • ••• 202 Zufallsvariabl 2üj Zli :'ll.\ .if l,r Co'III'" rur Sut\, ·)· 1>'",iKll
allli :'I h·t l,," lol' >KY (C'SIH f) Zuo;anllll