Thomas W. Pavkov, Kent A. Pierce
Do biegu, gotowi - start! Wprowadzenie do
SPSS dla Windows
Przekład:
Jacek Buczny
t( QWP GDAŃSKIE WYDAWNICTWO PSYCHOLOGICZNE Gdańsk 2005
Recenzje wydawnicze: prof. Jerzy Karyłowski prof. Grażyna Wieczorkowska Podręcznik
Spis treści
akademicki dotowany przez Ministerstwo Edukacji Narodowej i Sportu
Original title: Ready, Set, Go! A Student Guide to SPSS® 11.0 for Windows® 1/e by Thomas W. Pavkov, Kent A. Pierce, Perdue University Calumet. Original edition copyright © 2003, 2001 by The McGraw-Hill Companies, Inc. Ali rights reserved. Copyright for Polish edition © 2005 by
Przedruk materiałów graficznych za Copyright © 2005.
Gdańskie
Wydawnictwo Psychologiczne, Sopot
uprzejmą zgodą
firmy SPSS Polska.
Wszystkie prawa zastrzeżone. Książka ani żadna jej część nie może być przedrukowywana ani w żaden inny sposób reprodukowana lub odczytywana w środkach masowego przekazu bez pisemne; zgody Gdańskiego Wydawnictwa Psychologicznego.
Wydanie pierwsze Edytor: Anna Świtaj ska Redaktor prowadzący: Sylwia Kot Redakcja merytoryczna: Jerzy Karyłowski Redakcja polonistyczna: Małgorzata Jaworska Korekta: Małgorzata Drewa Skład: Piotr Geisler Projekt okładki: Agnieszka Wójkowska
Wskazówki dla bibliotekarzy: 1/ metodołogia badań 21 statystyka
Wstęp
9
Rozdział
1. Podstawy obsługi SPSS Początek pracy z SPSS dla Windows Otwieranie plików z danymi Używanie okna "Otwórz plik" Menu w oknie głównym SPSS Przeglądanie danych za pomocą okna "Dane" Przygotowanie danych za pomocą okna "Zmienne" Przeglądanie okna raportu Drukowanie okna raportu Zamykanie SPSS '" Zadania Rozdział
11 11 12 15 18 , 19 20 25 27 29 29
2.
Rozkłady częstości i statystyki opisowe Stosowanie procedury "Częstości" Zadania
, 30 31 34
Rozdział
3. Graficzna prezentacja danych Przygotowanie wykresów Zadania
36 36 39
ISBN 83-60083-08-8
Druk: PPH Follak/Opelgraf Gdańskie Wydawnictwo Psychologiczne sp. z 0.0. ul. Bema 4/1a, 81-753 Sopot, tel.lfax 058/551-61-04, 551-11-01 e-mail:
[email protected] http://www.gwp.pl
Rozdział 4. Testowanie hipotez badawczych dla dwóch prób niezależnych . . . . . . . . . . . . . . . . . . . . . . . . . . .. 40 Stosowanie procedury "Testt dla prób niezależnych" , 41 Wybór zmiennych 41
--- ----- -
6
---- - - -
--
--- -
----
'-, SPIS TREŚCI
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Interpretacja wydruku Zadania Rozdział 5. Testowanie hipotez badawczych dla dwóch prób zależnych Pytanie badawcze i plan badania Hipotezy badawcze Stosowanie procedury "Porównanie średnich: test t dla dwóch prób zależnych" Interpretacja raportu z analizy Zadania ,
44 47
Wybór zmiennych do analizy Przedstawianie relacji między zmiennymi na wykresie Zadania
48 48 50
Rozdział 9. Opisywanie związków liniowych między dwiema zmiennymi Pytanie badawcze Stosowanie procedury "Regresja: liniowa" Wybór zmiennych do analizy Interpretacja raportu z analizy Analiza regresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. Analiza regresji wielokrotnej Zadania '"
50 51
54
Rozdział
6. Porównanie prób niezależnych za pomocą jednoczynnikowej analizy wariancji . . . . . . . . . . . .. Stosowanie procedury "Porównywanie średnich: jednoczynnikowa ANOVA" Wybór i definiowanie zmiennych do analizy Wykonywanie testów post hoc (porównania nieplanowane) Interpretacja wyników jednoczynnikowej analizy wariancji Interpretacja wyników porównań testami post hoc Zadania
86 87 88
89 90 92 93
Rozdział
56 56 58
59 60 62
64 65 66
66 69 75
Rozdział
8. Badanie prostych relacji między dwiema zmiennymi Stosowanie procedury "Korelacje"
84
55
Rozdział
7. Porównywanie prób zależnych za pomocą jednoczynnikowej analizy wariancji z powtarzanym pomiarem . . . . . . . . . . . . . . . .. Pytanie badawcze i plan badania Hipotezy badawcze Stosowanie procedury " Ogólny model liniowy: Powtarzane pomiary" Interpretacja raportu z analizy Zadania
77 80 83
76
77
10. Badanie relacji między dwiema zmiennymi jakościowymi 94 Stosowanie procedury "Opis statystyczny: tabele krzyżowe" . .. 96 Interpretacja wyników analizy testem x2 i tabel krzyżowych .... 99 Zadania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 101 Dodatek: Tworzenie baz danych przy użyciu programów innych niż SPSS Edytor tekstów Pliki tekstowe ze stałymi odstępami między danymi Pliki tekstowe z danymi rozdzielonymi separatorem Otwieranie danych tekstowych przy użyciu "Kreatora importu tekstu" . . . . . . . . . . . . . . . . . .. Stosowanie arkuszy kalkulacyjnych do wprowadzania danych Używanie baz danych do wprowadzania wyników Posługiwanie się "Kreatorem przejmowania baz danych" . . . .. Zbiory danych
103 103 103 105 105
106 108 108 110
7
Wstęp
Niniejszy podręcznik zawiera informacje niezbędne do opanowania obsługi SPSS® dla Windows® oraz do analizy danych na poziomie podstawowym. Można go używać wraz z podręcznikiem do statystyki i metodologii. Prowadzący zajęcia mogą korzystać z tej książki na wiele sposobów, w zależności od profilu realizowanych przez siebie ćwiczeń. Podręcznik ten zrodził się z konieczności dostarczenia studentom podstawowych informacji na temat pakietu statystycznego SPSS dla Windows - programu, którego używaliśmy w nauczaniu analizy danych. Długo szukaliśmy opracowania, które w sposób efektywny i klarowny przedstawiałoby metody analizy zachowań. Nasze poszukiwania zakończyły się jednak niepowodzeniem. Wobec tego postanowiliśmy rozwinąć treści prowadzonych przez nas zajęć - i tak powstała książka Do biegu gotowi - start! Wprowadzenie do SPSS 6.1 dla Windows, której zaktualizowane wydanie (opisujące SPSS w wersji 11.0 i późniejszych) właśnie trafiło do Twoich rąk. W zamierzeniu autorskim ma to być narzędzie, dzięki któremu można się nauczyć podstawowych czynności, niezbędnych w obsłu dze SPSS dla Windows. Kolejne rozdziały zostały poświęcone głów nym zagadnieniom analizy danych. Ponadto każdy z rozdziałów pokazuje poszczególne kroki, które należy ćwiczyć przy użyciu SPSS, ażeby w pełni opanować prezentowaną tu praktykę badawczą; zawiera ryciny, które ilustrują najważniejsze etapy pracy z SPSS; i omawia podstawy interpretacji przeprowadzonych analiz. W swojej książce próbujemy także angażować studentów do samodzielnej pracy z SPSS - służą temu zadania zamieszczone na końcu rozdziałów. Wprowadzenie do SPSS dla Windows może być jednym z głów nych narzędzi pracy ze studentami. Użytkownik programu stopniowo bowiem poznaje poszczególne zagadnienia. Prezentację procesu badawczego rozpoczynamy zawsze od postawienia pytania badawczego oraz od wyboru odpowiedniego testu statystycznego, potem
1O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
następuje podsumowanie rezultatów, kończymy zaś interpretacją analizy statystycznej. Żywimy głębokie przekonanie, że taki porządek wykładu umożliwi studentom zrozumienie procesu badawczego i nauczy ich samodzielnej analizy danych, dokonywanej przy użyciu SPSS. Treści podręcznika dotyczą przede wszystkim tych metod statystycznych, które są uznawane za główną składową podstawowego kursu statystyki. W rozdziale pierwszym wprowadzamy czytelnika w arkana obsługi SPSS. W rozdziałach drugim i trzecim omawiamy sposoby uzyskiwania statystyk opisowych i prezentowania danych na wykresach. Kolejne rozdziały, począwszy od czwartego, a skończywszy na siódmym, dotyczą porównywania grup niezależ nych i zależnych za pomocą testu t i analizy wariancji. W dwóch następnych przedstawiamy korelację i analizę regresji. Ostatni rozdział pokazuje sposoby analizowania wyników w tabelach krzyżowych przy użyciu statystyki X2 • W Dodatku znajdują się zbiory danych, które wykorzystujemy, przedstawiając wybrane metody statystyczne. Chcielibyśmy wyrazić wdzięczność kolegom, przyjaciołom i człon kom naszych rodzin, którzy wspierali nasze twórcze przedsięwzięcie. Pragniemy podziękować Frankowi Grahamowi za wsparcie, jakiego nam udzielił w początkowej fazie przygotowywania tego podręczni ka, a także naszemu nowemu edytorowi, który ułatwił druk naszej książki w wydawnictwie McGraw-Hill. Jesteśmy wdzięczni Georgii Gero-Chen za koordynację końcowej fazy edycji tego podręcznika. Dziękujemy również naszym kolegom, którzy go recenzowali: Bruce'owi Abbottowi (Indiana University-Purdue University at Fort Wayne), Dennisowi Bergowi (California State University-Fullerton), Kennethowi Bordensowi (Indiana University Southeast), Paulowi C. Cozby'emu (California State University-Fullerton), Bernardowi Gormanowi (Hofstra University), Louisowi Primaverze (St. John's University), Steve'owi Slane'owi (Cleveland State University), B. Michaelowi Thorne'owi (Mississippi State University) i Toddowi Żakraj sekowi (Southern Oregon State College).
Gdańskie
Wydawnictwo Psychologiczne pragnie serdecznie podzię firmie SPSS Polska za zgodę na opublikowanie ekranów z polskiej wersji systemu SPSS. kować
Rozdział
1
Podstawy obsługi SPSS
CELE ZAJĘĆ 1. Początek pracy z SPSS dla Windows. 2. Nauka otwierania plików z danymi. 3. Prawidłowe przygotowanie bazy danych do analiz. 4. Efektywna praca z raportem. 5. Zamykanie SPSS dla Windows.
Książka, którą właśnie trzymasz w ręku, ma dostarczyć Ci informacji niezbędnych dla początkujących użytkowników SPSS dla Windows. Niniejszy rozdział pomoże Ci opanować podstawowe umiejętności
potrzebne do obsługi SPSS: rozpoczynanie pracy z programem i z bazą danych, przygotowanie bazy danych, opracowywanie wyników Twojej analizy danych. W razie problemów poproś o pomoc prowadzącego ćwiczenia. Początek pracy z SPSS dla Windows
Rozpoczynamy od pulpitu systemu operacyjnego Windows, a następnie posługujemy się menu Start (procedurę ilustruje rycina 1.1) albo klikamy na ikonę (skrót) SPSS, znajdującą się na pulpicie. Na ekranie Twojego komputera pojawi się obraz startowy programu (logo producenta i tym podobne). Oznacza to, że procedura otwierania programu została rozpoczęta. Czas uruchamiania
12
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
RYCINA 1.1.
PODSTAWY OBSŁUGI SPSS ~I
Bez nazwy
Plik Edjl'c;a
Uruchamianie
SPSS Edytor danych
Widok Dane
Przekszłał'cenia
Analiza Wjlkresy
Narzędzia
Okno Pomoc
SPSS za pomocą menu systemu Windows XP. -6
8 9 10 11
12
~.
·f3
§.
:
14
!
15
~
L.-.-..2l - 18 19
20
···21
22
Twojego SPSS zależy od konfiguracji komputera. Można przyspieszyć otwieranie i pracę z programem - w tym celu, zanim uruchomisz SPSS, wyłącz inne aplikacje, na przykład edytor tekstu bądź przeglądarkę internetową, które działają w Twoim systemie operacyjnym.
Otwieranie plików z danymi Po uruchomieniu SPSS pojawi się ekran zachęcający Cię do wykonania kilku operacji związanych z otwarciem plików danych. Pierwszym sposobem otwierania bazy danych jest użycie menu Plik w oknie głównym programu. Drugi sposób polega na posługi waniu się specjalnym oknem dialogowym. Wybór sposobu zależy od rodzaju instalacji SPSS w Twoim komputerze. Sposoby te opiszemy dalej. Jeśli specjalne okno dialogowe, pojawiające się na ekranie tuż po uruchomieniu SPSS, zostanie wyłączone, to główne okno programu będzie wyglądało tak, jak na rycinie 1.2. Ekran ten nazywany jest oknem Danych. Aby wczytać dane do analizy,
RYCINA 1.2.
Okno Dane (Edytor danych).
kliknij menu Plik i wskaż kursorem jedną z opcji w podmenu opcji Otwórz. Początkowe opcje menu Plik przedstawia rycina 1.3. Masz do wyboru: stworzenie nowego pliku, otwarcie pliku istniejącego albo dotarcie do danych zawartych w zwykłym pliku tekstowym. Rycina 1.3 pokazuje również, że dostępne jest podmenu Dane już analizowane - dzięki temu możesz uruchomić wybrany plik. Wystarczy, że klikniesz właściwą etykietę. Najczęściej będziesz uży wać opcji Otwórz. Na rycinie 1.3 została ona podświetlona. Jeśli wybierzesz następujące kroki: Plik> Otwórz> Dane, to powinno się pojawić okno Otwórz plik (rycina 1.5). A oto drugi sposób otwierania plików z danymi, zilustrowany na rycinie 1.4. Przy odpowiedniej konfiguracji Twojego programu takie okno dialogowe powinno się pojawiać za każdym razem po
13
14
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - START' WPROWADZENIE DO SPSS DLA WINDOWS Bez naz"" • SPSS Edytor danych
EJ Bez nazwy - SPSS Edyto! danych Plik Ed)'cja
Widok
Przekształcenia
Dane
• Jl:r;;::LI:U::U;W~
Nowy I
•
Przejmij bazę danych Czyłai dane tekstowe Zapis~
CUl+S
Z_~iak"' ..
Mtfl,j-
I
W'vkresjI
Analiza
Narzędzia
Okno
fhk.
Pomoc
~d.vr.ld
W"ł"k
Qant'
Pq;eb·...l~l.tml. Aby przećwiczyć przedstawioną do tej pory część kursu, wyszukaj odpowiedni plik z danymi, wybierz go, a następnie wczytaj zawarte w nim dane. Twój prowadzący ćwiczenia poinformuje Cię, który plik trzeba uruchomić. Kiedy już uda Ci się znaleźć folder przedstawiony na rycinie 1.5, SPSS natychmiast wskaże Ci pliki zawierające dane do analizy. W naszym przykładzie posłużymy się zbiorem danych GSS93 podzbiór.sav. Będzie on dla nas materiałem szkoleniowym wykorzystywanym w dalszej części książki. Dane tego pliku pochodzą z badań Generalnego Sondażu Społecznego", realizowanego co dwa lata przez Narodowe Centrum Badania Opinii Publicznej Uniwersytetu w Chicago. Celem tych badań jest śledzenie zmieniających się trendów społecznych w zakresie takich obszarów, jak wielokulturowość, posługiwanie się internetem czyipraktyki i przekonania religijne. Generalny Sondaż Społeczny (GSS) z roku 1993 został opracowany na podstawie badania losowo wybranej próby 1500 osób w wieku powyżej 17 lat, na stałe mieszkających w Stanach Zjednoczonych Ameryki Północnej. Plik z tymi danymi powinien się Format pliku można rozpoznać, używając opcji Właściwości (po przejściu do bezpoś redniej pracy z systemem Windows) tuż po kliknięciu ikony wybranego pliku prawym przyciskiem myszy (przyp. tłum.), . . . " " 4 W Polsce na taką skalę realizowana Jest między mnyrm DIagnoza Społeczna I Polski Generalny Sondaż Społeczny (przyp. tłum.), 3
PODSTAWY OBSŁUGI SPSS
RYCINA 1.5. Okno Otwórz plik.
znajdować w katalogu macierzystym SPSS. Jeśli jego lokalizacja jest
właśnie taka, to postaraj się go uruchomić.
W oknie Otwórz plik możesz wybrać nie tylko pliki o rozszerzeniu .sau. Naciśnięcie strzałki obok okienka Plik typu... spowoduje, że zobaczysz bogatą listę plików obsługiwanych przez Twój SPSS. Najczęściej będziesz używać plików z bazą danych, poleceniami i raportami z analiz. Na próbę możesz otworzyć plik z poleceniami programu SPSS - jego rozszerzenie (format) to .sps. Taki plik zawiera język wewnętrzny tego programu, który służy do wykonania zaprogramowanych przez Ciebie zadań. Możesz otworzyć także plik raportu - jego format to .spo. Okno raportu zawiera wyniki procedur statystycznych wykonywanych przez SPSS. Kiedy rozpocznie się otwieranie, zwróć szybko uwagę na środkową i dolną część głównego okna programu - miejsce to nazywane jest oknem statusu SPSS. Dzięki niemu uzyskasz informacje o procedurach, które SPSS właśnie wykonuje>. Po zadaniu otwarcia pliku w oknie statusu powinna pojawić się informacja o tym, że SPSS odczytuje dane.
5
Informacje na ogół są podawane w języku angielskim (przyp. tłum.).
17
18 JJ
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS GSS93 podzbiór sev
SPss Edytor danych
Plik Edycia Widok Dane
[1
PODSTAWY OBSŁUGI SPSS
Przekształcenia
Analiza W,kresy
Narzędzia
plikach, na przykład tworzyć i- opisywać dane, definiować zmienne, przeprowadzać analizy statystyczne. Menu Plik zawiera także opcje
Okno Pomoc
L
Id
(~R"~~r~~l~~~~T""T~·;{"~m'i :~-- 4]
c..:Jj
.. . '6 7 8
1
O I' . (
r r'
l
1Ó 11
'12 -'1~
14 15 16 .17 '18 19
"20)
:=.-1!] .
22 23
4 5 6
2 5 5
5 5 1
O O 25
4 1 2
O O 2
45 78 83
99 10 3
7 8 9 10 11
1 5 1 2 1
1 1 3 5 5
22 24 22 O O
2 3 1 1 1
2 2 2 O O
55 75 31 54 29
10 11 7 3 4
12 13 14 15 16 17 18 19 20 21 22 23
1 5 1 1 5 4 4 5 1 5 7 5 1 1 1 1 1 1 3 1 '21 5 2
O 31 24 O O O 22 32 24 24 23 25
O O 3 4 O 98 9 1 2 5 O 2
O 1 4 3 1 4 O 1 2 2 3 2
23 61 63 33 36 39 55 55 34 36 44 80
10 99 3. 3 11 3 1 9 4 6 8 5
RYCINA 1.6. Edytor danych w widoku Dane.
Podawana jest tam również informacja o liczbie danych zawartych w bazie. Udany proces ładowania pliku kończy się wyświetle niem: SPSS Procesor gotowy (rycina 1.6).
Menu w oknie
głównym
drukowania Twoich raportów z wynikami. Posługując się ryciną 1.6, przyjrzyj się dokładnie poszczególnym menu. Niektóre z nich powiązane są z podmenu. Pojawią się one, kiedy kursorem myszy podświetlisz wybrane menu główne. SPSS zawiera bardzo wiele procedur służących analizom statystycznym - część z nich poznasz, pracując z naszą książką. Podkreślamy jednak, że istnieje wiele zaawansowanych analiz statystycznych, których nie będziemy przedstawiali w niniejszym podręczniku.
zcdrac
SPSS
Przyjrzyj się uważnie głównemu oknu SPSS, przedstawionemu na rycinie 1.6. Zwróć uwagę, że znajduje się tam wiele różnych menu i zestawów narzędzi - korzysta się z nich zawsze przy użyciu lewego klawisza myszy. Większość ćwiczeń zawartych w niniejszej książce wymagać bę dzie od Ciebie opanowania umiejętności korzystania z menu Plik, Dane i Analiza. Dzięki nim możesz wykonywać wiele operacji na
Przeglądanie danych za pomocą okna "Dane" Po zakończeniu wczytywania danych wygląd okna SPSS powinien być zbliżony do ryciny 1.6. Na ekranie widzisz Okno danych albo Edytor danych. Narzędzie to pozwala Ci na dwa sposoby przegląda nia Twojej bazy danych, przy użyciu okien Dane i Zmienne", Okno Dane wyglądem przypomina arkusz kalkulacyjny. Liczby, które się w nim znajdują, to właśnie Twoje pomiary - dane do analiz statystycznych. Jeden rząd arkusza zawiera dane dla jednej obserwacji (przypadku) w Twoim badaniu (numery poszczególnych obserwacji znajdują się po lewej stronie). Jedna kolumna to jedna zmienna, którą posługujesz się w badaniu. Każda zmienna jest opatrzona nazwą, która widnieje u góry okna głównego. W zbiorze GSS93 podzbiór.sav są to na przykład nazwy wrstat, agetoed", Wskazanie kursorem danej zmiennej spowoduje wyświetlenie jej dokładnego opisu. Wykonaj tę czynność, aby szybko zebrać informacje o elementach bazy danych. Arkusz w widoku Dane składa się z komórek uformowanych przez linie pionowe i poziome. Dane do poszczególnych komórek
6
Widoki zmieniamy, klikając zakładki znajdujące się u dołu głównego okna (przyp.
tłum.).
7 Rozszerzeniem nazwy zmiennej jest etykieta, którą można przeczytać/opisać za pomocą widoku Zmienne. Nazwa zmiennej nie może zawierać więcej niż osiem znaków i pierwszym z nich nie może być liczba (przyp. tłum.).
19
2O
,-1 GSS93 podzbiór Plik
Ed}lcia
s av
Widok
SPSS Edyto, danych
Dane
Emifil."
Przekształcenia
Analiza Wykresy
Narzędzia
Okno Pomoc
~ ~ 1'"'1("'·1 ~ f..Jl?l ~ ~ -~ ... -Jlld Nazwa r:::e:~~::y-I~~r~k;;ćl:Dzle-~lęi~~ -
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI - STARTI WPROWADZENIE DO SPSS DLA WINDOWS
2 wrkstat
Numeryczny·1
O
3 4 5 6
mantal agewed sibs childs age
Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny
2 1 2
O O O O O
8 brrthmo -9 zodiac
Numeryczny Numeryczny
2 2
O O
11 degree ~padeg ~madeg ~sex ~ race • -n-16i mcome9 1
Nameryczny Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny Numeryczny
2 1 1 1 1 1 2
O O O O O O O
~ nncom91 18 region
Numeryczny Numeryczny
2 1
O O
~partYld ----22 vote92
Numeryczny Numeryczny Numeryczny Numeryczny
2 4 1 1
O O O O
23 po/vlews • _ -24] cappun
Numeryczny Numeryczny
1 1
O O
Numer czn
1
O
:: _--_71
~educ
19 xnorcsrz
........:J2J.
-----1QJ sns
25
unlaw
1
i
Kod responden Brak Brak Obecna sytua {O, Nie dotycz O, 9 Stan CYWilny {1, lonaty/zam 9 Wiek zawarcia {O, Nie dotycz 0,98,99 Liczba braci I {98, Nie wiem) 98,99 Liczba dzreci {8, OSiem lub 9 Wiek responde{98, Nie wiem) 0,98,99 Miesiąc urodz {O, Nie dotycz O, 98, 99 Znak zodiaku r {O, Nie dotycz -O,9B, 99 Lat nauki szko {97, Nie dotyc 97,98,99 Poziorn wyksz {O, Mniej ruz H 7, 8, 9 Poziom wyksz {O, Mniej High ·7, B, 9 Poziom wyksz {O, Mniej ruz HI7, 8, 9 Płeć responde {1, Męzczyzna Brak Brak Rasa responde p, Biała} Dochód łączny {O, Nie dotycz 0,98,99 Dochody z pra {O, Nie dotycz 0,98,99 RegIOn żarmes {O, Nie przypis O Rozszerzony k {O, Nie przypis O Wielkość
mrej 1-1, Nie przypi -1 Identyfikacja p {O, Mocny dem 8,9 Czy glosował {O, Nie dotycz 0,8,9 Czy myśli o solO, Nie dotycz 0,8,9 Za/przeciw kar {O, Nie dotycz 8, 9 la lub rzeciw O, Nie dot cz 0,8,9
O:
RYCINA 1.7.
Edytor danych w widoku Zmienne. możesz wprowadzać, klikając wybraną komórkę
arkusza. Dopiero w aktywnej komórce możesz umieścić wynik uzyskany w badaniu.
Przygotowanie danych za
pomocą
okna "Zmienne"
Zanim przystąpisz do analiz, zadbaj o pełne zdefiniowanie bazy danych. Odpowiednio przygotowany zbiór wyników umożliwi Ci odczytanie wielu informacji, na przykład w raporcie. Każdą zmienną naszej bazy możemy opisać na dwa sposoby jednocześnie: za pomocą ośmioznakowej nazwy lub etykiety. Poszczególne wiersze pozwalają na odczytariie, którego pomiaru dotyczy dana zmienna, jakie wartości może ona przybierać i na jakiego typu skali jest mierzona. Większość baz danych, które
obejmuje program SPSS, ma już odpowiednio zdefiniowane zmienne. Podsumowując, należy stwierdzić, że opisywany tutaj proces jest integralną częścią analizy danych. Przedstawiony etap zrealizujesz przy użyciu okna Zmienne (rycina 1.7). Widok Zmienne różni się od okna Dane tym, że w tym pierwszym zmienne są uporządkowane w rzędach, a w kolumnach widnieją właściwości każdej z nich. Na przykład na rycinie 1.7 czternasty rząd dotyczy zmiennej płeć (sex). Spróbuj kliknąć pierwszą kolumnę w tym rzędzie, a następnie przy użyciu strzałek kierunku na klawiaturze przemieszczaj się w obrębie tego rzędu z jednej kolumny do drugiej. W pierwszej znajduje się nazwa zmiennej. Kolejna zawiera już informację, że zmienna ta zdefiniowana jest jako numeryczna. Trzecia kolumna informuje o tym, ile znaków możemy napisać, wprowadzając dane do zmiennej. Okno Zmienne pozwala Ci na wykonanie wielu zadań. Jeśli używasz pliku przygotowanego przez firmę SPSS, to dostęp do właściwości zmiennych jest szybki i nie nastręcza żadnych problemów. Jeżeli zakładasz bazę danych, to zdefiniowanie zmiennych jest Twoim zadaniem. Możesz wówczas określić skalę pomiarową Twojej zmiennej, a do wyboru masz: jakościową, porządkową i ilościową". Dostępne jest także określenie wartości, które wprowadzasz, gdy brakuje Ci jakichś danych w odniesieniu do konkretnej obserwacji. Przykłady omawiane w tej książce opierają się na bazach danych przedstawionych w Dodatku. Twoim zadaniem będzie więc przygotowanie plików SPSS z tymi danymi. Gdy chcesz wprowadzić dane ze swojego badania, musisz zało żyć własną bazę. SPSS pozwala Ci także na zbieranie danych z plików MS Word, z arkuszy kalkulacyjnych, takich jak MS Excel czy Lotus, albo z baz danych dBase i MS Access (więcej informacji znajdziesz w Dodatku). Postaraj się w tym momencie zaznajomić z widokiem Zmienne. Spróbuj poklikać na poszczególne kolumny i komórki. Zauważ, że w niemal każdej kolumnie pojawiają się przyciski Za pomocą opcji Ilościowa definiujemy zmienne zmierzone na skali interwałowej i ilorazowej (przyp. tłum.).
8
21
22
III GSS93 podzbiór.• av - SPSS Edytor danych Phk
Edycja
-j
I
Widok.
Id
- -- "21wrkstat
i I
•
''::lImantai
"~
41agewed "5 srbs
~chllds
~age l
8 birthrno
-9" rodrac 10 educ "Ti degree ~padeg
Dane
GSS93 podzbióuav - SPSS Edylar danych
Przekształcenia
=
liIumeryczny
Analiza
Wykresy
Narzędzia
Okno
'o
Kod responden Brak
llllllll
ll l ·
f,
e Numeryczny
O
Przecmkcw'
-rr
O Z kropkę O Notaeranaukowa O DataI czas
Co
l
~~ i O l O
Pomoc
r-'(jK"I Szerokość
r:;'"1
l!J.
Mlelsca dZieSiętne@]
Dolar Format uz~tkownlka
Tek~tDw~
13 madeg Numeryczny 1 O 14 sex INumeryczngl1 O 15 race Numeryczny 1 0 O 16 IrIcome91 Numeryczny 2 17 nncom91 Numeryczny 2 O Numeryczny 1 iD fś region 19 xnorcsrz Numeryczny 2 O Numeryczny 4 20 size 'O 'Numeryczny 1 'O 21 partyld 22 'Iote92 Numeryczny ' 1 0 , 23 polvlews Numeryczny 1 O
L......:;::::.. r;:;:;::-1
{O, Nie dotycz 0,9 {1, lonaty/zam9 {O,-N;e doty'czO, 98, 99 {98, Nie wiem} '98,99
\llldok
Dane
Przekształcenia
Analiza Wykresy
N.uzędzia
Okno
Pornoc
i~l~r.sll!!l ;;;)-;::;) ~ fgfl ~ Eimil =rm~l r~~
Po~]
4
°
Kod responden Brak
1
O
1
O
Obecna eytue Stan CYWilny { -...... • '" ...
4 aqewed 5b
Numeryczny
2
O
Wiek zawarcia
Numeryczny Numeryczny Numeryczny
2 2 2
O
Wiek reepcnde f I
3 mańtal
6
:~':ds
.7 age
~~~:;:::~: ~
~
Brak
6
~:::: :;~~~:
r
=========::::l
:: :::::
I {l
,
Numeryczny
2
O
Numeryczny Numeryczny
1 1
O O
Pcnom wyksz {
13 madeg
Numeryczny
1
O
POZlOm wyksz {O, Mmej nlZ HI?, 8, 9
14 sex 15 race
Numeryczny Numeryczny
1 1
O
Piec responde Męzczy Rasa responde{1, Biała}
{O, Mniej High '7,8,9
-Pozrom wyksz {O, Mnrej ruz Hi7, 8, 9 Płeć responde 'p, MęzczyznaBrak Rasa responde {1, Brała] Brak Dochód !ączny'{O, Nie dotycz '0,98,99 Dochody z pra,{O,Nie dotycz 0,98,99 Reglóń'zamles'{OiNle prźYPls:O Rozszerzony k {O, Nie przypis O 'Wielkość miej {-1, Nie przypt -1 'Identyfikacja p {O, Mocny dem8, 9 Czy głosował {O, Nie dotycz '0,8,9 Czy myśli o so{O, Nie dotycz O, 8, 9
- wyjątkiem są kolumny Nazwa i Etykieta. Klawisze te służą do wykonania kolejnych kroków definiowania zmiennej. Rycina 1.8 przedstawia podświetloną kolumnę dla czternastej zmiennej (piec), a także okno Typ zmiennej, które możemy uruchomić, klikając kwadracik z trzema kropkami. Wspomniane okno pozwala ci na zdefiniowanie typu zmiennej. Osoba analizująca dane powinna wiedzieć, w jakim formacie? SPSS je przechowuje. W więk szości wypadków będziesz używać typu Numerycznego, tak jak w naszym przykładzie na rycinie 1.8. Dane możesz też przechowywać w formacie Tekstowym (litery i cyfry), Daty, Dolara, jak również w formacie przez siebie przygotowanym.
Chodzi tutaj o format numeryczny, tekstowy i inne (przyp. tlum.).
16 rncomes'l
Numeryczny
2
17 rincom91 18 regIon
Numeryczny Numeryczny
2 1
meresu
O O
a
lp.
F§I Brak Brak
Dochód łączny {O,Nie dotycz 0,98,99 Dochody z pra {O, Nie dotycz 0,98,99 Rapmnzanues{O.Nie przypis O
O O O
Rozszerzony k {O,Nie przypis O W'ielkość miej {-1. NIe przypl -1
8
Do prawej
8 8
Do prawej Do prawej
8
a 8
8
Do prawej Do prawej Do pralNe)
2
Numeryczny Numeryczny
4 1
O
ldentyfikacja p {O, Mocny dem8, 9
8
Numeryczny
1
23 pcbtews 24 cappun
Numeryczny Numeryczny
1 1
D O O
CZ)' głosował {O, Nie dotycz 0,8,9 Czy mysf o so{O, Nie dotycz 0,8,9 Za/przecIW kar {O, Nie dotycz 0.8,9
Do prawej Do prawej
22 vole92
8 8 8
Do prawej Do prawej
8
Do prawe)
25 gunlaw
Numeryczny
1
O
Za lub przacfw {D, Nie dotycz 0.8.9
8
26 grass
Numeryczny
1
O
Czy manhuana {O, Nie dotycz 0,8.9
8
Do prawej
27 rehg
Numeryczny
1
O
Zjaka religia,
8
Do prawej
O O O
8 8
Do prawe;
Idealna hczba
8 8
Do prawe}
28 lńe
Numeryczny Numeryczny
1 1
30 pillok
NumeryCZny Numeryczny
1 1
31 sexeduc
O
i POrOOC]
Do pra'9Vej
Numeryczny
29 chldrdel
•
pOZ10mWYkSZ{~';'~"~'''':;:;~==;===~====~_~J
20 srze 21 parlyld
19
_
r-iWI
~
~==========:; ! §iJ
10 educ
{O')t1meJ n1Z H) "8, 9
MieSiąc urcdz {i
;;::~::;:,:::;;:=====:=:;
11 padeg degree 12
O O
ilOŚCIOwy
-----11;-.
rEtykletYWillto"",::::,
{O, Nie dotycz O, 98, 99 {O, Nie dotycz ,0,98,99 {97, Nie dotyc97, 98, 99
8 bmfmc 9 zcdrac
Do prawe)
{)ijt?liil:il1fttg---"_M_----
l!.
Pcnom
Wyrównanie
Numeryczny Numeryczny Numeryczny
{98, Nie wiem} O, 98, 99
~ {8, OSiem lub ,9
",'
wattoset
1 Id
2 wrkstat
~ = :'MęzCly~na" Znak zodiaku r ~;iJ 2.. 'Kobteła Lat nauki szko {J . ~----""-l
RYCINA 1.8. Definiowanie typu zmiennej.
9
Plik Ed.vCla
-'-N;;;;;--' [--fYP-- -rszerokoŚĆ-l-D~;e~~--l-EtYklet;-
:4
23
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
{1, Protestant} 8,9
Zycie Jest pas) {O,Nie dotycz 0,8,9
r. Nie dotyczy -1,9
Kontrola uroda {O, Nie dotycz 0,8,9 Edukacja seks {O, NJe dotycz 0.8,9
Do prawe)
Do prawej
Do prawe}
RYCINA 1.9. Definiowanie etykiety wartości.
Okno Typ zmiennej pozwala Ci na określenie maksymalnej liczby znaków, jaką można wpisać do komórki w trakcie wprowadzania danych. Rycina 1.8 pokazuje, że w formacie Numerycznym wprowadzony jest jeden znak i że niemożliwe jest umieszczenie danych po przecinku-''. Jeśli prowadzący ćwiczenia zaleci Ci stworzenie bazy danych, to każda zmienna powinna być zdefiniowana. Odpowiednio przygotowane dane w kolumnie Wartości posłużą Ci do wprowadzania danych. Po raz kolejny zajmijmy się zmienną pleć. Rycina 1.9 pokazuje, że wartość 1 przyporządkowana jest do etykiety Mężczyzna, a wartość 2 - do etykiety Kobieta. Aby zmienić etykietę bądź przyporządkowanie do etykiety, najpierw wybierz 10 W takiej sytuacji, jeśli do komórki wkleimy dane zawierające liczby dziesiętne to SPSS dokona zaokrąglenia (przyp. dum.). '
24
PODSTAWY OBSŁUGI SPSS
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
G5S93 podzbIór *av - SPSS Ed,tordanych Edyqa WIdok Dane Przekaatełceme Andlml
Phk
W9k'e~.Y
Narzędll Drukuj. Po kliknięciu opcji Drukuj pojawi się odpowiednie okno (rycina 1.14), które zawiera wiele przydatnych opcji. W okienku Nazwa widoczna jest domyślna drukarkal'. Jeśli podana drukarka jest wła ściwa, wystarczy nacisnąć przycisk OK. Jeżeli plik raportu zawiera wiele tabel i wykresów, może upłynąć parę minut, zanim rozpocznie się drukowanie. Okno Drukowanie zawiera opcje dotyczące
Komenlaru Pllkdany Liczba dzieci [child & \@> Miesiąc urodzenia K;i
i>, Znak zodiaku resp ~%l ~:~"j
Poziom wyksztatc.~ ;Jj~l
Zmienne:
i> Wiek respondenta [age]
•
F'lec respondenta [:e.,]
&'
',0/
Poziom wyksztatc~:tl
,.~ Poziom wYksztatce~~
.&
~
Rasarespondenta llt~ ~c' Dochódłączny g
~ Pokeż tabele częstości
RYCINA 2.2. Okno Częstości.
- żeby były ułożone od najmniejszej do największej. Aby wybrać jedną z tych dróg, kliknij na klawisz Format w oknie Częstości. W oknie Częstości: Format możesz ograniczyć liczbę kategorii pojawiających się w tabeli częstości - takie postępowanie służy klarowności prezentacji Twoich wyników. Spróbuj poeksperymentować z opcjami w oknie Częstości: Format. Jakie rezultaty udało Ci się osiągnąć?
SPSS może wyliczyć dla Ciebie wiele statystyk - oddzielnie dla każdej zmiennej. Po kliknięciu na klawisz Statystyki, który znajduje się w oknie Częstości, pojawi się kolejne okno Częstości: Statystyki. Ulokowane są w nim zarówno wartości percentyli, miary tenden-
cji centralnej i rozproszenia, jak i innych charakterystyk rozkładu. Uzyskiwane tu statystyki są szczególnie przydatne we wstępnej fazie analizy danych. Każdy użytkownik SPSS powinien rozwinąć nawyk używania Częstości w konfiguracji dostosowanej do własnych potrzeb. Rycina 2.3 pokazuje, które statystyki wybrał przykładowy badacz. Są tam kwartyle, trzy miary tendencji centralnej, skośność i kilka rozmaitych miar rozproszenia. Ćwiczenia zawarte w tym rozdziale możesz wykonywać przy użyciu opcji wskazanych na tej rycinie - oczywiście, jeśli prowadzący ćwiczenia nie zdecyduje inaczej.
33
34
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
ROZKŁAD CZĘSTOŚCI I STATYSTYKI OPISOWE
EJ
CzęstOŚCI- Statystyki Wartości
percentyli-------..,
~ Kwartyle
D
Punkty podziału dla
D
równych grup
l...--....I
L____
j
o Odchylenie standardowe o Wariancja o Błąd standardowy średniej
I Anuluj I Pomoc J Dalej
D Suma D Wartości są środkami grup Rozkład--------,
Rozproszenie
r
~ Mediana ~ Dominanta
OPercentyle:
D
Tendencja centralna ~ Średnia
D D
Minimum
~ Skośność
MakSimum
D Kurtoza
~ Rozstęp
RYCINA 2.3. Okno Częstości: Statystyki. Naciśnięcie klawisza Dalej kończy wybór statystyk i pozwala na powrót do okna Częstości. Upewnij się, czy opcja Pokaź tabelę czę stości jest zaznaczona. Następnie kliknij OK. Po zakończeniu obliczeń w oknie statusu powinna pojawić się informacja, że procesor SPSS jest gotowy - w tym momencie wyniki Twojej wstępnej analizy danych znajdują się w oknie raportu.
ZADANIA i drukować raport będący wynikiem użycia Częstości. Wykonaj teraz następujące ćwiczenia: 1. Otwórz plik z bazą danych i użyj procedury Częstości. Przyjrzyj się informacjom zawartym w oknie raportu. Zwróć szczególną uwagę na tabelę częstości i jej relację z miarami tendencji centralnej, rozproszenia i z kształtem rozkładu. 2. Sporządź krótki raport pisemny, którego tematem będzie charakterystyka uzyskanych wyników. Opisz każdą ze zmien-
Wiesz
już
jak
przeglądać
nych, które zawiera Twój raport. Możesz wypunktować najważniejsze informacje. Nie ograniczaj się do przepisania danych zawartych w wydruku, opisz także wnioski, które Ci się nasuwają. Spróbuj odpowiedzieć na takie pytania jak:: "Dlaczego średnia danej zmiennej przyjmuje wartość 40,41?" czy też "Dlaczego mediana zmiennej jest większa od jej śred niej?" Odpowiedź na pytania tego typu wymaga szczegóło wego przyjrzenia się kształtom rozkładów a także miarom tendencji centralnej oraz rozproszenia. Przy wykonywaniu tego zadania przydatna może być rycina 1.11, pokazująca raport po przeprowadzeniu procedury Częstości.
35
GRAFICZNA PREZENTACJA DANYCH
37
1165593 podzbiór.eev - 5P55 Edytor danych Phk.
Edycja
Widok
Dane
Przekeatełcenie
Analiza
Wykresy
Narzędzia
Okno
Pomoc
OCZę.lolic;
Rozdział 3
~1~-c=r~"~~jT~~~~;; 3 2 2' 4 1i 2 2
Graficzna prezentacja danych el Pckeatabele częstoser
~ 11 12
"Ul ,~ -~2.41
CELE ZAJĘĆ 1. Przygotowanie wykresów za pomocą opcji Wykresy w oknie Częstości. 2. Drukowanie wykresów. 3. Interpretacja wykresów.
15 16
fi 18 19
'2Ó 21 22
W tym rozdziale omowimy tworzenie i interpretację wykresów. Proponowane tu ćwiczenia nie powinny sprawić Ci większych trudności. Zaczniemy od miejsca, w którym zakończyliśmy pracę w rozdziale 2.
Przygotowanie wykresów Zanim przejdziesz do tworzenia wykresów, pamiętaj, aby wybrać taki typ wykresu, który jest dostosowany do charakteru skali pomiarowej. Słupki służą do wizualizacji danych na skali nominalnej. Histogramów zaś używa się do opisu danych zmierzonych na skalach interwałowej i ilorazowej, szczególnie gdy mamy do czynienia ze zmiennymi o charakterze ciągłym. Aby uzyskać wykres, należy wykonać następujące kroki: Analiza> Statystyki opisowe> Częstości> Wykresy. Otwieranie tej ostatniej opcji zostało opisane w rozdziale 2. Po naciśnięciu klawisza -rc-z__ 1_..
c rvc c ~_L_':' ........... 1..._ _ rt_,.. ....,.,..,!~;. lVl",.l,N".ł'U""" ('ł"Ur1"~ '::t 1 \
()'lrnn
I Statystyki I~
10 11 12 13 14 15 16 17 18 19 20 21 22
2 1 1 1 5 4 1 7 1 1 1 3 2
5 5 5 1 4 -5 5 5 1 1 1 1 1
1 O O O O 2 2
43 43 45 78 83 55
x Typwyk,esów-----, ~
o Brak
O Wykresy O Wykresy
I Anulul J
słupkowe
kołowe
~
@ Histogramy ~ Z krzywą normalną
24 23
5 O
2 3
5
448
36 44
2 99 10 3 10 11 7 3 4 10 99 3 3 11 3 1 9 4 6 8
RYCINA 3.1. Okno Częstości: Wykresy.
to pozwala na wybór kilku rodzajów wykresów: słupkowego, koło wego i histogramu. Jeśli klikniesz teraz na opcję Wykres słupkowy lub na opcję Wykres kołowy, będziesz mógł wybrać pomiędzy wykresem prezentującym częstości a wykresem prezentującym dane procentowe. Jeżeli natomiast klikniesz na opcję Histogram, będziesz mógł zdecydować, czy chcesz, by na wykresie pojawiła się krzywa rozkładu normalnego. Wyboru takiego dokonasz, klikając na opcję Z krzywą normalną. Użyj
klawisza Dalej, aby zakończyć budowanie wykresów. SPSS powróci teraz do okna Częstości. Naciśnij OK. Na ekranie powinno się pojawić okno raportu. Kliknięcie na etykietę Histogram, w lewym panelu Edytora raportów, spowoduje podświetlenie utworzonego histogramu. Wynik tej czynności przedstawia rycina 3.2. Teśli wybierzesz wiecei niż iedna zmienna.
38
r ,
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
-
-
!oRapcrt @CJ:O'$latcl(FREQlA:NOES)
~
GRAFICZNA PREZENTACJA DANYCH
.
Wiek respondenta
"I~~
~Sl~1a
.a:Jj-
Eksport do p l i k u - - - - - - - - - - - - - - = = = = : . ,
300,-----------,
14Woekrespoodertll
Plik-
200
.
J
Lt2ii~_am_FI~es\S_PS_S_\O_UT_P':':"
Eksportuj---------,
Format eksportu-----..,
G Wszystkie wykresy
Typ pliku
O Widoczne wykresy
~_Mall
o Wybrane wykresy
La
100 Odch Sld = 17.42 Średnia = 46,2 N = 1495,00
o 21,3 36,3 51,3 66,3 81.3 28,8 43,8 58,8 73,8 88,8
RYCINA 3.3. Okno eksportu raportu
Wiek respondenta
ra powinno RYCINA 3.2. Histogram w oknie Edytora raportów.
to w lewym panelu edytora znajdzie się więcej wykresów do zaznaczenia. W wypadku histogramów SPSS dodaje do wykresu kilka statystyk, takich jak odchylenie standardowe, średnia i liczba obserwacji. Wybór opcji Z krzywą. normalną. powinien spowodować pojawienie się odpowiednio dopasowanej linii. Wybierając zmienne opisane na skali ciągłej, zwróć szczególną uwagę na to, jak histogram jest dopasowany do krzywej normalnej. Rzuć okiem na rycinę 3.2. Widać tam wyraźnie, że rozkład wybranej zmiennej jest skośny dodatnio i niedopasowany do krzywej normalnej. Twoim ostatnim zadaniem w tym rozdziale będzie wydrukowanie wykresu. Uczynisz to metodą opisaną w rozdziale 1. SPSS pozwala Ci także na wyeksportowanie wykresu, tak aby możliwe było odczytanie go w innym programie. W tym celu wejdź do menu Plik, a następnie wybierz opcję Eksportuj. Na ekranie Twojego kompute-
się pojawić takie
okno, jak na rycinie 3.3. Uruchom op-
cję Wykresy w okienku Eksportuj. Za pomocą klawisza możesz też określić wielkość uzyskanego eksportu. W tym celu w oknie Rozmiar eksportowanego wykresu zaznacz żądaną wielkość. Od wyboru opcji drukowania może upłynąć kilka lub kilkanaście sekund, zanim rozpocznie się drukowanie. Wykresy zajmują
dużo pamięci, dlatego też przygotowanie do ich wydrukowania zabiera trochę czasu.
ZADANIA Sądzimy, że przygotowaliśmy Cię do tworzenia wykresów. Uzupełnij swą dotychczasową wiedzę, wykonując kilka dodatko-
wych zadań (przy użyciu zbioru GSS93 podzbiór.sav): 1. Wybierz przynajmniej jedną zmienną do utworzenia wykresu. 2. Wydrukuj raport. 3. Korzystając z wydruku, opisz w krótkim raporcie uzyskane informacje, przede wszystkim kształt rozkładu, skośność a także ich relacje do miar tendencji centralnej. Uwzględnij też dane dotyczące rozproszenia. o
'
39
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB
NIEZALEŻNYCH
mogłoby brzmieć:
Rozdział
4
Testowanie hipotez badawczych dla dwóch prób niezależnych
CELE ZAJĘĆ 1. Nabycie umiejętności formułowania hipotez badawczych, dotyczących różnic pomiędzy dwiema niezależnymi populacjami. 2. Opanowanie procedury Test t dla prób niezależnych w celu weryfikacji hipotez badawczych. 3. Wykształcenie zdolności podsumowywania rezultatów analizy na podstawie raportu.
Większość hipotez badawczych głosi, że dwie populacje różnią się między sobą, Przetestowanie tego typu twierdzeń staje się możli we, gdy zostanie wybrana właściwa procedura statystyczna. W tym rozdziale nauczysz się, w jaki sposób porównywać pomiary pochodzące z dwóch różnych populacji przy użyciu testu t dla prób nie-
zależnych.
Przed przystąpieniem do testu należy podjąć decyzję, co ma być przedmiotem porównania. W podjęciu takiej decyzji pomocne bę dzie sformułowanie pytania badawczego. Pytanie takie powinno precyzyjnie wyrażać to, czego mianowicie chciałbyś się dowiedzieć na podstawie dokonywanych porównań. Załóżmy, że interesuje Cię porównanie kobiet i mężczyzn pod względem wieku zawarcia związku małżeńskiego. W takim wypadku Twoje pytanie badawcze
"Czy kobiety i mężczyźni różnią się wiekiem w momencie zawierania małżeństwa?" W zależności od tego, jak zostanie sformułowane pytanie badawcze, wybiera się odpowiednią procedurę statystyczną. W naszym przykładzie pytanie badawcze sprowadza się do porównania kobiet z mężczyznami pod względem wieku zawarcia pierwszego małżeństwa. Twoim zadaniem będzie zatem wykonanie testu t dla prób niezależnych. Chcąc odpowiedzieć na postawione pytanie badawcze, musisz sformułować hipotezę, którą można będzie zweryfikować za pomocą testu t dla prób niezależnych (więcej na temat testowania hipotez znajdziesz w podręczniku do statystyki). Gdy hipoteza będzie już gotowa, przejdź do jej testowania przy użyciu procedury statystycznej omawianej w niniejszym rozdziale. Do analizy użyj danych o wieku kobiet i mężczyzn w momencie zawarcia pierwszego małżeństwa. Informacje pochodzą z Generalnego Sondażu Społecznego, przeprowadzonego w roku 1993 (plik GSS93 podzbiór.sav).
Stosowanie procedury "Test t dla prób niezależnych" Najpierw wczytaj plik z danymi. W celu wykonania Testu t dla prób niezależnych użyj menu Analiza - w taki sposób, jak pokazuje rycina 4.1. Następnie kliknij na podmenu Porównywanie średnic~. Wyświetli się wówczas wiele dodatkowych opcji, takich jak: Srednie, Test t dla jednej próby, Test t dla prób niezależnych, Test t dla prób zależnych, jednoczynnikowa ANOVA. Wybierz opcję Test t dla prób niezależnych poprzez użycie lewego klawisza myszy (Analiza> Porównywanie średnich> Test t dla prób niezależnych).
Wybór zmiennych Po wyborze opcji Test t dla prób niezależnych w SPSS pojawi się okno zawierające listę zmiennych zawartych w pliku danych. Twoim zadaniem będzie wybranie dwóch rodzajów zmiennych: 1) zmiennej albo zmiennych testowanych (zmiennej albo zmiennych zależnych);
41
42
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
NIEZALEŻNYCH 43
-:J GSS93 podzbiór sev - SPSS Edytor danych Edycja
Plik
Widok
Dane
Przekształcenia
:~lg=r41 ~ l;)fr-: 0,05), to należy oprzeć się na wynikach testu t, umieszczonych w pierwszym wierszu. Jeśli zaś wartość testu Levene'a wskazuje, że wariancje są istotnie różne (P < 0,05), to należy oprzeć się na wynikach umieszczonych w wierszu drugim. Wyniki umieszczone w wierszu drugim zawierają poprawkę uwzględniająca niespełnienie założenia o równości wariancji. W przykładzie przedstawionym na rycinie 4.4 wartość testu Levene'a i wielkość p wskazują, że wariancje w grupach są podobne (nie różnią się istotnie). Należy zatem interpretować wyniki znajdujące się w wierszu o nazwie Założono równość wariancji. Po określeniu tego, który wiersz należy czytać, można przystąpić do interpretacji wyników testu t. SPSS oblicza wynik tego testu, pokazując jednocześnie wartość p dla tej statystyki. Poziom p (dwustronny) pozwala ocenić prawdopodobieństwo popełnienia błędu pierwszego rodzaju. Jeśli wartość p jest mniejsza niż założony poziom alfa (przyjmuje się zwykle p = 0,05; lub P = 0,01)16, powinno nas to skłonić do odrzucenia hipotezy zerowej a wiec do uznania, że porównywane populacje (mężczyźni i kobiety) różnią się od siebie w zakresie średniego poziomu zmiennej zależnej. Gdyby natomiast uzyskana wartość p okazała się wyższa niż założony poziom alfa, odrzucenie hipotezy zerowej nie byłoby możliwe. Znaczyłoby to, że brak jest wystarczających podstaw do stwierdzenia, że porównywane populacje różnią się od siebie w zakresie średniej wartości zmiennej zależnej. Nie oznacza to jednak, że bylibyśmy upoważnie ni do stwierdzenia, że są one takie same. 16 Warto zwrócić uwagę, że jeżeli podajemy założony poziom prawdopodobieństwa (alfa), to po znaku p piszemy ,,=". Natomiast jeśli podajemy uzyskaną wartość p, to zwykle używamy znaku nierówności, na przykład p < 0,05, p < Ó,Ol lub p < 0,001 (przyp. tłum).
SPSS wskazuje, że poziom p jest mniejszy niż założony (czyli alfa = 0,05). Można zatem stwierdzić, że różni ca między kobietami a mężczyznami pod względem wieku w momencie zawierania pierwszego małżeństwa jest istotna statystycznie. Dochodząc do takiego wniosku, odrzucasz jednocześnie hipotezę zerową o braku różnic między tymi grupami. Wartości średnich'? wskazują, że mężczyźni później niż kobiety zawierają swoje pierwsze małżeństwo. Jeśli poziom prawdopodobieństwa (p) jest niższy niż 0,001, to SPSS podaje wartość ,,0,000". Przy pisaniu raportu wartość ta powinna być przedstawiona jako p < 0,001. W naszym
przykładzie
ZADANIA Sądzimy, że
potrafisz już testować hipotezy badawcze przy uży ciu procedury Test t dla prób niezależnych. Naukę na podstawie tego rozdziału zakończ, wykonując następujące ćwiczenie: 1. Sformułuj pytanie badawcze odnoszące się do relacji między dwiema zmiennymi. 2. Sformułuj hipotezę, której weryfikacja wymaga porównania dwóch prób niezależnych. 3. Zweryfikuj swoją hipotezę używając testu t dla prób niezależ nych. 4. Sformułuj jedno-dwuzdaniową konkluzję opisując wyniki w terminach zmiennej niezależnej i zmiennej zależnej.
17
Można
je znaleźć w tabeli Statystyki dla grup (przyp. tłum.).
47
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
Rozdział
5
Testowanie hipotez badawczych dla dwóch prób zależnych
CELE ZAJĘĆ 1. Nabycie umiejętności formułowania pytań odnoszących się do różnic między dwiema zależnymi populacjami. 2. Nabycie umiejętności formułowania hipotez na podstawie pytań badawczych. 3. Opanowanie procedury Test t dla prób zależnych. 4. Nabycie umiejętności podsumowywania wyników analizy na podstawie raportu.
Procedura Test t dla prób zależnych służy do oszacowania, czy śred nie pochodzące z dwóch powiązanych ze sobą populacji różnią się między sobą. Rodzaj populacji i sposób jej dobierania zależy od postawionego pytania badawczego. Często badacze formułują pytania o następującej strukturze: "Czy uczestnicy badania po otrzymaniu określonego oddziaływania eksperymentalnego będą zachowywali się inaczej niż przed poddaniem ich oddziaływaniu?" Pytanie tego typu zakłada, że wystąpi powtórzony pomiar pewnej zmiennej. Taki schemat badania określa się mianem metody powtarzanych pomiarów lub test/retest.
Pytanie badawcze i plan badania Plan badania w układzie z powtarzanym pomiarem Przykładowe pytanie badawcze brzmi: "Czy lek stymulujący pamięć będzie wpływał na zdolność osób cierpiących na chorobę Alzheimera
do zapamiętania słów z listy?" Przed rozpoczęciem kuracji badamy u każdego pacjenta poziom zapamiętywania słów z listy. Ponowne badanie pamięci przeprowadzamy po zakończeniu kuracji. W teście t dla prób zależnych porównujemy wynik każdego pacjenta przed kuracją i po niej. Plan badania grup
niezależnych
z doborem parami
w układzie z powtarzanym pomiarem Opisywany tutaj test t może zostać użyty także wtedy, gdy w badaniu występują dwie niezależne grupy, przy czym osoby badane zostały dobrane do grup w taki sposób, by zapewnić, że grupy nie róż niły się od siebie w punkcie wyjścia. Mamy tu do czynienia z planem badawczym wykorzystującym dobór parami. W pierwszej fazie realizacji takiego planu należy utworzyć dwie niezależne grupy, tak aby były one jak najbardziej podobne ze względu na jakąś zmienną pozostającą w bliskim związku z naszą zmienną zależną. Postępo wanie to ma na celu zapewnienie równoważności grup w punkcie wyjścia. Przykładem może tu być badanie, w którym starano się odpowiedzieć na pytanie, czy grupa studentów, która weźmie udział w kursie przygotowawczym, wypadnie lepiej w teście zdolności akademickich (GRA) niż druga grupa, niebiorąca udziału w takim kursie. Jeśli tuż przed rozpoczęciem badania, przez przypadek, jedna z grup będzie o wiele słabsza pod względem zdolności akademickich, to wynik badania będzie obciążony błędem. Aby się przed tym ustrzec, badacz w pierwszej fazie badania ranguje wszystkie osoby badane pod względem średniej ocen uzyskanych w trakcie studiów. I tak, dwie osoby o najwyższej średniej ocen zostają następnie losowo przydzielone do grup: jedna do grupy eksperymentalnej (kurs przygotowawczy), a druga do grupy kontrolnej (brak kursu przygotowawczego). Podobnie postępujemy z kolejnymi parami złożony mi z osób badanych o zbliżonych rangach. Postępowanie to zapewni znaczny stopień podobieństwa między grupami w zakresie umiejętności akademickich (mierzonych na podstawie średnich ocen) w punkcie wyjścia. Następnie członkowie jednej z tak utworzonych grup (grupa eksperymentalna) biorą udział w kursie przygotowawczym, natomiast
49
5O
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
członkowie pozostałej
grupy (grupa kontrolna) nie biorą udziału w żadnym kursie. Wreszcie, członkowie obu grup zostają poddani testowi zdolności akademickich (GRA). Analiza danych opiera się na porównaniach wyników uzyskanych w teście zdolności akademickich przez osoby należące do kolejnych par, dobranych ze wzglę du na średnie ocen. W takiej analizie używa się testu t dla prób zależnych, traktując przy tym wyniki testu zdolności akademickich (GRA), uzyskane przez członków danej pary, w taki sposób, jak gdyby pochodziły one od jednej i tej samej osoby.
pamięci
dwukrotnie. Dane dla obu pomiarów zakodowane są pod odrębnymi nazwami. Pokazane jest to na rycinie 5.2 - wyniki pomiaru pamięci przeprowadzonego przed zastosowaniem leku znajdują się w kolumnie oznaczonej przed, a wyniki pomiaru pamięci przeprowadzonego po zakończeniu kuracji - w kolumnie oznaczonej po. Kliknij pierwszą nazwę, a następnie drugą. Następnie za pomocą strzałki przenieś to zestawienie do okna Pary zmiennych. Uruchom procedurę, naciskając OK.
Interpretacja raportu z analizy Hipotezy badawcze Hipoteza zerowa może przybrać dwie formy. Pierwsza mówi o tym, że średnie w grupach eksperymentalnej i kontrolnej nie różnią się między sobą (test obustronny). Druga wskazuje, że średnie różnią się w taki sposób, że jedna jest większa albo mniejsza od drugiej (test jednostronny). Jeżeli zaistnieją empiryczne podstawy do odrzucenia hipotezy zerowej, znaczy to, że mamy odpowiednie podparcie dla hipotezy alternatywnej. W teście t dla prób zależnych pomiar zmiennej zależnej musi być dokonany na skali interwałowej albo ilorazowej. Do przedstawiania omawianej procedury użyjemy zbioru dotyczącego oddziaływania farmakologicznego na osoby z chorobą Alzheimera (tabela 1 w Dodatku). Zmienną niezależną jest to, czy pacjent jest jeszcze przed kuracją, czy już po niej. Zmienną zależną natomiast jest liczba zapamiętanych słów.
Stosowanie procedury "Porównanie średnich: test t dla dwóch prób zależnych" od menu Analiza, następnie kliknij na Porównywanie średnich i przejdź do Test t dla prób zależnych (Analiza> Porównywanie średnich> Test t dla prób zależnych). Sposób uruchamiania testu ilustruje rycina 5.l. Po wybraniu wskazanej opcji SPSS pokaże Ci okno zawierające listę zmiennych tworzących Twoją bazę danych. Zmienna grupują ca nie jest tutaj potrzebna, ponieważ każdy pacjent przeszedł test Zacznij
pracę
Dane z analizy zostaną przedstawione w raporcie (rycina 5.3). Dwie tabele zawierają statystyki opisowe dla obu pomiarów. Z pierwszej odczytasz średnią, odchylenie standardowe oraz błąd standardowy średniej, a druga zatytułowana Korelacja dla prób zależnych, zawiera współczynnik korelacji pomiędzy obu pomiarami, a także istotność korelacji. Warto zwrócić uwagę na istotność korelacji. Jeśli byłaby ona nieistotna (p> 0,05), to można by mieć wątpliwości co do celowości zastosowania użytego tu schematu badawczego. Korelacja przedstawiona w naszym przykładzie jest relatywnie wysoka (r = 0,82) oraz istotna (p < 0,001; w poprzednim rozdziale wspomniano, że SPSS podaje poziom istotności jedynie z uwzględnieniem trzech miejsc po przecinku - wszystko poniżej 0,001 podawane jest jako ,,0,000"). Tabela Test dla prób zależnych zawiera porównania dwóch śred nich. Jej najważniejsze części to komórka dla testu t, liczba stopni swobody (df)18 oraz poziom istotności statystyki t (Istotność dwustronna). Statystyki te pozwalają na testowanie hipotezy zerowej. W naszym przykładzie t(39) = -2,29 - wartość ta jest ujemna, ponieważ średnia z pierwszego pomiaru pamięci jest mniejsza od śred niej z drugiego pomiaru. Liczba stopni swobody równa się liczbie par poszczególnych wyników w testach pamięci minus jeden (df = 40 - 1 = 39). Dwustronny poziom istotności dostarcza informacji początkowe
18 Skrót pochodzi od wyrażenia degrees af freedom, co w stopni swobody (przyp. tłum.).
tłumaczeniu
oznacza
liczbę
51
52
TESTOWANIE HIPOTEZ BADAWCZYCH DLA DWÓCH PRÓB ZALEŻNYCH
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS elzheimer sav
Plik
Edycia
Plik EdJcia W"Jdok Wstaw
S PS S Edptor danych
Widok
Dane
Przekształcenia t.. .~~aliza'"~ ..~ykre~~."_~~~~,~~a
W1 ~ ~~ ~ ~ ~A ą I·" r~ lilii Ik t? I"" [~~..~_:.~.~~.~ ~
-
r~~I;(~c_[
L..-.2J ~
~
:~41
.. 61 ~
5 6
~ ~
7 8
~~
.·~~~·I
1 2 3 4
~
~9 : 10 10 O] 11 ! ~~12J 12 CEl 13
L:...El
§
~
14 15
17
16 17
I ~~... ~:I
~~
r·· .201
20
i
I ...
...
retest
21 18 29 42 21 37 23 15 29 35 18 37 23 18 23 42 21 28 15 18
li! , ' _ emu In:; Ei,jjii'+rtttaM l '-1 Raporty warstwowe Opis statystyczny
::::"~-ł
23 11 29 34 14 38 24 21 24 41 21 33 19 20 31 42 22 40 26 12
~
I i I,
I I
I
Ogól"y model liniowy
..I
Korelecle
..
Regresja
.,:
Klasyfikacja Redukcja danych
Skalowanie Tesł}' nieparamełJyczne Analizy przeżycia Wielokrotne odpowiedzi
Pomoc
,
Modele mieszane
Analizy logliniowe
Okno
l-M"lm"iih'4+
, ,
•
I~~ st
'ff
!lty stylo;l tl1tIpro b Zale±nyCh
Pomoc
.; St~dl,)próbZl~ kon\NM r-L-·-.-.-. -""8"'" Teiil --
GT2Hochberga Tukey
D b Tukey'a D Duncan O Gabriel
@ D~Of\I"l)'
O / Koni"*,,, O >KorllQ/r,a
RYCINA 6.4. Okno Opcje dla Jednoczynnikowej
ANOVA.
Slalysl.ykl-----------. ~ Opisowe
D Efekly stełe i losowe ~ Tes! lednorodnoścl wenenqi
Brak zełozenre o równoścI w a n a n C f I - - - - - - - - - - - - - - ,
D
D T2 Tamhane'a D 13 Dunnetta
OWeich
Poziorn
istotnoścr
1,05.-J
O
Games·Howell ["'Da!;
D
II
C Dunnetta Anului
1/
Pomoc
Brown-Forsythe
D Wykres średnich Braki danych~------------___.
e Wył-ączanie obserwacji analiza po analizie RYCINA 6.3.
Wybór testów post hoc.
O
Wył-ączanie
wszystkich obserwacji z brakami
59
6O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
PORÓWNANIE PRÓB NIEZALEŻNYCH...
Raport zawiera także wyniki testu jednorodności wariancji dla grup wiekowych. Jest to taka sama procedura jak ta, którą SPSS przeprowadzał podczas wykonywania testu t dla prób niezależnych. W naszym przykładzie nie ma istotnych różnic pomiędzy trzema wariancjami w grupach - F(2;57) = 0,45; P < 0,05. Istotność jest większa niż założone 0,05, co znaczy, że pomiędzy tymi wariancjami nie ma różnic istotnych statystycznie. Podsumowanie ANOVA zostało przedstawione w dolnej części ryciny 6.5. Tabela ]ednoczynnikowa ANOVA zawiera sumy kwadratów między grupami i wewnątrz grup oraz sumę kwadratów ogółem. Danym tym towarzyszy informacja o stopniach swobody (df). W tabeli tej pokazane są również średnie kwadraty (dla efektów między- i wewnątrzgrupowych), które służą do obliczenia statystyki F19. Szczególną uwagę należy zwrócić na wartości F oraz Istotność (prawdopodobieństwo popełnienia błędu pierwszego rodzaju). Rycina 6.5 przedstawia rezultaty porównania trzech grup wiekowych na podstawie zmiennej zależnej, którą jest poziom cholesterolu - F(2;57) = 37,66; P < 0,001. Wartość w kolumnie Istotność wskazuje na prawdopodobieństwo popełnienia błędu pierwszego rodzaju - wynosi ona ,,0,000" (p < 0,001). Załóżmy, że testujesz hipotezę, przyjmując poziom alfa równy 0,01. Czy postąpisz prawidłowo, odrzucając hipotezę zerową, gdzie uzyskane p < 0,001? Odpowiedź jest twierdząca - każda wartość poziomu prawdopodobieństwa mniejsza niż 0,001 jest mniejsza od 0,01.
Interpretacja wyników
porównań testami
post hoc
Przyjrzyj się wynikom (średnim) w tabeli przedstawionej na rycinie 6.5, a z pewnością zauważysz różnicę między grupami. Wyniki ANOVA nie pokazują, które z grup różnią się istotnie od pozostałych. Aby się tego dowiedzieć, możemy się posłużyć wynikami testów post hoc, które obliczył SPSS. 19 F to stosunek średniego kwadratu grup (przyp. tłum.).
między
grupami do
średniego
kwadratu
wewnątrz
61 _
PIk
EdJ'Cllł
WIdok Wtlaw
ForIRat Analiza 'W'.vklMJ'
~["I8J~~ i!!I EiI immlbUil ~ ~
(!EJ a:=J
IJJ'l'ffi I
.... _
\!J.R_
-
m
@JednOCZ\'Mlkowa8MlJuwarill [EJTytul
mI
Narzl;dzta Ok""
Po_
~
~
Jednoczynnikowa analizawariancji (ONEWAY)
s--
:
~Uwagl
-ICi
Test jednorodnosa Wl!lI'lanql
I
St.-nyscykloplsowa
!
JednaC%YIV1ikowll ».NOVA
i T""
Porcwnerue
l
poziom cholesterolu
--E:T~posthoc
.
w~okrotne
E: Grupyjedr'la"odne
~Tytul
95%prtedzlalufnoscldla
..
(, poziomchQl~erolu
N 20
ponlleJ35
35 a 50
srecma
Ogółem
Dolna
Błąd
etancaroowe
slandardol'l'j 2Q,'139 4,526 26,424 5,909 27,536 6,157 37,352 4,822
178,50 231,35
00 00 60
po~eJ50
242,60 217,48
granica 169,03 218,99 229,71 207,83
ocma granica 187,87 243,72 255,49 227,13
Minimum 130
MakSimum
167
173 130
57
,637
JedlloczYłlIukowt'l
•
ANOVA
;
0,05), to moglibyśmy wówczas oprzeć .się na danych umle.szczonych w tabeli Testy efektów wewnqtrzobtekto~~h (por., rycina 7.7). Wartość F dla zmiennej CzyNNIK1 odnosi ~lę .do hipotezy zerowej mówiącej o braku różnic pomiędzy średnimi. W naszym przykładzie F(2;34) = 14,21 a p < 0,001, efekt jest więc istotny.
Al.
Porównania post hoc
RYCINA 7.5. Testowanie
sferyczności.
Jeśli nasze wyniki pozwalają n~ stwierdze,~ie~ że ist~ieją ~odst~~ do odrzucenia hipotezy zerowej o braku rozmc pomiędzy średnimi,
• -
'"'V U'l;;UU
Plok EdJclll "'lilak
UV' VYYI - '" IAn l! YVt'nUVVAULt::Nlt:: UU
"'"...
F....a1 AnaIaa
-
"'..
NarzędZIa
::;J-'SS DLA WINDOWS
POROWNYWANłE PROS ZALEZNYCH...
-
Dkno p"",,,
.
"
~[!!J~EJflil"'łE?ll§I~JJI [ill] 8:J ~ [ff'ID:] I -
~,Raport
l:.J
- @ OgólnymodellnlOWY (GL
I
Efekt CZYNNIK1
QJCZymki weWNtr:t
.QJ
-I
(.lJTestyelekWwwewn Testykontraslćwwe
SladPllI,1I
LOlmbdaW!Jksa ŚładHotelJmga
(,i Te$fsteryczooSclMll
-
~,
Testywieluznuellll)'Cł"P
Tylu/
" Uwagi
ot
NaJ\'VlększY
l:uef\lfjaslekRoy'il
Teslyefeldowmlędzy
Wartost ,556 ,434 1,302 1,302
F dfhlpoleZl" 1O.413~ 2,ODO 1O,413~ 2,000 10,413 1 2,000 10,413 '
dfbłędU
Istotność
15,000 16,000
,001 ,001 ,001
16,000
,001
16,000
2,000
D r
,
aS1alyslykadokladna
b
:
Plan lntercect Planwewnąlrzobleldovw- CZYNNIK1
.
l!!f •
.
kI:spss Procesa-gotoWY-
Khkrij dllUaotflle, aby edytować oblekł Tabelll~lawna
I
--
'I
ł1
~
i I" 1,"
iL.J
'"
432
,kt
A
RYCINA 7.6.
Testy F dla zmiennej zależnej w powtarzanym pomiarze.
-
"
.
Testyefektów wewnątrzoblekłowy.::h MiaraMIARA 1 źr6dłozmrennoscI CZYNNIKl
kwadratów
Ol
36433,333
ereenbcuee-cersser
36433,333 36433,333 36433,333 43566,667
1,230 1,277 1,000
34
1281,373
43566,667 43566,667 43566,667
20,915 21,716 17,000
2083,075 2006,158 2562,745
H~h-Feldt
Dolna granicaepsilon 8/ąd(ClYNNIKl )
Średni kWadral
TypIII sumy sremzncecze'cżcna
srervcznosc założona ereenhcuse-eelsser HtJYI1h·Feldl Dolna granicaecencn
2 18216,667 29614,084 18520,604 36433,333
F
retcmośc
14,217
,000
14,217
,001 ,001 ,002
14,217 14,217
D
mispSSProc~golowy
RYCINA 7.7. Testy efektów wewnątrzobiektowych.
to chcemy zwykle dowiedzieć się, które ze średnich różnią się mię dzy sobą istotnie. W wypadku gdy decyzja o dokonaniu takich porównań podjęta jest już po rozpoczęciu analizy danych, porównania te noszą nazwę post hoc. Niestety procedura SPSS Powtarzane pomiary nie dostarcza wyników porównań post hoc.
Najprostszym sposobem uzyskania zarówno z góry zaplanowanych porównań między poszczególnymi średnimi, jak i porównań post hoc, jest posłużenie się testem t dla prób zależnych. Odwołując się do naszego przykładu, możemy powiedzieć, że skoro mamy trzy warunki eksperymentalne, to możemy porównać "A" z "B", "B" z "C" i "A" z "C". Jednakże w takiej sytuacji dochodzi do sumowania błędów. Otóż w trakcie dokonywania pojedynczego porównania dwóch średnich za pomocą testu t zakładamy, że maksymalny dopuszczalny błąd wynosi p = 0,05. Każdy kolejny test to 0,05 wię cej. W wypadku trzech testów mamy zatem do czynienia z błędem wynoszącym 0,15. Rozwiązanie tego problemu, które powinno zapobiec wzrostowi dopuszczalnego błędu, może polegać na przyjęciu niższego poziomu alfa dla każdej analizy przeprowadzanej testem t dla prób zależ nych. Możemy podzielić 0,05 przez 3 (3 odpowiada liczbie warunków eksperymentalnych). Uzyskamy wtedy wartość 0,0167, co będzie naszym poziomem alfa, dla porównań za pomocą testu t. Ponieważ powinniśmy w tym wypadku testować hipotezę jednokierunkową, należy podzielić przez 2 wartości istotności, które SPSS wskaże nam dla każdego porównania, a wynik tego wyliczenia porównać z wartością alfa = 0,0167. Rycina 7.8 pokazuje rezultaty porównania trzech par pomiarów dla poszczególnych warunków eksperymentalnych. Oto interpretacja tabeli z tymi wynikami: 1. Porównanie warunków oval i deform. Otrzymana wartość p =
0,0245 (0,049:2) jest większa niż 0,0167. Znaczy to, że uzyskana wartość t wynosząca 2,122 nie była wystarczająco wysoka, aby można było odrzucić hipotezę zerową. Nie możemy zatem stwierdzić, że niemowlęta reagują inaczej w wypadku prezentacji pustego owalu, niż w wypadku prezentacji owalu zawierającego losowo rozmieszczone elementy twarzy. 2. Porównanie oval i face. Otrzymana wartość p < 0,0005 «0,001:2) jest mniejsza niż 0,0167. Znaczy to, że uzyskana wartość t wynosząca 4,358 była wystarczająco wysoka, by odrzucić hipotezę zerową. Możemy zatem stwierdzić, że niemowlęta skupiają uwagę
I ;os
74
PORÓWNYWANIE PRÓB ZALEŻNYCH...
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
~ Phk Ed)'citI
'W.doŁ
-
--"---
."
Format Anabza W,luesJ' N• .,.",..
Wstaw
, ~~l~SlJ ~ ~
a iilliłlcU? I~ [§I wI
-_.'Okoo
-
-
-o x
P~
~lli~;'ffIq![~11
8
{§I Raport
l§} TestT (T.TEST)
e !.i
U"I'l' agl
statystyki dl&prób za Qj'Korelacjedlaprobz
aoauce wpróbachzaleznych 95%przedzlal
.~
umoscr orerczmcy eręomen
,.
Błąd
Brednia Para
1 Para 2 Fara
....,---J
·,r·---·-·-----, l
! !,
Test dlapilili zaleznych
drylu!
;
~bJaneelernerIIJl(wlymOukJjile/zwlmęłe)
blalyowal-'twarz
zoerormowena biały owal· twarz naturalna tearzzdefurmcwana -fwarznaturalna
""···H··"._·....__
,
..
Odchylenie standardowe
standardowy
sreomer
Dolna granica
ramce
df
ł
tstomosc (dwustronna)
-11,67
23,326
5,498
-,07
-2,122
17
-SO,OO
58,410
13,767
-89,05
-30,95
·4,358
17
,000
-48,33
61,093
14,400
-78,71
-17,95
-3,357
17
,004
_. ..
------lłlSPSSPioĆeros !lOto~
-23,27
Górna
--··--h,
---,--,-~,-,-,--
--
r
~~
,049
,
.$l,
~
.. [dG
- -- - [H-lllS-W Sif~l- .4
RYCINA 7.8. Porównania metodą post hoc dokonane za pomocą testu t dla prób zależnych.
istotnie dłużej na figurze przedstawiającej twarz niż na pustym owalu. 3. Porównanie deform i face. Otrzymana wartość p = 0,002 (0,004:2) jest mniejsza niż 0,0167. Uzyskana wartość t = 3,57 była więc wystarczająco wysoka by umożliwić odrzucenie hipotezy zerowej. Możemy wiec stwierdzić, że niemowlęta skupiają uwagę istotnie dłużej na figurze przedstawiającej twarz niż na figurze zawierającej elementy twarzy umieszczonej na owalu w sposób losowy.
Wnioski
Porównanie czasów skupiania uwagi na poszczególnych obiektach wskazuje, że obecność pewnych elementów twarzy nie spotyka się z taką samą reakcją niemowląt, jak obraz będący odzwierciedleniem całej twarzy. Niemowlęta naj dłużej skupiają swoją uwagę na obrazach odzwierciedlających naturalny układ elementów twarzy ludzkiej.
ZADANIA Niniejszy rozdział miał Cię nauczyć analizy wyników pochodzą cych z więcej niż dwóch pomiarów zmiennej zależnej. Skorzystaj z dodatkowych danych, które może Ci przekazać prowadzą cy ćwiczenia, i w celu ugruntowania zdobytych umiejętności poćwicz analizę wariancji z powtarzanym pomiarem, wykonując następujące zadania: 1. Sformułuj i zapisz hipotezę zerową w celu dokonania analizy danych. Jaka to hipoteza? Jedno- czy dwustronna? 2. Przeprowadż analizę, korzystając z procedury Powtarzane pomiary. Jeśli okaże się, że istnieją różnice między grupami pomiarów, to dokonaj pogłębionej analizy tych różnic. Wykorzystaj opisaną w tym rozdziale metodę porównań post hoc. Zapisz plik raportu. 3. W dwóch, trzech zdaniach zapisz swoje wnioski z przeprowadzonej analizy. Wskaż, czy różnice pomiędzy grupami okazały się istotne, czy nie. Jeśli okazało się, że różnice pomię dzy grupami są istotne, to wskaż także, która grupa różni się istotnie od pozostałych.
75
BADANIE PROSlYCH RELACJI MIĘDZY DWIEMA ZMIENNYMI
od -1 do 1. jego maksymalne wartości wskazują na dos- negatywną (-1) i pozytywną (1) - korelację-s. Natomiast r = wskazuje na całkowity brak związku między zmiennymi. Wartość bezwzględna współczynnika korelacji może wynosić od do 1 - im wyższa wartość, począwszy od 0, tym większa siła związku pomiędzy zmiennymi. waha
Rozdział
8
Badanie prostych relacji między dwiema zmiennymi
CELE ZAJĘĆ
1. Nabycie umiejętności formułowania pytań badawczych dotyczących korelacji pomiędzy dwiema zmiennymi. 2. Opanowanie umiejętności wizualizowania relacji pomiędzy zmiennymi za pomocą wykresu. 3. Nabycie umiejętności interpretacji współczynnika korelacji Pearsona.
Korelacja jest metodą statystyczną, która służy do badania relacji pomiędzy dwiema zmiennymi. jedną zmienną określamy jako X,
drugą jako Y. Mogą one występować w sposób naturalny lub też
być efektem oddziaływań eksperymentalnych.
Wyobraź sobie, że jesteś socjologiem i że interesuje Cię zależność między poziomem wykształcenia a dochodami. Możesz postawić następujące pytanie badawcze: "Czy ludzie lepiej wykształceni zara-
biają więcej niż osoby gorzej wykształcone?" Po zebraniu danych, na przykład wśród osób pracujących w turystyce, relację pomiędzy badanymi zmiennymi zbadasz w SPSS, stosując współczynnik korelacji Pearsona. Przeprowadzając tę analizę, dowiesz się, jakie jest natężenie tego związku oraz jego kierunek - pozytywny bądź nega-
tywny. Współczynnik korelacji nazywamy czasem miarą związ ku między dwiema zmiennymi. Wartość współczynnika korelacji r
się
konałą
°
°
Stosowanie procedury "Korelacje" Analiza przykładu będzie oparta na wynikach przedstawionych w Dodatku, w tabeli Korelacje. Po utworzeniu bazy danych (nadaj jej nazwę, na przykład "Korelacje", i zapisz na dysku) wykonaj następujące kroki: kliknij na menu Analiza, potem na Korelacje (por. rycina 8.1). Z uzyskanego podmenu wybierz Parami (SPSS pozwala na wyliczenie wielu typów korelacji - skorzystaj z podręczników lub z wiedzy prowadzącego ćwiczenia, by dowiedzieć się czegoś więcej na ich temat).
Wybór zmiennych do analizy Procedura Korelacje: parami służy do oszacowania korelacji pomię dzy dwiema zmiennymi. Wyniki analizy przedstawione są w postaci tabeli (matrycy) pokazującej wartość współczynnika korelacji dla każdej możliwej pary zmiennych. jeśli użyjesz dwóch zmiennych, to SPSS utworzy tabelę typu 2 x 2. Typ tabeli jest zatem uzależniony od liczby użytych zmiennych. Definiowanie analizy możesz rozpocząć od okna Korelacje parami (por. rycina 8.2). Również w tym wypadku spotkasz się z opisanym w poprzednich rozdziałach sposobem wyboru zmiennych. Wybierz zmienne do analizy: lata nauki (wykszt) i aktualne zarobki (zarob). Korelacja r = 1 oznacza, że im wyższa wartość jednej zm~ennej, ty~ wy~sza warto~ć drugiej, na przykład im większy promień koła, tym dłuzszy J;:-;-:Iat~an-a""uk-='lw-Y""ks-'tl-~ ~ aktualne zarobki [zarob]
OJ Współ'czynnlkl korelacll---------~ ~ Peerson
D
teu-b Kendalla
[ Test IStotnOŚCI
C!J
Dwustlonna
o Spearman
o Jednostronna
~ OznaczkorelacjeIstotne
RYCINA 8.2. Wybór zmiennych do analizy za współczynnika korelacji.
N
.ro
1
,ODO 30
30
_ KorglaCJaJesllstotna na ponomrę O01 (dIM.lstronme)
I
RYCINA 8.3. Raport z wynikami analizy dokonanej za pomocą współczynnika ko-
RYCINA 8.1. Uruchamianie procedury Korelacje: parami. •
aKtualnezarobkJ
pomocą
kle p= 0,01 lub P = 0,05). Rycina 8.3 przedstawia wyniki analizy opartej na naszych danych przykładowych. SPSS wyliczył, że współczynnik korelacji
80
DO BIEGU GOTOWI- START! WPROWADZENIE DO SPSS DLA WINDOWS
pomiędzy zmiennymi
lata nauki i aktualne zarobki wynosi r = 0,70, gdzie N = 30. Wartość współczynnika korelacji jest dodatnia, co oznacza, że zmienne te wzrastają w tym samym kierunku - osoby z wyższym wykształceniem uzyskują wyższe zarobki, a osoby słabo wykształcone zarabiają mniej. Zauważ, iż gwiazdki-t przy r oznaczają, że współczynnik jest istotny przy p = 0,01.
Przedstawianie relacji
między
zmiennymi na wykresie
Do graficznego przedstawienia związku między zmiennymi ilościo wymi badacze używają wykresu rozrzutu. Takim wykresem możesz się posłużyć, aby przedstawić, jak zmienna X współzmienia się ze zmienną Y. Dzięki takiej wizualizacji łatwiej wykryć anomalie w danych. Anomalie takie widoczne są w postaci punktów szczególnie oddalonych od innych punktów wykresu. Anomalie mogą mieć duży wpływ na wartość współczynnika korelacji. Warto zwrócić szczególną uwagę na takie sytuacje i w razie konieczności eliminować je z analizy. Po wyliczeniu współczynnika korelacji Pearsona Twoim zadaniem będzie wizualizacja korelacji pomiędzy zmiennymi. W tym celu użyj menu Wykres, a następnie Rozrzutu (zob. rycina 8.4). Poszczególne punkty, przedstawiające wynik danej osoby, będą umieszczone pomiędzy dwiema osiami współrzędnych. Na osi X znajdzie się zmienna wykszt, a na osi Y - zarob. Po uruchomieniu opcji Wykres: rozrzutu pojawi się okno przedstawione na rycinie 8.5. SPSS pozwala na wygenerowanie różnych typów wykresów - warto poeksperymentować z opcjami przedstawionymi w oknie Wykresy rozrzutu. Pozwalają one na różne sposoby graficznego przedstawienia związku między zmiennymi. Wykresy rozrzutu nadają się najlepiej do przedstawienia relacji między zmiennymi zmierzonymi na skali ilościowej. Używanie tej metody do obrazowania
23
W psychologii zazwyczaj wartość r istotną na poziomie alfa = 0,05 oznacza się jed(*), a wartość r istotną na poziomie alfa = 0,01 - dwiema (**) (przyp.
ną gwiazdką tłum.).
BADANIE PROSTYCH RELACJI __irelocre
PliIe.
~P5S
Edytor danych
Edycja Widok
Dane
MIĘDZY DWIEMA ZMIENNYMI
_
Przekształcenia
Analiza "vi kre$}'i Narzędzia
Okno Pomoc
Galeria Interaktywne Słupkowy...
~
I
Id 1 2 3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
21 22
12420 8880. 8640 27500. 31300 10980 ·10080·
dosw 1,17 27,00
7860 8940 12300 12660 8400 9360 ·12780 18100 10980 36800 12300 9780. 8280. 14820 13560:
Liniowy... Warstwowy... Kołowy . Max-Min .
,001 - - - - - -1 3,17 Perero ... 3,92 Kalty kontrolne... 14,42 '28,67
Skrzynkowy .
Słupki błędu .
'18;501~jiiiiiiiil 8'." 14,001 Hlstogram.. _ 4,671 p·P . 5'331' K-K . 6,83 Sekwencyiny . ,00, Krzywa ROC . 34,00 Szeregi CZ8a:owe
~
3,00 4,00' 10,58 25,58 8,92 10,08 ,42 8,00
RYCINA 8.4. Wybór opcji Wykres: rozrzutu.
RYCINA 8.5. Wybór typu wykresu rozrzutu.
: Wykresy rozrzutu
[II ..
~
I:~~:I Nakładany
1#13'W
Macierzowy
-=.. Pomoc
relacji między zmiennymi mierzonymi na skalach nominalnej i porządkowej jest mało przydatne. W naszym przykładzie będzie my korzystali z typu wykresu Prosty, ponieważ chcemy przedstawić relacje między dwiema zmiennymi. Zaznacz więc ikonę Prosty i naciśnij klawisz Definiuj.
81
82
BADANIE PRU::; I Y\.;H
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Pfik Edycja \J/'Idok 'Wataw forIUl
OśY:
-@> numeridentyfikacyjny -@> skala doświadczenia z
Liik-,lu-.~-!~_-e_-z~-~o-bk-i-[z-aro-b-]-
""""'. "'......
!~I~lelm.Il'!l1!lEl 11lIlII1'6U1 \ ~ ~ [ill] lB3 @Id] Em!U11
Narzędzia
un
Ok. .
tlt: LAI.-.J l IVII"UL.1
P_c
.-1!iIR_ -
t§l1Nykres (ORAPH)
.
IT~~ • UWtlgl
Wykres (GRAPH)
40000
,
Ustaw znaczniki wedi'ug:
[}] [ .
L"VI~"'~ ~ . . , , - , . . . • ••••
o
-.J
"
30000
"
użyj do opisu obserwaqi ,
20000
~
S z a b l o n - - - - - - - - - - - - - - - - - - -......
D
@
c
]'l
Zastosuj szablon wykresuz:
~
r Pik. l
ł
•
~
"
10000
c
!
,
ID
c
O'
6
8
10
12
"
16
18
20
lata naukl
RVCINA8.6. Wybór zmiennych w celu utworzenia wykresu.
RVCINA8.7. Raport przedstawiający wykres relacji pomiędzy zmiennymi: lata
nauki a aktualne zarobki.
Kiedy to zrobisz, SPSS otworzy okno Prosty wykres rozrzutu (zob. rycina 8.6). W tym oknie ustalisz, na których osiach zostaną przedstawione Twoje zmienne. Najpierw zaznacz zmienną lata nauki (wykszt) i przy użyciu drugiej strzałki (licząc od góry) ustal, że będzie ona tworzyła oś X. Następnie wybierz zmienną zarob i za pomocą pierwszej górnej strzałki przenieś ją do okienka dla zmiennej y. Całą operację tworzenia wykresu zakończ, naciskając OK. Uzyskasz taki wykres jak na rycinie 8.7. Uzyskane wykresy możesz wydrukować. W tym celu użyj opcji Drukuj w menu Plik. Drukowanie wykresów może zajmować trochę czasu - im bardziej nowoczesny komputer, tym szybsze drukowanie. Możesz zmienić tytuł swojego wykresu. W tym celu dwukrotnie kliknij na domyślny tytuł wykresu (Wykres (GRAPH) i wpisz własną nazwę. Przypominamy, że SPSS ma możliwość eksportu wykresów do plików graficznych.
ZADANIA Celem niniejszego rozdziału było przygotowanie Cię do badania relacji między dwiema zmiennymi ilościowymi. Wykonanie następujących zadań ugruntuje twoją wiedzę: 1. Użyj bazy danych dostarczonej przez prowadzącego ćwiczenia do postawienia pytań badawczych i hipotez. 2. Przetestuj te hipotezy, używając procedury Korelacje: parami. 3. Przedstaw relację między zmiennymi za pomocą wykresu. 4. Sformułuj wnioski z przeprowadzonej analizy.
--
OPISYWANIE ZWIĄZKÓW LINIOWYCH MIĘDZY DWIEMA ZMIENNYMI
Rozdział 9
Opisywanie związków liniowych między dwiema zmiennymi ! /
CELE ZAJĘĆ 1. 2.
Zrozu~ienie związku między korelacją a regresją.
NabY~le .umiejętności formułowania
hipotez badawczych przewidujących wpływ jednej lub wielu zmiennych niezależ nych (predyktorów) na zmienną zależną (kryterium). 3. N~b~cie umiejętności wykonywania analizy regresji przy uzvoiu SPSS. 4.
Nab~c!e umiejętności formułowania wniosków na podstawie wynrkow zastosowania procedury Regresja: tiniows.
w: po?rzednim. rozdzial~ uczyliśmy się, w jaki sposób mierzyć rela-
CJę m~ędzy dWIe~a zmIennymi. Do tego celu używaliśmy współ cz~nTI1ka korelacji Pearsona. Budowaliśmy także wykres rozrzutu,
pozwalał ~a rozszerzony opis relacji między zmiennymi X i Y. ~ .ty:n. rozdzI~le skupimy się na opisie relacji pomiędzy zmien-
ktory
pomocą analizy regresji. Jest to metoda starystyczn~ słuząca d~ przed~ta~ieni~ związku między zmienną zależną nymi I1osCI?wymI za
(~~~terlUm? a z~~ennymI mezaleznymi (predyktorami) za pomocą h~ll regresp; LI.n~a regresji j.est to prosta dopasowywana do punktow ?rzeds;tawIającychwyniki uczestników badań (por. rozdział 8) :v ta~ sp~s?b, aby odległość pomiędzy tymi punktami a linią była
Jak najmniejsza,
Zwykle X o~reśl~ się ~ianem zmiennej niezależnej (predyktoY - zmI~nneJ zale.znej. Tak jak w przypadku korelacji, dla kazdego uczestmka badania powinniśmydysponować pomiarem na
re~), a
zmiennych X i Y. Mówimy, że X pozwala na przewidywanie Y. Matematyczną reprezentacją takiego sformułowania jest wzór:
Y' = a + bX gdzie: Y' to przewidywany wynik pomiaru zmiennej zależnej (kryterium); a to wartość tak zwanego wyrazu wolnego, a inaczej punktu przecięcia osi Y z linią regresji; b to współczynnik regresji, czyli miara nachylenia linii regresji względem osi X; X to wartość pomiaru zmiennej niezależnej (predyktora). W rozdziale tym przedstawimy dwa warianty analizy regresji: regresja z jednym predyktorem i regresja wielokrotna. Pierwszy z nich pozwala na opisanie związku między jedną zmienną niezależną (predyktorem) a zmienną zależna (kryterium), drugi zaś - na opis związku kilku zmiennych niezależnych (predyktorów) z jedną zmienną zależną (kryterium). Zaletą regresji wielokrotnej jest jej całościowy charakter, możliwość jednoczesnego uwzględnieniawię kszej ilości predyktorów. Matematyczny zapis regresji wielokrotnej z dwoma predyktorami przedstawia się następująco:
Y' = a + b1X1 + bzXz gdzie: Y' oznacza przewidywany wynik pomiaru zmiennej zależnej (kryterium); a - wartość tak zwanego wyrazu wolnego, inaczej punktu przecię cia osi Y z linią regresji; b1 - współczynnik regresji dla pierwszej zmiennej niezależnej (pierwszego predyktora); Xl-wartość pomiaru pierwszej zmiennej niezależnej (pierwszego predyktora); bz - współczynnik regresji dla drugiej zmiennej niezależnej (drugiego predyktora); X z - wartość pomiaru drugiej zmiennej niezależnej (drugiego predyktora).
85
......
UU 1:l1l:l.JU
OPISYWANIE ZWIĄZKÓW LINIOWYCH MIĘDZY DWIEMA ZMIENNYMI
\,jU I UWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
Pytanie badawcze Analiza regresji pozwala odpowiedzieć na podobne pytania jak w wypadku analiz z zastosowaniem współczynnika korelacji Pearsona. ~ poprzednim rozdziale rozważaliśmy pytanie: "Czy ludzie ~ar~zi~J ",!ks~tałceni zarabiają więcej?" Uzyskane wyniki wykazały istmeme silnej pozytywnej korelacji między latami nauki i zaróbka~i (r = O?OS): ,Biorąc ~o pod uwagę, możemy sformułować pytame o możliwość przewidzenia zarobków danego pracownika na podstawie informacji o jego poziomie wykształcenia. Analiza regresji jest metodą statystyczną, której możemy użyć w celu udzielenia odpowiedzi na takie właśnie pytanie. Natomiast ~naliza regresji wielokrotnej pozwoliłaby w tej sytuacji na zbadanie iednoczesnegc oddziaływania dodatkowych czynników. Taką analizą mozemy Się posłużyć, formułując następujące pytanie badawc~e: "Czy d~świadczenie zawodowe wraz z poziomem wykształce m.a pozwalają na przewidywanie poziomu zarobków?" Tak posta~lOne pytani~ implikuje, że zarówno doświadczenie zawodowe, jak i wykształceme mogą jednocześnie oddziaływać na pensje uczestników przeprowadzanego badania. Zmienną zależną (kryterium) był~by w .tym ~padku wielkość aktualnych zarobków, a zmiennymi niezależnymi (predyktorami) - doświadczenie zawodowe i poziom
wykształcenia.
W wypadku współczynnika korelacji Pearsona siła i kierunek :elacji między zmiennymi X i Y wyrażona była za pomocą wielkości i znaku. współczy~nika r. W wypadku analizy regresji relację mię dzy zmienną zalezną (kryterium) a zmiennymi niezależnymi (predykto~ami~ określamy w podobny sposób, posługując się współ c~ynm~am~ b. Im wyższa wartość wyliczonego dla danej zmiennej niezależnej (predyktora) współczynnika b - niezależnie od jego znaku ~ w tym większym stopniu poziom zmiennej niezależnej (k~yt~num) uzależniony jest od poziomu tej właśnie zmiennej zaleźnej ,afwaqe
RYCINA 9.4. . ." . modelu regresji: współczynmk determinacJI. podsumowame _ ox
RYCINA 9.3. Wybór statystyk.
z tym, przeprowadzając analizę regresji, powinniśmy się spodziewać pozytywnej wartości współczynnika regresji dla zmiennej lata nauki. Celem kolejnej analizy będzie dodatkowo oszacowanie wpływu informacji o doświadczeniu zawodowym na możliwość przewidywania wysokości osiąganych dochodów. Ażeby oszacować równoczesny udział przedstawionych tu zmiennych, w okienku zmiennych niezależnych należy umieścić zmienną dosw (wynik na skali doświadczenia zawodowego) oraz zmienną urykszt (lata nauki). Twoim zadaniem będzie zatem przeprowadzenie dwóch analiz: 1) z zastosowaniem zmiennej niezależnej lata nauki, 2) z zastosowaniem zmiennych niezależnych lata nauki i doświadczenie zawodowe. W
związku
Analiza regresji Interpretacja wyników tej analizy powinna się opierać na trzech rodzajach informacji, zawartych w raporcie wygenerowanym przez SPSS. Czytanie raportu zacznij od zwrócenia uwagi na współ czynnik determinacji umieszczony w tabeli Model - podsumowanie (zob. ryc. 9.4). Współczynnik ten oznaczony jest jako R2. Widzimy, że wartość R2 wynosi 0,497. Oznacza to, że około 50%
Analiza warialłCJl b Suma Model
1
kwadratów
Regre$la Reszta o~ółem
827525946 831307601 1,665E+09
Istotność
dl 1 28
8,JE-+OB 3,OE+07
27,673
,000.1
29
a Predyl Przejmij bazę danych> Nowa kwerenda. 2. Wybierz opcję Bazy danych MS Access, a następnie Dodaj źródło danych. 3. W oknie zatytułowanym Źródła danych użytkownika dwukrotnie kliknij na Bazy danych MS Access. 4. Po uruchomieniu okna ODBC - ustawienia dla programu Microsoft Access naciśnij klawisz Wybierz. 5. W oknie Wybierz bazę danych zaznacz katalog, w którym znajduje się poszukiwany plik bazy danych. W okienku po lewej stronie kliknij na odpowiednią nazwę. 6. Wróć do podstawowego okna - trzy razy naciśnij OK. 7. W oknie Kreatora przeimoioania-baz danych kliknij ponownie na Bazy danych MS Access, a potem naciśnij Dalej. 8. Jeżeli chcesz, aby SPSS użył wszystkich elementów bazy danych, to najpierw zaznacz jeden z nich, a następnie - utrzymując na niej kursor i przytrzymując lewy przycisk myszy - przeciągnij tę część z lewego okna do prawego. Możesz sprawdzić skład poszczególnych części bazy. W tym celu użyj ,,+" do pokazania struktury bazy. Po utworzeniu żądanej formy importu (przez przeciągnięcie elementów bazy do prawego okna) naciśnij Dalej. Po wykonaniu tej czynności możesz zakończyć cały proces importu bazy danych. 9. Przed naciśnięciem Zakończ możesz wykonać jeszcze inne operacje - możesz na przykład przefiltrować dane, używając w tym celu opcji Dalej w oknie Kreator przejmowania danych - krok 2 Z 6, co skieruje Cię do okna Kreator przejmowania danych - krok 4 Z 6. W tym ostatnim naciśnięcie Dalej doprowadzi Cię do kroku 5 z 6, a wówczas możesz wybrać te zmienne, które powinny się znaleźć w zbiorze SPSS. 10. Naciśnij klawisz Dalej. Ostatni krok - 6 z 6 - zawiera podsumowanie wykonywanych przez Ciebie operacji. Naciśnij Zakończ, aby ukończyć import. Rezultaty swoich operacji możesz zapisać w specjalnym pliku - SPSS Query File (*.spq) - użyj w tym celu klawisza Przeglądaj, umieszczonego po prawej stronie okienka Zapisz kwerendę pliku. Zapisując plik SPSS Query File, znacznie
1.
Użyj
109
11 O
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
przyspieszysz ponowne otwieranie wybranej bazy danych. Jeżeli baza danych, której używasz, nie zmieni miejsca na dysku, to po raz kolejny z niej skorzystasz, używając opcji Plik> Przejmij bazę danych> Uruchom kwerendę. W otwartym oknie poszukaj pliku o rozszerzeniu .spq.
Zbiory danych Na końcu książki umieściliśmy tabele z danymi. Znajdują się tam wyniki, którymi posługiwaliśmy się w rozdziałach piątym, szóstym, siódmym, ósmym i dziewiątym. Skorzystaj z nich, ćwicząc zakła danie zbiorów i wprowadzanie danych w Edytorze danych SPSS, w edytorze tekstów, w arkuszach kalkulacyjnych i w programach tworzących bazy danych typu ODBC.
DODATEK. ZBIORY DANYCH
TABELA 2. Kardiolog.
TABELA 1. Alzheimer PRZED
PO
1 2 3 4 5
21 18 29 42 21
23 11 29 34 14
6 7 8 9 10
37 23 15 29 35
38 24 21 24 41
11 12 13 14 15
18 37 23 18 23
21 33 19 20 31
16 17 18 19 20
42 21 28 15 18
42 22 40 26 12
21 22 23 24 25
29 42 21 37 23
32 37 17 41 27
26 27 28 29 30
14 29 40 17 37
24 27 44
31 32 33 34 35
23 18 24 36 35
22 25 34 45 43
36 37 38 39 40
42 21 37 20 21
40 20 42 29 25
ID
24 36
ID
GR WIEK
CHOlE
ID
GR WIEK
CHOlE
1 2 3 4 5
2 3 2 2 3
249 245 238 243 238
31 32 33 34 35
3 2 1 3 2
213 167 173 182 249
6 7 8 9 10
2 3 3 3 1
238 263 256 256 173
36 37 38 39 40
2 1 1 2 1
239 190 201 241 198
11 12 13 14 15
2 3 1 3 3
254 261 209 262 251
41 42 43 44 45
1 2 2 1 1
180 219 222 201 168
16 17 18 19 20
3 1 3 3 2
264 130 264 239 259
46 47 48 49 50
2 2 3 1 2
214 234 253 185 248
21 22 23 24 25
3 2 2 3 2
205 255 203 254 234
51 52 53 54 55
2 1 1 3 2
167 161 171 266 254
26 27 28 29 30
1 3 1 1 1
168 248 151 151 203
56 57 58 59 60
3 1 1 3 1
173 187 182 259 188
111
11 2
DO BIEGU GOTOWI - START! WPROWADZENIE DO SPSS DLA WINDOWS
TABELA 3
TABELA 4 Korelacje.
Niemowlaki ID
OVAL
DEFORM
FACE
ID
WYKSZT
ZAROB
DOSW
1 2 3 4 5
180 50 70 40 80
170 70 120 60 90
340 60 170 90 60
1 2 3 4 5
15 12 12 17 18
12420 8880 8640 27500 31300
1,17 27,00 0,00 3,17 3,92
6 7 8 9 10
80 60 50 110 60
60 80 70 120 70
180 140 120 230 120
6 7 8 9 10
12 8 8 8 12
10980 10080 7860 8940 12300
14,42 28,67 18,50 14,00 4,67
11 12 13 14 15
50 100 160 140 180
100 90 140 120 170
90 150 150 90 340
11 12 13 14 15
15 12 12 8 16
12660 8400 9360 12780 18100
5,33 6,83 0,00 34,00 3,00
16 17 18
50 70 40
70 120 60
60 170 90
16 17 18 19 20
15 19 12 12 15
10980 36800 12300 9780 8280
4,00 10,58 25,58 8,92 10,08
21 22 23 24 25
15 15 15 15 15
14820 13560 12660 12840 15660
0,42 8,00 0,83 5,58 3,83
26 27 28 29 30
16 12 17 12 12
14400 10740 32500 14280 9240
3,83 4,00 1,50 6,00 1,08