Wybór metody analizy

Wnioskowanie statystyczne składa się z następujących etapów:

- formułujemy hipotezę zerową i badawczą, określamy dobór próby,

- wybór testu statystycznego,

- sprecyzowanie reguły decyzyjnej (przy jakiej wielkości p hipoteza zerowa zostanie odrzucona),

- wykonanie analizy,

- interpretujemy uzyskany wynik z oparciu o założone kryteria decyzyjne (ustalone w trzecim etapie wnioskowania).Odrzucenie hipotezy zerowej oznacza uzyskanie wyników istotnych statystycznie (mamy podstawy do wnioskowania o istnieniu różnic, związku itp.).

Możemy wykorzystać zarówno testy parametryczne, jak i nieparametryczne (gdy złamane są pewne założenia określonych analiz). Warto zaznaczyć, że testy parametryczne maja większą moc.

Jednych z najważniejszych założeń jest wielkość próby i liczebność grup. W analizie czynnikowej minimalna liczba badanych wynosi 10 x liczba użytych zmiennych w tej analizie, a np. w przypadku analizy regresji: 56+ 8 x liczba predykatorów. Przebadanie mniejszej niż zalecana liczby badanych może prowadzić do błędów we wnioskowaniu. Jeśli chodzi o założenie normalności rozkładu warto wiedzieć, że np. testy t nie są wrażliwe na złamanie tego założenia.

Często o wyborze odpowiedniej analizy statystycznej wnioskujemy na podstawie skal pomiarowych, jakimi mierzone są określone zmienne:

- 2 skale nominalne: chi – kwadrat

- 2 zmienne ilościowe – analiza korelacji lub regresji,

- w przypadku posiadania zmiennej ilościowej i nominalnej musimy zwrócić uwagę na liczbę grup (poziomów zmiennej niezależnej) oraz na to, czy mamy do czynienia z pomiarami niezależnymi (międzygrupowymi czy wewnątrzgrupowymi). I tak:

            - 2 grupy niezależne – testy t dla prób niezależnych,

            - 2 pomiary zależne – testy t dla prób zależnych,

            - 3 i więcej grup niezależnych – jednoczynnikowa analiza wariancji

- 3 i więcej pomiarów zależnych – jednoczynnikowa analiza wariancji z powtarzanymi pomiarami,

- w sytuacji, gdzie mamy do czynienia z dwiema zmiennymi grupującymi badanych (pomiary niezależne) – dwuczynnikowa analiza wariancji

- jeśli badamy sytuację, gdzie mamy do czynienia zarówno z pomiarami zależnymi, jak i niezależnymi (badamy nastrój przed i po egzaminie ze statystyki, dodatkowo badamy występowanie różnic w nastroju między kobietami i mężczyznami) – analiza wariancji w schemacie mieszanym.

 

Podziała badanych na grupy

Decydując się na podział osób badanych wedle wyników uzyskanych na skali ilościowej możemy skorzystać z jednej z dwóch metod:

- wag absolutnych – np. podziału wedle wartości mediany (uzyskamy w miarę równoliczne grupy)

- wag ipsatywnych – podział dokonany po uwzględnieniu średniej oceny danej dziedziny, np. pytamy o lubienie danego wykładu na skali od 1 do 10 (im wyższy wynik, tym bardziej pozytywna ocen wykładu). W momencie wyliczania wyniku ipsatywnego dla badanych odejmujemy od średniej oceny wszystkich wykładów ocenę wykładu ze statystyki. Jej zastosowanie wydaje się bardziej rozsądne.

Przy interpretowaniu wyników musimy pamiętać, że każdy pomiar, prócz prawdziwego wyniku, zawiera pewien błąd. Warto więc na etapie planowania badania podjąć próbę kontrolowania pewnych czynników, które mogą zakłócać wyniki pomiaru. Pamiętajmy jednak, że wysoka kontrola czynników zakłócających (np. badanie pamięci poprzez naukę bezsensownych sylab) może zmniejszyć motywację badanych do wzięcia udziału w badaniu

Prócz zapisu istotności statystycznej warto podać również statystyki określające siłę efektu (wielkość różnicy, powiązania). Pozwala to na dokonanie bardziej precyzyjnej interpretacji wyników.

Projektując badanie zalecane jest także określenie, czy chcemy badać próby homogeniczne (składające się z osób spełniających określone warunki – studenci, kierowcy ciężarówek, wykładowcy statystyki) czy heterogeniczne (np. próby reprezentatywne). Użycie grup heterogenicznych pozwoli na generalizację wyników na populację (warunek trafności zewnętrznej).

Moderatory i mediatory

Decydując się na wykonanie analizy statystycznej wyników badania możemy zdecydować się na poszukanie mediatorów i moderatorów.

Moderatorto zmienna, której wartość wpływa na  kierunek lub siłę zależności. Obecność istotnego moderatora można sprawdzić wykorzystując analizę wariancji MANOVA. O istnieniu moderatora wnioskujemy, gdy interakcja okazałaby się istotna statystycznie. Graficznie przedstawiono to poniżej:

Mediatorjest to określona zmienna, która pośredniczy w relacji między dwiema innymi zmiennymi. Mediację można mierzyć m.in. poprzez zastosowanie analizy regresji (hierarchicznej; wprowadzając mediatora w kolejnym kroku analizy). Po uwzględnieniu mediatora w modelu (zmienna 3, por. poniższy wykres) relacja między zmiennymi 1 i 2 powinna zaniknąć lub znacząco osłabnąć:

Porównanie analizy regresji, wariancji i kowariancji

- analiza kowariancji nie pozwala na zbadanie interakcji kowiariantu z czynnikami,

- analiza regresji potwierdza istnienie większej liczby interakcji aniżeli analiza wariancji (kategoryzując zmienną ze skali ilościowej na nominalną lub porządkową tracimy część informacji – stąd mniejsza liczba wyjaśnionych efektów),

- minusem analizy regresji jest to, że interpretacja interakcji wyższego rzędu może być kłopotliwa.

Podsumowanie

- analiza czynnikowa – służy do sprawdzenia, czy na podstawie n zmiennych możemy wyodrębnić pewne podskale (czynniki). Grupujemy zmienne,

- skalowanie wielowymiarowe – chcemy zbadać zależności między obiektami w określonej przestrzeni (np. percepcji badanego). Miary podobieństwa wyliczane są poprzez odległości między obiektami,

- analiza skupień – pozwala na klasyfikację osób lub zmiennych pod względem podobieństwa (np. znalezienie grup charakteryzujących się określonymi stylami odżywiania lub sprawdzenie, czy oceny pewnych produktów są zbliżone / odległe względem siebie),

- analiza ścieżek / modelowanie strukturalne – badanie istnienia modelu przyczynowego na podstawie macierzy korelacji,

- analiza kowariancji – badamy wpływ zmiennych niezależnych (nominalnych) na zmienną zależną (ilościową) przy kontroli innych zmiennych ilościowych,

- rho Spearmana – sprawdzamy istnienie powiązania między dwiema zmiennymi porządkowymi (nieparametryczny odpowiednik analizy korelacji r Pearsona),

- test U Manna – Whiteya – mierzymy różnice między dwiema grupami pod względem nasilenia określonej zmiennej porządkowej. W momencie, gdybyśmy mieli do czynienia z większą liczbą grup – wykonalibyśmy test H Kruskala – Wallisa,