Podstawowe pojęcia w analizie czynnikowej
Zanim przejdziemy do omówienia metod analizy czynnikowej, warto wyjaśnić kilka kluczowych terminów:
Zmienna latentna – zmienna, której nie możemy bezpośrednio zmierzyć, ponieważ jest bardziej złożoną strukturą, zbudowaną z wielu innych, obserwowalnych mikrozmiennych. Przykładami zmiennych latentnych mogą być postawy społeczne (np. skala przekonań konserwatyzm vs liberalizm), inteligencja (np. Test Inteligencji Wielorakiej) czy cechy osobowości (np. Test Wielkiej Piątki).
Czynnik (factor/component) – składowa zmiennej latentnej, która grupuje razem powiązane ze sobą ładunki i pomaga w zrozumieniu jednego z wielu wymiarów ukrytej struktury badanego zjawiska.
Item – inaczej ładunek, podstawowy element, który wchodzi w skład czynnika. Może to być np. pytanie w kwestionariuszu lub zmienna mierząca konkretny aspekt zachowania czy postawy.
Rodzaje analizy czynnikowej
Analiza czynnikowa obejmuje różne techniki, które są stosowane w zależności od celu badania. Najczęściej wyróżnia się trzy główne typy:
1) Analiza Głównych Składowych (Principal Component Analysis – PCA) – jest to metoda redukcji wymiarowości, która służy do uproszczenia ilości zgromadzonych przez nas danych, czyli np. usunięcia tych ładunków, które nie pomagają w pomiarze i wyjaśnieniu zmiennej latentnej. Zatem PCA stosujemy, gdy już mamy z góry określoną liczbę ładunków i wiemy, że ich liczbę koniecznie należy zredukować.
Przy omawianiu analiz czynnikowych konieczne jest też wprowadzenie zagadnienia rotacji. Rotacje to nic innego, jak określone korekty do wzorów matematycznych wyprowadzających obliczenia szacujące moc i położenie ładunków itemów na rzecz danych czynników, a zatem znacząco wpływające na to, jak są one grupowane. W ramach nauk społecznych najpowszechniej można spotkać trzy rotacje: varimax, promax i oblimin.
Varimax – rotacja ortogonalna, która zakłada, że czynniki są od siebie niezależne, zatem teoretycznie nie będą ze sobą silnie skorelowane.
Promax – rotacja obrotowa, która zakłada, że czynniki mogą być ze sobą powiązane, zatem teoretycznie będą ze sobą silnie skorelowane.
Oblimin – rotacja, która jest kompromisem między warunkiem braku zależności czynników varimax oraz warunkiem zależności promax.
2) Analiza Eksploracyjna (Explorative Factor Analysis – EFA) jest odmianą analizy czynnikowej stosowaną, gdy chcemy poznawać nasze dane. Dzięki niej zobaczymy, jak różne ładunki, co do których nie mieliśmy wcześniej żadnych założeń teoretycznych, mogą tworzyć jakieś mniej bądź bardziej spójne czynniki. Naczelnym celem EFA jest eksploracja ukrytych struktur w danych i, podobnie jak w PCA, również można zastosować różnorodne rotacje, które poprawią interpretację wyników.
3) Analiza Konfirmacyjna (Confirmatory Factor Analysis – CFA) – stosujemy wyłącznie, gdy mamy już teoretyczny model zmiennej latentnej, który chcemy zweryfikować. Metoda ta pozwala na sprawdzenie, czy przyjęta struktura czynników i grupowanie ładunków są dobrze dopasowane do danych. W przeciwieństwie do EFA, CFA nie wprowadza rotacji ani nie dokonuje selekcji itemów, jej celem jest testowanie odgórnie wcześniej przyjętych założeń i ocena jakości dopasowania modelu do danych. Metoda ta najczęściej wykorzystywana jest do analizy spójności i rzetelności wystandaryzowanych modeli i narzędzi badawczych.
Kluczowe wskazówki metodologiczne
Aby analiza czynnikowa była skuteczna i wiarygodna, warto zwrócić uwagę na kilka istotnych kwestii metodologicznych:
Jednorodność skali – wszystkie itemy (konwertowane potem na ładunki) powinny być mierzone na tej samej skali (np. skala Likerta, skala 0-1 lub skala standaryzowana). Pozwala to na oszacowanie mocy ładunków, tak aby ujawnić ich powiązania korelacyjne w sposób porównywalny – dzięki temu jesteśmy w stanie ocenić, że jeden ładunek jest realnie silniejszy lub słabszy od drugiego.
Wielkość próby – aby analiza czynnikowa była wiarygodna, próba badawcza powinna być wystarczająco liczna. Minimalna liczba uczestników w naukach społecznych to zazwyczaj 30 osób w badaniach pilotażowych, a w badaniach właściwych zaleca się próby liczące co najmniej 200–300 osób, w zależności od złożoności modelu. Według reguły kciuka (rule of thumb) przyjmuje się, że poczynając od pary wskaźników/zmiennych, każdy dodatkowy generuje każdorazowo dodatkowe 30 obserwacji. Zatem pakiet 10 wskaźników generuje konieczność zbadania 270 osób.
Kompletność danych – brakujące dane mogą wpłynąć na wypaczenie wyników analizy. Ważne jest, aby uzupełnić brakujące wartości za pomocą odpowiednich technik imputacji danych, np. uzupełnianie medianą, modaną, średnią, wielokrotną imputacją lub drzewami losowymi.
Optymalna sekwencja analizy czynnikowej
Pełna analiza czynnikowa zwykle przebiega według poniższego schematu:
EFA – rozpoczynamy od analizy eksploracyjnej, aby zbadać, jak ładunki mogą być grupowane w czynniki.
PCA – następnie przeprowadzamy analizę głównych składowych poprzez eliminację słabych ładunków na poszczególnych czynnikach.
CFA – na końcu przeprowadzamy analizę konfirmacyjną, aby zweryfikować, czy model dobrze opisuje strukturę danych i czy jest zgodny z teorią.
Podsumowanie
Analiza czynnikowa to niezwykle przydatna metoda w naukach społecznych, która pozwala na identyfikację ukrytych struktur w danych i ułatwia zrozumienie złożonych zjawisk. Dzięki tej metodzie badacze mogą tworzyć bardziej spójne modele teoretyczne, które lepiej odzwierciedlają rzeczywistość społeczną. W zależności od celu badania można zastosować różne techniki analizy czynnikowej, takie jak PCA, EFA czy CFA. Każda z nich ma swoje specyficzne zastosowanie. Odpowiednia analiza czynnikowa może dostarczyć cennych informacji na temat tego, jak różne zmienne są ze sobą powiązane i jakie mechanizmy kierują silniej lub słabiej badanym zjawiskiem społecznym.
Kamil Błaszczyński
fot. pixabay.com
Ułatwienia dostępu
Tworzymy przestrzeń dyskursu o rodzinie, wychowaniu i edukacji, a także inspirujemy do poszukiwania rozwiązań wychowawczych dla przedstawicieli praktyki.
Spotkajmy się w mediach społecznościowychPromujemy osiągnięcia polskiej myśli teoretycznej i praktycznej w zakresie rodziny, wychowania i edukacji w środowisku polskich teoretyków i praktyków.
Administratorem danych osobowych jest EDUsfera. Ewa Jurczyk-Romanowska, ul. Drukarska 45/38, 53-311 Wrocław, NIP 5471830063, REGON 385633764, posiadająca status małego przedsiębiorcy w rozumieniu Ustawy z dnia 8 marca 2013 roku o przeciwdziałaniu nadmiernym opóźnieniom w transakcjach handlowych (Dz.U. z 2022 r. poz. 893 z późn. zm.). Kontakt możliwy jest z Administratroem pod adresem poczty elektronicznej: wydawnictwo@edusfera.press, nr tel: +48 500 858 921. W Polityce Prywatności Administrator informuje o celu, okresie i podstawach prawnych przetwarzania danych osobowych, a także o prawach jakie przysługują osobom, których przetwarzane dane osobowe dotyczą, podmiotom którym Administrator może powierzyć do przetwarzania dane osobowe, oraz o zasadach zautomatyzowanego przetwarzania danych osobowych, w tym ich profilowaniu
Wszelkie prawa zastrzeżone