Podstawowe założenie stojące u podstaw tej metody jest dość proste. Otóż jeśli wartości wielu różnych cech są wzajemnie skorelowane (każda cecha koreluje z każdą inną cechą z interesującego nas zestawu), to korelacje, o których mowa, wynikają z tego, że każda z interesujących nas cech (nazywanych zmiennymi jawnymi, bo możemy je zaobserwować lub ocenić, choćby pośrednio) jest skorelowana z jedną nieobserwowalną cechą (nazywaną zmienną ukrytą, gdyż nie jest ona przedmiotem pomiaru, lecz o jej istnieniu możemy tylko wnioskować na podstawie korelacji między zmiennymi jawnymi).
Oto prosty przykład – kiedy obserwujesz ludzi, możesz dojść do wniosku, że (1) jeśli ktoś zwykle mówi „dzień dobry” na powitanie, to z reguły (2) mówi też „przepraszam”, gdy kogoś czymś urazi oraz (3) ustępuje w tramwaju miejsca osobom starszym i (4) elegancko się ubiera do teatru. Wszystkie te zachowania są wzajemnie skorelowane, choć trudno powiedzieć, że jedno zachowanie jest przyczyną innego. Jeśli ktoś przejawia jedno z nich, to przeważnie przejawia też inne, a jeśli ktoś nie przejawia określonego zachowania, to przeważnie nie przejawia też pozostałych. Oczywiście od reguły są wyjątki, ale ogólna tendencja jest właśnie taka. Pomyśl, skąd takie uporządkowanie ludzkich zachowań? Odpowiedź jest dość oczywista: osoby, które przejawiają podane zachowania, odebrały dobre wychowanie. Osobom, które nie przejawiają tego typu zachowań, brakuje cechy indywidualnej, którą jest dobre wychowanie. Wskazaliśmy w ten sposób ukryte źródło różnych zachowań społecznych. Chociaż nie obserwowaliśmy procesu wychowawczego tych ludzi, możemy z treści ich konkretnych zachowań wywnioskować, jakie odebrali wychowanie.
Analiza czynnikowa takiemu wnioskowaniu nadaje podstawę matematyczną. Nie mam zamiaru nękać was formułami matematycznymi, podam jednak kilka kluczowych pojęć dla omawianej metody statystycznej. Podstawowe jest pojęcie korelacji. Drugim ważnym pojęciem jest czynnik, czyli hipotetyczna (ukryta, latentna, nieobserwowana) zmienna, która wyjaśnia zmienność cech bezpośrednio objętych badaniem (np. odpowiedzi na określone pytania kwestionariusza). Trzecim pojęciem jest ładunek czynnikowy, który można rozumieć jako współczynnik korelacji pomiędzy zmienną jawną a czynnikiem.
W analizie czynnikowej badacz musi sam podjąć decyzję o tym, jaką techniką wyodrębniania czynników się posłuży (jest ich kilka i mogą prowadzić do nieco innych rozwiązań. Najbardziej popularnym wariantem jest metoda głównych składowych (principal components) oraz metoda czynników głównych (principal factors). Mimo podobieństw matematycznie są to różne metody. Pomijam jednak szczegółowe rozważanie tej kwestii. Wystarczy na ten moment wiedzieć, że pierwsza z tych metod prowadzi z reguły do wyodrębnienia większej liczby czynników aniżeli ta druga.
Innym ważnym pojęciem w analizie czynnikowej jest wartość własna (eigenvalue). Jest to ważna wielkość, ponieważ od niej zależy decyzja o tym, ile czynników można wydobyć z macierzy korelacji zmiennych poddawanych analizie. Zwykle bierze się pod uwagę liczbę czynników o wartościach własnych powyżej 1. Czym więc są wartości własne? Są one miarą tego, w jakim stopniu wariancja obserwowanych zmiennych wyjaśnia dany czynnik. Każdy czynnik o wartości własnej >1 wyjaśnia więcej wariancji niż pojedyncza obserwowana zmienna. Gdyby zatem z pięciu zmiennych jawnych utworzył się jeden czynnik o wartości własnej równej 2, to wyjaśniałby on 2/5 zmienności tych pięciu zmiennych. Gdyby kolejny czynnik w tej samej analizie miał wartość własną 1, to oba czynniki wyjaśniałyby 3/5 zmienności z tych pięciu jawnych zmiennych. Podczas analizy czynnikowej badacz musi na wstępie zdecydować czynniki o jakiej wartości własnej mają znaleźć się w rozwiązaniu czynnikowych (zwykle zaznacza się wartość >1, choć czasem odstępuje się od tej reguły).
Kolejnym pojęciem jest rotacja czynników. Polega ona na wyznaczeniu wartości czynnikowych w sposób, który najbardziej pasuje do zadanego rozwiązania czynnikowego. Te rozwiązania mogą być dwojakiego rodzaju – ortogonalne (czynniki są wzajemnie niezależne) albo ukośne (czynniki są wzajemnie skorelowane). Badacz musi zdecydować przed analizą, jakiego rozwiązania poszukuje. Musi więc dysponować jakąś teorią, która pozwoli mu w tej materii podjąć decyzję. Jeśli takiej teorii nie ma, to bezpieczniej jest przyjąć rozwiązanie ukośne – jeśli czynniki w rzeczywistości są niezależne, to mimo użycia rotacji ukośnej i tak pojawią się jako niezależne. Użycie rotacji ortogonalnej do opisania nieortogonalnej struktury rzeczywistej byłoby zniekształceniem rzeczywistości. Najbardziej popularną metodą rotacji ortogonalnej jest metoda Varimax, a najbardziej popularną metodą rotacji ukośnej jest metoda Oblimin (obie są dostępne w pakiecie SPSS, w innych programach czasem mamy w opcjach tylko rotacje ortogonalne).
Rezultaty analizy czynnikowej przedstawiane są za pomocą macierzy czynnikowej. Jest to prostokątna tabela, w kolumnach której opisane są kolejne czynniki wyodrębnione w analizie przy użyciu ładunków czynnikowych odpowiadających poszczególnym zmiennym jawnym (jeden wiersz w tabeli to jedna zmienna jawna, a jedna kolumna pionowa to jeden czynnik). Ładunki czynnikowe są standaryzowanymi współczynnikami regresji zmiennych jawnych względem czynników. Im bardziej ładunek czynnikowy odbiega od zera (na plus lub na minus), tym silniejszy jest związek czynnika z daną zmienną jawną. Zmienne o najwyższych ładunkach względem danego czynnika pozwalają najwięcej wywnioskować na temat jego natury.
Przykład ze strony https://www.theanalysisfactor.com:

Zauważ dwa czynniki (Factor 1 i Factor 2). W lewej kolumnie znajdują się nazwy zmiennych. Przedmiotem badania był status socjoekonomiczny respondentów. Okazał się on kategorią niejednorodną, bo ujawniły się dwa, a nie jeden ogólny czynnik. Dochody, wykształcenie i prestiż zawodu utworzyły jeden czynnik, a wartość posiadanego lokum, liczba skwerów miejskich w sąsiedztwie i nasilenie przestępczości w sąsiedztwie utworzyły drugi czynnik. Warto zauważyć, że coś w tych danych się nie zgadza. Mam na myśli znaki w ostatnim wierszu tabeli, które są dodatnie (co by oznaczało, że przestępczość występuje w pobliżu bogatych domostw i najlepszych terenów rekreacyjnych). Prawdopodobnie autorzy tego przykładu zapomnieli o minusie przed ładunkiem czynnikowym. Zastanów się, jaką nazwę wymyślić dla każdego z tych czynników.
Piotr Kwiatkowski – pedagog specjalny, doktor habilitowany w zakresie nauk społecznych
fot. pixabay.com
Ułatwienia dostępu
Tworzymy przestrzeń dyskursu o rodzinie, wychowaniu i edukacji, a także inspirujemy do poszukiwania rozwiązań wychowawczych dla przedstawicieli praktyki.
Spotkajmy się w mediach społecznościowychPromujemy osiągnięcia polskiej myśli teoretycznej i praktycznej w zakresie rodziny, wychowania i edukacji w środowisku polskich teoretyków i praktyków.
Administratorem danych osobowych jest Wirtualny Uniwersytet EDUsfery Sp. z o.o., ul. Drukarska 45/38, 53-311 Wrocław, KRS 0001014962, REGON 524280873, NIP 8992949503, posiadający status małego przedsiębiorcy w rozumieniu Ustawy z dnia 8 marca 2013 roku o przeciwdziałaniu nadmiernym opóźnieniom w transakcjach handlowych (Dz.U. z 2022 r. poz. 893 z późn. zm.). Kontakt możliwy jest z Administratroem pod adresem poczty elektronicznej: wydawnictwo@edusfera.press, nr tel: +48 500 858 921. W Polityce Prywatności Administrator informuje o celu, okresie i podstawach prawnych przetwarzania danych osobowych, a także o prawach jakie przysługują osobom, których przetwarzane dane osobowe dotyczą, podmiotom którym Administrator może powierzyć do przetwarzania dane osobowe, oraz o zasadach zautomatyzowanego przetwarzania danych osobowych, w tym ich profilowaniu
Wszelkie prawa zastrzeżone