Rotace faktorů
Bez ohledu na metodu extrakce faktorů existuje nekonečně mnoho faktorových řešení. Znamená to, že ke každému odhadu faktorových zátěží existuje nekonečně mnoho dalších alternativ, které vystihují data stejně dobře. Proto se ve druhé fázi faktorové analýzy faktory transformují tak, abychom je mohli co nejlépe interpretovat. Praxe přitom ukázala, že nejlépe se interpretují takové faktory, jejichž faktorové zátěže nabývají hodnot blízkých buď jedné, nebo nule. To znamená, že každá manifestní proměnná je silně korelována jen s některými faktory a s ostatními faktory je korelována slabě. Tato fáze faktorové analýzy se nazývá rotace faktorů. Název "rotace" se ujal proto, že pro 2 faktory si tuto operaci můžeme představit jako pootočení, tj. rotaci souřadnicových os. To lze ilustrovat např. na následujícím příkladu:
Představme si faktorové řešení ve tvaru
X1 = 0,5 F1 + 0,5 F2
X2 = 0,5 F1 – 0,4 F2
X3 = 0,7 F1 + 0,6 F2
X4 = -0,6 F1 + 0,5 F2
Toto faktorové řešení je zobrazeno na obr. 2. Souřadnicové osy F1 a F2 jsou zobrazeny černě, původní faktorové zátěže zeleně. Pootočíme-li faktory F1 a F2 o 45˚, získáme nové souřadnicové osy F1' a F2', faktorové zátěže jsou po rotaci označeny oranžově. Vidíme, že po rotaci skutečně došlo k tomu, že některé faktorové zátěže jsou prakticky nulové nebo nule blízké. Rotované faktorové řešení má přibližně tvar
X1 = 0,71 F1' + 0,00 F2'
X2 = 0,07 F1' – 0,58 F2'
X3 = 0,92 F1' – 0,07 F2'
X4 = -0,08 F1' + 0,78 F2'
Obr. 2
Vidíme, že první faktor je po rotaci sycen pouze proměnnými X1 a X3, druhý pak X2 a X4. Přitom před rotací byly oba faktory syceny všemi čtyřmi proměnnými.
Pojem rotace úzce souvisí s představou jednoduché struktury matice faktorových zátěží. Matice faktorových zátěží má jednoduchou strukturu když:
- Každý řádek obsahuje nejméně jednu zátěž blízkou nule.
- Každý sloupec obsahuje nejméně tolik malých zátěží, kolik je faktorů.
- Pro každou dvojici sloupců existuje alespoň tolik dvojic proměnných, z nichž jedna má malou zátěž u jednoho faktoru a druhá velkou zátěž u druhého faktoru, kolik je společných faktorů.
Tato definice jednoduché struktury matice zátěží není přesná, protože v ní není specifikováno, co je to faktorová zátěž blízká nule, malá a velká. V praxi ale s touto definicí vystačíme. Pokud bychom se pohybovali v teoretické rovině, musely by být výrazy "blízká nule" a "malá" nahrazeny slovem "nulová" a výraz "velká" slovem nenulová. V praxi ale těžko získáme nulové faktorové zátěže.
Zvykem je uvažovat faktorové zátěže v absolutní hodnotě menší než 0,3 jako „blízké nule“, a za „velké“ uvažovat faktorové zátěže v absolutní hodnotě větší než 0,5. Faktorová zátěž rovna 1 znamená, že daná proměnná je zcela nasycena daným faktorem, tj. jde o faktorově čistou proměnnou. Faktorová zátěž rovna 0 ukazuje, že proměnná není daným faktorem vůbec dotčena.
Zvláštním případem jednoduché struktury matice faktorových zátěží jsou nezávislé shluky, kdy každá proměnná má nenulovou zátěž pouze u jednoho faktoru. Princip jednoduché struktury matice faktorových zátěží zdůvodnil Thurstone tím, že k řešení kognitivních úloh nepoužíváme všechny naše schopnosti současně. Přijatelnost požadavku jednoduché struktury je tedy možná dána spíše způsobem lidského myšlení než povahou zkoumaných dat.
Pro rotaci faktorů bylo navrženo mnoho metod, z nichž většina je založena na tzv. simplicitní funkci, která je funkcí všech prvků matice faktorových zátěží. Ta je zkonstruována tak, aby nabývala maxima nebo minima při přiměřené aproximaci jednoduché struktury. Bylo vytvořeno několik variant simplicitních funkcí, přičemž metody na nich založené dávajících odlišná řešení. Nadto je těžké stanovit, která implicitní funkce je obecně nejlepší. Zůstává proto jenom na výzkumníkovi, kterou z metod použije. Rozhodování má přitom několik fází.
Prvním krokem je rozhodnutí mezi pravoúhlou (ortogonální) a šikmou rotací. Pravoúhlou rotaci si můžeme představit jako pootočení všech os o stejný úhel, což poskytne řešení s nekorelovanými faktory. Hlavním důvodem pro použití ortogonální rotace je pojetí, ve kterém se předpokládá, že latentní proměnné by měly být jakési základní, nezávislé, a tedy i nekorelované proměnné.
V šikmém řešení dostáváme faktory korelované, což mnohdy lépe odpovídá realitě. Například testy kognitivních schopností mají tendenci spolu kladně korelovat a poskytovat jeden generální faktor - všeobecnou inteligenci. U kosé rotace je ale situace komplikovanější, můžeme získat dvě matice faktorových zátěží – jednak tzv. faktorový vzor, obsahující regresní koeficienty proměnných na faktorech, jednak tzv. faktorovou strukturu, která obsahuje koeficienty korelace. Při ortogonální rotaci jsou tyto dvě matice totožné. Pro interpretaci faktorů u šikmé rotace používáme matici faktorové struktury.
Jednotlivé metody rotace popíšeme v pořadí od nejčastěji používaných (a pro interpretaci faktorů nejméně záludných).
Varimax je ortogonální rotace, která minimalizuje počet proměnných, které mají vysoké zátěže s každým společným faktorem. Lze o ní mluvit jako o metodě zjednodušující faktory. Simplicitní funkce tu je dána součtem rozptylů čtverců faktorových zátěží v jednotlivých sloupcích. Protože faktory s malým počtem vysokých zátěží u proměnných se snáze interpretují, je tato metoda nejvhodnější pro začátečníky, protože pro interpretaci faktorů vyžaduje relativně nejmenší zkušenosti. Tato metoda má tendenci nevytvářet jeden všeobecný faktor.
Quartimax je ortogonální rotace, která minimalizuje počet faktorů, kterých je potřeba pro vysvětlení jednotlivých proměnných. Simplicitní funkce tu je dána součtem rozptylů čtverců faktorových zátěží v jednotlivých řádcích. Lze o ní mluvit jako o metodě zjednodušující proměnné, má tedy tendenci ponechávat jeden všeobecný faktor.
Equamax je kombinace metody Varimax a Quartimax. Je při ní minimalizován jak počet proměnných, které mají vysoké zátěže s každým společným faktorem, tak počet faktorů, kterých je potřeba pro vysvětlení jednotlivých proměnných. Jedná se o ortogonální rotaci.
Oblimin je šikmá rotace pomocí které se dosahuje jednodušší struktury faktorů než by bylo možné u ortogonální rotace. Využívá se především tam, kde z povahy zkoumaných dat a výsledných faktorů je zřejmé, že faktory pravděpodobně nemohou být nezávislé.
Promax je šikmá rotace, vhodná pro stejný typ dat a faktorů jako metoda oblimin. Na rozdíl od metody oblimin je rychlejší, proto se používá především pro velké soubory dat.
Matice rotovaných faktorových zátěží bývá následována maticí koeficientů dij, které udávají podobu konkrétní lineární transformace vedoucí k převodu původních faktorů Fi na rotované faktory Fi'. Pro koeficienty dij platí
Příklad jednoho z možných faktorových řešení udává tabulka 2.
Tab.2 Faktorové zátěže získané metodou maximální věrohodnosti a rotací varimax
|
Component |
|||
1 |
2 |
3 |
4 |
|
01 Žít ve správně rodině |
,471 |
|
|
|
02 Žít ve zdravém životním prostředí |
|
,546 |
|
|
03 Být vzdělaný, mít velké znalosti |
|
,609 |
|
|
04 Hodně cestovat, poznávat různé země |
|
|
|
|
05 Pomáhat všude, kde je potřeba |
,513 |
,324 |
|
|
06 Dobře vypadat, mít pěkný osobní vzhled |
|
|
,506 |
|
07 Umět se o sebe postarat, být samostatný |
|
|
|
,587 |
08 Být ve svém budoucím životě úspěšný |
|
|
,632 |
|
09 Umět se prosadit, mít dobré nápady |
|
|
,460 |
|
10 Žít v blahobytu, mít hodně peněz |
|
|
,642 |
|
11 Žít ve shodě se svojí náboženskou vírou |
|
|
|
-,309 |
12 Mít pocit, že jsem někomu užitečný |
,483 |
,315 |
|
|
13 Najít si dobrého životního partnera |
,730 |
|
|
,418 |
14 Být tolerantní, žít v dobrém vztahu s lidmi |
,717 |
|
|
|
15 Být hrdý na zemi, kde jsem se narodil |
,438 |
,468 |
|
|
16 Naučit se poctivě pracovat,odevzdávat co nejlepší výkon |
,576 |
,645 |
|
|
17 Chovat se vždy tak, aby si mne lidé vážili |
,810 |
|
|
|
18 Nemít velké zdravotní problémy |
,407 |
|
|
|
Extraction Method: Maximum Likelihood |
||||
a Rotation converged in12 iterations. |
Fi' = di1 F1 + di2 F2 + di3 F3 + + dim Fm
pro i = 1, 2, 3, … m.