Faktorová analýza

Rotace faktorů

Bez ohledu na metodu extrakce faktorů existuje nekonečně mnoho faktorových řešení. Znamená to, že ke každému odhadu faktorových zátěží existuje nekonečně mnoho dalších alternativ, které vystihují data stejně dobře. Proto se ve druhé fázi faktorové analýzy faktory transformují tak, abychom je mohli co nejlépe interpretovat. Praxe přitom ukázala, že nejlépe se interpretují takové faktory, jejichž faktorové zátěže nabývají hodnot blízkých buď jedné, nebo nule. To znamená, že každá manifestní proměnná je silně korelována jen s některými faktory a s ostatními faktory je korelována slabě. Tato fáze faktorové analýzy se nazývá rotace faktorů. Název "rotace" se ujal proto, že pro 2 faktory si tuto operaci můžeme představit jako pootočení, tj. rotaci souřadnicových os. To lze ilustrovat např. na následujícím příkladu:
Představme si faktorové řešení ve tvaru

X1 =   0,5 F1 + 0,5 F2
X2 =   0,5 F1 – 0,4 F2
X3 =   0,7 F1 + 0,6 F2
X4 = -0,6 F1 + 0,5 F2

Toto faktorové řešení je zobrazeno na obr. 2. Souřadnicové osy F1 a F2 jsou zobrazeny černě, původní faktorové zátěže zeleně. Pootočíme-li faktory F1 a F2 o 45˚, získáme nové souřadnicové osy F1' a F2', faktorové zátěže jsou po rotaci označeny oranžově. Vidíme, že po rotaci skutečně došlo k tomu, že některé faktorové zátěže jsou prakticky nulové nebo nule blízké. Rotované faktorové řešení má přibližně tvar

X1 =   0,71 F1' + 0,00 F2'
X2 =   0,07 F1' – 0,58 F2'
X3 =   0,92 F1' – 0,07 F2'
X4 = -0,08 F1' + 0,78 F2'

Obr. 2

Vidíme, že první faktor je po rotaci sycen pouze proměnnými X1 a X3, druhý pak X2 a X4. Přitom před rotací byly oba faktory syceny všemi čtyřmi proměnnými.

Pojem rotace úzce souvisí s představou jednoduché struktury matice faktorových zátěží. Matice faktorových zátěží má jednoduchou strukturu když:
- Každý řádek obsahuje nejméně jednu zátěž blízkou nule.
- Každý sloupec obsahuje nejméně tolik malých zátěží, kolik je faktorů.
- Pro každou dvojici sloupců existuje alespoň tolik dvojic proměnných, z nichž jedna má malou zátěž u jednoho faktoru a druhá velkou zátěž u druhého faktoru, kolik je společných faktorů.

Tato definice jednoduché struktury matice zátěží není přesná, protože v ní není specifikováno, co je to faktorová zátěž blízká nule, malá a velká. V praxi ale s touto definicí vystačíme. Pokud bychom se pohybovali v teoretické rovině, musely by být výrazy "blízká nule" a "malá" nahrazeny slovem "nulová" a výraz "velká" slovem nenulová. V praxi ale těžko získáme nulové faktorové zátěže.

Zvykem je uvažovat faktorové zátěže v absolutní hodnotě menší než 0,3 jako „blízké nule“, a za „velké“ uvažovat faktorové zátěže v absolutní hodnotě větší než 0,5. Faktorová zátěž rovna 1 znamená, že daná proměnná je zcela nasycena daným faktorem, tj. jde o faktorově čistou proměnnou. Faktorová zátěž rovna 0 ukazuje, že proměnná není daným faktorem vůbec dotčena.

Zvláštním případem jednoduché struktury matice faktorových zátěží jsou nezávislé shluky, kdy každá proměnná má nenulovou zátěž pouze u jednoho faktoru. Princip jednoduché struktury matice faktorových zátěží zdůvodnil Thurstone tím, že k řešení kognitivních úloh nepoužíváme všechny naše schopnosti současně. Přijatelnost požadavku jednoduché struktury je tedy možná dána spíše způsobem lidského myšlení než povahou zkoumaných dat.

Pro rotaci faktorů bylo navrženo mnoho metod, z nichž většina je založena na tzv. simplicitní funkci, která je funkcí všech prvků matice faktorových zátěží. Ta je zkonstruována tak, aby nabývala maxima nebo minima při přiměřené aproximaci jednoduché struktury. Bylo vytvořeno několik variant simplicitních funkcí, přičemž metody na nich založené dávajících odlišná řešení. Nadto je těžké stanovit, která implicitní funkce je obecně nejlepší. Zůstává proto jenom na výzkumníkovi, kterou z metod použije. Rozhodování má přitom několik fází.

Prvním krokem je rozhodnutí mezi pravoúhlou (ortogonální) a šikmou rotací. Pravoúhlou rotaci si můžeme představit jako pootočení všech os o stejný úhel, což poskytne řešení s nekorelovanými faktory. Hlavním důvodem pro použití ortogonální rotace je pojetí, ve kterém se předpokládá, že latentní proměnné by měly být jakési základní, nezávislé, a tedy i nekorelované proměnné.

V šikmém řešení dostáváme faktory korelované, což mnohdy lépe odpovídá realitě. Například testy kognitivních schopností mají tendenci spolu kladně korelovat a poskytovat jeden generální faktor - všeobecnou inteligenci. U kosé rotace je ale situace komplikovanější, můžeme získat dvě matice faktorových zátěží – jednak tzv. faktorový vzor, obsahující regresní koeficienty proměnných na faktorech, jednak tzv. faktorovou strukturu, která obsahuje koeficienty korelace. Při ortogonální rotaci jsou tyto dvě matice totožné. Pro interpretaci faktorů u šikmé rotace používáme matici faktorové struktury.
Jednotlivé metody rotace popíšeme v pořadí od nejčastěji používaných (a pro interpretaci faktorů nejméně záludných).

Varimax je ortogonální rotace, která minimalizuje počet proměnných, které mají vysoké zátěže s každým společným faktorem. Lze o ní mluvit jako o metodě zjednodušující faktory. Simplicitní funkce tu je dána součtem rozptylů čtverců faktorových zátěží v jednotlivých sloupcích. Protože faktory s malým počtem vysokých zátěží u proměnných se snáze interpretují, je tato metoda nejvhodnější pro začátečníky, protože pro interpretaci faktorů vyžaduje relativně nejmenší zkušenosti. Tato metoda má tendenci nevytvářet jeden všeobecný faktor.

Quartimax je ortogonální rotace, která minimalizuje počet faktorů, kterých je potřeba pro vysvětlení jednotlivých proměnných. Simplicitní funkce tu je dána součtem rozptylů čtverců faktorových zátěží v jednotlivých řádcích. Lze o ní mluvit jako o metodě zjednodušující proměnné, má tedy tendenci ponechávat jeden všeobecný faktor.

Equamax je kombinace metody Varimax a Quartimax. Je při ní minimalizován jak počet proměnných, které mají vysoké zátěže s každým společným faktorem, tak počet faktorů, kterých je potřeba pro vysvětlení jednotlivých proměnných. Jedná se o ortogonální rotaci.

Oblimin je šikmá rotace pomocí které se dosahuje jednodušší struktury faktorů než by bylo možné u ortogonální rotace. Využívá se především tam, kde z povahy zkoumaných dat a výsledných faktorů je zřejmé, že faktory pravděpodobně nemohou být nezávislé.

Promax je šikmá rotace, vhodná pro stejný typ dat a faktorů jako metoda oblimin. Na rozdíl od metody oblimin je rychlejší, proto se používá především pro velké soubory dat.

Matice rotovaných faktorových zátěží bývá následována maticí koeficientů dij, které udávají podobu konkrétní lineární transformace vedoucí k převodu původních faktorů Fi na rotované faktory Fi'. Pro koeficienty dij platí

Příklad jednoho z možných faktorových řešení udává tabulka 2.

Tab.2 Faktorové zátěže získané metodou maximální věrohodnosti a rotací varimax

	Component
	1	2	3	4
01 Žít ve správně rodině	,471
02 Žít ve zdravém životním prostředí		,546
03 Být vzdělaný, mít velké znalosti		,609
04 Hodně cestovat, poznávat různé země
05 Pomáhat všude, kde je potřeba	,513	,324
06 Dobře vypadat, mít pěkný osobní vzhled			,506
07 Umět se o sebe postarat, být samostatný				,587
08 Být ve svém budoucím životě úspěšný			,632
09 Umět se prosadit, mít dobré nápady			,460
10 Žít v blahobytu, mít hodně peněz			,642
11 Žít ve shodě se svojí náboženskou vírou				-,309
12 Mít pocit, že jsem někomu užitečný	,483	,315
13 Najít si dobrého životního partnera	,730			,418
14 Být tolerantní, žít v dobrém vztahu s lidmi	,717
15 Být hrdý na zemi, kde jsem se narodil	,438	,468
16 Naučit se poctivě pracovat,odevzdávat co nejlepší výkon	,576	,645
17 Chovat se vždy tak, aby si mne lidé vážili	,810
18 Nemít velké zdravotní problémy	,407
Extraction Method: Maximum Likelihood Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in12 iterations.

Fi' = di1 F1 + di2 F2 + di3 F3 + + dim Fm

pro i = 1, 2, 3, … m.