Konfirmativní faktorová analýza
Explorativní faktorová analýza se vymyká nejobvyklejší statistické proceduře založené na testování hypotéz. Její výsledky jsou nejednoznačné. Na jejím počátku nebývá stanoven počet faktorů. Nadto existuje celá škála metod pro extrakci faktorů. Přitom v mnoha výzkumných úkolech jsou už dopředu stanoveny hypotézy o počtu a povaze faktorů. V takových případech je mnohem vhodnější použít konfirmativní faktorovou analýzu. Konfirmativní faktorová analýza by ale měla být používána i tam, kde neznáme povahu proměnných natolik, abychom byli schopni hypotézy o počtu a povaze faktorů stanovit. V tom případě bychom měli použít explorativní faktorovou analýzu pro předběžné posouzení faktorové struktury, poté stanovit hypotézy o počtu a povaze faktorů a ty následně ověřovat za pomoci konfirmativní faktorové analýzy.
Protože každý problém má přinejmenším dvě stránky, je potřeba rovněž přiznat, že i postup konfirmativní faktorové analýzy není naprosto jednoznačný. I tady existuje několik metod, které lze při ověřování faktorové struktury použít. Obdobně jako u explorativní faktorové analýzy to jsou metoda maximální věrohodnosti, zobecněná metoda nejmenších čtverců a další. Nicméně proces konfirmativní faktorové analýzy je vždy zakončen statistickým testem hypotézy o vhodnosti zvolené faktorové struktury. Konkrétně jde o test shody původní korelační matice s korelační maticí odvozené na základě předpokladu, že manifestní proměnné jsou námi specifikovanou lineární kombinací faktorů. V tomto statistickém testu spočívá přednost konfirmativní faktorové analýzy. Námitka, že i některé metody explorativní faktorové analýzy jsou doprovázeny testem shody s faktorovým modelem, bývá odmítána s tím, že výzkumný pracovník pracující s mnohorozměrnými daty by měl znát důvody, proč je chce měřit, tj. znát cíle svého výzkumu.
Konfirmativní faktorová analýza na rozdíl od explorativní pracuje stejně často s kovariancemi jako s korelacemi. Tento text se stejně jako u explorativní faktorové analýzy omezí na analýzu korelačních koeficientů. Nespornou výhodou konfirmativní faktorové analýzy je skutečnost, že můžeme předepsat i korelace mezi faktory. Existují dvě základní možnosti, jak zadat strukturu faktorů a korelace mezi faktory - tabulka a graf. Pokud bychom pomocí faktorové analýzy chtěli ověřit výsledky explorativní faktorové analýzy dané tab. 2, můžeme strukturu faktorů zadat následovně:
Tab. 3 Předpis matice faktorových zátěží a korelační matice faktorů
|
F1 |
F2 |
F3 |
F4 |
|
F1 |
F2 |
F3 |
01 Žít ve správně rodině |
0 |
0 |
0 |
0 |
F1 |
1 |
0 |
0 |
02 Žít ve zdravém životním prostředí |
0 |
1 |
0 |
0 |
F2 |
0 |
1 |
0 |
03 Být vzdělaný, mít velké znalosti |
0 |
1 |
0 |
0 |
F3 |
0 |
0 |
1 |
04 Hodně cestovat, poznávat různé země |
0 |
0 |
0 |
0 |
05 Pomáhat všude, kde je potřeba |
1 |
0 |
0 |
0 |
06 Dobře vypadat, mít pěkný osobní vzhled |
0 |
0 |
1 |
0 |
07 Umět se o sebe postarat, být samostatný |
0 |
0 |
0 |
1 |
08 Být ve svém budoucím životě úspěšný |
0 |
0 |
1 |
0 |
09 Umět se prosadit, mít dobré nápady |
0 |
0 |
1 |
0 |
10 Žít v blahobytu, mít hodně peněz |
0 |
0 |
1 |
0 |
11 Žít ve shodě se svojí náboženskou vírou |
0 |
0 |
0 |
0 |
12 Mít pocit, že jsem někomu užitečný |
1 |
0 |
0 |
0 |
13 Najít si dobrého životního partnera |
1 |
0 |
0 |
0 |
14 Být tolerantní, žít v dobrém vztahu s lidmi |
1 |
0 |
0 |
0 |
15 Být hrdý na zemi, kde jsem se narodil |
1 |
1 |
0 |
0 |
16 Naučit se poctivě pracovat,odevzdávat co nejlepší výkon |
1 |
1 |
0 |
0 |
17 Chovat se vždy tak, aby si mne lidé vážili |
1 |
0 |
0 |
0 |
18 Nemít velké zdravotní problémy |
0 |
0 |
0 |
0 |
Tab. 3 má dvě části. Levá popisuje testovanou hypotézu, že 18 pozorovaných proměnných lze vysvětlit čtyřmi faktory a udává matici faktorových zátěží za pomoci tzv. strukturních nul, které představují, které faktorové zátěže lze pokládat za nulové. Na místě hodnot 1 se naopak předpokládá vysoká faktorová zátěž.
Pravá část tabulky znázorňuje obdobně korelace mezi faktory. Pokud jsou v této části tabulky jedničky pouze na diagonále, znamená to nekorelovanost faktorů.
Grafické znázornění struktury faktorů a korelace mezi faktory dává obr. 3. Pozorované proměnné mají tvar obdélníku, faktory tvar elipsy. Struktura faktorů je znázorněna šipkami směřujícími od faktorů směrem k pozorovaným proměnným. Graf ukazuje, že faktor 1 stojí za proměnnými 01, 05 a 12 až 18, faktor 2 za proměnnými 02, 03, 15 a 16, faktor 3 za 06, 08, 09 a 10 a faktor 4 za 07, 11 a 13. Pokud by faktory byly korelovány, byla by jejich znázornění propojena obloukem se šipkami na obou koncích. Protože náš model korelaci mezi faktory nepředpokládá, žádné takové propojení se v grafu nevyskytuje.
Pokud chceme výše uvedený model testovat, je třeba ho doplnit o chybové složky E1 až E18. Program AMOS dále vyžaduje určení alespoň jedné regresní váhy u každého faktoru. Tyto vstupní regresní váhy není třeba nijak přesně specifikovat, obvykle se stanovují jako 1 a slouží pouze jako měřítko pro odhad dalších parametrů modelu. První odhad modelu vypadá v grafickém znázornění následovně:
Test vhodnosti zvolené faktorové struktury dopadl pro tento model nedobře. Testové kritérium Chi-square = 211,107, pozorovaná hladina významnosti = 0,000. Nulovou hypotézu, že se původní korelační matice shoduje s korelační maticí odvozené na základě výše uvedeného modelu, tedy zamítáme. Je proto třeba výše uvedený model upravit. K tomu nám slouží modifikační tabulka, která ukazuje, kde jsou největší slabiny modelu. V tabulce je uveden vztah, který v současném modelu není obsažen a u něj ve sloupci M.I. hodnota, která ukazuje, o kolik minimálně poklesne Chi-Square, pokud by byl vztah do modelu zařazen. Sloupec Par Change je odhadem parametru u tohoto vztahu. V levé části tabulky jsou obousměrnými šipkami označeny korelace, jejichž zahrnutí do modelu by vedlo ke zlepšení modelu, v pravé části jsou uvedeny vztahy mezi manifestními proměnnými a faktory, které by bylo vhodné do modelu přidat.
Tab. 4 Modifikační tabulka
|
M.I |
Par Change |
|
M.I |
Par Change |
F2<-->F1 |
12,727 |
,125 |
v03<---F4 |
9,163 |
,520 |
E3<-->F4 |
9,163 |
,057 |
v03<---F1 |
7,014 |
,263 |
E3<-->F1 |
7,014 |
,052 |
v07<---F1 |
4,260 |
,133 |
E7<-->F1 |
4,260 |
,026 |
v11<---F1 |
5,984 |
,352 |
E7<-->E3 |
5,784 |
,029 |
v11<---F2 |
8,137 |
,308 |
E11<-->F1 |
5,984 |
,070 |
v14<---F4 |
6,177 |
,330 |
E11<-->F2 |
8,137 |
,138 |
v16<---F4 |
8,452 |
-,452 |
E18<-->E7 |
5,220 |
,028 |
v10<---F2 |
5,453 |
-,220 |
E12<-->E7 |
4,875 |
,033 |
v09<---F1 |
8,838 |
,279 |
E13<-->E2 |
4,917 |
,033 |
v09<---F2 |
6,365 |
,178 |
E14<-->F4 |
6,177 |
,036 |
v08<---F4 |
4,615 |
,364 |
E14<-->E3 |
4,054 |
,029 |
v08<---F2 |
9,895 |
,231 |
E14<-->E13 |
4,950 |
,023 |
v06<---F2 |
4,225 |
-,196 |
E16<-->F4 |
8,452 |
-,049 |
v01<---F4 |
4,449 |
,320 |
E16<-->E12 |
5,226 |
,048 |
v01<---F3 |
5,654 |
,165 |
E16<-->E13 |
7,549 |
-,034 |
v05<---F2 |
4,870 |
,184 |
E10<-->F2 |
5,453 |
-,099 |
|||
E9<-->F1 |
8,838 |
,055 |
|||
E9<-->F2 |
6,365 |
,080 |
|||
E9<-->E7 |
4,368 |
,024 |
|||
E9<-->E16 |
6,358 |
,041 |
|||
E8<-->F4 |
4,615 |
,040 |
|||
E8<-->F2 |
9,895 |
,104 |
|||
E8<-->E3 |
10,931 |
,061 |
|||
E8<-->E7 |
10,934 |
,040 |
|||
E8<-->E12 |
4,815 |
,050 |
|||
E8<-->E9 |
8,285 |
,050 |
|||
E6<-->F2 |
4,225 |
-,088 |
|||
E6<-->E12 |
5,431 |
-,069 |
|||
E1<-->F4 |
4,449 |
,035 |
|||
E1<-->F3 |
5,654 |
,069 |
|||
E1<-->E18 |
7,192 |
,045 |
|||
E5<-->F2 |
4,870 |
,083 |
V prvním kroku se omezíme na přidání korelační vazby mezi faktory F1 a F2, jejíž absence se ukazuje jako nejvíc model poškozující a jejíž zahrnutí do modelu nejvíce sníží Chi-Square. Výsledkem je následující grafické zobrazení modelu a nové výsledky testu.
Hodnota testového kriteria se sice snížila na hodnotu Chi-square = 193,7874738, pozorovaná hladina významnosti je ale nadále příliš nízká -
Probability level = ,0000061.
Tab. 5 Modifikační tabulka po první úpravě modelu
|
M.I |
Par Change |
|
M.I |
Par Change |
E3<-->F4 |
7,207 |
0,047 |
v03<---F4 |
7,207 |
0,477 |
E7<-->E3 |
4,633 |
0,026 |
v07<---F1 |
4,868 |
0,141 |
E11<-->F2 |
4,742 |
0,092 |
v011<---F1 |
6,435 |
0,360 |
E18<-->E7 |
5,085 |
0,028 |
v011<---F2 |
9,669 |
0,340 |
E12<-->E7 |
4,549 |
0,032 |
v014<---F4 |
5,142 |
0,316 |
E14<-->F4 |
5,142 |
0,031 |
v016<---F4 |
9,511 |
-0,510 |
E17<-->E2 |
4,152 |
-0,034 |
v010<---F2 |
5,793 |
-0,230 |
E16<-->F4 |
9,511 |
-0,050 |
v09<---F1 |
9,078 |
0,280 |
E16<-->E12 |
5,304 |
0,048 |
v09<---F2 |
9,560 |
0,221 |
E16<-->E13 |
7,806 |
-0,034 |
v08<---F2 |
9,360 |
0,228 |
E10<-->F2 |
4,037 |
-0,074 |
v01<---F4 |
4,246 |
0,331 |
E9<-->E7 |
4,470 |
0,024 |
v01<---F3 |
5,848 |
0,167 |
E9<-->E16 |
6,244 |
0,040 |
|||
E8<-->F2 |
9,280 |
0,088 |
|||
E8<-->E3 |
10,527 |
0,058 |
|||
E8<-->E7 |
11,364 |
0,041 |
|||
E8<-->E12 |
4,238 |
0,047 |
|||
E8<-->E9 |
8,285 |
0,050 |
|||
E6<-->E12 |
5,001 |
-0,067 |
|||
E1<-->F4 |
4,246 |
0,033 |
|||
E1<-->F3 |
5,848 |
0,070 |
|||
E1<-->E18 |
6,978 |
0,044 |
Je proto třeba provést další korekci modelu. Zadávat do modelu korelace mezi chybovými složkami, popřípadě i mezi chybovými složkami a faktory by sice teoreticky model zlepšilo (především zahrnutí korelací mezi chybovou složkou E8 se chybovými složkami E3 a E7), ale při interpretaci modelu by to přinášelo potíže. Proto se zdá vhodnější do modelu zanést další faktorové zátěže, tj. další vztahy manifestních proměnných k vysvětlovaným faktorům. Modifikační tabulka nabízí přidat mezi proměnné vysvětlující faktor 2, tj. faktor mé vlastní hodnoty ve smyslu výkonu proměnnou 11 Žít ve shodě se svojí náboženskou vírou a 09 Umět se prosadit, mít dobré nápady. My k nim přidáme ještě hodnoty 05 Pomáhat všude, kde je to potřeba a 12 Mít pocit, že jsem někomu užitečný, které měly při použití explorativní faktorové analýzy zátěže větší než 0,3. Dostáváme následující grafické zobrazení modelu s hodnotou testového kriteria Chi-square = 162,4743274 a významností
0,0010566. Tedy bohužel stále ještě nevyhovující model.
Tab. 6 Modifikační tabulka po druhé úpravě modelu
|
M.I |
Par Change |
|
M.I |
Par Change |
E3<-->F4 |
7,341 |
0,055 |
V03<---F4 |
7,341 |
0,385 |
E2<-->E3 |
5,305 |
0,047 |
V15<---F4 |
5,545 |
-0,295 |
E18<-->E7 |
5,076 |
0,027 |
V07<---F4 |
6,834 |
0,373 |
E17<-->E2 |
5,251 |
-0,039 |
V07<---F2 |
10,208 |
0,264 |
E16<-->F4 |
5,545 |
-0,042 |
V03<---F3 |
5,824 |
0,161 |
E16<-->E13 |
5,768 |
-0,028 |
|||
E8<-->F4 |
6,834 |
0,053 |
|||
E8<-->F2 |
10,598 |
0,075 |
|||
E8<-->E3 |
9,922 |
0,058 |
|||
E8<-->E7 |
10,816 |
0,039 |
|||
E8<-->E9 |
4,313 |
0,035 |
|||
E1<-->F3 |
5,824 |
0,070 |
|||
E1<-->E18 |
6,884 |
0,043 |
Jeho modifikační tabulka navrhuje do faktoru mé vlastní hodnoty ve smyslu výkonu (faktor2) zahrnout ještě proměnnou 07 Umět se o sebe postarat, být samostatný, která tam celkem logicky patří. Zřejmě se neobejdeme ani bez respektování skutečnosti, že chybová složka pro proměnnou 08 Být ve svém budoucím životě úspěšný je korelován se společným faktorem F2 a chybovou složkou pro proměnnou 07 Umět se o sebe postarat, být samostatný.
Po třetí úpravě modelu se konečně dostáváme nad jednoprocentní hladinu významnosti při testování shody našeho modelu s reálnými daty. Pozorovaná hladina významnosti činí 0,0263 při hodnotě testového kritéria Chi-square = 138,2735574. Jak by bylo možné model ještě více zlepšit, ukazuje modifikační tabulka 7.
Tab. 7 Modifikační tabulka po třetí úpravě modelu
|
M.I |
Par Change |
|
M.I |
Par Change |
E3<-->F4 |
4,461 |
0,039 |
V03<---F4 |
4,461 |
0,316 |
E2<-->E3 |
4,023 |
0,040 |
V15<---F4 |
8,319 |
-0,393 |
E18<-->E7 |
5,314 |
0,026 |
V03<---F3 |
5,768 |
0,158 |
E16<-->F4 |
8,319 |
-0,049 |
|||
E16<-->E13 |
5,722 |
-0,028 |
|||
E8<-->E3 |
4,277 |
0,034 |
|||
E1<-->F3 |
5,768 |
0,068 |
|||
E1<-->E18 |
6,837 |
0,043 |
|||
E5<-->F3 |
4,098 |
-0,072 |
|||
E5<-->E8 |
4,066 |
-0,038 |
Modifikační tabulka napovídá, že nejpřínosnější by bylo do faktoru 4, který jsme pojmenovali faktorem autonomie ve smyslu odpoutání se od vlastní rodiny, zahrnout i proměnnou 15 Být hrdý na zemi, kde jsem se narodil. Že by tu byl dán jakýsi signál toho, že člověk toužící po samostatnosti má přece jen potřebu jistého ukotvení? To, že si mladý člověk spojuje svoji samostatnost se snahou 03 Být vzdělaný je interpretačně méně náročné. Představa, že vzdělání pomůže člověku se osamostatnit je v naší společnosti dlouhodobě obecně přijímána. Co se týče faktoru 3 (materiální hodnoty), jeho sycení proměnnou 03 Být vzdělaný je také interpretačně nenáročné. Spojení vzdělání a materiálního prospěchu je v souvislosti s placením školného dlouhodobě medializováno. Do modelu zahrňme také propojení chybové složky proměnné 16 Naučit se poctivě pracovat se čtvrtým faktorem. Ostatní navržené úpravy opomiňme a přistupme, teď už doufejme k poslední modifikaci modelu.
Výsledky analýzy dat dávají konečně uspokojivé výsledky. Testové kritérium Chi-square = 122,3482712, jeho pozorovaná hladina významnosti
= ,1056726, překračuje tedy 5%. Model zobrazený na obr. 8 lze tedy pokládat za vhodný.