UNIVERZITA KARLOVA - PEDAGOGICKÁ FAKULTA

Konfirmativní faktorová analýza

Explorativní faktorová analýza se vymyká nejobvyklejší statistické proceduře založené na testování hypotéz. Její výsledky jsou nejednoznačné. Na jejím počátku nebývá stanoven počet faktorů. Nadto existuje celá škála metod pro extrakci faktorů. Přitom v mnoha výzkumných úkolech jsou už dopředu stanoveny hypotézy o počtu a povaze faktorů. V takových případech je mnohem vhodnější použít konfirmativní faktorovou analýzu. Konfirmativní faktorová analýza by ale měla být používána i tam, kde neznáme povahu proměnných natolik, abychom byli schopni hypotézy o počtu a povaze faktorů stanovit. V tom případě bychom měli použít explorativní faktorovou analýzu pro předběžné posouzení faktorové struktury, poté stanovit hypotézy o počtu a povaze faktorů a ty následně ověřovat za pomoci konfirmativní faktorové analýzy.

Protože každý problém má přinejmenším dvě stránky, je potřeba rovněž přiznat, že i postup konfirmativní faktorové analýzy není naprosto jednoznačný. I tady existuje několik metod, které lze při ověřování faktorové struktury použít. Obdobně jako u explorativní faktorové analýzy to jsou metoda maximální věrohodnosti, zobecněná metoda nejmenších čtverců a další. Nicméně proces konfirmativní faktorové analýzy je vždy zakončen statistickým testem hypotézy o vhodnosti zvolené faktorové struktury. Konkrétně jde o test shody původní korelační matice s korelační maticí odvozené na základě předpokladu, že manifestní proměnné jsou námi specifikovanou lineární kombinací faktorů. V tomto statistickém testu spočívá přednost konfirmativní faktorové analýzy. Námitka, že i některé metody explorativní faktorové analýzy jsou doprovázeny testem shody s faktorovým modelem, bývá odmítána s tím, že výzkumný pracovník pracující s mnohorozměrnými daty by měl znát důvody, proč je chce měřit, tj. znát cíle svého výzkumu.

Konfirmativní faktorová analýza na rozdíl od explorativní pracuje stejně často s kovariancemi jako s korelacemi. Tento text se stejně jako u explorativní faktorové analýzy omezí na analýzu korelačních koeficientů. Nespornou výhodou  konfirmativní faktorové analýzy je skutečnost, že můžeme předepsat i korelace mezi faktory. Existují dvě základní možnosti, jak zadat strukturu faktorů a korelace mezi faktory - tabulka a graf. Pokud bychom pomocí faktorové analýzy chtěli ověřit výsledky explorativní faktorové analýzy dané tab. 2, můžeme strukturu faktorů zadat následovně:

Tab. 3 Předpis matice faktorových zátěží a korelační matice faktorů

 

F1

F2

F3

F4

 

F1

F2

F3

01 Žít ve správně rodině

0

0

0

0

F1

1

0

0

02 Žít ve zdravém životním prostředí

0

1

0

0

F2

0

1

0

03 Být vzdělaný, mít velké znalosti

0

1

0

0

F3

0

0

1

04 Hodně cestovat, poznávat různé země

0

0

0

0

05 Pomáhat všude, kde je potřeba

1

0

0

0

06 Dobře vypadat, mít pěkný osobní vzhled

0

0

1

0

07 Umět se o sebe postarat, být samostatný

0

0

0

1

08 Být ve svém budoucím životě úspěšný

0

0

1

0

09 Umět se prosadit, mít dobré nápady

0

0

1

0

10 Žít v blahobytu, mít hodně peněz

0

0

1

0

11 Žít ve shodě se svojí náboženskou vírou

0

0

0

0

12 Mít pocit, že jsem někomu užitečný

1

0

0

0

13 Najít si dobrého životního partnera

1

0

0

0

14 Být tolerantní, žít v dobrém vztahu s lidmi

1

0

0

0

15 Být hrdý na zemi, kde jsem se narodil

1

1

0

0

16 Naučit se poctivě pracovat,odevzdávat co nejlepší výkon

1

1

0

0

17 Chovat se vždy tak, aby si mne lidé vážili

1

0

0

0

18 Nemít velké zdravotní problémy

0

0

0

0

Tab. 3 má dvě části. Levá popisuje testovanou hypotézu, že 18 pozorovaných proměnných lze vysvětlit čtyřmi faktory a udává matici faktorových zátěží za pomoci tzv. strukturních nul, které představují, které faktorové zátěže lze pokládat za nulové. Na místě hodnot 1 se naopak předpokládá vysoká faktorová zátěž.

Pravá část tabulky znázorňuje obdobně korelace mezi faktory. Pokud jsou v této části tabulky jedničky pouze na diagonále, znamená to nekorelovanost faktorů.

Grafické znázornění struktury faktorů a korelace mezi faktory dává obr. 3. Pozorované proměnné mají tvar obdélníku, faktory tvar elipsy. Struktura faktorů je znázorněna šipkami směřujícími od faktorů směrem k pozorovaným proměnným. Graf ukazuje, že faktor 1 stojí za proměnnými 01, 05 a 12 až 18, faktor 2 za proměnnými 02, 03, 15 a 16, faktor 3 za 06, 08, 09 a 10 a faktor 4 za 07, 11 a 13. Pokud by faktory byly korelovány, byla by jejich znázornění propojena obloukem se šipkami na obou koncích. Protože náš model korelaci mezi faktory nepředpokládá, žádné takové propojení se v grafu nevyskytuje.

Pokud chceme výše uvedený model testovat, je třeba ho doplnit o chybové složky E1 až E18. Program AMOS dále vyžaduje určení alespoň jedné regresní váhy u každého faktoru. Tyto vstupní regresní váhy není třeba nijak přesně specifikovat, obvykle se stanovují jako 1 a slouží pouze jako měřítko pro odhad dalších parametrů modelu. První odhad modelu vypadá v grafickém znázornění následovně:

Test vhodnosti zvolené faktorové struktury dopadl pro tento model nedobře. Testové kritérium Chi-square = 211,107, pozorovaná hladina významnosti = 0,000. Nulovou hypotézu, že se původní korelační matice shoduje s korelační maticí odvozené na základě výše uvedeného modelu, tedy zamítáme. Je proto třeba výše uvedený model upravit. K tomu nám slouží modifikační tabulka, která ukazuje, kde jsou největší slabiny modelu. V tabulce je uveden vztah, který v současném modelu není obsažen a u něj ve sloupci M.I. hodnota, která ukazuje, o kolik minimálně poklesne Chi-Square, pokud by byl vztah do modelu zařazen. Sloupec Par Change je odhadem parametru u tohoto vztahu. V levé části tabulky jsou obousměrnými šipkami označeny korelace, jejichž zahrnutí do modelu by vedlo ke zlepšení modelu, v pravé části jsou uvedeny vztahy mezi manifestními proměnnými a faktory, které by bylo vhodné do modelu přidat.

Tab. 4 Modifikační tabulka

 

M.I

Par  Change

 

M.I

Par  Change

F2<-->F1

12,727

,125

v03<---F4

9,163

,520

E3<-->F4

9,163

,057

v03<---F1

7,014

,263

E3<-->F1

7,014

,052

v07<---F1

4,260

,133

E7<-->F1

4,260

,026

v11<---F1

5,984

,352

E7<-->E3

5,784

,029

v11<---F2

8,137

,308

E11<-->F1

5,984

,070

v14<---F4

6,177

,330

E11<-->F2

8,137

,138

v16<---F4

8,452

-,452

E18<-->E7

5,220

,028

v10<---F2

5,453

-,220

E12<-->E7

4,875

,033

v09<---F1

8,838

,279

E13<-->E2

4,917

,033

v09<---F2

6,365

,178

E14<-->F4

6,177

,036

v08<---F4

4,615

,364

E14<-->E3

4,054

,029

v08<---F2

9,895

,231

E14<-->E13

4,950

,023

v06<---F2

4,225

-,196

E16<-->F4

8,452

-,049

v01<---F4

4,449

,320

E16<-->E12

5,226

,048

v01<---F3

5,654

,165

E16<-->E13

7,549

-,034

v05<---F2

4,870

,184

E10<-->F2

5,453

-,099

 

E9<-->F1

8,838

,055

E9<-->F2

6,365

,080

E9<-->E7

4,368

,024

E9<-->E16

6,358

,041

E8<-->F4

4,615

,040

E8<-->F2

9,895

,104

E8<-->E3

10,931

,061

E8<-->E7

10,934

,040

E8<-->E12

4,815

,050

E8<-->E9

8,285

,050

E6<-->F2

4,225

-,088

E6<-->E12

5,431

-,069

E1<-->F4

4,449

,035

E1<-->F3

5,654

,069

E1<-->E18

7,192

,045

E5<-->F2

4,870

,083

V prvním kroku se omezíme na přidání korelační vazby mezi faktory F1 a F2, jejíž absence se ukazuje jako nejvíc model poškozující a jejíž zahrnutí do modelu nejvíce sníží Chi-Square. Výsledkem je následující grafické zobrazení modelu a nové výsledky testu.

Hodnota testového kriteria se sice snížila na hodnotu Chi-square = 193,7874738, pozorovaná hladina významnosti je ale nadále příliš nízká -
Probability level = ,0000061.

Tab. 5 Modifikační tabulka po první úpravě modelu

 

M.I

Par  Change

 

M.I

Par  Change

E3<-->F4

7,207
0,047

v03<---F4

7,207
0,477

E7<-->E3

4,633
0,026

v07<---F1

4,868
0,141

E11<-->F2

4,742
0,092

v011<---F1

6,435
0,360

E18<-->E7

5,085
0,028

v011<---F2

9,669
0,340

E12<-->E7

4,549
0,032

v014<---F4

5,142
0,316

E14<-->F4

5,142
0,031

v016<---F4

9,511
-0,510

E17<-->E2

4,152
-0,034

v010<---F2

5,793
-0,230

E16<-->F4

9,511
-0,050

v09<---F1

9,078
0,280

E16<-->E12

5,304
0,048

v09<---F2

9,560
0,221

E16<-->E13

7,806
-0,034

v08<---F2

9,360
0,228

E10<-->F2

4,037
-0,074

v01<---F4

4,246
0,331

E9<-->E7

4,470
0,024

v01<---F3

5,848
0,167

E9<-->E16

6,244
0,040

E8<-->F2

9,280
0,088

E8<-->E3

10,527
0,058

E8<-->E7

11,364
0,041

E8<-->E12

4,238
0,047

E8<-->E9

8,285
0,050

E6<-->E12

5,001
-0,067

E1<-->F4

4,246
0,033

E1<-->F3

5,848
0,070

E1<-->E18

6,978
0,044

Je proto třeba provést další korekci modelu. Zadávat do modelu korelace mezi chybovými složkami, popřípadě i mezi chybovými složkami  a faktory by sice teoreticky model zlepšilo (především zahrnutí korelací mezi chybovou složkou E8 se chybovými složkami E3 a E7), ale při interpretaci modelu by to přinášelo potíže. Proto se zdá vhodnější do modelu zanést další faktorové zátěže, tj. další vztahy manifestních proměnných k vysvětlovaným faktorům. Modifikační tabulka nabízí přidat mezi proměnné vysvětlující faktor 2, tj. faktor mé vlastní hodnoty ve smyslu výkonu proměnnou 11 Žít ve shodě se svojí náboženskou vírou a 09 Umět se prosadit, mít dobré nápady. My k nim přidáme ještě hodnoty 05 Pomáhat všude, kde je to potřeba a 12 Mít pocit, že jsem někomu užitečný, které měly při použití explorativní faktorové analýzy zátěže větší než 0,3. Dostáváme následující grafické zobrazení modelu s hodnotou testového kriteria Chi-square = 162,4743274 a významností
0,0010566. Tedy bohužel stále ještě nevyhovující model.
 

Tab. 6 Modifikační tabulka po druhé úpravě modelu

 

M.I

Par  Change

 

 

M.I

Par Change

E3<-->F4

7,341
0,055

V03<---F4

7,341
0,385

E2<-->E3

5,305
0,047
V15<---F4
5,545
-0,295

E18<-->E7

5,076
0,027

V07<---F4

6,834
0,373

E17<-->E2

5,251
-0,039

V07<---F2

10,208
0,264

E16<-->F4

5,545
-0,042

V03<---F3

5,824
0,161

E16<-->E13

5,768
-0,028

E8<-->F4

6,834
0,053

E8<-->F2

10,598
0,075

E8<-->E3

9,922
0,058

E8<-->E7

10,816
0,039

E8<-->E9

4,313
0,035

E1<-->F3

5,824
0,070

E1<-->E18

6,884
0,043

Jeho modifikační tabulka navrhuje do faktoru mé vlastní hodnoty ve smyslu výkonu (faktor2) zahrnout ještě proměnnou 07 Umět se o sebe postarat, být samostatný, která tam celkem logicky patří. Zřejmě se neobejdeme ani bez respektování skutečnosti, že chybová složka pro proměnnou 08 Být ve svém budoucím životě úspěšný je korelován se společným faktorem F2 a chybovou složkou pro proměnnou 07 Umět se o sebe postarat, být samostatný.

Po třetí úpravě modelu se konečně dostáváme nad jednoprocentní hladinu významnosti při testování shody našeho modelu s reálnými daty. Pozorovaná hladina významnosti činí 0,0263 při hodnotě testového kritéria Chi-square = 138,2735574. Jak by bylo možné model ještě více zlepšit, ukazuje modifikační tabulka 7.

Tab. 7 Modifikační tabulka po třetí úpravě modelu

 

M.I

Par  Change

 

 

M.I

Par Change

E3<-->F4

4,461
0,039

V03<---F4

4,461
0,316

E2<-->E3

4,023
0,040

V15<---F4

8,319
-0,393

E18<-->E7

5,314
0,026

V03<---F3

5,768
0,158

E16<-->F4

8,319
-0,049

E16<-->E13

5,722
-0,028

E8<-->E3

4,277
0,034

E1<-->F3

5,768
0,068

E1<-->E18

6,837
0,043

E5<-->F3

4,098
-0,072

E5<-->E8

4,066
-0,038

Modifikační tabulka napovídá, že nejpřínosnější by bylo do faktoru 4, který jsme pojmenovali faktorem autonomie ve smyslu odpoutání se od vlastní rodiny, zahrnout i proměnnou 15 Být hrdý na zemi, kde jsem se narodil. Že by tu byl dán jakýsi signál toho, že člověk toužící po samostatnosti má přece jen potřebu jistého ukotvení? To, že si mladý člověk spojuje svoji samostatnost se snahou 03 Být vzdělaný je interpretačně méně náročné. Představa, že vzdělání pomůže člověku se osamostatnit je v naší společnosti dlouhodobě obecně přijímána. Co se týče faktoru 3 (materiální hodnoty), jeho sycení proměnnou 03 Být vzdělaný je také interpretačně nenáročné. Spojení vzdělání a materiálního prospěchu je v souvislosti s placením školného dlouhodobě medializováno. Do modelu zahrňme také propojení chybové složky proměnné 16 Naučit se poctivě pracovat se čtvrtým faktorem. Ostatní navržené úpravy opomiňme a přistupme, teď už doufejme k poslední modifikaci modelu.


Výsledky analýzy dat dávají konečně uspokojivé výsledky. Testové kritérium Chi-square = 122,3482712, jeho pozorovaná hladina významnosti
 = ,1056726, překračuje tedy 5%. Model zobrazený na obr. 8 lze tedy pokládat za vhodný.