Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Faktoranalüüs

Liina-Mai Tooding
2014

Faktoranalüüs on meetod suure hulga tunnuste omavahelise seose esiletoomiseks neid mõjutavate varjatud ehk latentsete tunnuste varal. Leitakse esialgsest palju väiksem komplekt tunnuseid, mistõttu meetodit iseloomustatakse ka kui informatsiooni kokkusurumise meetodit. Lähteks on tunnustevaheline korrelatsioonseos ja seetõttu sobib meetod tunnuste korral, mille skaalat võime tõlgendada arvulisena.

Millal kasutada faktoranalüüsi? Üldine vastus sellele lihtsale küsimusele oleks:

kui uurimisobjekti teoreetiline alus on endale piisavalt hästi selgeks tehtud;
kui on kahtlusi selles, kas oskame mõõta ühe-kahe tunnusega seda, mida tahame mõõta;
kui on kasutada küllalt suur hulk arvulisena tõlgendatavaid tunnuseid ühe ja sama omaduse mõõtmiseks ja need tunnused on omavahel mingi mustri kohaselt korreleeritud;
kui tunneme hästi faktoranalüüsi ideed ja tehnikat.

Faktoranalüüsi peatüki lugejale peaksid olema tuttavad andmeanalüüsi alused: variatiivsus (dispersioon), keskmine, korrelatsioonseos, lineaarse mudeli idee.

Kui faktoranalüüsi aluseks on tunnustevaheline korrelatsioonimaatriks, siis tekib küsimus, miks mitte selle hästi arusaadava kokkuvõttega piirdudagi. Vaatleme selle võimalikkust näite varal. Tabelites 1–5 on esitatud korrelatsioonimaatriksi andmed Euroopa sotsiaaluuringu viiest mõõtmisvoorust poliitiliste institutsioonide usaldusastme kohta Eestis, kokku igaühes seitse tunnust. Tunnuste tähenduse ja andmetega on võimalik tutvuda aadressilt http://www.yti.ut.ee/et/euroopa-sotsiaaluuring lähtudes. Võib arvata, et nendes hinnangutes peitub mingi üldisem vaade institutsioonidele, mis peegeldub korrelatsioonide mustris. Püüame seda mustrit üles leida ja „ilmutada“ need üldisemalt usaldust väljendavad omadused. Lugeja võib esmalt kõigi korrelatsioonimaatriksite detailse uurimise vahele jätta, piirdudes ainult ühega, nt 2012. aasta andmetega, ja tulla hiljem asjasse süvenenult tagasi. Sissejuhatuseks võiks jälgida ühe äramärgitud korrelatsioonikordaja ehk ühe tunnuspaari sisese seose muutusi aja jooksul.

Ülevaade faktoranalüüsist on üles ehitatud nii, et esmalt on päris pikalt esitatud põhimõtteid ja mõisteid ning näide nende kohta tuleb alles päris lõpus. Seepärast on soovitatav näiteni jõudmisel ja vastava mõiste kohaste arvude nägemisel lehitseda teksti ka ettepoole, et „teoreetilist“ osa veel kord üle vaadata. Näite sissepikkimine põhimõtetesse oleks lõppeesmärgi silme eest ära viinud ja selleni seletustes jõudmine oleks läinud väga pikale.

Sissejuhatuseks olgu öeldud veel see, et tänapäevased struktuurivõrrandite mudelid (vt nt Niels Blunchi „Introduction to Structural Equation Modeling Using IBM SPSS Statistics and Amos“, 2012 Sage Publ. Inc.) katavad suures osas tegevused ja ülesanded, mis moodustavad faktoranalüüsi ja selle rakendused, olles abiks veel palju laiemagi ülesannete klassi puhul. Faktoranalüüs sai alguse psühhomeetriast ja faktoranalüüsi peensusteni viidud parimad näited leiabki sellest vallast. Meetod on armastatud psühholoogias tervikuna.

Institutsioonide usaldusastme näide hõlmab seitsme tunnuse omavahelisi korrelatsioonseoseid viiel aastal. Tunnused on mõõdetud skaalal 0 (ei usalda) kuni 10 (täielik usaldus). See on väga mahukas info, mis ärgitab püstitama suurt hulka uurimisküsimusi. Milline on seose üldine tase ja kas see on aja jooksul nõrgenenud või tugevnenud? Mis hinnangud on omavahel tugevamini, mis nõrgemini korreleeritud? Kas usaldushinnangud on omavahel korreleeritud ühe ja sama mustri kohaselt, kui aastaid kõrvutada? Seda küsimuste rida võiks pikendada, kuid kõigile neile leiame omal kombel vastuse faktoranalüüsi kasutades. Uurige esmalt tabeleid 1–5 ja püüdke n-ö palja silmaga kujundada teatav arusaam usaldushinnangutevahelisest seosest. Paneme ka tähele, et kahjuks on korrelatsioonikordajale vastavas valimimahus päris suured kõikumised. See tekitab küsimuse, kuidas toimida edaspidi lünklike indiviididega. Et meid huvitavad hinnangud seitsme tunnuse alusel korraga, siis oleks põhimõtteliselt õigem piirduda nendega, kelle täielik seisukoht on teada. Teisalt kaotame niiviisi teatud hulga informatsiooni ja lisaks sellele tekib küsimus, kas andmeisse tekib seeläbi esindavuse nihe.

Tabel 1. Usaldus institutsioonide suhtes 2004. Allikas: Euroopa sotsiaaluuring 2004, Eesti