Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Valiidsus ja reliaablus

Andu Rämmer
2014

Kui iseloomustatakse uuringutes andmetekogumise tõesust ja täpsust, räägitakse eelkõige psühholoogiliste uuringute kontekstis valiidsusest ja reliaablusest (Elmes, Kantowitz ja Roediger, 2013). Valiidsus ehk kehtivus viitab eelkõige uuringutulemuste sisulisele täpsusele ja õigsusele, aga selle all peetakse silmas ka andmetekogumiseks loodud konstrukti määratlemise õigsust ja kehtivust. Reliaablus ehk usaldusväärsus viitab eelkõige eksperimenditulemuste korratavusele, järeldav statistika võimaldab teha kindlaks, kui suure tõenäosusega on tulemus korratav.

Valiidsuse ja reliaabluse vahekorda kirjeldab Babbiele (2010) anonüümse retsensendi soovitatud metafoorne joonis 1, kus märklauda tabanud lasud esindavad kordusmõõtmisi.

reliaabne_joonis_1.png

Joonis 1. Reliaablus ja valiidsus, allikas: Validity and reliability, n.d.

Elmes jt (2013) rõhutavad, et valiidsuse puhul on tegemist keerulise nähtusega, mille puhul eristatakse ennustavat, konstrukti-, välist ning sisemist valiidsust. Babbie (2010) toob välja ka ilmse ehk näiva valiidsuse.

Ilmne ehk näiv valiidsus osutab sellele, kui suurel määral vastavad uurimisel kasutatavad mõõtmisvahendid uuritavale nähtusele. Näiteks ütlevad tööliste kaebused midagi nende töömoraali kohta – kui palju täpselt, on juba raskem öelda. Küll aga ei ütle töömoraali kohta midagi erilist see, kui sageli nad raamatukogus käivad. Ilmne valiidsus on indeksite ja skaalade moodustamisel indikaatorite valiku esimene kriteerium.

Ennustav valiidsus näitab, kui palju sõltub mõõtmisvahendi olemusest. Ta osutab mõõtmisstandardi seosele mingi teise kriteeriumiga (nt missugune seos on ülikooli vastuvõtul kasutatava akadeemilise võimekuse testi skooril mingi aine keskmise hindega esimesel kursusel; kui palju ennustab liiklustest tegelikku sõiduoskust jms).

Konstruktivaliidsus põhineb uuritava muutuja seostel teiste muutujatega. Ta näitab, kas ja kui täpselt uurija loodud instrument mõõdab uuritavat nähtust, mille mõõtmiseks ta on loodud, ehk kuivõrd õigesti muutujad uuritavat käitumist peegeldavad või mõõdavad. Nt kui eeldame, et rahulolevad paarid ei valeta teineteisele, kuid kui nad siiski seda teevad, siis oleme oma konstrukti valesti koostanud, sest ta pole kuigi valiidne.

Väline ehk ökoloogiline valiidsus näitab, kuivõrd saab ühe uuringu tulemusi üldistada teistsugustele olukordadele ja populatsioonidele, nt kas üliõpilaste uuringus avaldunud väärtushinnangud on omaks võetud ka teistes elanikkonnagruppides.

Sisemine valiidsus osutab muutujatevahelisele põhjuslikule seosele. Sisemiselt valiidse uuringu korral on muutused sõltuvas muutujas põhjustatud muutus(t)est sõltumatus muutujas. Uuring ei ole sisemiselt valiidne, kui muutuste allikaks on miski muu peale sõltumatu muutuja. Nt korrektselt katseplaani järgivad eksperimendid on põhimõtteliselt sisemiselt valiidsed, sest muutujate põhjuslikkuse suund on teada. Matemaatiliste võimete test ei tohi haarata ainult liitmist, vaid peab hõlmama ka lahutamist, jagamist ja korrutamist.

Reliaablus ehk usaldusväärsus viitab mõõtmistäpsusele ehk mõõtmiste järjekindlusele. Küsimus seisneb selles, kui palju erineb sama tehnikat kasutades kordusmõõtmise tulemus. Reliaablus sõltub väga palju ka mõõtmisinstrumendist, nt kaalu silma järgi hindamine on vähem reliaabel meetod kui kaalu kasutamine. Samas tuleb kontrollida ka kaalu häälestatust. Reliaabluse suurendamiseks püütakse võrreldavaid uuringuid viia läbi täpselt samadel tingimustel. Psühholoogias kontrollitakse reliaablusega ka mõõtmisvahendi või testi järjekindlust. Selleks arvutatakse kas korrelatsioon ühe katsealuse kahe mõõtmiskorra skooride vahel (kordustesti reliaablus), ühe ja sama testi kahe alternatiivse versiooni tulemuste vahel (paralleeltesti reliaablus) või kahe testipoole skooride vahel (poolitusmeetod). Oluline on ka ajategur – mida lähedasemad on kaks mõõtmist teineteisele ajaliselt, seda tõenäolisem on sarnasus mõõtmistulemustes. Intelligentsuse uurimisel hinnatakse testi reliaablust kordustestimisega, testi paralleelversioonide kasutamise ja testi poolitamisega. Psühhomeetrias on testi sisereliaabluse mõõduks Cronbachi α (alfa), mille piisavaks suuruseks loetakse 0,7.

Babbie, E. (2010). The practice of social research. Belmont: Wadsworth Publishing.

Elmes, D. G., Kantowitz, B. H., ja Roediger, H. L. (2013). Psühholoogia uurimismeetodid. Tartu: Tartu Ülikooli Kirjastus.

Tooding, L.-M. (2007). Andmete analüüs ja tõlgendamine sotsiaalteadustes. Tartu: Tartu Ülikooli Kirjastus.

Validity and reliability. (n.d.). Kättesaadav internetist: https://explorable.com/validity-and-reliability