Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Valiidsus ja reliaablus

Andu Rämmer
2014, täiendatud ja parandatud 2025

Teaduslike uuringute puhul on väga oluline hinnata nende kvaliteeti, mis sõltub kasutatud andmete täpsusest. Andmete kogumisel tuleb pöörata tähelepanu selle protseduuri täpsusele, korratavusele ja usaldusväärsusele. Uuringutes andmetekogumise metoodika sobivust ja täpsust iseloomustades räägitakse nii psühholoogiliste kui ka sotsioloogiliste uuringute kontekstis valiidsusest ja reliaablusest (Babbie, 2021; Elmes jt, 2013). Valiidsus ehk kehtivus viitab eelkõige uuringutulemuste sisulisele täpsusele ja õigsusele (kuivõrd mõõdame seda, mida arvame mõõtvat), aga selle all peetakse silmas ka andmete kogumiseks loodud konstrukti määratlemise õigsust ja kehtivust. Reliaablus ehk usaldusväärsus viitab kordusuuringutes saadud tulemuste järjekindlusele. Järeldav statistika võimaldab teha kindlaks, kui suure tõenäosusega on ühe uuringuga saadud tulemused korratavad järgmises rangelt sama protseduuri järgivas uuringus.

Valiidsuse ja reliaabluse vahekorda visualiseerib Babbie’l (2021) põhinev joonis 1, kus märklauda tabanud lasud tähistavad kordusmõõtmisi.

*Joonis 1. Reliaablus ja valiidsus (Babbie, 2021 põhjal)*

Valiidsus kujutab endast mõõtmisvahendi sobivust ehk seda, kas me mõõdame oma uuringus tõepoolest seda, mida mõõta soovime. Elmes jt (2013) rõhutavad, et valiidsuse puhul on tegemist keerulise nähtusega, mille puhul eristatakse ennustavat, konstrukti-, välist ning sisemist valiidsust. Babbie (2021) toob välja ka ilmse ehk näiva valiidsuse.

Ilmne ehk näiv valiidsus osutab sellele, kui suurel määral mõõdavad uurimisel kasutatavad uurimisinstrumendid uuritavat nähtust. Näiteks ütleb tööliste rahulolematus midagi nende töösse suhtumise kohta – kui palju täpselt, seda on juba raskem öelda. Küll aga ei ütle tööliste töömoraali kohta midagi olulist see, kui sageli nad raamatukogus käivad. Ilmne valiidsus on indeksite ja skaalade moodustamisel indikaatorite valiku esimene kriteerium. Kuigi subjektiivsuse tõttu peetakse näivat valiidsust sageli valiidsuse kõige nõrgemaks vormiks, võib see olla kasulik täpsemate mõõdikute valikul uurimismeetodi väljatöötamise algfaasis.

Ennustav valiidsus näitab, kui palju suudab mõõtmisvahend prognoosida potentsiaalseid uurimistulemusi. See osutab mõõtmisstandardi seosele mingi teise kriteeriumi variatiivsusega, näiteks missugune seos on ülikooli vastuvõtul kasutatava akadeemilise võimekuse testi tulemusel mingi aine keskmise hindega esimesel kursusel; kui palju ennustab liiklustest tegelikku sõiduoskust jms.

Konstruktivaliidsus põhineb uuritava muutuja seostel teiste muutujatega. See näitab, kas ja kui täpselt uurija loodud instrument uuritavat nähtust mõõdab. Konstruktivaliidsus näitab, mil määral on mõõtmised kooskõlas uurijatele teadaolevate teooriate või nende tähelepanekute alusel loodud uuritava konstruktsiooni teoreetilise tähenduse ja kontseptualiseerimisega. Teisisõnu, kui hästi peegeldavad uuritavat käitumist selle variatiivsuse mõõtmiseks valitud muutujad? Näiteks kui eeldame, et suhtega rahulolevad paarid ei valeta teineteisele, kuid kui nad seda siiski teevad, siis oleme oma konstrukti valesti koostanud, mis tähendab, et see pole kuigi valiidne ega sobi paarisuhtega rahulolu mõõtmiseks.

Väline ehk „ökoloogiline“ valiidsus näitab, kuivõrd saab ühe uuringu tulemusi üldistada teistsugustele olukordadele ja populatsioonidele, näiteks kas esmalt õpilaste uuringus avaldunud muutused väärtushinnangutes on hilisemalt omaks võetud ka vanemates elanikkonnagruppides.

Sisemine ehk teoreetiline valiidsus osutab muutujatevahelisele põhjuslikule seosele. Sisemiselt valiidse uuringu korral on muutused sõltuvas muutujas põhjustatud muutus(t)est sõltumatus muutujas. Uuring ei ole sisemiselt valiidne, kui muutuste allikaks on miski muu peale sõltumatu muutuja. Näiteks on korrektselt katseplaani järgivad eksperimendid põhimõtteliselt sisemiselt valiidsed, sest sõltumatu ja sõltuva muutuja põhjuslikkuse suund on kindlaks määratud. Sellise loogika järgi võib uurida õppimisele kulutatud aja (mille pikkust saab mõõta näiteks stopperiga) mõju õppeedukusele (mida saab mõõta koolihinnetega). Ka matemaatiliste võimete testi koostamisel peab silmas pidama, et see ei haaraks ainult liitmist, vaid hõlmaks proportsionaalselt ka lahutamist, jagamist ja korrutamist.

Reliaablus kujutab endast mõõtmisvahendi usaldusväärsust ja mõõtmistäpsust. Sel puhul hinnatakse samasuguse metoodikaga kogutud andmete konsistentsust (kokkukuuluvust) ehk uurimistulemuste järjepidevust. Seega on reliaablus kordusuuringute usaldusväärsus, mis viitab kordusmõõtmiste täpsusele, sest tegemist on mõõtmiste järjekindluse näitajaga. Kokkuvõtlikult öeldes seisneb reliaabluse olemus selles, kas saame sama lähenemist kasutades sama nähtuse kordusmõõtmisel sõltumatult andmete kogumise ajast ja uurijast samasuguse tulemuse. Reliaablus sõltub väga palju ka mõõtmisinstrumendist, näiteks inimese kehakaalu silma järgi hindamine on vähem reliaabel (usaldusväärne) meetod, kui kasutada selle välja selgitamiseks analoog- või digitaalset kaalu. Seejuures tuleb kontrollida ka kaalu taadeldust. Reliaabluse suurendamiseks püütakse uusi (kordus)andmeid koguda täpselt samasugustes tingimustes.

Psühholoogias kontrollitakse reliaablusega ka mõõtmisvahendi või testi järjekindlust. Selleks arvutatakse kas korrelatsioon ühe katsealuse kahe mõõtmiskorra skooride vahel (kordustesti reliaablus), ühe ja sama testi kahe alternatiivse versiooni tulemuste vahel (paralleeltesti reliaablus) või kahe testipoole skooride vahel (poolitusmeetod). Sotsioloogilistes küsitlustes jagatakse küsimustiku reliaabluse kontrollimiseks uuringus osalejate valim pooleks (või mitmeks väiksemaks rühmaks). Iga rühm vastab ühte ja sama teemat käsitlevale küsimustikule, kuid rühmadele esitatakse teatud määral erinevaid teemasid puudutavaid küsimusi. Näiteks uuriti suhtumist uutesse biotehnoloogiatesse käsitlevas Eurobaromeetri küsitluses poole valimi hoiakuid geneetiliselt muundatud toiduainete suhtes ja teise poole hinnanguid toiduainetööstuse jaoks koduloomade kloonimise kohta. Aeg on sellistes uuringutes oluline tegur – mida lühema ajalise vahega kaks mõõtmist teineteisele järgnevad, seda tõenäolisem on see, et mõõtmistulemused on sarnased. Väga keeruline on reliaabluse saavutamine abstraktsete, raskesti hoomatavate teemade uurimisel. Näiteks on inimese kehakaalu mõõtmisest tunduvalt keerulisem tema intelligentsuse mõõtmine. Seetõttu hinnatakse intelligentsustesti reliaablust tavaliselt nii kordustestimisega, testi paralleelversioonide kasutamise kui ka testi poolitamisega. Mõõtevahendite koostamise ja mõõtmisprotseduuride väljatöötamisega tegelevas psühhomeetrias on testi sisereliaabluse mõõduks Cronbachi α (alfa), mille piisavaks suuruseks loetakse 0,7.

Babbie, E. (2021). The practice of social research. Belmont: Wadsworth Publishing.

Elmes, D. G., Kantowitz, B. H. ja Roediger, H. L. (2013). Psühholoogia uurimismeetodid. Tartu: Tartu Ülikooli Kirjastus.

Lagerspetz, M. (2021/2017). Ühiskonna uurimise meetodid: sissejuhatus ja väljajuhatus. Tallinn: Tallinna Ülikooli Kirjastus.

Rubin, A. ja Babbie, E. (2017). Research methods for social work. Boston: Cengage Learning.

Tooding, L.-M. (2015). Andmete analüüs ja tõlgendamine sotsiaalteadustes. Tartu: Tartu Ülikooli Kirjastus.

Sotsiaalse Analüüsi Meetodite ja Metodoloogia õpibaas

Valiidsus ja reliaablus

Valiidsus

Reliaablus

Kasutatud kirjandus

Soovitatav kirjandus