Teadusandmete otsing

Andmeregistrid

Andmeregistritest on võimalik otsida andmekogusid ilma, et peaks enne otsima repositooriumi. On olemas mitu andmeregistrit, portaali ja otsimootorit, mis metaandmete alusel andmekogud repositooriumidest üles leiavad. 

DataCite Search

DataCite on mittetulundusühing, mis registreerib andmekogude metaandmed ja väljastab andmekogudele DOI. Just selle organisatsiooni kaudu saavad ka Eesti teadlased oma andmekogudele DOI. Eesti suuremad kõrgkoolid on moodustanud konsortsiumi DataCite Eesti, et oma teadlastele seda teenust pakkuda. 

DataCite’i registrist on võimalik otsida teadusandmeid, publikatsioone, tarkvara, organisatsioone, repositooriume jm, alustades DataCite Commons lehelt.

DC Commons

 

Otsingusõnadeks tuleks kasutada DataCite’i metaandmete raamistikus nõutud metaandmete väljadel olevaid andmeid: andmekogu autor, pealkiri, võtmesõnad jne. 
Millised on DataCite’i kohustuslikud, soovituslikud ja valikulised metaandmed, võib leida DataCite Eesti konsortsiumi kodulehelt. 
Praegu on DataCite’i registris üle 36 miljoni töö, millest Eesti teadusandmeid on ligi 2,4 miljonit. Suurima panuse sellesse on andnud andmehaldusplatvorm PlutoF.

DataCite’i registril on mõned head omadused: 
1. alates 2020. aasta algusest kajastab DataCite’i register seda, kui mitu korda on andmekogu tsiteeritud, vaadatud ja alla laetud. Tuleb tähele panna, et varasemad tegevused ei kajastu, seega täpse ülevaate andmekogu kasutusest saab alles 2020. aastast.
2. Andmekogu on mugav tsiteerida kaheksas enamlevinud vormingus, need saab kohe registrist kopeerida.  
3. DataCite pakub viitevormindajat, Data Citation Formatter, kuhu kopeerides DOI, saab moodustada enam kui 5000 standardset viidet. 

Näide: Otsime TÜ teadlase Maarja Öpiku avaldatud andmeid. 
 

Maarja Dataset

 

Otsingutulemusest on näha, et andmekogu on 1 kord tsiteeritud, 175 korda vaadatud ja 24 korda alla laetud. Pealkirja link viib Dryad repositooriumisse andmekogu juurde, kus saab näha täpsemaid andmeid ja tsiteeridamitmes vormingus.

 

OpenAIRE EXPLORE

Veel üks andmete ja samuti publikatsioonide otsimise koht on OpenAIRE portaal. OpenAIRE on Euroopa Komisjoni pikaajaline projekt, mis koondab komisjoni poolt rahastatud teadusprojektide tulemused ning lingib need omavahel.

Otsimaks portaalist teaduspublikatsioone ja lingitud avaandmeid, tuleb avada OpenAIRE Explore. Otsingukastis valida, kas otsitakse publikatsioone, andmeid, tarkvara, organisatsioone, projekte või rahastajaid.

OpenAIRE

Otsime sellest registrist teadusandmeid autori Rämmer järgi ja näeme, et ühe TÜ teadlase teadusandmed on erinevates andmerepositooriumides, kuid siiski leitavad OpenAIRE portalist. Põhjus võib olla selles, et EK rahastatavad projektid on koostööprojektid, kus osalevad paljude maade teadlased, seega andmed pannakse kõikide partnerite poolt heaks kiidetud repositooriumisse. Embargoperioodi määrab andmete autor tavaliselt nii kauaks, kui andmete analüüsimine on lõppenud ja artikkel avaldatud. 

Rammer

 

Mendeley Data Search

Mendeley on Suurbritannias asuv firma, mis pakub tooteid ja teenuseid teadlastele. Firma omanik on teaduskirjastus Elsevier.
Mendeley Data on teenus, mis pakub teadlastele andmete säilitamise võimalust ja andmete otsingut üle paljude registrite. 
Mendeley Data Search  otsib repositooriumides olevaid andmekogusid, kasutades muuhulgas eelpool nimetatud DataCite’i, OpenAIRE’i jt registreid, kuid Mendeley Data eelis on see, et otsitakse võtmesõnu ka oma andmehoidla (Mendeley Data) andmefailide sisust, mitte ainult metaandmete hulgast.
Praegusel hetkel tundub Mendeley Data Search olevat kõige otstarbekam otsingukeskkond, ehkki ka seal on filtreerimise võimalusi vähe. Andmetüübid on väga selgelt välja toodud.
Otsingutulemusi ei saa järjestada aasta järgi, kuid aastanumbri saab lisada otsingukasti.  
Loogika on täpselt sama, mis teistel registritel: tuleb leida andmekogu ja andmetega tutvumiseks ja allalaadimiseks liikuda repositooriumisse. 

Mendeley võimaldab andmete liitotsingut järgmiste tunnuste järgi: 

  • AUTHOR()
  • AUTHOR_ID (Mendeley User ID, Scopus User ID, ORCID and all user IDs supported by DataCite)
  • TITLE()
  • INSTITUTION()
  • INSTITUTION_ID() (Scopus Institution ID, Scival Institution ID, Mendeley Institution ID)
  • ID()
  • DOI()
  • KEYWORDS
  • SUBJECT_AREA
  • IS_SUPPLEMENT_TO

Töötavad ka Boole’i operaatorid AND, OR, NOT,  “jutumärgid” ja sulud (), kuid sulgude sees operaatorid ei pruugi enam toimida. 
Näide: otsime Maarja Kruusmaa teadusandmeid liustike hüdroloogia teemal: Kruusmaa AND “glacial hydrology”. Saame kaks tulemust, mis viivad Zenodo repositooriumisse. 

Mendeley

 

 

Google Dataset Search

Google arendab andmekogude otsimootorit ja alates 2018. a on Google Dataset Search kasutatav. See on sarnane otsingumootoriga Google Scholar ja need on mõeldud teineteist täiendama. Praegu on võimalik vaid lihtne võtmesõnaotsing, filtreerida saab samuti andmetüüpidega. Võib öelda, et praegu on Google Dataset Search arendusjärgus. 

Data Citation Index

Sarnaselt Web of Science viitamisandmebaasile on Clarivate arendanud teadusandmete otsingu registri Data Citation Index, milles 2020. a lõpus oli hõlmatud üle 10 miljoni andmekogu. Eesti raamatukogudele ei ole see toode praegu ostetud.