Andmehaldus
Andmeregistrid
DataCite
DataCite on organisatsioon, mis väljastab DOI ja registreerib andmekogude metaandmed. Seega on võimalik metaandmete registrist ka teadusandmeid otsida.
Lisaks teadusandmetele leiab sealt ka publikatsioone, tarkvara, organisatsioone ja repositooriume.
Alustame DataCite Commons lehelt.
Otsingusõnadeks tuleks kasutada DataCite’i metaandmete raamistikus nõutud metaandmete väljadel olevaid andmeid: andmekogu autor, pealkiri, võtmesõnad jne.
Millised on DataCite’i kohustuslikud, soovituslikud ja valikulised metaandmed, võib leida DataCite Eesti konsortsiumi teadlastele suunatud lehelt.
Praegu on DataCite’i registris ligi 36 miljont registreeritud DOI-d, millest Eesti teadusandmeid on ligi 2,4 miljonit. Suurima panuse sellesse on andnud andmehaldusplatvorm PlutoF.
Sellel registril on mõned head omadused:
1. Alates 2020. aasta algusest kajastab DataCite’i register seda, kui mitu korda on andmekogu tsiteeritud, vaadatud ja alla laetud. Tuleb tähele panna, et varasemad tegevused ei kajastu, seega täpse ülevaate andmekogu kasutusest saab alles 2020. aastast.
2. Andmekogu on mugav tsiteerida 8 enamlevinud vormingus, need saab kohe registrist kopeerida.
3. DataCite pakub viitevormindajat, Data Citation Formatter, kuhu kopeerides DOI, saab moodustada enam kui 5000 standardset viidet.
Näide: Otsime TÜ teadlase Maarja Öpiku avaldatud andmeid.
Otsingutulemusest on näha, et andmekogu on 1 kord tsiteeritud, 175 korda vaadatud ja 24 korda alla laetud. Pealkirja link viib Dryad repositooriumisse andmekogu juurde, kus saab näha täpsemaid andmeid ja tsiteeridamitmes vormingus.
Lisalugemist: Ten simple rules for getting and giving credit for data.
OpenAIRE
Veel üks andmete ja samuti publikatsioonide otsimise koht on OpenAIRE portaal. OpenAIRE on Euroopa Komisjoni pikaajaline projekt, mis koondab komisjoni poolt rahastatud teadusprojektide tulemused ning lingib need omavahel.
Eesti OpenAIRE infopunkt on TÜ raamatukogu.
Otsimaks portaalist teaduspublikatsioone ja lingitud avaandmeid, tuleb avada OpenAIRE Explore. Otsingukastis valida, kas otsitakse publikatsioone, andmeid, tarkvara, organisatsioone, projekte või rahastajaid.
Lisalugemist OpenAIRE blogist, kuidas teadustöö tulemusi otsida ja mida OpenAIRE EXPLORE võimaldab: EXPLORE: Search Open Science scholarly works.
Mendeley Data Search
Mendeley on Suurbritannias asuv firma, mis pakub tooteid ja teenuseid teadlastele. Firma omanik on teaduskirjastus Elsevier. Mendeley Data on teenus, mis pakub teadlastele andmete säilitamise võimalust ja andmete otsingut üle paljude registrite.
Mendeley Data Search otsib repositooriumides olevaid andmekogusid, kasutades muuhulgas eelpool nimetatud DataCite’i, OpenAIRE’i jt registreid, kuid Mendeley Data eelis on see, et otsitakse ka võtmesõnu oma (st. Mendeley) andmehoidla andmefailide sisust, mitte ainult metaandmete hulgast.
Praegusel hetkel tundub Mendeley Data Search olevat kõige otstarbekam otsingukeskkond, ehkki ka seal on filtreerimise võimalusi vähe. Andmetüübid on väga selgelt välja toodud.
Otsingutulemusi ei saa järjestada aasta järgi, kuid aastanumbri saab lisada otsingukasti.
Loogika on täpselt sama, mis teistel registritel: tuleb leida andmekogu ja andmetega tutvumiseks ja allalaadimiseks liikuda repositooriumisse.
Näide:
Täpsemalt saab andmekogu vaadata, klõpsates pealkirjal ja see viib repositooriumisse https://data.mendeley.com/datasets/jtts2d7dtg/1
Google Dataset Search
Google arendab andmekogude otsimootorit ja alates 2018. a on Google Dataset Search kasutatav. See on sarnane otsingumootoriga Google Scholar ja need on mõeldud teineteist täiendama. Praegu on võimalik vaid lihtne võtmesõnaotsing, filtreerida saab samuti andmetüüpidega. Võib öelda, et praegu on Google Dataset Search arendusjärgus.
Data Citation Index
Data Citation Index on Web of Science grupile kuuluv teadusandmete register, mis lingib omavahel WoS artiklid ja nende alusandmed ning tarkvara.
Seda registrit ei ole Eesti raamatukogud ostnud.