Teadusandmete repositooriumid e. andmehoidlad on digitaalsed arhiivid teadusandmete ja nende metaandmete säilitamiseks ning kättesaadavaks tegemiseks. Repositooriumid annavad andmekogule püsilingi, mille abil on mugav andmekogusid leida, tuvastada, linkida ja tsiteerida.
Repositooriumid jagunevad:
Institutsionaalsed repositooriumid pakuvad andmete säilitamise teenust üldjuhul oma ülikooli teadlastele. Need on universaalsed repositooriumid, mis on võimelised säilitama enamlevinud andmetüüpe ja -vorminguid nagu tekstid, tabelid, audio- ja videomaterjal jne.
Tartu Ülikooli teadusandmete repositooriumit DataDOI haldab ülikooli raamatukogu ja sellega on liitunud ka Tallinna Ülikool. Andmeid saab otsida valdkonna või metaandmete järgi. Iga TÜ teadlane saab sellesse oma andmed üles laadida, andmetele antakse kohe püsiidentifikaator DOI ja nii on võimalik siduda omavahel andmed ja artiklid.
Erialased repositooriumid on võimelised säilitama väga spetsiifilisi andmeid vastavalt erialastele andmete ja metaandmete standarditele ja eeldatavatele andmemahtudele. Näiteks võib tuua geeniandmed, kosmoseuurimise andmed, satelliidiandmed ja suurandmed üldiselt.
Teadlased ise eelistavadki oma andmeid üles laadida erialastesse repositooriumidesse, kui need on olemas, sest need on oma teaduskogukonnale tuttavad. Seega kõik Tartu Ülikoolis kogutud andmed ei ole TÜ andmerepositooriumis.
Ka Eestis on olemas mõned valdkondlikud repositooriumid, näiteks andmehaldusplatvorm PlutoF elurikkuse andmetele, geokollektsioonide infosüsteem SARV ja arvutuskeemia mudelite andmebaas QsarDB. Enamasti on väiksemad erialased repositooriumid integreeritud suuremate võrgustikega, nii on Eesti Keeleressursside Keskus (EKRK) osa CLARIN-ERIC repositooriumide võrgustikust.
Universaalsed multidistsiplinaarsed repositooriumid on väga hästi tuntud, sest nendesse võivad oma andmeid laadida kõik teadlased ja seal on ka väga palju andmekogusid. Euroopa Komisjon rahastas repositooriumi Zenodo loomist ja selles avaldatakse EK projektidega (Horisont 2020) seotud andmed.
Kui on soovi universaalsetest repositooriumidest rohkem teada saada, võib lisaks uurida materjali General Repository Comparison.
Andmerepositooriumide teenused
Andmerepositooriumi põhiülesanne on pikaajalisele säilitamisele antud andmete hooldamine (data curation), et andmed oleksid leitavad, kättesaadavad, koostöövõimelised ja taaskasutatavad, ühesõnaga võimalikult FAIR andmed.
Samuti haldavad repositooriumid juurdepääsuõigusi ja embargoperioode, kui teadlane on need ette näinud.
Suured repositooriumid pakuvad sageli tarkvara enamlevinud vormingute töötluseks. Probleemiks on alati uued formaadid, mis teevad andmete hooldamise keeruliseks. Üldjuhul toimub andmetöötlus ikkagi pärast andmete allalaadimist mõnes teises keskkonnas.
Veel võivad repositooriumid pakkuda bibliomeetrilisi andmeid, statistikat andmekogu allalaadimise ning visualiseerimise kohta, samuti tsiteerimise vormindamist.
Repositooriumid abistavad teadlast ka litsentside valikul.