Andmehaldus

Erialased andmekataloogid

Andmekataloogi on koondatud mingi eriala ja/või selle võrgustikuga seotud e-infrastruktuurides kättesaadavad andmed. Üldjuhul on samad andmed leitavad ka andmeregistritest, kuid kataloogist on sageli lihtsam otsida ühe eriala andmeid. Kataloogide puhul on oluline uurida, kust kohast pärit andmeid need koondavad ja mis võib välja jääda. 

CESSDA (Consortium of European Social Science Data Archives) on sotsiaalteaduslike andmearhiivide konsortsium ning CESSDA Data Catalogue koondab sotsiaalteaduste andmeid, mis on pärit 20 Euroopa riigi teenusepakkujalt. 
Milliseid andmeotsinguid kataloog võimaldab, saab vaadata videost:

 

CLARIN ERIC (Common Language Resources and Technology Infrastructure of European Research Infrastructure Consortium) on üle-euroopaline koostöövõrgustik, et teha keeleressursid ja –tehnoloogia kättesaadavaks.
CLARINi keeleressursside register on  Virtual Language Observatory (VLO) ja seal  kajastuvad automaatselt kõik Eesti keeleressursside registrisse kogutud keeleresursside meta-andmed.

Veel mõned näited: 

COVID-19 Data Portal. Portaal võimaldab teadlastel COVID-19-ga seotud andmeid üles laadida, nendele juurde pääseda ja andmeid analüüsida.

OpenML (Open Machine Learning) koondab masinõppe andmed ja algoritmid.

IPCC kliimamuutuste andmekataloog

Geoinfosüsteemid (GIS) ruumiandmete kogumiseks, analüüsiks ja jagamiseks: 10 Free GIS Data Sources: Best Global Raster and Vector Datasets.