Teadusandmete otsing

Mis on teadusandmed

Teadusandmed on teadustöö otstarbeks omandatud või ise kogutud andmed.

Andmed on saadud eksperimendi või vaatluse teel, kogutud pildi- ja videomaterjal, intervjuude transkriptsioonid, küsitlusandmed, kunstiteoste interpretatsioonid, arhiivimaterjalid, arheoloogilised leiud, avaldatud tekstid ja käsikirjad – kõik, mille põhjal tehakse uusi teaduslikke järeldusi.

Suurbritannia teadlaskogukonna poolt koostatud dokument Concordat on Open Research Data annab küllaltki põhjaliku teadusandmete definitsiooni: 

Research data are the evidence that underpins the answer to the research question, and can be used to validate findings regardless of its form (e.g. print, digital, or physical). These might be quantitative information or qualitative statements collected by researchers in the course of their work by experimentation, observation, modelling, interview or other methods, or information derived from existing evidence. Data may be raw or primary (e.g. direct from measurement or collection) or derived from primary data for subsequent analysis or interpretation (e.g. cleaned up or as an extract from a larger data set), or derived from existing sources where the rights may be held by others. Data may be defined as ‘relational’ or ‘functional’ components of research, thus signalling that their identification and value lies in whether and how researchers use them as evidence for claims.
They may include, for example, statistics, collections of digital images, sound recordings, transcripts of interviews, survey data and fieldwork observations with appropriate annotations, an interpretation, an artwork, archives, found objects, published texts or a manuscript.

Teaduse avaandmed on teadustöö käigus kogutud andmed, mis tehakse internetis avatud juurdepääsuga kättesaadavaks. Selle juures on oluline, et andmed oleksid varustatud avatud litsentsidega (CC 0 või CC BY), et teised teadlased võiksid neid taaskasutada ning saada uusi teadustulemusi ning neid omakorda jagada. 

Mõistetav on ka see, et kõiki andmeid ei ole võimalik avada ja teistega jagada, näiteks 

  • Isikuandmed
  • Riigikaitse ja turvalisusega seotud andmed
  • Äritegevuse ja patenditaotluste andmed
  • Mõned keskkonnaandmed (näit. ohustatud liigid)
  • Tundlike andmete metaandmed (näit. ohustatud liikide asukohaandmed)

Andmed peaksid olema nii avatud kui võimalik ja nii suletud kui vajalik

Lisaks sellele, et teadusandmed peaksid olema üldjuhul avatud, võiksid need vastata ka FAIR põhimõtetele. FAIR tähendab, et masinloetavad andmed on leitavad, juurdepääsetavad, koostoimimisvõimelised paljude infosüsteemidega ja taaskasutatavad teistele teadlastele. 

FAIR