Andmehaldus

Probleemid ja takistused

Probleemid

Eestis on praegu üheks probleemiks selge avatud teaduse ja avaandmete poliitika puudumine. Selle tõttu ei ole välja kujunenud ka institutsionaalseid nõudeid ning praktikat, kuidas täpselt ja kui palju peaks teadlane avatud teadusesse panustama ning mida ta selle eest vastu saab. Silmnähtavat kasu akadeemilisele karjäärile ei ole.

Samas on surve all need teadlased, kes töötavad rahvusvahelistes uurimisgruppides. Väga paljudes teistes riikides on avatud teaduse poliitika vastu võetud. Nende riikide ülikoolides on vastavad juhendid olemas, mida sel juhul peaksid ka Eesti teadlased järgima.

An Analysis of Open Data and Open Science Policies in Europe (update 6, August 2020) SPARC Europe poolt annab ülevaate Euroopa riikide avatud teaduse poliitikatest ning olemasolevatest juhendmaterjalidest. 
Euroopas on olemas 15 riigil avatud teaduse poliitika.
EL riigid: Küpros, Tšehhi, Hispaania, Soome, Prantsusmaa, Holland, Belgia, Iirimaa, Leedu, Sloveenia, Slovakkia. Lisaks loetletutele veel Šveitsis, Norras, Serbias ja Suurbritannias. 

Eesti kuulub nende riikide hulka, kus avatud teaduse poliitikat ei ole, kuid sellegipoolest ollakse selles valdkonnas aktiivsed. 

Kindlasti on suureks probleemiks teadlase aja- ja rahapuudus. Andmehaldus ei ole eraldi rahastatud ning selleks tuleb võtta raha grandist. Samas on kindel, et kui teadusprojekti planeerimise faasis on andmehaldus planeeritud, siis see hoiab mujalt raha ning aega kokku.

Sageli puuduvad teadlastel andmehalduse oskused ning isegi andmemahukaid uurimusi läbi viivate töörühmade juures ei ole andmehalduse spetsialisti, kes õpetaks, juhendaks ning vastutaks.

Takistused

Kuna andmete jagamise praktika on enamikel erialadel suhteliselt uus nähtus, siis on loomulik, et teadlaskonnas on selle suhtes mitmeid eelarvamusi.

Teadlase kõige suurem hirm on see, et keegi saab tema andmetest kasu enne, kui ta on ise avaldanud planeeritud artiklid. Andmeid ei pea avama enne artikli ilmumist ning kui on plaanis täpselt samade andmetega veel midagi teha, saab kehtestada mõistliku embargoperioodi. On võimalik avaldada avatud juurdepääsuga preprint, mis saab ka ajatempli ning seega tagab andmete omanik, et tema artikkel on selle alusel esimene.

Kardetakse andmete väärkasutust ja väärtõlgendamist, mis tähendab, et keegi teine võib teha andmete alusel hoopis teistsuguseid järeldusi. Teadlased ei ole põhimõtteliselt andmete jagamise vastu, kuid seda eelistatakse teha nõudmisel, et saaks anda lisaselgitusi. Oma andmete kohta arvatakse, et andmekogu võib olla liiga suur või liiga keerukas teistele mõistmiseks.

Sellistel puhkudel ongi oluline, et andmed oleksid hästi organiseeritud, dokumenteeritud, varustatud metaandmete ja README.txt failiga.

Omaette teema on andmete autoriõigused, litsentsid, isikuandmete kaitse. Kuna see on keeruline ning juristi abi ei ole lihtne saada, eelistatakse andmeid mitte avada.

Siit graafikult saab kiiresti ülevaate probleemidest, mida teadlased tajuvad oma andmeid jagades:

Problems 2020

Science, Digital; Hahnel, Mark; McIntosh Borrelli, Leslie; Hyndman, Alan; Baynes, Grace; Crosas, Merce; et al. (2020): The State of Open Data 2020. Digital Science. Report. https://doi.org/10.6084/m9.figshare.13227875.v2 

2022. aasta andmetel on teadlaste arvamus andmete jagamist takistavatest asjaoludest veidi muutunud. Andmed on erinevate valimite põhjal, seega ei ole väga täpselt võrreldavad, aga tendents on näha.

Obstacles
Allikas: European Commission, Directorate-General for Research and Innovation, European Research Data Landscape – Final report, Publications Office of the European Union, 2022, https://data.europa.eu/doi/10.2777/3648

Oktoobris 2022 avaldati järjekordne väljaane küsitlusuuringust: Science, Digital; Goodey, Gregory; Hahnel, Mark; Zhou, Yuanchun; Jiang, Lulu; Chandramouliswaran, Ishwar; et al. (2022): The State of Open Data 2022. Digital Science. Report. https://doi.org/10.6084/m9.figshare.21276984.v5 

Siit on vastukaaluks hea näha, mis motiveerib teadlasi oma andmeid avaldama:

Motivation

Lisalugemist: Ülevaateartikkle teeb kokkuvõtte aastatel 2004-2019 avaldatud artiklitest teaduse avaandmete teemal, tuues välja palju põhjuseid, miks andmeid jagatakse või ei jagata (Tabelite avamiseks suures formaadis klikata iga tabeli juures oleval DOI-l).

Zuiderwijk A, Shinde R, Jeng W (2020) What drives and inhibits researchers to share and use open research data? A systematic literature review to analyze factors influencing open research data adoption. PLoS ONE 15(9): e0239283. https://doi.org/10.1371/journal.pone.0239283