Andmehaldus

Vastutusalad ja andmehalduse maksumus

Andmehaldusplaani koostamine ja kaasajastamine on kollektiivne töö, kuid igale tegevusele peaks olema määratud vastutajad, sest kõik on huvitatud projekti elluviimisest ning kvaliteetsetest tulemustest, artiklitest ja avaldatud andmetest.

Vastutust võib planeerida nii ametikohtade kui ka töövoo järgi. 

Juhtivteadurid (PI)

  • Peaksid hoolitsema selle eest, et kõik uurimisgrupi liikmed (sh doktorandid) oleksid teadlikud, milline on selle grupi andmehalduse poliitika
  • Vastutavad andmehaldusplaani koostamise ja täiendamise eest kogu projekti vältel
  • Vastutavad kõikide siduvate lepingute sõlmimise ja täitmise eest
  • Koordineerivad andmehaldust koostööprojektide puhul
  • Planeerivad andmehalduse kulud

Doktorantide juhendajad

  • Toetavad doktoranti andmehaldusplaani koostamisel, juhendades ja lahendades konkreetseid probleeme
  • Tagavad, et doktorandil oleksid andmehalduse alased oskused
  • Veenduvad, et PhD teeside alusandmed ning tarkvara saaksid hallatud ja avaldatud nii, et need oleksid repositooriumis säilitatavad FAIR andmed

Doktorandid

  • Vastutavad, et nende enda kogutud andmed oleksid organiseeritud ning dokumenteeritud vastavalt andmehaldusplaanile
  • Vastutavad, et nende andmed oleksid projekti lõppedes FAIR andmed
  • Probleemide tekkimisel küsivad abi ja koolitusi

Vastutust võib jagada ka andmetega tehtavate operatsioonide kaupa või töövoo järgi. Sel juhul tuleks määrata kindlaks, kes vastutab andmete kogumise ees, kes dokumenteerimise ja metaandmetega kirjeldamise eest, kes andmeturbe ja varundamise eest.

Lisaks otseselt teadustööd tegevale uurimisgrupile on teadlasi toetamas teised ülikooli struktuuriüksused nagu grandikeskus, IT-osakond ja raamatukogu.

Vajadusel tuleb palgata spetsialiste või lisatööjõudu. Ka nemad peavad olema teadlikud oma rollist ja vastutusest.

Andmehalduse maksumus

Juba grandi taotlemisel on mõttekas välja tuua andmehalduse kulud. Kulusid tekib andmete elutsükli igas etapis.

Andmete kogumine 

Teatavasti on üks võimalus andmete saamiseks neid osta. Kui andmed kogutakse ise, on võib-olla vajalik välja töötada juhendeid või luua malle andmete kogumiseks.

Kui andmeteks on näiteks videointervjuud või salvestatud fookusgrupi intervjuud, tuleb need transkribeerida. Selleks ei ole mõistlik kulutada kõrgelt kvalifitseeritud teadlase aega. Otstarbekam on see sisse osta lisatööd vajavalt üliõpilaselt. Mõnikord on vaja intervjuusid jms ka tõlkida – professionaalse tõlgi teenus on aga kallis.

Andmete kogumisel tuleb lisaks mõelda järgmistele küsimustele:

  • Kui on tegemist isikuandmete kogumisega, kas on olemas pädevus nõusolekuvormi koostamiseks? Kas andmekaitse spetsialisti konsultatsiooni on võimalik saada tasuta?
  • Kui andmete kogumiseks on vaja mingit tarkvara, kas see on tasuta saadaval, tuleb ise arendada või hoopis osta?
  • Kas vajalik riistvara on olemas? Kas see vastab planeeritavatele andmemahtudele? Kuidas toimub andmete kogumine välitööde ajal – kas selleks on vaja spetsiaalseid seadmeid? Kas andmete kogumise ja seadmete käsitsemise kohta on vaja korraldada koolitusi?

Dokumenteerimine 

Kui dokumeteerimist teha jooksvalt, siis on see odav. Kui tagantjärele, siis aga kallis ja mõnikord lausa võimatu.

Andmeanalüüs 

Siinkohal peab jälle mõtlema riist- ja tarkvarale ning koolitusvajadusele. Andmeanalüüsiks saab kasutada ka teiste asutuste tasulisi teenuseid. Näiteks suurandmete töötlus TÜ teadusarvutuste keskusest või teenused TÜ statistilise nõustamise keskusest.

Säilitamine, varundamine 

Ülikooli kesksed IT-teenused on tasuta, kuid muud lahendused ei pruugi olla. Üldiselt sõltub kõik prognoositavast andmemahust. Selle järgi saab otsustada salvestusruumi vajaduse ning maksumuse.

Kui materjale on vaja skaneerida või digiteerida ja tärktuvastada (OCR), on selleks vaja riist- ja tarkvara ning tööjõudu. Siinkohal peab eriti mõtlema andmeturbele, näiteks kas tundlikele andmetele on vaja eraldi serverit. Kuna andmeid peab varundama regulaarselt ja vähemalt üks varukoopia peab asuma kuskil eemal, siis tasub uurida, kas selleks on vaja mingeid seadmeid.

Andmete pikaajaline säilitamine ja jagamine 

Andmete ettevalmistamine jagamiseks võib olla suur töö, kui andmeid on vaja konverteerida teistesse vormingutesse. Tuleb veenduda, et kõik avaldatavad andmed oleksid anonümiseeritud. Audio- ja videofailide puhul on see väga suur töö. Selles etapis võib vaja minna ka juristi konsultatsiooni, et autoriõiguse ning litsentseerimise küsimused oleksid õigesti lahendatud.

Kui andmed säilitatakse institutsionaalses repositooriumis, siis see on üldjuhul tasuta. Suuremahuliste andmete säilitamine ükskõik millises repositooriumis on tasuline, ehkki need piirid on väga erinevad.

Andmemahuka teadustöö puhul võib olla otstarbekas palgata andmehaldur, kes oskab andmetega töötada, vastutab kogu töörühma andmehalduse eest ning nõustab ja koolitab.

Kui koostööpartnerid on välismaal, tuleb kindlasti korraldada ühiseid koosolekuid ja seminare. Selleks tuleks samuti raha planeerida.

Poster, mis illustreerib andmehalduse maksumust:  openaire_rdm_researcher_costs.pdf
Allikas: O’Connor, Ryan, Delipalta, Alexandra, & Jones, Sarah. (2020). What will it cost to manage and share my data?. Zenodo.http://doi.org/10.5281/zenodo.3837717

Siinkohal on ka väga huvitav vaadata, millistest allikatest andmete säilitamise maksumus kaetakse ning kuidas raha jagatakse sõltuvalt teadlase positsioonist: 

Costs

Allikas:  European Commission, Directorate-General for Research and Innovation, European Research Data Landscape – Final report, Publications Office of the European Union, 2022, https://data.europa.eu/doi/10.2777/3648