Andmehaldus

Andmete jagamine ja avaldamine

Pärast teadusprojekti lõppemist säilitatakse andmed usaldusväärsetes teadusandmete repositooriumides, mille kaudu saadakse ka DOI ja registreeritakse metaandmed. See tagab, et andmed oleksid teistele teadlastele kergesti leitavad, kättesaadavad ning taaskasutatavad.

Kui projekti käigus avaldatakse teadusartiklid, siis lingitakse artiklid nende alusandmetega (ja muude teadustöö väljunditega) DOI vahendusel. 

Data availability statement

Teaduskirjastused nõuavad või soovitavad, et artikli esitamisel avaldamiseks lisataks ka Data Availability Statement (DAS). See on siis teadaanne selle kohta, kus on artikli alusandmed kättesaadavad.
Mõned näited: 

Taylor&Francis: A data availability statement (also sometimes called a ‘data access statement’) tells the reader where the data associated with a paper is available, and under what conditions the data can be accessed. They also include links (where applicable) to the data set.

Springer Nature: Data availability statements provide a statement about where data supporting the results reported in a published article can be found – including, where applicable, hyperlinks to publicly archived datasets analysed or generated during the study.

Sage Publishing: We encourage authors to include in any articles that report results derived from research data to include a Data Availability Statement (DAS). A DAS should include information on where data supporting the results reported in the article can be found including, where applicable, hyperlinks to publicly archived datasets analyzed or generated during the study. Where research data are not publicly available, this must be stated along with any conditions for accessing the data.

Artiklis  Colavizza G, Hrynaszkiewicz I, Staden I, Whitaker K, McGillivray B (2020) The citation advantage of linking publications to research data. PLoS ONE 15(4): e0230416. https://doi.org/10.1371/journal.pone.0230416
väidetakse, et info selle kohta, kust leida andmed, suurendab artikli tsiteeritavust hinnanguliselt 25%.

Toome mõned näited, kuidas on artikkel avaldatud koos andmetega:

Näide 1: Avatud juurdepääsuga eelretsenseeritud teadusartikkel + avaandmed (supplemental material, supporting information). Ülalnimetatud artikli https://doi.org/10.1371/journal.pone.0230416 puhul on avaldatud, et 
Code and data can be found at: https://doi.org/10.5281/zenodo.3470062
See tähendab, et nii kood kui ka alusandmed on leitavad Zenodo repositooriumis.

Näide 2: Artikliga koos on avaldatud Supporting information, need on andmekogud, tabelid ja joonised, millest igaüks on saanud oma DOI. Nii on võimalik igale andmekogule eraldi viidata ja teadlased saavad tsiteeringuid.
Anagnostou P, Capocasa M, Milia N, Sanna E, Battaggia C, Luzi D, et al. (2015) When Data Sharing Gets Close to 100%: What Human Paleogenetics Can Teach the Open Science Movement. PLoS ONE 10(3): e0121409. https://doi.org/10.1371/journal.pone.0121409

Näide 3: Tellitavates ajakirjades avaldatud artiklite alusandmed võivad samuti olla avatud. Elsevieri ajakirjas Journal of Molecular Graphics and Modelling, avaldatud artikli andmed võib vabalt alla laadida QsarDB repositooriumist.

qsardb.png

 

Näide 4: Järgmises Eestiga seotud projektis on tegemist tundlike (isiku)andmetega ning neid ei ole võimalik avada. Selle tõttu avaldatakse info, kuidas ja mis tingimustel on teistel teadlastel siiski võimalik neid andmeid kasutada:
Goel R, Sharma R, Aasa A (2021) Understanding gender segregation through Call Data Records: An Estonian case study. PLoS ONE 16(3): e0248212. https://doi.org/10.1371/journal.pone.0248212
Data Availability: The data used in this study are owned by Mobility Lab. The data can be accessed through the secured servers of the Mobility Lab after making a non-disclosure agreement (NDA) with the Mobility Lab. Website: https://mobilitylab.ut.ee/. Address: Mobility Lab, University of Tartu, Faculty of Science and Technology, Institute of Ecology and Earth Sciences, Department of Geography, Vanemuise 46, 51003 Tartu, ESTONIA Email: mobilitylab@ut.ee Tel: +372 737 6844. All researchers will receive the same privileges as the authors after signing a non-disclosure agreement (NDA).

Näide 5: Toodud metauuringu puhul on esitatud lisaks andmetele ka muud materjalid, skriptid ja kood. Oluline on märgata, et artikkel ja muud materjalid ei pea olema kõik ühes ja samas repositooriumis, kuid peavad olema omavahel lingitud. 

​​​​​Hardwicke, T. E., Wallach, J. D., Kidwell, M. C., Bendixen, T., Crüwell, S., & Ioannidis, J. P. A. (2020). An empirical assessment of transparency and reproducibility-related research practices in the social sciences (2014-2017). Royal Society Open Science, 7(2), 190806. doi:https://doi.org/10.1098/rsos.190806.
Data accessibility: All data (https://osf.io/u9fw8/), materials (https://osf.io/z9qtr/) and analysis scripts (https://osf.io/sbrez/) related to this study are publicly available. To facilitate reproducibility this manuscript was written by interleaving regular prose and analysis code and is available in a Code Ocean container (https://doi.org/10.24433/CO.2749769.v4) which re-creates the software environment in which the original analyses were performed.

 

Andmed koos metaandmetega tuleks jagada õigeaegselt. Üldiselt eeldatakse, et andmed avalikustatakse mitte hiljem kui publikatsioon, kuid jagamise puhul puhul peaks järgima valdkonnas välja kujunenud praktikat.

Teadlasel on seaduslik õigus saada kasu andmete loomiseks kulutatud aja ja jõupingutuste eest, kuid mitte pikaajalise ainuisikulise andmete kasutamise eest. 

Tooge välja kõik eeldatavad probleemid andmete jagamisel koos põhjustega ning kuidas neid probleeme ületada. Probleemid võivad tuleneda andmete konfidentsiaalsusest, nõusolekuga seotud asjaoludest või intellektuaalomandi kaitsest.

Kui organisatsioonist väljastpoolt tulevad kasutajad seotakse mingite lepingutega, siis tuleb seda kindlasti näidata. Tooge välja vastavad tingimused ja vastutusala. Näidake, kuidas andmetele juurdepääsu kontrollitakse. Kui juurdepääsuks on vaja läbida kindel protseduur, peab see olema läbipaistev ja kirjeldatud (vt. näide 4).

Andmeajakirjad

Veel üks võimalus on avaldada andmeartikkel andmeajakirjas (Data Journal). Andmeajakiri ise andmeid ei säilita, need asuvad ikka repositooriumis. Artikkel andmeajakirjas ei ole analüüsi, tulemuste ja järelduste koht, vaid see keskendub detailsele andmekirjeldusele, andmete väärtusele ning taaskasutuse võimalustele. Andmeajakirja artiklid on eelretsenseeritud ning need suurendavad oluliselt tsiteeringute hulka ja väärtustavad teadlase tööd andmetega.

Näiteid andmeajakirjadest:

Veel mõned andmeajakirjad ja juhendid, kuidas andmeartiklit avaldada: 

Options to publish a Data Article (veebruar 2022)

Iga andmeajakiri annab oma autoritele juhised, kuidas andmekogu avaldamiseks ette valmistada. Seega peaks sellega arvestama juba andmehaldusplaani koostades.

Näide: Tedersoo, L., Küngas, R., Oras, E. et al. Data sharing practices and data availability upon request differ across scientific disciplines. Sci Data 8, 192 (2021). https://doi.org/10.1038/s41597-021-00981-0 

Lisalugemist: Kui on kavas oma andmed avaldada andmeajakirjas, tasub tutvuda kahe artikliga, mis käsitlevad andmajakirjade poliitikat:

1. Walters, William H.. 2020. “Data Journals: Incentivizing Data Access and Documentation Within the Scholarly Communication System”. Insights 33 (1): 18. DOI: http://doi.org/10.1629/uksg.510

2.   Sunkyung Seo, Jihyun Kim. 2020. “Data journals: types of peer review, review criteria, and editorial committee members’ positions”. Science Editing 7(2): 130-135.https://doi.org/10.6087/kcse.207

 

Lisalugemist: TÜ raamatukogu korraldas 2018. aasta maikuus rahvusvahelise seminari How to Get the Maximum from Research Data – Prerequisites and Outcomes.

Avatud teaduse ja andmete jagamise teemaga haakuvad seminaril Veerle Van den Eyndeni (UK Data Archive) poolt peetud ettekande ja töötoa slaidid:

PDF icon Sharing and Reusing Research Data

PDF icon Preparing Data for Sharing and Reuse