Andmehaldus

Avatud lähtekood

Avatud teaduse praktiseerimine eeldab, et andmetega töötamisel kasutatakse avatud lähtekoodiga tarkvara, mis on litsentseeritud nii, et igaüks võib seda kasutada, muuta ja täiustada.

Alati on mõistlik töös kasutada juba tunnustatud ja universaalset tarkvara, kuid vahetevahel on vajalik mõne kindla probleemi lahendamiseks ise koodi kirjutada.

Sellesse tuleb suhtuda täpselt niisamuti kui teadusandmetesse või meetoditesse. Oluline on tarkvara ning töövoo dokumenteerimine, metaandmed, versioonikontroll ja litsentsid.

Tuleb mõelda nii, et selleks, et teadustulemused oleksid läbipaistvad ja reprodutseeritavad, peab ka lisatud tarkvara võimaldama kõiki analüüse uuesti läbi viia.

Soovitav on kasutada versioonihaldussüsteemi Git ja mõnda pilvepõhist koodirepositooriumi nagu GitHub, GitLab (UT kasutajaga sisenemisel valida Sign in with Sibboleth), Bitbucket vms.

Öeldakse, et tarkvara ei saa kunagi valmis. Seetõttu tuleb mõelda, kas edaspidi suudetakse pakkuda kasutajatuge.

Artiklis Ten simple rules for making research software more robust on lisatud kontrollnimekiri tarkvaraarendajatele:

 

software_ten_rules.png

 

Kasulikke nõuandeid versioonihalduse kohta leiab artiklist Ten Simple Rules for Taking Advantage of Git and GitHub.

Delfti ülikooli juhendist leiab infot selle kohta, kuidas litsentseerida teadustöö või avatud hariduse tarbeks loodud tarkvara. Juuresoleva skeemi alusel saab otsustada, milliseid samme astuda:

os_software.png

Allikas

Avatud lähtekoodi litsentse saab muudel alustel valida ka vastavalt lehelt Choose a License.

Juuresolevas videos jagab tarkvarainsener Peter Kalverla häid nõuandeid:

 

On selge, et ettevalmistused oma tarkvara jagamiseks ja teiste koodi mõistmine ning kasutamine ei ole lihtne. 
Alljärgnevas küsitlusuuringus oli 188 vastajat ning huvitav on uurida, kui paljud tunnevad huvi teadusartikliga seotud koodi vastu ning kui ajamahukas on ettevalmistus selle avaldamiseks: 

Cadwallader L, Hrynaszkiewicz I. 2022. A survey of researchers’ code sharing and code reuse practices, and assessment of interactive notebook prototypes. PeerJ 10:e13933 https://doi.org/10.7717/peerj.13933

koodihuvilised

koodiaeg

Lisalugemist: Prantslased on avaldanud brošüüri Open Science – Source code and software, kus on lühidalt käsitletud järgmisi teemasid: What legal status do source code and software have? Why and how should we make them open access? How best to structure their  development and ensure permanent archiving? How should we  approach promotion?