Suurandmete analüüsi seminar / Big Data seminar

Please scroll down for the information in English!

Infoühiskonna keskus korraldab aprilli alguses kahepäevase suurandmete analüüsi teemalise koolituse. Koolituse käigus antakse osalejatele baasteadmised andmehaldusest, andmeanalüüsist ja visualiseerimisest, kasutades R programmeerimiskeelt. Koolitus on suunatud TÜ töötajatele ja doktorantidele, kes tegelevad või plaanivad tegeleda suurte andmehulkade korrastamise, analüüsi ja visualiseerimisega. Koolitus on sobilik ka algajatele. 

Koolituse toimumisaeg: 03.04.2017 kl 10-17, 04.04.2017 kl 10-17

Koht: Lossi 36-104 (03.04), Lossi 36-104/214 (04.04)

Koolitajad: Elena Sügis ja Dmytro Fishman, TÜ arvutiteaduse instituudi bioinformaatika nooremteadurid

Töökeel: inglise keel

Kohtade arv: 30

Registreeru siin hiljemalt 27.03.2017!

Vaata detailset päevakava ning uuri, millised programmid tuleks enne seminari alla laadida. 

Suurandmete analüüsi seminar on kahepäevane workshop, mille eesmärgiks on aidata TÜ teadlastel koguda oma andmetest rohkem teadmisi väiksema vaevaga. Seminari pikaajaliseks eesmärgiks on aidata kaasa andmeteaduse kompetentsi tõstmisele, andmeanalüüsi kogukonna arengule ja interdistsiplinaarsele koostööle. 

Seminaris osalejad saavad alustuseks loengu teemal "Sissejuhatus andmeteadusesse", millele järgneb mitu praktilist sessiooni R programmeerimiskeele kasutamise kohta. Seminar on üles ehitatud nii, et see on sobilik osalejatele, kellel puudub varasem kokkupuude programmeerimisega või kes on selles vallas alles algajad. 

Praktiliste sessioonide käigus saavad osalejad ülevaate R süntaksist ja RStudio keskkonnast. Lisaks käsitletakse teemasid, kuidas laadida andmestikke erinevatest allikatest, kuidas neid andmestikke korrastada ja salvestada sobiliku struktuuriga andmestikke. Osalejad õpivad, kuidas andmestikke kohaldada - lisada ja eemaldada andmeridasid, kokkuvõtvaid statistikuid luua ja tulemusi visualiseerida, kasutades ggplot2 kataloogi. 

Seminari käigus kasutatakse muuhulgas ka erinevaid avalikult kättesaadavaid andmebaase, illustreerimaks probleeme, mida osalejad võivad kohata iseseisva andmeanalüüsi käigus.

Seminari ülesehitamisel toetuvad õppejõud nii endi varasematele kogemustele kui ka õppematerjalidele, mis pärinevad Data Carpentry poolt läbiviidud andmeanalüüsi workshoppidest.  

Koolituse lõpuks on osalejatel ülevaade andmeteaduse põhialustest ja Ri süntaksi tööpõhimõtetest. Osalejad oskavad koostada ülevaatestatistikat ja visualiseerida oma andmeid ja tulemusi. 

Lisainfo: Kristel Vits (kristel.vits@ut.ee)


Centre for the Information Society will organise a 2-day Big Data seminar on big data analysis at the beginning of April. During the seminar, the participants will get an overview of data science, data analysis and visualisation, using R programming language. The seminar is suitable to all UT employees and doctoral students who wish to obtain knowledge on organising, analysing and visualising big bodies of data. The seminar is also suitable for beginners. 

Date and time: 03.04.2017 kl 10-17, 04.04.2017 kl 10-17

Place: Lossi 36-104 (03.04), Lossi 36-104/214 (04.04)

Lecturers: Elena Sügis ja Dmytro Fishman, Institute of Computer Science, Junior Research Fellows in Bioinformatics

Language of instruction: English

Places: 30

Register here on 27.03.2017 at the latest!

Read here the detailed programme of the seminar and get an overview of the programmes you should download before the start of the seminar!

The “Big data seminar" is a two-day workshop (April 3-4, 2017) aimed to help researchers from UT extract more knowledge from their data with less pain. The long-term goal of the event is to contribute to raising data science competences, development of data science community and interdisciplinary collaboration.

The event consists of the “Introduction to Data Science” lecture, followed by several hands-on lessons in R programming language. Course is designed for the participants with no or very limited programming experience. 

It will start with an introduction to Data Science and Reproducible Research, then move to basic overview of R syntax and RStudio environment. Following sessions will focus on the ways to load data from different sources, means to tidy it and store into convenient data structures. Participants will learn how to manipulate datasets - add and remove new rows and columns, how to compute summary statistics and finally how to visualise the results of the analysis using the ggplot2 library.  

Moreover, we plan to use real-life publicly available data sets to give participants an idea of problems that they might face when doing the analysis of their own data.

This event will be equally based on speakers' personal experience and teaching materials from successful series of workshops on data analysis from the Data Carpentry organisation.

At the end of the course we expect participants to have an overview of data science, get acquainted with the basic R syntax, compute summary statistics, being able to visualise their data/results.

For additional information, please contact Kristel Vits (kristel.vits@ut.ee). 

back forward