Õppimine ja õpetamine tehisintellekti ajastul: kuidas kasutada tekstiroboteid õppetöös
1. Mis on tehisintellekt ja kuidas see töötab?
See peatükk annab sulle tervikliku ülevaate tehisintellekti olemusest ja ajaloost, hõlmates nii selle arengut kui ka rakendusi, mida kohtame igapäevaelus. Saad teada, kuidas tehisintellekt toimib ning mille poolest erinevad tekstirobotid, nagu ChatGPT, teistest tehisintellekti rakendustest. Lisaks tutvustatakse sulle tehisintellekti arenduses oluliste närvivõrkude ja transformeri arhitektuuri tähtsust. Peatüki lõpus tuleb juttu valdkonna praegustest tehnilistest piirangutest ja potentsiaalsetest tulevikuväljavaadetest, mis aitavad ennustada, millise suuna võiks areng lähiaastatel võtta.
Mis on tehisintellekt?
Pärast ChatGPT tekstiroboti tulekut 2022. aasta novembris on tehisintellekt pakkunud palju kõneainet. Tehisintellekt (edaspidi TI) on arvutiteaduste haru, mille eesmärk on luua süsteeme, mis suudavad täita selliseid keerulisi ülesandeid, mille jaoks on tavaliselt läinud vaja inimese mõtlemisvõimet ehk intellekti. TI on teatud kujul eksisteerinud juba üle 50 aasta ja kokkupuuteid TI rakendustega on meie igapäevaelus olnud ammu enne ChatGPT-d. Näiteks on juba 2006. aastal välja tulnud Google Translate kasutanud algusest peale masinõppe mudeleid, mis on väga sarnased tekstirobotite kasutatavatele TI mudelitele. Siiski olid varasemad TI rakendused lihtsakoelisemad kui need, mida saame kasutada täna. Peamiselt on TI arengut võimaldanud väga suurte digitaliseeritud andmemahtude kättesaadavus internetist ja märkimisväärselt suurenenud arvutusvõimekus.
Kõige lihtsamalt öeldes on TI inimesele sarnase intellekti ehk mõtlemisvõimega (täpsemalt ennustus- ja arvutusvõimega) arvutiprogramm, mis suudab inimese moodi luua sisu, planeerida, õppida ja olla loominguline. Kuigi on vaieldav, kas TI oma praegusel kujul küündib nende võimete kõrgeimale tasemele, siis algsed toimingud on sellele juba jõukohased.
Arvutid on algusaegadest peale olnud sisuliselt keerulised kalkulaatorid, millel on palju arvutusvõimekusi. Seejuures on arvutid alati täitnud kindlaid etteantud ülesandeid. TI süsteemid erinevad neist kalkulaatoritest selle poolest, et suudavad anda sisendile vastuseks erinevaid tõenäolisi vastuseid − just nagu teeks ka inimene. Ühtlasi on TI-le jõukohaste ülesannete haare lai, hõlmates õppimist, probleemide lahendamist, mustrite tuvastamist tekstis ning keeleandmete töötlemist ja loomist.
Järgnevalt on lähemalt selgitatud olulisemaid termineid, mis on TI-st rääkides ja selle mõistmiseks tarvilikud. Nagu öledud, on TI arvutiprogramm, mis analüüsib olemasolevaid andmeid ja pakub vastavalt sisendile mingi ennustuse või lahenduse. TI rakendused jaotuvad kaheks: kitsas ja üldine TI.
- Kitsas TI tähistab rakendusi, mis on loodud konkreetsete ülesannete täitmiseks.
- Üldine TI tähistab rakendusi, mis on võimelised eri valdkondades ja erinevaid ülesandeid lahendades ise õppima ja tegutsema. Praegu laialt kättesaadavad TI rakendused kuuluvad kitsa TI alla.
Lisaks neile tuleks eristada veel generatiivset ehk loovat TI-d. Generatiivne TI suudab olemasolevatele andmetele tuginedes luua uusi tekste, pilte, muusikat või muud sisu. Vastavalt sellele, mis tüüpi meediumit generatiivne TI loob, eristatakse ka eri tüüpi TI rakendusi. Kõige levinumateks genereeritavateks meediumiteks on tekst, pilt, muusika ja video. Siinne õppematerjal keskendub ülikoolis enim kasutust leidvatele generatiivsetele TI rakendustele ehk tekstirobotitele.
Kuidas töötavad närvivõrgud ja miks on need TI arenduses olulised?
Närvivõrk on masinõppe üks peamisi tööriistu ning nagu ka nimetus vihjab, on see inspireeritud inimese ajust. Närvivõrkude programmeerimise ja toimimise ammendav selgitus ei ole siinse materjali eesmärki silmas pidades mõistlik, seega on järgnevalt esitatud lihtsustatud ülevaade sellest, mismoodi närvivõrk toimib ja mis on selle roll TI süsteemides.
Närvivõrk koosneb paljudest omavahel ühendatud punktidest, mida kutsutakse neuroniteks. Need töötavad koos, õppides ära mustreid, tehes arvutusi ja langetades otsuseid. Neuronid ei ole ühendatud ainult ühes, vaid mitmes omavahel seotud kihis. Lihtsustatud kujul on närvivõrgus neuronitest sisendkiht, varjatud kihid ja väljundkiht. Kui esitad tekstirobotile oma viiba, muudab sisendkiht sõnad numbriteks, varjatud kihid töötlevad infot edasi ja väljundkiht annab vastuse. Teisisõnu, varjatud kihid võtavad info sisendkihist ja ühendavad selle väljundiga.
Iga neuron varjatud kihis arvutab sisenditest kaalutud summa. Väljundkiht annab lõppvastuse või ennustuse. Sellises mitmekihilise ülesehitusega närvivõrgus võib olla väga palju neuroneid ja nendevahelisi seoseid ehk parameetreid. Sisuliselt on parameetrid neuronitevahelised kaalud ja nihked, mida mudel on treenides õppinud, et jõuda sisendkihist väljundkihi õige tulemini. TI närvivõrgu mudeli parameetrite arvu kasutatakse eri TI mudelite võimekuse võrdlemisel.
Lisaks parameetrite arvule iseloomustavad TI mudeli võimekust arvutusvõimekus (protsessorid, graafikakaardid ja mälu) ning treeningandmete hulk ja kvaliteet. Mida rohkem parameetreid on TI mudelis, seda arvutuslikult kulukam on seda kasutada. Suur arvutusvõimekus annab tihti küll parema TI mudeli, aga kasutab palju energiat. Treeningandmete hulk ja kvaliteet on olulised, sest mida suuremal hulgal kvaliteetset loomulikku tekstiandmestikku saab TI mudel õppimiseks kasutada, seda parem mudel tõenäoliselt on. Närvivõrguga seoses on oluline ka transformeri mõiste. Transformer on suhteliselt uus, 2017. aastal Google’i loodud närvivõrgutüüp, mis võimaldab TI-l keskenduda sisendi olulistele osadele. See tähendab, et sisestatud viibas olevate sõnade olulisust ei tuletata ainult nende omavahelise kauguse, vaid ka konteksti põhjal. Teine transformeri arhitektuuri suur eelis on see, et sisendis olevaid sõnu ja lauseid ei töödelda järjest, vaid paralleelselt, mis muudab need TI mudelid märkimisväärselt kiiremaks.
Millised on TI arenduse tulevikusuundumused?
Kui mõelda TI mudelitest ja nende arengust pärast 2022. aastat, ilmneb kohe üks selge tendents, mis lähiajal tõenäoliselt ei muutu: TI valdkonna areng on nii kiire, et sellega on väga raske kaasas käia. Kuigi enamjaolt kitsa TI alla kuuluvad mudelid tegid aastatel 2022–2024 suure arenguhüppe, oodatakse endiselt arenemist üldise TI tasemele: püüeldakse sellise TI poole, mis suudab näidata head, inimvõimete tasemel sooritust ka väga erinevate meediumite ja spetsiifiliste ülesannete korral. Mudelid muutuvad järjest paremaks ja suudavad mõne mudeligeneratsiooni möödudes sooritada mitmeastmelisi ülesandeid, kus TI küsib lahenduse jaoks lisaküsimusi ja suudab ise ennustada iga järgmist vajalikku etappi, et lahendada mingi suuremahuline ja keeruline ülesanne. Ehkki sellised mudelid võivad alguses olla isegi aeglasemad kui parimad praegused TI mudelid, suudavad need lahendada ülesandeid, mis nõuavad väga keerulist mõttetööd.
Palju on räägitud TI mõjust tööjõusektorile: tulevikus kujundavad TI üha laiem kasutuselevõtt ja töö automatiseerimine ümber ka tööturu. Näiteks võivad rutiinsed ja korduvad tööd, nagu andmesisestus, lihtsam klienditeenindus ja tootmisliinide valvamine, muutuda üha enam automatiseerituks. Samal ajal tekib hulk uusi ametikohti, nagu TI spetsialistid, TI süsteemide hooldajad ning eetikaeksperdid, kes hindavad ja reguleerivad TI rakenduste mõju. See tähendab, et töötajad peavad omandama uusi oskusi või liikuma teistesse valdkondadesse, kus inimese loovus ja oskus lahendada keerulisi probleeme jäävad asendamatuks.