Tehisintellekt Tartu Ülikoolis

1.1. Mis on tekstirobot?

Tekstirobotid on TI-l põhinevad programmid, mis suudavad luua teksti mis tahes teemal.

Tekstirobotid on TI-l põhinevad programmid, mis suudavad luua teksti mis tahes teemal, sealhulgas lahendada kooliülesandeid, sooritada eksameid, kirjutada kirjandeid ja arvutiprogramme. Tekstirobotid nagu ChatGPT, Gemini või Claude põhinevad suurtel keelemudelitel (large language models, LLMs) ning kuuluvad loomuliku keele töötluse (natural language processing, NLP) valdkonda, mis keskendub arvutite ja inimkeele vahelise suhtluse arendamisele.

Tekstirobotid on treenitud simuleerima vestlusi, vastama küsimustele, kirjutama sisu ja täitma mitmesuguseid teisi keelepõhiseid ülesandeid, lähtudes seejuures mudelile ette antud sisendist (viibast ehk promptist).

Kuidas erinevad tekstirobotid teistest TI süsteemidest?

Tekstirobotite eripära võrreldes teiste TI süsteemidega on juba nimetuse põhjal ilmne – tekstirobotid loovad ja töötlevad teksti. Kui tekstirobotite disainimisel on kasutatud loomuliku keele töötlust, siis näiteks pildiloome TI mudelite puhul on kasutusel teistsugused, nimelt masinnägemise alusmudelid. Nii on näiteks arvutinägemise süsteemid loodud visuaalsete andmete tõlgendamiseks ja töötlemiseks, aidates masinatel tuvastada objekte, analüüsida pilte ja langetada visuaalse sisendi põhjal otsuseid.

Tekstirobotite ülesanne on loomuliku keele töötlus – need loovad ja töötlevad teksti, erinevalt teistest TI süsteemidest, mis keskenduvad visuaalsete või ruumiliste andmete töötlemisele.

Robootika valdkonnas keskendub TI füüsilisele suhtlusele keskkonnaga, võimaldades masinatel juhtida liikumist, reageerida sensoorsele tagasisidele või lahendada ruumilisi ülesandeid. Need süsteemid kasutavad reaalajas otsuste langetamiseks andureid, kaameraid või muid andmevooge.

Tekstirobotid tuginevad nii treenides kui ka hiljem toimides pea eranditult tekstilistele andmetele. Treeningu käigus antakse neile ette tohutul hulgal kirjalikku sisu, mis võimaldab neil õppida grammatikat, süntaksit ja sõnade tähendusi erinevates kontekstides. Selline tekstipõhine treening muudab tekstirobotid väga tõhusaks keeleülesannetes, kuid vähem sobivad need muude andmetüüpide, näiteks heli või visuaalsete andmete töötlemiseks. Tekstipõhisusest hoolimata on mitmed levinud tekstirobotid (nt ChatGPT) ühendatud teiste alusmudelitega, mis suudavad tuvastada tekste piltidelt ja helidest, lisades nii tekstirobotile funktsioone ka väljaspool keeleülesandeid (näiteks on võimalik lahendada telefoniga tehtud pildi põhjal matemaatikaülesanne).

Ka tekstirobotite õppimismehhanismid ei ole samad mis teistes TI valdkondades. Tekstiroboteid treenitakse tavaliselt juhendamata või pooljuhendatud õppimise teel, kasutades suuri tekstipõhiseid andmekogusid. Tekstirobotite eesmärk on tuvastada keelemustreid – kuidas sõnad ja laused on üles ehitatud, et ennustada sõnade järjestuses iga järgmine sõna. Just see prognoosivõime aitab neil luua vastusena kasutaja sisendile sidusat teksti.

Tekstiroboteid treenitakse suurtel tekstipõhistel andmekogudel, mis võimaldab neil õppida grammatikat, süntaksit ja keelemustreid ning saada tõhusaks just tekstilistes ülesannetes.

Teised TI süsteemid, näiteks tugevdatud õppimist kasutavad mudelid, töötavad teistsuguses raamistikus, sest ei treeni staatiliste andmekogumitega, vaid õpivad keskkonnaga suheldes, saades tagasisidet n-ö preemia või karistuse kujul. Niimoodi treenitakse mh robootika ja arvutimängude valdkonna TI süsteeme, mis õpivad ära teatud strateegiad või käitumise, et aja jooksul maksimeerida oma tulemuslikkust või tasu. Näiteks õpib tugevdatud õppimise teel katse-eksituse meetodil TI, mis mängib malet, parandades iga partiiga oma otsustusprotsessi.

Kuigi tekstirobotid kuuluvad kitsasse TI-sse, siis tõlgendatakse neid tihti laiemana kui teisi generatiivseid TI-sid, näiteks pilte loovaid generatiivseid mudeleid. See tuleneb asjaolust, et tekstirobot suudab lahendada väga laia ampluaad ülesandeid, nagu uurimistöö kirjutamine, allikate otsimine, keeleõpe, tõlkimine, mis tahes teadusharus nõu andmine jne. Hoolimata sellest, et näiteks ChatGPT on võimeline ka piltidelt infot tuvastama ja isegi helilise kõne kujul vastama, on sellegipoolest tegu siiski kitsa TI mudeliga.

Kuidas kasutab tekstirobot andmeid oma mudelite täiustamiseks?

Selleks et treenida TI mudelit, peab olema võimalikult palju võimalikult häid andmeid. GPT-4o mudelil on 100 triljonit parameetrit. TI kasutab andmeid õppimiseks, tuvastades neis mustreid ja seoseid, optimeerides parameetreid ja kohandades neid nii, et mudel suudaks pakkuda võimalikult täpseid ennustusi.

Enesekontroll

Kolmandate osapoolte sisu nägemiseks palun nõustu küpsistega.