{"id":2003,"date":"2024-11-15T01:25:00","date_gmt":"2024-11-14T23:25:00","guid":{"rendered":"https:\/\/sisu.ut.ee\/ajakiri\/4754\/"},"modified":"2025-11-26T16:49:54","modified_gmt":"2025-11-26T14:49:54","slug":"4754","status":"publish","type":"post","link":"https:\/\/sisu.ut.ee\/ajakiri\/4754\/","title":{"rendered":"Teadlased \u00f5petavad keelemudelitele eesti keelt"},"content":{"rendered":"<p><?xml encoding=\"utf-8\" ?><\/p>\n<p><strong>Suuri keelemudeleid kasutavate vestlusrobotite, sisukokkuvo\u0303tjate ja muude selliste rakenduste kvaliteetseks toimimiseks on vaja, et mudelid oskaksid h\u00e4sti eesti keelt.<\/strong><\/p>\n<p>Tartu \u00dclikooli keeletehnoloogia kaasprofessor Kairit Sirts nentis, et tehisintellekti eesti keel k\u00f5lab tihti kunstliku ja puisena. Arvutiteaduse instituudi eestvedamisel hakatakse vabavaralisi keelemudeleid treenima senisest ladusamat eesti keelt k\u00f5nelema ja eesti kultuuri paremini m\u00f5istma.<\/p>\n<p>\u201eM\u00f5ned vabavaralised keelemudelid juba oskavad teatud m\u00e4\u00e4ral eesti keelt, kuid meie soov on panna keelemudel k\u00f5nelema nii, nagu inimesed tegelikult r\u00e4\u00e4givad. Iluk\u00f5ne asemel on eestlastele pigem omane konkreetsus ja lakoonilisus. Saame treenida mudelit Eesti kultuurikonteksti arvesse v\u00f5tma ja ka grammatikas parem olema,\u201c \u00fctles Sirts.<\/p>\n<p>Suurte tehnoloogiaettev\u00f5tete loodud keelemudelid on m\u00f5eldud massidele ja meil puudub nende \u00fcle kontroll. Nii ei saa n\u00e4iteks OpenAI ChatGPT-d kasutada konfidentsiaalsust n\u00f5udvates valdkondades nagu riigikaitse v\u00f5i tervishoid.<\/p>\n<p>Sirtsu s\u00f5nul on oluline hoida ja kasvatada meie teadlaskonnas suurte keelemudelite alast kompetentsi. Tehnoloogiaettev\u00f5tete jaoks ei ole eesti keele k\u00e4ek\u00e4ik ega kultuuritaust t\u00e4htis, seega tuleb ise nende asjade eest hea seista. \u201eT\u00e4nu uuele projektile saame t\u00e4iendada ka inimeste oskusi ja teadmisi, et mitte j\u00e4\u00e4da tehnoloogilise arengu juures pelgalt k\u00f5rvaltvaatajaks,\u201c s\u00f5nas ta.<\/p>\n<p>N\u00fc\u00fcd arendavadki Eesti teadlased vabavaralisi keelemudeleid ise edasi, et tulevikus oleks v\u00f5imalik luua eesti keelt oskavaid ja konteksti m\u00f5istvaid turvalisi ja kvaliteetseid tehisintellektirakendusi.<\/p>\n<p>Alanud projektis \u201eEesti keele toetus suurtes generatiivsetes vabavaralistes keelemudelites\u201c saavad kokku valdkonna Eesti tipud. Tartu \u00dclikoolist osalevad Kairit Sirts ja keeletehnoloogia professor Mark Fi\u0161el koos \u00fcli\u00f5pilastega, Tallinna Tehnika\u00fclikoolist l\u00f6\u00f6b kaasa k\u00f5netehnoloogia kaasprofessor Tanel Alum\u00e4e koos tudengitega, Eesti Keele Instituudist juhib t\u00f6\u00f6d keeletehnoloog Eleri Aedmaa.<\/p>\n<p>Kaks aastat kestvat projekti rahastatakse riiklikust programmist \u201eEesti keeletehnoloogia 2018\u20132027\u201c. Keelemudeleid hakatakse treenima Soomes asuvas P\u00f5hja-Euroopa v\u00f5imsaimas superarvutis LUMI. Esimeste tulemusteni eesti keelele kohandatud mudelitega loodetakse j\u00f5uda 2025. aasta juuniks.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Suuri keelemudeleid kasutavate vestlusrobotite, sisukokkuvo\u0303tjate ja muude selliste rakenduste kvaliteetseks toimimiseks on vaja, et mudelid oskaksid h\u00e4sti eesti keelt. Tartu \u00dclikooli keeletehnoloogia kaasprofessor Kairit Sirts nentis, et tehisintellekti eesti keel k\u00f5lab tihti kunstliku ja puisena. Arvutiteaduse instituudi eestvedamisel hakatakse vabavaralisi &#8230;<\/p>\n","protected":false},"author":813,"featured_media":2002,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[3,19],"tags":[],"class_list":["post-2003","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-aktuaalne","category-uudis"],"acf":[],"_links":{"self":[{"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/posts\/2003","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/users\/813"}],"replies":[{"embeddable":true,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/comments?post=2003"}],"version-history":[{"count":1,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/posts\/2003\/revisions"}],"predecessor-version":[{"id":2431,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/posts\/2003\/revisions\/2431"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/media\/2002"}],"wp:attachment":[{"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/media?parent=2003"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/categories?post=2003"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sisu.ut.ee\/ajakiri\/wp-json\/wp\/v2\/tags?post=2003"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}