Kalbos ekspertai: dirbtinio intelekto amžiuje kalba turi prisitaikyti prie pokyčių
Gyvename kalbos technologijų revoliucijos amžiuje, kai jos gali kurti rišlų tekstą, versti, spręsti sudėtingus uždavinius, su jomis net galime palaikyti pokalbį.
Vienas ryškiausių kalbos technologijų evoliucijos pasiekimų yra neuroniniais tinklais paremtas gilusis mašininis mokymasis, kurio pagrindu kuriami didieji kalbos modeliai, pavyzdžiui, 2022 m. pabaigoje „OpenAI“ kompanijos pristatytas „ChatGPT“ pokalbių robotas.
Technologijų evoliucija atneša naujų iššūkių kalbos industrijai, keičia kalbos ir kitų sričių tyrimų pobūdį ir metodologiją, net kai kurias profesijas.
Mokslininkams technologijos atveria naują tyrimų sritį
Dirbtinio intelekto (DI)tobulėjimas mokslininkams atveria duris, už kurių slepiasi menkai paliesta, tačiau itin aktuali kalbos technologijų tyrimų sritis. Kauno technologijos universiteto Socialinių, humanitarinių mokslų ir menų fakulteto (KTU SHMMF) kartu su Lietuvos švietimo istorijos muziejumi birželio 13-14 d. surengtoje konferencijoje „LTech 2024“ mokslininkai dalijosi atradimais apie kalbą ir jos iššūkius dirbtinio intelekto amžiuje.
Valstybinės lietuvių kalbos komisijos (iš Lietuvių kalbos prestižo stiprinimo programos lėšų) remiamoje konferencijoje kalbos ekspertai, tarp kurių ir žinomi mokslininkai bei profesoriai, dalijosi tyrimų rezultatais, metodologinėmis įžvalgomis ir patirtimi apie sparčiai besiplečiančią kalbos industriją bei dirbtinio intelekto pritaikymo galimybes.
Dirbtinio intelekto įtaka kalbai
Skaitmeninėje erdvėje dominuoja tos kalbos, kuriomis ekonomiškai stipriose valstybėse kalba dauguma žmonių, todėl kalbos technologijų tobulėjimas yra susijęs su kalbos standartizacijos klausimais, ypač kalbant apie pliuricentrines kalbas.
Freiburgo universiteto (Vokietija) profesoriaus dr. Christian Mair atlikto tyrimo metu paaiškėjo, kad mažiau dominuojantiems pliuricentrinių kalbų standartams (pavyzdžiui, britų anglų kalbos) tenka mažiau dėmesio kuriant didžiuosius kalbos modelius, o generatyvinio dirbtinio intelekto tekstuose taikomi labiau paplitę kalbos variantai.
Įdomu tai, kad pati kalba taip pat daro savotišką įtaką dirbtinio intelekto įrankiams. Pasitelkiant tam tikros struktūros ir turinio pasakojimo formos tekstus, vadinamus dirbtinio intelekto „užkalbėjimais“ (angl. jailbreaks), galima apeiti didžiųjų kalbos modelių draudžiamo turinio apribojimus.
„Jei sąmokslo teorijos įtikina žmones, „nulauždamos“ jų kritinio mąstymo apsaugos mechanizmus, lygiai tokiomis pačiomis priemonėmis sukonstruoti užkalbėjimai išjungia didžiųjų kalbos modelių algoritminius apribojimus“, teigia Kauno technologijos universiteto (KTU) mokslo grupės „Skaitmeninė kultūra, komunikacija ir medijos“ pagrindinis tyrėjas prof. dr. Saulius Keturakis. Kalbos technologijos kopijuoja mūsų bendravimą, o kartu ir klaidas bei silpnąsias vietas.
Mažai išteklių turinčių kalbų problema
Jau šiandien pastebima nelygybė tarp dirbtinio intelekto įrankių naudotojų. Nors kalbos technologijų bijoti nereikia, dirbtinis intelektas gali visuomenėje sukurti socialinę atskirtį tarp mažiau ir daugiau išsilavinusiųjų. Pastarieji, mokėdami daug išteklių turinčių kalbų, turi prieigą prie daugiau skaitmeninių duomenų.
Didieji kalbos modeliai, tokie, kaip „ChatGPT“, yra taikomi ir vertimo srityje, nors generatyviniai DI įrankiai nėra sukurti kaip vertimo sistemos.
Pasak KTU mokslininkės, mokslo grupės „Kalba ir technologijos“ tyrėja ir pirmosios „LTech2024” konferencijos organizacinio komiteto pirmininkės doc. dr. Dainoros Maumevičienės, kalba ir technologijos visada eina greta nuo to momento, kai žmogus išraižė tekstą Gilgamešo molio lentelėse ar hieroglifais.
„Kalba ir technologijos sąlygoja nuolatinę abipusę kaitą, plėtrą, raidą ir naujų technologinių sprendimų kūrimą. Dėl to kalbos, kartu ir vertimo, industrija per pastaruosius dešimt metų stipriai pasikeitė. Nepaisant to, kokybiško vertimo, ypač į lietuvių kalbą, mašininio vertimo sistemos ir dirbtinis intelektas šiuo metu ir per artimiausią laikotarpį negali pateikti dėl to, kad lietuvių kalba yra mažai išteklių turinti kalba. O tam, kad mašininio vertimo sistemos galėtų pasiūlyti aukštos kokybės vertimus, reikia ne tik daug finansinių investicijų, bet ir iniciatyvų sukurti pakankamai skaitmenizuotų ir atvirų išteklių turinčius didžiuosius kalbos modelius“, – sako ji.
DI ir lietuvių kalba
Lyginant su didelėmis kalbomis, ypač anglų, lietuvių kalba turi daug mažiau skaitmeninių išteklių ir duomenų rinkinių, nors yra viena iš oficialiųjų Europos Sąjungos kalbų.
„Lietuvių kalba visame pasaulyje maždaug kalba iki 4 milijonų gyventojų. Palyginus su kinų, anglų, vokiečių, ispanų ar kitomis „didelėmis“ kalbomis, net ir ukrainiečių, kurių yra 45 milijonai, kalbančiųjų bendruomenėmis, misija ir užduotis sukurti kokybiškai veikiančias mašininio vertimo ar DI sprendimais grindžiamas vertimo sistemas yra beveik neįmanoma tiek dėl mažos investicinės grąžos, tiek dėl mažos lietuvių kalba kalbančiųjų bendruomenė“, – sako D. Maumevičienė.
Pasak VLKK narės, KTU mokslo grupės „Kalba ir technologijos“ pagrindinės tyrėjos prof. dr. Ramunės Kasperės, didieji kalbų modeliai ir generatyvinis dirbtinis intelektas tekstus lietuvių kalba generuoja palikdami daug klaidų, netikslumų, neegzistuojančių žodžių, jau nekalbant apie tai, kad sugeneruotas turinys yra bendrinio pobūdžio.
„Pateikus užklausą, susijusią su tuo, kas nėra plačiai aprašyta skaitmeninėje erdvėje lietuvių kalba, rezultatai yra labai abstraktūs, tinkantys apibūdinti daug panašių konceptų arba pateikiama informacija yra klaidinga“, – sako ji.
Nors didelė visuomenės dalis technologijomis gali naudotis ir globaliąja anglų kalba, unikalią kultūrą ir tautinę tapatybę galime perteikti tik savo kalba.
„Jei siekiame išsaugoti lietuvių kalbą, vien mokslininkų pajėgų ir verslo investicijų neužtenka, reikalingi politiniai sprendimai ir finansavimas valstybės mastu. Svarbu skaitmenizuoti jau turimus išteklius, kurti atviros prieigos duomenų rinkinius ir tekstynus, nes tik dideli duomenų kiekiai gali užtikrinti skaitmeninių išteklių plėtrą lietuvių kalba“, – sako R. Kasperė.
Daugiau apie įvykusią konferenciją, LTech2024 konferencijos puslapyje: https://ltech.ktu.edu/
„Palangos tilto“ redakcija
Jūsų komentaras:
Taip pat skaitykite
Apie tualetą, tiesą ir pagarbą bei dirbtinio intelekto rašytą tekstą su litais
"Palangos tilto" informacija, 2025 05 22 | Rubrika: Miestas
Palangos miesto savivaldybė gegužės 20 dieną oficialiai kreipėsi į tinklalapio „Mūsų Palanga“ administratorių bei Seimo nario Karolio Neimanto patarėją Matą Gailevičių, atstovaujančius „Nemuno aušrai“, reikalaudami paneigti viešai paskleistą tikrovės neatitinkančią informaciją dėl tualeto Meilės alėjoje remonto.
Džiaugiamės, kad Palangos senosios gimnazijos abiturientę, IVC kl. gimnazistė Ilzė Galdikaitė, Respublikiniame viešosios kalbos anglų kalba konkurse laimėjo II-ąją vietą.
Kalbos ekspertai: dirbtinio intelekto amžiuje kalba turi prisitaikyti prie pokyčių
2024 07 04 | Rubrika: Miestas
Gyvename kalbos technologijų revoliucijos amžiuje, kai jos gali kurti rišlų tekstą, versti, spręsti sudėtingus uždavinius, su jomis net galime palaikyti pokalbį.
Socialinės apsaugos ir darbo ministerijoje vyksta Neįgaliųjų reikalų departamento organizuojamas renginys – diskusija „Asmenų su psichosocialine ar intelekto negalia teisių apsauga ir pokyčiai Lietuvoje ir Islandijoje“.
Negalia būna ne vien fizinė, bet ir proto, psichikos ar intelekto. Higienos instituto duomenimis, pernai Lietuvoje psichikos ir elgesių sutrikimų turėjo 12,1 proc. suaugusių šalies gyventojų.
Seniausio Palangos viešbučio direktorius Kristupas Šliogeris: „Gyvename aukso amžiuje!“ (NUOTRAUKOS)
Linas JEGELEVIČIUS, 2022 02 06 | Rubrika: Miestas
„Palangos žuvėdra“ – seniausias, ilgiausią istoriją Palangoje skaičiuojantis viešbutis – turi kuo pasididžiuoti. Tai – ne tik jūra alsuojantis viešbutis Meilės alėjoje. Pastaraisiais metais viešbutis „Palangos žuvėdra“ pirmajame dešimtuke tarp visų šalies viešbučių rikiuojasi pagal keletą rodiklių – sumokėtus mokesčius ir vidutinį darbo užmokestį. Jau 12 metų viešbučiui, virtusiam iš Pelenės į...
Profesorius Vladas Žulkus: „Man lengviausia būtų „nupiešti“ Palangos gyvenimą XII amžiuje!”
Linas JEGELEVIČIUS, 2021 08 17 | Rubrika: Pajūrio žurnalas
Palangoje gyvena profesorius, habilituotas daktaras, akademikas – Vladas Žulkus. Vienintelis toks Palangoje! Didžiąją savo gyvenimo dalį jis pašventė tyrinėjimams: povandeninei ir marinistinei Baltijos jūros archeologijai, viduramžių miestų archeologijai, vakarų baltų kultūrai bei baltų ir skandinavų kultūriniams ryšiams. „Jeigu burtų lazdele atsuktumėme laiko ratą 600 metų atgal, kaip...
Kas bendro tarp santechniko iš Nigerijos ir dirbtinio intelekto?
"Palangos tilto" informacija, 2019 03 25 | Rubrika: Politikų, lyderių žodis
Visiems gerai žinomas posakis – konkurencija skatina progresą. Jo teisingumu galėjome įsitikinti visai neseniai – JAV prezidentas Donaldas Trumpas savo įsaku „Amerikos dirbtinio intelekto (DI) iniciatyva“ nurodė administracijai visus federalinės vyriausybės išteklius skirti inovacijų dirbtinio intelekto srityje skatinimui. Atrodo natūralus žingsnis, nes visas...
Pasitikrinti lietuvių kalbos žinias pageidauja vis daugiau palangiškių
Rasa GEDVILAITĖ, 2017 02 27 | Rubrika: Miestas
Praėjusį penktadienį šalies gyventojai buvo pakviesti pasitikrinti savo lietuvių kalbos žinias – buvo rašomas jubiliejinis – dešimtasis – Nacionalinis diktantas. Kurorte jis buvo rašomas Palangos miesto savivaldybės viešojoje bibliotekoje, bet kiti galėjo jį rašyti ir darbo vietoje ar namuose, klausant tiesioginės transliacijos per...
Svarbiausia kalba tapo anglų, o kitos – šešėlyje?
Rasa GEDVILAITĖ, 2016 10 17 | Rubrika: Jūros vaikai
Mokyklose karaliauja anglų ir rusų kalbos, taip į šešėlį nustumdamos vokiečių ir prancūzų. Bent jau taip galima pagalvoti, pažvelgus, jog mokiniai jau ilgą laiką nebesirenka mokytis šių kalbų kaip pirmųjų užsienio kalbų, o ir egzaminų nelaiko. Tuo tarpu anglų kalbos egzaminą norinčiųjų laikyti skaičius kasmet vis auga. Niekas neabejoja, jog anglų kalba yra tapusi...
