Valitsus otsustas eraldada miljon eurot masintõlketarkvara arendamiseks ning 400 tuhat eurot selleks, et luua automaatne eestikeelsete subtiitrite lisamise võimalus telesaadetele.
Haridus- ja teadusminister Mailis Reps märkis, et keeletehnoloogia võimalused aitavad viia kiiresti mitmekeelset infot kõigi Eesti inimesteni. „Vajadus selle järele on suur, mõeldes kasvõi kevadisele COVID-19 kriisile,“ ütles Reps. „Arenguhüpe keeletehnoloogias toob tõhusama eestikeelse toe ka nutiseadmetesse, mis suhtlevad inimestega ju üha enam.“
Masintõlketarkvara valmib järgmise aasta lõpuks ja aitab reaalajas ühe hiireklõpsuga tõlkida veebilehti, eri liiki dokumente ja mahukaid tekstihulki. Masintõlketarkvarale lisatakse ka kõnetehnoloogia, mis võimaldab automaatselt suulist kõnet üles kirjutada ja tõlkida. Avaliku sektori masintõlge arendatakse võimalikult mitmekeelseks, näiteks eesti-inglise-eesti, eesti-vene-eesti, eesti-saksa-eesti. Uuringute põhjal on masintõlge üldjuhul 15–20% kiirem, kuid mõne kitsa valdkonna teksti puhul – näiteks COVID-19-teemalised – võib masintõlge olla isegi kuni poole kiirem. Tehnoloogiate arengut arvestades suureneb masintõlke tõhusus aja jooksul veelgi.
Automaatne eestikeelsete subtiitrite lisamise võimalus telesaadetele parandab info kättesaadavust neile, kes ei saa enamikku eesti keeles kõneldavaid otsesaateid jälgida, näiteks vaegkuuljatele. Järgmiseks suveks valmiv teenus võimaldab kasutajal valida teleripuldilt eestikeelsed subtiitrid, mille peale aktiveeritakse reaalajalised subtiitrid. Esmalt rakendatakse uut võimalust uudiste, pressikonverentside, valimisdebattide jms puhul.
ise saan hakkama 10-s keeles, tuleb kasutada ka tõlkureid. Üks on muidugi Kuugel, kuid on ka suulised tõlkurid kasutusele tulnud. Levinumaid keeli tõlgivad nad otse, ilma veebiühenduseta, üle 100 keele ka veebi abil. Tõlkurite tootjad tagavad omasõnu küll 97%-lise vastavuse, kuid seda levinumate keelte ja lihtsate lausete puhul.
Eesti keel on samuti üks mahajäänutest, eesti keelest korea keelde ja siis tagasi tõlkides on vastavus juba nigel, et otsetõlkeks ei kõlba. Sest tõlgitakse teiste keelte vahendusel ning mida rohkem on vahenduskeeli, seda vigasem saab tulemus. Kui viitsin, siis panen siia mõned näited pisut hiljem.
Just selleks on RAHA vaja. Kõigepealt on vaja suurendada sõnastikku ja seejärel tähendusvarjundite suunamist abisõnadele toetudes. Ise arvan, et 400000-st jääb väheks, taolised tarkvarad nõuavad miljoneid.
Kuugli veebitõlkuri vahendusel saadud tagasitõlked meile hästituttavale lausele Kevadest:
Kui Arno isaga koolimajja jõudis, olid tunnid juba alanud.
.
inglise: Selleks ajaks, kui Arno koos isaga kooli jõudis, olid tunnid juba alanud.
vene: Selleks ajaks, kui Arno isaga kooli tuli, olid tunnid juba alanud.
saksa: Kui Arno isaga kooli tuli, olid tunnid juba alanud.
soome: Selleks ajaks, kui Arno koos isaga kooli jõudis, olid tunnid juba alanud.
hiina: Kui Arno läks isaga kooli, oli tund juba alanud.
jaapani: Selleks ajaks, kui Arno koos isaga kooli jõudis, olid tunnid juba alanud.
baski: Selleks ajaks, kui Arno koos isaga kooli jõudis, olid tunnid alanud.
samoa: Selleks ajaks, kui Arno isaga kooli jõudis, olid tunnid juba alanud.
.
Nagu näha, 100% vastavust pole, kuid selle ligi on ja arusaadav on see lause igas keeles. Hiinakeelne ainsus on tingitud nende mõistemärkidest. Samuti esineb hiinas läks (mitte koolist lähtudes), mitte jõudis/tuli. Venes puudub järelikult vaste прибыл. Samas on olid juba alanud täpselt igasse keelde sisse söödetud.
.
Vaatan ka lihtsat lauset, kus tegemist ümberütleva väljendiga:
Siis peavad pead lendama hakkama!
.
inglise: Siis peate hakkama lendama!
vene: Siis on teie lendamise aeg!
saksa: Siis peate hakkama lendama!
soome: Siis peate hakkama lendama!
hiina: Siis peate hakkama lendama!
jaapani: Siis peate lendu alustama!
baski: Siis peate hakkama lendama!
samoa: Siis peaksite lendama hakkama!
.
Väiksed erinevused on, kuid mitte üskki keel ei taba ära lause mõtet – siis laseme teid lahti!
isegi päid ei taheta hakata lennutama, vaid sind ennast!
.
Seda ma räägingi, et tähenduste eristamisi on vaja rohkem sisse sööta, mõnd tervikuna, mõnd mõne abisõna või kaastähenduse abil. Kui muudes lausetes on juttu kellegi tööga mitteoimetulekust, siis ütleb juba see ette, et mitte ei hakka sina lendama, vaid keegi lastakse lahti. Sinna ongi neid miljoneid vaja.
1,4 mili jääb väheks. Lisaks toksijatele on vaja tunduvalt rohkem kaasata keeleteadlasi. Las 20 jätavad oma praeguse uinumise pooleli ja asuvad tähendusvälju korralikult välja töötama ja rühmitama. Ning siis antakse need üle toksijatele ja saamegi suurepärase tarkvara valmis. Kerge ja kiire see ei saa olema, kuid ka praegused magistrid ja tohtrid saaks kõva palgalisa ning töötaks huviga. Mina jään välja, sest olen surmaeelik ja harjunud jalad seinal vedelema.
Õige otsus. Olen kõigega rahul mis valitsus teeb sisepoliitikas aga välispoliitikas soovitan mitte toppida oma nina teiste riikide siseasjadesse.