Vsaj 21 evropskim jezikom grozi digitalno izumrtje
Vrhunski evropski strokovnjaki s področja jezikovnih tehnologij v študiji opozarjajo, da večina evropskih jezikov v digitalni dobi najverjetneje ne bo preživela
V novi študiji vrhunski strokovnjaki s področja jezikovnih tehnologij ugotavljajo, da večini evropskih jezikov grozi digitalno izumrtje. Pri ocenjevanju ravni podpore jezikovnih tehnologijam za 30 od približno 80 evropskih jezikov so strokovnjaki prišli do zaključka, da je ta za 21 od 30 ocenjevanih jezikov “neobstoječa” ali v najboljšem primeru “nizka”. Študija je bila izvedena v okviru evropske mreže odličnosti META-NET, ki jo sestavlja 60 raziskovalnih centrov v 34 državah.
Več kot 200 strokovnjakov je v študiji, ki je dokumentirana v seriji 30 belih knjig projekta META-NET (na voljo je v tiskani in spletni obliki), za vsakega od jezikov ocenjevalo podporo jezikovnim tehnologijam na štirih področjih: strojno prevajanje, govorne tehnologije, procesiranje pisnega jezika in dostopnost jezikovnih virov. Skupaj 21 od 30 jezikov (70 %) so strokovnjaki vsaj na enem od področij uvrstili v najnižjo kategorijo z “neobstoječo ali nizko podporo”. Nekaj jezikov, npr. islandščina, latvijščina, litvanščina in malteščina, je dobilo najnižjo oceno v vseh kategorijah. Na drugi strani lestvice je bila le angleščina ocenjena kot jezik z “dobro podporo”, medtem ko nobeden od jezikov ni dobil ocene “odlična podpora”. Angleščini sledijo nizozemščina, francoščina, nemščina, italijanščina in španščina kot jeziki s “povprečno podporo”, jeziki kot baskovščina, bolgarščina, katalonščina, grščina, madžarščina, poljščina in tudi slovenščina pa so bili ocenjeni z “delno” oz. “fragmentarno podporo”, kar jih uvršča v niz ogroženih jezikov.
“Rezultati študije so alarmantni. Večina evropskih jezikov je slabo opremljenih, nekateri so popolnoma zapostavljeni. V tem smislu preživetje mnogih naših jezikov pravzaprav še ni zagotovljeno,” pravi profesor Hans Uszkoreit, koordinator mreže META-NET, znanstveni direktor DFKI (Nemški raziskovalni center za umetno inteligenco) in sourednik študije. Drugi sourednik, dr. Georg Rehm (DFKI) dodaja: “Gre za dramatične razlike pri podpori jezikovnim tehnologijam, tako med samimi evropskimi jeziki kot med različnimi tehnološkimi področji. Vrzel med “velikimi” in “malimi” jeziki je vedno širša. Zagotoviti moramo, da bodo vsi manjši in zapostavljeni jeziki opremljeni z nujnimi temeljnimi tehnologijami, sicer so ti jeziki obsojeni na digitalno izumrtje.”
Rezultat jezikovnih tehnogij so računalniške aplikacije, ki znajo procesirati človeški govorjeni ali pisni jezik. Znani zgledi jezikovnotehnoloških računalniških programov so denimo črkovalniki in slovnični pregledovalniki, interaktivni osebni pomočniki na pametnih telefonih (npr. Siri na iPhonu), telefonski dialoški sistemi, strojni prevajalniki, spletni iskalniki ter sintetizatorji govora v avtomobilskih navigacijskih sistemih. Danes se jezikovnotehnološki sistemi v prvi vrsti opirajo na statistične metode, za katere so potrebne izjemno velike količine pisnega in govorjenega gradiva. Predvsem pri jezikih z relativno majhnim številom govorcev je težko zbrati potrebne količine podatkov. Poleg tega imajo statistični jezikovnotehnološki sistemi glede kvalitete svoje notranje meje, kar je denimo mogoče opaziti pri zabavnih prevodih, ki jih včasih proizvedejo spletni strojni prevajalniki.
Evropa je uspela odstraniti skoraj vse meje med svojimi državami. Ena meja pa še vedno ostaja in ta se zdi takorekoč nepremagljiva: nevidne jezikovne pregrade preprečujejo prost pretok znanja in informacij. Ovirajo tudi dolgoročni cilj vzpostavljanja enotnega digitalnega trga, ker zaustavljajo prost pretok dobrin, izdelkov in storitev. Čeprav jezikovne tehnologije ponujajo možnost, da se s pomočjo sodobnih prevajalnih sistemov teh jezikovnih meja znebimo, rezultati študije mreže META-NET jasno kažejo, da mnogi evropski jeziki na to še niso pripravljeni. Pri sedanjih tehnologijah obstajajo precejšnje vrzeli, ker se raziskovalne in razvojne aktivnosti osredotočajo predvsem na angleščino, zaradi pomanjkanja volje in finančnih sredstev, a tudi zaradi pomanjkanja jasne raziskovalne in tehnološke vizije.
V Evropi je potrebna obsežna skupna akcija, v okviru katere bi ustvarili manjkajoče tehnologije in jih hkrati prenesli na večino evropskih jezikov. Za skupinsko soočenje s tem velikanskim izzivom, ki bi moral vključiti tako Evropsko unijo in njene članice kot tudi industrijo, obstajajo dobri razlogi. Ti zajemajo predvsem visoko finančno breme glede na število prebivalcev pri manjših jezikovnih skupnostih, potrebo po prenosu tehnologij med jeziki, pomanjkanje interoperabilnosti pri virih, orodjih in storitvah, ter dejstvo, da jezikovne meje pogosto ne sovpadajo s političnimi mejami. Evropa mora dejavno pripraviti svoje jezike na digitalno dobo, saj so dragocen del naše kulturne dediščine in kot taki zaslužijo, da jim zagotovimo preživetje v prihodnosti.
Jezikovne tehnologije: ozadje
Jezikovne tehnologije nam že zdaj nudijo podporo pri vsakodnevnih opravilih, kot je pisanje elektronskih sporočil ali pri kupovanju vstopnic. Izkoriščamo jih, ko iščemo po spletnih straneh in jih prevajamo, ko uporabljamo črkovalnike in slovnične pregledovalnike v urejevalnikih besedil, ko v avtu upravljamo z informacijsko-zabavnimi sistemi ali na telefonih poizvedujemo z glasovnimi ukazi, ko pregledujemo priporočila v spletnih knjigarnah ali ko sledimo navodilom, ki jih izgovarja navigacijska aplikacija na pametnem telefonu. V bližnji prihodnosti se bomo lahko pogovarjali z računalniškimi programi, tudi z napravami in stroji, vključno z dolgo pričakovanimi storitvenimi roboti, ki bodo kmalu vstopili v naše domove in delovne prostore. Kjerkoli bomo – ko bomo potrebovali informacijo, bomo po njej enostavno povprašali, in ko bomo potrebovali pomoč, jo bomo le naglas zahtevali. Odprava komunikacijskih ovir med ljudmi in tehnologijo bo spremenila naše svetove.
Jezikovne tehnologije so danes splošno priznane kot eno od ključnih področjih rasti v informacijskih tehnologijah. Velike mednarodne korporacije kot Google, Microsoft, IBM in Nuance so vložile veliko sredstev v to področje. Na drugi strani se je v Evropi na stotine malih in srednjih podjetij specializiralo za določene tipe jezikovnotehnoloških aplikacij in storitev. Jezikovne tehnologije omogočajo ljudem sodelovanje, učenje, poslovanje in deljenje znanja – preko jezikovnih meja in neodvisno od računalniškega znanja.
Serija belih knjig META-NET
Serija belih knjig META-NET z naslovom “Jeziki v evropski informacijski družbi” vsebuje poročilo o stanju 30 evropskih jezikov na področju jezikovnih tehnologij in pojasnila glede najbolj perečih tveganj in možnosti. Serija zajema vse uradne jezike držav članic Evropske unije in nekaj drugih jezikov, ki jih govorimo v Evropi. Čeprav obstaja veliko število dragocenih in obsežnih znanstvenih študij o različnih vidikih jezikoslovja in tehnologij, do sedaj ni bilo celovite zbirke, v kateri bi bili predstavljene glavne ugotovitve in izzivi za posamezni jezik z ozirom na tehnološko podprto večjezično Evropo. Serija belih knjig META-NET zapolnjuje to vrzel. V mreži META-NET lahko zdaj pokažemo, zakaj se večina jezikov sooča z resnimi težavami in izpostavimo najbolj pereče pomanjkljivosti. Serijo je pomagalo pripraviti več kot 200 avtorjev in sodelavcev.
Bele knjige so bile napisane za naslednje evropske jezike: angleški, baskovski, bolgarski, češki, danski, estonski, finski, francoski, galicijski, grški, hrvaški, irski, islandski, italijanski, katalonski, latvijski, litvanski, madžarski, malteški, nemški, nizozemski, norveški (bokmal in nynorsk), poljski, portugalski, romunski, slovaški, slovenski, srbski, španski in švedski. Vse bele knjige so napisane v jeziku, o katerem poročajo, celotna vsebina je prevedena tudi v angleščino.
O META-NET in META
Mrežo odličnosti META-NET sestavlja 60 raziskovalnih centrov iz 34 držav in je namenjena zagotavljanju tehnoloških temeljev večjezične evropske informacijske družbe. Mrežo sofinancira Evropska komisija v okviru štirih povezanih projektov.
META-NET sodeluje pri oblikovanju združenja META (Multilingual Europe Technology Alliance), Tehnološke zvezo za večjezično Evropo. V združenju je več kot 600 organizacij iz 55 držav, med njimi so raziskovalni centri, univerze, mala in srednja podjetja ter več velikih podjetij.