Cel puțin 21 de limbi europene în pericol de extincție în spațiul digital
Un studiu realizat de experți europeni de vârf în domeniul tehnologiei limbajului avertizează că, cel mai probabil, cele mai multe limbi europene nu vor supraviețui erei digitale
Un nou studiu realizat de specialiști din Europa în domeniul tehnologiei limbajului arată că cele mai multe limbi europene sunt în pericol de dispariție în spațiul digital. În urma evaluării nivelului de dezvoltare a tehnologiei limbajului pentru 30 dintre cele aproximativ 80 de limbi europene, experții au tras concluzia că susținerea digitală pentru 21 dintre cele 30 de limbi este „inexistentă” sau, în cel mai bun caz, „slabă”. Studiul a fost realizat de către META-NET, o rețea de excelență europeană formată din 60 de centre de cercetare din 34 de țări.
Studiul, elaborat de peste 200 de experți și documentat în 30 de volume ale Seriei de studii META-NET (disponibilă în format electronic și tipărit), a evaluat nivelul actual de susținere a tehnologiei limbajului pentru fiecare limbă în patru domenii diferite: (1) traducerea automată, (2) interacțiune prin vorbire, (3) analiză de text și (4) disponibilitatea resurselor lingvistice. 21 de limbi din totalul de 30 analizate (70%) au fost plasate de către experți în cea mai slabă categorie, cu „susținere slabă sau inexistentă”, la cel puțin unul dintre cele patru domenii. Multe dintre limbi, precum islandeza, letona, lituaniana și malteza, au primit acest scor slab la toate cele patru domenii. La celălalt capăt al spectrului, nicio limbă nu a fost considerată ca având „susținere excelentă”, doar limba engleză a fost evaluată ca având „susținere bună”, urmată de limbi precum franceza, germana, italiana, olandeza și spaniola cu „susținere moderată”. Limbi precum basca, bulgara, catalana, greaca, polona și ungara au „susținere fragmentară”, ceea ce le plasează printre limbile cu risc ridicat.
„Rezultatele studiului nostru sunt deosebit de alarmante. Majoritatea limbilor europene au foarte puține resurse, iar unele sunt complet neglijate. În acest sens, existența multora dintre limbile noastre nu este garantată pentru viitor.”, spune profesorul Hans Uszkoreit, coordonatorul META-NET, director științific al DFKI (Centrul de Cercetare în Inteligență Artificială din Saarbrücken, Germania) și co-editor al studiului. Cel de al doilea co editor al studiului, dr. Georg Rehm (DFKI), adaugă: „Există diferențe dramatice în ce privește susținerea tehnologiei limbajului între diversele limbi europene precum și între diversele arii tehnologice. Distanța dintre limbile „mari” și „mici” crește în continuare. Trebuie să ne asigurăm că vom echipa toate limbile lipsite de resurse cu tehnologiile de bază necesare, altfel aceste limbi vor fi condamnate dispariției în spațiul digital.”
Domeniul tehnologiei limbajului produce software care poate procesa limbajul uman scris sau vorbit. Exemple bine cunoscute de tehnologii ale limbajului includ corectoare de ortografie și gramatică, asistenți personali interactivi pentru smartphone-uri (de exemplu Siri pentru iPhone), sisteme de dialog care funcționează prin telefon, sisteme de traducere automată, motoare de căutare pe internet și voci sintetice folosite pentru sistemele de navigație. Sistemele de tehnologie a limbajului de astăzi se bazează pe metode statistice care au nevoie de cantități incredibil de mari de date scrise sau vorbite. Este greu de adunat cantitatea necesară de date, în special pentru limbile cu relativ puțini vorbitori. Mai mult, sistemele de tehnologie a limbajului bazate pe metode statistice sunt limitate în corectitudine, fapt ce poate fi observat, de exemplu, în traducerile incorecte produse de sisteme de traducere automată online, care stârnesc adesea zâmbete.
Europa a reușit să elimine aproape toate granițele dintre țările sale. Mai există însă o graniță, și aceasta pare impenetrabilă: granița invizibilă a barierelor de limbaj este una care împiedică transferul liber de cunoaștere și informație. Această graniță dăunează scopului pe termen lung de a stabili o piață digitală comună, deoarece împiedică transferul de bunuri, produse și servicii. Deși tehnologia limbajului are potențialul de a elimina barierele de limbaj prin sisteme de traducere automată moderne, rezultatele studiului META-NET arată foarte clar faptul că multe limbi europene nu sunt încă pregătite pentru acest pas. Există goluri tehnologice semnificative datorită concentrării efortului de cercetare și dezvoltare în principal pe limba engleză, a lipsei de angajament și de resurse financiare și a lipsei unei viziuni clare de cercetare și dezvoltare tehnologică.
Trebuie făcut un efort coordonat, pe scară largă, în întreaga Europă, pentru a crea tehnologiile lipsă și pentru a transfera tehnologii către majoritatea limbilor. Există motive puternice pentru a aborda această provocare imensă printr-un efort comunitar care să implice Uniunea Europeană, statele membre și asociate, dar și parteneri industriali. Aceste motive includ costul financiar crescut pe cap de locuitor pentru comunitățile lingvistice mici; necesitatea de transfer tehnologic între limbi; lipsa de interoperabilitate a resurselor, uneltelor și serviciilor; faptul că granițele lingvistice nu coincid întotdeauna cu granițele politice. Europa trebuie să acționeze și să-și pregătească limbile pentru era digitală. Acestea sunt o parte importantă a moștenirii noastre culturale și, ca atare, merită apărate. Pe 26 septembrie Consiliul European serbează Ziua Europeană a Limbilor, o zi care recunoaște importanța păstrării și dezvoltării moștenirii culturale bogate a continentului nostru. Rezultatele META-NET sunt un semnal de alarmă pentru provocările și posibilitățile cu care se confruntă moștenirea noastră lingvistică în era informațională.
Tehnologia limbajului: o privire de ansamblu
Tehnologia limbajului ne ajută deja în activități zilnice precum scrierea de e-mail-uri sau cumpărarea de bilete. Beneficiem de tehnologia limbajului atunci când căutăm sau traducem pagini web, când folosim facilitățile de verificare de ortografie și gramaticală ale unui procesor de text, când dăm comenzi vocale aparaturii din mașină sau telefonului mobil, când primim recomandări în librării online sau când urmăm indicațiile unei aplicații de navigare prin GPS. În viitorul apropiat vom putea vorbi cu programele de calculator sau cu aparatele electrocasnice, inclusiv cu roboții de servicii îndelung așteptați care vor ajunge în curând în birourile și casele noastre. Oriunde ne aflăm, atunci când vom avea nevoie de informație, o vom cere pur și simplu, iar când vom avea nevoie de ajutor îl vom solicita cu voce tare. Eliminarea barierei de comunicare dintre oameni și tehnologie va schimba lumea.
Tehnologia limbajului este considerată astăzi unul din domeniile cheie de dezvoltare în tehnologia informației. Corporații internaționale mari precum Google, Microsoft, IBM și Nuance au investit substanțial în acest domeniu. În Europa, sute de întreprinderi mici și mijlocii s-au specializat în diverse aplicații și servicii de tehnologia limbajului. Tehnologia limbajului le permite oamenilor să colaboreze, să învețe, să facă afaceri și să împărtășească cunoașterea peste granițele limbajului, independent de competențele de utilizare a calculatorului.
Seria de studii META-NET
Seria de studii META-NET, „Limbile în societatea informațională europeană”, descrie starea a 30 de limbi europene din perspectiva tehnologiei limbajului și explică cele mai urgente riscuri și oportunități. Seria acoperă toate limbile oficiale ale statelor membre ale UE și o serie de alte limbi vorbite în Europa. Deși există o serie de studii științifice importante și comprehensive asupra unor aspecte diverse ale limbajului și tehnologiei, nu a existat până acum un compendiu general, pe înțelesul tuturor, care să prezinte, pentru fiecare limbă, principalele descoperiri și provocări cu privire la o Europă multilingvă susținută de tehnologie. Seria de studii META-NET umple acest gol. META-NET poate acum să arate de ce cele mai multe limbi au probleme serioase și să indice cu precizie cele mai amenințătoare lipsuri ale acestora în tehnologia limbajului. În total, peste 200 de autori și colaboratori au ajutat la pregătirea studiilor.
Studiile META-NET au fost scrise pentru următoarele limbi europene: bască, bulgară, catalană, croată, cehă, daneză, engleză, estonă, finlandeză, franceză, galițiană, germană, greacă, islandeză, irlandeză, italiană, letonă, lituaniană, maghiară, malteză, norvegiană (Bokmål și Nynorsk), olandeză, poloneză, portugheză, română, sârbă, slovacă, slovenă, spaniolă, și suedeză. Studiile pentru fiecare limbă sunt scrise în limba respectivă și includ o traducere completă în limba engleză.
Despre META-NET și META
META-NET, o rețea de excelență formată din 60 de centre de cercetare din 34 de țări, are ca scop construirea fundamentului tehnologic pentru o societate europeană informațională multilingvă. Rețeaua META-NET este finanțată parțial de Uniunea Europeană prin intermediul a patru proiecte.
META-NET promovează Alianța Tehnologică pentru o Europă Multilingvă (Multilingual Europe Technology Alliance – META). Peste 600 de organizații din 55 de țări, incluzând centre de cercetare, universități, companii mici și mijlocii și companii de mare anvergură, s-au alăturat deja acestei alianțe tehnologice.