Almeno 21 Lingue Europee a Rischio di Estinzione Digitale
I Maggiori Esperti Europei di Tecnologie Linguistiche Avvertono: la maggior parte delle lingue europee a rischio di sopravvivenza nell’era digitale
Secondo uno studio condotto dai maggiori esperti Europei nel settore delle tecnologie linguistiche, la maggior parte delle lingue europee è di fronte al rischio di “estinzione digitale”. In base a una valutazione del grado di supporto offerto dalle tecnologie linguistiche per 30 delle circa 80 lingue europee, gli esperti concludono che il supporto digitale per 21 delle 30 lingue studiate è “inesistente” o “debole”. Lo studio è stato condotto da META-NET, una rete di eccellenza che consiste di 30 centri di ricerca in 34 paesi europei.
Lo studio, che è stato preparato da più di 200 esperti e documentato in 30 volumi della Collana di Libri Bianchi di META-NET (disponibile online e a stampa), valuta il supporto delle tecnologie linguistiche per ogni lingua in quattro aree diverse: la traduzione automatica, l’interazione vocale, l’analisi del testo e la disponibilità di risorse linguistiche. Il 70% delle lingue analizzate (21 su 30) si colloca al livello più basso, con “supporto debole o assente” per almeno una delle aree considerate. L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. All’estremo opposto si trova l’inglese (“supporto buono”), seguito da olandese, francese, tedesco, italiano e spagnolo, con “supporto modesto”. Nessuna lingua viene considerata avere “supporto eccellente”. Lingue come basco, bulgaro, catalano, greco, ungherese e polacco mostrano un “supporto frammentario”, collocandosi nell’insieme delle lingue ad alto rischio.
“I risultati del nostro studio sono allarmanti. La maggior parte delle lingue europee non dispone di risorse sufficienti ed alcune sono quasi completamente ignorate. Da questo punto di vista, molte delle nostre lingue non hanno futuro”, sostiene il Prof. Hans Uszkoreit, coordinatore di META-NET, direttore scientifico presso il DFKI (German Research Center for Artificial Intelligence) e co-editore dello studio. L’altro co-editore, il Dr. Georg Rehm (DFKI), aggiunge: “Ci sono delle differenze enormi tra le varie lingue europee dal punto di vista del supporto fornito dalle tecnologie linguistiche. Il divario fra lingue ‘grandi’ e ‘piccole’ continua ad ingrandirsi. Dobbiamo assicurarci di fornire a tutte le lingue le tecnologie di base necessarie, altrimenti queste lingue sono destinate all’estinzione digitale.”
Il settore delle tecnologie linguistiche produce software in grado di elaborare il linguaggio umano parlato o scritto. Ben noti esempi di questo tipo di software includono i correttori ortografici e grammaticali, gli assistenti personali interattivi sugli smartphones (come Siri sull’iPhone), i sistemi telefonici di dialogo, i sistemi di traduzione automatica, i motori di ricerca, e le voci sintetiche usate nei navigatori satellitari. I sistemi di tecnologia linguistica odierni si basano sostanzialmente su metodi statistici che necessitano di enormi quantità di dati scritti o parlati. Specialmente per lingue con relativamente pochi parlanti, acquisire la quantità di dati necessaria è molto difficile. Inoltre, i sistemi statistici di tecnologie linguistiche hanno dei limiti qualitativi intrinseci, come si può vedere ad esempio dalle traduzioni spesso comicamente sbagliate prodotte dai sistemi di traduzione automatica online.
In Europa quasi tutte le barriere sono state rimosse. Una barriera esiste ancora, tuttavia, e sembra insormontabile: il confine invisibile delle barriere linguistiche ostacola la libera circolazione di beni, prodotti e servizi. Da una parte, la tecnologia linguistica ha il potere di eliminare queste barriere attraverso i moderni sistemi di traduzione automatica; dall’altra, i risultati dello studio di META-NET mostrano chiaramente che molte delle lingue europee non sono ancora pronte. Ci sono delle lacune tecnologiche enormi, dovute al fatto che la maggior parte della ricerca e dello sviluppo si concentra sull’inglese, e che mancano impegno, risorse finanziarie, ma anche una chiara visione di ricerca e di sviluppo tecnologico.
In Europa è stato fatto uno sforzo coordinato su larga scala per creare le tecnologie mancanti e per trasferire le tecnologie esistenti alla maggior parte delle lingue. Ci sono delle ragioni molto forti per affrontare questa sfida immensa coinvolgendo l’Unione Europea, i suoi stati membri ed associati, e l’industria. L’alto costo pro-capite per le comunità linguistiche più piccole, la necessità di trasferire le tecnologie fra le lingue, la mancanza di interoperabilità tra risorse, strumenti e servizi, ed il fatto che i confini linguistici spesso non coincidono con i confini politici sono alcune fra queste ragioni. L’Europa deve agire per preparare all’era digitale le sue lingue, che rappresentano una parte preziosa del nostro patrimonio culturale e pertanto meritano sicurezza per il futuro.
Le tecnologia linguistica: informazioni di base
La tecnologia linguistica ci sta già aiutando in compiti quotidiani come scrivere e-mail o comprare dei biglietti online. Ci serviamo della tecnologia linguistica ogni volta che cerchiamo e traduciamo delle pagine web, o utilizziamo le funzioni di correttore grammaticale e ortografico di un word processor, o quando facciamo funzionare il nostro cellulare con i comandi vocali, cerchiamo le opinioni sui libri di una libreria virtuale, o seguiamo le istruzioni di un’applicazione per la navigazione mobile. Nel prossimo futuro potremo parlare con i computer, i macchinari e gli apparecchi elettronici, inclusi i tanto attesi robot che presto entreranno nelle nostre case e nei nostri uffici. Rimuovere le barriere comunicative tra le persone e la tecnologia cambierà il nostro mondo.
La tecnologia linguistica rappresenta oggi una delle aree di crescita chiave nella tecnologia dell’informazione. Grandi aziende internazionali come Google, Microsoft, IBM, e Nuance hanno fatto grossi investimenti in quest’area. Centinaia di piccole e medie imprese In Europa si sono specializzate in applicazioni o servizi particolari. La tecnologia linguistica consente alle persone di collaborare, imparare, fare affari, e condividere conoscenza attraverso i confini linguistici e a prescindere dalla capacità informatiche.
La Collana Libri Bianchi di META-NET
La Collana di Libri Bianchi di META-NET “Le lingue nella società europea dell’informazione” fa il punto dello stato di 30 lingue europee relativamente alla tecnologia linguistica e spiega quali sono i rischi e le opportunità più urgenti. La serie copre tutte le lingue ufficiali degli stati membri dell’Unione Europea e molte altre lingue parlate in Europa. Anche se ci sono stati alcuni validi e ampi studi scientifici su alcuni aspetti delle lingue e delle tecnologie, mancava fino ad ora un compendio per il vasto pubblico, che presentasse per ciascuna lingua i fatti principali e le sfide più importanti dal punto di vista del supporto tecnologico ad un’Europa multilingue. La Collana Libri Bianchi di META-NET colma questa lacuna.
Più di 200 autori hanno contribuito in totale a preparare I Libri Bianchi, che sono disponibili per basco, bulgaro, catalano, croato, ceco, danese, estone, finlandese, francese, galiziano, greco, inglese, islandese, italiano, lettone, lituano, maltese, norvegese (bokmål e nynorsk), olandese, polacco, portoghese, rumeno, serbo, slovacco, sloveno, spagnolo, svedese, tedesco e ungherese. Ogni Libro Bianco è scritto nella lingua di cui tratta e comprende una traduzione inglese completa.
Su META-NET e META
META-NET è una rete di eccellenza composta da 60 centri di ricerca in 34 paesi, rivolta a costruire le basi tecnologiche di una società dell’informazione europea multilingue. META-NET è co-finanziata dalla Commissione Europea attraverso quattro progetti.
META-NET sta costruendo META, Multilingual Europe Technology Alliance. Più di 600 organizzazioni in 55 paesi (centri di ricerca, università, piccole e medie imprese, grandi industrie) si sono già unite a questa alleanza tecnologica.