Minst 21 europeiska språk riskerar digital utrotning
En studie av Europas ledande språkteknologiska experter varnar för att flertalet europeiska språk förmodligen inte kommer att överleva i den digitala tidsåldern
De flesta europeiska språk står inför digital utrotning, visar en ny studie från Europas ledande experter inom språkteknologi. Genom att uppskatta nivån av språkteknologiskt stöd för 30 av de cirka 80 europeiska språken, drar experterna slutsatsen att det digitala stödet för 21 av de 30 undersökta språken är ”obefintligt” eller som bäst ”svagt”. Studien genomfördes av META-NET, ett europeiskt spetsforskningsnätverk som består av 60 forskningscentra i 34 länder.
I studien, som utförts av fler än 200 experter och dokumenteras i 30 volymer av META-NETs vitboksserie (tillgänglig både online och i tryckt form), bedöms det språkteknologiska stödet för varje språk inom fyra olika områden: automatisk översättning, talad interaktion, textanalys samt tillgången till språkresurser. Totalt 21 av de 30 språken (70 %) placerades av experterna i den sämsta kategorin, där ”stödet är svagt eller obefintligt” för åtminstone ett område. Flera språk, till exempel isländska, lettiska, litauiska och maltesiska, får detta betyg för alla fyra områden. I den andra änden av skalan fanns inget språk som ansågs ha ”utmärkt stöd”, och bara engelska som bedömts ha ”bra stöd”, följt av språk som franska, holländska, italienska, spanska och tyska med ”måttligt stöd”. Språk som baskiska, bulgariska, grekiska, katalanska, polska och ungerska har “fragmentariskt stöd”, vilket placerar också dem i gruppen av högriskspråk.
”Resultaten av vår studie är högst oroväckande. Flertalet av de europeiska språken lider av en stor brist på resurser och vissa är nästan helt försummade. I det avseendet är många av våra språk är ännu inte framtidssäkrade.”, säger professor Hans Uszkoreit, samordnare för META-NET, vetenskaplig ledare på DFKI (tyska forskningscentret för artificiell intelligens) och medredaktör för studien. Studiens andra medredaktör, Dr Georg Rehm (DFKI), tillägger: ”Det finns dramatiska skillnader mellan det språkteknologiska stödet för olika europeiska språk och teknikområden. Klyftan mellan ’stora’ och ’små’ språk ökar fortfarande. Vi måste se till att utrusta alla mindre språk och språk med få resurser med den nödvändiga basteknologin, annars är dessa språk dömda till digital utplåning.”
Inom det språkteknologiska området utvecklas programvara som kan hantera talat eller skrivet mänskligt språk. Välkända exempel på språkteknologisk programvara inkluderar stavnings- och grammatikkontroll, interaktiva personliga assistenter i smarttelefoner (som Siri i iPhone), dialogsystem som fungerar över telefon, automatiska översättningssystem, sökmotorer för webben och talsyntes som används i bilars navigationssystem. Idag förlitar sig de språkteknologiska systemen främst på statistiska metoder som kräver enorma mängder data i form av text eller tal. Speciellt för språk med relativt få talare är det svårt att få ihop tillräckligt mycket data. Dessutom har statistiska språkteknologiska system inneboende begränsningar i kvalitet, vilket exempelvis kan ses i de ofta roliga felöversättningar som produceras av online-system för maskinöversättning.
Europa har lyckats ta bort nästan alla gränser mellan sina länder. En gräns kvarstår dock, och den verkar vara ogenomtränglig: Språkbarriärer utgör en osynlig gräns som hindrar det fria flödet av kunskap och information. Den motverkar också det långsiktiga målet att etablera en gemensam digital marknad, eftersom den hindrar det fria flödet av varor, produkter och tjänster. Även om språkteknologi har potential att ta bort språkliga hinder genom moderna system för maskinöversättning, så visar resultatet av META-NETs studie tydligt att många av de europeiska språken ännu inte är redo. Det finns stora luckor i tekniken vilka beror på att större delen av forskningen och utvecklingsarbetet fokuserar på engelska, på bristande engagemang och ekonomiska resurser, och även på avsaknad av en tydlig vision för forskning och teknik.
För att skapa och sprida den teknik som behövs för de flesta europeiska språk krävs en samordnad, storskalig satsning i Europa. Det finns starka skäl för att ta sig an denna enorma utmaning i en gemensam kraftansträngning mellan den Europeiska unionen, dess medlemsstater och associerade länder samt industrin. Några av dessa skäl är: hög per capita-kostnad för mindre språkgemenskaper, behovet av tekniköverföring mellan olika språk, bristande interoperatiblitet mellan resurser, verktyg och tjänster, samt det faktum att språkliga gränser ofta inte sammanfaller med politiska gränser. Europa måste vidta åtgärder för att förbereda sina språk för den digitala tidsåldern. De är en värdefull del av vårt kulturarv och som sådan förtjänar de att framtidssäkras. Den 26:e september har av Europarådet utsetts till den europeiska språkdagen, en dag då vi begrundar vikten av att bevara och utveckla vår kontinents rika språkliga och kulturella arv. META-NETs arbete sätter fingret på de utmaningar och möjligheter som vårt språkliga arv står inför i informationstidsåldern.
Språkteknologi: Bakgrund
Språkteknologi hjälper oss redan i vardagliga sysslor, som att skriva e-post eller köpa biljetter. Vi får hjälp av språkteknologi vid sökning efter och översättning av webbsidor, vid ordbehandling för stavnings- och grammatikkontroll, när vi styr underhållningssystemet i bilen eller vår mobiltelefon med röstkommandon, när vi får rekommendationer i en online-bokhandel, eller när vi följer instruktioner upplästa av en mobil navigerings-app. Inom en snar framtid kommer vi att kunna tala med datorprogram såväl som med maskiner och apparater, inklusive de efterlängtade servicerobotar som snart kommer att göra sitt inträde i våra hem och på våra arbetsplatser. Var vi än är, kommer vi helt enkelt att be om den information och hjälp vi behöver. När vi blir av med kommunikationshinder mellan människor och teknik kommer hela vår värld att förändras.
Språkteknologin är idag allmänt erkänd som ett av de viktigaste tillväxtområdena inom informationstekniken. Stora internationella företag som Google, Microsoft, IBM och Nuance har investerat stort inom detta område. I Europa har hundratals små och medelstora företag specialiserat sig på olika språkteknologiska applikationer och tjänster. Språkteknologi tillåter människor att samarbeta, utbilda sig, göra affärer och dela kunskap över språkgränserna och oberoende av deras datakunskaper.
Meta-NETs vitboksserie
META-NETs vitboksserie ”Språken i det europeiska informationssamhället” rapporterar om tillståndet för 30 europeiska språk med avseende på språkteknologi och förklarar vilka de mest överhängande riskerna och de största möjligheterna är. Serien omfattar alla officiella EU-språk och flera andra av de europeiska språken. Även om det tidigare funnits flera värdefulla och omfattande vetenskapliga studier om olika aspekter av språk och teknik, så har det hittills inte funnits någon lättillgänglig sammanställning som presenterar de viktigaste resultaten och utmaningarna för varje språk när det gäller ett teknikstött flerspråkigt Europa. Meta-NETs vitboksserie fyller denna lucka. META-NET kan nu visa varför flertalet språk står inför allvarliga problem och peka på de mest ödesdigra bristerna. Totalt har mer än 200 författare och bidragsgivare hjälpt till att utarbeta vitboksserien.
Vitböckerna finns för följande europeiska språk: baskiska, bulgariska, danska, engelska, estniska, finska, franska, galiciska, grekiska, iriska, isländska, italienska, katalanska, kroatiska, lettiska, litauiska, maltesiska, nederländska, norska (bokmål och nynorska), polska, portugisiska, rumänska, serbiska, slovakiska, slovenska, spanska, svenska, tyska, tjeckiska och ungerska. Varje språks vitbok är skriven på det språk som den rapporterar om och innehåller även en komplett engelsk översättning.
Om META-NET och META
META-NET är ett spetsforskningsnätverk bestående av 60 forskningscentra från 34 länder, vars mål är att bygga den tekniska basen för ett flerspråkigt europeiskt informationssamhälle. META-NET samfinansieras av EU-kommissionen genom totalt fyra projekt.
META-NET har tagit initiativet till META, Multilingual Europe Technology Alliance. Mer än 600 organisationer från 55 länder, inklusive forskningscentra, universitet, små och medelstora företag liksom ett antal storföretag har redan gått med i denna öppna teknikallians.