W świecie cyfrowym wyginięcie grozi co najmniej 21 językom europejskim
Czołowi europejscy eksperci do spraw technologii językowych ostrzegają: większość języków europejskich prawdopodobnie nie przetrwa epoki cyfrowej
Najnowszy raport czołowych europejskich ekspertów do spraw technologii językowych ostrzega, że w erze cyfrowej wyginięcie grozi większości języków europejskich. Oceniając poziom rozwoju technologii językowych dla 30 z około 80 języków europejskich, eksperci doszli do wniosku, że w przypadku 21 spośród 30 języków ich jakość jest w najlepszym razie niska lub wręcz zerowa. Badania te przeprowadziła europejska sieć doskonałości META-NET, do której należy 60 ośrodków badawczych w 34 krajach.
Badania, przygotowane przez ponad 200 ekspertów i opublikowane w 30 tomach serii raportów META-NET (dostępnych zarówno online, jak i w postaci drukowanej), oceniały jakość technologii językowych dla każdego języka w czterech różnych dziedzinach: tłumaczenie automatyczne, przetwarzanie mowy, analiza tekstu i dostępność zasobów językowych. Eksperci umieścili ogółem 21 spośród 30 języków (70%) w najniższej kategorii – „słaba lub zerowa jakość” – w przynajmniej jednej dziedzinie. Kilka języków, na przykład, islandzki, łotewski, litewski i maltański, uzyskały najniższy wynik we wszystkich czterech dziedzinach. Z drugiej strony, chociaż bynajmniej nie uznano, że którykolwiek język ma technologie doskonałej jakości, tylko angielski oceniono jako mający technologie bardzo dobrej jakości; dalej były języki niderlandzki, francuski, niemiecki, włoski i hiszpański – jakość technologii dla nich jest dobra. Technologia obsługująca języki takie jak baskijski, bułgarski, kataloński, grecki, węgierski i polski ma jakość średnią, przez co znajdują się one w grupie języków bardzo zagrożonych.
„Wyniki naszych badań są bardzo niepokojące. Istotnych zasobów nie ma większość języków europejskich, a niektóre są niemal całkowicie zaniedbane. W tym sensie wiele z naszych języków nie jest gotowych na wyzwania przyszłości” – mówi prof. Hans Uszkoreit, koordynator sieci META-NET, dyrektor naukowy DFKI (niemieckie centrum badawcze w dziedzinie sztucznej inteligencji) i współredaktor raportów. Drugi współredaktor raportów, dr Georg Rehm (DFKI), dodaje: „Są olbrzymie różnice w jakości technologii dla różnych języków europejskich i dla różnych dziedzin zastosowań. Przepaść między „dużymi” a „małymi” językami cały czas się pogłębia. Musimy koniecznie dostarczyć potrzebne technologie podstawowe dla mniejszych języków, niemających istotnych zasobów. W przeciwnym razie wszystkim tym językom grozi cyfrowe wyginięcie”.
Technologie językowe to oprogramowanie służące do przetwarzania mówionego lub pisanego języka naturalnego. Do znanych przykładów oprogramowania tego rodzaju należą korektory pisowni i gramatyki, interaktywni osobiści asystenci na smartfony (na przykład Siri dla iPhone’a), systemy dialogowe, które działają za pośrednictwem telefonu, systemy tłumaczenia automatycznego, wyszukiwarki internetowe i syntetyczne głosy używane w systemach nawigacji samochodowej. Dzisiejsze systemy technologii językowych opierają się przede wszystkim na metodach statystycznych, wymagających nieprawdopodobnie dużych ilości tekstów i nagrań języka mówionego. Zdobycie niezbędnej ilości danych jest trudne zwłaszcza w przypadku języków, którymi mówi stosunkowo niewiele osób. Ponadto z natury ograniczona jest jakość statystycznych systemów technologii językowych, co widać na przykładzie często zabawnie niepoprawnych tłumaczeń wytwarzanych przez internetowe systemy tłumaczenia maszynowego.
Europie udało się zatrzeć prawie wszystkie granice między jej państwami członkowskimi. Nadal istnieje jednak jedna granica, i to granica nieprzekraczalna: niewidzialne bariery językowe utrudniają swobodny przepływ wiedzy i informacji. Szkodzi również długoterminowemu celowi, jakim jest stworzenie jednolitego rynku cyfrowego, ponieważ utrudnia swobodny przepływ towarów, produktów i usług. Podczas gdy technologie językowe mogłyby zlikwidować bariery językowe przy użyciu nowoczesnych systemów tłumaczenia maszynowego, wyniki badań sieci META-NET wyraźnie wskazują, że wiele języków europejskich nie jest jeszcze gotowych. Istnieją znaczne luki w technologiach ze względu na koncentrację większości działań z zakresu badań i rozwoju na języku angielskim, niewystarczające zaangażowanie i środki finansowe, a także brak jasnej wizji badawczej i technicznej.
W Europie należy podjąć skoordynowane wysiłki na szeroką skalę, aby stworzyć brakujące technologie, a także dokonać transferu technologii do większości języków. Istnieją poważne powody, aby wspólnie podjąć to ogromne wyzwanie w ramach Unii Europejskiej, w jej państwach członkowskich i stowarzyszonych, a także w biznesie. Do tych powodów należą m.in. wysokie koszty finansowe per capita w mniejszych społecznościach językowych; potrzebny transfer technologii między językami; brak interoperacyjności zasobów, narzędzi i usług; oraz fakt, że granice językowe często nie pokrywają się z granicami politycznymi. Europa musi przygotować swoje języki na erę cyfrową. Są one cennym składnikiem naszego dziedzictwa kulturowego i jako takie zasługują na bezpieczną przyszłość.
Technologie językowe: podstawowe informacje
Technologie językowe już dziś pomagają nam w codziennych czynnościach, takich jak pisanie wiadomości e-mail czy zakup biletów. Korzystamy z technologii językowych przy wyszukiwaniu i tłumaczeniu stron internetowych, posługując się korektorem pisowni i funkcją sprawdzania gramatyki w edytorach tekstów, sterując samochodowym systemem audio czy telefonem komórkowym przy użyciu poleceń głosowych, uzyskując rekomendacje w internetowej księgarni lub postępując zgodnie z instrukcjami programu do nawigacji w urządzeniu przenośnym. W najbliższej przyszłości będziemy mogli mówić do programów komputerowych, a także do maszyn i urządzeń, w tym także do długo oczekiwanych robotów usługowych, które wkrótce zagoszczą w naszych domach i miejscach pracy. Gdziekolwiek będziemy potrzebować informacji, po prostu o nie poprosimy, a kiedy będziemy potrzebować pomocy, głośno jej zażądamy. Usuwając bariery komunikacyjne między ludźmi i techniką, zmienimy nasz świat.
Powszechnie uznaje się, że technologie językowe to jedna z kluczowych dziedzin informatyki. Duże międzynarodowe korporacje, takie jak Google, Microsoft, IBM i Nuance zainwestowały znaczne sumy w tej dziedzinie. W Europie setki małych i średnich firm wyspecjalizowały się w określonych aplikacjach lub usługach tego rodzaju. Technologie językowe ułatwiają ludziom współpracę, naukę, biznes i dzielenie się wiedzą ponad granicami językowymi i niezależnie od ich umiejętności w zakresie obsługi komputera.
Seria raportów META-NET
Seria raportów META-NET „Języki w europejskim społeczeństwie informacyjnym” informuje o stanie technologii językowych dla 30 języków europejskich; wskazuje potencjalne zagrożenia i szanse rozwojowe. Seria opisuje wszystkie języki urzędowe państw członkowskich UE oraz kilka innych języków używanych w Europie. Podczas gdy przeprowadzono wiele wartościowych i wyczerpujących badań naukowych nad niektórymi aspektami języków i technik ich przetwarzania, do tej pory nie istniało powszechnie zrozumiałe kompendium przedstawiające główne ustalenia i wyzwania dla każdego języka związane z technicznymi zasobami wielojęzycznej Europy. Seria raportów META-NET wypełnia tę lukę. Sieć META-NET może teraz wskazać języki borykające się z poważnymi problemami i zidentyfikować największe zagrożenia. W przygotowywaniu raportów brało udział ponad 200 autorów i współpracowników.
Raporty zostały napisane dla następujących języków europejskich: angielski, baskijski, bułgarski, chorwacki, czeski, duński, estoński, fiński, francuski, galicyjski, grecki, hiszpański, islandzki, irlandzki, kataloński, litewski, łotewski, maltański, niemiecki, niderlandzki, norweski (bokmål i nynorsk), polski, portugalski, rumuński, serbski, słowacki, słoweński, szwedzki i węgierski i włoski. Każdy raport napisano w języku angielskim, załączając też tłumaczenie na język, którego on dotyczy.
META-NET i META
META-NET, sieć doskonałości składająca się z 60 ośrodków badawczych z 34 krajów ma za zadanie budowę technicznych fundamentów wielojęzycznego społeczeństwa informacyjnego w Europie. Sieć META-NET jest współfinansowana przez Komisję Europejską w ramach czterech projektów.
META-NET tworzy META (Multilingual Europe Technology Alliance – wielojęzyczny sojusz technologii Europy). Do sojuszu przyłączyło się już ponad 600 organizacji z 55 krajów, m.in. ośrodki badawcze, uniwersytety, małe i średnie przedsiębiorstwa, a także kilka dużych firm.