2 minute read
Wikipedia på alla språk
Ett Wikipedia som är lika an vändbart oberoende av vilket språk man söker på, det är visionen för projektet Abstract Wikipedia. För att förverkliga detta ambitiösa mål har upp slagsverket tagit hjälp av ett riktigt kraftfullt verktyg: Gram matical Framework, utvecklat av Aarne Ranta, professor i datavetenskap, och hans kollegor.
Aarne Ranta har matical Framework (GF) sedan 1998 och ambitionen är väldig: att formalisera den grammatiska strukturen på all världens språk och på så sätt göra det möjligt att översätta från och till vilket språk som helst.
På en datorskärm visar han hur det kan komma att gå till.
– Jag vill kanske skriva meningen ”Mitt hus är rött”: Så fort jag skrivit in ”Mitt” dyker det upp ett antal förslag på substan tiv i neutrum som kan fortsätta mening en. När jag lägger till ordet ”hus” kommer nya förslag, denna gång lämpliga verb. Systemet begränsas av att jag bara kan använda ord och grammatiska konstruk tioner som GF känner igen, jag kan alltså inte hitta på vad som helst. Men fördelen är att min mening genast får en korrekt översättning till alla 50 språk som ingår i systemet. Och med hjälp av studenter och exjobbare utvecklas GF kontinuerligt så att det täcker allt större områden.
Automatisk översättning till, om inte all världens så åtminstone många språk, passar väldigt väl in i Wikipedias mål att bli ett globalt uppslagsverk för alla
Det är skälet till att Aarne Ranta och hans forskargrupp erbjudits samarbete med Wikimedia Foundation och samverkan kring Abstract Wikipedia, berättar Krasimir Angelov, docent i datavetenskap, som också utvecklar GF.
GF för att skriva artiklar som bygger på fakta från databasen Wikidata. Det handlar alltså om texter som har ett innehåll som går att översätta med den vokabulär och den grammatiska struktur som GF klarar av. Vi kommer snart att lansera en demo där 24 språk ingår: användaren kan alltså skriva en text på vilket som helst av de här språken och automatiskt får den översatt till alla de andra språken. Och om några fakta behöver rättas, räcker det att göra det i ett språk för att de ska ändras överallt. Tanken är att programvaran ska vara lätt att använda; de flesta som jobbar med Wikipedia är ju inte programmerare utan entusiaster som vill dela med sig av sin kunskap inom ett visst område. Och precis som Wikipedia självt utvecklas Abstract Wikipedia löpande, berättar
– Det finns hundratals wikipedianer ute i världen som bidrar till projektets
Wikipedia har idag artiklar på drygt 300 språk. Men på många av dessa finns kanske bara ett fåtal artiklar eller kortare sammanfattningar. Bristen på innehåll gäller främst småspråk men även ganska stora språk kan vara dåligt representerade i det väldiga uppslagsverket, påpekar Aarne Ranta.
– Abstract Wikipedia betyder att artiklar på exempelvis engelska översätts till swahili, vilket naturligtvis är värdefullt. Men motsatsen är också viktig; om en konstälskare i Uganda skriver en text om en utställning i Kampala kommer den texten omedelbart att finnas på alla andra språk som ingår i GF. På så sätt sprids kultur och kunskap från olika länder åt alla håll. Vårt mål är därför att kunna översätta från och till samtliga 300 Wikipedia-språk; det är ett arbete som, precis som Wikipedia självt, aldrig kommer att ta slut.
Text: Eva Lundgren
Foto: Johan Wingborg
Abstract Wikipedia är ett projekt, initierat av Wikimedia Foundation, som syftar till att skapa en språkoberoende version av Wikipedia, det vill säga, att innehållet i Wikipedia ska finnas tillgängligt på cirka 300 språk. För att göra det samarbetar man med bland annat Grammatical Framework, ett översättningsprogram utarbetat av Aarne Ranta och hans kollegor. Mer information finns på: https://www.grammaticalframework.org/.