Microsoft har meddelt, at de vil implementere kunstig intelligens (AI) og dybe neurale netværk for at forbedre sprogoversættelse i realtid til tre af de mest anvendte sprog i subkontinentet - hindi, bengali og tamil. Brugen af dybe neurale netværk forventes at give mere nøjagtige og naturlige oversættelser, hvilket ville være en velkommen lettelse for enhver, der har forsøgt at oversætte et fremmed sprog til et indisk sprog, kun for at finde underlige, unaturlige og ofte, åbenlyst ukorrekte oversættelser.
I en pressemeddelelse frigivet ved lejligheden sagde Sundar Srinivasan, General Manager-AI og Research hos Microsoft Indien, at ”Microsoft fejrer mangfoldigheden af sprog i Indien og ønsker at gøre det store internet endnu mere tilgængeligt. Vi har støttet indiske sprog i computing i over to årtier, og for nylig har vi gjort betydelige fremskridt med stemmebaseret adgang og maskinoversættelse på tværs af sprog ”.
Hvis du taler et af de tre ovennævnte sprog og er interesseret i at prøve Microsofts AI-drevne oversættelser, kan du gå videre til Bing Translate-webstedet for at se Microsofts neurale netværksdrevne oversættelser i aktion. Den nye teknologi implementeres også i virksomhedens Microsoft Translator-app, der er tilgængelig på både Andriod og iOS. Teknologien vil også blive brugt til at forbedre oversættelser på Skype såvel som forskellige Office 365-software som Word, Excel, PowerPoint og Outlook.
Jeg forsøgte personligt at oversætte det første afsnit i denne artikel til bengalsk (ved hjælp af Bing Translate), og resultaterne var lige så forvirrende og uforståelige som enhver oversættelse til et indisk sprog nogensinde har været. Hvis du spekulerer på, hvordan det sammenlignes med Google Translate og er fortrolig med bengalsk, skal du se på sammenligningen side om side nedenfor. Bemærk, at det er et sammensat billede med oversættelsen fra Google til højre og oversættelsen fra Bing i bunden.
Selvom der ikke ser ud til at være meget forskel mellem de to på dette stadium, er det at bemærke her, at med dybe neurale netværk vil oversættelserne sandsynligvis blive drastisk forbedret med tiden, fordi teknologien har evnen til at tage konto "Begreber som køn (feminin, maskulin, neutral), høflighedsniveau (slang, afslappet, skriftlig, formel) og ordtype (verb, substantiv, adjektiv)".
Som det ser ud nu, vil oversættelser til og fra indiske sprog dog fortsat forblive utilfredsstillende på trods af at top 6-indiske sprog er blandt de 20 mest anvendte sprog i verden. Det er fordi "Der er ikke nok materiale på Internettet, som vi kunne bruge til at træne systemet", ifølge Krishna Doss Mohan, Senior Program Manager, Microsoft Indien.
Forhåbentlig, når den større indiske befolkning begynder at bruge internettet, får vi mere sprogligt indhold, der skal hjælpe med at træne disse dybe neurale netværk for at give bedre oversættelser fremover.