For det første var det AlphaGo AI fra Googles DeepMind-datterselskab, der slog verdens bedste Go-spillere i deres eget spil for at lave en rekord. Derefter klassificerede en AI ved navn Libratus, udviklet af Carnegie Mellon University, pokerproffs i en turnering for at rette verdens opmærksomhed mod det hurtige tempo, hvor AI udvikler sig. I det seneste eksempel på en AI, der overlever mennesker, en dyb neurale netværksmodel udviklet af Alibaba klarede sig bedre end mennesker i en læseforståelsestest.
AI-modellen udviklet af Alibaba's Institute of Data Science and Technologies flammede forbi SQuAD (Stanford Question Answering Dataset) -testen - en af de mest pålidelige læseforståelsestest til evaluering af maskinens sprogfærdigheder - i en konkurrence, der satte den mod menneskelige rivaler.
Alibabas AI scorede kumulative 82.44 Exact Match (EM) point, der overskred sine menneskelige konkurrenter, der manglede at placere 82.304 point på resultattavlen. Ifølge en rapport offentliggjort i South China Morning Post - også ejet af Alibaba - er denne præstation første gang, når en maskine har slået sine menneskelige kolleger i en læseforståelsestest.
Når det kommer til netto F1-scores i SQuAD-vurderingen, Alibabas AI-model toppede diagrammet med 88.607 point og placerede sig højere end lignende systemer udviklet af Microsoft og Facebook. Resultaterne er virkelig imponerende, fordi sprogforståelse traditionelt er blevet betragtet som et svagt punkt i AI-systemer. Den førnævnte mangel begrænser alvorligt deres evne til at føre en virkelig produktiv samtale med en person og ikke kun knuse numre og behandle information.
Med ordene fra Si Luo, en videnskabsmand inden for naturlig sprogbehandling i Alibabas forskningsarm, vil de nylige resultater åbne op for nyere muligheder for at implementere AI-systemer i kundehjælpsjob takket være deres forbedrede sprogbehandlingsfunktioner.
Vi mener, at den underliggende teknologi gradvist kan anvendes til adskillige applikationer såsom kundeservice, museumsvejledninger og online svar på forespørgsler fra patienter, hvilket frigør menneskelig indsats på en hidtil uset måde
Resultaterne opnået med Alibabas dybe neurale netværksmodel indikerer, at AI-systemer snart vil være i stand til at besvare objektive spørgsmål som 'hvad der forårsager regn' ved at behandle den enorme mængde information, de har til rådighed, og reagere med det mest sammenhængende nøjagtige og præcise svar.