Alle, der har prøvet Google Fotos, er enige i, at denne gratis fotolagrings- og administrationstjeneste fra Google er smart. Det indeholder forskellige smarte funktioner som avanceret søgning, evnen til at kategorisere dine billeder efter placeringer og datoer, automatisk oprette album og videoer baseret på ligheder og føre dig ned ad hukommelsesbanen ved at vise dig fotos fra samme dag for flere år siden. Der er mange ting, som Google Fotos kan gøre, som for flere år siden ville være umuligt maskinelt. Google Fotos er en af de mange “smarte” tjenester fra Google, der bruger en maskinindlæringsteknologi kaldes TensorFlow. Ordet læring indikerer, at teknologien bliver klogere med tiden til det punkt, som vores nuværende viden ikke kan forestille sig. Men hvad er TensorFlow? Hvordan kan en maskine lære? Hvad kan du gøre med det? Lad os finde ud af det.
Hvad er TensorFlow?
TensorFlow er Googles open source og magtfulde software til kunstig intelligens, som driver mange tjenester og initiativer fra Google. Det er anden generation af et system til store maskinlæringsimplementeringer, bygget af Google Brain-teamet. Dette algoritmebibliotek efterfølger DistBelief - den første generation.
Teknologien repræsenterer beregning som statefulde dataflydningsgrafer. Det, der gør TensorFlow unik, er dens evne til at modellere beregninger på en lang række hardware, fra mobile enheder på forbrugerniveau til multi-GPU-servere i verdensklasse. Det kan køre på forskellige GPU'er og CPU'er og lover skalerbarheden af maskinindlæring blandt de forskellige enheder og gadgets uden at skulle ændre en betydelig mængde kode.
TensorFlow stammer fra Googles behov for at instruere et computersystem til at efterligne, hvordan en menneskelig hjerne fungerer i læring og ræsonnement. Systemet, kendt som neurale netværk, skal være i stand til at udføre på flerdimensionelle dataarrays kaldet "tensorer". Det endelige mål er at træne neurale netværk til at opdage og dechifrere mønstre og korrelationer.
I november 2015 lavede Google denne teknologi open source og tillod det at blive optaget i alle slags produkter og undersøgelser. Enhver, inklusive forskere, ingeniører og hobbyister, kan hjælpe med at fremskynde væksten i maskinindlæring og tage det til et højere niveau på kortere tid.
Dette skridt viste sig at være det rigtige, fordi der er så mange bidrag fra de uafhængige udviklere til TensorFlow, at de langt overgår Googles bidrag. Wikipedia nævner, at ”der er 1500 arkiver på GitHub, der nævner TensorFlow, hvoraf 5 er fra Google. ” Når det er sagt, mistænker en af diskussionerne hos Quora, at den frigivne open source-kode er den "ryddede" version fra den, som Google bruger i sine tjenester.
Hvordan fungerer TenserFlow?
Ved hjælp af det enkle normale menneskelige sprog og en tung forenkling ser vi måske den ene side af TensorFlow som en avanceret autonom filtreringsteknologi. I sin kerne er teknologien et enormt softwarebibliotek med maskinindlæring. Den bruger databasen til at hjælpe den med at "træffe beslutning".
For eksempel uploader nogen et foto til Google Fotos. Teknologien sammenligner alle detaljer fra billedet til dets database og beslutter, om det er et billede af et dyr eller et menneske. Så hvis det er et menneske, vil det forsøge at bestemme køn, alder til hele personen. Den samme proces gentages for andre objekter på billedet.
Det bruger også brugerens data, såsom identiteten på personen i billedet og placeringen, hvor billedet tages, for at forbedre dets bibliotek, så det kan give bedre resultater i fremtiden - både for den person, der uploadede billedet og for alle andet. Derfor udtrykket "læring". Men det stopper ikke kun ved at kende og lære data fra fotos. Der er så meget, at teknologien kan gøre med information fra et foto. For eksempel kan den gruppere fotos med lignende detaljer, såsom den samme person, den samme placering, den samme dato; se ansigtsmønsteret for at bestemme, hvilken familie og venner personen på billedet tilhører, og brug oplysningerne til at lave videoer af familieferie eller animation fra kontinuerlige billeder.
Det skraber næppe overfladen af, hvordan TensorFlow fungerer, men jeg håber, det kan give dig et generelt billede af teknologien. Brug af kun et eksempel kan heller ikke gøre retfærdighed over for det, det er i stand til.
Og for alle kunstige intelligensentusiaster derude er det værd at nævne, at Google allerede har oprettet en computerchipteknologi, der er optimeret til maskinindlæring og integrerer TensorFlow i den. Det hedder Tensor Processing Unit (TPU) ASIC-chip.
De, der ønsker at lære mere om TensorFlow, kan besøge vejledningssiden.
Anvendelser af TensorFlow
Vi er i et tidligt stadium af maskinlæringsteknologi, så ingen ved, hvor det vil føre os. Men der er et par indledende applikationer, der kan give os et kig på fremtiden. Da det stammer fra Google, er det indlysende, at Google bruger teknologien til mange af sine tjenester.
-
Mere om billedanalyse
Vi har diskuteret eksemplet med at bruge teknologien til billedanalyse i Google Fotos. Men billedanalyseapplikationen bruges også i Google Maps 'Street View-funktion. For eksempel bruges TensorFlow til at forbinde billedet med kortkoordinaterne og til automatisk at sløre nummerpladens nummer på enhver bil, der ved et uheld er inkluderet i billedet.
-
Tale genkendelse
Google bruger også TensorFlow til sin stemmeassistent software til talegenkendelse. Den teknologi, der giver brugerne mulighed for at udtale instruktioner, er ikke ny, men at inkludere det stadigt voksede bibliotek af TensorFlow i blandingen kan bringe funktionen op et par hak op. I øjeblikket genkender teknologi til talegenkendelse over 80 sprog og varianter.
-
Dynamisk oversættelse
Et andet eksempel på den "lærende" del af maskinlæringsteknologi er Googles oversættelsesfunktion. Google tillader sine brugere at tilføje nye ordforråd og rette fejlene i Google Translate. De stadigt voksende data kan bruges til automatisk at registrere det inputsprog, som andre brugere ønsker at oversætte. Hvis maskinen laver fejl i sprogopdagelsesprocessen, kan brugerne rette dem. Og maskinen vil lære af disse fejl for at forbedre dens fremtidige ydeevne. Og cyklussen fortsætter.
-
Alpha Go
Et sjovt eksempel på brug af TensorFlow er Alpha Go. Det er et program, der er programmeret til spille Go. For dem der ikke er bekendt med Go, er det et abstrakt brætspil for to spillere med oprindelse i Kina for mere end fem tusind og fem hundrede år siden, og det er det ældste brætspil, der stadig spilles kontinuerligt i dag. Mens reglerne er enkle - at omgive mere territorium end modstanderen, er spillet utroligt komplekst og ifølge Wikipedia: "besidder flere muligheder end det samlede antal atomer i det synlige univers."
Så det er interessant, hvad en læringsmaskinteknologi kan gøre med de uendelige muligheder. I sine kampe mod Lee Sedol - den 18-gange Go verdensmester vandt Alpha Go 4 ud af 5 spil og fik den hæderlige højeste Go-stormesterrang.
-
Magenta-projekt
En anden interessant anvendelse af TensorFlow er Magenta Project. Det er et ambitiøst projekt at skabe maskindannet kunst. Et af de tidlige håndgribelige resultater af eksperimentet er klavermelodien på 90 sekunder. På lang sigt håber Google at generere mere avanceret maskindannet kunst via sit Magenta-projekt og opbygge et samfund af kunstnere omkring det.
I februar 2016 afholdt Google også en kunstudstilling og auktion i San Fransisco, der viste 29 computergenererede - med lidt hjælp fra menneskelige - kunstværker. Seks af de største værker blev solgt for så meget som $ 8.000. Computeren kan muligvis stadig have en meget lang vej at gå, før den kan efterligne en rigtig kunstner, men hvor mange penge folk er villige til at betale for kunsten viser os, hvor langt teknologien er gået.
Support til iOS
Mens vi allerede har set funktionerne i TenserFlow på Android med sin nyeste version, tilføjer TensorFlow endelig understøttelser til iOS-enheder. Da der er masser af gode mobilapps, der udelukkende er tilgængelige til iOS eller frigives først på iOS, betyder det, at vi kan forvente flere fantastiske mobilapps, der vedtager maskinindlæring i den nærmeste fremtid. Det samme kan siges om mulighederne for bredere adoptioner og anvendelser af TensorFlow.
Fremtiden for TensorFlow
Hvad kan man muligvis gøre med en maskine, der er i stand til at lære og tage sin egen beslutning? Som en person, der beskæftiger sig med mere end et sprog som en del af det daglige liv, er det første, der dukker op i mit sind, sprogoversættelse. Ikke i ord for ord-niveau, men mere i det længere tekstniveau som dokumenter eller endda bøger. Dagens oversættelsesteknologi er begrænset til ordforrådene. Du kan let finde ud af, hvad der "sover" på kinesisk og omvendt, men prøv at smide et kapitel af Eiji Yoshikawa's Musashi på dets originale japanske og oversætte kapitlet til engelsk. Du kan se, hvad jeg får fat i.
Det er også sjovt at se, hvad fremtiden for kunstig intelligens kan gøre med musik. Selvom det stadig er meget grundlæggende, kan Apples Music Memo-app allerede give automatisk bas og trommeakkompagnement til din indspillede sang. Jeg husker en episode af et SciFi-tv-show, hvor en karakter i showet skabte en maskine, der analyserer alle de bedste sange i hitlisterne og er i stand til at skrive sine egne hit-sange. Vil vi nogensinde ankomme der?
Og som den afsluttende tanke, vil jeg gerne nævne Solopgang. Det er en kort science fiction-film skrevet udelukkende af en AI-manuskriptforfatter, der kaldte sig selv Benjamin - som endda komponerede pop-sang musikalske mellemrum. Filmen blev sammensat af instruktøren Oscar Sharp til den 48-timers Film Challenge of Sci-Fi London begivenhed.
Nu kan jeg ikke stoppe med at tænke på Terminator. Velkommen til fremtiden.
Billedkredit: Wikipedia, TechInsider, The Verge, Wall Street Journal