Teknisk

Alt du trenger å vite om Google Brains TensorFlow

Alt du trenger å vite om Google Brains TensorFlow

Alle som har prøvd Google Photos er enige i at denne gratis tjenestelagrings- og administrasjonstjenesten fra Google er smart. Den inneholder forskjellige smarte funksjoner som avansert søk, muligheten til å kategorisere bildene dine etter steder og datoer, automatisk lage album og videoer basert på likheter, og føre deg nedover i minnefeltet ved å vise deg bilder fra samme dag for flere år siden. Det er mange ting Google Photos kan gjøre som for flere år siden ville være maskinelt umulig. Google Foto er en av de mange “smarte” tjenestene fra Google som bruker en maskinlæringsteknologi kalt TensorFlow. Ordet læring indikerer at teknologien vil bli smartere med tiden til det punktet som vår nåværende kunnskap ikke kan forestille seg. Men hva er TensorFlow? Hvordan kan en maskin lære? Hva kan du gjøre med det? La oss finne det ut.

Hva er TensorFlow?

TensorFlow er Googles åpen kildekode og kraftig programvare for kunstig intelligens, som driver mange tjenester og initiativer fra Google. Det er andre generasjon av et system for store maskinlæringsimplementeringer, bygget av Google Brain-teamet. Dette algoritmebiblioteket etterfølger DistBelief - den første generasjonen.

Teknologien representerer beregning som stateful data flow grafer. Det som gjør TensorFlow unik, er dens evne til å modellere beregninger på et stort utvalg av maskinvare, fra mobile enheter på forbrukernivå til multi-GPU-servere i verdensklasse. Den kan kjøres på forskjellige GPUer og CPUer og lover skalerbarheten av maskinlæring blant de forskjellige enhetene og gadgetene uten å måtte endre en betydelig mengde kode.

TensorFlow stammer fra Googles behov for å instruere et datasystem for å etterligne hvordan en menneskelig hjerne fungerer i læring og resonnement. Systemet, kjent som nevrale nettverk, skal kunne utføre på flerdimensjonale dataarriser som kalles "tensorer". Målet er å trene nevrale nettverk for å oppdage og tyde mønstre og korrelasjoner.

I november 2015 laget Google denne teknologien åpen kilde og tillot det å bli adoptert i alle slags produkter og undersøkelser. Alle, inkludert forskere, ingeniører og hobbyister, kan bidra til å øke hastigheten på maskinlæring og ta det til et høyere nivå på kortere tid.

Dette trekket viste seg å være det rette fordi det er så mange bidrag fra de uavhengige utviklerne til TensorFlow at de langt overgår Googles bidrag. Wikipedia nevner at "det er 1500 arkiver på GitHub som nevner TensorFlow, hvorav 5 er fra Google. ” Når det er sagt, mistenker en av diskusjonene hos Quora at den frigitte åpen kildekoden er den "ryddede" versjonen fra den som Google bruker i sine tjenester..

Hvordan fungerer TenserFlow?

Ved å bruke det enkle normale menneskelige språket og en tung forenkling, ser vi kanskje den ene siden av TensorFlow som en avansert autonom filtreringsteknologi. I sitt hjerte er teknologien et stort programvarebibliotek for maskinlæring. Den bruker databasen for å hjelpe den med å "ta en beslutning".

For eksempel laster noen opp et bilde til Google Foto. Teknologien vil sammenligne alle detaljene fra bildet til databasen og avgjøre om det er et bilde av et dyr eller et menneske. Så hvis det er et menneske, vil det prøve å bestemme kjønn, alder helt til hvem personen er. Den samme prosessen gjentas for andre gjenstander på bildet.

Den bruker også brukerens data som identiteten til personen i bildet og stedet der bildet er tatt, for å forbedre biblioteket slik at det kan gi bedre resultater i fremtiden - både for den enkelte som lastet opp bildet og for alle ellers. Derav begrepet "læring". Men det stopper ikke bare ved å kjenne og lære data fra bilder. Det er så mye at teknologien kan gjøre med informasjon fra et bilde. For eksempel kan den gruppere bilder med lignende detaljer som samme person, samme sted, samme dato; se ansiktsmønsteret for å bestemme hvilken familie og venner personen på bildet tilhører, og bruk informasjonen til å lage videoer av familieferie eller animasjon fra kontinuerlige bilder.

Det klør knapt overflaten av hvordan TensorFlow fungerer, men jeg håper det kan gi deg et generelt bilde av teknologien. Bruk av bare ett eksempel kan heller ikke gjøre rettferdighet mot det den er i stand til.

Og for alle kunstige intelligensentusiaster der ute, er det verdt å nevne at Google allerede opprettet en datamaskinbrikketeknologi som er optimalisert for maskinlæring og integrerer TensorFlow i den. Det heter Tensor Processing Unit (TPU) ASIC-brikke.

De som ønsker å lære mer om TensorFlow, kan besøke veiledningssiden.

Bruk av TensorFlow

Vi er i et tidlig stadium av maskinlæringsteknologi, så ingen vet hvor det vil føre oss. Men det er noen få første applikasjoner som kan gi oss et blikk på fremtiden. Siden den kommer fra Google, er det åpenbart at Google bruker teknologien til mange av sine tjenester.

Vi har diskutert eksemplet med å bruke teknologien til bildeanalyse i Google Foto. Men bildeanalyseapplikasjonen brukes også i Google Maps 'Street View-funksjon. TensorFlow brukes for eksempel til å koble bildet med kartkoordinatene og automatisk uskarpe lisensnummeret til alle biler som tilfeldigvis er inkludert i bildet.

Google bruker også TensorFlow for sin stemmeassistent programvare for talegjenkjenning. Teknologien som lar brukere snakke ut instruksjonene er ikke ny, men å inkludere det stadig voksende biblioteket til TensorFlow i blandingen kan bringe funksjonen opp noen hakk opp. For tiden gjenkjenner talegjenkjenningsteknologien over 80 språk og varianter.

Et annet eksempel på "læring" -delen av maskinlæringsteknologi er Googles oversettelsesfunksjon. Google lar brukerne legge til nye vokabularer og fikse feilene i Google Translate. De stadig voksende dataene kan brukes til automatisk å oppdage inndataspråket som andre brukere vil oversette. Hvis maskinen gjør feil i språkoppdagelsesprosessen, kan brukerne rette dem. Og maskinen vil lære av disse feilene for å forbedre den fremtidige ytelsen. Og syklusen fortsetter.

Et morsomt eksempel på bruk av TensorFlow er Alpha Go. Det er et program som er programmert til spill Go. For de som ikke er kjent med Go, er det et abstrakt brettspill for to spillere med opprinnelse i Kina for mer enn fem tusen fem hundre år siden, og det er det eldste brettspillet som fortsatt spilles kontinuerlig i dag. Mens reglene er enkle - å omgi mer territorium enn motstanderen, er spillet utrolig komplekst, og ifølge Wikipedia: "har flere muligheter enn det totale antallet atomer i det synlige universet."

Så det er interessant hva en læringsteknologi kan gjøre med de uendelige mulighetene. I sine kamper mot Lee Sedol - den 18-ganger Go verdensmesteren, vant Alpha Go 4 av 5 kamper og ble gitt den æres høyeste Go stormesteren rang.

En annen interessant applikasjon av TensorFlow er Magenta Project. Det er et ambisiøst prosjekt å lage maskingenerert kunst. En av de første konkrete resultatene av eksperimentet er 90 sekunders pianomelodi. På sikt håper Google å generere mer avansert maskingenerert kunst via sitt Magenta-prosjekt og bygge et samfunn av kunstnere rundt det.

I februar 2016 holdt Google også en kunstutstilling og auksjon i San Fransisco med 29 datagenererte - med litt hjelp fra menneskelige - kunstverk. Seks av de største verkene ble solgt for hele 8000 dollar. Datamaskinen kan fortsatt ha en veldig lang vei å gå før den kan imitere en ekte kunstner, men hvor mye penger folk er villige til å betale for kunsten viser oss hvor langt teknologien har gått.

Støtte for iOS

Mens vi allerede har sett funksjonene til TenserFlow på Android, med sin nyeste versjon, legger TensorFlow endelig til støtte for iOS-enheter. Siden det er mange flotte mobilapper tilgjengelig eksklusivt for iOS, eller utgitt først på iOS, betyr det at vi kan forvente flere flotte mobilapper som tar i bruk maskinlæring i nær fremtid. Det samme kan sies om mulighetene for bredere adopsjoner og applikasjoner av TensorFlow.

Fremtiden til TensorFlow

Hva kan man muligens gjøre med en maskin som er i stand til å lære og ta en egen beslutning? Som en person som arbeider med mer enn ett språk som en del av det daglige, er det første som dukker opp i tankene mine, oversettelse av språk. Ikke i ord for ordnivå, men mer på lengre tekstnivå som dokumenter eller til og med bøker. Dagens oversettelsesteknologi er begrenset til vokabularene. Du kan enkelt finne ut hva som "sover" på kinesisk og omvendt, men prøv å kaste inn et kapittel av Eiji Yoshikawa's Musashi på originaljapansk og oversette kapitlet til engelsk. Du får se hva jeg kommer til.

Det er også morsomt å se hva fremtiden for kunstig intelligens kan gjøre med musikk. Selv om det fremdeles er veldig grunnleggende, kan Apples Music Memo-app allerede gi automatisk bass og trommeakkompagnement til den innspilte sangen din. Jeg husker en episode av et SciFi TV-show der en karakter i showet opprettet en maskin som analyserer alle toppsangene i hitlistene og er i stand til å skrive sine egne hitlåter. Kommer vi noen gang dit?

Og som avslutningen tenkte, vil jeg nevne Soloppgang. Det er en kort science fiction-film skrevet helt av en AI-manusforfatter som kalte seg selv Benjamin - som til og med komponerte pop-sanger musikalske mellomspill. Filmen ble satt sammen av regissør Oscar Sharp for den 48-timers Film Challenge of Sci-Fi London-begivenheten.

Nå kan jeg ikke slutte å tenke på Terminator. Velkommen til fremtiden.

Bildekreditt: Wikipedia, TechInsider, The Verge, Wall Street Journal

Secretbook Lar deg skjule hemmelige meldinger i Facebook-bilder
Secretbook er en kromforlengelse utviklet av Owen Campbell-Moore, en informatikkstudent ved Oxford University og Ex Googler. Denne kromforlengelsen ...
Lag animerte forklaringsvideoer i 3 enkle trinn på MakeWebVideo
I en dagens verden er hvert felt i livet drevet av en nakke til nakke-konkurranse. Presentasjon og markedsføring har blitt en viktig del av markedsfør...
Hvordan migrere Windows 10 til en ny SSD
Oppgradering til en SSD (Solid State Drive) er den beste oppgraderingen du kan gi til datamaskinen din. Enten du har en aldrende maskin som bremser, e...