Iedereen die Google Foto's heeft geprobeerd, is het ermee eens dat deze gratis fotoopslag- en beheerservice van Google slim is. Het bevat verschillende slimme functies zoals geavanceerd zoeken, mogelijkheid om uw foto's te categoriseren op locaties en datums, automatisch albums en video's te maken op basis van overeenkomsten en u door de geheugenstrook te leiden door u foto's van dezelfde dag enkele jaren geleden te laten zien. Er zijn veel dingen die Google Photos een aantal jaren geleden kan doen, maar dat is vrijwel onmogelijk. Google Foto's is een van de vele 'slimme' services van Google die gebruikmaken van een machine learning-technologie genaamd TensorFlow. Het woord leren geeft aan dat de technologie in de loop van de tijd slimmer zal worden tot het punt dat onze huidige kennis niet kan bedenken. Maar wat is TensorFlow? Hoe kan een machine leren? Wat kun je ermee doen? Laten wij het uitzoeken.
Wat is TensorFlow?
TensorFlow is de open-source en krachtige kunstmatige intelligentiesoftware van Google, die veel services en initiatieven van Google aanstuurt. Het is de tweede generatie van een systeem voor grootschalige machine learning-implementaties, gebouwd door het Google Brain-team. Deze bibliotheek met algoritmen volgt DistBelief op, de eerste generatie.
De technologie vertegenwoordigt berekening als stateful gegevensstroomgrafieken. Wat TensorFlow uniek maakt, is de mogelijkheid om berekeningen te modelleren op een breed scala aan hardware, van mobiele apparaten op consumentenniveau tot multi-GPU-servers van wereldklasse. Het kan op verschillende GPU's en CPU's worden uitgevoerd en belooft de schaalbaarheid van machinaal leren tussen de verschillende apparaten en gadgets zonder dat een aanzienlijke hoeveelheid code hoeft te worden gewijzigd.
TensorFlow is ontstaan vanuit de behoefte van Google om een computersysteem te instrueren om na te bootsen hoe een menselijk brein werkt in leren en redeneren. Het systeem, bekend als neurale netwerken, zou in staat moeten zijn om uit te voeren op multidimensionale gegevensarrays die "tensoren" worden genoemd. Het einddoel is om de neurale netwerken te trainen om patronen en correlaties te detecteren en te ontcijferen.
In november 2015 heeft Google deze technologie open-source gemaakt en toegestaan deze te gebruiken voor allerlei producten en onderzoeken. Iedereen, inclusief onderzoekers, ingenieurs en hobbyisten, kan de groei van machine learning helpen versnellen en op een hoger niveau brengen in minder tijd.
Deze stap bleek de juiste te zijn omdat er zoveel bijdragen van de onafhankelijke ontwikkelaars aan TensorFlow zijn dat ze de bijdragen van Google ver overtreffen. Wikipedia vermeldt dat "er zijn 1500 repositories op GitHub die TensorFlow vermelden, waarvan er 5 van Google zijn." Dat gezegd hebbende, vermoedt een van de discussies bij Quora dat de vrijgegeven open-sourcecode de "opgeruimde" versie is van de een die Google gebruikt in haar services.
Hoe werkt TenserFlow?
Gebruik makend van de eenvoudige normale menselijke taal en een zware vereenvoudiging, kunnen we de ene kant van TensorFlow zien als een geavanceerde autonome filtertechnologie. In de kern is de technologie een enorme softwarebibliotheek van machine learning. Het gebruikt de database om het te helpen "een beslissing te nemen".
Iemand uploadt bijvoorbeeld een foto naar Google Foto's. De technologie vergelijkt alle details van de foto met de database en beslist of het een foto is van een dier of een mens. Als het dan een mens is, zal het proberen het geslacht te bepalen, leeftijd tot helemaal naar wie de persoon is. Hetzelfde proces wordt herhaald voor andere objecten op de foto.
Het maakt ook gebruik van gebruikersgegevens, zoals de identiteit van de persoon op de foto en de locatie waar de foto wordt gemaakt, om de bibliotheek te verbeteren zodat deze in de toekomst betere resultaten kan opleveren - zowel voor de persoon die de foto heeft geüpload en voor iedereen anders. Vandaar de term 'leren'. Maar het houdt niet alleen op bij het kennen en leren van gegevens uit foto's. Er is zoveel dat de technologie kan doen met informatie uit een foto. Het kan bijvoorbeeld foto's groeperen met vergelijkbare details, zoals dezelfde persoon, dezelfde locatie, dezelfde datum; bekijk het patroon van gezichten om te bepalen tot welke familie en vrienden de persoon op de foto behoort en gebruik de informatie om video's van gezinsvakanties of -animaties te maken van doorlopende opnamen.
Dat krast nauwelijks het oppervlak van hoe TensorFlow werkt, maar ik hoop dat het u een algemeen beeld van de technologie kan geven. Ook kan het gebruik van slechts één voorbeeld geen recht doen aan wat het in staat is.
En voor alle liefhebbers van kunstmatige intelligentie die er zijn, is het de moeite waard te vermelden dat Google al een computerchiptechnologie heeft gemaakt die is geoptimaliseerd voor machine learning en waarmee TensorFlow erin kan worden geïntegreerd. Het wordt de ASIC-chip van de Tensor Processing Unit (TPU) genoemd .
Degenen die meer willen weten over TensorFlow kunnen de zelfstudiepagina bezoeken.
Toepassingen van TensorFlow
We bevinden ons in een vroeg stadium van machine learning-technologie, dus niemand weet waar het ons heen zal brengen. Maar er zijn een paar eerste toepassingen die ons een blik in de toekomst kunnen geven. Omdat het afkomstig is van Google, is het duidelijk dat Google de technologie voor veel van zijn services gebruikt.
Meer over beeldanalyse
We hebben het voorbeeld besproken van het gebruik van de technologie voor beeldanalyse in Google Foto's. Maar de beeldanalysetoepassing wordt ook gebruikt in de Street View-functie van Google Maps. TensorFlow wordt bijvoorbeeld gebruikt om de afbeelding te verbinden met de kaartcoördinaten en om automatisch het kenteken te vervagen van elke auto die per ongeluk in de afbeelding is opgenomen.
Spraakherkenning
Google gebruikt TensorFlow ook voor zijn spraakherkenningssoftware. De technologie die gebruikers toestaat om instructies uit te spreken is niet nieuw, maar met inbegrip van de immer gegroeide bibliotheek van TensorFlow in de mix kan de functie enkele inkepingen opleveren. Momenteel herkent de spraakherkenningstechnologie meer dan 80 talen en varianten.
Dynamische vertaling
Een ander voorbeeld van het "leer" -gedeelte van machine learning-technologie is de vertaalfunctie van Google. Google staat zijn gebruikers toe om nieuwe vocabulaires toe te voegen en de fouten in Google Translate te corrigeren. De steeds groter wordende gegevens kunnen worden gebruikt om automatisch de invoertaal te detecteren die andere gebruikers willen vertalen. Als het apparaat fouten maakt in het taaldetectieproces, kunnen gebruikers dit corrigeren. En de machine zal leren van die fouten om zijn toekomstige prestaties te verbeteren. En de cyclus gaat verder.
Alpha Go
Een leuk voorbeeld van gebruik van TensorFlow is Alpha Go. Het is een applicatie die is geprogrammeerd om Go te spelen . Voor degenen die niet bekend zijn met Go, het is een abstract bordspel voor twee spelers die meer dan vijfduizend jaar geleden in China zijn ontstaan, en het is het oudste bordspel dat nog steeds continu wordt gespeeld. Hoewel de regels eenvoudig zijn - om meer territorium te omringen dan de tegenstander, is het spel ongelooflijk ingewikkeld en, volgens Wikipedia: "bezit meer mogelijkheden dan het totale aantal atomen in het zichtbare universum."
Het is dus interessant wat een leermachine-technologie kan doen met de oneindige mogelijkheden. In de wedstrijden tegen Lee Sedol - de wereldkampioen 18-jarigen - won Alpha Go 4 van de 5 wedstrijden en kreeg het de hoogste Go-rang voor grootmeesters.
Magenta Project
Een andere interessante toepassing van TensorFlow is het Magenta Project. Het is een ambitieus project om door de machine gegenereerde kunst te maken . Een van de eerste tastbare resultaten van het experiment is de pianomelodie van 90 seconden. Op de lange termijn hoopt Google via haar Magenta-project geavanceerdere door de computer gegenereerde kunst te genereren en een gemeenschap van kunstenaars eromheen te bouwen.
In februari 2016 hield Google ook een kunsttentoonstelling en -veiling in San Fransisco, waarop 29 computer gegenereerde - met een beetje hulp van de mens - kunstwerken te zien waren. Zes van de grootste werken werden verkocht voor maar liefst $ 8000. De computer heeft misschien nog een lange weg te gaan voordat het een echte artiest kan imiteren, maar de hoeveelheid geld die mensen bereid zijn te betalen voor de kunst laat zien hoe ver de technologie is gegaan.
Ondersteuning voor iOS
Hoewel we de mogelijkheden van TenserFlow op Android al hebben gezien, met de nieuwste versie, voegt TensorFlow eindelijk ondersteuning toe voor iOS-apparaten. Omdat er heel veel geweldige mobiele apps beschikbaar zijn exclusief voor iOS, of eerst op iOS worden uitgebracht, betekent dit dat we in de nabije toekomst meer geweldige mobiele apps kunnen verwachten die het leren van computers zullen accepteren. Hetzelfde kan gezegd worden voor de mogelijkheden van bredere adopties en toepassingen van TensorFlow.
De toekomst van TensorFlow
Wat kan men doen met een machine die in staat is om te leren en zijn eigen beslissing te nemen? Als iemand die meer dan één taal behandelt als onderdeel van het dagelijkse leven, is het eerste wat in me opkomt taalvertaling. Niet per woordniveau, maar meer op het langere tekstniveau, zoals documenten of zelfs boeken. De hedendaagse vertaaltechnologie is beperkt tot de vocabulaires. Je kunt eenvoudig achterhalen wat 'slapen' is in het Chinees en omgekeerd, maar probeer in een hoofdstuk van Eiji Yoshikawa's Musashi in zijn oorspronkelijke Japans te gooien en het hoofdstuk in het Engels te vertalen. Je zult zien waar ik aan begin.
Het is ook leuk om te zien wat de toekomst van Kunstmatige Intelligentie met muziek kan doen. Hoewel het nog steeds erg eenvoudig is, kan de Music Memo-app van Apple al automatische bas en drums begeleiden naar je opgenomen zang. Ik herinner me een aflevering van een SciFi tv-show waar een personage in de show een machine creëerde die alle topnummers in de hitlijsten analyseert en in staat is om zijn eigen hitnummers te schrijven. Zullen we daar ooit aankomen?
En als afsluitende gedachte zou ik graag Sunspring willen noemen. Het is een korte science fiction-film die volledig is geschreven door een AI-scenarioschrijver die zich Benjamin noemde - en die zelfs het muzikale pop-partje componeerde. De film is samengesteld door regisseur Oscar Sharp voor het 48-uurs Film Challenge of Sci-Fi London-evenement.
Nu kan ik niet stoppen met denken aan de Terminator. Welkom in de toekomst.
Beeldcredits: Wikipedia, TechInsider, The Verge, Wall Street Journal