De computer moet zich leren gedragen

Fred Teunissen
De toekomst van de IT (1)

Als we denken dat een computer slim is, dan hebben we het mis. De meest geavanceerde systemen van dit moment hebben nog niet meer dan het denkvermogen van een kind van drie, zegt Marc Teerlink, global strategist van IBM. En net als bij een kind van drie houden ze nauwelijks rekening met ons, maar dwingen ze ons rekening te houden met hen. De komende tien jaar gaat dat compleet veranderen. Computer-systemen gaan leren redeneren en ontwikkelen zelfs een moraal. En ze zullen zich beter aan ons gaan aanpassen. Als ze ons tegen die tijd niet te slim af zijn natuurlijk.

Wie een glimp wil opvangen van hoe de wereld van de IT – en dus die van onze business – er over tien jaar uit zal zien, moet twee dingen doen: allereerst een kijkje nemen in de R&D keuken van grote it-aanbieders als IBM, HP, Apple, Samsung, Microsoft, Dell, Cisco, Amazon en Google. De tweede stap is je oor te luister leggen bij start-ups. Niet alleen in het domein waarin jouw organisatie actief is, maar ook in een ruime kring daaromheen. Waarbij aangetekend kan worden dat een start-up eigenlijk ook een R&D-afdeling is, want ontwikkeling gaat altijd voor de baat uit.

First of a kind
ICT Magazine zal komend jaar aandacht besteden aan de toekomst van de IT. We spreken daarvoor met sleutelpersonen uit de gevestigde industrie, maar zullen ook aandacht besteden aan digitale onruststokers, die zich opmaken om de gevestigde verhoudingen op de proef te stellen. De aftrap is voor Marc Teerlink, één van de zes ‘global strategists’ van IBM. Zijn focusgebied is Big Data Science & Customer Behaviour Analytics. Marc is nauw betrokken bij de ontwikkelingen rondom IBMs supercomputer Watson en komt over de hele wereld bij klanten over de vloer die met iets totaal nieuws bezig zijn. First-of-a-kind-projecten noemt hij dat. Daar zit hij met zijn neus bovenop. Voor zijn wereldwijde team van 173 medewerkers fungeert hij als ‘professionele gekmaker,’ vertelt hij lachend, als we hem spreken in het Nederlandse hoofdkantoor van IBM aan de Johan Huizingalaan in Amsterdam.

Scenario’s ontwikkelen
Marc praat als een waterval. Van alle kanten komen er stromen en stroompjes in zijn betoog samen met af en toe met een zijwaartse beweging als er onderweg een rotsblok is geraakt. Maar steeds opnieuw keert hij terug naar de hoofdstroom. En die gaat snel. “Het is mijn taak om vooruit te kijken in tijdvakken van drie, zes en negen jaar,” steekt hij van wal. “Dat doe ik samen met mijn team, met de overige global strategists, de mensen van IBM Research en de algemene strategische leiding van de onderneming. Onze bevindingen leggen we vast in scenario’s. Soms zijn dat scenario’s waarin we aangeven dat we niet weten wat er op een bepaald gebied zal gaan gebeuren. Een goed voorbeeld daarvan is interfacing. Wie had een paar jaar geleden gedacht dat we zo absurd snel naar touch screens zouden gaan? De komst van de iPhone in 2007 heeft het totale beeld in zeer korte tijd veranderd. Het wachten is nu op een nieuwe uitdager die met de volgende disruptieve technologie komt. Wat wordt het toegangsportaal over negen jaar? Niemand die dat nu weet.”

Stevige uitdagingen
“Ieder jaar vindt er bij IBM een interne discussie plaats over de vraag welke projecten genomineerd moeten worden voor onze ‘Next Grand Challenge’. Die projecten moeten gepitched worden op verschillende niveaus en uiteindelijk hakt onze Board de knoop door. Periodiek legt onze organisatie zich hiermee een stevige uitdaging op. We sponsoren zo’n project en er zit ook veel inzet en vrije tijd van onze medewerkers in. Een voorbeeld daarvan is het Genographic Project, dat we in 2005 selecteerden. Uitkomst was dat je aan de hand van je eigen DNA kunt zien hoe je voorouders zich tot wel 20.000 jaar geleden over de aarde hebben bewogen. Ook de deelname van Watson aan de tv-show Jeopardy is in 2008 uitverkoren als Next Grand Challenge. Daaraan gingen allerlei brainstormsessies vooraf. Zo van ‘we moeten iets doen met natuurlijke taal’ en ‘O ja, ook iets met machine learning en met structured en unstructured data’ en ‘O ja, niet op zo’n manier dat het doet wat een mens die snel denkt ook al kan, maar het moet combinaties vinden die een mens normaal nooit had kunnen vinden‘. Zo komen er binnen IBM allerlei ideeën naar boven en worden er teams samengevoegd. Bijvoorbeeld hardcore researchers zoals het team van Dave Ferrucci en zijn mannen en vrouwen die met machine learning en language parsing bezig zijn met mensen als Michael Haydock, onze chief scientist, en ikzelf die meer vanuit de bedrijfseisen denken en commerciële toepassingen zoeken. In dat brainstormstadium dacht niemand nog aan Jeopardy. Totdat Charles Lickel, één van onze collega’s die ook weer vanuit een ander team kwam, in een sportbar in New York zat en zag wat er gebeurde toen deelnemer Ken opging voor de veertigste ronde. Iedereen rende naar een klein scherm in de hoek van die bar om mee te kijken. Sport deed er even niet meer toe. Op dat moment ontstond bij Charles het idee.”

De uitdaging: ontwikkel een systeem dat natuurlijke taal begrijpt en ook in diezelfde natuurlijke taal kan antwoorden op een veelheid van vragen. Eind 2008 werd een dedicated team gevormd met als kern dat van Dave Ferruci. Teerlink nam plaats in het extended team, met onder meer de taak ervoor te zorgen dat al in het ontwikkeltraject rekening gehouden werd met latere commerciële toepassingen. “Daar hebben we namelijk met het eerdere Grand Challenge-project met Kasparov leergeld mee betaald. Er was geen bedrijf ter wereld dat zat te wachten op een hele grote schaakcomputer.”

Cognitive computing
Watson stond uiteindelijk zijn mannetje in Jeopardy en versloeg beide menselijke topkandidaten. Het was mooi dat daar zoveel media-aandacht voor was, maar toch was dit succes nog maar een bescheiden stap op de lange weg naar cognitive computing, stelt Teerlink vast. “De manier waarop Watson bij Jeopardy redeneerde is te vergelijken met die van een kind van drie. Die gooit het dopje van de yoghurt op de grond om te zien wat er gebeurt en herhaalt dat proces misschien wel honderdmaal totdat het weet dat de zwaartekracht altijd hetzelfde werkt. Watson bleef in sommige opzichten gewoon doorgaan het dopje op de grond te gooien en was in die zin oliedom. Het systeem analyseerde iedere vraag telkens opnieuw en op dezelfde manier: Heb ik deze vraag al eerder gehad? En zo ja, is er dan in de tussentijd iets veranderd? Dat zijn de what if, then else vragen die zo kenmerkend zijn voor het tijdperk van het puur technische programmeren dat we middels cognitive technology achter ons gelaten hebben. Dit tijdperk beslaat grofweg de periode 1950 tot 2011. Wat in die aanpak nog ontbreekt, is het voorspellende karakter. En wat ook nieuw is: computersystemen beginnen te leren van hun ervaringen.”

Om computersystemen zo slim te krijgen moet aan vijf voorwaarden worden voldaan. Teerlink somt ze op. “Om te beginnen moet je complexe hoeveelheden data kunnen ontsluiten. Dat zijn meestal combinaties van gestructureerde en ongestructureerde data. Het hoeven niet alleen woorden te zijn, maar bijvoorbeeld ook gegevens van sensoren. Dat is stap 1: unleash Big Data. Stap 2 is visualiseren, want je krijgt zoveel gegevens dat je daar niks mee kunt aanvangen. Ik zal een voorbeeld geven. Mijn dochter heeft bij ons thuis alle oude muziekcassettes, lp’s, cd’s en oude videobanden gedigitaliseerd. Prima natuurlijk. Schone, betrouwbare data, allemaal keurig getagd. Maar nu ga ik een feestje geven en probeer ik een playlist samen te stellen uit 25.000 ongestructureerde mp3′s. Dat gaat me niet lukken. Visualisatie begint met context en purpose en dat geeft doorzicht en houvast in grote hoeveelheden data. Dit is één van de grote uitdagingen van dit moment. Zonder visualisatie kan ik ook geen goede vergelijkingen maken.
Stap 3 is delen. Jeopardy is één vraag, één antwoord en één persoon. Er wordt niks gedeeld. In de business-praktijk wordt overal gedeeld. Het gaat meer en meer om zakelijke ecosystemen. Er worden ook steeds meer gegevens gedeeld buiten die ecosystemen. Het kunnen delen van de uitkomst en het kunnen reageren daarop is één van de allerbelangrijkste dingen. Delen is het nieuwe hebben. Wat wij hebben geconstateerd is dat bedrijven die in de moeilijke periode van 2007 tot 2011 in staat waren om a) binnen en buiten hun waardeketen informatie te delen en b) dat op een voorspellende manier te doen, vijf keer meer top line growth realiseerden dan anderen in dezelfde branche.
Stap 4 is het echt kunnen voorspellen. De meeste bedrijven doen dat niet. Ze doen wel aan extrapolatie of correlatie, maar voorspellen is iets anders. Je moet je concentreren op de signalen zijn die er echt toe doen. Die vind je soms als je kijkt tussen de data. Een goed voorbeeld is Starbucks. Niemand heeft ooit aangegeven voortaan liever vijf euro te betalen voor zijn koffie in plaats van twee. Maar er was wel een sluimerende wens om in een wat chiquere omgeving betere kwaliteit koffie te kunnen drinken, met werkruimte en mogelijkheden om anderen te ontmoeten. Starbucks heeft goed op die behoeften ingespeeld. Het kunnen kijken tussen de data is een vaardigheid waarmee een data scientist wonderen kan verrichten. Stap 5 is het cognitief maken van het systeem. Cognitive computing heeft drie kernaspecten: het kunnen begrijpen van taal in context, het geven van een antwoord op basis van betrouwbaarheid en machine learning. Dat laatste wil zeggen: werken met modellen die modellen kunnen aanpassen zonder dat er geprogrammeerd wordt. Computers kunnen op deze wijze leren door middel van training, precies zoals een kind dat doet.”

Toepassingen
“IBM is nu bezig cognitive computing te ontwikkelen voor een aantal sectoren, bijvoorbeeld in de gezondheidszorg. Kijk maar eens naar de invulling in de zorg van de vijf stappen die ik zojuist noemde. Stap één: complexe gestructureerde en ongestructureerde data is hier ruimschoots aanwezig en kan ik ontsluiten. Twee: de medische wereld is gewend aan visualiseren. Drie: en heeft bovendien een algemeen gedeeld taalgebruik en is al gewend gegevens te delen tussen verschillende partijen. Ontsluiten naar meer partijen was daarentegen vaak nog een probleem. Vier: triage en voorspellingen voor behandelingen beginnen langzaam van de grond te komen. En vijf: omdat deze sector al deze dingen heeft en dat ook nog eens in de vorm van patiëntcases kun je het cognitieve systeem gaan trainen. Je geeft het opgaven en corrigeert de antwoorden waar het systeem mee komt. Zo maak je het stap voor stap wijzer. Dat is iets anders dan wanneer je een lijst met vragen en antwoorden opstelt. Veel mensen denken dat wij Watson geleerd hebben wat alle Jeopardy-vragen zouden kunnen zijn en hoe daar op te antwoorden, maar zo werkt Watson niet. We hebben Watson geleerd hoe je een vraag moet begrijpen, hoe je het vertrouwen in de bronnen waaruit je put kunt wegen, hoe je die bronnen vervolgens ontsluit en hoe je de miljoenen variaties inschat van kandidaat-antwoorden om tenslotte te kunnen vaststellen in welk antwoord je het meeste vertrouwen hebt.
Nu was het bij Jeopardy zo dat Watson uiteindelijk met één antwoord moest komen. Maar bij een toepassing voor bijvoorbeeld een afdeling oncologie in een ziekenhuis kun je met varianten werken. Watson kan op basis van de analyse van de cases en zijn aansluitende training verschillende behandelmethoden voorstellen. Sommigen daarvan sluiten beter aan bij de voorkeur van de patiënt. De oncoloog hoeft zich nu niet meer hoofdzakelijk op de diagnose te richten, maar kan meer aandacht geven aan de persoonlijke situatie van de patiënt en alternatieven aandragen. Deze nieuwe functionaliteit in Watson noemen we de ‘engagement advisor’. Of, als je wilt, de bijna niet uit te spreken vakterm: collaborative cognitive predictive analytics. Deze term is in de praktijk al aan het vervagen tot cognitive analytics en er komt een tijd dat je hem niet meer gebruikt, omdat dit proces dan heel normaal geworden is. Iedereen doet het dan. Er zijn legio toepassingen voor de engagement advisor. We zullen dan ook voor iedere industrietak een daarop toegespitste variant op de markt brengen.”

Watson ecosysteem
IBM is inmiddels ook bezig de Watson hardware te schalen en stukken van de software apart beschikbaar te maken. Ter vergelijking, in 2011 had Watson de omvang van acht Amerikaanse koelkasten en einde 2013 van nog slechts drie gestapelde pizzadozen. Stukjes Watson dus voor wie er zelf mee aan de slag wil. Daarnaast heeft IBM Watson eind 2013 opengesteld als cloud-platform waarop ontwikkelaars applicaties kunnen ontwikkelen. IBM wil zo een ecosysteem rondom zijn supercomputer in het leven roepen. “Niet voor één bedrijf, maar voor communities,” benadrukt Teerlink. En hij verduidelijkt: “Er zitten twee lagen in dit platform. Een content-laag en een applicatie-integratie-laag. Iedereen mag op dit platform voorstellen doen voor apps en content-stromen. Een voorstel dat ik zelf gedaan heb is een app voor mensen die last hebben van luchtweginfecties zoals astma, copd, bronchitis en dergelijke. Het grootste probleem voor deze groep is dat het medicijngebruik niet constant is. Het hangt van een heleboel omstandigheden af wanneer je iets inneemt. Ik zou nu graag een appje willen zien dat een paar dingen automatisch voor je bijhoudt, zoals het aantal pollen in de lucht, de luchtvochtigheid, de mogelijke negatieve interacties tussen verschillende soorten medicijnen, testresultaten en dergelijke en waar bovendien ervaringen van andere medicijngebruikers in zijn verwerkt. Daarmee verander ik mijn medicijnregime niet, maar wel het moment en de volgorde van het gebruik. De meeste astmapatiënten experimenteren zelf allang. Dit helpt hen daarbij. Zo eenvoudig is het.”
App-ontwikkelaars gaan Watson nu trainen aan de hand van cases. Daarbij is feedback van de gebruikers van deze apps cruciaal. Teerlink voorziet hier een soort natuurlijk selectieproces: “App-ontwikkelaars die erin slagen feedback van hun gebruikers te stimuleren zullen aanzienlijk slimmere apps op de markt brengen en daardoor meer kans op succes hebben.”

Van zelflerend naar redenerend en dienend
“Watson is nu al zelflerend. We gaan vervolgens toe naar zelfredenerend. Stel je daarvoor een personal lifestyle app voor. Daarin staat je dieet. Die app communiceert via de cloud of via je device met je supermarktapp en adviseert je vervolgens bepaalde producten van je boodschappenlijst af te halen. Dat is typisch zelfredenerend. Het mooie van advies is overigens dat je het in de wind kan slaan. Je kunt zo’n app uitzetten. Je blijft zelf aan het roer.”
Teerlink schetst in samenhang hiermee een perspectief van meer dienende computers. “In 2015 zullen we de rekenkracht bereiken van het menselijk brein. En de redeneerkracht van het menselijk brein? Hou dat voorlopig maar op 2020. Deze systemen kunnen dan weliswaar redeneren, maar je zou ze in het autistisch spectrum kunnen zetten. Ze kennen nog geen empathie. Daarin wordt in 2025 voorzien, want dan komt er een moreel framework bij. Dit wordt van groot belang. Wat zullen die ethische regels straks zijn? We hebben voor het antwoord op die vraag gelukkig nog ruim elf jaar de tijd. Naarmate de digitalisering doorzet zullen we ook meer humanisering van technologie zien. Onze systemen zullen steeds beter moeten leren hoe ze ons van dienst kunnen zijn, in plaats van dat wij ons moeten inspannen om hun te bedienen.”

Links:
Genographic Project
‘Customer analytics pay off’ – Onderzoek relatie Big Data Analytics en omzetgroei (pdf)

Naschrift
Bovenstaand interview vond op 22 november 2013 plaats. Begin januari 2014 maakte IBM bekend 1 miljard dollar te gaan investeren in de verdere ontwikkeling van ‘Watson’. Er is een aparte IBM Watson Group gevormd die 2000 medewerkers krijgt. De onderneming verwacht dat de vraag naar toepassingen van de Watson-technologie de komende jaren sterk zal toenemen en dat dit nieuwe bedrijfsonderdeel in 2018 goed zal zijn voor 11 procent van omzet wereldwijd.

Marcs TED talk
In januari 2013 sprak Marc Teerlink tijdens TEDxFlanders over Watsons deelname aan Jeopardy. Hij legt uit hoe Watson tot een antwoord komt en geeft een voorbeeld van een toepassing in de medische beroepspraktijk.
Titel: Masters of our own Destiny.  >>> Video

Chef Watson
Watson heeft onlangs een culinair uitstapje gemaakt. Opdracht: maak eens een paar totaal nieuwe recepten op basis van reeds bestaande. Er kwamen combinaties uit die niet zo snel uit een mensenbrein zouden ontspruiten, maar niettemin verrukkelijk waren volgens kenners, zoals een gerecht op basis van mango en cayennepeper.  >>> Video

Gerelateerde berichten...