brs85 - Web

logo nrc

Europese privacywetgeving, zoals GDPR, zet onze techbedrijven op achterstand in de ontwikkeling van kunstmatige intelligentie, meent Arjan van Hessen.

7 november 2017 om 15:36

nrc 1

Wij leven in een wonderlijke tijd. Komend jaar treedt de nieuwe Europese wetgeving voor databescherming, de General Data Protection Regulation (kortweg GDPR) in werking. Hierdoor wordt het voor bedrijven een stuk lastiger om structureel persoonsgebonden data te verzamelen, langdurig te bewaren en met anderen te delen. Een strop om de nek van Europese techbedrijven, die deze data hard nodig hebben in hun strijd naar het nieuwe IT-goud: het talig vermogen.

nrc 2 Arjan van Hessen is onderzoeker taal- en spraaktechnologie aan de
Universiteit Twente.

Wat we zien is dat huidige toepassingen van kunstmatige of artificiële intelligentie (AI), zoals zelfsturende auto’s of ‘intelligent’ communicerende chatbots, steeds vaker de mens naar de achtergrond duwen. Mensen blijven dikwijls wel eindverantwoordelijk maar het leeuwendeel van het ‘werk’ zal door AI-gebaseerde software worden gedaan.

Maar sterke (lees: echte) kunstmatige intelligentie vraagt meer dan het herkennen van patronen in grote hoeveelheden ruizige data. Wat ons mensen bijzonder maakt is de mogelijkheid tot denken in concepten, in taal: beter bekend als ons ‘talig vermogen’. Alles wat je verzint, denkt en voelt, gebeurt immers aan de hand van taal. En onder taal verstaan we niet het Nederlands of Italiaans, maar een soort interne stem waarmee we in ons hoofd met onszelf communiceren.

Dit talig vermogen stelt ons in staat te overleggen en gedachten te verwoorden om zo tot diepere inzichten te komen. Om kunstmatige intelligentie op menselijk niveau te brengen, moeten computers eerst geleerd worden te ‘denken in taal’. Het bedrijf dat dit het eerst voor elkaar weet te krijgen, heeft goud in handen. Sterke AI zal voorlopig nog wel een droom blijven en voorlopig richt men zich op de zwakke AI, want ook daar valt nog een wereld te winnen. En dat geldt zowel voor de op patroonherkenning, als de op taalgerichte AI.

Voor de ontwikkeling van AI zijn zoals bekend grote hoeveelheden data nodig; data die vanwege GDPR volgend jaar niet meer of slechts met grote moeite beschikbaar zal zijn voor Europese techbedrijven. De waarschijnlijkheid dat zij op internationaal niveau mee kunnen blijven doen met concurrenten uit de VS en China wordt met de dag kleiner. Juist nu heeft onze IT-sector meer data nodig.

Internet of Things

Neem de leasebranche. Met de komst van Internet of Things staat een groeiend aantal applicaties en apparatuur met elkaar in verbinding via het internet. Dit genereert een enorme hoeveelheid data die tot nu toe voornamelijk negatief in het nieuws komt. Er is echter ook een vaak onderbelichte en positieve kant. Dezelfde data kunnen namelijk gebruikt worden om bedrijfsprocessen te stroomlijnen, kosten en tijd te besparen en zelfs het milieu te ontzien door een verlaging van energiekosten en uitstoot. De les die we hieruit kunnen leren is de volgende: data op individueel niveau die tot een persoon kan worden herleid kunnen gevaarlijk zijn, maar geanonimiseerde data op groepsniveau kunnen daarentegen veel voordelen opleveren.

Geanonimiseerde data op groepsniveau kunnen bedrijfsprocessen stroomlijnen en zelfs het milieu ontzien door verlaging van uitstoot

Het aan de hand van de thermostaatdata uitvogelen hoe laat iemand meestal zijn huis verlaat en weer terugkomt kan het inbrekersgilde op verkeerde ideeën brengen, maar een geaggregeerde en geanonimiseerde verzameling van deze data kan verkeersspecialisten helpen bij het opzetten van een optimale inrichting van wegen en openbaar vervoer. Gemeenten moeten juist dit soort gegevens als open data beschikbaar maken in de hoop dat bedrijven er ‘handige’ diensten mee ontwikkelen: diensten waarvan we nu nog niet weten dat we ze nodig hebben!

Een wet zoals de GDPR stelt terecht strenge eisen aan de beheerders van data die tot personen te herleiden zijn, maar door te besluiten dat dit soort data niet meer gebruikt mogen worden, wordt het kind met het badwater weggegooid. De Europese IT-sector heeft toegang tot dit soort data nodig, wil ze de aansluiting met de rest van de wereld niet missen. Een aanpassing van de regels is wellicht niet nodig, maar de Europese lidstaten zouden gezamenlijk moeten nadenken hoe de data toch op een veilige manier beschikbaar kan worden gesteld voor ontwikkeling in de techsector. Alleen dan hebben Nederlandse en Europese IT-bedrijven een kans in de zoektocht naar de heilige graal van de IT: de omgang met de talig mens.

24 - 07 - 2017

is een smart home de toekomst Is smart de toekomst? © Pixabay

Amsterdam, 24 juli 2017 - Interview met dr. Arjan van Hessen, als taal- en spraaktechnoloog verbonden aan de Universiteit van Twente en Utrecht en spreker tijdens het NVL Jubileum event op 12 september 2017.

Op dit moment vinden wij veel apparaten nog een beetje dom. Omdat ze niet vooruit kunnen denken en geen emoties (her)kennen. De sleutel tot echt slimme apparaten zit in het 'talig vermogen'; alles wat we bedenken, bedenken we via taal. Met zogenaamde artificial intelligence is men in staat om talig vermogen toe te voegen aan computers en objecten waardoor ze écht intelligent worden, bovendien zelflerend en ook in staat meerdere taken tegelijk uit te voeren.

De inzichten met betrekking tot deze technologie en de toepassingen ervan worden op het NVL Jubileum gepresenteerd door dr. Arjan van Hessen. NVL Next sprak hem alvast en samen keken we vooruit naar 12 september.

Kunstmatige intelligentie of Artificial Intelligence, kortweg AI, is een containerbegrip. Het komt neer op ‘met computers nabootsen van wat wij verstaan onder menselijke intelligentie’.

U bent als taal- en spraaktechnoloog hoofdspreker tijdens een jubileumevent van de Nederlandse vereniging van leasemaatschappijen. Waarom is dat minder onlogisch dan het op het eerste gezicht lijkt?

De laatste tijd is er enorm veel interesse in AI. Systemen proberen patronen te vinden in grote hoeveelheden data en ze proberen te redeneren en te voorspellen. De volgende grote stap is die van het begrijpen en dat is iets waar wij mensen ook goed in (denken te) zijn. Het talige vermogen van mensen dat ons in staat stelt te redeneren over gebeurtenissen, te fantaseren, als-dan scenario’s te bedenken en uit te werken, het abstraheren en het samenvatten. Dat wordt vaak gezien als de menselijke intelligentie. Als je daar wat mee wilt doen met computers, kom je al snel bij de taal en spraaktechnologie: die proberen immers de communicatie tussen mensen en machines na te bootsen door de menselijke communicatie zo goed mogelijk te begrijpen.

Waarom is juist taal een van de meest belangrijke zaken met betrekking tot het lerend vermogen van computers?
Taal, en dan niet “het Frans”, “het Chinees”, of “het Nederlands”, maar het talig vermogen van de mens onderscheidt ons van de overige (zoog)dieren. Dit talige vermogen stelt ons in staat om te leren, te bedenken, te abstraheren etc. Hoe beter we dit begrijpen, hoe beter we in staat zijn om het na te maken en dus hoe slimmer systemen kunnen worden.

Wat is het belangrijkste inzicht dat u de afgelopen jaren heeft ontdekt in relatie tot spraakherkenning?
Duidelijk is geworden dat de stap naar 100% herkenning, die door spraakherkenningstechnologen altijd als een soort heilige graal werd gezien, eigenlijk niet zo relevant is. Ook wij mensen herkennen de spraak niet vlekkeloos, maar we begrijpen de ander (hopelijk) wel volkomen. Gebrek in de herkenning wordt door ons gecompenseerd doordat we begrijpen waar het overgaat. Hiaten in de herkenning vullen we als het ware zelf aan. Daar zit natuurlijk ook een gevaar in: we denken dat we iets gehoord hebben, maar dat is niet altijd zo.. Dit is de stap van herkennen naar begrijpen en die is essentieel!

Facebook en Google investeren fortuinen in fundamenteel onderzoek rond artificial intelligence. Waarom doen ze dat?

Alle grote internetbedrijven investeren massaal in HLT, Human Language Technology. Wie als eerste in staat is om op een enigszins intelligente manier met mensen te communiceren, ze te begrijpen, te ondersteunen en ze te vermaken, heeft de buit binnen. Denk aan ouderen die eenzaam zijn, mensen die iets willen maar er niet uitkomen hoe dat te bereiken etc. Als er een slimme “robot” is die hier met jou over kan praten, je kan helpen…. Dan gaat er een hele wereld open.

Wat zijn voorbeelden van toepassingen van artificial intelligence waar u de komende 3-5 jaar het meest van verwacht?
We zullen AI op alle gebieden tegen gaan komen. Niet alleen in de HLT maar in werkelijk alles. Denk aan het herkennen van beelden, het vroegtijdig opsporen van ziektes op basis van een hersenscan, het voorspellen wanneer een onderdeel in een apparaat vervangen moet worden, het helpen bij medische beslissingen, het ondersteunen van advocaten en rechters, het communiceren met mensen via internet bij bv het aanvragen van een hypotheek, etc. Er is waarschijnlijk niet een gebied waar het niet zal worden gebruikt.

Waar in de keten zou de overheid een rol kunnen of moeten spelen in stimuleren van de toepassingen van artificial intelligence?
De overheid zou veel meer moeten investeren in het opbouwen van de kennis door het verzamelen en (her)gebruiken van data (uiteraard met inachtneming van privacy) te stimuleren. Nu doen de grote internetbedrijven (Apple, Google, Facebook, IBM, Microsoft, Amazon) dat waardoor alle kennis naar de overkant “lekt” en daar ook onze data staan. Onze technici en universiteiten doen niet veel onder voor de Amerikanen, maar het is in Europa veel lastiger om grote hoeveelheden data te bewaren en vooral te hergebruiken. Als dat eenmaal gaat dan komen de toepassingen vanzelf. Maar we moeten oppassen het goud (de data) niet te verkwanselen aan anderen.

Je bent ook actief in het bedrijfsleven, bijvoorbeeld klantcontactsector, wat speelt er in die sector wat betreft AI?
Ja dat klopt. Enerzijds zien we dat bestaande software (veel) beter wordt door het gebruik van AI, anderzijds zien we dat nieuwe mogelijkheden opkomen door slimme toepassingen van AI. Denk daarbij aan het voorspellen. Je belt een bedrijf/organisatie en stelt een vraag. Hoe kun je het best met de combinatie van tijdstip, beller, zijn/haar geschiedenis, de gestelde vraag en beschikbare resources bij de organisatie omgaan om ervoor te zorgen dat de beller en de organisatie optimaal geholpen worden? Hierbij kan al 95% van de vragen juist worden afgehandeld. En veel sneller en goedkoper. Dit biedt bedrijven veel kansen.

Wat is de belangrijkste mind shift die de leasebranche volgens u zou moeten maken?
Ga experimenteren. Denk niet: dat zal mijn tijd wel duren want dan zijn de Amerikanen en Chinezen er al. Probeer al dan niet in samenspraak met slimme bedrijven, start-ups en universiteiten te experimenteren met wat mogelijk is en wat nu nog onmogelijk lijkt. Probeer de toekomst te voorspellen op basis van alle gegevens die je nu al hebt. Verzamel data, ook waarvan je nu het nut niet inziet, uiteraard binnen de grenzen van de privacy wetgeving. Leg vragen en processen vast, zodat je die straks kunt ontrafelen en op basis van de data betere beslissingen kunt nemen. Bijvoorbeeld het goedkeuren van lease-aanvragen; als je het goed organiseert kan een computer dat op basis van data beter en sneller dan een mens. Of voorspellen welke bedrijfsmiddelen onderhoud nodig hebben of welke klanten binnenkort de leasetermijnen niet meer kunnen betalen. Denk na over toepassingen voor jouw bedrijf. Maar doe iets!

Welk advies heeft u, tot slot, voor mensen die dit interview lezen?
Verdiep je er in, lees er over, probeer mee te doen en laat je bijpraten door mensen die er meer van weten. Deze leestips zijn misschien een leuk begin:

https://medium.com

https://artplusmarketing.com/digital-processes-inspiring-analog-paintings-a358eb7801a0

http://notas.nl/artikelen/blogs/165-spraakherkenning-van-nederlandse-bodem

Smaakt dit naar meer? Je hoort Arjan tijdens het NVL Jubileum event op 12 september. Ben je werkzaam bij een van de leden van NVL, dan kun je je aanmelden voor het event: http://noq.caos.nl/forms/NVLjubileum/application/

Door Pascal van Hombergh, namens NVL Next

Pagina 1 van 5

China en VS gaan er met het nieuwe IT-goud vandoor

Internet of Things

De toekomst van machines is 'smart'