BRS85
  • Schrijfsels
    • Blogs
    • Populaire
    • Wetenschappelijk
    • Drenten
  • In de media
    • AV
    • Web
    • Krant
    • Lezingen
    • AV-Lezingen
    • Televisie
  • Werk
    • TST & AI
      • Spraakherkenning
      • AI
      • Whisper
      • Knowledge Navigator
      • Showcases
      • LIPS
      • UvN
      • Maastricht
      • Diplomaten
      • TTS
      • URaad
      • Preek
    • Affiliaties
      • UTwente
      • UU
      • Telecats
      • Vorige wergevers
    • Netwerken
      • NOTaS
      • CLST
      • Levende Herinneringen
      • SOS
    • Infrastructuur
      • CLARIAH
      • CLARIN-NL
      • CLARIN-EU
      • DARIAH
      • CHAT
      • LISTEN
      • Verteld Verleden
    • Projecten
      • Voltooid
        • TTNWW
        • Radio Oranje
        • Buchenwald
        • Bosnian Memories
        • Croatian Memories
      • Lopend
        • OH-Smart
        • Corpus Gesproken Nederlands
      • Demonstratie
        • Gemeenten
        • Oratie
        • Preek
        • Klimaatverandering
        • Café Weltschmerz
        • Debat Gemist
    • Programming
    • Software
    • Over mij
    • LOT 2023
      • Background
      • Course
    • NTU
    • Workshop(s)
  • Persoonlijk
    • Arjan
      • Arjan
      • Ouders
      • Zus & Broer
      • Neven & Nicht
      • Grootouders
      • Foto's
    • Brigitte
      • Operatie
    • Drentsche Patrijshonden
      • Pepper
      • Moos
    • Huizen
      • Samen
        • Italië
        • Burg. Reiger (2010 - ...)
        • Steve Biko (2009 - 2010)
        • Baarnseweg (2007 - 2009)
        • Poortstraat (1994 - 2007)
      • Arjan
        • Poortstraat (1977 -1994)
        • Sweelincklaan (1972 -1977)
        • Soestdijkseweg (1965 -1972)
        • Biltzigt (1958 -1965)
      • Brigitte
        • Thijssenlaan (1985 - 1994)
        • Braamstraat (1981 - 1985)
        • Voorstraat (1980 -1981)
        • Hopakker (1980 -1980)
        • Kemperstraat (1979 -1979)
        • Verwerstraat (1968 - 1979)
        • Oude Raadhuisstraat (1961 - 1968)
        • Drostlaan (1960 - 1961)
    • Rolanda
      • Levensverhaal
      • Rolanda 85
      • Afnemende Gezondheid
      • Begrafenis
      • Foto's
        • 85 Jaar
        • Sta-op stoel
  • Interessant
    • Zipf's Law
    • Conversatie Regels
    • Toon PDF
  • Extra Activiteit

Arjan van Hessen: “Taal- en spraaktechnologie gaat de wereld veranderen”

Het is een kleine stap van de geofysica naar de taal- en spraaktechnologie. Het gaat allebei om trillingen en golven. Dus voor Arjan van Hessen, opgeleid tot geofysicus, was de overstap logisch. Hij is werkzaam bij diverse universiteiten, is betrokken bij het project Clariah en werkt voor het bedrijf Telecats. “Wat ik ontzettend boeiend vind is datgene wat er uitgevonden wordt in de praktijk gebruiken. Ik ben niet een hele goeie wetenschapper, maar ik ben wel goed in staat om die vertaalslag te maken van dat wat al die slimme collega’s van mij doen naar het bedrijfsleven waar ik ook werk.  Dus om te zorgen dat datgene wat bedacht en uitgevonden wordt en waar mensen aan werken om dat ook echt in de maatschappij te gaan gebruiken.”

Op dit moment zijn er al vrij veel toepassingen van taal – en spraaktechnologie waar mensen dagelijks mee te maken krijgen. Denk aan de spellingschecker op de computer of de TomTom die tegen je praat. Maar de komende jaren zullen de voorbeelden alleen maar toenemen. “We zien dat de verzorgingsmaatschappij onder druk staat, mensen worden ouder. Er zijn minder jongeren om voor de ouderen te gaan zorgen. Je ziet al in Japan dat er steeds meer robots komen, maar wil je die robots echt in het intermenselijk verkeer als partner hier aan tafel erbij hebben dan moeten ze niet alleen kunnen praten, maar ze moeten ook kunnen begrijpen en sociaal kunnen zijn. Als jij gewoon chagrijnig bent dan wil je niet zo’n vrolijke eikel van een robot naast je hebben, dus hij moet aanvoelen hoe jij bent. Hij moet de manier waarop je praat kunnen interpreteren, kunnen aanvoelen. Social signal processing is dat. Waarom zie ik dat jij vrolijk bent? Dat is waanzinnig complex. En vaak cultureel afhankelijk. Dat maakt het ook lastig.”

“Data en computing power zorgen voor een stap voorwaarts ”Tweet This

De afgelopen jaren heeft taal- en spraaktechnologie een enorme ontwikkeling doorgemaakt. “In de laatste 5, 6 jaar is er een enorme boost geweest in deze technologie en dat komt door het zogeheten deep learning. Jij ziet iemand lopen, die herken je. Waarom? Geen idee, het is iets in de manier van lopen. Beschrijf dat eens? Dat kun je niet. Dat is wat neurale netwerken ook doen. Wanneer je heel veel voorbeelden geeft leert de computer: wat zijn de parameters, hoe moet ik hem instellen om het kopje van het glas te onderscheiden. Die technologie wordt gebruikt voor gezichtsherkenning, beeld herkenning in het algemeen, spraak herkenning en emotie herkenning. En omdat we en heel veel computing power en heel veel data hebben zorgt dat voor stappen voorwaarts de laatste 5 jaar”

Gingen computers vroeger bij 1 op de 7 woorden de mist in qua herkenning, op dit moment is het 1 op de 12 woorden. “Dat is misschien nog wel te hoog, maar mensen zijn ook niet perfect. En waar mensen heel goed in zijn is een aha erlebnis: je hoort iets en je verstaat het eigenlijk niet goed maar vanwege de context kun je dat invullen.” Mensen spreken woorden vaak alles behalve netjes uit, maar door een context weten anderen vrijwel altijd wat je bedoelt. “Dus mensen horen wat ze verwachten te horen en meestal klopt dat en daarom zijn wij er zo goed in  en dat moeten we de computer nog leren.” Een belangrijk proces dat zorgt voor brede inzetbaarheid van computers in diverse telefonische dienstverlening. Door computers goed te tunen zijn ze uitstekend in staat om een eerste afvang te doen, waarna mensen het werk kunnen overnemen. “Dat is wat je overal ziet: het is een hybride systeem. Saaie, makkelijke dingen gaat de computer doen en mensen gaan echt doen waar mensen goed in zijn: emotie en al dat soort zaken.”

“Google wil alle informatie van de wereld ontsluiten ”Tweet This

Grote bedrijven als Facebook, Amazon en Google zetten fors in op de nieuwe mogelijkheden. “Google zegt wij willen alle informatie van de wereld ontsluiten. Een belangrijk deel van die informatie zit tegenwoordig in video, maar video is eigenlijk nog heel slecht doorzoekbaar voor een gebruiker.” Dat wordt anders wanneer het gesproken woord geautomatiseerd omgezet kan worden in tekst. Tekst is doorzoekbaar en kun je ordenen op trefwoorden. “Die bedrijven zetten dus massaal in op die technologie. Ik zag een interessante keynote van Microsoft. Die willen op je telefoon naar een situatie waarin one rules them all : één applicatie die straks al de andere apps gaat sturen. Waarom heb ik een app nodig voor de trein en het vliegtuig en het weer en hotels? Ik kan straks gewoon tegen dat ding praten en dan zorgen zij voor die onderlinge communicatie“

Of in de toekomst werkelijk alles doorzoekbaar zal worden en  iedereen overal herkenbaar zal zijn, moeten we afwachten. Dat veiligheidsdiensten graag meer grip krijgen op wat burgers zeggen en doen staat vast. Misschien is dit dan ook een goed moment om na te denken over privacy en het beschermen daarvan. De ontwikkelingen staan in ieder geval niet stil. “Ik gok dat we nog een jaar of vijf in de versnelling zitten, omdat er nog heel veel data beschikbaar zijn waar mee getraind kan worden. Daar zul je nog enorm vaak winst door zien. In het begrijpen wat wordt er bedoeld? Waar gaat het over?  Wat zegt ze nou precies? Want als iemand zegt ‘ik wil het nu niet over terrorisme hebben’ dan pikt de computer op dit moment als onderwerp terrorisme op, maar daar gaat het juist niet over. Er zit een ontkenning in. Dat is nog een stap die gemaakt kan worden en zal worden.”

(Een verslag van @daalder)

De afleveringen van Top Names zijn via Soundcloud en iTunes als podcast beschikbaar dankzij sponsoring van  Merchandise.

  • Bots

Leonieke Daalder

Leonieke Daalder is politicoloog en journalist. Ze werkte voor onder meer Radio Noord Holland en de VPRO. Bij de laatste omroep was ze verantwoordelijk voor crossmediaal project 3VOOR12 dat onder haar leiding onder meer de Prix Europa, Gouden Pixel, Pop Pers Prijs en UPC Digital Award won. Ze is een van de oprichters van Fast Moving Targets. Ze schrijft, interviewt, onderzoekt, filmt, presenteert en is in te huren voor (publieke) interviews, presentaties en workshops op het gebied van (social) media. Dit e-mailadres wordt beveiligd tegen spambots. JavaScript dient ingeschakeld te zijn om het te bekijken.
  • Volg Leonieke op:
  • Twitter
  • Linkedin
  • Website

TV-programma IDTV - BNN/VARA

In het voorjaar van 2019 werden onderzoekers van de UTwente gevraagd mee te werken een een programma van IDTV voor BNN/VARA.

De producer formuleerde het zo:

"Wij gaan voor BNN/VARA vier afleveringen maken van het BBC-format Big Life Fix. Iedere aflevering helpen we 2 mensen die door een ongeluk of handicap iets niet meer kunnen wat ze wel graag zouden willen. Een team uitvinders/wetenschappers gaat voor 1 individu iets bedenken (open source), een live changing uitvinding voor de persoon in kwestie. Hier hebben we max 8 maanden de tijd voor. We proberen in september/oktober te starten.

UT Twente wil hieraan meewerken door een aantal wetenschappers qua uren beschikbaar te stellen.  

Per aflevering zijn er twee ‘caseholders’, wetenschappers die de leiding hebben over het uitvindtraject van een van de deelnemers. Zij mogen weer andere mensen binnen en buiten de UT inschakelen voor hulp zodat er een groep aan een vinding werkt. De caseholder werkt mee aan de vinding en is degene die op tv het woord doet en dus ook het gezicht is voor de kijker en degene voor wie iets wordt gemaakt.

De jongen waar het voor jullie (Khiet Truong en Arjan van Hessen) om gaat, is de 14-jarige Joël. Joël heeft door zuurstoftekort ernstige cerebraal parese opgelopen. Sinds zijn 2e zit hij in een elektrische rolstoel. Doordat hij moeite heeft met de aansturing van zijn spieren is hij ook heel slecht te verstaan. Veel mensen denken daarom dat hij achterlijk is en zullen om die reden niet de moeite nemen om naar zijn mening te vragen of überhaupt naar hem luisteren. Joël is een intelligente jongen met humor en enorm veel positiviteit.
De enigen die hem verstaan, en dus kunnen vertalen wat Joël zegt, zijn zijn oudere en zijn begeleiders. Zijn begeleiders hebben er 2 weken over gedaan om zijn taal te leren.
Joël wil heel graag een computer die zijn spraak kan vertalen naar ABN zodat hij kan communiceren met de wereld om hem heen. 

Wij zijn bij Joël geweest en hij heeft ons hart gestolen.

Ik hoop dan ook van harte dat jullie of een van jullie wil meedoen om hem te helpen.

Joel geeft ook lezingen over zijn leven: https://lezingshithappens.nl/

Op dit moment ligt de boel stil. BNN/VARA heeft filmpjes van de kandidaten van ons gekregen en aan de hand daarvan een go gegeven voor een aantal cases. Maar ze willen nu ook graag de eventueel deelnemende wetenschappers op beeld zien voordat ze het programma-voorstel naar de NPO sturen. Die laatste partij beslist uiteindelijk of het programma gemaakt mag worden."

Om te zien of wij (=onderzoekers) geschikt zijn voor de TV, moeten we een filmpje opnemen.

Dat filmpje staat hieronder.

 

Het video element wordt niet ondersteund door uw browser.