Al een paar jaar leeft de wens bij veel overheidsorganisaties om hun gesproken content makkelijker en sneller om te kunnen zetten in tekst om die (gesproken) documenten beter doorzoekbaar te maken. Een voordehand liggende manier is natuurlijk middels spraakherkenning, maar die is zeker nog niet foutloos (en zal dat waarschijnlijk ook nooit worden).

Recent hebben we bij Telecats een tweetal opnamen van een debat tussen Haarsma Buma en Roemer door de herkenner gehaald om te zien hoe goed de herkenning van plenaire vergaderingen in de grote zaal van de Tweede Kamer zijn.En dat valt niet tegen.

Natuurlijk, het is mooie en duidelijke spraak, er wordt niet door elkaar gesproken en men spreekt met als doel dat anderen je goed verstaan. Maar toch...... De DVR van de Kamer gaat kijken of dit goed genoeg is om de transcriptie en uiteindelijk het maken van de Handelingen te vergemakkelijken. Mij lijkt van wel maar dat is nog even afwachten.

Een aandachtspunt is echter het verschil van spreek en schrijftaal. Ook al gaan we straks bijna 100% correct herkennen dan nog is het de vraag of een letterlijke transcriptie van hetgeen er gezegd werd wel zo prettig is om later nog eens na te lezen. Er zou dus een "vertaling" van spreek→schrijftaal moeten komen. Dat is iets dat nog niet kan, maar.......

Hieronder een voorbeeld van 2x 10 minuten debat met een kleine overlap tussen deel 1 en deel 2. Onder de herkende tekst staan de knoppen voor de player. De herekende woorden worden gehighlight tijdens het spelen (met dank aan Jan Willem Mulder).


{tab=Sybrand van Haersma Buma - Emile Roemer 1}

{tab=Sybrand van Haersma Buma - Emile Roemer 2}

 

  • Laatste aanpassing website: vrijdag 25 oktober 2024, 12:51:10.
  • Copyright @2023 Arjan van Hessen