De robotredacteur: hoe kunstmatige intelligentie de redactievloer verandert

De robotredacteur: hoe kunstmatige intelligentie de redactievloer verandert

Dit artikel is oorspronkelijk verschenen in Villamedia op 16 april 2021.

De komst van slimme computersystemen en vernuftige algoritmes doet langzaam maar zeker zijn intrede in de journalistiek. Hoe kunstmatige intelligentie vandaag de dag wordt toegepast om jou als redacteur te ondersteunen en waar de beperkingen liggen. 

“Ik denk dat de journalistiek veel gaat veranderen. AI kan journalisten helpen hun werk beter te doen. Het zal in staat zijn om saaie werkzaamheden, zoals data-anlyse, uit te voeren. In de toekomst zullen journalisten zich kunnen concentreren op de meer creatieve delen van hun baan.” Dat is het antwoord op de vraag: ‘Hoe gaat kunstmatige intelligentie de journalistiek veranderen?’. Alleen komt het antwoord niet van een menselijke expert, maar van taalgenerator GPT-3. Het systeem van de Amerikaanse organisatie Open AI is getraind op miljarden webpagina’s en kan daardoor het menselijk schrijven moeiteloos imiteren. Het geeft antwoord op vragen, kan artikelen samenvatten, interviewvragen bedenken en hele artikelen genereren. GPT-3 kreeg veel aandacht toen de Britse krant The Guardian een opiniestuk publiceerde dat was gegenereerd met deze technologie. In zeventien alinea’s legt het algoritme knap uit waarom mensen de komst van kunstmatige intelligentie niet moeten vrezen. Het stuk kwam de krant ook op kritiek te staan: GPT-3 had acht varianten van het artikel gegenereerd, waar de journalisten de beste onderdelen uit hebben geput. 

Omdat GPT-3 nog niet vrij beschikbaar is, had de krant hulp nodig van een techneut met goede connecties. Liam Porr is student aan de Berkley universiteit in Californië en is al langer actief in de wereld van machine learning. Hij genereerde middels GPT-3 een aantal populaire blogposts, wat hem aandacht opleverde van grote technologiesites als The Verge. Hij werd vervolgens benaderd door The Guardian of hij ze zou kunnen helpen met het opiniestuk. “Dat project is behoorlijk ontploft,” lacht Liam vanuit zijn studentenkamer. De telefoon stond roodgloeiend. Ook vanuit OpenAI die wilde weten hoe Liam toegang had gekregen tot het algoritme. Liam vertelt dat het kinderlijk eenvoudig was om het stuk te genereren. “We hebben het een paar keer gebeld over de instructies die we moesten meegeven, anders weet GPT-3 niet waar het over moet schrijven. Verder was het een kwestie van een paar regels code en een beetje stoeien met de instellingen.” 

Porr zet gelijk een kanttekening bij de mogelijkheden. “Het taalalgoritme heeft geen begrip van wat het schrijft. Het gokt als het ware het volgende woord in een zin. Dat ziet er op het eerste oogpunt leuk uit, maar qua feiten zie je al snel de beperkingen. De argumentatie is niet logisch en quotes worden toegedicht aan verkeerde personen. Het is de geschreven doorvertaling van 2 + 2 = 5.” Ook hoogleraar Emiel Krahmer die zich vanuit de Tilburg Universiteit specialiseert in computer linguïstiek waarschuwt voor de beperkingen: “De tekst die uit GPT-3 komt, heeft geen enkele link met de werkelijkheid en daarmee ongeschikt voor journalistieke doeleinde”. Het artikel in The Guardian noemt hij dan ook teleurstellend: “De titel is bedacht door een mens, het plot is bedacht door een mens en de inhoud is gekozen door een mens. Het is niets meer dan een woordenbrij en wij vinden dat fascinerend.” 

Voor de journalistiek ziet Krahmer meer heil in de stapsgewijze opkomst van het doorvertalen van feitelijke data naar een geschreven artikel: “Dat kan gaan over weersvoorspellingen, beurskoersen of voetbaluitslagen. Je neemt dan een aantal gegeven feiten als uitgangspunt en kleed dat aan met leesbare taal. Het is voor een redactie ondoenlijk om van elke voetbalwedstrijd op zaterdagmiddag een artikel te schrijven, terwijl lokale fans daar dolblij mee zouden zijn. Geautomatiseerde berichtgeving is dan een uitkomst: die pakt een aantal datapunten en schrijft daaromheen een leesbaar artikel. Het volume van het aantal artikelen zal daarmee enorm omhoog gaan, want je genereert artikelen over gebeurtenissen op wijkniveau in een handomdraai.”

ADAM

Een van de redacties die hier volop mee experimenteert is RTL Nieuws. Robotredacteur ADAM (Automatische Data Artikel Machine) draait alweer twee jaar mee en werd zelfs genomineerd voor een journalistieke tegel. “ADAM vertaalt grote datasets door naar artikelen op lokaal niveau,” vertelt datajournalist Jasper Bunskoek. Bunskoek gebruikte het systeem onder meer om de verkeersveiligheid voor elke gemeente inzichtelijk te maken, artikelen te maken over de prestaties van scholen en recentelijk voor lokale verkiezingsuitslagen: “Onze redactierobot schrijft zodra een uitslag bekend is, binnen 1 minuut een artikel op maat voor elke gemeente. Met grafieken, kaarten en duiding.”

ADAM gaat verder dan een simpel artikel-template waar lokale data in wordt geplakt. “Alleen al voor het genereren van een goede, pakkende, maar ook kloppende kop, kan het rekening houden met diverse variabelen. Zo kan het voor gemeente A uniek zijn dat een bepaalde partij een grote overwinning boekt, terwijl het voor gemeente B belangrijk is dat de opkomst dat jaar abnormaal hoog is. Als redactie geven wij die scenario’s mee en op basis van de lokale situatie kiest ADAM de juiste kop.” 

Bij de introductie was niet iedereen even enthousiast. Sommige waren bang voor de gevolgen voor hun baan, anderen vonden dat een robot nooit het werk van een journalist kon overnemen, anderen dachten dat het de lokale journalistiek nog verder zou afkalven. “In de praktijk blijkt het niemand te vervangen en lokale journalistiek vooral een duwtje in de rug te geven,” zo beschrijft Bunskoek. “Lokale journalisten hebben vaak geen tijd om te grasduinen een gigantische dataset over het aantal verkeersongelukken in Nederland. Wij maken die data toegankelijk, waarna een lokale journalist naar de wethouder kan gaan met vragen over de verkeersveiligheid. Als je kijkt naar het aantal vragen in gemeenteraden die zijn gesteld na aanleiding van de berichtgeving van ADAM, ben ik daar best trots op.” 

Om het systeem te maken werkte Bunskoek nauw samen met de IT-afdeling van RTL. Inmiddels kunnen hij en zijn collega’s zelfstandig datasets inladen en de context van artikelen schrijven. “Daarvoor moeten wij wel wat verstand hebben van programmeertaal Python, maar je hoeft geen raketgeleerde te zijn. Het vergt wel wat werk, want artikelen over verkiezingsuitslagen zijn heel anders qua opzet dan informatie over criminaliteit. Voor ons is de kunst dat de artikelen qua inhoud moeten passen in de RTL Nieuws-stijl. Het moet net zo lekker lopen als een normaal artikel. Het moet niet voelen alsof het door een robot is geschreven, al zetten we het er wel altijd bij in de disclaimer. “

Moderatiebot

Op de reactie bij Nu.nl hebben ze inmiddels anderhalf jaar geleden moderatierobot Maura (‘Machine voor automatisch reacties afhandelen’) geïntroduceerd. “Zonder Maura had Nujij niet kunnen bestaan”, zo blikt adjunct-hoofdredacteur Colin van Hoek terug. Het aantal reacties op het platform steeg – mede door de coronacrisis – van circa 150.000 tot bijna 600.000 per maand. “Maura is steeds beter geworden in het bepalen of een reactie geschikt is voor Nu.nl of dat het wordt afgewezen. Het kan nu in 80% van de gevallen het correct voorspellen, de overige 20% wordt nog steeds handmatig nagekeken. Die laatste 20 procent is heel moeilijk te automatiseren. De moderatiebot werkt onder meer met een zwarte lijst van woorden die per definitie worden afgekeurd, maar heeft ook een grijze lijst waarbij het gaat om de context. Heeft iemand het over kanker, dan kan dat gaan om een scheldwoord, maar ook om de ziekte. Tegelijkertijd kan de bot moeilijk omgaan met sarcasme. Een keer zei een zangeres een concert af, met een heleboel flauwe grapjes tot gevolg. Geen ramp, maar niet iets wat we doorgaans toestaan. We kunnen per artikel daarom aangeven waar Maura niet wordt gebruikt en waarbij we handmatig de reacties screenen.” 

Ook in het geval van Maura heeft de technologie niet gezorgd voor minder werk voor journalisten, maar vooral dat het werk meer betekenis heeft gekregen. “We hadden voorheen dagelijks vier diensten met mensen die reacties moesten goed- of afkeuren. Dat is behoorlijk saai werk. Nu kan die tijd worden ingezet om in gesprek te gaan met onze lezers. Of voor live Q&A’s met bijvoorbeeld Jaap van Dissel over het vaccinatiebeleid. Nujij is een heel waardevol onderdeel van ons merk. Niet alleen weten we als redactie beter wat er speelt en krijgen we dikwijls artikel-ideeën uit de reacties die mensen plaatsen. Je ziet ook dat lezers die reageren vaker terugkomen en langer op het platform blijven.” 

Voor de redactierobot werd gekeken of de techniek intern ontwikkeld zou worden, maar uiteindelijk werd gekozen voor een bestaande software-oplossing genaamd Utopia dat zich specialiseert in contentmoderatie. “Onze IT-afdeling heeft al weinig tijd en de redactie had behoefte aan een oplossing op korte termijn. Het bleek een goede keuze om voortvarend van start te gaan.” 

Aanbevelingsalgoritme

Nu.nl is sinds vorig jaar onderdeel van uitgeefconcern DPG Media waar ze een aparte afdeling hebben die de merken middels kunstmatige intelligentie moet ondersteunen. Anne Schuth is Machine Learning Architect die zich specialiseert in personalisatie middels aanbevelingssystemen. Schuth verdiende zijn strepen bij Blendle en Google alvorens hij zich stortte op dagbladen als Volkskrant, AD, Trouw en het Parool. Het is logisch dat uitgevers investeren in personalisatie, stelt Schuth, omdat de concurrentie vanuit big tech niet stil zitten: “Je strijdt uiteindelijk om de aandacht van je gebruiker en daarom wil je zo relevant mogelijk zijn.” 

Bij het doel om de gebruiker artikelen te tonen die voor hem of haar interessant zijn, houdt het team van Schuth de journalistieke waarde altijd als belangrijkste uitgangspunt: “Dat betekent dat we de gebruiker goed moeten informeren, ook als dat in strijd is met de relevantie. Iemand kan geen fan zijn van Donald Trump en het liefst niets over hem willen lezen, maar als een artikel volgens de redactie van belangrijk is voor de algemene kennis, moet deze toch bovenaan staan in het nieuwsoverzicht. De redactie moet ten alle tijd invloed hebben op het algoritme. Echter: wanneer iemand zich totaal niet interesseert voor sport, mag de uitslag van een willekeurige wedstrijd best worden weggefilterd. Belangrijk is dat je een filterbubbel voorkomt. Daar heeft niemand baat bij.” 

Hoewel er ook aanbevelingsalgoritmes te koop zijn, zou Schuth kleinere merken afraden deze zonder diepgaand onderzoek te implementeren: “Als je niet weet hoe het algoritme tot aanbevelingen komt en je als redactie geen invloed hebt op de nieuwskeuze, geef je als het ware je journalistieke keuzes uit handen. Dat moet je voorkomen.” In de ontwikkeling van de technologie spreekt het team van Schuth geregeld met de verschillende redacties binnen het uitgeefconcern. “We vallen onder oud-Volkskrant-hoofdredacteur Philippe Remarque. We zijn dus niet een stel IT’ers die stilletjes iets aan het bouwen zijn op een kamertje achteraf. ”  

Audio

Dan is er nog de komst van audio. Naast podcasts en Clubhouse is ook het ingesproken artikel gemeengoed geworden bij online long reads. Met spraakassistenten en slimme speakers in menig huiskamer, zou je zeggen dat deze tak van sport eenvoudig door text-to-speech-algoritmes te automatiseren is. De praktijk blijkt weerbarstiger, weet ook Jan-Willem Sanders, uitgever bij Follow The Money. Het onderzoeksplatform laat geregeld artikelen inspreken, maar de ideale robotstem heeft hij nog niet gevonden: “Ik heb er twee jaar geleden naar gekeken, maar ik vond toen de kwaliteit nog zo slecht dat het geen optie voor ons was. We hebben ook gekeken naar professionele stemmen, maar die struikelen dikwijls over jargon en namen in onze artikelen. Vandaar dat wij kiezen om de auteur het te laten doen. Het publiek accepteert dat een auteur niet een geboren voorlezer is. Ik verwacht dus ook niet dat wij snel op een geautomatiseerde oplossing over zullen stappen.” 

Ook stem-expert Jente Kater van Voicebooking.com weet hoe lastig het is om een computer het vermogen van de menselijke stem te laten evenaren. Zijn bedrijf ontwikkelde een gratis voice-over generator die gratis te gebruiken is voor producties met een klein budget. Toch zou hij het niet gebruiken voor journalistieke verhalen: “Het eerste dat je moet beseffen is dat schrijftaal heel anders is dan spreektaal. Als je een artikel dus letterlijk woord voor woord zou voorlezen, is het zelfs met de beste stem lastig om je publiek lang te blijven boeien, omdat sommige geschreven zinsconstructies – uitgesproken veel concentratie vragen om de logica te begrijpen. Daarnaast missen computerstemmen begrip van de inhoud en weten daarom niet waar de nadruk of nuance moet liggen. De techniek zit misschien al op 80 procent van wat daarvoor nodig is, maar om die laatste 20 procent te behalen dat het in alle situaties gebruikt kan worden, gaat misschien wel tien of twintig jaar duren.”

China

Veel techneuten kijken als het gaat over innovaties op het vlak van kunstmatige intelligentie met een schuin oog naar China. Niet alleen stelt het land jaarlijks vele miljarden beschikbaar voor onderzoek, ook bulkt het van data, de grondstof voor algoritme. De staatsomroep pronkte met het nieuws dat ze een van hun menselijke presentatoren hadden gedigitaliseerd – vanaf dat moment zou ook een virtuele avatar met de gelijkenis van de presentator het nieuws kunnen brengen. Is China echt zo’n voorloper als het aankomt op journalistieke AI-innovaties? Volgens NOS-correspondent Sjoerd den Daas die ruim vijf jaar woont en werkt vanuit Beijing valt het in de praktijk mee: “China is een heel duaal land als het aankomt op vernieuwing. Aan de ene hand heb je hier technologische wereldspelers, aan de andere hand moeten interviewverzoeken gefaxt worden naar de overheid en ziet het staatsjournaal eruit alsof het een uitzending uit de jaren 70 is. De grootste vernieuwing was dat ze een aantal jaar geleden overgestapt naar het uitzenden in breedbeeld-formaat. Virtuele nieuwslezers heb ik nog niet kunnen ontdekken. Op journalistiek vlak is Toutiao in de praktijk het meest succesvol: dit is een nieuwsaggregator dat is ontwikkeld door Bytedance, het bedrijf achter het sociale medium TikTok. Met machine learning zorgen ze ervoor dat de artikelen in je tijdlijn je blijven boeien – al zorgen ze er ook voor dat bepaalde berichten, bijvoorbeeld over de staatspartij altijd bovenaan staan. Er wordt geschat dat de app meer dan 250 miljoen actieve gebruikers heeft en is dus een van de belangrijkste platformen geworden voor de Chinese nieuwsconsument.” 

Freelance-ondersteuning

Machine learning en kunstmatige intelligentie kan ook de individuele journalist helpen om beter en efficiënter te werken, zo stelt Laurens Vreekamp. Hoewel Vreekamp geen formele opleiding in de journalistiek heeft, werkte hij lange tijd voor KRO-NRCV en Google News Lab. Tegenwoordig is hij oprichter van platform Future Journalism Today en geeft hij bij de NVJ cursussen hoe journalisten gebruik kunnen maken van bestaande AI-tools en algoritmes kunnen schrijven om tot betere inzichten achter datasets te komen. “Het is belangrijk dat journalisten hiermee leren werken, ik ben een soort rij-instructeur die je op weg helpt. Gelukkig hoef je daarvoor geen wiskundige te zijn of afgestudeerd in de statistiek. Google heeft bijvoorbeeld een tool genaamd pinpoint die in een handomdraai woorden, bedrijven of namen weet te vinden in miljoenen e-mails, pdf’s of zelfs handgeschreven brieven. Geweldig handig als je bijvoorbeeld bezig bent met een wob-verzoek. Microsoft heeft een product gemaakt Lobe.ai waarbij je zelf een systeem kunt trainen om objecten te herkennen op foto’s. Weer een ander systeem kan je leren om het sentiment in Twitter-berichten te herkennen. Zo kan je bijvoorbeeld achterhalen wat de opinie is over bepaalde politici. Ik verwacht dat het kunnen werken met dergelijke middelen binnen een paar jaar gemeengoed is op menig redactie. Niet iedereen hoef ermee te kunnen werken, maar misschien krijg je wel een rol ‘algorithmic editor’ of ‘ai journalist’ net zoals ‘data journalist’ inmiddels heel gebruikelijk is. De technologie gaat ons helpen bij betere berichtgeving.” 

Related Posts