Wat een AI-hackathon ons leerde over synthetic users

Een hoofd vol vragen: kunnen synthetic users research helpen?

UX-research is altijd een evenwichtsspel geweest. Aan de ene kant: tijd, budget en agenda's van klanten. Aan de andere kant: de honger van een productteam dat snel wil leren. Sinds de explosie van large language models hangt er een verleidelijke vraag in de lucht: kunnen we een deel van dat onderzoek simuleren? Niet om echte gebruikers te vervangen, maar om sneller te leren tussen sessies door?

Met ons UX-team bij Centraal Beheer wilden we niet wachten tot iemand anders het antwoord zou geven. Dus we boekten een dag, kochten croissants in, en organiseerden onze eigen AI-hackathon over synthetic users.

De opzet van de dag

We splitsten het team op in groepjes en gaven iedereen dezelfde uitdaging, maar met andere gereedschappen. De ene groep ging aan de slag met ChatGPT, een andere met Claude, en een derde groep verkende minder bekende AI-tools. Het doel was simpel maar concreet:

Bouw een Centraal Beheer-persona vanuit de tool
Voer een interview met die persona over een actueel klantvraagstuk
Laat een ontwerp zien en vraag om feedback
Confronteer de persona met edge cases en spannende dilemma's

Zelfde input, zelfde scenario, andere AI. Aan het einde van de dag zouden we de outputs naast elkaar leggen en kijken: wie levert iets dat we écht kunnen gebruiken in research?

Verschillende perspectieven op een vraagstuk, net als verschillende AI-tools

Verschillende AI's, verschillende stemmen, verschillende uitkomsten: daar ging het ons om.

Wat we tegenkwamen

1. Standaard AI-tools zijn (nog) onbetrouwbaar

Het eerste wat opviel: bij ChatGPT en de meeste andere out-of-the-box tools kreeg je bij elke nieuwe chat een ander persona. Stelden we exact dezelfde openingsvraag, dan kwam de "klant" in de ene sessie als zorgzame moeder uit West-Brabant en in de andere als chagrijnige zelfstandige uit Groningen. Dat is grappig in een spelletje, maar funest voor onderzoek waarin reproduceerbaarheid telt.

Voor research is consistentie geen luxe, maar een fundamenteel principe. Als je conclusies trekt op basis van een interview, moet datzelfde interview de volgende dag tot vergelijkbare conclusies leiden. De meeste tools faalden hier hard.

Een persona die elke sessie verschuift is geen onderzoeksmiddel, maar een willekeurige tekstgenerator met een hoedje op.

Goede research vraagt herhaalbaarheid: dat moeten AI-tools óók kunnen leveren.

2. Voorgedefinieerde kaders maken het verschil

De doorbraak kwam toen we stopten met "los" prompten en begonnen met het bouwen van een voorgedefinieerde AI-agent. Een agent met een vast karakter, vaste achtergrond, vaste denkrichtlijnen, en een duidelijke missie. Geen instructies meer per chat, maar een persona die blijft wie hij is, sessie na sessie, gesprek na gesprek.

Het verschil met losse prompts was kolossaal. Plotseling kregen we antwoorden die op elkaar rijmden. Tegenstrijdigheden waren echte tegenstrijdigheden in het karakter (zoals een echte mens er heeft), niet kleine verschillen door een willekeurige opstart.

3. AI bouwt betere persona's dan wij vaak doen

Eerlijk: dit was een ongemakkelijke ontdekking. Wanneer je een AI vraagt een Centraal Beheer-persona te bouwen, scant hij het hele internet. Reviews op KlantenVertellen. Discussies op Tweakers. Berichten op LinkedIn. Forumposts over verzekeringen. En distilleert daar een persona uit die kloppender is dan veel persona's die we zelf in workshops hebben opgesteld.

Niet omdat het slimmer is dan ons. Maar omdat het meer signaal kan verwerken dan wij in een paar middagen kunnen doen. De rauwe data is groot, we hadden hem alleen nooit zo systematisch gebruikt.

4. De truc zit hem in echte synthetic users, geen scripted bots

De meeste AI-modellen zijn van nature aardig. Ze willen je helpen. Ze geven je het antwoord dat ze denken dat je wilt horen. Voor research is dat een nachtmerrie. Een echte gebruiker zegt: "ik snap het niet". Een AI zegt: "interessante vraag, hieronder vind je een uitgebreide analyse".

Om dit te ontwijken moet je via een API-gateway naar een synthetic user die meerdere perspectieven combineert en niet "behulpzaam" wil zijn, maar realistisch. Een gebruiker die mag verveeld raken, mag onlogisch reageren, mag het antwoord vergeten, net als de echte mens.

5. Visueel werk gaat verrassend goed, live websites nog niet

We waren benieuwd: als je een ontwerp toont (een mockup, een screenshot, een wireframe) kan een synthetic user dat dan bekijken en feedback geven? Het antwoord is: verrassend goed. Toonaangevende modellen herkennen niet alleen wat er staat, maar reageren ook op wat ontbreekt, op visuele hiërarchie, op tone-of-voice in microcopy.

Live websites bezoeken en analyseren is nog een ander verhaal. Daar zijn we nog volop aan het experimenteren. De technologie kan het, maar de output is nog wisselend van kwaliteit.

6. Onze eigen Claude-chat: een kleine doorbraak

Aan het eind van de dag hadden we met Claude een werkende chat waarin je een gesprek voert met een Centraal Beheer-persona. We hebben dezelfde vraag op verschillende dagen opnieuw gesteld en kregen consistente, herkenbare antwoorden. We hebben edge cases bedacht, zoals verhuizen tijdens een schadeclaim of twijfelen over een opzegging na vijftien jaar, en kregen reacties die voelden als die van een echte klant. Niet perfect, maar wel bruikbaar.

Voor het eerst had iemand in het team de zin: "hier kunnen we tussen sessies door iets mee doen". Dat is niet niets.

Wat dit voor research betekent

Synthetic users zullen echte klanten niet vervangen. Dat moet ook niet. Een synthetic user kan geen pijn voelen tijdens een schadeproces. Kan niet vertellen hoe het is om je vader te verliezen en zijn polis te moeten beëindigen. Kan niet de boze opmerking maken die we nooit hadden verwacht.

Maar synthetic users kunnen wel een nieuwe rol vervullen: de scout vooraf. De partij die je gebruikt om je interviewgids aan te scherpen. Om je hypotheses te valideren voordat je echte klanten benadert. Om in een sprint snel een mening te krijgen die niet uit je eigen team komt.

De hoofdconclusie

Veel AI-tools zijn nog niet slim genoeg om als synthetic user te dienen. Ze produceren tekst, geen perspectief. Ze hebben geen geheugen, geen consistent karakter, geen weerstand. Maar er zijn uitzonderingen. Claude kwam er in onze hackathon duidelijk uit als de meest bruikbare partner: door betere consistentie, diepere reacties en een vermogen om in karakter te blijven.

Een workshop in volle gang: mensen die samen leren werken met nieuwe tools

De échte winst van deze hackathon zat niet in de tools, maar in een dag samen leren als team.

Voor ons betekent dat dat we nu een richting hebben. We gaan Claude verder optimaliseren tot een tool waar je als designer of researcher mee kunt sparren, niet als vervanger van de klant, maar als versneller van het proces. Een synthetic user die ons helpt om sneller, slimmer en uiteindelijk waardevoller te onderzoeken.

Wordt vervolgd. Letterlijk.

Werk je zelf met synthetic users of overweeg je het? Ik ben heel benieuwd naar je ervaringen, stuur een berichtje en dan vergelijken we notities.

Bekijk meer artikelen

Wat eenAI-hackathon onsleerde.