Elke dag nemen mensen beslissingen waarvan de uitkomst niet alleen afhangt van wat zij zelf doen, maar ook van wat anderen kiezen. Denk aan prijsafspraken tussen bedrijven, samenwerking in de politiek, doping in de sport, milieumaatregelen tussen landen, of zelfs eenvoudige situaties in het dagelijks leven. Een van de bekendste modellen om zo’n situatie te begrijpen is het dilemma van de gevangenen.
Dit gedachte-experiment is een klassieker uit de speltheorie, een tak van de wiskunde die keuzes en strategieën bestudeert. Het is tegelijk eenvoudig én verrassend diepzinnig: twee mensen die allebei rationeel handelen, kunnen samen slechter af zijn dan wanneer ze hadden samengewerkt.
Het verhaal
Stel dat twee verdachten worden opgepakt voor een misdrijf. De politie heeft niet genoeg bewijs om hen zwaar te veroordelen, tenzij minstens één van beiden bekent. Daarom worden de twee gevangenen apart ondervraagd. Ze kunnen niet met elkaar praten.
Iedere gevangene heeft twee mogelijkheden:
- zwijgen en dus de ander niet verraden;
- bekennen en dus de ander verraden.
De politie doet ieder van hen hetzelfde voorstel:
- als beiden zwijgen, krijgen ze allebei een lichte straf;
- als één bekent en de ander zwijgt, dan gaat de verklikker vrijuit en krijgt de zwijger een zware straf;
- als beiden bekennen, krijgen ze allebei een middelzware straf.
Een mogelijke strafverdeling is deze:
- beiden zwijgen: elk 1 jaar
- beiden bekennen: elk 5 jaar
- jij bekent, de ander zwijgt: jij 0 jaar, de ander 10 jaar
- jij zwijgt, de ander bekent: jij 10 jaar, de ander 0 jaar
De kern van het probleem
Laten we ons verplaatsen in één van de twee gevangenen.
Hij redeneert als volgt:
- Als de ander zwijgt, dan is bekennen beter:
ik krijg dan 0 jaar in plaats van 1 jaar. - Als de ander bekent, dan is bekennen óók beter:
ik krijg dan 5 jaar in plaats van 10 jaar.
Dus wat de ander ook doet, bekennen lijkt de beste keuze.
Maar precies hetzelfde denkt de andere gevangene.
Daarom zullen beide gevangenen rationeel besluiten om te bekennen. Het resultaat is dan dat ze elk 5 jaar krijgen.
En toch zouden ze allebei beter af zijn geweest als ze allebei gezwegen hadden: dan kregen ze elk slechts 1 jaar.
Daar zit het echte dilemma:
individueel rationeel gedrag leidt tot een collectief slechter resultaat.
De uitbetalingstabel
In de speltheorie vat men zo’n situatie vaak samen in een tabel. In plaats van “jaren gevangenisstraf” gebruikt men meestal punten of opbrengsten, waarbij een groter getal beter is.
Een mogelijke tabel is:
| Gevangene B zwijgt | Gevangene B bekent | |
|---|---|---|
| Gevangene A zwijgt | (3, 3) | (0, 5) |
| Gevangene A bekent | (5, 0) | (1, 1) |
Hierbij betekent bijvoorbeeld (3,3) dat beide spelers een redelijke uitkomst krijgen, terwijl (1,1) slechter is voor allebei.
De volgorde van voorkeuren is dan:
- het beste: zelf bekennen terwijl de ander zwijgt;
- daarna: allebei zwijgen;
- daarna: allebei bekennen;
- het slechtste: zelf zwijgen terwijl de ander bekent.
Wat zegt de wiskunde?
Het dilemma van de gevangenen is een voorbeeld van een spel met een dominante strategie.
Een strategie heet dominant wanneer ze altijd beter is, ongeacht wat de ander doet. In dit spel is bekennen voor beide spelers dominant.
Daarom eindigt het spel in de situatie:
(bekennen, bekennen)
Die uitkomst noemt men een Nash-evenwicht: geen van beide spelers kan zijn situatie verbeteren door alleen zelf van keuze te veranderen, zolang de ander zijn keuze behoudt.
Dat klinkt stabiel, maar het is niet noodzakelijk de beste gezamenlijke uitkomst. En precies dat maakt het dilemma zo boeiend.
Waarom is dit belangrijk?
Het dilemma van de gevangenen is veel meer dan een abstract raadsel. Het model duikt op in talloze echte situaties.
Concurrentie tussen bedrijven
Twee bedrijven kunnen allebei hun prijs hoog houden, en dan maken ze allebei winst. Maar elk bedrijf heeft de verleiding om iets goedkoper te worden en zo klanten af te snoepen. Als beide bedrijven dat doen, dalen de prijzen voor iedereen en blijft er minder winst over.
Wapenwedloop
Twee landen zouden veiliger en goedkoper af zijn als ze allebei minder bewapenen. Maar elk land vreest dat de ander zich niet aan de afspraak houdt. Daarom bewapenen beide landen zich toch, met hoge kosten en meer wantrouwen als gevolg.
Klimaat en milieu
Landen zouden samen beter af zijn als ze allemaal hun uitstoot verminderen. Toch bestaat voor elk land de verleiding om zelf minder inspanning te leveren en te profiteren van de inspanningen van anderen. Het gevolg is dat er te weinig gebeurt.
Doping in de sport
Zonder doping zouden alle atleten op een eerlijker en gezonder niveau kunnen concurreren. Maar elke individuele sporter heeft de prikkel om toch doping te gebruiken, uit angst anders achterop te raken.
De paradox van rationeel gedrag
Wat dit probleem zo fascinerend maakt, is dat er geen domme keuzes gemaakt worden. Integendeel: beide spelers redeneren logisch.
En toch leidt die logica tot een slecht resultaat.
Dat laat zien dat rationaliteit op individueel niveau niet automatisch leidt tot rationaliteit op collectief niveau. Wiskundig gezien kan een systeem dus perfect consistent zijn, en toch ongewenste uitkomsten voortbrengen.
Wat verandert er als het spel herhaald wordt?
In het klassieke dilemma spelen de gevangenen maar één keer. Dan is bekennen de logische keuze.
Maar veel situaties in het echte leven keren terug. Mensen, bedrijven of landen ontmoeten elkaar opnieuw. Dan ontstaat een ander beeld.
In een herhaald dilemma van de gevangenen kan samenwerking wél zinvol worden. Waarom? Omdat je rekening houdt met toekomstige reacties.
Wie vandaag de ander verraadt, kan morgen het vertrouwen verliezen. Wie samenwerkt, kan op langere termijn beloond worden. Daardoor ontstaan strategieën zoals:
- vriendelijk beginnen;
- samenwerken zolang de ander samenwerkt;
- terugslaan wanneer de ander je verraadt.
Een beroemde strategie is tit for tat: begin met samenwerken, en doe daarna gewoon wat de ander in de vorige ronde deed. Deze eenvoudige aanpak bleek in veel experimenten opvallend sterk.
Een les voor het dagelijks leven
Het dilemma van de gevangenen leert ons iets fundamenteels over samenleven:
- vertrouwen is waardevol;
- samenwerking is kwetsbaar;
- eigenbelang kan samenwerking ondermijnen;
- goede regels en afspraken kunnen helpen om betere uitkomsten te bereiken.
Dat is meteen ook de reden waarom samenlevingen wetten, controles, reputatiesystemen en wederzijdse afspraken ontwikkelen. Zulke mechanismen verminderen de verleiding om enkel aan zichzelf te denken.
Besluit
Het dilemma van de gevangenen is een prachtig voorbeeld van hoe wiskunde een menselijk probleem zichtbaar maakt. Het toont dat de beste keuze voor één individu niet altijd leidt tot het beste resultaat voor iedereen samen.
Daarom is speltheorie niet alleen nuttig in de wiskunde, maar ook in economie, politiek, biologie en sociale wetenschappen. Het helpt ons begrijpen waarom samenwerking soms moeilijk is — en waarom ze toch zo belangrijk blijft.
Misschien is dat wel de mooiste les van dit beroemde dilemma:
samenwerking is niet vanzelfsprekend, maar zonder samenwerking wordt de wereld vaak slechter voor iedereen.





