De paradox van Simpson.

De Franse wiskundige B.Pascal legde omstreeks 1650 samen met Pierre de Fermat de grondslagen voor de kansrekening. Het berekenen van winstkansen is echter niet zo eenvoudig en je komt bij de toepassingen verschillende schijnbare tegenstellingen tegen.

Deze paradox is genoemd naar de statisticus E.H.Simpson en werd in 1951 voor het eerst gepubliceerd. Laten we die paradox  bespreken aan de hand van een voorbeeld.

In bovenstaande tabel staan de slaagcijfers van jongens en meisjes voor 3 studierichtingen: medische, humane en exacte wetenschappen. Uit deze tabel blijkt dat in de 3 verschillende richtingen de slaagpercentages van de meisjes net iets hoger liggen dan bij de jongens. Paradoxaal genoeg blijken de jongens in het totaal toch beter te presteren dan de meisjes: 51% tegen 46%.

De verklaring is dat meisjes zich meestal inschreven voor studierichtingen waar de slaagkansen kleiner waren. Dit is Simpsons paradox: als je gegevens van twee groepen op een onhandige manier combineert, dan lijken de resultaten van de groepen om te draaien.