De verjaardagsparadox

Hoe groot is de kans dat in een groep van n personen er minstens twee op dezelfde dag jarig zijn? Dit  probleem, in 1939 bedacht door de Oostenrijks wetenschapper en filosoof, Richard von Mises(1883-1953), is belangrijk omdat de oplossing de meeste mensen onwaarschijnlijk lijkt.

Als we uitgaan van 365 dagen in een jaar is de gevraagde kans gelijk aan

    \[1-\frac{365!}{(365-n)!365^n}\]

Een paar waarden:

    \[\begin{array}{c|c} n& kans \\ \hline 20&0,411\\23&0,507\\30&0,706\\40&0,891\\50&0,970 \end{array}\]

Voor een groep van 23 personen is de kans al 50%. Dat het aantal personen in de groep zo laag is, komt doordat we niet specifieke persoenen of een specifieke datum zochten. Van 23 personen zijn 253 verschillende paren voor te stellen, en maar 1 van die paren hoeft te voldoen!

De Poissonverdeling

In vele praktische voorbeelden hebben we te maken met een zeer groot aantal (n) onafhankelijke uitvoeringen van hetzelfde Bernoulli experiment, waarbij de succeskans (p) zeer klein is en waarbij het gemiddeld aantal successen ( np) ongeveer constant is. In dat geval kunnen de binomiale kansen vervangen worden door volgende functie:

We zeggen dat X een Poissonverdeling heeft met parameter \lambda. De naam is ontleend aan de Franse wiskundige Siméon Poisson(1781-1840).

Er bestaan tabellen voor de Poissonverdeling. Het gemiddelde is E(X)=\lambda.

Een voorbeeld: Op 1 december ga ik voor mijn verjaardag naar een concert en bevind ik me in een zaal met 1000 personen. Noem X het aantal personen in de zaal die op dezelfde dag jarig zijn. Dan is X Poisson verdeeld met n=1000 en p=\frac{1}{365} en dus \lambda= \frac{1000}{365}\approx 2,74

Dan is P(X=0)=0,06; P(X=1)=0,18; P(X=2)=0,24 ; P(X=3)=0,22; P(X=4)=0,15; P(X=5)=0,08

De negatieve binomiale verdeling

Bij herhaalde onafhankelijke uitvoeringen van eenzelfde Bernoulli experiment (met succeskans p), kunnen we ook vragen wanneer we juist r keer succes hebben verkregen. Noteer met X de stochast die het tijdstip weergeeft van de r-de succes.

  • X heeft als waarden r,r+1,r+2,…
  • P(X = k) is de kans dat het r-de succes bereikt wordt bij de k-de beurt. Dit is de kans op r - 1 successen bij de eerste k-1 uitvoeringen vermenigvuldigd met de kans op succes bij de k-de uitvoering. Dus

        \[P(X = k)=\binom{r-1}{k-1}p^{r-1}q^{k-r}.p=\binom{r-1}{k-1}p^rq^{k-r}\]

  • Deze verdeling heet de negatieve binomiale verdeling of Pascal verdeling, met parameters r en p.
  • Voor r=1 krijgen we uiteraard de geometrische verdeling met parameter p.
  • Het gemiddelde van deze verdeling is E(X)=\frac{r}{p}.
  • De berekening van kansen i.v.m. een negatieve binomiale verdeling kan gebeuren met de tabellen van de binomiale verdeling. Noteer met Y de stochast van de binomiale verdeling met parameters k en p, dan geldt

        \[P(X=k)=\frac{r}{k}P(Y=r)\]

De geometrische verdeling

Veronderstel dat we n onafhankelijke uitvoeringen doen van eenzelfde Bernoulli experiment met succeskans p. Bij de binomiaalverdeling stellen we ons de vraag hoeveel keer succes hebben we. Nu stellen we volgende vraag: na hoeveel uitvoeringen boeken we voor het eerst succes?  

Bijvoorbeeld: hoeveel keer moet de gokker roulette spelen om voor het eerst te winnen?

X is het tijdstip van het eerste succes. X is een stochast met waarden 1,2,…

    \[\text{P(X=k)}=q^{k-1}p\]

We zeggen dat X een geometrische verdeling heeft met parameter p. Het is inderdaad een kansverdeling want de som van alle kansen is 1.

Een voorbeeld van een geometrische verdeling met p=0,10:

Het gemiddelde van zo een geometrische verdeling is \frac{1}{p}. Een belangrijke eigenschap van de geometrische verdeling is het geheugenverlies: ze vergeet het verleden. Als we weten dat uitvoeringen 1 tot en met i mislukkingen waren, dan heeft de wachttijd vanaf die i-de mislukking tot het eerste succes, juist dezelfde verdeling als de wachttijd vanaf het begin. Met andere woorden de verdeling van die wachttijd tot het eerste succes hangt helemaal niet af van het aantal mislukkingen dat tot dan toe gebeurd is. In symbolen:

    \[P(X>i+j|X>i)=P(X>j)\]

Andere dobbelstenen

Iedereen kent deze klassieke dobbelsteen. Nemen we nu twee van dergelijke dobbelstenen en berekenen we de som van het aantal ogen: 

De vraag is nu: kunnen we geen ander stel van dobbelstenen vinden die dezelfde verdeling geeft?

  • We stellen onze gewone dobbelsteen voor door

        \[x^6+x^5+x^4+x^3+x^2+x\]

    Je leest deze veelterm als: er is 1 kant met 6stippen, 1 kant met 5 stippen,…
  • Wanneer je nu met 2 dobbelstenen gooit, voer je eigenlijk het product uit van die veelterm met zichzelf en krijg je dus (x^6+x^5+x^4+x^3+x^2+x)^2=x^{12}+2x^{11}+3x^{10}+...+x^2 Je leest in deze uitkomst dan volledig het bovenstaande schema.
  • Noem nu het gezochte stel andere dobbelstenen door f(x) en g(x).
  • We willen dat f(x).g(x)=x^{12}+2x^{11}+3x^{10}+...+x^2 .
  • De ontbonden vorm van de veelterm in het rechterlid is

        \[x^2(x+1)^2(x^2+x+1)^2(x^2-x+1)^2\]

  • Hieruit volgt dat we opzoek moeten naar een a,b,c en d  zodat

        \[f(x)=x^a(x+1)^b(x^2+x+1)^c(x^2-x+1)^d\]


    g(x)=x^{2-a}(x+1)^{2-b}(x^2+x+1)^{2-c}(x^2-x+1)^{2-d}
  • Omdat we zes zijvlakken hebben moet f(1)=6 , dus moet 2^b3^c=6 of b=c=1
  • Verder kan a zeker niet nul zijn want dan zou f(0) niet 0 zijn. En dus kan a ook niet 2 zijn. Bijgevolg is a=1.
  • Voor d=1 krijgen we de klassieke dobbelstenen.
  • Nemen we d=0, dan is f(x)=x(x+1)(x^2+x+1)=x^4+2x^3+2x^2+x. Dis geeft een dobbelsteen met op de zijvlakken 4/3/3/2/2/1
  • De andere dobbelsteen geeft dat g(x)=x(x+1)(x^2+x+1)(x^2-x+1)^2=x^8+x^6+x^5+x^4+x^3+x of een dobbelsteen met op de zijvlakken 8/6/5/4/3/1.
  • Hier zie je dat de verdeling inderdaad hetzelfde is tussen de 2 sets van dobbelstenen.