type 1 en type 2 fouten bij hypothese toetsen

Bij een hypothesetoets neem je op basis van een steekproef een beslissing over een uitspraak (de hypothese). Omdat steekproeven toevallig kunnen afwijken, kan je twee soorten fouten maken: type 1 en type 2. In de praktijk komen die overeen met vals positief en vals negatief.

De basis: H0 en H1

  • Nulhypothese H0: “er is geen effect / geen verschil / alles is normaal”.

  • Alternatieve hypothese : “er is wél een effect / wél een verschil / er is iets aan de hand”.

Een toets eindigt met één van deze beslissingen:

  • je verwerpt (je vindt genoeg bewijs tegen )

  • je verwerpt niet (je vindt onvoldoende bewijs tegen )

Type-1 fout betekent: Je verwerpt terwijl in werkelijkheid waar is. Dit heet ook een vals positief: je “detecteert” iets dat er niet is. is waar, maar jij zegt: “nee, klopt niet”.Klassieke slogan: “vals alarm”.

Type-2 fout betekent: Je verwerpt niet terwijl in werkelijkheid waar is. Dit heet ook een vals negatief: er is wél een effect, maar je mist het. is waar, maar jij zegt: “ik zie geen reden om te verwerpen”. Klassieke slogan: “gemiste detectie

Je kan nooit beide fouten ‘klein’ maken, want als de ene kleiner wordt, dan wordt de andere groter.

Voorbeeld A: medische test (screening)

  • : “de patiënt is niet ziek”

  • Type-1 fout (vals positief): test zegt “ziek”, maar patiënt is gezond
    → stress, extra onderzoeken, kosten

  • Type-2 fout (vals negatief): test zegt “gezond”, maar patiënt is ziek
    → gevaarlijk: behandeling komt te laat

Voorbeeld B: rechtbank

  • : “de verdachte is onschuldig”

  • Type-1 fout (vals positief): onschuldige wordt veroordeeld

  • Type-2 fout (vals negatief): schuldige wordt vrijgesproken

Voorbeeld C: kwaliteitscontrole in een fabriek

  • : “dit product voldoet aan de norm”

  • Type-1 fout (vals positief): een goed product wordt afgekeurd
    → verspilling, extra kosten

  • Type-2 fout (vals negatief): een slecht product wordt goedgekeurd
    → klachten, risico’s, soms veiligheidsproblemen

 


Welke fout wil je vooral vermijden?

Dat hangt af van de context:

  • Als een gemiste detectie gevaarlijk is (bv. ernstige ziekte), dan wil je vooral type-2 fouten (vals negatief)beperken.

  • Als een vals alarm heel schadelijk is (bv. iemand ten onrechte beschuldigen), dan wil je vooral type-1 fouten (vals positief) beperken 

 

 


 

De 2 enveloppenparadox

Er zijn twee enveloppen. In de ene zit een bedrag , in de andere . Je kiest willekeurig een envelop.Vervolgens krijg je de mogelijkheid om te wisselen naar de andere envelop. De vraag is: is het rationeel om te wisselen, of maakt het niet uit?

Stel je kiest een envelop en opent die. Er zit bedrag Y in. Met kans 50% heb je de kleinere envelop, de andere bevat dan 2Y. Met kans 50% heb je de grotere envelop, de andere bevat \frac{1}{2}Y

De verwachte waarde van de andere envelop lijkt dan: E=0,5.2Y+0,5.\frac{1}{2}Y = \frac{5}{4}Y

Dus zou de andere envelop gemiddeld meer waard zijn. Dit suggereert dat je altijd beter af bent door te wisselen. Maar dat kan niet kloppen, want symmetrie: beide spelers kunnen redeneren dat ze moeten wisselen, en toch kan niet iedereen altijd winnen.

De bovengenoemde redenering berust op een denkfout. Weliswaar is de winst 100% in het ene geval en het verlies 50% in het andere, maar het betreft percentages van (stochastisch gezien) verschillende bedragen en absoluut gezien gaat het om hetzelfde bedrag. Op tafel liggen namelijk enveloppen met respectievelijk X zeg 1000 euro, en 2X, dus 2000 euro. Wisselen levert in het ene geval een winst van 100% van X, dus 1000 euro op, en in het andere geval een verlies van 50% van 2X, dus ook 1000 euro op. Het verwachte voordeel bij wisselen is dus 0. Er is geen winnende strategie.
 
 

 

Dames in een kaartspel

Schud een spel kaarten goed. Hoeveel kaarten van de top , gemiddeld genomen, kom je de eerste dame tegen?

  • We weten dat er 4 dames in het spel zijn. 
  • Wat ook de volgorde van de kaarten mag zijn, de dames verdelen het pak kaarten in 5 groepen: de kaarten voor de eerste dame, de kaarten tussen de eerste en tweede dame, enzovoort.
  • Het aantal kaarten in elk van die groepen varieert van 0 tot en met 48.
  • Noteer met X_i het aantal kaarten in de i-de groep. Dan geldt:

        \[0 \leq X_i \leq 48\]

     

        \[X_1+X_2+X_3+X_4+X_5=48\]

  • Elke X_i is een kansvariabele en omdat het pak kaarten goed geschud is, zal de kansverdeling van elke X_i dezelfde zijn.
  • Maar dan is 48=E(48)=E(X_1+X_2+X_3+X_4+X_5)=5E(X_1).
  • Bijgevolg is

        \[E(X_1)=\frac{48}{5}=9,6\]

  • Het verwacht aantal kaarten voor de eerste dame is dus gelijk aan 9,6.

Determinant vervolg

Bereken de kans dat de determinant van een 3×3 matrix, met natuurlijke getallen als elementen,  oneven is.

 

  • Gegeven een matrix A=\begin{pmatrix}a&b&c\\d&e&f\\g&h&i\end{pmatrix}.
  • Zijn determinant is

        \[det A =aei+bfg+dhc-gec-dbi-ahf\]

  • Omdat het gaat over even/oneven kunnen we modulo 2 werken. 
  • Determinant oneven betekent dan dat de determinant 1 is en dus dat de matrix inverteerbaar moet zijn.
  • Een matrix is inverteerbaar als de kolommen onafhankelijk zijn. Kies de eerste kolom willekeurig ( mag niet 000 zijn) . Dan heb je hiervoor 7 mogelijkheden.
  • De tweede kolom mag geen veelvoud zijn van de eerste, maw mag er niet aan gelijk zijn. Dus heb je hiervoor nog 6 mogelijkheden.
  • De derde kolom mag niet gelijk zijn aan de eerset of de tweede , maar ook niet gelijk aan de som van die twee ( en natuurlijk ook niet 000). Hiervoor heb je 4 mogelijkheden .
  • Er zijn 7x6x4=168 mogelijkheden om determinant 1 te vinden. Er zijn 2^9=512 mogelijke matrices te vormen met nullen en enen.
  • De kans dat een 3×3 matrix met natuurlijke elementen oneven is , is dus

        \[\frac{168}{512}\]

Determinant

Bereken de kans dat de determinant van een 2×2 matrix, met natuurlijke getallen als elementen,  even is.

 

  • Gegeven een matrix A=\begin{pmatrix}a&b\\c&d\end{pmatrix}.
  • Zijn determinant is

        \[det A =ad-bc\]

  • Een product van twee natuurlijke getallen is oneven als beide getallen oneven zijn, dus de kans dat ad oneven is, is \frac{1}{4}. De kans dat ad even is, wordt dat \frac{3}{4}.
  • Nu is det A even als ad en bc beiden even zijn of beide oneven zijn.
  • De kans dat det A even is , is bijgevolg gelijk aan \frac{1}{4}.\frac{1}{4}+\frac{3}{4}.\frac{3}{4}=\frac{10}{16}=0,625