Statistiek: toetsende statistiek
Statistiek: flowchart + tabellen afdrukken Alle lessen worden opgenomen Spss downloaden:
student.thomasmore.be (gratis jaar) Examen op pc —> oefeningen (GEEN THEORIE) Zie cursusformatie toledo
Extra oefeningen op toledo (niet op punten, maar wel met oplossingen) Formuleblad op toledo
1. Kansverdeling en hypothesetoetsing
1.1 Doel
- Beschrijvende analyse = centrummaten en spreidingsmaten
- ALTIJD eerst beschrijvende analyse, dan pas statistische toetsen (inductieve analyse
à significante verschillen)
- Uiteindelijk besluit vormen à waar of puur toeval? à theorie of uitspraak creëeren
- à Empirische cyclus
Hypothese
Theorie / Dataver-
uitspraak zameling
Inductieve Beschrijvende
analyse analyse
- Probleem van de inductieve statistiek
o Populatie toetsen
o Steekproef trekken (best mooie, evenwichtige steekproef à van alles wat)
o Uitspraak met een bekende mate van (on)zekerheid
- De kansberekening over de zekerheid
o Uitgaande van geen verschil tussen de groepen
o Hoe groot is de kans dat we wel een verschil observeren (hier gaan we naar
op zoek)
o Is de kans groot (dan is de kans heel klein dat het toeval is)
o Dan is de observatie geen uitzondering
- Misbruik
o Statistiek is een hulpmiddel, geen doel
o Beïnvloeding van keuzes, incorrect gebruik van cijfergegevens
o Zwakke onderzoeksmethodes
o Vage beweringen
o Onterecht gebruik van termen als ‘wetenschappelijk bewezen’
- Hoe meer problemen je combineert, hoe moeilijker het wordt om populatie te
vinden
- Opletten met “wetenschappelijk onderzoek toont aan” want statistiek blijft gokken,
blijft kansberekening
1
,1.2 Kans
- Definitie
o Kans, is de mate van zekerheid / onzekerheid over het optreden van een
bepaalde gebeurtenis in de toekomst
o Kansverdeling (hypothetisch) is een vorm van frequentieverdeling
(observatie)
o Voorspellen wat de frequentie van voorkomen zal zijn van een gebeurtenis
indien we oneindig vaak de proef op de som nemen
- Symbolen
o P = Probability = kans
o M = de betreffende gebeurtenis die we willen halen
o N = het aantal waarden waaruit ik een steekproef trek, uitkomstenruimte (U)
o De elementen in de uitkomsten ruimte noemen we de elementaire
gebeurtenissen
o N(M) = het aantal keer dat de gewenste waarde voorkomt in het totaal aantal
waarden N (= in mijn steekproef)
- De kans op een gebeurtenis
o P(M) = de kans om de waarde M te krijgen
o P(M) = N(M)/N
- Bv. “hoe groot is de kans dat ik een blonde dame eruit trek als proefpersoon” =
kansberekening
- Bv. hoe groot is de kans dat ik iem die 19/20 had voor Wet hand eruit haal?”
à M is 19/20
à N is aantal in 2e jaar LOG à bv 90
à N(M) is dan bv 5/90
Mogelijke uitkomsten
- Kans op één specifieke elementaire gebeurtenis is altijd 0
o P(M) ³0
- Kans op eender welke gebeurtenis uit U is altijd 1
o P(M) = 1 want het is de som van alle kansen op elementaire gebeurtenissen
uit U
o Mits alle kansen gelijk zijn aan N(M)/N en we dit N keer optellen wordt dit
N/N
o à 100% kans
- Kans op niet die ene specifieke elementaire gebeurtenis (bv iemand eruit trekken
en die mag NIET 10/20 hebben à alles kleiner of groter wel)
o P(niet-M) = 1 – P(M) à 1 – kans dat ik wel 10/20 heb
Voorbeeld
- Een dobbelsteen bevat 6 waarden (N = 6)
- De uitkomstenruimte U = {1, 2, 3, 4, 5, 6}
- We zoeken de kans op het gooien van ‘6’ in één keer.
- Het aantal keer dat 6 voor komt in U = N(6) = 1
- P(6) = N(6) / 6 = 1/6 = 0,167 = 16,7%
Bij een perfecte dobbelsteen en een aselecte steekproef met teruglegging heeft elke
gebeurtenis uit de
uitkomstenruimte evenveel kans om voor te komen.
2
,We spreken in dit geval van een: uniform kansmodel
P = totaal aantal kansen om een 6 te gooien (à dobbelsteen heeft 6 zijden)
N = hoeveel keer 6 aan bod komt (--> 6 komt maar 1 keer voor)
‘met teruglegging’ = ik heb altijd terug 6 zijden aan mijn dobbelsteen
Uniform kansmodel: altijd evenveel kans om 6 te gooien
1.3 Frequentie/kans
Frequentieverdeling: Kansverdeling:
Hoogte van de staven zijn het aantal Hoogte van de staven is de kans op de
observaties voor een uitkomst uitkomst
1 dobbelsteen 1 dobbelsteen
0,30 0,20
0,25
0,15
0,20
0,15 0,10
0,10 0,05
0,05
0,00
0,00
1 2 3 4 5 6
1 2 3 4 5 6
à Hoewel ik altijd dezelfde kans heb om een cijfer te gooien, gooi ik toch niet telkens een
ander cijfer X P(X)
1 1/6
1.4 Kansverdeling
2 1/6
- De kansverdeling
o » frequentietabel 3 1/6
o Theoretische waarden niet echt vastgesteld 4 1/6
o Gemiddelden en standaardafwijkingen zijn dus in principe 5 1/6
niet toe te passen
6 1/6
o Daarom: doen we alsof we oneindig vaak gooien met de
dobbelsteen Totaal 1
o Soort van gemiddelde = de verwachte waarde (verwacht gemiddelde van de
populatie) ¹ het gemiddelde van een steekproef
o µx of E(X)
- E(X) = P(X = x1) (x1) + P(X = x2)(x2) + … + P(X = xk)(xk) = Kans om 1 te gooien x 1 + kans
om 2 te gooien x 2 + ........
- E(X) = xiP(X= xi)
- Theoretische waarden (geen effectief gegooide waarden)
- We berekenen de verwachte waarde van het gemiddelde van de steekproef
- Variantie
o sx² = E(X - µx)²
o sx² = SP(X=xi)(xi - µx)² = S((xi - µx)² / N)
o (Kans op gebeurtenis x gebeurtenis – het gemiddelde)^2 = variantie
3
, - Standaardafwijking, sx of SE(X)
o sx = Ö sx ² = SE(X) = ÖE(X - µx)²
- µx = E(X) = P(X = x1) (x1) + P(X = x2)(x2) + … + P(X = xk)(xk)
= (1/6)(1) + (1/6)(2) + (1/6)(3) + (1/6)(4) + (1/6)(5) + (1/6)(6)
= 3,5
= de verwachte waarde van wat ik gemiddeld zal gooien
à Als ik oneindig gooi met een dobbelsteen en ik bereken het gemiddelde van wat ik
heb gegooid, kom ik op 3, 5 uit
- sx = SE(X) = ÖE(X - µx)²
= Ö[(P(X = x1) (x1 - µx)² + P(X = x2)(x2 - µx)² + … + P(X = xk)(xk - µx)²]
= Ö [(1/6)(1-3,5)² + (1/6)(2-3,5)² + (1/6)(3-3,5)² + (1/6)(4-3,5)² + (1/6)(5-3,5)² +
(1/6)(6-3,5)²]
= 1,71
à Kansberekening = gem berekenen op een andere manier!!! Niet meer gewoon alles
optellen en delen door aantal
Kansverdeling van het steekproefgemiddelde
- Uit de populatie kunnen nu oneindig veel steekproeven getrokken worden
- Op zoek naar de verwachte waarde van de verschillende steekproefgemiddelden
- Alle gemiddelden van de steekproeven volgen een verdeling
- De kansverdeling: geeft informatie om te weten hoe groot de kans is op een bepaald
gemiddelde
4