Statistiek: toetsende statistiek
Statistiek: flowchart + tabellen afdrukken Alle lessen worden opgenomen Spss downloaden:
student.thomasmore.be (gratis jaar) Examen op pc —> oefeningen (GEEN THEORIE) Zie cursusformatie toledo
Extra oefeningen op toledo (niet op punten, maar wel met oplossingen) Formuleblad op toledo
1. Kansverdeling en hypothesetoetsing
1.1 Doel
- Beschrijvende analyse = centrummaten en spreidingsmaten
- ALTIJD eerst beschrijvende analyse, dan pas statistische toetsen (inductieve analyse
à significante verschillen)
- Uiteindelijk besluit vormen à waar of puur toeval? à theorie of uitspraak creëeren
- à Empirische cyclus
Hypothese
Theorie / Dataver-
uitspraak zameling
Inductieve Beschrijvende
analyse analyse
- Probleem van de inductieve statistiek
o Populatie toetsen
o Steekproef trekken (best mooie, evenwichtige steekproef à van alles wat)
o Uitspraak met een bekende mate van (on)zekerheid
- De kansberekening over de zekerheid
o Uitgaande van geen verschil tussen de groepen
o Hoe groot is de kans dat we wel een verschil observeren (hier gaan we naar
op zoek)
o Is de kans groot (dan is de kans heel klein dat het toeval is)
o Dan is de observatie geen uitzondering
- Misbruik
o Statistiek is een hulpmiddel, geen doel
o Beïnvloeding van keuzes, incorrect gebruik van cijfergegevens
o Zwakke onderzoeksmethodes
o Vage beweringen
o Onterecht gebruik van termen als ‘wetenschappelijk bewezen’
- Hoe meer problemen je combineert, hoe moeilijker het wordt om populatie te
vinden
- Opletten met “wetenschappelijk onderzoek toont aan” want statistiek blijft gokken,
blijft kansberekening
1
,1.2 Kans
- Definitie
o Kans, is de mate van zekerheid / onzekerheid over het optreden van een
bepaalde gebeurtenis in de toekomst
o Kansverdeling (hypothetisch) is een vorm van frequentieverdeling
(observatie)
o Voorspellen wat de frequentie van voorkomen zal zijn van een gebeurtenis
indien we oneindig vaak de proef op de som nemen
- Symbolen
o P = Probability = kans
o M = de betreffende gebeurtenis die we willen halen
o N = het aantal waarden waaruit ik een steekproef trek, uitkomstenruimte (U)
o De elementen in de uitkomsten ruimte noemen we de elementaire
gebeurtenissen
o N(M) = het aantal keer dat de gewenste waarde voorkomt in het totaal aantal
waarden N (= in mijn steekproef)
- De kans op een gebeurtenis
o P(M) = de kans om de waarde M te krijgen
o P(M) = N(M)/N
- Bv. “hoe groot is de kans dat ik een blonde dame eruit trek als proefpersoon” =
kansberekening
- Bv. hoe groot is de kans dat ik iem die 19/20 had voor Wet hand eruit haal?”
à M is 19/20
à N is aantal in 2e jaar LOG à bv 90
à N(M) is dan bv 5/90
Mogelijke uitkomsten
- Kans op één specifieke elementaire gebeurtenis is altijd 0
o P(M) ³0
- Kans op eender welke gebeurtenis uit U is altijd 1
o P(M) = 1 want het is de som van alle kansen op elementaire gebeurtenissen
uit U
o Mits alle kansen gelijk zijn aan N(M)/N en we dit N keer optellen wordt dit
N/N
o à 100% kans
- Kans op niet die ene specifieke elementaire gebeurtenis (bv iemand eruit trekken
en die mag NIET 10/20 hebben à alles kleiner of groter wel)
o P(niet-M) = 1 – P(M) à 1 – kans dat ik wel 10/20 heb
Voorbeeld
- Een dobbelsteen bevat 6 waarden (N = 6)
- De uitkomstenruimte U = {1, 2, 3, 4, 5, 6}
- We zoeken de kans op het gooien van ‘6’ in één keer.
- Het aantal keer dat 6 voor komt in U = N(6) = 1
- P(6) = N(6) / 6 = 1/6 = 0,167 = 16,7%
Bij een perfecte dobbelsteen en een aselecte steekproef met teruglegging heeft elke
gebeurtenis uit de
uitkomstenruimte evenveel kans om voor te komen.
2
,We spreken in dit geval van een: uniform kansmodel
P = totaal aantal kansen om een 6 te gooien (à dobbelsteen heeft 6 zijden)
N = hoeveel keer 6 aan bod komt (--> 6 komt maar 1 keer voor)
‘met teruglegging’ = ik heb altijd terug 6 zijden aan mijn dobbelsteen
Uniform kansmodel: altijd evenveel kans om 6 te gooien
1.3 Frequentie/kans
Frequentieverdeling: Kansverdeling:
Hoogte van de staven zijn het aantal Hoogte van de staven is de kans op de
observaties voor een uitkomst uitkomst
1 dobbelsteen 1 dobbelsteen
0,30 0,20
0,25
0,15
0,20
0,15 0,10
0,10 0,05
0,05
0,00
0,00
1 2 3 4 5 6
1 2 3 4 5 6
à Hoewel ik altijd dezelfde kans heb om een cijfer te gooien, gooi ik toch niet telkens een
ander cijfer X P(X)
1 1/6
1.4 Kansverdeling
2 1/6
- De kansverdeling
o » frequentietabel 3 1/6
o Theoretische waarden niet echt vastgesteld 4 1/6
o Gemiddelden en standaardafwijkingen zijn dus in principe 5 1/6
niet toe te passen
6 1/6
o Daarom: doen we alsof we oneindig vaak gooien met de
dobbelsteen Totaal 1
o Soort van gemiddelde = de verwachte waarde (verwacht gemiddelde van de
populatie) ¹ het gemiddelde van een steekproef
o µx of E(X)
- E(X) = P(X = x1) (x1) + P(X = x2)(x2) + … + P(X = xk)(xk) = Kans om 1 te gooien x 1 + kans
om 2 te gooien x 2 + ........
- E(X) = xiP(X= xi)
- Theoretische waarden (geen effectief gegooide waarden)
- We berekenen de verwachte waarde van het gemiddelde van de steekproef
- Variantie
o sx² = E(X - µx)²
o sx² = SP(X=xi)(xi - µx)² = S((xi - µx)² / N)
o (Kans op gebeurtenis x gebeurtenis – het gemiddelde)^2 = variantie
3
, - Standaardafwijking, sx of SE(X)
o sx = Ö sx ² = SE(X) = ÖE(X - µx)²
- µx = E(X) = P(X = x1) (x1) + P(X = x2)(x2) + … + P(X = xk)(xk)
= (1/6)(1) + (1/6)(2) + (1/6)(3) + (1/6)(4) + (1/6)(5) + (1/6)(6)
= 3,5
= de verwachte waarde van wat ik gemiddeld zal gooien
à Als ik oneindig gooi met een dobbelsteen en ik bereken het gemiddelde van wat ik
heb gegooid, kom ik op 3, 5 uit
- sx = SE(X) = ÖE(X - µx)²
= Ö[(P(X = x1) (x1 - µx)² + P(X = x2)(x2 - µx)² + … + P(X = xk)(xk - µx)²]
= Ö [(1/6)(1-3,5)² + (1/6)(2-3,5)² + (1/6)(3-3,5)² + (1/6)(4-3,5)² + (1/6)(5-3,5)² +
(1/6)(6-3,5)²]
= 1,71
à Kansberekening = gem berekenen op een andere manier!!! Niet meer gewoon alles
optellen en delen door aantal
Kansverdeling van het steekproefgemiddelde
- Uit de populatie kunnen nu oneindig veel steekproeven getrokken worden
- Op zoek naar de verwachte waarde van de verschillende steekproefgemiddelden
- Alle gemiddelden van de steekproeven volgen een verdeling
- De kansverdeling: geeft informatie om te weten hoe groot de kans is op een bepaald
gemiddelde
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller kaatspildooren1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.74. You're not tied to anything after your purchase.