• Deductieve of Beschrijvende Statistiek à Statistiek 1:
o Doel = globale patronen en kenmerken ontdekken ahv
− Kengetallen = karakteristieke waarden = beschrijvende maten
(gemiddelde, standaardafwijking, correlatiecoëfficiënt, etc.)
− Figuren (histogram, spreidingsdiagram, …)
• Inductieve of Inferentiële statistiek à Statistiek 2:
o Verklarende statistiek, vergelijkt onderzoeksgegevens met wat mogelijk is door
TOEVAL, gebaseerd op kansrekening
o Op basis van een beperkt aantal gegevens wordt getracht om algemene
uitspraken te formuleren over de gehele populatie.
Steekproef geeft info over Populatie
(De stap terug noemen we inductie)
Stel dat in België evenveel jongens als meisjes kiezen om psychologie te gaan studeren …
Mogelijke resultaten van steekproefonderzoek:
Hoe waarschijnlijk is het dat ik een slechte steekproef ga trekken? Of als ik een idee heb over de
samenstelling van mijn steekproef, in welke mate kan ik dan gaan veralgemenen naar de populatie toe? 1
,KANS en INFERENTIE
• Waarom Kansrekening?
o Onderzoeksresultaten vergelijken met “toeval”!
à Voorbeeld: Kan een rat “zien” of iemand jong <> oud en man <> vrouw is?
Stel je voor dat ik het gekke idee heb om de vraag te stellen of ratten/muizen in staat zijn om op
basis van een foto een verschil te kunnen maken tussen jonge en oude mensen en mannen en
vrouwen. Dus een beetje geoperationaliseerd vraag ik mij af: is de rat in staat om het kleine
meisje te herkennen? Om zo’n vraag aan een rat te stellen moet je deze motiveren. Je moet ze
door honger motiveren om te zoeken naar een beloning. Je zet de rat in een opstelling zoals hier,
met daarin 4 foto’s en die foto’s staan op deurtjes en als die het juiste deurtje kiest, dan krijgt die
een korreltje rattenvoer. Rat moet weten wat de opdracht is, dus de rat een paar keer laten
kiezen en belonen wanneer juist. Dan komt de testfase; dan ga je de rat loslaten voor het deurtje
en laten kiezen voor een foto. Wat kan er dan gebeuren? Stel je voor dat de rat het kan en het
meisje kan herkennen, dan verwacht je dat die dat 20 keer juist doet. Indien de rat het niet kan,
dan zal die waarschijnlijk geen 0 halen, wel 4 of 5. Er zijn 4 deurtjes, bij elke poging heeft ze 1
kans op 4 om het juiste deurtje te kiezen, dus op 20 pogingen verwacht je 20 gedeeld door 4, dus
5 juiste pogingen. Dat is eigenlijk waar we voor staan. Dus eigenlijk het totaal niet kunnen
betekent niet dat je 0 moet halen, je kunt nog juist gokken. We moeten niet vergelijken met 20
en 0, het zal dan gaan tussen 20 en 5. Stel nu voor dat die rat 16 keer juist is, dan besluit je dat ze
het goed kan. Tussen de 5 en 20 zitten er dus heel wat gradaties en ik vraag mij dus af als ik een
resultaat zie in welke mate ik dat kan verklaren door toeval.
Dit fenomeen nabootsen met pingpong balletjes; een geblindeerd zakje met daarin 4 pingpong
balletjes, waarvan 3 witte en 1 gele bal. 20 keer met de ogen toe een balletje trekken en kijken
naar de kleur, als het een wit is heeft de rat het niet gekund, als het een geel is dan heeft de rat
het juiste deurtje geopend. Is het mogelijk dat ik 20 keer na elkaar zuiver door toeval het gele
balletje zou trekken? Theoretisch kan dat, dus het is mogelijk dat je 20 keer na elkaar geluk hebt,
1 op 4 tot de 20ste macht à is bijna 0, maar is niet echt 0. Is het mogelijk dat ik 20 keer na elkaar
alleen maar witte balletjes heb? Uiteraard. Wat ik kan doen; als ik 20 keer een balletje trek, als ik
dat nu heel veel keer ga doen, bv 100 000 keer, dan ga ik een soort van histogram kunnen
maken; zuiver door toeval krijg je dit resultaat: bv het komt vaak voor dat je er 5 of 6 of 3 juiste
hebt, 20 juiste dat zal waarschijnlijk weinig voorkomen. Dan kan ik mijn rat loslaten in deze
opstelling en zien hoe veel deze het juiste deurtje open doet en dan kan ik die prestatie gaan
vergelijken met hetgeen dat ik zuiver door toeval heb kunnen vaststellen.
In de resultaten hierboven zie je dat 5 het meest voorkomt en dat hadden we eigenlijk ook
voorspeld. En we zien dat 4 en 6 (die dichter bij 5 liggen) ook een grotere frequentie hebben.
Hoe verder je weg gaat van 5 hoe lager de frequentie wordt. Moest een rat meer dan 11 keer het
juiste deurtje open doen, dan mogen we besluiten dat die het eigenlijk wel heeft geleerd, dan is
daar iets meer dan toeval aan de hand
2
, Stel je nu eens voor dat de rat 10 keer het juiste deurtje opendoet,
dan besluit je dat het al bijna geen toeval meer kan zijn. Dus hier
zie je dat je een soort van grens gaat moeten stellen van wanneer
je eigenlijk gaat zeggen dat de rat toch wel iets geleerd heeft en
dus afwijkt van toeval. We gaan dat later noemen; ze wijkt
significant af van wat we kunnen verklaren door toeval. Hoe
streng zou je willen zijn? In feite zie je dat als je 100% zeker wil
zijn dat het niet verklaard kan worden door toeval, dat je dus
verder naar rechts zal moeten gaan en je niet tevreden zal zijn
met 11 juiste pogingen. Je gaat dan zeggen dat het minstens 12
juiste pogingen moeten zijn obv wat we hier hebben gezien en dat
is heel streng. Dat betekent dat je over heel veel van de beestjes
die eigenlijk echt wel al iets hebben opgestoken gaat zeggen dat
ze niets hebben geleerd. Dus we gaan daar eigenlijk een risico
lopen op foutieve beslissingen.
Denken dat alleen het toeval alles kan verklaren, dat noemen we de nulhypothese. Die geeft
weer wat we kunnen verklaren door gewoon gebruik te maken van toeval. De alternatieve
hypothese die ga je aanvaarden als je de nulhypothese kunt verwerpen. De nulhypothese
verwerpen betekent dat je een resultaat hebt, waarbij je bereid bent te geloven dat dit niet te
verklaren is op basis van toeval. Klassiek gaan we daarvoor als drempel 5% nemen. Dus vanaf
dat de kans om een zo hoog resultaat te bekomen, zuiver door toeval, kleiner is dan 5%, dan
gaan we zeggen dat we het niet als toeval beschouwen. Is belangrijk, want zal een soort van
beslissingscriterium geven. We hebben hier 1000 ratten, waarvan 5%, is 50. Dus dat zou
betekenen dat vanaf 8 juiste deurtjes we zouden zeggen dat er al iets geleerd is. We willen in
staat zijn om kleine verschillen te detecteren; we willen bv zien of er een bepaalde verbetering is
(bv doen de ratten met krachtvoer het beter dan de ratten die geen krachtvoer hebben
gekregen? à willen dan kleine verschuivingen kunnen detecteren). Met de drempel van 5% kan
je dus eigenlijk de lat al een stuk lager leggen en al beslissen vanaf 8 dat er iets geleerd is.
De 5% is nu volledig aan de rechterkant genomen; is niet altijd evident omdat ik met mijn
pingpong balletjes de situatie ga beschrijven die tot stand komt door toeval. In het voorbeeldje
dat we nu hebben gemaakt verwacht je eigenlijk alleen maar dat je beter gaat doen dan toeval
(dus rechts). Ik kan me moeilijk een verhaal bedenken bij een rat die het slechter gaat doen dan
toeval; dan moet die bv al een soort van vermijdingsgedrag gaan vertonen. In de praktijk is het
soms zo dat we denken dat er wel eens een verschil zou kunnen zijn, maar dat we niet
noodzakelijk weten of het naar rechts of naar links gaat zijn. Stel je voor je hebt een leesmethode
in een lagere school, kindjes behalen een bepaalde score op een leestest. Er komt een nieuwe
methode op de markt, het is niet zeker of die methode beter of slechter zal zijn. Dus in dat geval
ga je eigenlijk naar de 2 kanten kijken van die verdeling van wat je kan verklaren op basis van
toeval.
à Laat 1 rat het experiment ECHT uitvoeren…
Dus je gaat eerst een model maken van wat je kan verklaren als alleen maar toeval speelt. Dan ga
je de rat laten lopen en je gaat tellen en dus als je bv een rat hebt die 7 keer het juiste deurtje
behaald ga je zeggen dat dit in het midden valt van wat ik kan verklaren door toeval, dus ik kan
dat verklaren door toeval. We gaan dan oppervlaktes bekijken zoals we hebben gedaan bij de
normaalverdeling. Gaan kijken hoe groot de kans is dat je door toeval een score zou behalen die
groter is dan zoveel of zoveel.
3
, à Simulatie van “heel veel” (1 miljoen) ratten…
Dan zie je hier dat in een miljoen pogingen de 20 nooit voorgekomen is. Geen stabiel resultaat,
maar een toevallig resultaat, een gesimuleerd resultaat.
In het voorbeeld van de pingpong balletjes; toen 1 kans op 4, 20 keer na elkaar, dat is tot de
macht 20. Een stapje lager; hoe groot is nu de kans dat je 19 keer van de 20 pogingen het gele
balletje hebt, maar 1 keer het wit? Dan wordt het ineens veel ingewikkelder, omdat het daarjuist
altijd de gele moest zijn, maar nu is er 1 wit en waar gaat dat zitten? Is het de eerste, de tweede,
de derde poging,…? Dus in die 20 pogingen zal er ergens eentje zijn, maar ik ga dus een kans
hebben dat ik 1 wit balletje heb op de 1ste positie OF de kans dat ik dat wit balletje heb op de 2de
positie OF de kans op de 3de positie, … à gebruik hier speciaal 2 woorden EN =
vermenigvuldigen (en de eerste keer en de tweede keer en de derde keer,…) en OF is optellen.
Stel je dan voor 2 witte balletjes, dus 18 gele en 2 witte, dan kan dat wit balletje in de 1ste en de
2de poging zitten of in de 2de en de 3de of in de 1ste en de 4de, … dan krijg je natuurlijk heel lange
kettingen van producten en optellingen om uiteindelijk die kans te gaan berekenen. Om die
dingen te kunnen begrijpen en doen is het nuttig om te kijken naar verzamelingenleer en
combinatieleer. We kunnen het kansrekenen voor een groot stuk voorstellen adhv
verzamelingen.
Verzamelingen en Combinatieleer
Verzamelingen
à Een beknopt overzicht
• Een verzameling A is een groepering van n elementen a1, a2, …, an
• Notatie: A={a1, a2, …, an}
o (Om te zeggen dat ze bij elkaar horen zetten we ze tussen haakjes)
• Venn-diagram:
o Hier een ovaal, maar kan gelijk wat zijn,
zolang het maar een gesloten figuur is
• Verzameling B is een deelverzameling van A die elementen a3, en an bevat
• Notatie:
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller emmafrateur. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.65. You're not tied to anything after your purchase.