2.2 Statistiek: Verklaren En Voorspellen (FSWPE2022)
Institution
Erasmus Universiteit Rotterdam (EUR)
en complete samenvatting van blok 2.2 statistiek. Inclusief: aantekeningen bij alle colleges, alle gevraagde hoofdstukken uit de boeken, SPSS en een overzicht van de verschillende toetsen.
2.2 Statistiek: Verklaren En Voorspellen (FSWPE2022)
All documents for this subject (5)
1
review
By: lvanwesten • 1 year ago
Seller
Follow
rozemarijnnoelle
Reviews received
Content preview
College 1: Herhaling blok 1.3
Statistiek omdat: voor onderzoek of om onderzoek kritisch te kunnen interpreteren.
Bijvoorbeeld: is een onderzoek over de werking van een medicijn voor een bepaalde ziekte
wel relevant? Dat een onderzoek gepubliceerd is (ook in aangeschreven bladen/op sites)
betekent niet dat het onderzoek ook daadwerkelijk goed is.
Twee soorten van statistiek:
Beschrijvende statistiek: samenvatten/organiseren/beschrijven van kwantitatieve
onderzoeksresultaten, bijvoorbeeld CBS: van alle studenten heeft 20% depressie
Inferentiële statistiek: om aan te tonen of er verbanden/relaties zijn, toetsen,
trekken van conclusies over een populatie op basis van de onderzoeksresultaten
afkomstig uit een steekproef, bijvoorbeeld: werkt een bepaalde interventie voor
depressie bij studenten.
Inferentiële statistiek kan op beschrijvende volgen, bijvoorbeeld: 30% van de mensen die
corona heeft rookt. Vervolgens ga je toetsen: leidt roken tot ernstige coronaklachten?
Statistiek geeft een model voor hoe je denkt dat de werkelijkheid eruit ziet, dat model ga je
testen. Er is altijd een interventiegroep en controlegroep, jij denkt óf dat allebei die groepen
hetzelfde zijn óf dat allebei de groepen hetzelfde zijn behalve één ding, bijvoorbeeld het
gemiddelde. Het éne ding dat verschilt, bepaalt welke test je uitvoert.
In analyses werk je met variabelen. Vier soorten variabelen met verschillende meetniveaus:
- Nominaal (kwalitatief): er zijn verschillende waarden, maar die waarden zeggen
alleen dat iets niet hetzelfde is dan een ander, bijvoorbeeld: appel, peer, banaan. Er
wordt onderscheid gemaakt tussen verschillende waarden, zonder rangorde.
- Ordinaal (kwalitatief): er zijn verschillende waarden, die waarden zeggen dat iets niet
hetzelfde is en dat iets “meer” of “minder” is, er zit een rangorde in. De volgorde loopt
niet gelijk op, de afstanden tussen de waarden zijn onbepaald, niet te interpreteren.
- Interval (kwantitatief): we kunnen kijken naar afstanden tussen de waarden, deze zijn
interpreteerbaar, bijv. IQ het verschil tussen 130-140 en 110-120 is even groot. máár
er is geen absoluut nulpunt, dus het is niet zo dat een IQ van 160 twee keer zo
hoog is als een IQ van 80.
- Ratio (kwantitatief): meetschalen met een natuurlijk voorkomend nulpunt (zoals
lengte, gewicht, inkomen), iemand van twee meter is twee keer zo lang als iemand
van een meter.
Het presenteren van variabelen
kan aan de hand van een
frequentieverdeling. We kijken in
eerste instantie of de verdeling
unimodaal is (één top heeft) en of
hij symmetrisch is. Een verdeling
kan ook right skewed of left
skewed zijn. Een verdeling wordt
1
,bekeken aan de hand van centrummaten: de modus, de mediaan en het gemiddelde. De
modus is de meest voorkomende score. De mediaan is de middelste score en het
gemiddelde is de som van alle scores gedeeld door het aantal. Wanneer een verdeling
skewed is, heeft dit invloed op deze maten, bijvoorbeeld het gemiddelde wordt als het ware
meegetrokken met de scheefheid.
Een verdeling kan je samenvatten aan de hand van een centrummaat en de maat van
spreiding; het gemiddelde en de standaarddeviatie. Als je een verdeling wilt beschrijven
maar je verdeling is scheef (left or right) kan je het gemiddelde vervangen door de mediaan.
Met spreiding bedoelt men of de waarden van een variabele dichtbij elkaar of ver van elkaar
af staan. De standaarddeviatie is dus de gemiddelde spreiding rond het gemiddelde. Des te
hoger de standaarddeviatie, des te platter de verdeling. De standaarddeviatie wordt
berekend aan de hand van de variantie, het is namelijk de wortel van de variantie.
Als je de spreidingsmaat wilt berekenen, wil je alle afstanden van het gemiddelde
(gekwadrateerd!) van iedere meting weten om hiervan het gemiddelde te nemen, gedeeld
door het aantal metingen minus
1. Nu ken je de variantie. De
standaarddeviatie is de wortel
hiervan.
Nu je weet wat het gemiddelde en de standaarddeviatie is, kan je gaan kijken naar scores
die afwijken ofwel extreem hoog of extreem laag is. Bij een normaal verdeelde scoren zit
68% van de scores binnen -s en +s, 95% van de scores zitten tussen -2s en +2s. Je gaat de
kans berekenen op iets nog extremers dan +2s of -2s. Je berekent de Z-score. Je kan deze
berekenen met het gemiddelde en de
standaarddeviatie. Je gebruikt de tabel
om met de Z-
score op te
zoeken wat de
kans is om een
bepaalde waarde te overschrijden. Je
zou ook de kans kunnen berekenen op
een waarde tussen twee bepaalde
waardes.
Inferentiële statistiek is onderdeel van de empirische cyclus. Je hebt een idee, een
hypothese. Deze ga je toetsbaar maken. Vervolgens ga je dit dan ook daadwerkelijke
toetsen. Hierop evalueer je en kan je gebruiken als observatie instrument. Op deze manier
kan je blijven onderzoeken.
Voorbeeld: je veronderstelt dat je door kauwgum kauwen beter gaat presteren. Je gaat een
hypothese opstellen. De nulhypothese (H0) houdt in dat er geen verschil is: zowel mensen
die kauwgum kauwen als niet behalen dezelfde resultaten. De alternatieve hypothese (HA)
houdt in dat er wel verschil is, ofwel: beide groepen zijn niet gelijk.
2
,Voor elke toetsing heeft men een steekproef nodig. Een steekproef is een gedeelte van de
populatie. Het is in principe niet mogelijk om met de hele populatie te toetsen. De steekproef
representeert de populatie, deze moet wel groot genoeg zijn. In de steekproef worden twee
gelijke groepen gecreëerd (romaniseren) zodat deze groepen vervolgens vergeleken
kunnen worden. De onafhankelijke variabele is hetgeen dat we gaan manipuleren, in dit
geval het kauwgum kauwen. De afhankelijke variabele is hetgeen waarin we
geïnteresseerd zijn, in dit geval prestatie, hetgeen dat afhankelijk is van de onafhankelijke
variabele.
Bij statistiek gaat men er altijd vanuit dat de H0 volledig juist is. Nu gaan we kijken of een
bepaalde score extreem is in het geval dat de H0 waar is. Het gemiddelde verschil tussen
kauwgum kauwers en niet kauwgum kauwers is 0, want je H0 is dat er geen verschil is
tussen die twee. Welke waarde zou je moeten zien om toch te gaan twijfelen aan je H0?
Vaak wordt er gesteld dat een score extreem is als we een waarde zien waarop de kans
volgens de H0 5% is of minder. Dat betekent in dit geval dus 2,5% kans op iets dat lager is
dan -2,1 (ofwel kauwgum kauwen is slecht) of 2,5% kans op iets dat hoger +2,1 (ofwel
kauwgum kauwen is goed).
Er bestaan drie manieren om de nulhypothese te verwerpen:
1. De kritische waarde opzoeken en deze vergelijken met de toets statistiek (t, z waarde
etc.). Wanneer de toets statistiek groter is dan deze kritieke waarde, verwerp je H0.
2. De p-waarde achterhalen en deze vergelijken met alpha. Wanneer de kans kleiner is
dan alpha, verwerp je de nulhypothese.
3. Het betrouwbaarheidsinterval opstellen, wanneer de waarde van de H0 (meestal 0)
niet tussen dit interval ligt, mag je H0 verwerpen.
Bij het verwerpen van de H0 weten we echter nooit 100% zeker of die H0 ook daadwerkelijk
onjuist is. Er kunnen twee typen fouten gemaakt worden. Stel je hebt een normale verdeling
die de H0 weergeef, waarbij je de kritieke waarde hebt bepaald. Iedere waarde die links van
de kritieke waarde zou liggen zou niet leiden tot het verwerpen van H0. Iedere waarde die
rechts zou liggen van de kritieke waarde zou wel leiden tot het verwerpen van H0. Echter is
er bij verwerpen sprake van waarschijnlijkheid. Het kan zijn dat je H0 verwerpt, terwijl deze
eigenlijk waar is. Je ziet dan iets heel onwaarschijnlijks/afwijkends, wat toch af en toe kan
voorkomen en dus onder H0 niet onmogelijk is. Dit is een Type 1 fout. Bij een Type II fout
wordt de H0 niet verworpen, terwijl
dit eigenlijk wel zou moeten
gebeuren. Het zou namelijk voor
kunnen komen dat je steekproef
insinueert dat H0 waar is (gezien
je links van de stippellijn uitkomt)
terwijl daar ook waardes liggen die
waar zijn volgen HA.
De power van een toets is de kans op het accepteren van de HA als die waar is; als er een
effect is, wat is de kans dat je het dan ook daadwerkelijk vind. Je kiest voor HA zolang je aan
3
, de rechterkant van de stippellijn zit. Je kan de power vergroten door je significantieniveau op
te hogen, je steekproef te vergroten of de standaarddeviatie te verkleinen.
Stappen van elke statistische toetsingsprocedure:
1. Formuleren van H0 en HA (eenzijdig of tweezijdig)
2. Kiezen van een beslisregel: wat vinden we verbazend. We kiezen hier een
significantieniveau: wanneer gaan we twijfelen aan onze H0. We kiezen ook een
analyseprocedure: welke toets moeten we gebruiken?
3. We trekken een steekproef.
4. We bepalen een referentieverdeling en berekenen een toetsingsgrootheid uit de data.
5. We bepalen de p-waarde: kans
6. Beslissing maken: verwerp H0 als p kleiner of gelijk aan je significantie niveau is
Voorbeeld toetsing: al jarenlang
halen kinderen zonder kauwgum
een gemiddelde score van 6.9 met
een standaard deviatie van 2.3 (dit
gaat dus om de populatie). Welke
waarde zou ik voor de
kauwgumkauwers moeten vinden
om te gaan twijfelen of
kauwgumkauwen inderdaad geen
zin heeft. (1) We stellen
hypotheses op waarbij H0 dus
inhoudt dat er geen verschil is
tussen kauwgumkauwers en niet-
kauwgumkauwers. Het
gemiddelde is dus gelijk. HA houdt
in dat dit niet gelijk zou zijn. De
beslisregel is dat als we iets
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rozemarijnnoelle. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.96. You're not tied to anything after your purchase.