Extensive summary Craig, B: Introduction to the Practice of Statistics - Statistics
Summary Lectures and Readings: Statistics 1 - Introduction (FSWPE1-032)
Detailed Summary: Lectures and Readings STATISTICS 2.2 FSWPE2-022
All for this textbook (11)
Written for
Erasmus Universiteit Rotterdam (EUR)
Psychologie
(FSWPE2022)
Seller
Follow
alysiadejong
Content preview
Hoorcollege 1
Er zijn twee soorten statistiek
- Beschrijvende statistiek: samenvatten/organiseren van kwantitatieve
onderzoeksresultaten
- Inferentiële statistiek: toetsen en het trekken van conclusies over een populatie op
basis van onderzoeksresultaten afkomstig uit een steekproef
Categorische variabelen
- Nominaal: verschillen in groepen (mannen en vrouwen)
- Ordinaal: rangorde in groepen, de ene groep is ‘beter’ of ‘meer’ dan de andere groep
(bijv. SES)
Continue variabelen
- Interval: er is geen 0 punt, de afstanden tussen de waarden is gelijk (IQ)
- Ratio: er is een absoluut 0 punt, en voldoet aan alle voorgaande eisen (gewicht,
lengte, inkomen)
Frequentieverdeling
- Symmetrisch, de kans dat iemand hoog scoort is hetzelfde als laag en afname
- Rechts scheve verdeling, mediaan ligt voor het gemiddelde
- Links scheve verdeling, mediaan ligt na het gemiddelde
Centrummaten
- Modus: meest voorkomende score
- Mediaan: middelste score
- Gemiddelde: som van alle scores gedeeld door het totale aantal
Bij een scheve verdeling kijken we naar de mediaan
Bij een symmetrische verdeling kijken we naar het gemiddelde
Spreidingsmaten
Spreiding: zitten de waarden van een variabele dichtbij elkaar of ver van elkaar af
Standaarddeviatie is de gemiddelde spreiding rond het gemiddelde. Het wordt berekend
door de variantie
Variantie is gemiddelde gekwadrateerde afstand van een datapunt naar het gemiddelde
Standaard scores (z-score)
Aantal standaarddeviaties dat een score verwijderd is van het gemiddelde
Nulhypothese (H0): geen verschil, beide groepen zijn gelijk
Alternatieve hypothese (Ha): wel verschil, beide groepen zijn niet gelijk
,Type I fout: H0 verwerpen maar dit klopt niet (bijv. onschuldig maar je zit wel in de
gevangenis)
Type II fout: Ha is waar, maar H0 verwerp je niet (bijv. schuldig maar je komt niet in de
gevangenis)
Steekproeven
Je trekt een steekproef door te randomiseren, hierdoor krijg je twee gelijke groepen
Steekproef verdeling: welke waarden zijn aannemelijk (dichtbij het midden) en welke
onaannemelijk (ver van het midden)
P-waarden
Bij een kleine p-waarde (doorgaans < 0.05) is er sterk bewijs dat de nulhypothese onjuist is
en wordt de nulhypothese doorgaans verworpen
Bij grotere p-waarde (> 0.05) is de bewijskracht tegen de nulhypothese zwak en wordt de
nulhypothese aangenomen
Een p-waarde dichtbij de grens (0.05) wordt marginaal genoemd, zodat er ook geen duidelijk
oordeel voor of tegen de nulhypothesen kan worden geveld
Als de standaarddeviatie niet bekend is dan gebruik je de one sample t-test, independent
sample t-test of de paired sample t-test
Als de standaarddeviatie wel bekend is gebruik je de z test
,Hoorcollege 2
H0: geen verschil tussen de groepen. Het gemiddelde is gelijk aan 0. Het is een
symmetrische verdeling
Welke verdeling gebruiken we voor het toetsen van een hypothese?
➢ De verdeling van streekproefgemiddelden
Een streekproefverdeling is dat je nagaat wat er zou gebeuren als je de steekproef keer op
keer zou trekken, wat is dan de verdeling van de resultaten
Voorbeeld: Hoeveel zal het streekproefgemiddelde variëren als we veel steekproeven van 16
mensen nemen?
Je kijkt naar de verdeling van steekproeven en dan het gemiddelde, niet naar de individuen.
Als je een setje van 16 mensen samenvat in 1 waarde, heb je veel meer informatie dan van
1 individu.
Als je 16 waardes gemiddeld neem, dan heb je veel minder spreiding/variabiliteit dan als je
individuen vergelijkt, omdat je dan dichterbij het populatiegemiddelde zit.
Met een grote sample size heb je dus meer zekerheid over wat je aan het testen bent
Het interval van 10 punten onder tot 10 punten boven het steekproefgemiddelde zal in 95%
van alle steekproeven van grootte 16 ‘vangen’
Proportie
Een proportie is het aantal successen / totaal aantal die je hebt in je steekproef
1.28 voor 80% betrouwbaarheidsinterval
1.645 voor 90% betrouwbaarheidsinterval
Het aantal successen en niet-successen moet in de steekproef beide minimaal 10 zijn voor
een betrouwbaarheidsinterval voor proportie.
Wat doe je als je dit niet hebt? De plus-vier methode, je voegt dan 2 successen en 2 niet-
successen toe.
Gebruik de significatie toets voor proportie alleen als de verwachte aantallen van successen
en niet-successen beide minimaal gelijk zijn aan 10 (normal)
Er moet ook een random steekproef gedaan zijn.
Significante toets voor vergelijken van twee proporties
- Je berekent de z-statistiek met een gepoolde proportie
- De data moet random zijn, willekeurig getrokken
- Normal; successen en niet-successen moeten minstens 5 zijn (want de groepen zijn
nu samen)
- Independent
Relatieve risico
Een relatief risico van 1 betekent dat twee proporties aan elkaar gelijk zijn. Je vergelijkt dus
twee proporties met elkaar
, Hoorcollege 3
Categorische variabelen
Chi-kwadraat
- Chi-kwadraat voor onafhankelijkheid
Bij frequenties op twee variabelen
Vertelt ons over relatie tussen twee nominale variabelen
- Chi-kwadraat test voor goodness of fit
Bij frequenties op maar één variabele
Vertelt ons hoe goed onze aantallen passen bij ‘idee’
Afhankelijke en onafhankelijke variabele zijn kwalitatief
Marginale verdeling
De verdeling die je hebt op één variabele waarbij je de andere
variabele buiten beeld laat
Bijv. de kans dat iemand rijk wordt, maar ik kijk niet naar het
verschil tussen man en vrouw
Dus je doet het totaal van de rij / gehele totaal
Conditionele verdeling
De verdeling conditioneel maken op een andere variabele, om de
relatie te bekijken
Bijv. de verdeling van de kans dat je rijk bent, conditioneel op je
geslacht
Dus je doet de variabele van man / totaal man
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller alysiadejong. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.90. You're not tied to anything after your purchase.