Samenvatting voor het vak Statistiek 3 van de bachelor Psychologie jaar 3 op de VU. Mocht je nog op- of aanmerkingen hebben hoor ik dat graag. Heel veel succes met leren!! Liefs Roos
Statistiek:
Definitie statistiek:
‘’De wetenschap van het verzamelen, organiseren en interpreteren numerieke feiten, welke
we data noemen’’.
- Deze definitie benadrukt dat statistiek een toepassende wetenschap is.
Belangrijke zaken die nodig zijn om statistiek toe te passen:
1. Het selecteren van een sample van een populatie.
2. Dan wil je controleren of je sample wel representatief is (en als dat niet zo is, welke
error er is).
3. Wanneer je de data hebt welke representatief is voor de populatie dan wil je twee
statistieken genereren:
o Beschrijvende statistieken.
§ Uitleggen wat het gemiddelde en de standaarddeviatie is en de range
etc.
§ Om de lezer een indruk te geven van hoe de data eruitziet.
o Inferentiële statistieken.
§ Hier wordt het wat moeilijker.
§ Hier ga je het hebben over de statistische significantie en type 1 en 2
fout etc.
4. Je moet je bewust zijn van de meetniveaus van de variabelen (NOIR) en van de typen
variabelen (categorisch/kwantitatief).
o Nominaal: niet geordende categorieën (oogkleur, gender).
o Ordinaal: geordende categorieën (niet mee eens/neutraal/mee eens).
o à Die zijn categorisch/kwalitatief.
o Interval: een
gelijke ruimte
tussen de waarden
(graden celsius).
o Ratio: gelijke
ruimte tussen de
waarde én een
nulpunt.
o à Die zijn numeriek/kwantitatief.
o Verschillende ranges:
§ Discreet: meetwaarden die onzichtbaar zijn (broers/zussen).
§ Continu: eindeloze deelbare meetwaarden (lengte).
5. Dan ga je de correcte statistische analyse kiezen.
6. Je moet ook begrijpen of de data het resultaat is van een experimenteel design of een
onderzoeksdesign. Dat is belangrijk om te begrijpen of de resultaten een causaal
verband kunnen hebben of niet.
Ø Statistiek 3 gaat voornamelijk over stap 5!
o Het plaatje op de volgende pagina geeft eigenlijk aan wat je wanneer moet
gebruiken.
, 2
Beschrijvende statistiek:
Er zijn drie dimensies die belangrijk zijn:
1. Centrale tendency = typische observatie.
o Central tendency waarden zijn: gemiddelde, modus, mediaan.
2. Dispersion = de variabiliteit in observaties.
o Dispersion waarden zijn: standaarddeviatie, variantie, interkwartiel range (=
verschil tussen de 25% observatie en 75% observatie geeft aan dat in die range
de middelste 50% zit van alle observaties).
3. Position = positie. De relatieve positie van de observaties.
o Geeft informatie over de relatieve posities van observaties: percentiel, kwartiel
etc.
Inferentiele statistiek:
Het doel is om betrouwbare en valide uitspraken te doen die generaliseerbaar zijn, gebaseerd
op een sample.
- We hopen dat het niet veel verschilt van de populatie. We weten de
populatieparameter niet, dat is waarom we beginnen met onderzoeken.
, 3
Problemen zijn:
- Sampling error: is het resultaat van natuurlijke steekproefvariatie.
o Je observeert maar een paar mensen van de populatie en dus kan het zo zijn dat
jouw steekproef een gemiddelde geeft wat een beetje boven of onder het
populatie gemiddelde ligt.
- Sampling bias: dat je alsnog een selectieve steekproef hebt waarvan je niet goed weet
of hij representatief is voor de populatie.
- Response bias: dat mensen in de steekproef soms anders antwoorden door
bijvoorbeeld sociaal wenselijkheid.
- Non-response bias: dat mensen soms bijvoorbeeld geen antwoord op de vraag geven.
Ø De oplossing hiervoor is een aselecte steekproef benadering van voldoende omvang
die de data van iedereen die wordt benaderd meeneemt (geen niet-respons bias), met
correcte antwoorden (geen response en niet-respons bias) op alle items voor alle
onderwerpen.
Dimensies van verdelingen:
Er zijn drie dimensies van verdelingen:
1. Populatie verdeling.
o Die weten we niet, anders dan hoeven we geen
onderzoek te doen.
o Bijvoorbeeld: de proportie studenten die
behoefte hebben aan extra ondersteuning voor
statistiek.
o à Niet normaal verdeeld (zie plaatje).
2. Steekproef data verdeling.
o Als je geïnteresseerd bent in die onderzoek
vraag, ga je data verzamelen: zeg n =1000
(1000 studenten).
o Je hoopt dan dat het aantal studenten die ‘ja’
antwoord, vergelijkbaar is met het aantal
mensen die in de echte populatie ‘ja’ zou
antwoorden.
o Dan is jouw steekproefgrootte hopelijk accuraat
en hetzelfde als de echte grootte van studenten
die er behoefte aan hebben in de populatie.
o à Niet normaal verdeeld (zie plaatje).
3. Steekproevenverdeling.
o Dit gaat over de verdeling van alle gemaakte
steekproeven die er gedaan worden.
o Als je de empirische studie telkens opnieuw
over zou doen (en de steekproef verdelingen
zou verzamelen) dan krijg je de normale
verdeling à.
o De standaarddeviatie van de
steekproevenverdeling is de standaardfout
(standard error).
o à Als je de steekproefgrootte groter maakt, dan krijg je een kleinere
standaardfout.
, 4
o à Als de steekproefgrootte maar groot genoeg is, dan wordt hij normaal
verdeeld.
De verschillende verdelingen en toetsen:
In een normale verdeling kunnen we zeggen dat:
- 68% van alle observaties bevinden zich binnen +/- één SD van het gemiddelde af.
- 95% van alle observaties bevinden zich binnen +/- twee SD’s van het gemiddelde af.
- Bijna 100% van alle observaties bevinden zich binnen +/- drie SD’s van het
gemiddelde af.
De normale verdeling (z-statistiek):
We gebruiken de standaard normale verdeling (z-
verdeling) wanneer we vragen hebben over proporties.
De z-score = hoeveel standaardfouten zit de waarde af
van het gemiddelde. Het ingekleurde stukje is dan het
percentage die zo veel van het gemiddelde zit.
- Er zit bijvoorbeeld maar 2.5% 1.96 standaardfouten af
van het gemiddelde. (Zie tabel in het geel!)
De T verdeling (t-statistiek):
Wanneer we te maken hebben met gemiddelden of met regressie coëfficiënten, of wanneer de
standaarddeviatie onbekend is. Zie volgende pagina!
De t-verdeling heeft een dikke staart en de z-verdeling een dunnere. Zie plaatje hierboven.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rooszeelen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.