Samenvatting voor het vak Statistiek 3 van de bachelor Psychologie jaar 3 op de VU. Mocht je nog op- of aanmerkingen hebben hoor ik dat graag. Heel veel succes met leren!! Liefs Roos
Topicwise Past Exam & Quiz Questions with detailed explanations and lecture summary for the topics "Moderation, Path Analysis, Binary Logistics Regression"
Topicwise Past Exam & Quiz Questions with detailed explanations and lecture summary for the topics "Adding a Third variable, Multiple regression with 2 predictors, Multiple regression with multiple pr...
How to pass CAT with an 8
All for this textbook (4)
Written for
Vrije Universiteit Amsterdam (VU)
Psychologie
Statistiek 3 (P_BSTAT3KL)
All documents for this subject (17)
Seller
Follow
rooszeelen
Reviews received
Content preview
1
Statistiek 3
Hoorcollege 1 - Terugblik
Statistiek:
Definitie statistiek:
‘’De wetenschap van het verzamelen, organiseren en interpreteren numerieke feiten, welke
we data noemen’’.
- Deze definitie benadrukt dat statistiek een toepassende wetenschap is.
Belangrijke zaken die nodig zijn om statistiek toe te passen:
1. Het selecteren van een sample van een populatie.
2. Dan wil je controleren of je sample wel representatief is (en als dat niet zo is, welke
error er is).
3. Wanneer je de data hebt welke representatief is voor de populatie dan wil je twee
statistieken genereren:
o Beschrijvende statistieken.
§ Uitleggen wat het gemiddelde en de standaarddeviatie is en de range
etc.
§ Om de lezer een indruk te geven van hoe de data eruitziet.
o Inferentiële statistieken.
§ Hier wordt het wat moeilijker.
§ Hier ga je het hebben over de statistische significantie en type 1 en 2
fout etc.
4. Je moet je bewust zijn van de meetniveaus van de variabelen (NOIR) en van de typen
variabelen (categorisch/kwantitatief).
o Nominaal: niet geordende categorieën (oogkleur, gender).
o Ordinaal: geordende categorieën (niet mee eens/neutraal/mee eens).
o à Die zijn categorisch/kwalitatief.
o Interval: een
gelijke ruimte
tussen de waarden
(graden celsius).
o Ratio: gelijke
ruimte tussen de
waarde én een
nulpunt.
o à Die zijn numeriek/kwantitatief.
o Verschillende ranges:
§ Discreet: meetwaarden die onzichtbaar zijn (broers/zussen).
§ Continu: eindeloze deelbare meetwaarden (lengte).
5. Dan ga je de correcte statistische analyse kiezen.
6. Je moet ook begrijpen of de data het resultaat is van een experimenteel design of een
onderzoeksdesign. Dat is belangrijk om te begrijpen of de resultaten een causaal
verband kunnen hebben of niet.
Ø Statistiek 3 gaat voornamelijk over stap 5!
o Het plaatje op de volgende pagina geeft eigenlijk aan wat je wanneer moet
gebruiken.
, 2
Beschrijvende statistiek:
Er zijn drie dimensies die belangrijk zijn:
1. Centrale tendency = typische observatie.
o Central tendency waarden zijn: gemiddelde, modus, mediaan.
2. Dispersion = de variabiliteit in observaties.
o Dispersion waarden zijn: standaarddeviatie, variantie, interkwartiel range (=
verschil tussen de 25% observatie en 75% observatie geeft aan dat in die range
de middelste 50% zit van alle observaties).
3. Position = positie. De relatieve positie van de observaties.
o Geeft informatie over de relatieve posities van observaties: percentiel, kwartiel
etc.
Inferentiele statistiek:
Het doel is om betrouwbare en valide uitspraken te doen die generaliseerbaar zijn, gebaseerd
op een sample.
- We hopen dat het niet veel verschilt van de populatie. We weten de
populatieparameter niet, dat is waarom we beginnen met onderzoeken.
, 3
Problemen zijn:
- Sampling error: is het resultaat van natuurlijke steekproefvariatie.
o Je observeert maar een paar mensen van de populatie en dus kan het zo zijn dat
jouw steekproef een gemiddelde geeft wat een beetje boven of onder het
populatie gemiddelde ligt.
- Sampling bias: dat je alsnog een selectieve steekproef hebt waarvan je niet goed weet
of hij representatief is voor de populatie.
- Response bias: dat mensen in de steekproef soms anders antwoorden door
bijvoorbeeld sociaal wenselijkheid.
- Non-response bias: dat mensen soms bijvoorbeeld geen antwoord op de vraag geven.
Ø De oplossing hiervoor is een aselecte steekproef benadering van voldoende omvang
die de data van iedereen die wordt benaderd meeneemt (geen niet-respons bias), met
correcte antwoorden (geen response en niet-respons bias) op alle items voor alle
onderwerpen.
Dimensies van verdelingen:
Er zijn drie dimensies van verdelingen:
1. Populatie verdeling.
o Die weten we niet, anders dan hoeven we geen
onderzoek te doen.
o Bijvoorbeeld: de proportie studenten die
behoefte hebben aan extra ondersteuning voor
statistiek.
o à Niet normaal verdeeld (zie plaatje).
2. Steekproef data verdeling.
o Als je geïnteresseerd bent in die onderzoek
vraag, ga je data verzamelen: zeg n =1000
(1000 studenten).
o Je hoopt dan dat het aantal studenten die ‘ja’
antwoord, vergelijkbaar is met het aantal
mensen die in de echte populatie ‘ja’ zou
antwoorden.
o Dan is jouw steekproefgrootte hopelijk accuraat
en hetzelfde als de echte grootte van studenten
die er behoefte aan hebben in de populatie.
o à Niet normaal verdeeld (zie plaatje).
3. Steekproevenverdeling.
o Dit gaat over de verdeling van alle gemaakte
steekproeven die er gedaan worden.
o Als je de empirische studie telkens opnieuw
over zou doen (en de steekproef verdelingen
zou verzamelen) dan krijg je de normale
verdeling à.
o De standaarddeviatie van de
steekproevenverdeling is de standaardfout
(standard error).
o à Als je de steekproefgrootte groter maakt, dan krijg je een kleinere
standaardfout.
, 4
o à Als de steekproefgrootte maar groot genoeg is, dan wordt hij normaal
verdeeld.
De verschillende verdelingen en toetsen:
In een normale verdeling kunnen we zeggen dat:
- 68% van alle observaties bevinden zich binnen +/- één SD van het gemiddelde af.
- 95% van alle observaties bevinden zich binnen +/- twee SD’s van het gemiddelde af.
- Bijna 100% van alle observaties bevinden zich binnen +/- drie SD’s van het
gemiddelde af.
De normale verdeling (z-statistiek):
We gebruiken de standaard normale verdeling (z-
verdeling) wanneer we vragen hebben over proporties.
De z-score = hoeveel standaardfouten zit de waarde af
van het gemiddelde. Het ingekleurde stukje is dan het
percentage die zo veel van het gemiddelde zit.
- Er zit bijvoorbeeld maar 2.5% 1.96 standaardfouten af
van het gemiddelde. (Zie tabel in het geel!)
De T verdeling (t-statistiek):
Wanneer we te maken hebben met gemiddelden of met regressie coëfficiënten, of wanneer de
standaarddeviatie onbekend is. Zie volgende pagina!
De t-verdeling heeft een dikke staart en de z-verdeling een dunnere. Zie plaatje hierboven.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rooszeelen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.92. You're not tied to anything after your purchase.