Aantekeningen SPSS hoorcollege
Extra cursus 1
Afhankelijke variabele = Y, moet een mate van spreiding hebben
Onafhankelijke variabele = X
Wat je doet met SPSS is een model opstellen om deze spreiding weg te nemen.
Beschrijvende statistiek → gaat altijd over een populatie
Verklarende statistiek → steekproef onzekerheid omdat je niet de hele populatie hebt.
Kwalitatieve gegevens:
- Nominaal → man/vrouw, nationaliteit
- Ordinaal → opleidingsniveau, rangorde bij defensie, er is sprake van een rangorde
maar geen gelijke afstand.
Kwantitatieve gegevens:
- Interval →IQ, temperatuur, rangorde, afstand gelijk.
- Ratio → inkomen, leeftijd, een betekenisvol middelpunt.
Eigenschappen kwantitatieve data
1. Centrale tendentie → zich richten rond een bepaald punt
2. Variantie → spreiding
3. Vorm
Begrippen:
1. Gemiddelde
2. Mediaan → middelste getal (geordend)
3. Modus → komt het vaakste voor
1. Bereik → hoogste – laagste score (geordend)
2. Kwartielafstand → middelste 50%, Q3 -Q1
3. Variantie → geeft de mate van spreiding weer
4. Standaarddeviatie → wortel van de variantie
1. Scheefheid (ook wel scenes)
• Linkschreef → staat de bolling aan de rechter kant van het gemiddelde.
• Rechtsschreef → staat de bolling aan de linker kant van het gemiddelde.
2. Spitsheid
• Bij een grote spitsheid is er weinig spreiding
• Bij een platte verdeling is er heel veel spreiding
Wanneer de verdeling symmetrisch is → G=M=M, gemiddelde, modus en mediaan zijn
gelijk.
Deviatie van het gemiddelde, afstand tot het gemiddelde (van individuele scores).
Deviatie van het gemiddelde ^2 alles bij elkaar optellen = variantie
S2 is variantie.
,Z-score → X- /
Bij de Z-score wordt er gekeken hoeveel standaarddeviaties een waarde zich van het
gemiddelde bevindt.
Iedere statistische schatting vanuit een steekproef naar een populatie gaat gepaard met een
bepaalde mate van onzekerheid.
Deze onzekerheid drukken we uit in de vorm van een bepaalde mate van betrouwbaarheid.
Om iets te kunnen zeggen over de betrouwbaarheid van onze statistische schattingen,
moeten we iets weten over de waarschijnlijkheid van een bepaalde uitkomst.
Om iets te kunnen zeggen over de waarschijnlijkheid van bepaalde uitkomsten, moeten we
iets weten over de kans op deze uitkomsten.
,Extra cursus 2
Bij verklarende statistiek kijkt men naar de mogelijkheden om uitspraken te doen over een
populatie.
Standaardfout (Standard error SE) → statistische maat voor het bepalen van de kwaliteit.
Standaarddeviatie van de steekproefverdeling → is Standaardfout.
Als de steekproefgroot genoeg is (n > 30), dan zal de steekproevenverdeling van ͞x normaal
verdeeld zijn met de volgende twee eigenschappen
• 𝜇𝑥 = μ
𝜎 𝑠
• 𝜎𝑥 = 𝑛 = 𝑛
√ √
Dit is de centrale limietstelling.
De standaarddeviatie van de steekproevenverdeling 𝜎𝑥 noemen we de standaardfout (=
standard error SE)
Hoe lager de SE hoe beter.
De toegestane mate van onzekerheid druk je uit in α (alfa):
90% zekerheid = 10% onzekerheid = α .10
95% zekerheid = 5% onzekerheid = α .05
99% zekerheid = 1% onzekerheid = α .01
Schattingen bij kleine steekproeven (n < 30)
• Centrale limietstelling garandeert niet meer dat:
Steekproevenverdeling normaal verdeeld is
𝜎 𝑠
=
√𝑛 √𝑛
❖ Omdat de steekproef kleiner is dan 30 wordt er gebruik gemaakt van de t-
verdeling in plaats van de z verdeling. De correctie wordt uitgedrukt in het aantal
vrijheidsgraden (weergegevens als df) n-1.
Toetsende statistiek:
• T-toetsen →Verschillen tussen twee groepen
• Variatieanalyse →Toetsen in experimenten
• Verdelingsvrije statistiek →Analyse van categorische data
• Regressieanalyse →Enkelvoudige lineaire regressie
→Multipele lineaire regressie
Toetsen van een statistisch model:
• signal/noise
• effect/error
• Systematische/onsystematische variantie
, Stappen plan:
1. Nulhypothese: H0
Representeert de status-quo (vorig onderzoek)
Heeft altijd gelijkheidsteken: =
Specificatie: H0: m, p, σ = een getal
2. Alternatieve hypothese: HA
Representeert de veronderstelling die de onderzoeker heeft (en wil bewijzen)
Heeft altijd ongelijkheidsteken: ¹, <, of >
Specificatie: Ha: m, p, σ < een getal
3. Kies
4. Kies n
5. Kies toets
6. Bepaal de kritieke waarden
7. Bereken de toets waarden
8. Trek statistische conclusie
9. Verwoord de conclusie
Voorbeeld éénzijdig toetsen: