Discovering statistics using IBM SPSS statistics – Andy Field
Samenvatting van Rianne Weijts – Erasmus Universiteit Rotterdam
CHAPTER 2: THE SPINE OF STATISTICS
De meeste statistische modellen zijn een variatie op het idee van het voorspellen van een uitkomst van
één of meer voorspellende variabelen. Verder hebben de meeste statische modellen een aantal dingen
gemeen en als je dat begrijpt ben je al een heel eind, de SPINE van statistiek.
S: standaard error
P: parameters
I: Interval estimates (betrouwbaarheids interval)
N: Null hypothesis significance tests
E: Estimation (schatting)
2.3 Statistical Models
Wetenschappers gebruiken over het algemeen een lineair model, een model gebaseerd op een rechte
lijn. Het statistische model zou de verzamelde data zo goed mogelijk moeten representeren. De mate
waarin een statistisch model de data representeert wordt ook wel de fit van het model genoemd.
In principe zijn alle statistische modellen terug te brengen tot één
simpele vergelijking. Deze vergelijking houdt in dat de data die
we observeren voorspelt kan worden door het model dat we kiezen plus een bepaalde hoeveelheid
error. De kleine i refereert aan de i’de score. Het betekent dat de waarde van de uitkomst en de error
verschillend zullen zijn voor elke persoon. We voorspellen een uitkomst variabele vanuit een model,
maar zullen dit niet perfect doen dus we voegen ook wat error toe.
Een populatie kan heel breed zijn (alle mensen) of heel specifiek (alle mannelijke roodharige katten
die Bob heten). Over het algemeen kijken wetenschappers vaak naar algemene populaties. Omdat we
vaak niet iedereen in een populatie kunnen ondervragen verzamelen we data uit een deel van de
populatie, we nemen dus een sample. Dit gebruiken we vervolgens om conclusies te trekken over de
populatie in zijn geheel.
2.5 P is for Parameters
Parameters zijn niet iets wat ‘gemeten’ wordt, in tegenstelling tot variabelen, het zijn constructen
waarvan gedacht wordt dat een fundamentele waarheid beschrijven over de relaties tussen variabelen
in een model. Voorbeelden van parameters zijn de gemiddeldes (mean en mediaan), en de correlatie en
regressie coëfficiënten. Verschillende parameters krijgen vaak verschillende
namen en symbolen (X, r, b), maar het is veel simpeler om voor de
parameter altijd b te gebruiken. De onderdelen tussen de haakjes in de
vergelijking staan dus voor ‘het model’ oftewel het statistische model wat we toepassen.
We kunnen waarden van een uitkomstvariabele voorspellen op basis van een model. De vorm van het
model verandert, maar er zal altijd een fout in de voorspelling zijn en er zullen altijd parameters zijn
die ons vertellen over de shape of vorm van het model. We gebruiken de data uit het sample om de
parameters in de populatie in te schatten (parameter estimates).
, 2.5.1. The mean as a statistical model
Het gemiddelde is een hypothetische waarde, het is een model dat is
gecreëerd om de data samen te vatten en er zal altijd error zijn in deze
voorspelling. Wanneer je een vergelijking ziet met een hoedje → dan
betekent dit alleen dat dit estimates zijn die een schatting van de
populatie voorstellen.
2.5.2 Assessing the fit of a model: sums of squares and variance revisited
Het is belangrijk om te kijken hoe goed de fit van een statistisch model is, omdat we moeten weten
hoe representatief het is voor de populatie. De deviance (afwijking) is een ander woord voor error.
De error voor een specifieke entiteit is geobserveerde score – de voorspelde score.
Deze vergelijking laat zien dat we de sum of squares ook
kunnen gebruiken om de totale error in een model te bepalen.
Deze vergelijking laat zien hoe je de gemiddelde error in de
populatie kan berekenen. Hierbij gebruiken we degrees of
freedom (df), dat is het aantal scores dat is gebruikt om het
totaal te berekenen, gecorrigeerd voor het feit dat we proberen de populatiewaarde te schatten. De
mean squared error staat ook wel bekend als de variantie.
2.6 E is for estimating parameters
De vergelijking voor het gemiddelde is ontworpen om die parameter te schatten om de error te
minimaliseren. Met andere woorden, het is de waarde met de minste error. Dit betekent niet
noodzakelijkerwijs dat de waarde goed bij de gegevens past, maar het past beter dan elke andere
waarde die er mogelijk is gekozen. Hoewel de vergelijkingen voor het schatten van deze parameters
verschillen van die van het gemiddelde, zijn ze gebaseerd op dit principe van het minimaliseren van
errors: ze geven je de parameter met de minste error vanuit de data die je hebt. Dit betekent overigens
niet dat deze parameter accuraat, niet biased, of representatief is voor de populatie.
2.7 S is for standard error
Sampling variation of steekproef variatie betekent dat steekproeven variëren omdat ze verschillende
mensen uit de populatie bevatten. Een sampling distribution of steekproef distributie, is de frequentie
distributie van de steekproef gemiddelden uit dezelfde populatie. Deze distributie verteld ons iets over
hoe de steekproeven van de populatie zich gedragen en deze is gecentreerd rondom dezelfde waarde
als het gemiddelde van de populatie.
De standaarddeviatie van de steekproef gemiddelden is de standard error of the mean
(SE) of standard error. Als onze steekproef groot genoeg is (>30) kunnen we deze
vergelijking gebruiken om de standaard error te schatten. Een grote standaard error (SE) betekent dat
er veel variatie is tussen de gemiddelden van de verschillende steekproeven en het steekproef
gemiddelde is daarom wellicht niet representatief voor de populatie.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rvw999. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.