Alle informatie over de inleiding van statistiek gegroepeerd en helder beschreven. Dit document helpt om de ingewikkelde informatie te structureren en begrijpen. Gebruik deze tijdens het doorwerken van de stof, of leer hem aan het einde voor het tentamen. Ik heb zelf een 9,2 gehaald en wist enkel d...
Samenvatting
Met statistiek wil je de samenhang van variabelen bestuderen. Wanneer je een manipulatie op één
van de variabel uitvoert (experimenteel design), voordat je hem meet, dan kun je causale uitspraken
doen. Wanneer je variabele bestudeert zonder manipulatie mag je nooit spreken van oorzaak-gevolg,
maar spreek je over samenhang.
De samenhang die je onderzoekt, wordt weergegeven in een vraag; onderzoeksvraag. De vermoedde
uitkomst (gebaseerd op theorie of andere onderzoeken) formuleer je in een hypothese. De
hypothese wordt visueel weergegeven in een conceptueel model. (Gebruik een dubbele pijl om aan
te geven dat de richting van het verband niet duidelijk is. Wanneer maar één richting mogelijk is door
bijvoorbeeld manipulatie of niet te beïnvloeden factoren, dan mag een enkele pijl worden gebruikt.)
De maat waarmee we de onderzochte samenhang vastleggen is effectmaat: een maat die een
verband meet en waarvan de uitkomst niet afhankelijke is van een schaal.
De grootte van het verband noemen we effectgrootte. Dit is als het ware het getal dat vergeleken
kan worden en waarmee vast kan worden gesteld of de gevonden samenhang sterk of niet sterk is.
De variabele die je onderzoekt kunnen categorische variabelen zijn of continue variabelen.
Categorische variabelen zijn onderverdeelt in dichotome variabelen (twee categorieën), nominale
variabelen (meerdere categorieën), ordinale variabelen (meerdere categorieën die een rangorde
hebben). De continue variabelen zijn onder te verdelen in interval variabele (de afstand tussen de
variabele is altijd even groot) en rationele variabelen (deze hebben een absoluut nulpunt).
De variabele die je bestudeert meet je altijd in een steekproef. Dit is, als het goed is, een
representatieve groep participanten uit de populatie waarover je een uitspraak wil doen. Wanneer
dit niet is er sprake van een steekproeffout. De steekproef geeft uitkomsten, maar je kunt nooit
stellen dat deze exact overeenkomen met de populatie. De populatie is namelijk te groot om exact te
meten. De gegevens uit te streekproef zijn dus een indicatie en daarom wil je weten hoe groot de
kans is dat de populatie overeenkomst met de steekproefgegevens.
Een steekproef kun je zien als gekozen groepje mensen uit alle mogelijk mensen en bij zo’n
steekproef hoort een steekproef waarde. De steekproef zou ook een willekeurige anders gekozen
groep kunnen zijn en dus ook een andere steekproefwaarde. Alle mogelijke groepssamenstellingen/
steekproefwaarden vormen een steekproevenverdeling. Een steekproef behoort dus altijd tot zo’n
verdeling.
Om na te gaan in welk opzicht de steekproefwaarde (puntschatting) zich verhoudt tot de populatie
wordt een betrouwbaarheidsinterval opgesteld. Het geeft een indruk van hoe de werkelijkheid in
elkaar zal steken. Je kunt dan met een vooraf bepaalde kans (betrouwbaarheid) stellen dat het
populatie in het berekende gebied (interval) valt rondom de puntschatting. Het
betrouwbaarheidsinterval wordt berekend door de breedte-index te vermenigvuldigen met de
standaardfout en dit van de steekproefwaarde af te halen (linker grenswaarde) en erbij op te tellen
(rechter grenswaarde). De breedte-index hangt af van de te bereken maat en de beoogde
betrouwbaarheid. De standaardfout verkrijg je door de standaarddeviatie van de populatie te delen
door de wortel van de steekproefgrootte.
Wanneer er in de populatie geen verband is, zou de samenhangsmaat nul moeten zijn; de
nulhypothese. Gegevens worden altijd vergeleken met dit uiterste geval, om in te schatten of de
maat die gevonden is per toeval is gevonden en het afwijken van nul dus een steekproeffout is;
nulhypothesetoetsing. De kans dat de puntschatting tot de nulhypothese zou horen wordt
, uitgedrukt in een p-waarde. Wanneer deze waarde klein is, is de kans dus groot dat verband in de
populatie groter is dan nul en is samenhang aannemelijk. Om te definiëren wat klein is, wordt een
alpha-waarde opgesteld; de grenswaarde. Alpha duidt de kans aan dat je de nulhypothese verwerpt
terwijl deze eigenlijk juist was. Als de p-waarde kleiner is dan de alpha-waarde, dan wordt er
gesproken van een significante p-waarde.
Bij het verwerpen of behouden van de nulhypothese bestaat de kans dat dit niet juist was. Bij het
onterecht verwerpen spreken we van een type-1 fout. Bij het onterecht behouden spreken we van
een type-2 fout. Het deel van de steekproefverdeling, dat bij verwerping van de nulhypothese, ook
daadwerkelijk een verband aantoonde, wordt de power genoemd.
Eén variabelen onderzoeken: beschrijvingsmaten
Als je benieuwd bent naar een middelpunt in de data, dan bestudeer je de centrummaten.
Gemiddelde: alle uitkomsten bij elkaar, gedeeld door het aantal uitkomsten
Mediaan: het absolute middelpunt van de datareeks.
Modus: welke uitkomst komt het vaakste voor.
Als je benieuwd bent hoe de data is verdeeld, dan bekijk je de spreidingsmaten.
Range: van waar tot waar lopen de uitkomsten.
Interkwartielafstand: van waar tot waar loopt de middelste 50% van de data.
Variatie: de totale som van de afwijkingen van het gemiddelden. Je rekent hier met gekwadrateerde
afwijkingen, zodat negatieve waardes ook zorgen voor een toename in totale afwijking.
Variantie: de variantie gedeeld door de vrijheidsgraden (totaal aantal waardes – 1).
Standaarddeviatie: de wortel van de variantie; de gemiddelde afwijking van het gemiddelde.
Frequentieverdeling: geeft het aantal datapunten per meetwaarde aan.
Als je wil zien hoe de data is verdeeld, dan kijk je naar verdelingsvormen.
Histogram: visualisatie van de frequentieverdeling; aantal datapunten per meetwaarde.
Plot/grafiek: elke punt correspondeert met de waarde op de x- en y-variabele. Wanneer er
datapunten zijn met exact dezelfde waarden dan vergroot de aanduiding in het plot.
Boxplot: de kwantielen worden gevisualiseerd. Belangrijk om uitschieters te bestuderen.
Als je wil weten hoe de data is verdeeld, dan bereken je de verdelingsmaten.
Modaliteit: hoeveel pieken zijn er in de verdeling?
Skewness: is de verdeling is symmetrisch?
Linksscheef: rechts meer data (- getal)
Rechtsscheef: links meer data (+ getal)
Kurtosis: hoe spits is de verdeling.
Spits: een + waarde
Plat: een - waarde
Data die perfect normaal verdeeld is, met alle verdelingsmaten op nul, is een normaalverdeling.
Wanneer we deze schaal onafhankelijk willen maken, moeten we deze standaardiseren; een
standaard-normaalverdeling. Dit doen we middels een z-transformatie, met z-waardes, waardoor
het ook een z-verdeling wordt genoemd.
De breedte-index bij de normaalverdeling staat vast:
1 standaarddeviatie/-fout voor 68%
2 standaarddeviaties/-fout voor 95%
3 standaarddeviaties/-fout voor 99.7%
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper NienkevDongen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.