Overzicht van alle onderwijsstof van beschrijvende statistiek zoals behandeld in de colleges (incl. voorbeelden, afbeeldingen, formules en stappenplannen).
Eindcijfer: 8,3 (enkel op basis van deze aantekeningen oefenmateriaal CANVAS)
1.1. Fundamentele begrippen
Populatie Het totaal waar je in Parameter De parameter van de populatie kun je bijna
geïnteresseerd bent. nooit in het geheel meten
Steekproef Een deel uit de populatie die Statistic Wordt gebruikt om iets te kunnen zeggen over
je wilt onderzoeken. de parameter. Samenvatting van de data (bijv.
een gemiddelde).
De verschillende statistiekvormen:
• Beschrijvende statistiek: Het beschrijven van een populatie/steekproef, waarbij het puur gaat om het
samenvatten van de data d.m.v. bijvoorbeeld het gemiddelde.
• Toetsende statistiek (inferentie): Gebruiken van statistics om iets te zeggen over de parameters.
Er bestaan verschillende soorten variabelen:
• Categorische variabelen: Variabelen die je kunt indelen in categorieën.
- Nominaal: Enkel de categorieën zijn relevant (bijv. sekse).
- Ordinaal: Categorieën hebben een bepaalde ordening (bijv. universiteit – HBO – MBO).
• Kwantitatieve variabelen: De waardes en cijfers hebben betekenis die representeer hoeveel je van een
variabele hebt. De waardes hebben een absolute betekenis.
- Discrete variabelen: Zijn bepaalde vaste waardes (bijv. 1,5 kind dat kan niet).
- Continue variabelen. Een continuüm met tussenwaarden die ook betekenis hebben (bijv. lengte). Er
bestaan oneindig veel mogelijkheden.
1.2. Beschrijvende statistiek op een categorische variabele
Weergave in de statistiek wordt gedaan door:
• Een grafische weergave.
• Centrummaten
• Spreidingsmaten.
Vb. Hoe goed kunnen Nederlandse peuters tellen voordat ze naar de basisschool gaan.
→ Variabele: Tellen van vijf blokjes.
→ Mogelijkheden: Correct en incorrect (categoriaal)
Centrummaat binnen de categorische variabele:
Modus: De categorie met de hoogste frequentie; die het vaakste voorkomt.
Modus
Stap 1: Beschrijven van een steekproef. De verkregen gegevens beschrijven, zonder wat te zeggen over
de populatie.
Stap 2: Een grafische weergave produceren (bijv. met SPSS).
• Cirkeldiagram
• Staafdiagram:
- Frequenties of percentages
- Staven staan los bij elkaar (omdat er geen continue schaal is).
- Er zijn geen tussenwaardes.
Staafdiagram met frequenties en percentages 1
, • Frequentietabel.
- Missing: Weergave van de gegevens die missen (bijv. door geen antwoord).
- Percent: Percentage op basis van de totale steekproef.
- Valid percent: Percentage waarbij “missing” is meegenomen.
De missing wordt in het artikel beschreven (bijv. dat er werd gestart met 52 en er 50
overbleven).
Frequentietabel met “”missing, percent en valid percent”
1.3. Beschrijvende statistiek op kwantitatieve variabele
Vb. Telvaardigheid meten door het aantal blokjes dat geteld moet worden numeriek te meten (dus 1 of 6
blokjes goed).
Hoe goed kunnen Nederlandse peuters tellen voordat zij naar de basisschool gaan?
→ Variabele: Het hoogst aantal getelde bokjes.
Als centrummaat werkt de modus niet goed bij kwalitatieve gegevens. Daarom gebruikt men:
• De mediaan: De data die verzameld is wordt geordend van klein naar groot (op volgorde). Dit
deel je vervolgens door twee. De mediaan refereert naar het midden van deze
gegevens.
Bijv. 2, 4, 6, 7, 8 de mediaan wordt 6.
Bij even getal rijen wordt een extra stap verricht doordat de twee middelste getallen
worden gedeeld door twee:
Bijv. 5, 6, 7, 8 de mediaan is 6,7 dus 6,5.
In lange cijferreeksen wordt de mediaan lastiger te bepalen (zie onderstaande tabel):
Bepaling mediaan
De bepaling kan dan op drie manieren worden gedaan:
1. Alle 50 waardes uitschrijven.
2. Cumulatieve gegevens bekijken (percentages opgeteld per waarde).
De regel is altijd: De mediaan correspondeert met 50% onder en 50% boven
de waarde.
Voorbeeld: Als 52% van de scores een 8 is of hoger dan ligt de mediaan op de 8
(niet helemaal exact, maar een indicatie).
3. Direct op vragen in SPSS.
2
,• Gemiddelde: Een representatieve manier om een maat weer te geven. Het gemiddelde maakt
gebruik van alle getallen in tegenstelling tot de mediaan die enkel het middelste
getal gebruikt (dit kan vertekeningen geven).
Het gemiddelde:
∑𝑛
𝑖=1 𝑥𝑖
𝑥̅ = 𝑛
Het gemiddelde bij een frequentieverdeling
∑𝑘
𝑖=1(∫ 𝑖 𝑥𝑖)
𝑥̅ = 𝑛
n = Steekproefomvang
k = Aantal waardes dat is gevonden.
i=1 = Alle individuele observaties (begonnen bij de eerste waarde).
X1 = De waarde voor de observatie.
∑ = De som (dus alle waarde moeten worden opgeteld).
∫ = Frequentie van de uitkomst x de waarde van de uitkomst
Het gemiddelde is dus het totaal aantal waardes keer de frequentie waarin deze
voorkomen, gedeeld door het totaal.
Mediaan versus gemiddelde
Er zijn een aantal momenten waarop men kiest voor een bepaalde centrummaat:
Bijv. Een reeks 1, 1, 1, 1, 10, 10, 10
o Mediaan: 1 (verkend beeld).
o Gemiddelde: 5 (betere score)
Er geldt:
• Perfecte klokvormige/symmetrische vorm: Gemiddelde en mediaan zouden hetzelfde moeten zijn.
Hierbij gebruikt men liever het gemiddelde.
Klokvorm
• Scheve vorm: De mediaan wordt het liefst gebruikt.
• Het gemiddelde ligt dan lager/hoger dan de mediaan
en wordt te veel omlaag/omhooggetrokken.
• De mediaan geeft de score 50% erboven en 50%
eronder weer.
Scheve verdeling (links en rechts scheef verdeeld)
3
, Het tekenen van normaalverdelingen kan handmatig, maar ook door een histogram te plotten.
Staafdiagrammen en cirkeldiagrammen zijn bij veel kwantitatieve gegevens niet representatief.
Vertekeningen bij cirkeldiagrammen en staafdiagrammen
Bij een histogram worden geen losse waardes gebruikt, maar een even groot aantal categorieën.
Vromen van een histogram Uitschieters op het gemiddelde
Let op: Soms kun je ook twee pieken hebben, maar probeert SPSS toch een klokvorm te tekenen. De
laatste piek wordt dan niet meegenomen en zal dus vertekenen als je het gemiddelde wilt
bereken.
→ De mediaan heeft minder last van dit fenomeen en is in dit geval dus beter te
gebruiken.
Stem-Leaf-Plot In de stam worden
tientallen
(honderdtallen e.d.)
weergegeven waarover
de data worden
geordend. Hierdoor
kan snel worden
Stem-leaf-plot
Dot-Plot
Dot-plot
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper nsangers. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,19. Je zit daarna nergens aan vast.