Blok 5
Kennisclip
Boxplots
Mediaan
Procedure: zet waarnemingen van laag naar hoog → middelste waarde is de mediaan
- Bij even aantal getallen 2 middelste getallen, de mediaan is dan het gemiddelde
Kwartielen
De mediaan verdeelt de dataset in twee gelijke helften. (bij oneven aantal gegevens doet de
mediaan niet mee)
- Gegevens 1 t/m 10
- Gegevens 11 t/m 20
Van beide helften bepaal je de mediaan op dezelfde wijze
● Zo worden de kwartielen berekend
○ 1e kwartiel, ofwel Q1
○ 2e kwartiel, ofwel M(ediaan)
○ 3e kwartiel, ofwel Q3
● 1e kwartiel = 25% - percentiel:
○ 25% van de waarnemingen heeft een waarde < Q1
● 3e kwartiel = 75% percentiel:
○ 75% van de waarnemingen heeft een waarde < Q3
● x% - percentiel
○ x% van de waarnemingen heeft een waarde < x% - percentiel
○ Vaak strookt n niet met het gezochte percentiel
○ Computer interpoleert en geeft de waarde
5 number summary
De vijf getallen die de onderzoeksgegevens samenvatten
- Min: 53 (0% percentiel)
- Q1: 75,5 (25% percentiel)
- M: 98,5 (50% percentiel)
- Q3: 126,5 (75% percentiel)
- Max: 218 (100% percentiel)
→ deze getallen kunnen worden gebruik voor een boxplot
Boxplot iets objectiever dan een histogram, want een boxplot komt dmv regels tot stand en
een histogram kies jezelf.
Hoorcollege beschrijvende statistiek
Meten → toekennen waarde (of label) van een ‘variabele’ aan een ‘subject’ (of
individu/proefpersoon)
- Een variabele is
- een kenmerk van een individu
- dat verschillende waarden kan hebben bij verschillende individuen
Metingen weerspiegelen relaties
, - Relaties tussen individuen zijn weerspiegeld in relaties tussen waarden
- Meten objectiveert waarnemen
Meten doen we objectief (maakt niet uit wie de metingen doet, er komen dezelfde resultaten
uit) → daarom vindt ‘wetenschappelijk’ meten altijd via protocollen plaats
- Protocol vind je terug in Materiaal en Methode Sectie
Diversiteit in variabelen
- Er zijn verschillende typen variabelen
- Belangrijk voor:
- wat de variabele voorsteld
- hoe je de metingen eraan weergeeft
- welke (wiskundige) bewerking betekenis heeft
Categoriale variabelen
- Categoriaal (kwalitatief)
- Als individuen in (natuurlijke) categorieën in te delen zijn
- Zijn de categorieën geordend?
- Nee: variabele is nominaal
➢ bloedgroep
➢ oogkleur
- Ja: variabele is ordinaal (oplopend van laag naar hoog)
➢ kledingmaat: XXS - XS - S - M - L - XL - XXL - XXXL
➢ sociaal economische posities
- Speciaal geval van nominaal: dichotoom
- Geslacht: man of vrouw
- Scholing: universitair of niet
Kwantitatieve variabele
Met kwantitatieve variabele kun je rekenen, ze hebben een eenheid.
- Als nulpunt gekozen is dan zijn verhoudingen niet betekenisvol
➢ Bv. 10 graden is niet tien keer zoveel als 1 graden
1. Discreet - aftelbaar, gaat over aantallen, bv. aantal scrubben slang. Kan geen
tussenwaardes aannemen.
2. Continu - onaftelbaar, bv lengte, concentraties in het bloed. Kan alle waardes
aannemen.
→ Aan continu waarde meten we discreet, we kiezen zelf hoe groot de stapjes zijn
Continue variabelen kun je niet exact meten, het aantal cijfers weerspiegelt de precisie.
- 96 cm
- 96,2 cm
“Meten is weten”
Veronderstellingen:
- Je ‘weet’ wat je wilt meten
- Je hebt beschikking over een ideaal meetinstrument
- De betekenis van de meting mag niet multi-interpretabel zijn
, Ofwel meten is niet weten, tenzij je precies weet wat je meet
Voorafgaand aan analyseren
Onderzoek aan variabelen gaat vooraf aan onderzoek aan relaties tussen variabelen.
Doel:
- Kritische keuze tav analyseplan
- Beslissingen over ‘foute’ meetwaarden
Dit doen we door:
- Verdeling van variabelen te evalueren
- Gegevens samen te vatten - werkgroep vandaag
● Taartdiagram
● Staafdiagram (ordening alfabetisch, afnemend belang)
● Stem & leaf plot
○ Knip getal op in stem en leaf
○ Maak kolom van alle stem-waarden
○ Plaats leaf-waarden achter hun eigen stem, in numerieke volgorde
● Histogram
○ Deel waarden in klassen in
○ Deling arbitrair (willekeurig, zelf kiezen) → dat maakt een histogram
illustratief
Scheef rechtse verdeling → omdat de uitschieters aan de rechterkant zitten.
Het centrum van de gegevens
Gemiddelde:
→ wiskundig bruikbaar - veel statistiek gaat over gemiddelden