Cases – Waar doe je onderzoek naar? Bijv. voetballers (dingen of personen)
Variabele – Hoe meet je dit? Bijv. leeftijd, gewicht, aantal doelpunten, haarkleur etc.
(kenmerken van iets of iemand.
Er zijn vier verschillende soorten variabelen:
- Categoriale variabelen
1. nominaal: nominale variabele bestaat uit verschillende categorieën die van elkaar
verschillen. Er is geen rangorde, bijvoorbeeld nationaliteit.
2. Ordinaal: Verschil tussen categorieën met rangorde. Bijvoorbeeld volgorde in een
competitie. Je weet de winnaar is en wie tweede is etc. Maar je weet niet de
verschillen tussen de categorieën (met hoeveel de eerste verschilt van de tweede
bijvoorbeeld)’
- Kwantitatieve variabelen, ook wel kardinaal of numeriek:
3. Interval: verschillende categorieën, een rangorde, maar ook vergelijkbare
intervallen tussen de categorieën. Bijvoorbeeld leeftijd.
4. Ratio: Vergelijkbaar met interval en heeft betekenisvolle nulpunt. Bijvoorbeeld
Lengte van iemand in centimeters. Hoogte van 0 cm betekent dat er geen hoogte
is, dat kan niet van leeftijd want leeftijd 0 betekent niet dat er geen leeftijd is en
is daarom interval.
1
, Module 1
Clip 1.1; Data beschrijven
o Tabellen
Datamatrix = een overzicht van alle cases en variabelen. Links staan de cases en bovenaan
de variabelen. De waardes die in de matrix staan zijn de observaties.
➔ Tabellen en grafieken worden gebruikt als samenvatting voor de data uit de datamatrix.
Frequentietabel; laat zien hoe de waarden van een variabele verdeeld zijn. Het is een lijst
met alle mogelijke waarden. De tabel bestaat uit frequenties (aantal blond haar, bruin etc.),
relatieve frequenties (percentage) en cumulatieve percentage (opsommingen van relatieve
percentage).
Haarkleur is een categorie waar makkelijk overzicht in te krijgen is. Bij kwantitatieve data
zoals gewicht (61.1, 67, 67.2, etc.) krijg je al gauw alsnog een lange matrix.
Hercoderen van een variabele – In het voorbeeld hierboven, gewicht indelen in verschillende
categorieën, spelers tussen 60-65 kg, 65-70 kg, etc. Hierbij wordt kwantitatieve data
hercodeert naar ordinale categorieën. Van ordinaal naar kwantitatief (de andere kant dus
op) kan niet.
o Grafieken
Categorie data -> nominaal
- Vanuit een frequentietabel een grafiek maken.
Een staafdiagram maken is voordelig wanneer het aantal categorieën in een variabele
toeneemt.
2
,Voordeel cirkel diagram: Direct overzicht hoeveel procent wat is. Bijvoorbeeld Europa
ongeveer 75%.
Voordeel barchart: Makkelijk om het exacte aantal uit te halen. Bijvoorbeeld Zuid amerika
iets meer dan 50 spelers.
Kwantitatieve data -> interval/ratio
Bijvoorbeeld de hoogte van voetbalspelers in centimenters, kan een puntplot worden
gebruikt.
Met meerdere observaties kan een histogram worden gebruikt. Een histogram heeft vaak
een klokvorm maar dit hoeft niet altijd het geval te zijn. De piek kan ook meer aan de linker
of rechterkant zitten.
Er zijn twee verschillende vormen van een
histogram: unimodaal (één piek) en bimodaal
(twee pieken).
Conclusie:
Als je nominale of odinale variabelen hebt → cirkel of staafdiagram
Inerval of ratio variabelen → histogram
3
, Clip 1.2; Maten van centraliteit
Naast het gebruik van grafieken voor het samenvattenn van data kan je ook het centrum van
je distributie beschrijven. Er zijn drie manieren hoe je dit kan doen:
1. Modus; de waarde die het meeste voorkomt. De modus is bijv. de categorie die het
meeste voorkomt, niet het percentage. Meerdere modussen is mogelijk.
2. Mediaan; de middelste waarde van de observatie wanneer ze van klein naar groot
zijn geordend. Zet eerst alle waarden van laag naar hoog. Oneven voorbeeld: 6 7 7 8
8 8 9 → 8 is mediaan. Even voorbeeld: 6 7 7 7 8 8 8 9 → gemiddelde van middelste
getallen: (7+8)/2 = 7,5
3. Gemiddelde (mean); som van alle waarden gedeeld door het aantal observaties.
Voorbeeld: 8+7+9+8+7+6+8 = 53 53/7 = 7,6
Formule voor het gemiddelde:
Wanneer gebruik je welke maat?
Dit is afhankelijk van het meetniveau van je variabele.
Wanneer een variabele nominaal is kan alleen modus worde gebruikt
want je kan ze niet op rangorde zetten of numerieke berekeningen doen
(dus geen mediaan en gemiddelde).
Bij een kwantitatieve variabele kan gemiddelde en mediaan worden
gebruikt. Bij scheve verdelingen en uitschieters (zoals een ouder persoon
van 80 bij een groep jongeren onder de 20) kan beter de mediaan
worden gebruikt degene van 80 een disproportionele invloed heefd op
het gemiddelde. (Zo’n persoon wordt ook wel een outlier genoemd, het
verschil met de andere is erg groot.
Clip 1.3; Maten van variatie
Bereik, interkwartielafstand en boxplot
Soms hebben we meer informatie nodig dan de maten van centrale tendens. We hebben
ook informatie nodig over variabiliteit of dispersie van de data. Twee soorten maten:
1. Het bereik
2. Interkwartielafstand
1. Bereik: verschil tussen de hoogste en laagste waarde. Voorbeeld percentage tattoo
op lichaam, zie hieronder:
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper alexthijssenn. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,49. Je zit daarna nergens aan vast.