Hoorcollege 1: statistiek 1 in vogelvlucht
Variabelen operationaliseren1 en meten
Variabelen kunnen … zijn
• Kwantitatief
o Numeriek
Ø Getallen
• Kwalitatief
o Categorisch
Ø Categorieën
• Continu
o Geleidelijk
Ø Kommagetallen
• Discreet
o Sprongsgewijs
Ø Gehele waarden
• Verschillende meetniveaus
o Nominaal
Ø Onderscheid
o Ordinaal
Ø Onderscheid, ordening
o Interval
Ø Onderscheid, ordening, gelijke verschillen
o Ratio
Ø Onderscheid, ordening, gelijke verschillen, verhoudngen blijven gelijk
• Onafhankelijk
o Verschillen in deze variabelen worden gezien als oorzaak van de verschillen in de
afhankelijke veriabele
• Afhankelijk
o Verschillen in deze variabelen worden gezien als gevolg van de verschillen in de
onafhankelijke veriabele
Twee voorwaarden voor meten
1. Betrouwbaarheid
o Hoe goed meet de test wat we willen meten?
2. Validiteit
o Meet de test wat we willen meten?
1
Variabelen meetbaar maken.
1
,Steekproeven
= het deel van de populatie dat wordt onderzocht, hierop doen we beroep wanneer de populatie te
groot is om helemaal te onderzoeken
• Belangrijk doel van de inductieve statistiek
o Verantwoorde uitspraken doen over de populatie aan de hand van een steekproef
o We willen wél uitspraken doen over de gehele populatie
Ø Dus de steekproef moet een goede afspiegeling zijn van de populatie
Onderzoek doen bij depressieve patiënten uit het UZA om uitspraken te doen over depressieven in
het algemeen. Goede steekproef?
Soorten steekproeven
Aselecte steekproeven
• Volledig aselecte steekproef
o Elk element van de populatie een gelijke kans geven om in de steekproef te worden
opgenomen
Ø Vb. uit de lijst van alle Vlaamse leerlingen SO randomgewijs 2000 leerlingen
selecteren om het gemiddelde IQ van Vlaamse leerlingen SO na te gaan
o Nadeel: niet altijd representatief
• Gestratificeerde steekproef
o De populatie wordt opgedeeld in deelpopulaties en uit elke deelpopulaite wordt er een
aselecte steekproef getrokken
Ø Vb. eerst percentages nagaan van ASO, TSO en BSO leerlingen, en daarna uit elke
deelpopulatie een aselecte steekproef trekken zodat de percentages in de
steekproef dezelfde zijn als in de populatie
o Voordeel: wel mogelijk om representativiteit te bereiken
Ø Als de steekproef goed wordt samengesteld
• Clustersteekproef
o Populatie verdelen in gelijkaardige clusters (subgroepen) en daarna aselecte steekproef
trekken uit deze clusters. Vervolgens binnen elke geselecteerde cluster een aselecte
steekproef trekken.
Ø Vb. de populatie leerlingen verdelen in clusters volgens provincie. Aselect 3
provincies trekken. Elke provincie verdelen in clusters volgens school en 4 scholen
aselect trekken. Ten slotte binnen elke geselecteerde school een aselecte
steekproef van 40 leerlingen trekken.
o Voordeel: spaart kosten en tijd
o Nadeel: minder nauwkeurig, minder representatief
Niet-aselecte steekproeven
= wanneer elk individu van de populatie niet evenveel kans heeft om getrokken te worden
• Sneeuwbalsteekproef
o Onderzoeker vertrekt van één respondent aan wie vervolgens gevraagd wordt andere
respondenten te contacteren
o Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
o Nadeel: kans is groot dat mensen sterk op elkaar lijken
2
, • Gelegenheidssteekproef
o Keuze van respondenten wordt overgelaten aan ondervrager (men kiest individuen die voor
het grijpen liggen)
Ø Namelijk mensen die men makkelijk kan vinden
§ Vb. eerste jaars studenten psychologie, mensen op straat…
o Voordeel: goedkoop, snel
o Nadeel: niet geschikt voor populatieschattingen
• Quotasteekproef
o Onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in de steekproef
Ø Vb. verdeling jongens/meisjes
o Onderzoeker zorgt ervoor dat hij aan dat aantal komt (= quotum)
Ø Hoe hij aan dat aantal komt is niet belangrijk
§ Vb. via gelegenheidssteekproef
Conclusie: niet-aselecte steekproeven zijn niet altijd geschikt voor inductieve statistiek!
Frequentieverdelingen2
Verschillende soorten frequenties
• Absolute frequentie
o Het aantal keren dat de waarde voorkomt
• Relatieve frequentie (%)
o De absolute frequentie gedeeld door het aantal respondenten
• Absolute cumulatieve frequentie
o Hoeveel observaties hoger of gelijk zijn aan een bepaalde waarde
• Cumulatieve proportie/percentages (%)
o Hoeveel procent van de proefpersonen eenzelfde of een lagere score behaalden
Verschillende visuele voorstellingen
• Taartdiagram (nominaal)
• Staafdiagram (nominaal of ordinaal)
• Stamdiagram/histogram/boxplot (interval)
Percentielscores: plaats van een score in het geheel, toont hoeveel procent van de deelnemers eenzelfde
of zwakkere score behaalde (= cummulatieve proportie)
Centrummaten
Modus
• Waarde die het meest voorkomt
o Elk meetniveau
Mediaan
• Middelste waarde bij gerangschikte waarnemingen (van laag naar hoog)
o Minimum ordinaal
o = percentiel 50
2
Eerste verkenning van de data.
3
, Gemiddelde
• Som van alle waarden gedeeld door aantal waarnemingen
o Minimum interval
• Bij een symmetrische verdeling
o Modus = mediaan = gemiddelde
Ø Mediaan minder gevoelig voor extreme waarden
Ø Gemiddelde consistenter over verschillende steekproeven
Spreidingsmaten
= tonen hoe ver scores uit elkaar liggen
Variatiebreedte
• Verschil tussen grootste en kleinste waarneming
Interkwartielafstand
• (P75 – P25)
o Hier bevind 50% van de (middelste)observaties zich
o Minimum ordinaal
Variantie
• De gemiddelde gekwadrateerde afwijkingsscore
Standaarddeviatie
• Wortel van de variantie
• Wortel uit de gekwadrateerde afwijkingen ten opzichte van het rekenkundig gemiddelde
Standaardscores (Z-scores)
• Geven aan hoeveel standaardafwijkingen een score van het gemiddelde ligt
• Brengt een verdeling tot een standaarddeviatie van 1 en een rekenkundig gemiddelde 0
De normale verdeling
•Geobserveerde gegevens die passen in theoretische verdeling (model) bieden meer
mogelijkheden voor verwerking
• Veelgebruikt model
o Geeft de kans op het voorkomen van een bepaalde waarde
• Normale verdelingen verschillen enkel in gemiddelde en standaarddeviatie
• De curve is altijd klokvormig en symmetrisch
Transformaties van verdelingen
Niet alle data zijn normaal verdeeld, en om makkelijk berekeningen te maken is het nuttig om een verdeling
te transformeren zodat ze de normale verdeling benadert.
Vormkenmerken van een verdeling
• Centrummaat (gemiddelde, mediaan, modus)
• Spreidingsmaat (standaard-deviatie)
• Kurtosis: gepiektheid (welving)
• Skewness: scheefheid
o Maar van afwijking van de symmetrie = 0
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Jennableyenberg. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.