Het distilleren van enkele zeer informatieve, samenvattende getallen over variabelen
Beschrijvende ➔ Vb. gemiddelde, mediaan, standaardafwijking, etc…
statistiek Onderzoek bij een populatie en als alle eenheden waarover je uitspraak wil doen, deelnemen aan
het onderzoek
De opgetelde verschillen tussen wat je geobserveerd hebt en wat je kunt verwachten op basis van
Chikwadraat
toeval en dit deel je door de verwachte frequentie
Een toets om na te gaan of er een significant verschil is tussen twee of meer groepen op een
Chikwadraattoets
kenmerk dat op nominaal niveau gemeten werd.
Codeerschema of Je geeft daarin aan welk antwoord welke code krijgt
codeboek
Een lijn waarop waarden een aaneengesloten rij punten vormen: een continuüm (tussen 2 punten
Continue variabelen liggen altijd nog oneindig veel andere mogelijke waarden)
➔ Vb. lengte, leeftijd, intelligentie…
Kan slechts 2 waarden aannemen
Dichotoom
➔ Vb. man/vrouw
Kunnen alleen hele waarden aannemen
Discrete variabelen
➔ Vb. aantal auto’s die iemand bezit, aantal kinderen in een gezin…
Je toetst eenzijdig (one-tailed) wanneer je een hypothese of verwachting hebt geformuleerd
➔ Vb. theorie op grond waarvan je kunt verwachten dat de vrouwelijke werknemers intelligenter
Een- of tweezijdig
zijn, dan kun je eenzijdig toetsen
toetsen
➔ Heb je echter geen idee of er sprake is van een verschil en zeker niet van de richting van dat
verschil, dan toets je tweezijdig (two-tailed)
Exhaustief en Elke deelnemer moet geplaatst kunnen worden (exhaustief) en elke deelnemer kan slechts in één
mutueel exclusief categorie geplaatst worden (mutueel exclusief)
Frequentieverdeling Een overzicht van scores op een variabele
Gemiddelde (interval Sommering alle items gedeeld door het aantal items
en ratio niveau)
Is in de empirische wetenschap een stelling die (nog) niet bewezen is, en die dient als uitgangspunt
voor een experiment of voor een gerichte waarneming
Hypothese ➔ Vb. langdurige blootstelling aan stress kan leiden tot aantasting van de immuniteit tegen ziektes
➔ 0-hypothese: ‘er is geen verband tussen stress en immuniteit’ (proberen verwerpen!)
➔ Alternatieve hypothese: ‘langdurige blootstelling aan stress leidt tot aantasting van immuniteit’
Inductieve of Je wilt op grond van een steekproef algemene uitspraken doen over de populatie (en dus personen
inferentiële statistiek of zaken die niet betrokken zijn in je onderzoek)
Vaste meeteenheid
Interval ➔ Vb. temperatuur meet warmte-energie (is even groot tussen 34 en 35 als tussen 1 en 2
bijvoorbeeld)
Verschil is in een getal uit te drukken
Interval- en
Interval = geen nulpunt
rationiveau
Ratio = absoluut nulpunt
Kruistabel Frequentieverdeling van twee kenmerken tegelijk
Een overzicht (draaitabel) van de scores op een variabele X IN COMBINATIE met de scores op een
tweede variabele Y.
→ het is een gezamenlijke frequentieverdeling van twee kenmerken bij dezelfde personen gemeten
→ het is gebruikelijk om de onafhankelijke variabele (als daar sprake van is) in de kolommen te
Kruistabel
zetten en de afhankelijke in de rijen
Bijvoorbeeld: autobezit en geslacht (deze laatste is OV: je kunt niet van geslacht veranderen door te
veranderen van autobezit)
Bijvoorbeeld: leefsituatie en geslacht
Mediaan Middelste waarde wanneer je de scores ordent van laag naar hoog
Mediaan (ordinaal, Ordenen van waarnemingen van ‘weinig’ naar ‘veel’, van ‘dun’ naar ‘dik’ -> dan in welke categorie
interval en ratio valt de ‘middelste waarneming’?
niveau) ➔ Vb. leeftijdscategorie, schoenmaat…
Modus De score die het meest voorkomt in een reeks
Modus (nominaal, Waarde met het hoogst aantal waarnemingen
ordinaal, interval en ➔ Vb. 300 witte auto’s, 100 zwarte auto’s = modus = witte auto’s
ratio niveau)
Nominaal Er is alleen een verschil; je bent man of vrouw, je bent niet méér man of vrouw
meetniveau
1
, Een verdeling die heel wat kenmerken kunnen observeren waarbij dat we zien dat de meeste
waarnemingen zich dicht bij het gemiddelde bevinden, en hoe verder dat je van het gemiddelde
Normaalverdeling
afwijkt hoe minder waarnemingen die waarde zal hebben
➔ Vb. er zijn veel meer mensen die dichter bij de gemiddelde lichaamslengte zitten
Ompolen Alle scores ‘1’ krijgen de waarde ‘2’ en andersom
Ordinaal meetniveau Er is sprake van meer of minder, maar verschil is niet in een getal uit te drukken
Een getal tussen 0 en 1 (berekend a.d.h.v. de teststatistiek en het aantal vrijheidsgraden)
Hoe kleiner de p-waarde, hoe significanter het resultaat:
P-waarde
➔ P<0,001 is sterker significant dan p<0,05
➔ Alle waarden hoger zijn niet-significant: vb. p<0,08; p<0,24,…
Parameters van Modus, mediaan en gemiddelde
positie/centraliteit
Zegt iets meer over de spreiding van de cases op een variabele
o Nominaal niveau: uitspraken over spreiding vaak weinig zinvol
o Ordinaal niveau: tussen welke waarden ligt de centrale 50% waarnemingen
Parameters van o Interval en ratio:
spreiding o Variantie: gemiddelde afstand van de waarnemingen tot het gemiddelde
➔ Vb. je hebt 3 waarnemingen: waarden = 2, 3, 4, gemiddelde = 3 | 2 en 3 schelen 1 van elkaar, 3
en 4 schelen 1 van elkaar | Gemiddelde van die twee 1’s = 1 = variantie
o Standaardafwijking
Populatie Alle eenheden waarover je uitspraken wilt doen zijn in je onderzoek betrokken
Populatieonderzoek Zie beschrijvende statistiek
Absoluut nulpunt (vaste meeteenheid maar ook absoluut nulpunt = kan niet kleiner zijn dan 0, bv. -1
Ratio cm).
➔ Vb. lichaamslengte -> berekenen van verhoudingen mogelijk
Een verschil is significant als de kans dat je het geobserveerde verschil in de steekproef ook terug zou
Significant verschil
vinden in de populatie ook significant is (groot genoeg dus)
Geeft aan wat de kans is dat een gevonden verband/verschil in een steekproef (dus 2 variabelen) te
wijten is aan het toeval
Significantie ➔ We spreken dus over een significant verband wanneer de kans dat een gevonden relatie tussen
2 variabelen in een steekproef te wijten is aan toeval (en dus zich niet voordoet in de gehele
bevolking) minder dan 1 op 20 is: p<0,05
Splitsingsvariabele Variabele die je gebruikt als onderzoeker om je groep op te splitsen in categorieën
(onafhankelijke
variabele)
Standaarddeviatie De wortel uit de variantie (zie ‘variantie’)
Geeft aan in hoeverre het gevonden steekproefgemiddelde een betrouwbare schatting is van het
populatiegemiddelde
Standaardfout
(De standaardfout van een schatting geeft de precisie van die schatting weer. De standaardfout
wordt gebruikt om aan te geven hoe zeker je bent van een geschatte waarde)
‘Staal van de bevolking (van interesse)’
Representatief: als alle leden van die bevolking evenveel kans maken om in de steekproef terecht te
Steekproef
komen
Steekproefonderzoek Zie inductieve statistiek
System missing Wanneer een vraag niet van toepassing is op een respondent
values
User missing values De respondent heeft geen antwoord ingevuld terwijl de vraag wel op hem of haar van toepassing is
Is een eigenschap/kenmerk van de onderzoekseenheid (proefpersoon, huishouden, sova-groep,…)
Variabele Er kunnen verschillende waardes toegekend worden aan dit kenmerk
➔ het kenmerk varieert -> VARIABELE
Variantie Berekent hoeveel elk van de scores afwijkt van het gemiddelde
Maakt gebruik van kansrekening op basis van een steekproef. Op basis van een beperkt aantal
Verklarende gegevens wordt getracht om algemene uitspraken te formuleren over de gehele populatie
statistiek ➔ Vb. als de luchtdruk stijgt, stijgt dan ook de temperatuur?
➔ Vb. als we patiënten geneesmiddel X geven, verhogen dan ook hun overlevingskansen?
Met een ‘constante’ kan je geen variatie in een variabele verklaren
Verschil variabele en
➔ Vb. als je 100 kinderen hebt die allemaal 125cm groot zijn, kan je voor die groep de verschillen in
constante
lichaamsgewicht niet verklaren aan de hand van lichaamslengte.
Vrijheidsgraden Geeft de mate aan waarin scores kunnen variëren
2
,In de statistiek houdt het aantal vrijheidsgraden verband met het aantal onafhankelijke
waarnemingen waarmee een steekproefgrootheid wordt bepaald
Steekproefgrootheid: is een functie op de uitkomsten in een steekproef. Meestal, maar niet altijd,
een schatter van een populatieparameter zoals het gemiddelde of de variantie...
➔ Vb. de variantie is eigenlijk de gemiddelde afwijking van alle datapunten tot het gemiddelde
➔ Stel: We hebben 2 datapunten waarvan we de variantie berekenen: 2 en 4.
➔ Het gemiddelde daarvan is 3
➔ In dit voorbeeld hebben we eigenlijk 1 datapunt meer dan nodig is om de variantie te schatten.
Bij twee datapunten weten we namelijk dat als het eerste getal 1 punt boven het gemiddelde
ligt, dan moet(!) de andere 1 punt onder het gemiddelde liggen; dat is namelijk de aard van een
gemiddelde afwijking van het gemiddelde.
➔ Dus bij twee waarnemingen heb ik niet twee waarnemingen nodig om de variantie te
berekenen: de eerste waarneming volstaat.
➔ We hebben dus een 1 vrijheidsgraad
Het aantal vrijheidsgraden hangt dus af van het aantal waarnemingen en de parameter die moet
geschat worden: gemiddelde, variantie, correlatie…
3
, 1 HOE ANALYSEER IK MIJN DATA? .................................................................................................................................... 5
1.1 OM WAT VOOR SPECIFIEKE ONDERZOEKSVRAGEN GAAT HET IN MIJN ONDERZOEK ? ................................................................................. 5
1.2 WAT IS HET MEETNIVEAU VAN MIJN GEGEVENS?.............................................................................................................................. 5
1.3 GAAT HET OM EEN POPULATIE OF OM EEN STEEKPROEF ? ................................................................................................................... 5
1.4 UITZICHT EXCEL BESTAND ............................................................................................................................................................ 5
2 CODEERSCHEMA OF CODEBOEK MAKEN ........................................................................................................................ 6
2.1 HOE VOER IK MIJN GEGEVENS IN (DATAMATRIX)? ............................................................................................................................ 6
2.1.1 Codeboek ...................................................................................................................................................................... 6
2.1.2 Gegevens ...................................................................................................................................................................... 7
3 VERANDEREN VAN GEGEVENS....................................................................................................................................... 8
3.1 OMPOLEN ................................................................................................................................................................................ 8
3.1.1 Nieuwe kolommen voor het ompolen .......................................................................................................................... 8
3.2 DE FUNCTIE ALS: HERBEREKENING STARTEN ................................................................................................................................... 8
3.3 VARIABELE INDELEN IN KLASSEN.................................................................................................................................................... 9
4 HOE ANALYSEER IK MIJN GEGEVENS BIJ EEN FREQUENTIEONDERZOEKSVRAAG? ........................................................... 11
4.1 HET MAKEN VAN EEN FREQUENTIEVERDELING IN DE VORM VAN EEN TABEL ......................................................................................... 11
4.1.1 Frequentieverdeling bij een gering aantal waarden: draaitabel................................................................................ 12
4.1.2 Gecombineerde frequentieverdeling bij twee variabelen met beperkt aantal waarden: draaitabel: kruistabel ...... 13
4.1.3 Frequentieverdeling bij een groot aantal waarden: histogram ................................................................................. 14
4.2 HOE BEREKEN IK SAMENVATTENDE STATISTISCHE MATEN? ............................................................................................................... 15
4.2.1 Samenvattende statistische maten voor een populatie ............................................................................................. 15
4.2.1.1 Alternatief voor het gemiddelde ................................................................................................................................................ 15
4.2.1.2 Standaarddeviatie ....................................................................................................................................................................... 15
4.3 HOE GEEF IK DE FREQUENTIES GRAFISCH WEER? ............................................................................................................................ 16
4.3.1 Grafieken voor een variabele met beperkt aantal waarden (frequentietabel verkregen via draaifunctie)............... 16
4.3.1.1 Cirkeldiagram .............................................................................................................................................................................. 16
4.3.1.2 Staafdiagram ............................................................................................................................................................................... 16
4.3.2 Grafieken voor een variabele met veel waarden (of continue waarden) (frequentietabel verkregen via
histogramfunctie) ....................................................................................................................................................................... 17
5 HOE ANALYSEER IK MIJN GEGEVENS BIJ EEN VERSCHILONDERZOEKSVRAAG? ................................................................ 18
5.1 VERSCHIL BIJ EEN NOMINALE TEST- EN SPLITSINGSVARIABELE? .......................................................................................................... 18
5.1.1 Chikwadraat ............................................................................................................................................................... 19
5.1.2 Wanneer gebruik ik een kruistabel en wanneer een chikwadraat ............................................................................. 19
5.1.3 Hoe bereken ik de chikwadraat met Excel? ................................................................................................................ 19
5.1.3.1 Het berekenen van de chikwadraat en de bijhorende p-waarde............................................................................................... 21
5.1.4 Hoe lees ik de uitvoer van de chikwadraattoets? ....................................................................................................... 23
5.1.5 Hoe rapporteer ik over de uitvoer van de kruistabel en de chikwadraattoets? ......................................................... 23
5.2 VERSCHILVRAAG BIJ INTERVAL/RATIOTESTVARIABELE EN NOMINALE SPLITSINGSVARIABELE ..................................................................... 24
5.2.1 T-toets voor niet-gekoppelde steekproeven ............................................................................................................... 24
5.2.1.1 Wanneer gebruik ik een t-toets? ................................................................................................................................................ 25
5.2.1.2 Hoe voer ik een t-toets uit? ........................................................................................................................................................ 25
5.2.1.3 Stap 1: beschrijvende statistische maten opvragen voor mannen en vrouwen: ....................................................................... 25
5.2.1.4 Stap 2: t-toets toepassen om verschil tussen mannen en vrouwen te toetsen ......................................................................... 26
5.2.1.5 Hoe lees ik de uitvoer van een t-toets voor niet gekoppelde steekproeven? ........................................................................... 27
5.2.1.6 Hoe rapporteer ik over een t-toets? ........................................................................................................................................... 27
5.2.2 T-toets voor gekoppelde steekproeven (verschilvraag bij twee gepaarde steekproeven) ......................................... 27
5.2.2.1 Wanneer gebruik ik een t-toets? ................................................................................................................................................ 27
5.2.2.2 Hoe voer ik een t-toets voor gepaarde groepen uit? ................................................................................................................. 27
5.2.2.3 Hoe rapporteer ik over een t-toets voor gepaarde steekproeven? ........................................................................................... 28
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller freyaspillemaeckers. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.50. You're not tied to anything after your purchase.