ONDERZOEKSMETHODOLOGIE EN
STATISTIEK 1:
H1: EEN TRAJECT VAN ZERO NAAR STATISTICAL HERO
STATISTIEK THEORIE OPBOUW:
DEEL 1 “Het ABC van de statistiek”
Slides hoorcollege
Handboek hfdst 2 t.e.m. 2.4.3: Wat is statistiek, meetniveau’s, variabelen
Extra: oefeningen “meetniveaus” op BB
DEEL 2 “tabellen en grafieken”
Slides hoorcollege
Handboek hfdst 2.4.1.- 2.4.3. en hfdst 7 (+ vrijblijvend: cursus voorgaande jaren)
Extra oefeningen op BB
DEEL 3 “numerieke maten van data”
Slides hoorcollege
Handboek hfdst 6 (+ vrijblijvend: cursus voorgaande jaren)
extra oefeningen op BB
DEEL 4 “Normaalverdeling en hypothesetoetsing”
Slides hoorcollege
Handboek hfdst 2.4.4. t.e.m. 2.6. en hfdst 8, 9, 10, 11 en 12 (+ vrijblijvend: cursus voorgaande jaren)
extra oefeningen op BB
,DEEL 1: HET ABC VAN DE STATISTIEK
WAT IS STATISTIEK?
wetenschap die toto doel heeft het verzamelen, verwerken en interpreteren van waarnemingsgegevens. In
het statistisch proces kunnen 3 stadia onderscheiden worden:
1. Verzamelende statistiek: informatie verzamelen (adhv tellingen, enquêtes, steekproeven, …)
eventuele opmaak tabellen of grafieken
2. Beschrijvende statistiek: eerste analyse van de waarnemingsgegevens. Tabellen, grafieken,
frequentieverdeling gegevens worden beschreven adhv typerende parameters. Je kan hier
gemiddelde, mediaan, … van berekenen.
met de gegevens die je verkregen hebt in de beschrijvende statistiek ga je een verklaring proberen
vormen in de verklarende statistiek
3. Verklarende statistiek: gebruikt steekproefgegevens voor het schatten, nemen van beslissingen en
voorspellen van grote populatie waaruit steekproef afkomstig is. Generalisatie met bepaalde
zekerheid (nooit 100%)
Verzamelende statistiek:
Je stelt een onderzoeksvraag op: bv. Hoeveel uren sport binnen de studenten kinesitherapie eerste bachelor?
Hoe vaak komt de uitkomst op een bepaald aantal uren sport weer?
de gegevens die je hebt verzamelt kan je dan als snel even neer zetten in een grafiek om een goed overzicht
te krijgen.
(balkjes plakken niet aan elkaar (staafdiagram), als dit wel zou zijn, is het
een histogram. We doen dit niet omdat de uren allemaal apart zijn, er zit
niets tussen deze getallen)
Beschrijvende statistiek:
Als we de gegevens uit de verzamelende statistiek in excel zetten krijgen
we nog meer informatie over de proef.
Verklarende statistiek:
(one sample test = je gaat een verschil in 1 steekproef met 1 waarde bekijken. Bv. 2 verschillende populaties
vergelijken met dezelfde test. )
Gemiddelde aantal uren sport per week voor eerste bachelor studenten belgië = 1.8 uur
,Bij de verklarende statistiek gaan we zien dat het aantal uren sport per wee tussen eerste bachelor
kinesitherapeutstudenten en eerste bachelor universiteitsstudenten van België significant verschilt. We gaan
door dit verschil adhv statistiek de waardes interpreteren en kijken hoe dit verschil zou kunnen komen.
nooit 100% zeker!
INLEIDING:
Tijdens corona vonden er zeer veel grootschalige verandering plaats (werkloosheid, eenzaamheid, ziekte, …)
voor onderzoekers was dit heel interessant om te onderzoeken:
Hoeveel procent van de Belgen had in het begin van de coronapandemie te kampen met depressieve
gevoelens?
Lag dat percentage een jaar later hoger of lager?
Hoe zijn deze onderzoekers te werk gegaan?
1. Gegevens of kenmerken verzamelen over de onderzoekpopulatie = waarden verzamelen van
variabelenµ
2. De juiste descriptieve of inferentiële analysetechniek(en) kiezen
er zijn 3 bepalende factoren die de juiste analysetechniek bepalen:
Aantal variabelen in de onderzoeksvraag
Meetniveau van elke variabelen
Rol van elke variabelen in de onderzoeksvraag: afhankelijke of onafhankelijke variabele
1. Statistische analyse(s) uitvoeren op verzamelde gegevens
Er zijn ook verschillende tools die u helpen om de juiste beslissing te maken en de juiste test te gebruiken. Een
voorbeeld hier van is een beslissingsboom.
Geel = scale niveau
Blauw = ordinaal meetniveau
Paars = nominaal meetniveau
MEETNIVEAU VAN VARIABELEN:
Onderzoekseenheden:
respondenten: bv. Variabele ‘gender’ en ‘gewicht’
producen of diensten zoals socialemedia-apps: bv. Variabele ‘aantal actieve gebruikers’
tijdsperiodes of ruimtes zoals gevangenissen: bv. Variabele ‘aantal m^2 celruimte per gedetineerde’
Variabelen = kenmerken van een populatie waarin je als onderzoeker geïnteresseerd bent en die telkens
kunnen variëren wanneer ze gemeten worden bij verschillende onderzoekseenheden van die populatie of op
verschillende tijdstippen en plaatsen.
, Per waarneming neemt een variabele altijd een bepaalde numerieke waarde aan, waarvan vooraf beslist wordt
wat die waarden precies betekenen.
Meetniveau = variabelen zullen met bepaalde waarden moeten worden gerepresenteerd. Zo kun je de leeftijd
van respondenten te weten komen door naar hun geboortejaar te vragen, maar ook door hun leeftijd te vragen
of leeftijdscategorie. Die relatie tussen wat gemeten wordt en de waarden die de metingen representeren
noemt men het meetniveau.
4 meetniveaus geordend van weinig naar meer informatief:
1. Nominaal: hokjes waar mensen inzitten (bv. geslacht, lievelingskleur, …) allemaal categorieën naast
elkaar, de één is niet belangrijker dan de andere, er zit geen orde in (we kunnen wel zeggen ‘die kleur
komt het vaakste voor’)
2. Ordinaal: hier zit wel een orde in (bv. Opleiding, graad van brandwonde) het zijn nog steeds geen
numerieke waarden maar de orde van die is hoger dan de andere is er wel. Categorieën maar wel
gecodeerd, die gaan gecodeerd in uw database voorkomen.
= categorische variabelen (kwalitatieve variabelen)
3. Interval
hebben wel numerieke variabelen, alle mogelijke waarden tussen hokjes zijn ook mogelijk, alle gegevens over
hele schaal zijn mogelijk. Verschil tussen interval en ratio valt meestal weg bij statistiek (klein verschil)
Interval: bv. Jaartal 10 jaar geleden was de helft zo lang geleden als 20 jaar geleden, sommige dingen zijn
hier wel nutteloos (bv. Gemiddeld gezien begon de oorlog in België in 1946,5 onnuttig) heeft geen absoluut
nulpunt optrekken en aftrekken is nuttig
Ratio: wel een absoluut nulpunt = afwezigheid van de variabelen (gewicht, lengte)
4. Ratio
= metrische (of continue) variabelen (kwantitatieve variabelen)
Hoe lager hoe beperkter de mogelijkheden om de gegevens statistisch te bewerken.
CATEGORISCHE VARIABELEN:
= indien de waarde een bepaalde klasse of categorie vertegenwoordigt noemen we die variabele een
kwalitatieve of categorische variabele. Variabelen of categorisch meetniveau vallen op hun beurt weer eens in
te delen in 2 soorten: nominale en ordinale variabelen.
= discrete variabele, mogelijke waarden zijn beperkt en liggen vooraf vast. Tussenliggende waarden zijn niet
mogelijk
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lautevdl2005. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,46. Je zit daarna nergens aan vast.