Dit document bevat de uitgebreide notities van het vak 'dataverwerking' gegeven in het derde jaar, door H. Arnouts (OWA00R). Alle notities van alle lessen en enkele voorbeeldoefeningen zijn terug te vinden in dit document.
, 2.5.1.4 75% percentiel of 75% kwantiel (x75) ..........................................................................................9
2.5.1.5 Modus .......................................................................................................................................10
2.5.2 Spreidingsmaten ..............................................................................................................................10
2.5.2.1 Variantie....................................................................................................................................10
2.5.2.2 Standaardafwijking of standaarddeviatie (s) .............................................................................10
2.5.2.3 Variatiecoëfficiënt .....................................................................................................................10
2.5.2.4 Bereik of range (R) ....................................................................................................................10
2.5.2.5 Interkwartielafstand (IQR) ........................................................................................................11
2.6 Samenvattend .........................................................................................................................................11
2.6.1 Univariatie beschrijving: grafieken ...................................................................................................11
2.6.2 Univariate beschrijving: maatstaven ................................................................................................11
2.7 Bivariate beschrijving ..............................................................................................................................11
2.7.1 Verband tussen twee kwalitatieve variabelen .................................................................................11
2.7.1.1 Grafisch .....................................................................................................................................11
2.7.1.1.1 Kruistabel ...........................................................................................................................11
2.7.1.1.2 Meervoudig staagdiagram .................................................................................................12
2.7.1.2 Associatiemaat ..........................................................................................................................12
2.7.1.2.1 Cramer’s V .........................................................................................................................12
2.7.2 Verband tussen een kwalitatieve variabele en kwantitatieve variabele ..........................................12
2.7.2.1 Grafisch .....................................................................................................................................12
2.7.2.1.1 Dotplot per groep ..............................................................................................................12
2.7.2.1.2 Boxplot per groep ..............................................................................................................13
2.7.2.2 Associatiemaat ..........................................................................................................................13
2.7.2.2.1 Verschil in gemiddelde .......................................................................................................13
2.7.3 Verband tussen twee kwantitatieve variabelen ...............................................................................13
2.7.3.1 Grafisch .....................................................................................................................................13
2.7.3.1.1 Puntenwolk of scatterplot .................................................................................................13
2.7.3.2 Associatiemaat ..........................................................................................................................13
2.7.3.2.1 Pearson correlatiecoëfficiënt .............................................................................................13
2.8 Samenvattend .........................................................................................................................................14
2.8.1 Bivariate beschrijving: grafieken ......................................................................................................14
2.8.2 Bivariate beschrijving: associatiemaat .............................................................................................14
3. Van populatie tot steekproef ........................................................................................................................15
3.1 Inleiding ..................................................................................................................................................15
3.2 Populatiemaatstaven ..............................................................................................................................15
3.3 Voorwaarden ..........................................................................................................................................15
, 3.4 Populatiegemiddelde v.s. steekproefgemiddelde ...................................................................................15
3.5 Betrouwbaarheidsinterval (BTI) voor populatiegemiddelde ...................................................................15
3.5.1 Effect van steekproefstandaarddeviatie en aantal waarnemingen ..................................................16
3.5.1.1 Oefening ...................................................................................................................................16
3.5.2 Voorwaarden BTI voor populatiegemiddelde (µ) .............................................................................16
3.5.2.1 Normaal verdeeld .....................................................................................................................16
3.5.2.1.1 Q-Q-plot .............................................................................................................................17
3.5.2.1.2 Shapiro-Wilk test................................................................................................................17
3.6 Betrouwbaarheidsinterval (BTI) verschil van 2 populatiegemiddelden ..................................................17
3.6.1 Gepaarde v.s. ongepaarde gegevens ...............................................................................................18
3.6.1.1 Ongepaarde gegevens ..............................................................................................................18
3.6.1.1.1 Voorwaarden BTI ongepaarde gegevens ...........................................................................19
3.6.1.2 Gepaarde gegevens ..................................................................................................................19
3.6.1.2.1 Voorwaarden BTI gepaarde gegevens ...............................................................................19
3.6.1.2.2 Opmerkingen .....................................................................................................................20
4. Toetsen van hypothesen ...............................................................................................................................20
4.1 Soorten hypothesen ...............................................................................................................................20
4.2 Bewijzen tegen nulhypothese .................................................................................................................21
4.3 Fouten en juiste interpretatie .................................................................................................................22
4.3.1 Type I-fout .......................................................................................................................................22
4.3.2 Type II-fout.......................................................................................................................................22
4.3.3 Juiste interpretatie ...........................................................................................................................22
4.3.4 Samenvattend ..................................................................................................................................22
4.4 Relatie tussen toetsen en betrouwbaarheidsintervallen ........................................................................22
4.5 Toets voor verband tussen kwantitatieve en binaire variabele ..............................................................22
4.5.1 Ongepaarde t-test............................................................................................................................23
4.5.1.1 Levene’s test .............................................................................................................................23
4.5.1.2 Voorbeeld ongepaarde t-test (met Levene’s test) ....................................................................23
4.5.2 Gepaarde t-test ................................................................................................................................24
4.5.2.1 Shapiro-Wilk test (of Q-Q-plot) .................................................................................................24
4.5.2.2 Voorbeeld gepaarde t-test (met Shapiro Wilk-test) ..................................................................24
4.5.3 Niet-parametrische testen (mann-Whitney U test, Wilcoxon rank (signed rank/sum) test) ...........25
4.6 Meervoudige toetsen .............................................................................................................................26
4.6.1 Correctiemethodes ..........................................................................................................................26
4.6.2 Toets voor verband tussen kwantitatieve en kwalitatieve variabele (meer dan 2 uitkomsten).......26
4.6.2.1 Anova-test.................................................................................................................................26
, 4.6.2.1.1 Post hoc analyse ................................................................................................................26
4.6.2.1.1 Voorbeeld anova-test (met post hoc analyse) ...................................................................26
4.6.2.2 Niet-parametrische testen (Kruskal-Wallis test) .......................................................................28
4.6.2.2.1 Voorbeeld ..........................................................................................................................28
4.6.3 Toets voor verband tussen twee kwalitatieve variabelen ................................................................28
4.6.3.1 Pearson Chi-kwadraat ...............................................................................................................28
4.6.3.1.1 In geval van twee binaire kwalitatieve variabelen .............................................................29
4.6.3.1.2 In geval van twee kwalitatieve variabelen, waarvan minstens 1 variabele niet binair is ...29
4.6.3.2 Fisher’s exact test .....................................................................................................................30
4.6.4 Toets voor verband tussen twee kwantitatieve variabelen .............................................................31
4.6.4.1 Toets op Pearson correlatie ......................................................................................................31
4.6.4.2 Toets op Spearman rangcorrelatie ...........................................................................................31
4.6.4.3 Voorbeeld .................................................................................................................................31
5. Studiedesign .................................................................................................................................................32
5.1 Steekproef ..............................................................................................................................................32
5.1.1 Clustersteekproef ............................................................................................................................32
5.1.2 Gestratificeerde steekproef .............................................................................................................32
5.2 Dataverzameling .....................................................................................................................................33
5.2.1 Experiment.......................................................................................................................................33
5.2.1.1 Experiment met controlegroep.................................................................................................33
5.2.1.2 Cross-over experiment..............................................................................................................33
5.2.2 Observationele studies ....................................................................................................................33
6. Enquête.........................................................................................................................................................34
6.1 Aandachtspunten bij het formuleren van de vragen ..............................................................................34
6.1.1 Operationalisering ...........................................................................................................................34
6.1.2 Criteria voor de vragen ....................................................................................................................35
6.1.2.1 Concreetheid ............................................................................................................................35
6.1.2.2 Beantwoordbaarheid ................................................................................................................35
6.1.2.3 Neutraal ....................................................................................................................................35
6.1.3 Speciale vragen ................................................................................................................................36
6.1.3.1 Controle vragen ........................................................................................................................36
6.1.3.2 Onrechtstreekse vragen............................................................................................................36
6.1.3.3 Conditionaliteit en doorverwijzing ............................................................................................36
6.1.3.4 Meningsvragen .........................................................................................................................36
6.1.3.5 Sociaal-demografische kenmerken ...........................................................................................36
6.2 Aandachtspunten bij het formuleren van de antwoorden .....................................................................36
, 6.2.1 Gesloten versus open vragen...........................................................................................................36
6.2.2 Criteria voor antwoorden ................................................................................................................37
6.2.2.1 Gedetailleerd ............................................................................................................................37
6.2.2.2 Uitputtend en uitsluitend .........................................................................................................38
6.2.2.3 In logische volgorde ..................................................................................................................38
6.2.3 Specifieke typen antwoorden ..........................................................................................................39
6.2.3.1 Antwoorden in blok ..................................................................................................................39
6.2.3.2 ‘Geen antwoord’-categorie .......................................................................................................39
6.2.4 Opbouw enquête .............................................................................................................................39
6.3 Inleiding van de enquête ........................................................................................................................39
6.4 Steekproef ..............................................................................................................................................40
6.5 Non-respons ...........................................................................................................................................40
6.6 Analyseren van enquêteresultaten .........................................................................................................40
6.7 oefening hoofdstuk 5 en 6 ......................................................................................................................40
, DATAVERWERKING
1. INLEIDING
1.1 HET NUT VAN STATISTIEK
Statistiek verwijst naar numerieke informatie, zoals de informatie over de bevolking van een land (geboorte-
en sterftecijfers, immigraties en emigraties…), de Vlaamse landbouw en visserij (aantal bedrijven,
bedrijfsgrootte, productiehoeveelheid…) of dierproefstatistieken.
1.2 DEFINITIE
Statistiek wordt gezien als een wetenschap die zich bezighoudt met het verzamelen, analyseren en
interpreteren van gegevens om vooropgestelde onderzoeksvragen te kunnen beantwoorden. Deze gegevens
zijn talrijk aanwezig. Maar vaak worden deze gegevens ook zelf actief verzameld, doormiddel van het uitvoeren
van experimenten of het afnemen van enquêtes.
Wanneer de nodige gegevens verzameld zijn is het belangrijk om deze te verwerken tot bruikbare informatie
om een antwoord te kunnen geven op de vooropgestelde onderzoekvragen, zoals bijvoorbeeld:
- Heeft een nieuwe meststof invloed op de plantengroei?
- Wat is de invloed van regelmatig joggen op de bloeddruk?
- Is er een verschil in visie tussen jongeren en ouderen wat betreft voedselveiligheid?
- Heeft socialisatie bij pups een effect op het latere gedrag?
1.3 BIOLOGISCHE VARIABILITEIT
Deze vragen kunnen zelden tot nooit beantwoord worden bij enkel het bekijken van verzamelde gegevens. Zo
zal je om na te gaan of een nieuwe meststof een invloed heeft op de plantengroei op zijn minst al de
gemiddelde lengte van de planten moeten berekenen. Daarnaast moet je bij het beantwoorden van deze
onderzoekvragen ook rekening houden met het feit dat de verzamelde gegevens onderhevig zijn aan variatie.
Bijvoorbeeld: Effect van meststof op plantengroei, hangt af van:
o Omgeving: sommige planten in de zon, anderen in de schaduw
o Wanneer werd bemesting toegediend: droge periode of natte periode
o Verschil in individuele planten: sommige planten zwakker
Bijvoorbeeld: Hoe iemand reageert op een aspirine en of dit voor iedereen even effectief is, is meestal
niet exact te voorspellen en hangt af van:
o Mensen verschillen in gewicht, ziektegraad, gevoeligheid voor een stof…
o ’s avonds of ’s ochtends ingenomen, moe of uitgerust, voor of na het eten, geregelde
tijdstippen of onregelmatige intervallen…
o Variatie binnen een persoon, bloeddruk…
De aanwezigheid van biologische variabiliteit is ook bijzonder opvallend in de context van roken. De schadelijke
gevolgen van roken op longkanker en hartaandoening zijn intussen goed gekend, maar nagenoeg iedereen kent
wel iemand die zijn hele leven gerookt heeft en desondanks meer dan 80 jaar oud geworden is. Omwille van
deze biologische variabiliteit is het moeilijk om wetenschappelijke vragen goed te beantwoorden en zal men
zelden onmiddellijk het antwoord zien na het bekijken van ruwe gegevens.
1
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper yanadevos. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.