Samenvatting statistiek B: bundel van uitgebreide samenvatting op basis van de lessen, OLP, videolessen, oefeningensessies, ... + kernsamenvatting met belangrijkste theorie voor het examen + per hoofdstuk stappenplan met stappen in R + overzicht analysetechnieken.
Ik haalde hiermee 15/20 (en ik be...
Hoofdstuk 1: De keuze van de meest gepaste analysetechniek ............................................... 5
Inleiding ................................................................................................................ 5
1.1 Identificeren van variabelen en hun meetniveau......................................................... 5
1.2 Verbanden tussen variabelen ................................................................................. 6
1.3 Welke analysetechniek bij welke visualisatie? ............................................................ 8
Hoofdstuk 3: t - test .................................................................................................... 9
3.1 De verschillende onderzoeksdesigns ........................................................................ 9
3.2 Independent samples design .................................................................................. 9
Kengetallen vergelijken (bv gemiddelde) ...............................................................................9
Betrouwbaarheidsintervallen per categorie/groep respondenten + visualiseren (enkel bij independent
samples design) ........................................................................................................... 10
T-test bij independent samples design ................................................................................ 11
Decompositie (of verdeling) van de totale variantie: ............................................................ 11
Assumpties ................................................................................................................. 14
Effectgrootte (effect size) (Cohen’s d)................................................................................ 15
Opgelet bij interpretaties ivm t-test en effectgrootte !!........................................................ 16
T-test bij repeated measures design .................................................................................. 17
Effectgrootte .............................................................................................................. 18
Flowchart T-test .....................................................................................................18
Samengevat: stappen bij een t-test..............................................................................19
Voorbeeldexamenvraag T-test (theorie) ........................................................................19
Hoofdstuk 2: Kruistabellen ...........................................................................................21
2.1 Onderdelen van de kruistabel ...............................................................................21
Verbanden opsporen met relatieve frequenties .................................................................... 21
2.2 Statistische afhankelijkheid opsporen .....................................................................22
Effectgrootte of ‘sterkte’ van een verband .......................................................................... 22
De richting van een verband (positief-negatief): enkel vanaf ordinaal niveau ................................. 22
De aard van een verband ................................................................................................ 22
Significantietoets: de chi kwadraat toets ............................................................................. 23
Stap 1: geobserveerde totaalpercentages vaststellen .......................................................... 24
Stap 2: verwachte totaalpercentages bij statistische onafhankelijkheid .................................. 24
Stap 3: verwachte absolute celfrequenties bij statistische onafhankelijkheid ........................... 25
Stap 4: vergelijk geobserveerde en verwachte aantallen .................................................... 25
Stap 5: Voer een significantietoets uit met de chi-kwadraatwaardes ...................................... 25
2
, Effectgrootte: Cramer’s V ............................................................................................... 26
Cramer’s V .............................................................................................................. 26
Visuele weergave ....................................................................................................27
Samengevat: stappen bij kruistabellen .........................................................................28
Hoofdstuk 4: ANOVA.....................................................................................................29
Wat is Anova? .........................................................................................................29
Te doorlopen stappen bij een Anova (uitgewerkt voorbeeld)..............................................29
Kengetallen, betrouwbaarheidsinterval en visualisatie weergeven .............................................. 29
Assumptie van gelijke varianties testen (Levene’s Test) ........................................................... 30
F-test ....................................................................................................................... 30
Effectgrootte (Eta²) ...................................................................................................... 31
Post-hoc testen (indien Anova en/of Eta² significant zijn) ........................................................ 32
Samengevat: stappen bij een f-test (Anova) ...................................................................33
Hoofdstuk 5: correlaties ...............................................................................................35
Visueel nagaan van een verband: puntenwolk of spreidingsdiagram .....................................35
Covariantie ............................................................................................................36
Correlatie: Pearson correlatie (rxy) (steekproef)..............................................................37
Effectgrootte .............................................................................................................. 37
Effectgrootte .........................................................................................................38
Significantietoets (populatie) .....................................................................................38
Visueel weergeven van de significantietoets (matrix puntenwolk) ............................................... 39
Samengevat: stappen bij een correlatie-test ..................................................................40
Hoofdstuk 6: bivariate (lineaire) regressie ........................................................................41
Correlatie ≠ bivariate regressie ..................................................................................41
Bivariate regressie: de regressielijn als ‘samenvatting’ voor verbanden ................................41
Inexacte verbanden....................................................................................................... 42
De kleinste kwadraten ................................................................................................... 43
Effectgrootte, model fit en statistische significantie ........................................................44
Model fit (steekproef) .................................................................................................... 44
Significantietoets van de model fit .................................................................................... 45
Significantietoets van de parameters slope en intercept .......................................................... 46
Uitgewerkt voorbeeld met interpretaties ............................................................................. 46
Lineariteit .............................................................................................................47
Overzicht: stappenplan bij bivariate lineaire regressie .....................................................48
Hoofdstuk 7: assumpties bij lineaire regressieanalyse .........................................................49
Assumpties ............................................................................................................49
3
, Lineariteit .................................................................................................................. 49
Homoscedasticiteit (constante variantie) ............................................................................. 49
Geen outliers .............................................................................................................. 49
Geen clustering ........................................................................................................... 49
Normale verdeling van de errortermen (predictiefouten/residuelen) ........................................... 50
Niet ontbreken van relevante verklarende variabelen (zie hfst 8) ............................................... 50
Controle in R ..........................................................................................................50
Wanneer is een outlier problematisch? .........................................................................51
Voorbeeld examenvragen (herhaling voorbije hoofdstukken) .............................................53
Hoofdstuk 8: Meervoudige lineaire regressie.....................................................................55
Onechte verklaringen en indirecte verbanden ................................................................55
Meervoudige regressieanalyse ....................................................................................55
Multicollineariteit ...................................................................................................55
Wanneer zorgt multicollineariteit voor problemen? ................................................................ 56
Wat te doen bij een collineariteitsprobleem? ........................................................................ 56
Modellen vergelijken................................................................................................56
Interpretatie van een multivariaat model ......................................................................57
Welke van de variabelen heeft het meeste impact? ................................................................ 57
Voorbeeldexamenvraag ............................................................................................58
Stappen samengevat ................................................................................................59
Hoofdstuk 10: Regressieanalyse als Lingua Franca ..............................................................61
Interpretatie verhogen .............................................................................................61
Variabelen centreren rond het gemiddelde om het intercept interpreteerbaar te maken .................. 61
Variabelen standaardiseren om de regressiecoëfficiënten interpreteerbaar te maken ..................... 62
Wat is de meerwaarde van standaardiseren? ...................................................................... 63
Dummyvariabelen ...................................................................................................63
Herhalende oefening (voorbeeld examenvraag) bij OV zonder interactie-effecten......................... 67
Volledig uitgewerkte oefening als voorbeeld ..................................................................69
Interactie-effecten ..................................................................................................74
Interactie-effecten inschatten met producttermen ................................................................. 74
Herhalende oefening (voorbeeld examenvraag) bij OV met interactie-effecten ............................ 75
Vergelijken van een model mét en zonder interactie-effect ...................................................... 80
Belangrijke reminders voor het examen........................................................................81
4
, Hoofdstuk 1: De keuze van de meest gepaste
analysetechniek
Inleiding
Analyses met 2 (bivariate) of > 2 (multivariate) variabelen onderzoeksproblemen met variabelen waar
tussen we het verband willen kennen
Voorspellingsproblemen / ontwerpproblemen > hoe kan een fenomeen veranderd worden? bv: hoe kan
je de leeromgeving ontwerpen zodat wiskundeprestaties beter worden?
Hoe juiste analysetechniek bij de onderzoeksvraag?
o OV visualiseren met formeel notatiesysteem (Tacq)
o eenvoudige/complexe verbanden in kaart brengen
o Tekeningen koppelen aan analysetechnieken
1.1 Identificeren van variabelen en hun meetniveau
Meetniveau Stemt overeen met Of met Tekening
Nominaal:
- geen totale orde
- geen meeteenheid
- geen absoluut nulpunt
Ordinaal Kwalitatief Categorisch / factor
- wel totale orde
- geen meeteenheid
- geen absoluut nulpunt
Interval
- wel totale orde
- wel meeteenheid
- geen absoluut nulpunt Parametrisch / Numeriek
Kwantitatief
Ratio / continu
- wel totale orde
- wel meeteenheid
- wel absoluut nulpunt
OPGELET! Om het meetniveau te bepalen, moet je nakijken hoe de variabele geoperationaliseerd wordt!
Bv: ‘Open bedrijfsklimaat’ meten:
Vragen of men het bedrijfsklimaat als open of gesloten aanvoelt = categorisch (kwalitatief)
vragenlijst en dan het gemiddelde nemen van de scores (=schaalscore) = kwantitatief
Scores op een Likert-schaal (=ordinaal/kwalitatief), maar totaalscore op de schaal = somscore (=kwant)
5
, 1.2 Verbanden tussen variabelen
Niet-causaal Is er samenhang tussen 2 variabelen? Gewicht Lengte
(wordt X geassocieerd met Y, samenhang, …)
Causaal oorzaak-gevolg: is er invloed vd ene var
uren toets-
op de andere? De onderzoeker voorspelt een richting.
studie score
o oorzaak = onafhankelijke variabele = links
o gevolg = afhankelijke variabele = rechts
(effect, impact, invloed, voorspeller, verklaren, …) uren
studie
Meerdere causale verbanden: bv: 2 onafh var toets-
score
IQ
Oneigenlijk verband: bv: je onderzoekt verband uren studie en toetsscore. Echter, IQ kan ook een
invloed hebben op zowel score als uren studie. Je moet dus controleren voor IQ, anders heb je een
oneigenlijk verband. (~interne validiteit)(dus alleen bij causale OV’s)(IQ = ook een onafh var)
o vb2: Effect aantal brandweerslui en brandschade = positief effect. Maar je moet controleren voor de grootte
van de brand, want dit heeft een invloed op zowel aantal brandweerslui als op de brandschade.
o vb3: verband aantal ooievaarsnesten en aantal geboorten controleren voor aantal woningen (en dus
schoorstenen) effect op aantal ooievaars + aantal geboortes
Om oneigenlijke verbanden en foutieve conclusies uit te sluiten controlevariabelen: bv: effect van
uren studie op score onderzoeken, maar controleren op IQ = controlevariabele. (Visueel gewoon
weergeven als voorspeller, dus als onafh var). Je herkent dit aan: “Wat is het effect van X op Y …
o “… ongeacht Z” “ Controlerend voor Z” “Na rekening te houden met Z”
Interactie-effect: Effect van 2 variabelen tezamen (X en Z) op afhankelijke variabele (Y). Dus maw:
het effect van A op B is niet bij iedereen hetzelfde, maar is afhankelijk van een 3e kenmerk.
bv: Je komt tot een positief effect tussen uren studie en toetsscore, onafhankelijk van IQ, maar je kan je de vraag
stellen of dat effectief even groot is bij ‘domme’ en ‘slimme’ lln. Misschien is het effect van uren studie groter bij
‘dommere’ lln?
Je kan dit herkennen aan: Is het effect van X op Y …
o “… afhankelijk van Z?” “ hetzelfde/identiek voor… als voor…” “verschillend voor… als voor…”
OPGELET! Bij het uittekenen van de onderzoeksvraag, neem je de hoofdeffecten ook nog mee! Als je
dat niet doet, kan je het interactie-effect fout (bv te groot) inschatten!
Bv: “Is het verband tussen het aantal uren studie en de toetsscore afhankelijk van het IQ?”
uren
studie
toets-
score
IQ
6
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur christelvandenborre. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €16,99. Vous n'êtes lié à rien après votre achat.