Masterbestand Statistiek
Kant en klaar voor je tentamen: leer dit uit je hoofd
Van kans naar odds en andersom:
P(Y )
Odds op Y = (de complementregel)
1−P(Y )
Odds
P(Y )= (eigenlijk ‘andersom’)
1+odds
Het berekenen van ln(odds) naar odds en andersom
Ln(0,800) → e^0,800 → Exp (B) = 2,225
Exp (B) 2,225 → Rekenmachine ln functie (2,225) → geeft Ln odds (0,800)
Het berekenen van de 95% BI rondom de odds ratio en de Hazard ratio
95%BI rond de OR = B +/- 1,96 * SE
95% BI rond de HR =
Interpretaties:
Bij meervoudige regressie is de regressiecoëfficiënt de gemiddelde toename van
de afhankelijke variabele, terwijl de andere verklarende variabelen gelijk blijven.
Verschil in gemiddelden (Continue uitkomst)
Constante: Als X (bijv: BMI) 0 is. Daarom interpreteer je de P waarde ook niet! Je spreekt
hier geen hypothese over uit, dus deze toets je ook niet.
De uitkomst, Y, per verschil in X.
Logistische regressie analyse:
Verschil in groepen: Uitkomst of groep A of groep B (Dichotome uitkomst)
Constante: Als X (determinant) 0 is.
De uitkomst, Y, per verschil in X.
Als er meerdere variabelen benoemd staan, schrijf dan altijd op: gecorrigeerd voor …
, Bijles 01-12-2020
Welke statistische toets
Om te bepalen welke statistische toets je dient te gebruiken, moet je goed kijken naar de
opzet van de studie. Eigenlijk beredeneer je in 3 stappen welke toets je nodig hebt.
1. Allereerst kijk je naar het type data. Wat voor soort data heb je?
Numerieke/ continue waarde: kan in een bepaald interval iedere waarde aannemen.
Lengte, gewicht en temperatuur zijn continue variabelen (bijvoorbeeld 37.3 graden
Celsius).
Categorische/ discrete waarde: Er wordt onderscheid gemaakt tussen binaire, nominale
en ordinale discrete variabelen.
- Binair/ dichotoom: deze uitkomstmaat heeft slechts 2 mogelijke uitkomsten of
waarden. Voorbeelden zijn geslacht (man of vrouw), overleving (dood of levend) of
hersteld (wel of niet).
- Nominaal: Op nominaal niveau gemeten variabelen zijn kwalitatieve variabelen,
waarvan de categorieën niet in een vaste of zinvolle volgorde zijn te plaatsen.
Voorbeeld. 'Bloedgroep' met als waarden A, B, AB en O of
- Ordinaal: Op ordinaal niveau gemeten variabelen zijn kwalitatieve variabelen,
waarvan de categorieën wel in een vaste en zinvolle volgorde zijn te plaatsen.
Bijvoorbeeld een stelling in een vragenlijst, zoals 'ik heb de laatste tijd vaak sombere
gedachten', met als antwoordcategorieën: 'geheel mee eens', 'mee eens', 'geen
mening', 'niet mee eens' en 'geheel niet mee eens'.
Als je een continue uitkomstmaat hebt, is het belangrijk om te checken of deze wel
of niet normaal verdeeld is.
Normale verdeling: Bij een frequentieverdeling hoort een kromme die lijkt op een
klok (klokvormig). Deze klokvormige kromme is symmetrisch waarbij het
gemiddelde (μ), de mediaan en de modus precies samenvallen.
Daarnaast is sigma (‘σ’) een belangrijke component van de normale verdeling. Dit
is de maat van spreiding. Studenten kunnen met hun tentamencijfer dichtbij het
gemiddelde zitten, maar hier ook ver van afwijken. We hanteren een paar
vuistregels bij de normale verdeling:
● Ongeveer 68% van de waarden liggen binnen één standaarddeviatie van het
gemiddelde. Enerzijds -1 standaardafwijking en anderzijds +1 standaardafwijking .
● Ongeveer 95% van de waarden liggen binnen twee standaardafwijkingen van het
gemiddelde. Wederom enerzijds -2 afwijkingen aan de ene kant en +2 afwijkingen
aan de andere kant.
, 2. Vervolgens kijk je naar het type vergelijking: hoeveel groepen vergelijk je met
elkaar? De categorieën zijn:
- meten binnen 1 groep
- 2 groepen vergelijken
- meer dan 2 groepen vergelijken.
3. Tot slot kijk je soms naar hoeveel en wat voor variabelen (determinanten) je wilt
onderzoeken.
- Wil je 1 determinant onderzoeken, 2 of meer?
- Is de determinant continue, dichotoom of bijvoorbeeld categoriaal?
https://hulpbijonderzoek.nl/wp-content/upload_folders/hulpbijonderzoek.nl/2016/05/
Statistische-toets-kiezen.pdf
T-toets: bij een continue uitkomstwaarde
ANOVA: bij meer dan 2 groepen
Chi-kwadraat: bij nominale/ dichotome uitkomstwaarden
, T-toetsen
→ worden gebruikt om de gemiddelden van maximaal twee groepen met elkaar te
vergelijken.
1. Uitkomstmaat is continu/numeriek
2. Kan alleen bij een normale verdeling
3. Je kan meten binnen 1 groep (one-sample t-test) of tussen 2 groepen:
independent t-test bij 2 onafhankelijke groepen of paired samples t-test bij
afhankelijke groepen
4. -
One sample t-test
Gebruik de one sample t-test om te analyseren of het gemiddelde van een steekproef
verschilt van een bepaalde waarde.
*Een gezonde bloeddruk is onder de 140/90. Ook voor ouderen gelden dezelfde
bloeddrukwaarden. Je wilt weten of de 30 ouderen in verpleeghuis X gemiddeld gezien
een gezonde bloeddruk hebben.
Independent samples t-test
De independent samples t-test (of ongepaarde t-test) gebruik je om te kijken of twee
steekproefgemiddelden van elkaar verschillen.
*Je wilt de bloeddruk tussen mannen en vrouwen vergelijken.
Paired samples t-test
Gebruik de paired samples t-test om twee gemiddelden van gepaarde steekproeven met
elkaar te vergelijken. Gepaarde steekproeven zijn van elkaar afhankelijk.(meestal wordt
dezelfde groep gebruikt en 2x gemeten over tijd).
*Je meet de bloeddruk van dezelfde personen in 2015 en 2018. Deze waardes zijn
duidelijk van elkaar afhankelijk en daarom gebruik je een paired samples t-test.
T-test SPSS output interpreteren
De SPSS-output voor de independent samples t-test (t-test voor onafhankelijke
steekproeven) bevat twee tabellen:
1. Group Statistics
De eerste tabel, Group Statistics, bevat beschrijvende statistieken van beide groepen,
zoals het gemiddelde, de standaarddeviatie en de standaardfout van het gemiddelde.