Dit is een samenvatting van statistiek:theorie, een vak van het eerste semester van het schakeljaar naar de master in de verpleeg- en vroedkunde. De woordenlijst-vorm maakt het gemakkelijk om af te dekken en jezelf te bevragen.
H1: Inleiding
Steekproef Steekproef: onderzoekspopulatie, de groep die bevraagd/onderzocht wordt in het onderzoek
doelpopulatie Doelpopulatie: de volledige populatie die de steekproef moet representeren
Onderzoeksvormen 1. Observationeel onderzoek
Cohort (kan retrospectief, transversaal of prospectief zijn)
Case-control (enkel retrospectief)
2. Experimenteel onderzoek
Cohort (altijd prospectief)
2 soorten AV = afhankelijke variabele = uitkomstvariabele (outcome)
variabelen op vlak OV = onafhankelijke variabele = verklarende variabelen
van gebruik
2 soorten 1. Categorische variabelen (kwalitatieve)
variabelen op vlak Nominaal (geen ordening) vb. man/vrouw
van inhoud Ordinaal (wel ordening) vb. disease staging
Dichotoom (ja/nee, 0/1)
2. Numerieke variabelen (kwantitatieve)
Discreet (gehele getallen/aantallen) vb. dagen ziekte
Continu (oneindig aantal getallen) vb. gewicht in kg, lenge,…
Interval
Ratio schaal
2 soorten statistiek 1. Beschrijvende statistiek
Overzichtelijk samenvatten van data: grafische / numerieke weergave
2. Verklarende statistiek
Schatten van effecten / relaties – hypothese testen
Betrouwbaarheid van de onderzoeksresultaten
,H2: Beschrijvende statistiek
Grafische 1. Categorische variabelen
weergaven Staafdiagram (bar chart)
Taartdiagram (pie chart)
2. 2 Categorische variabelen
Geclusterde / gesegmenteerde staafdiagram
3. Continue variabelen
Histogram
Tak-en-blad diagram (stem-en-leaf plot)
4. 2 continue variabelen
Puntenwolk (scatterplot)
Numerieke 1. Categorische variabelen
weergaven Frequentietabel
2. Categorische variabelen met missende waarden
Frequentietabel met valid percent
Centrummaten 1. Modus
= de meest voorkomende waarde in de dataset
Weinig informatief
Ook voor categorische variabelen
Voordelen:
Snel determineerbaar
Nadelen
Negeert veel informatie
Niet zo correct
2. Rekenkundig gemiddelde
= alle waarden optellen en delen door n
Enkel indicator bij normaal verdelingen
Voordelen:
Gebruikt alle data
Wiskundig meetbaar
Nadelen:
Vervormd door uitschieters en scheve verdelingen
3. Mediaan
Alle resultaten ordenen en hierbij P50 (percentiel 50%) bekijken
Er zijn 4 percentielen
Voordelen:
Niet vervormd door uitschieters of scheve verdelingen
Nadelen:
Negeert veel informatie
Niet wiskundig gedefinieerd
4. Geometrisch gemiddelde
Bij transformatie van niet-normaal verdeelde variabelen (rechts scheef)
Logaritme nemen van elke waarde
Gemiddelde nemen van getransformeerde waarden
Dit gemiddelde tot de e^x doen om opnieuw in oorspronkelijke eenheid te praten
Voordelen:
Wiskundig meetbaar en maakt gebruik van alle data
Handig voor rechts scheve verdelingen
Nadelen:
Alleen bruikbaar als de logaritme transformatie zorgt voor een normale
verdeling
Normaal- Kenmerken:
verdeling - Observaties zijn symmetrisch verdeeld rond het gemiddelde gemiddelde =
mediaan (geen uitschieters)
- Klokvormig met 95% van de observaties tussen gem +/- 2 keer sd
, Niet normale Scheef naar rechtse verdeling
verdelingen - Gemiddelde > mediaan
Scheef naar linkse verdeling (vb. geboortegewicht)
- Gemiddelde < mediaan
Spreidingsmaten 1. Variantie
De gemiddelde afstand van elke variabele tot het gemiddelde
Omdat het getal in de teller 0 kan zijn en dit vermeden moet worden zal het
kwadraat genomen worden van iedere verhouding (= s²)
Voordelen:
Gebruikt elke observaties van de dataset
Wiskundig gedefinieerd
Nadelen:
Er wordt een kwadraat genomen (dus niet de rauwe dataset)
Gevoelig voor uitschieters
Gevoelig voor scheef verdeelde variabelen
2. Standaarddeviatie
Sd is de vierkantswortel van de variantie
Dit zijn alleen goede indicatoren bij normaal verdeelde variabelen
Voordelen:
Gebruikt elke observatie van de dataset
Wiskundig gedefinieerd
Zelfde eenheid als de rauwe data (geen kwadraat meer)
Makkelijk interpreteerbaar
Nadelen:
Gevoelig voor uitschieters
Gevoelig voor scheef verdeelde variabelen
3. Range
(minimum, maximum)
Voordelen:
Snel determineerbaar
Nadelen:
Gebruikt maar 2 observaties van de volledige dataset
Vervormd door uitschieters
Zal stijgen wanneer de steekproef stijgt
4. Interkwartiel-range
Tussen percentiel P25 en P75 zit dus 50% van de variabelen
Voordelen:
Geen effect van uitschieters
Onafhankelijk van de grootte van de steekproef
Kan gebruikt worden bij scheef verdeelde variabelen
Nadelen:
Moeilijk te berekenen
Kan niet gebruikt worden bij kleine steekproeven
Gebruikt maar 2 observaties van de data set
Niet wiskundig gedefinieerd
Numerieke / 1. Continue variabelen
grafische Box-and-whisker plot / boxplot
weergave
Normaliteit - Observeren histogram
nagana - Vergelijken van gemiddelde en mediaan (symmetrie?)
- Vergelijken van gemiddelde en standaarddeviatie (klokvorm?)
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper justinemoerman. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,16. Je zit daarna nergens aan vast.