Statistiek: theorie - samenvatting in woordenlijst-vorm
16 views 0 purchase
Course
Statistiek: theorie
Institution
Universiteit Gent (UGent)
Dit is een samenvatting van statistiek:theorie, een vak van het eerste semester van het schakeljaar naar de master in de verpleeg- en vroedkunde. De woordenlijst-vorm maakt het gemakkelijk om af te dekken en jezelf te bevragen.
H1: Inleiding
Steekproef Steekproef: onderzoekspopulatie, de groep die bevraagd/onderzocht wordt in het onderzoek
doelpopulatie Doelpopulatie: de volledige populatie die de steekproef moet representeren
Onderzoeksvormen 1. Observationeel onderzoek
Cohort (kan retrospectief, transversaal of prospectief zijn)
Case-control (enkel retrospectief)
2. Experimenteel onderzoek
Cohort (altijd prospectief)
2 soorten AV = afhankelijke variabele = uitkomstvariabele (outcome)
variabelen op vlak OV = onafhankelijke variabele = verklarende variabelen
van gebruik
2 soorten 1. Categorische variabelen (kwalitatieve)
variabelen op vlak Nominaal (geen ordening) vb. man/vrouw
van inhoud Ordinaal (wel ordening) vb. disease staging
Dichotoom (ja/nee, 0/1)
2. Numerieke variabelen (kwantitatieve)
Discreet (gehele getallen/aantallen) vb. dagen ziekte
Continu (oneindig aantal getallen) vb. gewicht in kg, lenge,…
Interval
Ratio schaal
2 soorten statistiek 1. Beschrijvende statistiek
Overzichtelijk samenvatten van data: grafische / numerieke weergave
2. Verklarende statistiek
Schatten van effecten / relaties – hypothese testen
Betrouwbaarheid van de onderzoeksresultaten
,H2: Beschrijvende statistiek
Grafische 1. Categorische variabelen
weergaven Staafdiagram (bar chart)
Taartdiagram (pie chart)
2. 2 Categorische variabelen
Geclusterde / gesegmenteerde staafdiagram
3. Continue variabelen
Histogram
Tak-en-blad diagram (stem-en-leaf plot)
4. 2 continue variabelen
Puntenwolk (scatterplot)
Numerieke 1. Categorische variabelen
weergaven Frequentietabel
2. Categorische variabelen met missende waarden
Frequentietabel met valid percent
Centrummaten 1. Modus
= de meest voorkomende waarde in de dataset
Weinig informatief
Ook voor categorische variabelen
Voordelen:
Snel determineerbaar
Nadelen
Negeert veel informatie
Niet zo correct
2. Rekenkundig gemiddelde
= alle waarden optellen en delen door n
Enkel indicator bij normaal verdelingen
Voordelen:
Gebruikt alle data
Wiskundig meetbaar
Nadelen:
Vervormd door uitschieters en scheve verdelingen
3. Mediaan
Alle resultaten ordenen en hierbij P50 (percentiel 50%) bekijken
Er zijn 4 percentielen
Voordelen:
Niet vervormd door uitschieters of scheve verdelingen
Nadelen:
Negeert veel informatie
Niet wiskundig gedefinieerd
4. Geometrisch gemiddelde
Bij transformatie van niet-normaal verdeelde variabelen (rechts scheef)
Logaritme nemen van elke waarde
Gemiddelde nemen van getransformeerde waarden
Dit gemiddelde tot de e^x doen om opnieuw in oorspronkelijke eenheid te praten
Voordelen:
Wiskundig meetbaar en maakt gebruik van alle data
Handig voor rechts scheve verdelingen
Nadelen:
Alleen bruikbaar als de logaritme transformatie zorgt voor een normale
verdeling
Normaal- Kenmerken:
verdeling - Observaties zijn symmetrisch verdeeld rond het gemiddelde gemiddelde =
mediaan (geen uitschieters)
- Klokvormig met 95% van de observaties tussen gem +/- 2 keer sd
, Niet normale Scheef naar rechtse verdeling
verdelingen - Gemiddelde > mediaan
Scheef naar linkse verdeling (vb. geboortegewicht)
- Gemiddelde < mediaan
Spreidingsmaten 1. Variantie
De gemiddelde afstand van elke variabele tot het gemiddelde
Omdat het getal in de teller 0 kan zijn en dit vermeden moet worden zal het
kwadraat genomen worden van iedere verhouding (= s²)
Voordelen:
Gebruikt elke observaties van de dataset
Wiskundig gedefinieerd
Nadelen:
Er wordt een kwadraat genomen (dus niet de rauwe dataset)
Gevoelig voor uitschieters
Gevoelig voor scheef verdeelde variabelen
2. Standaarddeviatie
Sd is de vierkantswortel van de variantie
Dit zijn alleen goede indicatoren bij normaal verdeelde variabelen
Voordelen:
Gebruikt elke observatie van de dataset
Wiskundig gedefinieerd
Zelfde eenheid als de rauwe data (geen kwadraat meer)
Makkelijk interpreteerbaar
Nadelen:
Gevoelig voor uitschieters
Gevoelig voor scheef verdeelde variabelen
3. Range
(minimum, maximum)
Voordelen:
Snel determineerbaar
Nadelen:
Gebruikt maar 2 observaties van de volledige dataset
Vervormd door uitschieters
Zal stijgen wanneer de steekproef stijgt
4. Interkwartiel-range
Tussen percentiel P25 en P75 zit dus 50% van de variabelen
Voordelen:
Geen effect van uitschieters
Onafhankelijk van de grootte van de steekproef
Kan gebruikt worden bij scheef verdeelde variabelen
Nadelen:
Moeilijk te berekenen
Kan niet gebruikt worden bij kleine steekproeven
Gebruikt maar 2 observaties van de data set
Niet wiskundig gedefinieerd
Numerieke / 1. Continue variabelen
grafische Box-and-whisker plot / boxplot
weergave
Normaliteit - Observeren histogram
nagana - Vergelijken van gemiddelde en mediaan (symmetrie?)
- Vergelijken van gemiddelde en standaarddeviatie (klokvorm?)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller justinemoerman. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.78. You're not tied to anything after your purchase.