Inductieve statistiek:
Formuleren van hypothese ivm eigenschappen van een populatie
Nemen en bestuderen van een steekproef
Hypothese verwerpen of niet
Het proces waarbij men veralgemeent van een steekproef naar een populatie
wordt statistische inductie genoemd
Inductie is altijd onderhevig aan onzekerheid
2. Steekproef vs populatie
2.1. Populatie
= verzameling van entiteiten die op zijn minst één karakteristiek
(eigenschap)
gemeen hebben
N = (doorgaans) onbeperkt groot
Bv: Belgische kinesitherapeuten 1ste jaarsstudenten REVAKI 2021 – 2022 aan de Ugent
2.2. Steekproef
= deelverzameling van subjecten (toevalling) getrokken uit de
studiepopulatie
n = steekproefgrootte (is steeds eindig)
!! Belangrijk:
i. Steekproef moet representatief zijn voor de populatie (vermijden
bias)
ii. Steekproef wordt gebruikt voor het schatten van de
populatieparameters en het testen van hypothesen
3. Meetniveau van variabelen
Variabele = karakteristiek van een populatie die verschillende waarden
(attributen) kan
aannemen, wordt gemeten of waargenomen
Attribuut = een specifieke waarde die men aan een variabelen toekent
Bv: X = leeftijd (variabele)
x1 = 18, x2 = 19, …
, 1: KWALITATIEF EN CATEGORISCH
2: KWANTITATIEF EN NUMERIEK
4. Frequentieverdeling en tabellen
4.1. Frequentieverdeling
= informatieve manier om meetwaarden van een variable weer te geven
4.2. Kruistabellen
= contigentietabel
Classificeren van items ahv 2 kwalitatieve variabelen
in elke cel van de tabel wordt de frequentie/ percentage gegeven
Soorten variabelen
Onafhankelijk = independent – explanatory – predictor
Beïnvloedt of veroorzaakt de studievariabelen
Bv: geslacht
Afhankelijke = dependent – outcome
Wordt beïnvloedt door andere variabelen
Bv: gewicht
Nominaal Kenmerken:
1. Antwoordmogelijkheden zitten vervat in categoriën
2. Categoriën zijn mutueel exclusief
3. Er is geen rangorde in de categoriën
Bv: geslacht, politieke voorkeur cijfers aan categorie toekennen hebben geen
betekenis
Ordinaal Kenmerken:
1. Antwoordmogelijkheden zitten vervat in categoriën
2. Categoriën zijn mutueel exclusief
3. Er is een rangorde
Bv: graad letsel, leeftijdsklasse cijfers aan categorie toekennen hebben geen
betekenis
Interval = variabele waarbij op de meetschaal gelijke intervallen van
de meetschaal duiden op gelijke verschillen in de variabelen
Kenmerk: er is geen absoluut nulpunt
Bv: temperatuur in °C gelijke intervallen; verschil 10 – 20 is zelfde als 40 – 50
geen absoluut nulpunt, toestand van materiaal wordt
aangeduid
“20°C is dubbel zo warm als 40°C mag niet gezegd worden
Ratio Kenmerk: er is een absoluut nulpunt
Bv: temperatuur in K gelijke intervallen; verschil 10 – 20 is zelfde als 40 – 50
absoluut nulpunt, bij 0K is er geen beweging van
moleculen
er mag in ratio’s gesproken worden
Discreet Bv: tellingen zoals aantal kinderen
Continu Bv: gewicht (70 – 70,2 – 70,168875643)
Dichotoom 2 antwoordmogelijkheden
Specifiek geval: binair (waarden 1 en 0 worden toegekend)
totale rij – of kolomfrequenties: marginale totalen
5. Beschrijvende statistiek
Samenvatting van steekproefgegevens op een duidelijke en bevattende manier.
Hoe? Numeriek: berschrijvende parameters
Visueel: grafische voorstellingen
5.1. Centrale maten
5.1.1. Rekenkundig gemiddelde
enkel bij interval- en ratiovariabelen toe te passen
n = steekproefgrootte
- x (steekproef) als schatting voor μ
(populatie)
, 5.1.2. Mediaan
enkel bij interval-, ratio- en ordinale variabele
n = oneven: middelste waarde na rangschikken van klein naar groot
n = even: gemiddelde van 2 middelste waarden na rangschikken klein
naar groot
5.1.3. Modus
= waarde of categorie die het meest frequent voorkomt in de
steekproef
enkel bij interval-, ratio-, nominale en ordinale variabele
2 modi aanwezig => BIMODAAL 2+ modi aanwezig =>
MULTIMODAAL
5.1.4. Onderlinge ligging gemiddelde, mediaan
5.2. Spreidingsmaten
5.2.1. Percentielen – kwartielen – range
5.2.2. Variantie
s2 (steekproef) als schatting voor σ2
(populatie)
n = steekproefgrootte
n-1 = het aantal vrijheidsgraden
Vrijheidsgraden = DF = Degrees of Freedom
slaat op het aantal termen dat vrij kunnen variëren nadat bepaalde
restricties
op de data zijn opgelegd
bij r x k tabel: DF = r-1 x k-1
bv: 4 getallen; gemiddelde ervan moet 25 zijn (restrictie)
10 – 20 – 30 – 40 OF75 – 0 – 0 – 25
⇒ we kunnen 3 getallen zelf kiezen, 1 niet DUS 3 vrijheidsgraden
5.2.3. Standaardafwijking
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper janavanhaele. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €15,46. Je zit daarna nergens aan vast.