100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Volledige Samenvatting Blok 2.2: Statistiek €7,99   In winkelwagen

Samenvatting

Volledige Samenvatting Blok 2.2: Statistiek

2 beoordelingen
 97 keer bekeken  17 keer verkocht

Dit is een samenvatting van alle belangrijke hoofdstukken en alle colleges. Dit is alle relevante stof voor het tentamen.

Voorbeeld 6 van de 52  pagina's

  • 26 juni 2022
  • 52
  • 2021/2022
  • Samenvatting
Alle documenten voor dit vak (3)

2  beoordelingen

review-writer-avatar

Door: sennavanb • 9 maanden geleden

review-writer-avatar

Door: elohaisaqzai • 11 maanden geleden

avatar-seller
lunaerasmus2020
Basiskennis

Meetniveaus variabelen
 Categorische/kwalitatieve variabelen
o Nominaal
 Geen volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 Sekse
o Ordinaal
 Wel volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 SES (Hoog, Gemiddeld, Laag)
 Kwantitatieve variabelen
o Interval: deling geeft geen juiste uitkomst.
 Wel volgorde
 Wel meeteenheid
 Geen natuurlijk nulpunt (Nulpunt is arbitrair.)
 Temperatuur, IQ (Iemand met een IQ van 100 is niet twee keer zo slim als
iemand met een IQ van 50.), toets cijfer (Nulpunt is hier arbitrair).
o Ratio
 Wel volgorde
 Wel meeteenheid
 Wel natuurlijk nulpunt (Nulpunt is niet arbitrair.)

Frequentieverdeling
 Unimodaal: verdeling heeft 1 piek.
 Bimodaal: verdeling heeft 2 pieken.
 Gemiddelde: beïnvloedt door outliers.
 Mediaan: middelste getal, niet beïnvloedt door outliers.
 Modus: getal dat het meeste voorkomt, niet beïnvloedt door outliers.




Variantie

,Variantie is de mate waarin de waarden onderling verschillen.

2
Xi (score) x̄ (gem) Afwijking afwijking
4 6 4 – 6 = -2 4
5 6 5 – 6 = -1 1
6 6 6–6=0 0
6 6 6–6=0 0
7 6 7–6=1 1
8 6 8–6=2 4
SOM = 0 SOM = 10

2 somafwijking 2 10
Variantie( s )=  Variantie= =2
aantal scores−1 6−1
Standaard deviatie( s)= √ Variantie  Standard deviatie=√2 = 1.41

Stappenplan berekenen variantie
1. Bereken het gemiddelde van de scores.
2. Trek het gemiddelde van alle scores af, zo bereken je de afwijking.
3. Zet al deze afwijkingen in het kwadraat.
4. Tel al deze gekwadrateerde afwijkingen bij elkaar op.
5. Deel de som hiervan door het aantal score – 1.
6. Neem hier de wortel van.

Notaties
 Populatie
o Gemiddelde: μ
o Standaarddeviatie
 SD van de populatie
 σ
o Proportie: p
 Steekproef:
o Gemiddelde: x̄
o Standaard deviatie: SD
o Proportie: p̂

Betrouwbaarheidsinterval
Stel je hebt een betrouwbaarheidsinterval van 95%. Wanneer je 100 steekproeven uit de
populatie trekt en hier de betrouwbaarheidsintervallen van berekend, zullen 95 van deze
betrouwbaarheidsintervallen de échte populatiewaarde bevatten en 5 niet. 95% van de
betrouwbaarheidsintervallen zullen de populatiewaarde dus bevatten.
(Betrouwbaarheidsintervallen zijn altijd tweezijdig.)
 Als je oneindig keer uit deze populatie een steekproef van … personen zou trekken, zou in
95% van de gevallen “de ware populatiewaarde” in dit betrouwbaarheidsinterval (lopend
van … tot …) liggen en in 5% van de gevallen niet.
Let op: het is dus niet zo dat je met 95% zekerheid weet dat de echte populatiewaarde in
een bepaald interval ligt.

, Betrouwbaarheidsinterval populatiegemiddelde:
o μ= x̄ ± m
z∗σ
o m=
√n
 N berekenen met de margin of error: je kan zo bepalen hoeveel mensen je in de
steekproef nodig hebt om een bepaalde mate van nauwkeurigheid te krijgen.

( )
2

o n=
m

,Proporties
Toetsen met proporties doen we altijd met een z-toets, nooit met een t-toets.

Toetsen één proportie
aantal succesgevallen x
De sample proportie (p̂ ) = 
totaal aantal deelnemers n
Als de sample size (n) groot genoeg is en gekozen met SRS, zal de steekproevenverdeling van
p̂ ongeveer normaal verdeeld zijn.
 Het gemiddelde is dan μ ^p= p
 De standaarddeviatie is dan σ =
√ p( 1− p)
n
.

 SE van de steekproefverdeling is dan SE ^p=

^p (1− ^p )
n
Omdat p een onbekende waarde is wordt deze vervangen door p̂ en zo ontstaat een
standaard error.
 Berekenen betrouwbaarheidsinterval
x
o p̂ =
n
^
o p ( schatting proportie)± m


o m=z∗ ^p ( 1− ^p )
n
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen beide minimaal 10 zijn.
Voorbeeld: je berekent de proportie van het aantal mensen dat de bloktoets heeft
gehaald. Het aantal mensen dat de bloktoets wel heeft gehaald en het aantal mensen
dat de bloktoets niet heeft gehaald moeten beide minimaal 10 zijn.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je mag dan twee successen en twee niet-successen toevoegen.
aantal successen∈de sample +2
o ^p=
n+ 4


o SE ^p= p (1− p)
n+4
o ^p ± z∗
√^p (1− ^p )
n+4
 N berekenen met de margin of error
o n=¿ ¿
o P*: een gegokte waarde voor de steekproefproportie omdat p̂ nog onbekend
is omdat we nog geen data hebben verzameld. P* kan bepaald worden op
twee manieren:
 Gebruik p̂ uit een pilotstudie.
 Gebruik p* = 0.5. Dit is het worst-case scenario, de margin of error is
dan het grootst. Je weet dan zeker dat je goed zit.
Nadeel: het gebruik van 0.5 kan leiden tot de uitkomst van een veel
grotere n dan dat in werkelijkheid nodig is.
 Significantie toets

, o Hypothesen opstellen
 H 0= p 0
 H a < p0 of H a > p0 of H a ≠ p 0
p0 is hier een bepaalde bekende proportie die we willen testen.
o Z-toets
^p− p 0
z=


 p0 (1−p 0)
n
Let op: gebruik deze test alleen als de verwachte aantallen van de successen
en niet-successen beide minimaal gelijk zijn aan 10.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode
toepassen.
o Conclusie
 Bij een tweezijdige toets moet je de p-waarde * 2 doen.
 P < alpha  Verwerp H 0.
 P > alpha  Verwerp H 0 niet.
We maken niet vaak gebruik van significantietesten voor één proportie omdat het niet veel
voorkomend is om een situatie te hebben waar er een precieze p0 die we willen weten.

Toetsen twee proporties
Hierbij worden twee proporties vergeleken. Dit kan door twee populaties te vergelijken of
door twee behandelingen in één populatie te vergelijken.
Om beide populaties te vergelijken kijk je naar het verschil tussen de sample proporties:
D= p̂ 1− p̂ 2.

 SED = 1
√ ^p (1−^p1) ^p2 (1−^p 2)
n1
+
n2
Wanneer beide steekproeven groot zijn zal de steekproevenverdeling van het verschil (D)
ongeveer normaal verdeeld zijn.
 Berekenen betrouwbaarheidsinterval
o D±m

o m=z∗¿

o Conclusie
√ ^p1 ( 1− ^p1 ) ^p 2 ( 1− ^p 2)
n1
+
n2

 Is de betrouwbaarheidsinterval volledig positief, dan is methode A
beter dan methode B.
 Is de betrouwbaarheidsinterval volledig negatief, dan is methode B
beter dan A.
 Is de betrouwbaarheidsinterval gedeeltelijk positief en gedeeltelijk
negatief, dan ligt 0 in het interval, wat bekent dat beide methode even
goed zouden kunnen zijn.
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen in beide samples minimaal 10 is.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je voegt dan één succes en één niet-succes toe aan elke sample.

, X 1+1 X +1
o p̂ 1= en p̂ 2= 2
n 1+2 n2 + 2

o SED =

o D±m
√ ^p1 ( 1− ^p1 )
n1 +2
+
^p 2 ( 1−^p 2 )
n2 +2





o m=z∗¿
√ ^p1 ( 1− ^p1 ) p^ 2 ( 1− ^p 2)
n1 +2
N berekenen met de margin of error
+
n2 +2

o n=¿ ¿
o P*: de gegokte proportie.
 Significantie toets
o Hypothesen opstellen
 H 0 : p 1 = p2
 H a : p 1< p 2 of p1 > p2 of p1 ≠ p2
( ^p1− ^p2 )
z=


o 1 1
p^ ( 1− p^ ) ( + )
n1 n1
o ^p: pooled steekproefpoprotie
totale aantal succssen∈beide steekproeven gecombineerd
o ^p=
totaal aantal individuen∈beide steekproeven gecombineerd
Let op: gebruik deze toets alleen als de aantal successen en niet-successen in beide
samples minimaal 5 zijn.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode toepassen. Je
voegt dan bij elke sample 1 succes en 1 niet-succes toe.

Relatief risico
Je kunt proporties vergelijken door het betrouwbaarheidsinterval te berekenen, maar ook
door de ratio te nemen. Een proportie wordt dan gezien als een risico dat iets zal gebeuren.
Je kunt dus twee risico’s vergelijken met de ratio van de twee proporties (relatief risico). Een
relatief risico van 1 betekent dat de proporties gelijk zijn. Je berekent het relatief risico door
^p 1
RR =
^p 2

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lunaerasmus2020. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €7,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 76449 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€7,99  17x  verkocht
  • (2)
  Kopen