100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Volledige Samenvatting Blok 2.2: Statistiek $8.68   Add to cart

Summary

Volledige Samenvatting Blok 2.2: Statistiek

2 reviews
 100 views  17 purchases
  • Course
  • Institution

Dit is een samenvatting van alle belangrijke hoofdstukken en alle colleges. Dit is alle relevante stof voor het tentamen.

Preview 6 out of 52  pages

  • June 26, 2022
  • 52
  • 2021/2022
  • Summary

2  reviews

review-writer-avatar

By: sennavanb • 10 months ago

review-writer-avatar

By: elohaisaqzai • 1 year ago

avatar-seller
Basiskennis

Meetniveaus variabelen
 Categorische/kwalitatieve variabelen
o Nominaal
 Geen volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 Sekse
o Ordinaal
 Wel volgorde
 Geen meeteenheid
 Geen natuurlijk nulpunt
 SES (Hoog, Gemiddeld, Laag)
 Kwantitatieve variabelen
o Interval: deling geeft geen juiste uitkomst.
 Wel volgorde
 Wel meeteenheid
 Geen natuurlijk nulpunt (Nulpunt is arbitrair.)
 Temperatuur, IQ (Iemand met een IQ van 100 is niet twee keer zo slim als
iemand met een IQ van 50.), toets cijfer (Nulpunt is hier arbitrair).
o Ratio
 Wel volgorde
 Wel meeteenheid
 Wel natuurlijk nulpunt (Nulpunt is niet arbitrair.)

Frequentieverdeling
 Unimodaal: verdeling heeft 1 piek.
 Bimodaal: verdeling heeft 2 pieken.
 Gemiddelde: beïnvloedt door outliers.
 Mediaan: middelste getal, niet beïnvloedt door outliers.
 Modus: getal dat het meeste voorkomt, niet beïnvloedt door outliers.




Variantie

,Variantie is de mate waarin de waarden onderling verschillen.

2
Xi (score) x̄ (gem) Afwijking afwijking
4 6 4 – 6 = -2 4
5 6 5 – 6 = -1 1
6 6 6–6=0 0
6 6 6–6=0 0
7 6 7–6=1 1
8 6 8–6=2 4
SOM = 0 SOM = 10

2 somafwijking 2 10
Variantie( s )=  Variantie= =2
aantal scores−1 6−1
Standaard deviatie( s)= √ Variantie  Standard deviatie=√2 = 1.41

Stappenplan berekenen variantie
1. Bereken het gemiddelde van de scores.
2. Trek het gemiddelde van alle scores af, zo bereken je de afwijking.
3. Zet al deze afwijkingen in het kwadraat.
4. Tel al deze gekwadrateerde afwijkingen bij elkaar op.
5. Deel de som hiervan door het aantal score – 1.
6. Neem hier de wortel van.

Notaties
 Populatie
o Gemiddelde: μ
o Standaarddeviatie
 SD van de populatie
 σ
o Proportie: p
 Steekproef:
o Gemiddelde: x̄
o Standaard deviatie: SD
o Proportie: p̂

Betrouwbaarheidsinterval
Stel je hebt een betrouwbaarheidsinterval van 95%. Wanneer je 100 steekproeven uit de
populatie trekt en hier de betrouwbaarheidsintervallen van berekend, zullen 95 van deze
betrouwbaarheidsintervallen de échte populatiewaarde bevatten en 5 niet. 95% van de
betrouwbaarheidsintervallen zullen de populatiewaarde dus bevatten.
(Betrouwbaarheidsintervallen zijn altijd tweezijdig.)
 Als je oneindig keer uit deze populatie een steekproef van … personen zou trekken, zou in
95% van de gevallen “de ware populatiewaarde” in dit betrouwbaarheidsinterval (lopend
van … tot …) liggen en in 5% van de gevallen niet.
Let op: het is dus niet zo dat je met 95% zekerheid weet dat de echte populatiewaarde in
een bepaald interval ligt.

, Betrouwbaarheidsinterval populatiegemiddelde:
o μ= x̄ ± m
z∗σ
o m=
√n
 N berekenen met de margin of error: je kan zo bepalen hoeveel mensen je in de
steekproef nodig hebt om een bepaalde mate van nauwkeurigheid te krijgen.

( )
2

o n=
m

,Proporties
Toetsen met proporties doen we altijd met een z-toets, nooit met een t-toets.

Toetsen één proportie
aantal succesgevallen x
De sample proportie (p̂ ) = 
totaal aantal deelnemers n
Als de sample size (n) groot genoeg is en gekozen met SRS, zal de steekproevenverdeling van
p̂ ongeveer normaal verdeeld zijn.
 Het gemiddelde is dan μ ^p= p
 De standaarddeviatie is dan σ =
√ p( 1− p)
n
.

 SE van de steekproefverdeling is dan SE ^p=

^p (1− ^p )
n
Omdat p een onbekende waarde is wordt deze vervangen door p̂ en zo ontstaat een
standaard error.
 Berekenen betrouwbaarheidsinterval
x
o p̂ =
n
^
o p ( schatting proportie)± m


o m=z∗ ^p ( 1− ^p )
n
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen beide minimaal 10 zijn.
Voorbeeld: je berekent de proportie van het aantal mensen dat de bloktoets heeft
gehaald. Het aantal mensen dat de bloktoets wel heeft gehaald en het aantal mensen
dat de bloktoets niet heeft gehaald moeten beide minimaal 10 zijn.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je mag dan twee successen en twee niet-successen toevoegen.
aantal successen∈de sample +2
o ^p=
n+ 4


o SE ^p= p (1− p)
n+4
o ^p ± z∗
√^p (1− ^p )
n+4
 N berekenen met de margin of error
o n=¿ ¿
o P*: een gegokte waarde voor de steekproefproportie omdat p̂ nog onbekend
is omdat we nog geen data hebben verzameld. P* kan bepaald worden op
twee manieren:
 Gebruik p̂ uit een pilotstudie.
 Gebruik p* = 0.5. Dit is het worst-case scenario, de margin of error is
dan het grootst. Je weet dan zeker dat je goed zit.
Nadeel: het gebruik van 0.5 kan leiden tot de uitkomst van een veel
grotere n dan dat in werkelijkheid nodig is.
 Significantie toets

, o Hypothesen opstellen
 H 0= p 0
 H a < p0 of H a > p0 of H a ≠ p 0
p0 is hier een bepaalde bekende proportie die we willen testen.
o Z-toets
^p− p 0
z=


 p0 (1−p 0)
n
Let op: gebruik deze test alleen als de verwachte aantallen van de successen
en niet-successen beide minimaal gelijk zijn aan 10.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode
toepassen.
o Conclusie
 Bij een tweezijdige toets moet je de p-waarde * 2 doen.
 P < alpha  Verwerp H 0.
 P > alpha  Verwerp H 0 niet.
We maken niet vaak gebruik van significantietesten voor één proportie omdat het niet veel
voorkomend is om een situatie te hebben waar er een precieze p0 die we willen weten.

Toetsen twee proporties
Hierbij worden twee proporties vergeleken. Dit kan door twee populaties te vergelijken of
door twee behandelingen in één populatie te vergelijken.
Om beide populaties te vergelijken kijk je naar het verschil tussen de sample proporties:
D= p̂ 1− p̂ 2.

 SED = 1
√ ^p (1−^p1) ^p2 (1−^p 2)
n1
+
n2
Wanneer beide steekproeven groot zijn zal de steekproevenverdeling van het verschil (D)
ongeveer normaal verdeeld zijn.
 Berekenen betrouwbaarheidsinterval
o D±m

o m=z∗¿

o Conclusie
√ ^p1 ( 1− ^p1 ) ^p 2 ( 1− ^p 2)
n1
+
n2

 Is de betrouwbaarheidsinterval volledig positief, dan is methode A
beter dan methode B.
 Is de betrouwbaarheidsinterval volledig negatief, dan is methode B
beter dan A.
 Is de betrouwbaarheidsinterval gedeeltelijk positief en gedeeltelijk
negatief, dan ligt 0 in het interval, wat bekent dat beide methode even
goed zouden kunnen zijn.
Let op: deze interval mag alleen gebruikt worden als het aantal successen en niet-
successen in beide samples minimaal 10 is.
 Plus-vier methode
Wanneer er niet genoeg successen en niet-successen zijn, kan de plus-vier methode
worden toegepast. Je voegt dan één succes en één niet-succes toe aan elke sample.

, X 1+1 X +1
o p̂ 1= en p̂ 2= 2
n 1+2 n2 + 2

o SED =

o D±m
√ ^p1 ( 1− ^p1 )
n1 +2
+
^p 2 ( 1−^p 2 )
n2 +2





o m=z∗¿
√ ^p1 ( 1− ^p1 ) p^ 2 ( 1− ^p 2)
n1 +2
N berekenen met de margin of error
+
n2 +2

o n=¿ ¿
o P*: de gegokte proportie.
 Significantie toets
o Hypothesen opstellen
 H 0 : p 1 = p2
 H a : p 1< p 2 of p1 > p2 of p1 ≠ p2
( ^p1− ^p2 )
z=


o 1 1
p^ ( 1− p^ ) ( + )
n1 n1
o ^p: pooled steekproefpoprotie
totale aantal succssen∈beide steekproeven gecombineerd
o ^p=
totaal aantal individuen∈beide steekproeven gecombineerd
Let op: gebruik deze toets alleen als de aantal successen en niet-successen in beide
samples minimaal 5 zijn.
Voldoet je sample hier niet aan? Ook dan mag je de plus-vier methode toepassen. Je
voegt dan bij elke sample 1 succes en 1 niet-succes toe.

Relatief risico
Je kunt proporties vergelijken door het betrouwbaarheidsinterval te berekenen, maar ook
door de ratio te nemen. Een proportie wordt dan gezien als een risico dat iets zal gebeuren.
Je kunt dus twee risico’s vergelijken met de ratio van de twee proporties (relatief risico). Een
relatief risico van 1 betekent dat de proporties gelijk zijn. Je berekent het relatief risico door
^p 1
RR =
^p 2

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller lunaerasmus2020. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.68. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

77988 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$8.68  17x  sold
  • (2)
  Add to cart