Samenvatting Toetsende
statistiek
Week 1 Steekproevenverdeling en Hypothesetoetsing
H0= 0 hypothese (het normaal) -> ‘niets aan de hand’
- De term komt van het feit dat het stelt dat de populatiegemiddelden niet van
elkaar verschillen.
Ha= alternatieve hypothese -> wat je denkt dat er aan de hand
Hypothese - > uitspraken over parameters in de populatie
- > statistiek begint altijd met een nulhypothese (er is geen verschil)
Steekproef error -> doordat een steekproef een selectie aan scores uit een populatie heeft,
zal een steekproefwaarde (zoals het gemiddelde) waarschijnlijk afwijken van die populatie.
Eenzijdige hypothese: links -> kleiner, rechts -> groter
Tweezijdige hypothese: hangt af van kennis en verwachting
- Statistiek is onderdeel van de wiskunde (oefenen en precies zijn)
- Statistiek is niet zwart/wit (er is veel discussie)
- Het vak is lastig (veel oefenen)
Steekproevenverdeling (sampling distribution)
o Geeft aan welke waarden we kunnen verwachten bij een bepaalde statistiek
onder vooraf gedefinieerde condities.
o Verdeling van statistieken van alle mogelijke steekproeven van een specifieke
grootte (n) populatie
o Standaarddeviatie is hier de standaard error
P-waarde
o De kans dat je een specifieke test vindt met deze statistieken of een
extremere een als de 0-hypothese waar is
Hypothese test
o Om te onderzoeken of iets toeval is of werkelijk een verschil
o Een statistische methode dat ‘sample data’ gebruikt om een nul-hypothese te
evalueren
Fisher
o De p-waarde laat de sterkte van het bewijs tegen de nul-hypothese zien.
o Fisher concludeert dat wanneer we de nulhypothese niet kunnen verwerpen,
we nog niet genoeg data hebben gevonden om de nulhypothese aan te
nemen.
o Fisher zou meer data gaan verzamelen, en concluderen dat het onderzoek
heeft ‘gefaald in het verwerpen van de nulhypothese’
Neyman-Pearson
1
, o Stellen dat we de nulhypothese simpelweg kunnen accepteren tot het
tegendeel wordt bewezen. Dit heeft het risico dat we de nulhypothese
onterecht accepteren.
o We kunnen beslissen of de 0-hypothese goed is, of de alternatieve
We wijzen H0 af als x ≥ X⍺
o Het bepaalde niveau waarop we H0 verwerpen
⍺= .05 (dan is H0) niet correct
o We wijzen H0 af als de hypothese waarde: P ≤ ⍺
o Hoe lager de p-waarde, des te sterker het bewijs voor de nul-hypothese
o Iets conservatiever: P≤.01
o Dit heet het significantieniveau of het verwerpingsniveau. Elke uitkomst met
een kans, onder H0, kleiner dan of gelijk aan het significantieniveau valt in het
verwerpingsgebied en dus wordt H0 verworpen.
T-test
o Wordt onder andere gebruikt om te bepalen of twee steekproeven uit
populaties met hetzelfde gemiddelde afkomstig zijn.
Type 1 fout -> (⍺) -> de nul-hypothese afwijzen terwijl die klopt
- Om de kans op een type 1 fout te verkleinen, kan het significantieniveau verschoven
worden naar .01. Dit vergroot wel de kans op een type 2 fout.
Type 2 fout -> (β) -> de nul-hypothese niet afwijzen terwijl hij niet klopt
- In de meeste gevallen weet je niet hoe groot β is, omdat we niet weten hoe de
werkelijke distributie van een bepaalde populatie is
De juiste beslissing over hoe groot het significantieniveau moet zijn, hangt af van wat
je onderzoekt en welke type fout je probeert te voorkomen. Voor nieuwe therapieën
wil je vooral een type 1 fout voorkomen, dus dan gebruik je een strengere ⍺.
Werkelijke situatie
Beslissing H0 is juist H0 is onjuist
H0 verwerpen Type 1 fout p =⍺ Juiste beslissing p = 1- β = power
H0 niet verwerpen Juiste beslissing p= 1- ⍺ Type 2 fout p = β
Eenzijdige/directionele test:
- alleen kijken naar een alternatieve hypothese die óf hoger óf lager is. Dus de
bovenste 5% verwerpen óf de onderste 5% verwerpen. Dit is een keuze die je van
tevoren al maakt, waardoor je het risico loopt dat de waarde aan de andere kant
eruit schiet, maar je vervolgens de H0 niet verwerpt.
Tweezijdige/niet-directionele test:
- Kijken naar extreem hoge én extreem lage uitkomst. Je verwerpt dus de laagste 2,5%
en de hoogste 2,5%. Het nadeel is nu wel dat een score die met een eenzijdige test
wel in het verwerpingsgebied viel, nu niet in het verwerpingsgebied valt, omdat het
maar 2,5% is i.p.v. 5%.
Tweezijdig testen komt vaker voor, omdat we vaak niet weten in welke richting een
mogelijk verschil zal voorkomen. En het is ook een voorzorgsmaatregel. Maar de
uiteindelijke keus voor eenzijdig of tweezijdig testen is afhankelijk van de ernst van
fouten.
2
,Effectgrootte -> de grootte van het effect van een bepaalde meting.
Als je een statische significante relatie hebt betekent niet per se een praktische
significantie.
Samenvatting:
1) Hypothese Combinatie H0 en Ha
2) Steekproevenverdeling Distributie van statistieken onder H0
3) Test statistieken Sample statistiek -> toets statistiek
4) Afwijzen H0 afwijzen met (p-waarden en ⍺ en β)
5) Statistische conclusie H0 afwijzen of niet
6) Conclusie (inhoudelijk) antwoord onderzoeksvraag
Je kunt H0 nooit ‘accepteren’
3
, Week 2 Basisconcepten van Waarschijnlijkheid
Random variabelen -> variabele die we krijgen voor steekproeven te nemen
n
Formule verwachte waar x -> ∑ pi x i
i=1
- Werkt alleen bij random variabele + discrete waarde
The law of large numbers
- Hoe groter de sample is, hoe dichterbij het sample gemiddelde bij de populatie
gemiddelde ligt
- Staat aan basis voor een aantal statistische ideeën.
Variantie van random variabelen (sample):
n
σ 2 x=∑ pi ( x i−μx )2
i=1
Algebra
- Vermenigvuldigen met b
o Nieuwe verwachte waarde: 𝝁 y = b 𝝁 x
o Nieuwe variantie: 𝝈2y = b2𝝈2x
- Toevoegen van a
o Nieuwe verwachte waarde: 𝝁 y = a + 𝝁 x
o Nieuwe variantie: 𝝈2y = 𝝈2x
- Lineaire transformaties
o Nieuwe verwachte waarde: 𝝁 y = a + b 𝝁 x
o Nieuwe variantie: 𝝈2y = b2 𝝈2 x
- Som van random variabelen
o Nieuwe verwachte waarde: 𝝁x + y = 𝝁 x +𝝁y
o Nieuwe variantie: 𝝈2 x + y = 𝝈2 x + 𝝈2 y + 2pxy 𝝈x 𝝈y
𝝆 = Rho = correlatie
Disjunct -> wederzijds uitsluitend
Wet van kansrekeningen
- Toevoegende wet van mogelijkheid voor disjunct gebeurtenissen:
o P(A of B) = P(A) + P(B)
- Toevoegende wet (algemeen) -> niet disjunct
o P(A of B) = P(A) + P(B) – P(A en B)
- Complementen wet
o P(A) = 1 – P(Ac)
- Vermenigvuldiging wet van mogelijkheid voor onafhankelijke gebeurtenissen
o P(A en B) = P(A) x P(B)
- Vermenigvuldiging wet van mogelijkheid voor afhankelijke gebeurtenissen
o P(A en B) = P(A) x P(B/A)
Marginale kans:
- Gaat over 1 variabele (totale)
- Somregel (óf) -> kans op 1 i.p.v. 2
- Totaal bekijken
Conditionele kans
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper martinespaapen84. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.