Week 1
Steekproefverdeling (sampling distrubution): De steekproevenverdeling is in te beelden als de
verdeling die je zou krijgen als je een steekproef (van een bepaalde grootte n) oneindig vaak zou
herhalen, dat geeft een schatting van de werkelijke variabiliteit van de hele populatie.
Een normale steekproefverdeling gaat over het gemiddelde van een enkele steekproef.
Een steekproefverdeling schat hoeveel variabiliteit (spreiding) tussen steekproeven we bij toeval
kunnen verwachten als gevolg van steekproeffouten: de steekproefstatistiek komt niet voor in de
gehele populatie, maar alleen in de steekproef. Een steekproeffout is het gevolg van verschillende
steekproeven (sommige steekproeven bevatten bijvoorbeeld meer depressieve mensen). De
steekproefverdeling sampling distrubution is normaal verdeeld.
Een hypothese is een voorlopige stelling waarin je aangeeft wat je verwacht te vinden over de
populatieparameters.
Nulhypothese ( H 0 ¿ : Er is sprake van alleen toeval en er bestaat dus in de populatie geen
verband of verschil. Er is dus geen significant verschil. Je noteert het als H 0 :=x
Alternatieve hypothese ( H a ): Er is sprake van een significant verschil/verandering/relatie. Er
is een verschil tussen de gemiddelden van twee populaties.
Je kan alternatieve hypothese op verschillende manieren noteren, eenzijdig of tweezijdig:
Eenzijdige alternatieve hypothese: Als de alternatieve hypothese al een richting geeft aan
het verschil (bijvoorbeeld mannetjes kikkers zijn groter dan vrouwtjes kikkers) mag je
éénzijdig toetsen.
- Rechtsdraaiende alternatieve hypothese: H a :>0
- Linksdraaiende alternatieve hypothese: H a :<0
Tweezijdige alternatieve hypothese: Bij een tweezijdige test kan het effect onder de
alternatieve hypothese zowel positief of negatief zijn. H a :≠ 0
,Als je de nulhypothese niet verwerpt, betekend dat niet dat de nulhypothese per se waar is. Het kan
zijn dat we de juiste alternatieve hypothese gewoon nog niet gevonden hebben.
Steekproefstatistiek: gemiddelde, variantie of mediaan van een steekproef
Gemiddelde van een steekproef is X en standaardafwijking is s
Gemiddelde van populatieparameter is en de standaardafwijking is
Significantie: het is onwaarschijnlijk dat het resultaat toeval is.
Afwijzingscriterium (significantieniveau) is standaard = 0.05. Als het significantieniveau 0.05 is,
betekent dit dat deze statistiek in slechts 5% van de gevallen zult vinden wanneer de nulhypothese
juist is. Als de p kleiner is dan 0.05 verwerpen we de nulhypothese. Als de p groter is dan 0,05
behouden we de nulhypothese en is er geen sprake van een significant resultaat. Als we een p-waarde
van 0,03 vinden betekent dit dat als de nulhypothese waar zou zijn, de kans dat we dat zouden vinden
slechts 0,03 is.
Alle extreme steekproefstatistieken, die onwaarschijnlijk zijn als de nulhypothese waar zou zijn, vallen
in het verwerpingsgebied. Als de steekproefstatistiek zich dus in het verwerpingsgebied bevindt,
mogen wij de H 0 verwerpen .
De p-waarde is de kans dat het resultaat berust op toeval. P < betekend dat we de H 0verwerpen.
Deze valt te vinden op
https://www.socscistatistics.com/pvalues/.
Je kunt ook de kritische waarde Z a bepalen, dat zijn waarden die de grens van een afkeuringsgebied
vormen. Als de Z > Z a wordt de H 0verworpen en Z < Z awordt H 0aangehouden. Dit geldt alleen bij
een positief getal, bij een negatief getal is het andersom. Als de z-waarde verder van 0 is verwijderd
dan de kritische z-waarde, verwerpen we de nulhypothese. Als de z-waarde dichter bij 0 ligt dan de
kritische z- waarden behouden we de nulhypothese.
Bij een tweezijdige toetsing wordt het significantieniveau 5% verdeelt over twee vlakken, dus verwerp
je de laagste en hoogste 2,5%.
Fouten:
Type 1 fout: als H 0 wordt verworpen, terwijl H 0waar is. We vinden een verschil dat er
eigenlijk niet is. De kans dat deze fout wordt gemaakt is even groot als .
Type 2 fout: als H 0 behouden blijft, terwijl de H a waar is. We vinden geen verschil, terwijl er
wel een verschil is. De kans bij het maken van deze fout wordt aangegeven door
Power: de kans dat H 0 wordt verworpen en dit ook daadwerkelijk klopt. De power bereken je door 1 -
te doen.
Week 2
Twee soorten willekeurige variabelen:
Discreet: variabelen met beperkt aantal mogelijke waarden, BV een dobbelsteen
Continu: variabelen die oneindig veel mogelijke waarden kan aannemen, BV temperatuur
Kansen is de verhouding tussen (teller) aantal specifieke uitkomsten en (noemer) totaal aantal
mogelijke uitkomstenzijn. Verhoudingen zijn gebaseerd op gegevens van steekproeven. BV tien keer
3 1
een munt opgooien en drie keer kop krijgen heeft de verhouding = 0,3 terwijl de kans op kop is =
10 2
, 0,5 = 50%. Bij een continue variabele kunnen we alleen zeggen wat de kans is op een waarde binnen
een bepaald interval.
De verwachtingswaarde is het gemiddeld wat je verwacht te kunnen halen als je steekproeven maar
vaak genoeg herhaald. Deze kan worden berekend met de formule:
BV
Je had ook het aantal kinderen x count kunnen doen en delen door n.
Stappen:
1. Bereken de proportie uit. Dat doe je door de frequentie te delen door totale n
2. Dan vermenigvuldig je elke proportie met bijhorende X op
3. Deze tel je allemaal bij elkaar op
De wet van grote getallen: hoe groter een steekproef, hoe groter de kans dat het
steekproefgemiddelde lijkt op de werkelijke populatiegemiddelde
De variantie voor de gehele populatie kan ook berekend worden. De formule is;
( xi−x ). 2
Bij de variantie van steekproef gaat het als volgt: ∑
n−1
Stappen:
1. Bereken de verwachtingswaarde (gemiddelde uit).
2. Trek bij elke X het gemiddelde eraf
3. Doe het antwoord dat je krijgt bij stap 2 in het kwadraat
4. Vermenigvuldig het antwoord van stap 3 met de proportie
5. Tel alles bij elkaar op.
Transformatie: als we de variabele willen veranderen, omdat sommige resultaten in een andere
eenheid worden weergeven. Dit gebruik je BV als je twee variabelen met een andere eenheid wilt
samenvoegen of als je gewoon de eenheid wilt veranderen. De nieuwe verwachte waarde veranderd,
maar de variantie blijft hetzelfde.
Verschillende soorten transformaties:
Het optellen van een bepaalde waarde (), BV lengte meten van een kind dat op een stoel
staat
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller yara20. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.86. You're not tied to anything after your purchase.