100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Statistiek: Verklaren en Voorspellen (alle college's uitgewerkt) €5,49
In winkelwagen

College aantekeningen

Statistiek: Verklaren en Voorspellen (alle college's uitgewerkt)

 1 keer bekeken  0 keer verkocht

Alle college's uitgewerkt van statistiek

Voorbeeld 4 van de 33  pagina's

  • 15 november 2023
  • 33
  • 2023/2024
  • College aantekeningen
  • Bruno bocanegra
  • Alle colleges
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
avatar-seller
alysiadejong
Hoorcollege 1

Er zijn twee soorten statistiek
- Beschrijvende statistiek: samenvatten/organiseren van kwantitatieve
onderzoeksresultaten
- Inferentiële statistiek: toetsen en het trekken van conclusies over een populatie op
basis van onderzoeksresultaten afkomstig uit een steekproef

Categorische variabelen
- Nominaal: verschillen in groepen (mannen en vrouwen)
- Ordinaal: rangorde in groepen, de ene groep is ‘beter’ of ‘meer’ dan de andere groep
(bijv. SES)

Continue variabelen
- Interval: er is geen 0 punt, de afstanden tussen de waarden is gelijk (IQ)
- Ratio: er is een absoluut 0 punt, en voldoet aan alle voorgaande eisen (gewicht,
lengte, inkomen)

Frequentieverdeling
- Symmetrisch, de kans dat iemand hoog scoort is hetzelfde als laag en afname
- Rechts scheve verdeling, mediaan ligt voor het gemiddelde
- Links scheve verdeling, mediaan ligt na het gemiddelde




Centrummaten
- Modus: meest voorkomende score
- Mediaan: middelste score
- Gemiddelde: som van alle scores gedeeld door het totale aantal

Bij een scheve verdeling kijken we naar de mediaan
Bij een symmetrische verdeling kijken we naar het gemiddelde

Spreidingsmaten
Spreiding: zitten de waarden van een variabele dichtbij elkaar of ver van elkaar af
Standaarddeviatie is de gemiddelde spreiding rond het gemiddelde. Het wordt berekend
door de variantie
Variantie is gemiddelde gekwadrateerde afstand van een datapunt naar het gemiddelde

Standaard scores (z-score)
Aantal standaarddeviaties dat een score verwijderd is van het gemiddelde

Empirische cyclisch bij inferentiële statistiek
Observatie > idee/hypothese > voorspelling > testen > evaluatie

Nulhypothese (H0): geen verschil, beide groepen zijn gelijk
Alternatieve hypothese (Ha): wel verschil, beide groepen zijn niet gelijk

,Type I fout: H0 verwerpen maar dit klopt niet (bijv. onschuldig maar je zit wel in de
gevangenis)
Type II fout: Ha is waar, maar H0 verwerp je niet (bijv. schuldig maar je komt niet in de
gevangenis)

Steekproeven
Je trekt een steekproef door te randomiseren, hierdoor krijg je twee gelijke groepen
Steekproef verdeling: welke waarden zijn aannemelijk (dichtbij het midden) en welke
onaannemelijk (ver van het midden)

P-waarden
Bij een kleine p-waarde (doorgaans < 0.05) is er sterk bewijs dat de nulhypothese onjuist is
en wordt de nulhypothese doorgaans verworpen
Bij grotere p-waarde (> 0.05) is de bewijskracht tegen de nulhypothese zwak en wordt de
nulhypothese aangenomen
Een p-waarde dichtbij de grens (0.05) wordt marginaal genoemd, zodat er ook geen duidelijk
oordeel voor of tegen de nulhypothesen kan worden geveld

Als de standaarddeviatie niet bekend is dan gebruik je de one sample t-test, independent
sample t-test of de paired sample t-test
Als de standaarddeviatie wel bekend is gebruik je de z test

,Hoorcollege 2
H0: geen verschil tussen de groepen. Het gemiddelde is gelijk aan 0. Het is een
symmetrische verdeling

Welke verdeling gebruiken we voor het toetsen van een hypothese?
➢ De verdeling van streekproefgemiddelden
Een streekproefverdeling is dat je nagaat wat er zou gebeuren als je de steekproef keer op
keer zou trekken, wat is dan de verdeling van de resultaten

Voorbeeld: Hoeveel zal het streekproefgemiddelde variëren als we veel steekproeven van 16
mensen nemen?
Je kijkt naar de verdeling van steekproeven en dan het gemiddelde, niet naar de individuen.
Als je een setje van 16 mensen samenvat in 1 waarde, heb je veel meer informatie dan van
1 individu.
Als je 16 waardes gemiddeld neem, dan heb je veel minder spreiding/variabiliteit dan als je
individuen vergelijkt, omdat je dan dichterbij het populatiegemiddelde zit.
Met een grote sample size heb je dus meer zekerheid over wat je aan het testen bent

Het interval van 10 punten onder tot 10 punten boven het steekproefgemiddelde zal in 95%
van alle steekproeven van grootte 16 ‘vangen’

Proportie
Een proportie is het aantal successen / totaal aantal die je hebt in je steekproef

1.28 voor 80% betrouwbaarheidsinterval
1.645 voor 90% betrouwbaarheidsinterval

Het aantal successen en niet-successen moet in de steekproef beide minimaal 10 zijn voor
een betrouwbaarheidsinterval voor proportie.
Wat doe je als je dit niet hebt? De plus-vier methode, je voegt dan 2 successen en 2 niet-
successen toe.

Gebruik de significatie toets voor proportie alleen als de verwachte aantallen van successen
en niet-successen beide minimaal gelijk zijn aan 10 (normal)
Er moet ook een random steekproef gedaan zijn.

Significante toets voor vergelijken van twee proporties
- Je berekent de z-statistiek met een gepoolde proportie
- De data moet random zijn, willekeurig getrokken
- Normal; successen en niet-successen moeten minstens 5 zijn (want de groepen zijn
nu samen)
- Independent

Relatieve risico
Een relatief risico van 1 betekent dat twee proporties aan elkaar gelijk zijn. Je vergelijkt dus
twee proporties met elkaar

, Hoorcollege 3
Categorische variabelen
Chi-kwadraat
- Chi-kwadraat voor onafhankelijkheid
Bij frequenties op twee variabelen
Vertelt ons over relatie tussen twee nominale variabelen
- Chi-kwadraat test voor goodness of fit
Bij frequenties op maar één variabele
Vertelt ons hoe goed onze aantallen passen bij ‘idee’

Afhankelijke en onafhankelijke variabele zijn kwalitatief

Marginale verdeling
De verdeling die je hebt op één variabele waarbij je de andere
variabele buiten beeld laat
Bijv. de kans dat iemand rijk wordt, maar ik kijk niet naar het
verschil tussen man en vrouw
Dus je doet het totaal van de rij / gehele totaal




Conditionele verdeling
De verdeling conditioneel maken op een andere variabele, om de
relatie te bekijken
Bijv. de verdeling van de kans dat je rijk bent, conditioneel op je
geslacht
Dus je doet de variabele van man / totaal man

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper alysiadejong. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52928 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,49
  • (0)
In winkelwagen
Toegevoegd