Deze samenvatting van alle hoofdstukken van blok 1.3 statistiek aan de Erasmus Universiteit Rotterdam is aan de hand van het hoorcollege en het boek 'Introduction to the practice of statistics (eighth edition)' van Moore, McCabe en CRAIG gemaakt. Er worden verhelderende voorbeelden gegeven en dia's...
Hoorcollege 1 Statistiek
Waarom statistiek?
Onderzoek uitvoeren en interpreteren van de resultaten. Behandelingen beoordelen.
Herhaling 1.3
Twee soorten statistiek
1/ Beschrijvende statistiek = samenvatten, organiseren van kwantitatieve onderzoeksresultaten.
Voorbeeld: wat is er gevonden in de data, hypothese opstellen.
2/ Inferentiele statistiek = toetsen, trekken van conclusies over een populatie op basis van de
onderzoeksresultaten afkomstig uit een steekproef.
Voorbeeld: deze hypothese toetsen en kijken naar andere factoren en relaties tussen variabelen.
Flowchart
Soorten toetsen die er zijn → t-test, correlatie, regressie (modellen worden getoetst middels
interventie groep of controle groep.
- Interventiegroep
- Controle groep
Alles is hetzelfde tussen de twee groepen of alleen het gemiddelde is anders tussen de groepen.
Voorbeeld: continue data gewicht en lengte. Langer en gemiddeld zwaarder hypothese. De relatie is
lineair (lengte 1 cm toe, gewicht 1 cm toe), constant. Dit is een model over de werkelijkheid. Dit kan
getest worden m.b.v. correlatie.
Kwalitatieve variabelen: data waarmee gewerkt wordt en kan variëren. Het kan op verschillende
meetniveaus zijn. Uitgedrukt in woorden.
➢ Nominaal = de ene categorie is niet meer / beter dan de andere. Onderscheid en geen
rangorde.
Naam / nominaal.
Voorbeeld: peren en appels.
➢ Ordinaal = wel rangorde en onderscheid, maar daarmee is alles gezegd, ongelijke afstanden
tussen waarden.
Voorbeeld: spinnen (hoe enger de spin wordt). De afstand in eenheid, de categorie, is NIET
hetzelfde tussen alle spinnen.
Meetniveaus: kwantitatieve variabelen
Kwantitatieve variabelen: getal met echte betekenis. Uitgedrukt in getallen en eenheden.
➢ Interval: afstanden tussen de waarden zijn interpeteerbaar en vergelijkbaar, geen absoluut
nulpunt (niet natuurlijk). Je kan kijken naar de intervallen en niet naar ratio.
Voorbeeld: lengte heeft absoluut nulpunt (je kan niet kleiner zijn dan 0 cm).
Voorbeeld: vragenlijst met scores van 0-5 (zelf het nulpunt maken, geen absoluut natuurlijk
nulpunt).
1
, ➢ Ratio: meetschalen met nulpunt. Voldoet aan alle eisen en heeft een absoluut nulpunt
waardoor het delen van waarden ook interpeteerbaar is.
Voorbeeld: lengte, gewicht, inkomen.
Op volgorde = N O I R (van niet specifiek naar heel specifiek)
Frequentieverdeling
Frequentietabel (veel data weergegeven) / Frequentiegrafiek (fijner de data weergegeven).
→ Is het grafiek?
- Unimodaal = 1 top
- Biomodaal = 2 of meer toppen
- Symmetrisch of geen symmetrische verdelingen (meestal symmetrisch unimodaal)
- Scheef naar rechts = welke kant wijst de neus van de hak → Rechts
- Scheef naar links = welke kant wijst de neus van de hak → Links
Centrummaten
Modus = meest voorkomende score
Mediaan = de middelste score. Formule >
Gemiddelde = De som van alle scores gedeeld door aantal scores. Formule >
Sommige centrummaten zijn gevoelig voor de verdelingen. Waarvoor kies je? Mediaan omdat
gemiddelde wordt beïnvloed. Of het kan dichtbij elkaar liggen.
Voorbeeld: scheef naar links, het gemiddelde wordt naar links getrokken. Scheef naar rechts, het
gemiddelde wordt naar rechts getrokken.
Hoe ziet de verdeling eruit en daarna naar de berekeningen van centrummaten.
Spreidingsmaten
We weten waar het midden zit. Hoe ziet de spreiding eruit?
Spreiding = zitten de waarden van de variabelen dichtbij elkaar of ver van elkaar af?
Variantie (S)= berekenen voor de SD. Formule >
Standaarddeviatie (SD) = gemiddelde spreiding rond het gemiddelde. Wordt berekent aan de hand
van de variantie. Formule >
Wat wil je weten? Van alle personen uit de steekproef hoe iedere persoon van het gemiddelde afligt.
Alle afstanden wil je weten en optellen om de totale afstand gemiddeld te weten.
Probleem: hoge scores vallen tegen negatieve scores weg. Je kan geen afstanden pakken. + en –
moet niet uitmaken. Kwadraten omdat positieve waardes niet wegvallen van negatieve waarden.
De maat van spreiding lijkt groter door grotere dataset. N-1.
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper anoukopschoor99. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.