Deze samenvatting van alle hoofdstukken van blok 1.3 statistiek aan de Erasmus Universiteit Rotterdam is aan de hand van het hoorcollege en het boek 'Introduction to the practice of statistics (eighth edition)' van Moore, McCabe en CRAIG gemaakt. Er worden verhelderende voorbeelden gegeven en dia's...
Hoorcollege 1 Statistiek
Waarom statistiek?
Onderzoek uitvoeren en interpreteren van de resultaten. Behandelingen beoordelen.
Herhaling 1.3
Twee soorten statistiek
1/ Beschrijvende statistiek = samenvatten, organiseren van kwantitatieve onderzoeksresultaten.
Voorbeeld: wat is er gevonden in de data, hypothese opstellen.
2/ Inferentiele statistiek = toetsen, trekken van conclusies over een populatie op basis van de
onderzoeksresultaten afkomstig uit een steekproef.
Voorbeeld: deze hypothese toetsen en kijken naar andere factoren en relaties tussen variabelen.
Flowchart
Soorten toetsen die er zijn → t-test, correlatie, regressie (modellen worden getoetst middels
interventie groep of controle groep.
- Interventiegroep
- Controle groep
Alles is hetzelfde tussen de twee groepen of alleen het gemiddelde is anders tussen de groepen.
Voorbeeld: continue data gewicht en lengte. Langer en gemiddeld zwaarder hypothese. De relatie is
lineair (lengte 1 cm toe, gewicht 1 cm toe), constant. Dit is een model over de werkelijkheid. Dit kan
getest worden m.b.v. correlatie.
Kwalitatieve variabelen: data waarmee gewerkt wordt en kan variëren. Het kan op verschillende
meetniveaus zijn. Uitgedrukt in woorden.
➢ Nominaal = de ene categorie is niet meer / beter dan de andere. Onderscheid en geen
rangorde.
Naam / nominaal.
Voorbeeld: peren en appels.
➢ Ordinaal = wel rangorde en onderscheid, maar daarmee is alles gezegd, ongelijke afstanden
tussen waarden.
Voorbeeld: spinnen (hoe enger de spin wordt). De afstand in eenheid, de categorie, is NIET
hetzelfde tussen alle spinnen.
Meetniveaus: kwantitatieve variabelen
Kwantitatieve variabelen: getal met echte betekenis. Uitgedrukt in getallen en eenheden.
➢ Interval: afstanden tussen de waarden zijn interpeteerbaar en vergelijkbaar, geen absoluut
nulpunt (niet natuurlijk). Je kan kijken naar de intervallen en niet naar ratio.
Voorbeeld: lengte heeft absoluut nulpunt (je kan niet kleiner zijn dan 0 cm).
Voorbeeld: vragenlijst met scores van 0-5 (zelf het nulpunt maken, geen absoluut natuurlijk
nulpunt).
1
, ➢ Ratio: meetschalen met nulpunt. Voldoet aan alle eisen en heeft een absoluut nulpunt
waardoor het delen van waarden ook interpeteerbaar is.
Voorbeeld: lengte, gewicht, inkomen.
Op volgorde = N O I R (van niet specifiek naar heel specifiek)
Frequentieverdeling
Frequentietabel (veel data weergegeven) / Frequentiegrafiek (fijner de data weergegeven).
→ Is het grafiek?
- Unimodaal = 1 top
- Biomodaal = 2 of meer toppen
- Symmetrisch of geen symmetrische verdelingen (meestal symmetrisch unimodaal)
- Scheef naar rechts = welke kant wijst de neus van de hak → Rechts
- Scheef naar links = welke kant wijst de neus van de hak → Links
Centrummaten
Modus = meest voorkomende score
Mediaan = de middelste score. Formule >
Gemiddelde = De som van alle scores gedeeld door aantal scores. Formule >
Sommige centrummaten zijn gevoelig voor de verdelingen. Waarvoor kies je? Mediaan omdat
gemiddelde wordt beïnvloed. Of het kan dichtbij elkaar liggen.
Voorbeeld: scheef naar links, het gemiddelde wordt naar links getrokken. Scheef naar rechts, het
gemiddelde wordt naar rechts getrokken.
Hoe ziet de verdeling eruit en daarna naar de berekeningen van centrummaten.
Spreidingsmaten
We weten waar het midden zit. Hoe ziet de spreiding eruit?
Spreiding = zitten de waarden van de variabelen dichtbij elkaar of ver van elkaar af?
Variantie (S)= berekenen voor de SD. Formule >
Standaarddeviatie (SD) = gemiddelde spreiding rond het gemiddelde. Wordt berekent aan de hand
van de variantie. Formule >
Wat wil je weten? Van alle personen uit de steekproef hoe iedere persoon van het gemiddelde afligt.
Alle afstanden wil je weten en optellen om de totale afstand gemiddeld te weten.
Probleem: hoge scores vallen tegen negatieve scores weg. Je kan geen afstanden pakken. + en –
moet niet uitmaken. Kwadraten omdat positieve waardes niet wegvallen van negatieve waarden.
De maat van spreiding lijkt groter door grotere dataset. N-1.
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller anoukopschoor99. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.21. You're not tied to anything after your purchase.