Beschrijvende En Inferentiele Statistiek (S_PMBIS)
Instelling
Vrije Universiteit Amsterdam (VU)
Een beknopte samenvatting van 33 bladzijdes waar alle stof van module 0 t/m 13 aanbod komt.
Van de kennisclips tot de hoorcolleges en van de literatuur tot de oefentoetsen! (eindcijfer 8.5)
5. De steekproevenverdeling ........................................................................................................................ 12
12. Beschouwing van het effect van X op Y en van verklaarde variantie ........................................................ 30
13. Het interpreteren van regressieresultaten .............................................................................................. 33
,0. Introductie & Statistische concepten
Ultieme doel is door middel van data, kennis vergaren over de wereld om ons heen. Gegevens
(data) verzamelen, bewerken, interpreteren en presenteren
Beschrijvende statistiek = samenvatting van de verkregen data - hoe zien de data eruit?
Inferentiële statistiek = uitspraken en voorspellingen doen over hele populatie op basic van
de verkregen data (steekproef) wat zeggen de data van de steekproef over de gehele
populatie?
Variabelen zijn kenmerken van iets of iemand = kenmerken (v.d. speler zoals aantal goals en
leeftijd) Cases zijn die dingen of personen = spelers/team/school/bedrijf
Variabelen = verschillen (uit welke stad komen de teams uit de eredivisie?
Contant = hetzelfde (uit welk land komen de teams uit de eredivisie?
Categorische variabelen:
- Bestaan uit woorden, kenmerken en categorieën (geslacht, nationaliteit, religie)
- Nominaal = zonder rangorde, zoals nationaliteit
- Ordinaal = met rangorde, zoals team in een voetbalcompetitie
Kwalitatieve variabelen:
- Interval en ratio
- In cijfers en getallen
- Bijvoorbeeld leeftijd, gewicht, inkomen
- Hier is ook vaak een rangorde in (hoogste VS laagste of lichtste VS zwaarste)
- Discreet = variabelen met hele cijfers. Hoeveel kinderen: 0, 1, 2, 3 ect.
- Continue (Continuous) = variabelen zonder hele cijfers. Lengte, gewicht ect.
Levels of measurement
- Nominale variabele met twee categorieën = dichotoom
- Onderscheid tussen interval en ratio is niet belangrijk
- Een beter voorbeeld van een interval variabele (i.p.v. leeftijd) is tempratuur
- Leeftijd is in veel gevallen wel een ratio variabelen
2
,1. Beschrijvende statistieken
Data (statistische analyses) wordt in een data matrix gezet. (Overzicht wat altijd nodig is)
Verticaal staan alle cases (spelers) en horizontaal staan alle variabelen (leeftijd, gewicht)
CASES VARIABELEN
Player 1 Blond
Player 2 Bruin
Player 3 Blond
Player 4 Zwart
Ect. Ect.
Een data matrix kan zo heel lang doorgaan als er veel cases zijn (b.v. spelers in een
competitie). In plaats van een data matrix kan er daarom een frequentietabel gebruikt
worden met alle mogelijke variabelen.
Cumulatief percentage = percentages bij elkaar opgeteld.
Bij Continue (Continuous) categorieën = geen gehele getallen
= Intervallen gebruiken (gewicht = minder dan 70, 70-75, 76 – 80)
Van discreet naar continue is erg makkelijk, andersom is niet mogelijk.
Data samenvatten -> een frequentietabel -> grafiek
Categoriale variabelen =
- Cirkeldiagram (zie je beter het percentage, beter bij weinig categorieën)
- Staafdiagram (zie je beter de hoeveelheid cases, beter bij meer categorieën)
Kwalitatieve variabelen =
- Puntplot (handig bij maar paar observaties)
- Histogram – pareto charts (handig bij meer observaties)
- Klokvormig/symmetrisch
- Uni modaal is histogram met 1 piek en bimodaal is histogram met 2 pieken
- Scheef (niet eerlijk verdeeld, uitsteeksel)
- scheef naar links verdeeld is als je links de berg af kan skiën
3
, 1.2 Maten van centraliteit
§ Modus (MODE)
- De waarde die het meeste voorkomend
- Komt vaak voor bij nominaal of ordinaal
- Kunnen ook twee modus zijn
§ Mediaan (MEDIAN)
- De middelste waarde van je observatie
- In orde zetten van hoog naar laag
- Bij een even aantal observatie het gemiddelde nemen
- Is resistent tegen veranderingen. Als een cijfer veranderd blijft mediaan hetzelfde
§ Middel van het gemiddelde (MEAN)
- Het gemiddelde van alle waardes
- Alle waardes bij elkaar optellen gedeeld door aantal waardes
- Is niet resistent tegen veranderingen. Als een cijfer veranderd, veranderd de mean
Categoriaal = alleen modus mogelijk
Kwantitatief = mediaan of modus gebruiken
1.3 Maten van variantie
Twee maten van variabiliteit = het bereik en de interkwartielafstand
- Bereik (RANGE) = het verschil tussen de hoogste en laagste waarde
(Geen goede impressie van de variabiliteit)
- Interkwartielafstand = De afstand tussen Q1 en Q3 (IKA)
- Boxplot = is een box tussen de mediaan van Q1 en Q3
- Outliers = alles meer dan 1.5 keer de interkwartielafstand (IKA) van Q1 en Q3
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Amber2308. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,29. Je zit daarna nergens aan vast.