Dit document omvat een uitgebreide uitwerking / samenvatting van alle hoorcolleges met betrekking op het vak MTO-B MAW: inleiding statistiek. Dit helpt voor een optimale voorbereiding voor het tentamen.
BESCHRIJVENDE EN INFERENTIËLE STATISTIEK
• Beschrijvende statistiek → je beschrijft daar dingen mee → je vat het samen
- Gebruik: kwantitatieve samenvatting van informatie/data
- Relevantie jargon: summery statistics, gemiddelde, mediaan, modus,
variatie, standaarddeviatie, covariantie, frequentieverdeling, histogram,
etc
• Inferentiële statistiek → data observeren en dan generaliseren → conclusies
trekken voor het algemene op basis van steekproef
- Gebruik: maak inductieve inferenties van data (een steekproef) naar een
meer algemene situatie (de populatie)
- Relevante jargon: Sampling error, standaardfout, schatten, confidence,
intervals, margin of error, hypothesetoetsing etc.
RANDOM VARIABELEN (X)
• Geslacht, werkstatus etc zijn random variabelen (= het kan variëren en het
heeft met kansen te maken, vandaar random)
• Random variabelen = Variabelen waarvan de mogelijke uitkomsten het
resultaat zijn van een random fenomeen
• Statistische notatie: Meestal X of Y
• Specifieke uitkomsten en specifieke observaties worden opgeschreven met
een kleine x of y
KWANTIFICEREN VAN RANDOM VARIABELEN
• Het meetniveau van een variabele bepaalt wat voor betekenis de nummers
die we toewijzen hebben
• Het meetniveau van een random variabele bepaalt wat voor analyses je er
beter wel/niet op kan uitvoeren
MEETNIVEAUS VAN RANDOM VARIABELEN
• Nominale variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
• Ordinale variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
• Interval variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
3. De intervallen tussen elk van de geordende uitkomsten is betekenisvol en
dezelfde grootte
• Ratio variabelen
1
, 1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
3. De intervallen tussen elk van de geordende uitkomsten is betekenisvol en
dezelfde grootte
4. Absoluut nulpunt: een nul betekent dat de gemeten eigenschap afwezig is
DISCRETE VS CONTINUE RANDOM VARIABELEN
• Discrete variabele
- De mogelijke uitkomsten voor de variabelen zijn te vangen in een eindige,
telbare lijst van waarden
- Voorbeelden: aantal kinderen per gezin, sekse categorieën of
beroepsgroep (je kan niet iets hebben wat er tussenin ligt)
• Continue variabelen
- De mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen
van -oneindig tot oneindig)
- Voorbeelden: Leeftijd (niet afgerond), hoeveelheid geschonken alcohol,
dosering in grammen, lengte (je kan de tussenliggende waarde ook
meten)
FREQUENTIEVERDELINGEN EN KANSVERDELINGEN
• Frequentie (van de uitkomsten van een random variabele) → hoe vaak een
bepaalde uitkomst is geobserveerd
• Frequentie verdelingen → een tabel of grafiek die weergeeft hoe vaak een
bepaalde uitkomst is geobserveerd, voor elke mogelijke uitkomst voor die
variabele
• Kans → de relatieve frequentie van de uitkomst → hoe vaak de uitkomst
voorkomt in verhouding tot het totaal aantal observaties
• Kans verdelingen → laten de kans zien op elke mogelijke uitkomst voor een
random variabele → deze kansen moeten altijd opgeteld 1 zijn
DISCRETE EN CONTINUE KANSVERDELINGEN
• Bij discrete kansverdelingen
kun je alleen bepaalde
waardes observeren en voor
elke mogelijke uitkomst zie je
dan een balkje met de
hoeveelheid
• Bij continue kansverdelingen
kun je ook alle tussenliggende waarde observeren en als je dan voor elke
waarde een puntje zal zetten dan wordt het uiteindelijk een lijn
BESCHRIJVENDE STATISTIEKEN
• Centrummaten
- Beschrijven het ‘centrum’ of ‘midden’ of ‘typische waarde’ voor een
variabele
- Modus, mediaan en het gemiddelde
• Spreidingsmaten
2
, - Beschrijven de variatie, spreiding, breedte van variabele
- Bereik, variantie en standaarddeviatie
CENTRUMMATEN
• Modus
- De uitkomst die het vaakst voorkomt → de uitkomst met de hoogte
frequentie
• Mediaan
- De waarde die de hoogste helft van de data scheidt van de laagste helft
van de data
- 50% van de data ligt boven deze waarde en 50% ligt onder deze waarde
• Gemiddelde
- Tel alle observaties voor variabele X op (neem de som van X)
- Bepaal het totale aantal observaties, we noemen dat getal N of n
- We delen de som uit stap 1 door het totale aantal observaties van stap 2
- Notatie: µ voor het gemiddelde van de
populatie
- Notatie: X̄ voor het gemiddelde van een
steekproef
SPREIDINGSMATEN
• Bereik
- Het verschil tussen de laagste en de hoogste waarde van de variabele
• Variantie & standaarddeviatie
- Het idee: hoe ver zijn observaties, gemiddelde genomen, van het centrum
van de verdeling
- We nemen het gemiddelde als centrum van de verdeling
• Variantie → de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking
(deviatie) van het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2
4. Bepaal het totaal aantal observaties, we noemen dat aantal n of N
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal
observaties
• Standaarddeviatie → de wortel de variatie. Handig om
te hebben omdat het uitgedrukt wordt in dezelfde
eenheden als de observaties i.p.v. die kwadraten in de
variantie
1. Bereken de variantie
2. Neem de wortel van de variantie
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper fleurkooops. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.