Dit document omvat een uitgebreide uitwerking / samenvatting van alle hoorcolleges met betrekking op het vak MTO-B MAW: inleiding statistiek. Dit helpt voor een optimale voorbereiding voor het tentamen.
BESCHRIJVENDE EN INFERENTIËLE STATISTIEK
• Beschrijvende statistiek → je beschrijft daar dingen mee → je vat het samen
- Gebruik: kwantitatieve samenvatting van informatie/data
- Relevantie jargon: summery statistics, gemiddelde, mediaan, modus,
variatie, standaarddeviatie, covariantie, frequentieverdeling, histogram,
etc
• Inferentiële statistiek → data observeren en dan generaliseren → conclusies
trekken voor het algemene op basis van steekproef
- Gebruik: maak inductieve inferenties van data (een steekproef) naar een
meer algemene situatie (de populatie)
- Relevante jargon: Sampling error, standaardfout, schatten, confidence,
intervals, margin of error, hypothesetoetsing etc.
RANDOM VARIABELEN (X)
• Geslacht, werkstatus etc zijn random variabelen (= het kan variëren en het
heeft met kansen te maken, vandaar random)
• Random variabelen = Variabelen waarvan de mogelijke uitkomsten het
resultaat zijn van een random fenomeen
• Statistische notatie: Meestal X of Y
• Specifieke uitkomsten en specifieke observaties worden opgeschreven met
een kleine x of y
KWANTIFICEREN VAN RANDOM VARIABELEN
• Het meetniveau van een variabele bepaalt wat voor betekenis de nummers
die we toewijzen hebben
• Het meetniveau van een random variabele bepaalt wat voor analyses je er
beter wel/niet op kan uitvoeren
MEETNIVEAUS VAN RANDOM VARIABELEN
• Nominale variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
• Ordinale variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
• Interval variabelen
1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
3. De intervallen tussen elk van de geordende uitkomsten is betekenisvol en
dezelfde grootte
• Ratio variabelen
1
, 1. Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve
uitkomsten
2. Er is een betekenisvolle ordening in de mogelijke uitkomsten
3. De intervallen tussen elk van de geordende uitkomsten is betekenisvol en
dezelfde grootte
4. Absoluut nulpunt: een nul betekent dat de gemeten eigenschap afwezig is
DISCRETE VS CONTINUE RANDOM VARIABELEN
• Discrete variabele
- De mogelijke uitkomsten voor de variabelen zijn te vangen in een eindige,
telbare lijst van waarden
- Voorbeelden: aantal kinderen per gezin, sekse categorieën of
beroepsgroep (je kan niet iets hebben wat er tussenin ligt)
• Continue variabelen
- De mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen
van -oneindig tot oneindig)
- Voorbeelden: Leeftijd (niet afgerond), hoeveelheid geschonken alcohol,
dosering in grammen, lengte (je kan de tussenliggende waarde ook
meten)
FREQUENTIEVERDELINGEN EN KANSVERDELINGEN
• Frequentie (van de uitkomsten van een random variabele) → hoe vaak een
bepaalde uitkomst is geobserveerd
• Frequentie verdelingen → een tabel of grafiek die weergeeft hoe vaak een
bepaalde uitkomst is geobserveerd, voor elke mogelijke uitkomst voor die
variabele
• Kans → de relatieve frequentie van de uitkomst → hoe vaak de uitkomst
voorkomt in verhouding tot het totaal aantal observaties
• Kans verdelingen → laten de kans zien op elke mogelijke uitkomst voor een
random variabele → deze kansen moeten altijd opgeteld 1 zijn
DISCRETE EN CONTINUE KANSVERDELINGEN
• Bij discrete kansverdelingen
kun je alleen bepaalde
waardes observeren en voor
elke mogelijke uitkomst zie je
dan een balkje met de
hoeveelheid
• Bij continue kansverdelingen
kun je ook alle tussenliggende waarde observeren en als je dan voor elke
waarde een puntje zal zetten dan wordt het uiteindelijk een lijn
BESCHRIJVENDE STATISTIEKEN
• Centrummaten
- Beschrijven het ‘centrum’ of ‘midden’ of ‘typische waarde’ voor een
variabele
- Modus, mediaan en het gemiddelde
• Spreidingsmaten
2
, - Beschrijven de variatie, spreiding, breedte van variabele
- Bereik, variantie en standaarddeviatie
CENTRUMMATEN
• Modus
- De uitkomst die het vaakst voorkomt → de uitkomst met de hoogte
frequentie
• Mediaan
- De waarde die de hoogste helft van de data scheidt van de laagste helft
van de data
- 50% van de data ligt boven deze waarde en 50% ligt onder deze waarde
• Gemiddelde
- Tel alle observaties voor variabele X op (neem de som van X)
- Bepaal het totale aantal observaties, we noemen dat getal N of n
- We delen de som uit stap 1 door het totale aantal observaties van stap 2
- Notatie: µ voor het gemiddelde van de
populatie
- Notatie: X̄ voor het gemiddelde van een
steekproef
SPREIDINGSMATEN
• Bereik
- Het verschil tussen de laagste en de hoogste waarde van de variabele
• Variantie & standaarddeviatie
- Het idee: hoe ver zijn observaties, gemiddelde genomen, van het centrum
van de verdeling
- We nemen het gemiddelde als centrum van de verdeling
• Variantie → de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking
(deviatie) van het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2
4. Bepaal het totaal aantal observaties, we noemen dat aantal n of N
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal
observaties
• Standaarddeviatie → de wortel de variatie. Handig om
te hebben omdat het uitgedrukt wordt in dezelfde
eenheden als de observaties i.p.v. die kwadraten in de
variantie
1. Bereken de variantie
2. Neem de wortel van de variantie
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller fleurkooops. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.21. You're not tied to anything after your purchase.