100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5) €5,99
In winkelwagen

College aantekeningen

College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5)

 2 keer verkocht

Alle aantekeningen van de hoorcolleges van MTO-B. Dit vak afgerond met een 8,5. Staan veel screenshots in.

Voorbeeld 4 van de 149  pagina's

  • 4 oktober 2021
  • 149
  • 2020/2021
  • College aantekeningen
  • -
  • Alle colleges
Alle documenten voor dit vak (8)
avatar-seller
zaravss
Hoorcollege 1 - MTO – B

Correlatie is niet hetzelfde als causatie

- Beschrijvende en inferentiële statistiek
- Typen random variabelen
- Frequentie en kansverdelingen
- Centrummaten en spreidingsmaten

Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van gegevens

Statistiek in de empirische cyclus (dit herhaalt zich steeds): observatie → inductie → deductie
→ toetsing → evaluatie → en dan weer observatie

Beschrijvende statistiek
➢ Gebruik: kwantitatieve samenvatting van informatie/data
➢ Relevante jargon: summary statistics, gemiddelde, mediaan, modus, variantie,
standaarddeviatie, covariantie, frequentieverdeling, histogram etc.

Inferentiële statistiek
➢ Gebruik: maak inductieve inferenties van data (een steekproef) naar een meer
algemene situatie (de populatie)
➢ Relevante jargon: sampling error, standaardfout, schatten, confidence intervals,
margin of error, hypothese toetsing, etc.
➢ Maak je uitspraken over iets, bijvoorbeeld toetsingen, steekproeven, hypothese,
toetsing etc.

Je neemt dus uit de populatie een steekproef (MTO A), vervolgens breng je steekproef terug
naar de populatie (MTO B/inferentiële statistiek)

Data: random variabelen (X)
➢ Variabelen waarvan de mogelijke uitkomsten het resultaat zijn van een random
fenomeen
➢ Statistische notatie meestal X of Y
➢ Specifieke uitkomsten en specifieke observaties worden opgeschreven met een kleine
x of y
➢ Leeftijd kan dan bv X zijn en dan x4 → de 4de persoon is bijv. 23 dus x4 is dan 23

Kwantificeren van random variabelen
➢ Cijfers toekennen aan elke mogelijke variabele in spss, man 0,vrouw 1
➢ Het meetniveau van een variabele bepaalt wat voor betekenis de nummers die we
toewijzen hebben: 4 niveaus: nominaal, ordinaal, interval, ratio
➢ De niveaus zijn cumulatief – elk level heeft de eigenschappen van de vorige levels
➢ Het meetniveau van een random variabele bepaalt wat voor analyses je er beter
wel/niet op kan uitvoeren

Meetniveaus van random variabelen:
1. Nominale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten

, ➢ Voorbeelden: geslacht (man/vrouw), nationaliteit (Nederlands, Duits etc.), teamnaam
2. Ordinale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ Voorbeelden: dosering (laag, medium, hoog), rangen (1e plaats, 2e plaats etc.), Likert
schalen (zeer oneens, oneens, neutraal etc.), leeftijdscategorieën (9-13,14-18)
3. Interval variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Voorbeelden: temperatuur in graden Celsius, Fahrenheit, jaartallen
4. Ratio → bij 0 stopt het
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Absoluut nulpunt, een nul betekent dat de gemeten eigenschap afwezig is
➢ Voorbeelden: dosering in milligram (0,1 etc.), lengte in cm (0 betekent geen lengte),
temperatuur in Kelvin → 0 is ook geen temperatuur

In de sociale wetenschap: een ordinale variabelen met meer dan 5 uitkomstcategorieën wordt
vaak ook als interval gezien of in ieder geval zo behandeld.

Afstanden hetzelfde: interval (graden), niet hetzelfde: ordinaal (zeer oneens, eens, zeer eens)

Lengte meten met een meetlint van de grond (ratio → want je kan niet kleiner zijn dan de
grond/0) en lengte meten vanaf 1m van de muur met een streepje (interval → mensen kunnen
kleiner zijn dan 1m dus kan onder dat 0 punt komen)

Discrete vs. continue random variabelen
➢ Het type variabele bepaalt wat voor analyses we er beter wel/niet op uit kunnen voeren
➢ Discrete variabele → de mogelijke uitkomsten voor de variabelen zijn te vangen in
een eindige, telbare lijst van waarden – Let op! Als de gemeten score discreet is, hoeft
de onderliggende variabele dat niet te zijn (bv. leeftijd afgerond op hele jaren)
Voorbeelden: aantal kinderen per gezin, dosering categorieën (laag, medium,
hoog), sekse (man/vrouw), beroepsgroep (docent, advocaat, tandarts)
➢ Continue variabele → de mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen van -oneindig
tot oneindig)
Alle waardes zijn mogelijk, bv. ook bij temperatuur (zonder afronding)
Voorbeelden: leeftijd (niet afgerond), hoeveelheid gedronken alcohol in ml,
dosering in grammen, lengte, sekse schalen (van vrouwelijk tot mannelijk)
Denk bij discreet aan staven bij staafgrafiek en bij continu aan een vloeiende lijn/parabool

Continue variabelen hebben over het algemeen interval/ratio niveaus. Interval/ ratio
variabelen zijn niet per se continu.
Nominale/ordinale variabelen zijn over het algemeen discreet. Discrete variabelen zijn niet
per se nominaal/ordinaal.

,Mogelijke tentamenvraag:
Een ziekenhuis is geïnteresseerd in het gezinsleven en de leef-werkbalans van hun
medewerkers en zet daarom en survey uit. Aan elke werknemer wordt gevraagd hoeveel
kinderen zij hebben.
Stelling: De resulterende variabele, namelijk het aantal kinderen voor elke werknemer, is een
discrete variabele met een ratio meetniveau.
A. Juist OF B. Onjuist
→ discreet omdat het duidelijk is dat het 1 of 2 etc. kind is en geen half kind, het is een ratio
meetniveau omdat je alle 4 de voorwaarden kunt toepassen, ruimte is even groot en 0 betekent
ook echt 0 en kan hier niet onder zitten.

Frequentieverdelingen en kansverdelingen
- Frequentie (van de uitkomsten van een random variabele) → hoe vaak een bepaalde
uitkomst is geobserveerd
- Frequentieverdelingen → een tabel of grafiek die weergeeft hoe vaak een bepaalde uitkomst
is geobserveerd, voor elke mogelijke uitkomst voor die variabele
- Kansverdelingen → de relatieve frequentie van de uitkomst, hoe vaak de uitkomst voorkomt
in verhouding tot aantal observaties
Kansverdelingen laten de kans zien op elke mogelijke uitkomst voor een random variabelen
Deze kansen moeten altijd optellen tot 1!

Beschrijvende statistiek → centrummaten en spreidingsmaten voor het samenvatten van
variabelen en hun kansverdelingen in een paar getallen
• Centrummaten → beschrijven het centrum/midden van variabelen + modus (wat het
meeste voorkomt), mediaan en gemiddelde
• Spreidingsmaten → beschrijven variatie, spreiding, breedte van variabelen + bereik
(hoogste-laagste), variantie en standaarddeviatie → als je het wil uitrekenen, eerst de
getallen – het gemiddelde doen

Centrummaten:
1. Modus → de uitkomst die het vaakst voorkomt, d.w.z., de uitkomst met de hoogste
frequentie → dus bv. cijfers: 7,6,8,7 dan is de modus 7
2. Mediaan → de waarde die de hoogste helft van de data scheidt van de laagste helft van de
data, 50% van de data ligt boven deze waarde, en 50% ligt onder deze waarde → dus bv. stel
je hebt de volgende cijfers: 7,7,6,8,9 → start met ordenen: 6,7,7,8,9 → de mediaan is dan de
middelste waarde → 7 dus → MAAR bij een even aantal cijfers kijk je naar de twee
middelste cijfers en daar het gemiddelde van dus stel je voor 7 en 8 → dan 7,5
3. Gemiddelde → stel je hebt deze cijfers: 7,7,8,6,9 → dan deze bij elkaar optellen en delen
door het aantal cijfers dus delen door 5 → dit geeft 7,4
Op hun manier: tel alle observaties voor variabele X op (neem de som van X) dan bepaal het
totale aantal observaties, we noemen dat getal N of n en vervolgens delen we de som uit stap
1 door het totale aantal observaties van stap 2 → notatie µ voor het gemiddelde van een
populatie → hoort nog moeilijke formules bij

Op welke manier geeft het gemiddelde het centrum of het midden van onze verdeling aan?
- De som van de deviaties (afwijkingen van: X-µ) tussen de observaties en het gemiddelde is
altijd 0
- D.w.z., de totale afstand tussen de observaties hoger dan het gemiddelde, en de totale
afstand tussen de observaties lager dan het gemiddelde zijn precies even groot

, DUS: je kijkt voor elke X bv. 6,7,7,8,9 dan haal je van deze getallen steeds het gemiddelde af
dus 6-7,4 enz. al deze getallen die hier uitkomen heffen elkaar op en uitkomst: 0
Daarom is gemiddelde het meest betekenisvol voor interval/ratio variabelen want
hierbij zijn de afstanden even groot waardoor je beter conclusies kunt trekken over
gemiddelde

Spreidingsmaten:
1. Bereik → het verschil tussen de laagste en hoogste waarde van de variabele dus weer bij
diezelfde cijfers → 9-6 = 3
2. Variantie → hoe ver zijn de observaties, gemiddeld genomen, van het centrum van de
verdeling (het gemiddelde) → definitie variantie: de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking (deviatie) van het gemiddelde → dus
weer het cijfer – het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2 → dus alles optellen
4. Bepaal het totaal aantal observaties, we noemen dat aantal N of n
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal observaties (N)
3. Standaarddeviatie → de wortel van de variantie. Handig om te hebben omdat het
uitgedrukt wordt in dezelfde eenheden als de observaties, i.p.v. die kwadraten in de variantie
1. Bereken de variantie
2. Neem de wortel van de variantie

Variantie en standaarddeviatie voor de populatie vs. een steekproef (zijn dus verschillend)
Populatie → a en steekproef → s (en bij het delen niet door N maar door N-1) dus komen
verschillende antwoorden uit. Steekproef dus delen door n-1

Mogelijke tentamenvraag:
Rechts zie je een grafiek van een perfect symmetrische kansverdeling, voor deze verdeling
geldt dat: (een vloeiende curve)
A. De modus, mediaan en gemiddelde allemaal dezelfde waarde hebben in het midden
van deze verdeling
B. De modus ligt in het midden van de verdeling, maar de mediaan en gemiddelde zouden
meer rechts of links kunnen liggen
C. De modus en mediaan liggen in het midden van de verdeling, maar het gemiddelde zou
meer links of meer rechts kunnen liggen
D. We hebben niet genoeg informatie om iets te kunnen zeggen over de modus, mediaan of
het gemiddelde

Hoorcollege 2 – MTO – B
Aantekeningen online
Kansen staan op de y-as
Uitkomsten staan op de x-as

Kans → de relatieve frequentie van de uitkomst → weergegeven met p (x=uitkomst) dus bv.
p(auto=groot) of P(groot)
Kansverdeling → laten de kans zien op elke mogelijke uitkomst voor een random variabele,
moeten altijd optellen tot 1
Voor mutueel exclusieve gebeurtenissen A en B reken je P;(A) + P(B)

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper zaravss. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 62774 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,99  2x  verkocht
  • (0)
In winkelwagen
Toegevoegd