100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5) $6.40
Add to cart

Class notes

College aantekeningen MTO-B MAW: Inleiding Statistiek (424503-B-5)

 17 views  2 purchases
  • Course
  • Institution

Alle aantekeningen van de hoorcolleges van MTO-B. Dit vak afgerond met een 8,5. Staan veel screenshots in.

Preview 4 out of 149  pages

  • October 4, 2021
  • 149
  • 2020/2021
  • Class notes
  • -
  • All classes
avatar-seller
Hoorcollege 1 - MTO – B

Correlatie is niet hetzelfde als causatie

- Beschrijvende en inferentiële statistiek
- Typen random variabelen
- Frequentie en kansverdelingen
- Centrummaten en spreidingsmaten

Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van gegevens

Statistiek in de empirische cyclus (dit herhaalt zich steeds): observatie → inductie → deductie
→ toetsing → evaluatie → en dan weer observatie

Beschrijvende statistiek
➢ Gebruik: kwantitatieve samenvatting van informatie/data
➢ Relevante jargon: summary statistics, gemiddelde, mediaan, modus, variantie,
standaarddeviatie, covariantie, frequentieverdeling, histogram etc.

Inferentiële statistiek
➢ Gebruik: maak inductieve inferenties van data (een steekproef) naar een meer
algemene situatie (de populatie)
➢ Relevante jargon: sampling error, standaardfout, schatten, confidence intervals,
margin of error, hypothese toetsing, etc.
➢ Maak je uitspraken over iets, bijvoorbeeld toetsingen, steekproeven, hypothese,
toetsing etc.

Je neemt dus uit de populatie een steekproef (MTO A), vervolgens breng je steekproef terug
naar de populatie (MTO B/inferentiële statistiek)

Data: random variabelen (X)
➢ Variabelen waarvan de mogelijke uitkomsten het resultaat zijn van een random
fenomeen
➢ Statistische notatie meestal X of Y
➢ Specifieke uitkomsten en specifieke observaties worden opgeschreven met een kleine
x of y
➢ Leeftijd kan dan bv X zijn en dan x4 → de 4de persoon is bijv. 23 dus x4 is dan 23

Kwantificeren van random variabelen
➢ Cijfers toekennen aan elke mogelijke variabele in spss, man 0,vrouw 1
➢ Het meetniveau van een variabele bepaalt wat voor betekenis de nummers die we
toewijzen hebben: 4 niveaus: nominaal, ordinaal, interval, ratio
➢ De niveaus zijn cumulatief – elk level heeft de eigenschappen van de vorige levels
➢ Het meetniveau van een random variabele bepaalt wat voor analyses je er beter
wel/niet op kan uitvoeren

Meetniveaus van random variabelen:
1. Nominale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten

, ➢ Voorbeelden: geslacht (man/vrouw), nationaliteit (Nederlands, Duits etc.), teamnaam
2. Ordinale variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ Voorbeelden: dosering (laag, medium, hoog), rangen (1e plaats, 2e plaats etc.), Likert
schalen (zeer oneens, oneens, neutraal etc.), leeftijdscategorieën (9-13,14-18)
3. Interval variabelen
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Voorbeelden: temperatuur in graden Celsius, Fahrenheit, jaartallen
4. Ratio → bij 0 stopt het
➢ Toewijzen van mutueel exclusieve getallen aan de mutueel exclusieve uitkomsten
➢ Er is een betekenisvolle ordening in de mogelijke uitkomsten
➢ De intervallen tussen elk van de geordende uitkomsten is betekenisvol en dezelfde
grootte
➢ Absoluut nulpunt, een nul betekent dat de gemeten eigenschap afwezig is
➢ Voorbeelden: dosering in milligram (0,1 etc.), lengte in cm (0 betekent geen lengte),
temperatuur in Kelvin → 0 is ook geen temperatuur

In de sociale wetenschap: een ordinale variabelen met meer dan 5 uitkomstcategorieën wordt
vaak ook als interval gezien of in ieder geval zo behandeld.

Afstanden hetzelfde: interval (graden), niet hetzelfde: ordinaal (zeer oneens, eens, zeer eens)

Lengte meten met een meetlint van de grond (ratio → want je kan niet kleiner zijn dan de
grond/0) en lengte meten vanaf 1m van de muur met een streepje (interval → mensen kunnen
kleiner zijn dan 1m dus kan onder dat 0 punt komen)

Discrete vs. continue random variabelen
➢ Het type variabele bepaalt wat voor analyses we er beter wel/niet op uit kunnen voeren
➢ Discrete variabele → de mogelijke uitkomsten voor de variabelen zijn te vangen in
een eindige, telbare lijst van waarden – Let op! Als de gemeten score discreet is, hoeft
de onderliggende variabele dat niet te zijn (bv. leeftijd afgerond op hele jaren)
Voorbeelden: aantal kinderen per gezin, dosering categorieën (laag, medium,
hoog), sekse (man/vrouw), beroepsgroep (docent, advocaat, tandarts)
➢ Continue variabele → de mogelijke uitkomsten van de variabele kunnen elke waarde
aannemen binnen een bepaald interval (dat interval zou kunnen lopen van -oneindig
tot oneindig)
Alle waardes zijn mogelijk, bv. ook bij temperatuur (zonder afronding)
Voorbeelden: leeftijd (niet afgerond), hoeveelheid gedronken alcohol in ml,
dosering in grammen, lengte, sekse schalen (van vrouwelijk tot mannelijk)
Denk bij discreet aan staven bij staafgrafiek en bij continu aan een vloeiende lijn/parabool

Continue variabelen hebben over het algemeen interval/ratio niveaus. Interval/ ratio
variabelen zijn niet per se continu.
Nominale/ordinale variabelen zijn over het algemeen discreet. Discrete variabelen zijn niet
per se nominaal/ordinaal.

,Mogelijke tentamenvraag:
Een ziekenhuis is geïnteresseerd in het gezinsleven en de leef-werkbalans van hun
medewerkers en zet daarom en survey uit. Aan elke werknemer wordt gevraagd hoeveel
kinderen zij hebben.
Stelling: De resulterende variabele, namelijk het aantal kinderen voor elke werknemer, is een
discrete variabele met een ratio meetniveau.
A. Juist OF B. Onjuist
→ discreet omdat het duidelijk is dat het 1 of 2 etc. kind is en geen half kind, het is een ratio
meetniveau omdat je alle 4 de voorwaarden kunt toepassen, ruimte is even groot en 0 betekent
ook echt 0 en kan hier niet onder zitten.

Frequentieverdelingen en kansverdelingen
- Frequentie (van de uitkomsten van een random variabele) → hoe vaak een bepaalde
uitkomst is geobserveerd
- Frequentieverdelingen → een tabel of grafiek die weergeeft hoe vaak een bepaalde uitkomst
is geobserveerd, voor elke mogelijke uitkomst voor die variabele
- Kansverdelingen → de relatieve frequentie van de uitkomst, hoe vaak de uitkomst voorkomt
in verhouding tot aantal observaties
Kansverdelingen laten de kans zien op elke mogelijke uitkomst voor een random variabelen
Deze kansen moeten altijd optellen tot 1!

Beschrijvende statistiek → centrummaten en spreidingsmaten voor het samenvatten van
variabelen en hun kansverdelingen in een paar getallen
• Centrummaten → beschrijven het centrum/midden van variabelen + modus (wat het
meeste voorkomt), mediaan en gemiddelde
• Spreidingsmaten → beschrijven variatie, spreiding, breedte van variabelen + bereik
(hoogste-laagste), variantie en standaarddeviatie → als je het wil uitrekenen, eerst de
getallen – het gemiddelde doen

Centrummaten:
1. Modus → de uitkomst die het vaakst voorkomt, d.w.z., de uitkomst met de hoogste
frequentie → dus bv. cijfers: 7,6,8,7 dan is de modus 7
2. Mediaan → de waarde die de hoogste helft van de data scheidt van de laagste helft van de
data, 50% van de data ligt boven deze waarde, en 50% ligt onder deze waarde → dus bv. stel
je hebt de volgende cijfers: 7,7,6,8,9 → start met ordenen: 6,7,7,8,9 → de mediaan is dan de
middelste waarde → 7 dus → MAAR bij een even aantal cijfers kijk je naar de twee
middelste cijfers en daar het gemiddelde van dus stel je voor 7 en 8 → dan 7,5
3. Gemiddelde → stel je hebt deze cijfers: 7,7,8,6,9 → dan deze bij elkaar optellen en delen
door het aantal cijfers dus delen door 5 → dit geeft 7,4
Op hun manier: tel alle observaties voor variabele X op (neem de som van X) dan bepaal het
totale aantal observaties, we noemen dat getal N of n en vervolgens delen we de som uit stap
1 door het totale aantal observaties van stap 2 → notatie µ voor het gemiddelde van een
populatie → hoort nog moeilijke formules bij

Op welke manier geeft het gemiddelde het centrum of het midden van onze verdeling aan?
- De som van de deviaties (afwijkingen van: X-µ) tussen de observaties en het gemiddelde is
altijd 0
- D.w.z., de totale afstand tussen de observaties hoger dan het gemiddelde, en de totale
afstand tussen de observaties lager dan het gemiddelde zijn precies even groot

, DUS: je kijkt voor elke X bv. 6,7,7,8,9 dan haal je van deze getallen steeds het gemiddelde af
dus 6-7,4 enz. al deze getallen die hier uitkomen heffen elkaar op en uitkomst: 0
Daarom is gemiddelde het meest betekenisvol voor interval/ratio variabelen want
hierbij zijn de afstanden even groot waardoor je beter conclusies kunt trekken over
gemiddelde

Spreidingsmaten:
1. Bereik → het verschil tussen de laagste en hoogste waarde van de variabele dus weer bij
diezelfde cijfers → 9-6 = 3
2. Variantie → hoe ver zijn de observaties, gemiddeld genomen, van het centrum van de
verdeling (het gemiddelde) → definitie variantie: de gemiddelde gekwadrateerde afwijking
(deviatie) van het gemiddelde
1. Voor elke observatie bereken je de afwijking (deviatie) van het gemiddelde → dus
weer het cijfer – het gemiddelde
2. Kwadrateer alle deviaties die je in stap 1 hebt berekend
3. Neem de som van alle gekwadrateerde deviaties uit stap 2 → dus alles optellen
4. Bepaal het totaal aantal observaties, we noemen dat aantal N of n
5. Deel de som van de gekwadrateerde deviaties door het totaal aantal observaties (N)
3. Standaarddeviatie → de wortel van de variantie. Handig om te hebben omdat het
uitgedrukt wordt in dezelfde eenheden als de observaties, i.p.v. die kwadraten in de variantie
1. Bereken de variantie
2. Neem de wortel van de variantie

Variantie en standaarddeviatie voor de populatie vs. een steekproef (zijn dus verschillend)
Populatie → a en steekproef → s (en bij het delen niet door N maar door N-1) dus komen
verschillende antwoorden uit. Steekproef dus delen door n-1

Mogelijke tentamenvraag:
Rechts zie je een grafiek van een perfect symmetrische kansverdeling, voor deze verdeling
geldt dat: (een vloeiende curve)
A. De modus, mediaan en gemiddelde allemaal dezelfde waarde hebben in het midden
van deze verdeling
B. De modus ligt in het midden van de verdeling, maar de mediaan en gemiddelde zouden
meer rechts of links kunnen liggen
C. De modus en mediaan liggen in het midden van de verdeling, maar het gemiddelde zou
meer links of meer rechts kunnen liggen
D. We hebben niet genoeg informatie om iets te kunnen zeggen over de modus, mediaan of
het gemiddelde

Hoorcollege 2 – MTO – B
Aantekeningen online
Kansen staan op de y-as
Uitkomsten staan op de x-as

Kans → de relatieve frequentie van de uitkomst → weergegeven met p (x=uitkomst) dus bv.
p(auto=groot) of P(groot)
Kansverdeling → laten de kans zien op elke mogelijke uitkomst voor een random variabele,
moeten altijd optellen tot 1
Voor mutueel exclusieve gebeurtenissen A en B reken je P;(A) + P(B)

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller zaravss. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.40. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

56326 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$6.40  2x  sold
  • (0)
Add to cart
Added