Dit document bevat alle hoorcolleges (uitgebreid) van Statistiek voor Tentamen I & II. De colleges behandelen alle stof uit de syllabus statistiek 2020 (met voorbeelden). Het is dus niet nodig ook nog de syllabus te lezen.
- Nagaan in welke mate de uitkomsten van een steekproef algemeen geldig zijn.
Statistiek → 2 vormen:
1. Beschrijvende Statistiek (ordenen/presenteren van gegevens dmv tabellen en
grafieken + samenhang tussen variabelen + verschillen tussen groepen + doe je
altijd/begin je altijd mee (steekproef hoeft niet aselect te zijn)).
2. Inductieve Statistiek (alleen toepassen als er sprake is van een steekproef; nagaan
of de uitkomsten van de steekproef ook geldig zijn voor de hele populatie + alleen
toepassen op aselecte steekproeven).
Populatie en Steekproef
- Populatie = hele onderzoeksgroep (groep met 1 of meer gemeenschappelijke
kenmerken).
- Steekproef = deelgroep uit de populatie (als we de populatie als geheel niet kunnen
onderzoeken → moet representatief zijn).
- aselect = random = representatieve afspiegeling populatie
Datamatrix (= bestand met alle gegevens)
- Onderzoekseenheden of cases (elementen die je onderzoekt → rijen; onder elkaar).
- Variabelen (kenmerken van de onderzoekseenheden → kolommen; naast elkaar).
- Waarden of scores (feitelijk gemeten gegevens → getallen
(leeftijden)/eigenschappen (geslacht) → cellen van de matrix).
- Titel: boven de tabel + tabelnummer + duidelijk zijn wat er in de tabel te zien is.
- Bron: achter de titel/onder de tabel.
Typen variabelen - meetschalen
4 meetschalen (bepaald welke statistische technieken je kunt toepassen).
- Nominaal (categorieën zonder logische volgorde (geslacht, typen huishouden,
studierichting)).
- Ordinaal (categorieën met een natuurlijke ordening (opleidingsniveau, stellingen,
numerieke gegevens die in klassen zijn ingedeeld (leeftijd → je weet niet het verschil
in de leeftijd))).
→ Kwalitatief of categorisch (je kunt hiermee niet rekenen)
- Interval (het nulpunt is arbitrair; niet echt nul (temperatuur → beide schalen hebben
een ander nulpunt, maar in beide gevallen is het niet echt nul)). → komen weinig
voor.
- Ratio (hebben wel een echt nulpunt (reistijd, inkomen)).
→ Kwantitatief of numeriek (hiermee kun je wel rekenen)
Oplopend: als een techniek bij een bepaald meetniveau is toegestaan, dan is het ook
toegestaan bij een hogere schaal, maar niet bij een lagere (gemiddelde; intervalschaal →
ook ratio, maar niet nominaal of ordinaal).
1
,Typen variabelen - andere indelingen
Bijzondere meetschalen:
- Dichotoom
● Categorisch met slechts twee categorieën (geslacht (man/vrouw), woningtype
(koop/huur), studieresultaat (gehaald/gezakt)).
● Proporties of fracties p + q = 1 (rekenen als interval).
● 60 vrouwen; 40 mannen → p = 0,6 en q = 0,4
- Rangnummers
● Ordinaal
Discreet - Continu
- Discreet
● Categorisch (beperkt aantal waarden/categorieën).
● Numerieke - gehele getallen (numerieke getallen kunnen ook discreet zijn als
ze gehele getallen zijn; aantallen (geen cijfers achter de komma mogelijk)).
● STAAFDIAGRAM (staven staan los van elkaar).
- Continu
● Wel cijfers achter de komma mogelijk.
● Numeriek - doorlopende getallen
● Numeriek - ingedeeld in klassen
● HISTOGRAM (staven staan tegen elkaar aan).
Frequentieverdeling
Stap 1:
Beschrijvende statistiek: welke antwoorden zijn er gegeven + hoe vaak komt bepaald
antwoord voor → frequentietabel (overzicht + absolute aantallen/frequenties → = f +
relatieve frequenties → proporties/fracties = p (f/n) / = %).
Staafdiagram
- Grafiek met een titel (boven de grafiek + aangeduid met Figuur) en een bron (achter
titel of onder figuur).
- Horizontale as: element
- Verticale as: frequentie
Kruistabel - Vergelijken categorieën
- Gebruik als je twee categorische variabelen tegen elkaar wilt afzetten (geslacht -
vervoermiddelen).
- Kolommen: variabelen waarvoor de groepen willen vergelijken.
- Rijen: variabelen die we willen vergelijken.
2
, - Totaal: onderaan en meest rechtse rij.
- Titel en bron nodig.
- Om de gegevens te vergelijken moet je gebruik maken van kolompercentages.
- Kolompercentages geven de relatieve verdeling per groep + tellen op tot 100%.
Staafdiagrammen - verdeling vervoermiddelen per geslacht
- Grafisch weergeven van een kruistabel: samengesteld staafdiagram
(aantallen/procenten + naast elkaar/op elkaar).
- Absolute verdeling (zien hoe vaak iets echt voorkomt + slecht met elkaar te
vergelijken).
- Relatieve verdeling (verdelingen goed te vergelijken + zegt niks over de aantallen
antwoorden die gegeven zijn).
Frequentieverdeling - geclassificeerde gegevens
→ Klassen lopen in elkaar over, dus: gebruik maken van een histogram.
Histogram - geclassificeerde gegevens
- Horizontale as: klassen + zorg dat de klassengrenzen altijd onder het midden onder
de staaf staan (niet onder de hoekpunten want dat zijn de exacte grenzen) +
klassenmiddens ook onder de staven.
- Verticale as: absolute aantallen/relatieve aandeel.
- Titel en bron.
Cumulatieve frequentieverdeling
- Geven het aantal waarnemingen aan tot een bepaalde bovengrens.
- Cumulatieve frequentieverdeling = F.
- Absoluut/relatief.
Cumulatieve of somfrequentiepolygoon
- Horizontale as: bovengrenzen van de klassen.
- Verticale as: cumulatieve frequenties/percentages (% het meest gekozen).
- Steile lijn: klassen hebben een hoge frequentie
- Afgevlakte lijn: er komt weinig frequentie bij bij de klassen.
- Stap 1: beschrijvende statistiek + frequentietabel (kan ook in grafiek).
- Stap 2: berekenen van statistische maten (samenvatten van alle waarden in een
paar karakteristieke getallen).
Statische maten
- Centrummaten (Indicatie van het middelpunt/zwaartepunt van de gegevens).
● Modus (meest voorkomende waarde → alle meetschalen).
● Mediaan (middelste waarde → minimaal ordinale schaal).
● Rekenkundig gemiddelde (zwaartepunt → intervalschaal/ratioschaal).
- Spreidingsmaten (HC2 → Verdeling van de gegevens).
- Scheefheidsmaten (HC2 → Symmetrisch of niet).
Modus
- Mo.
- Meest voorkomend.
- Kan gebruikt worden bij kwantitatieve en kwalitatieve gegevens.
Mediaan
- Md.
- Middelste waarde.
- 1. Zet de gegevens op volgorde (ordinale schaal) → 2. Bepaal de middelste
waarneming. → 3. Md = waarde van de middelste waarneming.
- Middelste =
Mediaan bij klassen
- Formule =
Rekenkundig gemiddelde
- Zwaartepunt.
- Meetschaal: interval of ratio.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Lisette88. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.14. You're not tied to anything after your purchase.