Dit document bevat alle hoorcolleges (uitgebreid) van Statistiek voor Tentamen I & II. De colleges behandelen alle stof uit de syllabus statistiek 2020 (met voorbeelden). Het is dus niet nodig ook nog de syllabus te lezen.
- Nagaan in welke mate de uitkomsten van een steekproef algemeen geldig zijn.
Statistiek → 2 vormen:
1. Beschrijvende Statistiek (ordenen/presenteren van gegevens dmv tabellen en
grafieken + samenhang tussen variabelen + verschillen tussen groepen + doe je
altijd/begin je altijd mee (steekproef hoeft niet aselect te zijn)).
2. Inductieve Statistiek (alleen toepassen als er sprake is van een steekproef; nagaan
of de uitkomsten van de steekproef ook geldig zijn voor de hele populatie + alleen
toepassen op aselecte steekproeven).
Populatie en Steekproef
- Populatie = hele onderzoeksgroep (groep met 1 of meer gemeenschappelijke
kenmerken).
- Steekproef = deelgroep uit de populatie (als we de populatie als geheel niet kunnen
onderzoeken → moet representatief zijn).
- aselect = random = representatieve afspiegeling populatie
Datamatrix (= bestand met alle gegevens)
- Onderzoekseenheden of cases (elementen die je onderzoekt → rijen; onder elkaar).
- Variabelen (kenmerken van de onderzoekseenheden → kolommen; naast elkaar).
- Waarden of scores (feitelijk gemeten gegevens → getallen
(leeftijden)/eigenschappen (geslacht) → cellen van de matrix).
- Titel: boven de tabel + tabelnummer + duidelijk zijn wat er in de tabel te zien is.
- Bron: achter de titel/onder de tabel.
Typen variabelen - meetschalen
4 meetschalen (bepaald welke statistische technieken je kunt toepassen).
- Nominaal (categorieën zonder logische volgorde (geslacht, typen huishouden,
studierichting)).
- Ordinaal (categorieën met een natuurlijke ordening (opleidingsniveau, stellingen,
numerieke gegevens die in klassen zijn ingedeeld (leeftijd → je weet niet het verschil
in de leeftijd))).
→ Kwalitatief of categorisch (je kunt hiermee niet rekenen)
- Interval (het nulpunt is arbitrair; niet echt nul (temperatuur → beide schalen hebben
een ander nulpunt, maar in beide gevallen is het niet echt nul)). → komen weinig
voor.
- Ratio (hebben wel een echt nulpunt (reistijd, inkomen)).
→ Kwantitatief of numeriek (hiermee kun je wel rekenen)
Oplopend: als een techniek bij een bepaald meetniveau is toegestaan, dan is het ook
toegestaan bij een hogere schaal, maar niet bij een lagere (gemiddelde; intervalschaal →
ook ratio, maar niet nominaal of ordinaal).
1
,Typen variabelen - andere indelingen
Bijzondere meetschalen:
- Dichotoom
● Categorisch met slechts twee categorieën (geslacht (man/vrouw), woningtype
(koop/huur), studieresultaat (gehaald/gezakt)).
● Proporties of fracties p + q = 1 (rekenen als interval).
● 60 vrouwen; 40 mannen → p = 0,6 en q = 0,4
- Rangnummers
● Ordinaal
Discreet - Continu
- Discreet
● Categorisch (beperkt aantal waarden/categorieën).
● Numerieke - gehele getallen (numerieke getallen kunnen ook discreet zijn als
ze gehele getallen zijn; aantallen (geen cijfers achter de komma mogelijk)).
● STAAFDIAGRAM (staven staan los van elkaar).
- Continu
● Wel cijfers achter de komma mogelijk.
● Numeriek - doorlopende getallen
● Numeriek - ingedeeld in klassen
● HISTOGRAM (staven staan tegen elkaar aan).
Frequentieverdeling
Stap 1:
Beschrijvende statistiek: welke antwoorden zijn er gegeven + hoe vaak komt bepaald
antwoord voor → frequentietabel (overzicht + absolute aantallen/frequenties → = f +
relatieve frequenties → proporties/fracties = p (f/n) / = %).
Staafdiagram
- Grafiek met een titel (boven de grafiek + aangeduid met Figuur) en een bron (achter
titel of onder figuur).
- Horizontale as: element
- Verticale as: frequentie
Kruistabel - Vergelijken categorieën
- Gebruik als je twee categorische variabelen tegen elkaar wilt afzetten (geslacht -
vervoermiddelen).
- Kolommen: variabelen waarvoor de groepen willen vergelijken.
- Rijen: variabelen die we willen vergelijken.
2
, - Totaal: onderaan en meest rechtse rij.
- Titel en bron nodig.
- Om de gegevens te vergelijken moet je gebruik maken van kolompercentages.
- Kolompercentages geven de relatieve verdeling per groep + tellen op tot 100%.
Staafdiagrammen - verdeling vervoermiddelen per geslacht
- Grafisch weergeven van een kruistabel: samengesteld staafdiagram
(aantallen/procenten + naast elkaar/op elkaar).
- Absolute verdeling (zien hoe vaak iets echt voorkomt + slecht met elkaar te
vergelijken).
- Relatieve verdeling (verdelingen goed te vergelijken + zegt niks over de aantallen
antwoorden die gegeven zijn).
Frequentieverdeling - geclassificeerde gegevens
→ Klassen lopen in elkaar over, dus: gebruik maken van een histogram.
Histogram - geclassificeerde gegevens
- Horizontale as: klassen + zorg dat de klassengrenzen altijd onder het midden onder
de staaf staan (niet onder de hoekpunten want dat zijn de exacte grenzen) +
klassenmiddens ook onder de staven.
- Verticale as: absolute aantallen/relatieve aandeel.
- Titel en bron.
Cumulatieve frequentieverdeling
- Geven het aantal waarnemingen aan tot een bepaalde bovengrens.
- Cumulatieve frequentieverdeling = F.
- Absoluut/relatief.
Cumulatieve of somfrequentiepolygoon
- Horizontale as: bovengrenzen van de klassen.
- Verticale as: cumulatieve frequenties/percentages (% het meest gekozen).
- Steile lijn: klassen hebben een hoge frequentie
- Afgevlakte lijn: er komt weinig frequentie bij bij de klassen.
- Stap 1: beschrijvende statistiek + frequentietabel (kan ook in grafiek).
- Stap 2: berekenen van statistische maten (samenvatten van alle waarden in een
paar karakteristieke getallen).
Statische maten
- Centrummaten (Indicatie van het middelpunt/zwaartepunt van de gegevens).
● Modus (meest voorkomende waarde → alle meetschalen).
● Mediaan (middelste waarde → minimaal ordinale schaal).
● Rekenkundig gemiddelde (zwaartepunt → intervalschaal/ratioschaal).
- Spreidingsmaten (HC2 → Verdeling van de gegevens).
- Scheefheidsmaten (HC2 → Symmetrisch of niet).
Modus
- Mo.
- Meest voorkomend.
- Kan gebruikt worden bij kwantitatieve en kwalitatieve gegevens.
Mediaan
- Md.
- Middelste waarde.
- 1. Zet de gegevens op volgorde (ordinale schaal) → 2. Bepaal de middelste
waarneming. → 3. Md = waarde van de middelste waarneming.
- Middelste =
Mediaan bij klassen
- Formule =
Rekenkundig gemiddelde
- Zwaartepunt.
- Meetschaal: interval of ratio.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Lisette88. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,69. Je zit daarna nergens aan vast.