100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Statistiek 1 hoorcolleges 2021 €5,89   In winkelwagen

College aantekeningen

Statistiek 1 hoorcolleges 2021

 56 keer bekeken  5 keer verkocht

In dit document vind je de aantekeningen van de hoorcolleges 1.1 t/m 5.2. Hierin staat alle stof duidelijk beschreven met voorbeelden. Ook zijn alle voorbeeld opdrachten uit het de hoorcolleges voorgedaan. Aan de hand van afbeeldingen hoop ik het nog duidelijker voor je te hebben gemaakt!

Laatste update van het document: 2 jaar geleden

Voorbeeld 5 van de 20  pagina's

  • 16 december 2021
  • 16 december 2021
  • 20
  • 2021/2022
  • College aantekeningen
  • Ilja cornelisz
  • Alle colleges
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (20)
avatar-seller
lolageuzinge
Statistiek 1
Hoorcollege 1.1
Hoofdstuk 1
Statistiek → Een wetenschap van het verzamelen, organiseren en het interpreteren van numerieke feiten, wat we data
noemen. Deze proberen we op een juiste manier te verzamelen en weer te geven in bijvoorbeeld tabellen en grafieken.
Dit kunnen ook statistieken zijn, bijvoorbeeld het gemiddelde.
Een empirische wetenschap: Komen niet met logisch redeneren tot conclusies, maar juist door het meten en het
observeren.
Kansrekening gaat uit van deductie : Je weet al hoe een bepaald model eruit ziet en op basis van die kennis doe je
uitspraken over specifieke voorvallen (van algemeen naar specifiek) → Bij wiskunde kreeg je bijvoorbeeld een vaas
met knikkers. Je wist al hoeveel knikkers erin de vaas zitten, maar je wilt weten wat de kans is dat je er een groene
knikker uithaalt. Hier ga je dus van iets algemeens naar iets specifieks.
o Van algemeen naar specifiek
o Van populatie naar steekproef
o Vanuit het model kun je uitspraken doen over de data


Statistiek gaat uit van inductie : Is vaak andersom. We weten de werkelijkheid niet, maar deze willen we vaak
begrijpen. We hebben specifieke antwoorden voor ons (100 studenten), maar willen hier een algemene uitkomst voor
(alle studenten) (specifiek naar algemeen).
Dus:
o Van specifiek naar algemeen
o Van steekproef naar populatie
o Vanuit data proberen we uitspraken te doen over model (wereld om je heen)
“Als we 1 rode, 4 blauwe en 5 zwarte sokken pakken, wat is dan de verdeling van sokken in de lade?”
“We doen dit 5x, met teruglegging, en het gemiddelde aantal sokken is 7. Hoeveel zwarte sokken zitten er in de lade?”
Overeenkomst tussen kansberekening en statistiek:
→ Rekenen met toeval (randomness).
→ Statistiek gaat voornamelijk over steekproeven, maar door middel van statistische technieken kan de gehele
populatie worden beschreven (bijvoorbeeld ‘de gemiddelde leeftijd van alle Olympische sporters’)
→ Sommige statistische technieken maken eerst bepaalde aannames over de populatie. Op basis van de steekproef kan
er bepaald worden hoe onwaarschijnlijk dit is.
Je kunt niet met volledige zekerheid een conclusie uitspreken.
Kenmerk van de statistiek: Beslisregel → Kunnen wij op basis van een steekproef conclusies trekken aangaande een
populatie? Dit heet Falsificatie. Eén zwarte zwaan is genoeg om een hypothese te falsifiëren wanneer je denkt dat alle
zwanen wit zijn.
Hoe onwaarschijnlijk is het dat als H0 klopt, dat je ….. zal aantreffen in je steekproef. Als dit onwaarschijnlijk is,
verwerpen we de hypothese.
Beschrijvende statistiek → Vat de data van een steekproef of een populatie samen door middel van nummers,
tabellen of grafieken.
Inferentiële statistiek → Kun je op basis van je steekproef voorspellingen doen over je populatie? Uitspraken.
Parameter → Zitten in de populatie die je enkel weet als je data hebt over de gehele populatie. Hier
wil je achterkomen aan de hand van je steekproef.
Statistiek en methodologie komen erg met elkaar overeen, maar zijn toch verschillend:
Methodologie → Leert je manieren hoe je (empirisch) onderzoek zou moeten uitvoeren (welk design, regels van
opzet).
Statistiek → Heb je nodig om dit plan/ onderzoek te kunnen uitvoeren. Geeft je instrumenten om dit te kunnen doen.

,We hebben gereedschap nodig om hypotheses te toetsen en om uiteindelijk te kunnen bepalen of we hem gaan
falsifiëren.
o Statistisch redeneren
o Kritische houding

Q: Hoe hoog is de werkdruk van Statistiek 1?
Werkdruk is niet precies meetbaar (= Construct).
Dit moet je operationaliseren om het toch te kunnen meten → Bijvoorbeeld: Hoeveel tijd besteden studenten aan
zelfstudie?
Populatie → De totale set van deelnemers, relevant voor de onderzoeksvraag
Steekproef → Een deel van de populatie waarover de data verzameld is. Deze steekproef is representatief en
aselect getrokken.
Om de vraag goed te kunnen beoordelen is goede data nodig:
- Betrouwbare data (als je de meting nog een keer doet, komt er ongeveer hetzelfde uit).
- Valide data (het is representatief, generaliseerbaar).

Variabele → Gemeten karakteristiek die verschillende waarden kan aannemen en kan verschillen tussen subjecten.
Het type variabele bepaald ook het gereedschap wat je nodig hebt.
Verschillende meetniveaus (NOIR):
- Categorisch/ kwalitatief:
- Nominaal → Ongeordende categorieën
(kleur ogen)
- Ordinaal → Geordende categorieën
(opleidingsniveau)
- Kwantitatief/ numeriek:
- Interval → Gelijke afstand tussen
opeenvolgende waarden (graden Celsius)
- Ratio → Gelijke afstand én absoluut nulpunt (graden Kelvin)
Waardenbereik: Iets kan voor verschillende mensen verschillende waarden aannemen.
- Discreet waardenbereik → Eindig deelbare meeteenheid (x aantal broers/ zussen) → Je kunt namelijk niet 2,4
broers hebben.
- Continu waardenbereik → Oneindig deelbare meeteenheid (lichaamslengte) → Je kunt een lengte van 1.62 meter
hebben.
Op basis van een steekproef wil je uitspraken doen over de gehele (doel)populatie. Je probeert ervoor te zorgen dat de
steekproef representatief is, omdat je dit uiteindelijk wilt generaliseren. Het kan zijn dat je steekproef een andere
waarde geeft dan de parameter, maar dit kan komen door toeval of problemen of fouten.
Problemen bij steekproeven:
o Steekproeffout → Toevallige steekproefverschillen
o Steekproefvertekening → Selectieve werving (kan zijn dat het niet representatief is voor de gehele populatie)
o Meetfout → incorrect antwoord, fout in instrument
o Selectieve respons → Selectieve deelname, mensen haken af, mensen zijn niet gemotiveerd.
Een goede steekproef is aselect met een voldoende omvang die informatie oplevert over iedereen die benaderd is, met
correcte responses voor alle subjecten op alle items.




Hoorcollege 1.2

,Hoofdstuk 2
Beschrijvende statistiek → Vat de steekproef of populatie data samen met nummers, tabellen en grafieken
Inferentiële statistiek → Wil uitspraken doen over de totale populatie aan de hand van de steekproef (parameter).
Je wilt een steekproef die representatief is voor de gehele populatie, zodat je uiteindelijk kunt generaliseren.
Er kunnen hierbij problemen ontstaan:
- Variatie tussen steekproeven
- Problemen binnen de steekproef.
Doel → Betrouwbare en valide uitspraken over populatie op basis van een steekproef.
Steekproefmethoden:

• Enkelvoudige aselecte steekproef
• Systematisch aselecte steekproef
• Gestratificeerde steekproef
• Cluster steekproef
• Getrapte steekproef
Je kiest je soort steekproef aan de hand van de samenstelling van de doelpopulatie, onderzoeksvraag en de
haalbaarheid van de te vormen steekproef.
Enkelvoudige aselecte steekproef
Je stelt eerst het steekproefkader vast en je trekt willekeurig/ aselect een steekproef van n deelnemers.
Hierbij heeft iedereen evenveel kans om in de steekproef te komen.
Iedere student van de gehele populatie geef je bijvoorbeeld een getal en je trekt willekeurig een paar
getallen, dus komen deze personen in de steekproef.
Systematische aselecte steekproef
Het lijkt op de enkelvoudige aselecte steekproef, maar je hebt één tussenstap en het is makkelijker.
Eerst stel je weer het steekproefkader vast. Vervolgens ga je de stapgrootte bepalen.
Je hebt bijvoorbeeld weer iedereen een getal gegeven. Hierbij ga je de stapgrootte bepalen (skip number) →
Steekproef n=4, populatie N=20, k=20/4=5. Je maakt dus telkens stappen van 5.
Je schuift telkens het aantal personen op aan de hand van de stapgrootte k. Deze mensen komen in je
steekproef.
Je weet zeker dat niet iedereen een gelijke kans heeft om in de steekproef te komen. Hierdoor wordt er eerder
voor een enkelvoudige aselecte steekproef gekozen.
Gestratificeerde steekproef
Je hebt verschillende groepen (strata/ stratum) die je in je steekproef wilt opnemen, bijvoorbeeld een
aantal jongens en een aantal meiden. Binnen ieder stratum wordt een steekproef getrokken.
Bij een enkelvoudige aselecte steekproef heb je het gevaar dat je bijvoorbeeld alleen maar jongens of
alleen maar meiden trekt.
Je stelt als eerst je steekproefkader op. Uit elk stratum trek je een aselecte steekproef, dus bijvoorbeeld
twee uit de meiden en twee uit de jongens.
Clustersteekproef
Het gaat hier niet zo zeer over de soort groepen (zoals jongens en meiden). Als eerste stel je weer een steekproefkader
op. Daarna wordt de populatie verdeeld in clusters, bijvoorbeeld verschillende scholen. Wanneer je deze scholen niet
persé allemaal wil vergelijken, maar een paar scholen wil kiezen die representatief zijn voor alle scholen in Nederland.
Je trekt hierbij willekeurig twee clusters uit de rest van je clusters. Vaak uit praktische redenen.
Getrapte steekproef
Je stelt als eerst weer een steekproefkader op. Is aan het begin hetzelfde als de clustersteekproef. Uit de populatie van
alle scholen kiezen we bijvoorbeeld 150 scholen. Binnen elk van deze scholen zitten natuurlijk ook weer heel veel
verschillende leerlingen. Binnen deze school ga je a-select de leerlingen trekken. Dit is handig wanneer het moeilijk is
om alle clusters te bereiken voor een steekproef. Kan anders ook duur en arbeidsintensief zijn.
PISA – steekproefmethode → Getrapte steekproefmethode. Er wordt gekeken naar de niveaus van de leerlingen. Er
worden dus scholen geselecteerd waarin vervolgens weer leerlingen worden gekozen (target cluster size, aantal

Resulterend in een getrapte steekproef:
- Twee-traps steekproef (1. Scholen, 2. Leerlingen)

,leerlingen per cluster, school die gekozen is):
- Simple random (scholen en leerlingen)
- Stratified (schoolkenmerken)
- Cluster (geografische locatie)
Hoofdstuk 3 – Descriptive statistics
Als we denken aan beschrijvende statistiek, zijn drie dimensies van belang:

• Centrum – “typische observatie” – centrummaten
• Variantie – “spreiding van observaties” – Spreidingsmaten
• Positie – “relatieve posities van observaties” – Positiematen
Centrummaten → Zijn getallen zoals bijvoorbeeld ‘gemiddelde’, ‘mediaan’ of ‘modus’. Door alleen naar
centrummaten te kijken, heb je vaak niet voldoende informatie of een te zwakke conclusie.
Spreidingsmaten → Hoe verschillen de mensen van elkaar? Bijvoorbeeld ‘standaarddeviatie’, ‘bereik’ of
‘interkwartiel-afstand’.
Positiematen → Geven de relatieve positie van een observatie. Bijvoorbeeld ‘mediaan’ of ook de ‘modus’.
Het maakt uit of je categorische of numerieke variabelen hebt welke soort statistiek je gaat gebruiken.
Zo gebruik je voor Nominaal bijvoorbeeld een staagdiagram. Wat vind je het lekkerste ijs? → Frequentie in het
diagram. Wel kan je de modus gebruiken → Smaak die het vaakst is gekozen.
Spreidingsmaat (variantie-ratio) → Hoe groot is de proportie van de meest voorkomende frequentie?
v = Variantie-ratio
fm = De frequentie van variabele (bijvoorbeeld aardbei)
N = Populatiegrootte


Dus: stel de frequentie is 12 en de populatiegrootte is 36 → 1 – 12/36.
Als deze 0 is, zal iedereen in deze frequentie zitten, dus bijvoorbeeld iedereen aardbei. Wanneer deze heel groot is,
betekent dit dat alle frequenties een beetje gelijk zijn verdeeld.
Tabel → Frequentieverdeling
Grafiek → Histogram
Tabel/ grafiek → Stamdiagram.
Interkwartiel-afstand → Een kwartiel is een positiemaat.
De grafiek hiernaast betekent:
- Bij het eerste kwartiel (25%) heeft 75% een hogere score en 25% een lagere score.
- Het tweede kwartiel (de mediaan) zit precies op de helft.
- Bij het derde kwartiel (75% heeft 25% een hogere score en 75% een lagere score.
Interkwartiel-afstand is de afstand tussen de eerste en het laatste kwartiel. 25% zit
dus onder de middelste twee kwartielen en 25% boven de twee kwartielen.
Informatie zet je in een boxplot:


mediaan




Q1 Q3

, Hierbij is de interkwartiel-afstand de afstand van 27 tot 51. Alle waardes die meer dan Q3 minder dan Q1, worden
als een puntje weergegeven (ouliers)
Uitleg boxplot:
Box → Het verschil tussen Q1 en Q3, dus het blokje
Whiskers → De lijnen aan de buitenkanten van het blokje (minimale tot maximale).
Lijn → In de box is de mediaan.
Outliers → De waarden die erboven liggen. Liggen ergens tussen 1,5 en 3x de interkwartiel-afstand van Q3 of Q1.
Extreme outliers → Liggen nog hoger dan je outliers.
Gemiddelde → Wordt vaak aangegeven met een kruisje. De outliers en de extreme waarden zorgen ervoor dat het
gemiddelde wat omhoog wordt geduwd, waardoor het gemiddelde hoger ligt dan de mediaan.
Wanneer je een figuur en maat kiest, is de meetschaal van de variabele, de scheefheid van de
verdeling en zijn outliers van belang.
Bivariate statistiek → Kijken hoe twee variabelen met elkaar samenhangen.
Bij twee categorische variabelen gebruiken we een kruistabel.
Bij twee kwantitatieve variabelen gebruiken we een spreidingsdiagram.

Hoorcollege 2.1
Hoofdstuk 4 – kansverdelingen
Er zijn twee regels van kansberekening die wij moeten weten:
1) P(A) → Kans dat uitkomst A plaatsvindt.
2) P(not A) = 1 – P(A) → Kans dat uitkomst A niet plaatsvindt. Dus 1 keer minder dan de
kans dat het wel voorkomt.
Er zijn ook een aantal kansverdelingen die we gebruiken in de statistiek (zit vooral in de steekproevenverdeling):
o Interpretatie van “lange-termijn relatieve frequentieverdeling”. Dit betekent dat als ik dit vaker doe, dat het
gemiddelde hetzelfde blijft.
o Verschil tussen discrete variabelen (niet oneindig) en continue variabelen (oneindig)
o 4 verdelingen:
• Binoinale verdeling
• Student’s T verdeling
• Chi-kwadraat verdeling
• (Standaard) Normale verdeling

y P(y)
Bij discrete variabelen is er een beperkte set aan mogelijke waarden. De kans voor elk van deze 0 0.01
waarden kan berekend worden. 1 0.03
Tabel hiernaast: y staat voor het aantal kinderen dat ouders willen. P(y) staat voor de frequentie van 2 0.60
hoe vaak het antwoord is gegeven. Dit is discreet, omdat een aantal kinderen niet 1,8 kan zijn 3 0.23
bijvoorbeeld. 4 0.12
5 0.01
Bij continue variabelen kan het antwoord op een vraag een oneindig aantal Total 1.0
mogelijke waarden hebben. De kans voor intervallen kan berekend woorden.




Populatie verdeling → De kans-/ of frequentieverdeling van de verschillende uitkomstmogelijkheden van een
variabele zoals deze in de totale populatie wordt waargenomen (groep waar je je uitspraken over wil doen).
Steekproefverdeling → De kans-/ of frequentieverdeling van de verschillende uitkomstmogelijkheden van een
variabele zoals deze in een specifieke steekproef wordt waargenomen (generaliseren naar populatie).

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lolageuzinge. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,89. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 64438 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,89  5x  verkocht
  • (0)
  Kopen