Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
Statistiek 1 hoorcolleges 2021 €5,89   Ajouter au panier

Notes de cours

Statistiek 1 hoorcolleges 2021

 56 vues  5 achats
  • Cours
  • Établissement
  • Book

In dit document vind je de aantekeningen van de hoorcolleges 1.1 t/m 5.2. Hierin staat alle stof duidelijk beschreven met voorbeelden. Ook zijn alle voorbeeld opdrachten uit het de hoorcolleges voorgedaan. Aan de hand van afbeeldingen hoop ik het nog duidelijker voor je te hebben gemaakt!

Dernier document publié: 2 année de cela

Aperçu 5 sur 20  pages

  • 16 décembre 2021
  • 16 décembre 2021
  • 20
  • 2021/2022
  • Notes de cours
  • Ilja cornelisz
  • Toutes les classes
avatar-seller
Statistiek 1
Hoorcollege 1.1
Hoofdstuk 1
Statistiek → Een wetenschap van het verzamelen, organiseren en het interpreteren van numerieke feiten, wat we data
noemen. Deze proberen we op een juiste manier te verzamelen en weer te geven in bijvoorbeeld tabellen en grafieken.
Dit kunnen ook statistieken zijn, bijvoorbeeld het gemiddelde.
Een empirische wetenschap: Komen niet met logisch redeneren tot conclusies, maar juist door het meten en het
observeren.
Kansrekening gaat uit van deductie : Je weet al hoe een bepaald model eruit ziet en op basis van die kennis doe je
uitspraken over specifieke voorvallen (van algemeen naar specifiek) → Bij wiskunde kreeg je bijvoorbeeld een vaas
met knikkers. Je wist al hoeveel knikkers erin de vaas zitten, maar je wilt weten wat de kans is dat je er een groene
knikker uithaalt. Hier ga je dus van iets algemeens naar iets specifieks.
o Van algemeen naar specifiek
o Van populatie naar steekproef
o Vanuit het model kun je uitspraken doen over de data


Statistiek gaat uit van inductie : Is vaak andersom. We weten de werkelijkheid niet, maar deze willen we vaak
begrijpen. We hebben specifieke antwoorden voor ons (100 studenten), maar willen hier een algemene uitkomst voor
(alle studenten) (specifiek naar algemeen).
Dus:
o Van specifiek naar algemeen
o Van steekproef naar populatie
o Vanuit data proberen we uitspraken te doen over model (wereld om je heen)
“Als we 1 rode, 4 blauwe en 5 zwarte sokken pakken, wat is dan de verdeling van sokken in de lade?”
“We doen dit 5x, met teruglegging, en het gemiddelde aantal sokken is 7. Hoeveel zwarte sokken zitten er in de lade?”
Overeenkomst tussen kansberekening en statistiek:
→ Rekenen met toeval (randomness).
→ Statistiek gaat voornamelijk over steekproeven, maar door middel van statistische technieken kan de gehele
populatie worden beschreven (bijvoorbeeld ‘de gemiddelde leeftijd van alle Olympische sporters’)
→ Sommige statistische technieken maken eerst bepaalde aannames over de populatie. Op basis van de steekproef kan
er bepaald worden hoe onwaarschijnlijk dit is.
Je kunt niet met volledige zekerheid een conclusie uitspreken.
Kenmerk van de statistiek: Beslisregel → Kunnen wij op basis van een steekproef conclusies trekken aangaande een
populatie? Dit heet Falsificatie. Eén zwarte zwaan is genoeg om een hypothese te falsifiëren wanneer je denkt dat alle
zwanen wit zijn.
Hoe onwaarschijnlijk is het dat als H0 klopt, dat je ….. zal aantreffen in je steekproef. Als dit onwaarschijnlijk is,
verwerpen we de hypothese.
Beschrijvende statistiek → Vat de data van een steekproef of een populatie samen door middel van nummers,
tabellen of grafieken.
Inferentiële statistiek → Kun je op basis van je steekproef voorspellingen doen over je populatie? Uitspraken.
Parameter → Zitten in de populatie die je enkel weet als je data hebt over de gehele populatie. Hier
wil je achterkomen aan de hand van je steekproef.
Statistiek en methodologie komen erg met elkaar overeen, maar zijn toch verschillend:
Methodologie → Leert je manieren hoe je (empirisch) onderzoek zou moeten uitvoeren (welk design, regels van
opzet).
Statistiek → Heb je nodig om dit plan/ onderzoek te kunnen uitvoeren. Geeft je instrumenten om dit te kunnen doen.

,We hebben gereedschap nodig om hypotheses te toetsen en om uiteindelijk te kunnen bepalen of we hem gaan
falsifiëren.
o Statistisch redeneren
o Kritische houding

Q: Hoe hoog is de werkdruk van Statistiek 1?
Werkdruk is niet precies meetbaar (= Construct).
Dit moet je operationaliseren om het toch te kunnen meten → Bijvoorbeeld: Hoeveel tijd besteden studenten aan
zelfstudie?
Populatie → De totale set van deelnemers, relevant voor de onderzoeksvraag
Steekproef → Een deel van de populatie waarover de data verzameld is. Deze steekproef is representatief en
aselect getrokken.
Om de vraag goed te kunnen beoordelen is goede data nodig:
- Betrouwbare data (als je de meting nog een keer doet, komt er ongeveer hetzelfde uit).
- Valide data (het is representatief, generaliseerbaar).

Variabele → Gemeten karakteristiek die verschillende waarden kan aannemen en kan verschillen tussen subjecten.
Het type variabele bepaald ook het gereedschap wat je nodig hebt.
Verschillende meetniveaus (NOIR):
- Categorisch/ kwalitatief:
- Nominaal → Ongeordende categorieën
(kleur ogen)
- Ordinaal → Geordende categorieën
(opleidingsniveau)
- Kwantitatief/ numeriek:
- Interval → Gelijke afstand tussen
opeenvolgende waarden (graden Celsius)
- Ratio → Gelijke afstand én absoluut nulpunt (graden Kelvin)
Waardenbereik: Iets kan voor verschillende mensen verschillende waarden aannemen.
- Discreet waardenbereik → Eindig deelbare meeteenheid (x aantal broers/ zussen) → Je kunt namelijk niet 2,4
broers hebben.
- Continu waardenbereik → Oneindig deelbare meeteenheid (lichaamslengte) → Je kunt een lengte van 1.62 meter
hebben.
Op basis van een steekproef wil je uitspraken doen over de gehele (doel)populatie. Je probeert ervoor te zorgen dat de
steekproef representatief is, omdat je dit uiteindelijk wilt generaliseren. Het kan zijn dat je steekproef een andere
waarde geeft dan de parameter, maar dit kan komen door toeval of problemen of fouten.
Problemen bij steekproeven:
o Steekproeffout → Toevallige steekproefverschillen
o Steekproefvertekening → Selectieve werving (kan zijn dat het niet representatief is voor de gehele populatie)
o Meetfout → incorrect antwoord, fout in instrument
o Selectieve respons → Selectieve deelname, mensen haken af, mensen zijn niet gemotiveerd.
Een goede steekproef is aselect met een voldoende omvang die informatie oplevert over iedereen die benaderd is, met
correcte responses voor alle subjecten op alle items.




Hoorcollege 1.2

,Hoofdstuk 2
Beschrijvende statistiek → Vat de steekproef of populatie data samen met nummers, tabellen en grafieken
Inferentiële statistiek → Wil uitspraken doen over de totale populatie aan de hand van de steekproef (parameter).
Je wilt een steekproef die representatief is voor de gehele populatie, zodat je uiteindelijk kunt generaliseren.
Er kunnen hierbij problemen ontstaan:
- Variatie tussen steekproeven
- Problemen binnen de steekproef.
Doel → Betrouwbare en valide uitspraken over populatie op basis van een steekproef.
Steekproefmethoden:

• Enkelvoudige aselecte steekproef
• Systematisch aselecte steekproef
• Gestratificeerde steekproef
• Cluster steekproef
• Getrapte steekproef
Je kiest je soort steekproef aan de hand van de samenstelling van de doelpopulatie, onderzoeksvraag en de
haalbaarheid van de te vormen steekproef.
Enkelvoudige aselecte steekproef
Je stelt eerst het steekproefkader vast en je trekt willekeurig/ aselect een steekproef van n deelnemers.
Hierbij heeft iedereen evenveel kans om in de steekproef te komen.
Iedere student van de gehele populatie geef je bijvoorbeeld een getal en je trekt willekeurig een paar
getallen, dus komen deze personen in de steekproef.
Systematische aselecte steekproef
Het lijkt op de enkelvoudige aselecte steekproef, maar je hebt één tussenstap en het is makkelijker.
Eerst stel je weer het steekproefkader vast. Vervolgens ga je de stapgrootte bepalen.
Je hebt bijvoorbeeld weer iedereen een getal gegeven. Hierbij ga je de stapgrootte bepalen (skip number) →
Steekproef n=4, populatie N=20, k=20/4=5. Je maakt dus telkens stappen van 5.
Je schuift telkens het aantal personen op aan de hand van de stapgrootte k. Deze mensen komen in je
steekproef.
Je weet zeker dat niet iedereen een gelijke kans heeft om in de steekproef te komen. Hierdoor wordt er eerder
voor een enkelvoudige aselecte steekproef gekozen.
Gestratificeerde steekproef
Je hebt verschillende groepen (strata/ stratum) die je in je steekproef wilt opnemen, bijvoorbeeld een
aantal jongens en een aantal meiden. Binnen ieder stratum wordt een steekproef getrokken.
Bij een enkelvoudige aselecte steekproef heb je het gevaar dat je bijvoorbeeld alleen maar jongens of
alleen maar meiden trekt.
Je stelt als eerst je steekproefkader op. Uit elk stratum trek je een aselecte steekproef, dus bijvoorbeeld
twee uit de meiden en twee uit de jongens.
Clustersteekproef
Het gaat hier niet zo zeer over de soort groepen (zoals jongens en meiden). Als eerste stel je weer een steekproefkader
op. Daarna wordt de populatie verdeeld in clusters, bijvoorbeeld verschillende scholen. Wanneer je deze scholen niet
persé allemaal wil vergelijken, maar een paar scholen wil kiezen die representatief zijn voor alle scholen in Nederland.
Je trekt hierbij willekeurig twee clusters uit de rest van je clusters. Vaak uit praktische redenen.
Getrapte steekproef
Je stelt als eerst weer een steekproefkader op. Is aan het begin hetzelfde als de clustersteekproef. Uit de populatie van
alle scholen kiezen we bijvoorbeeld 150 scholen. Binnen elk van deze scholen zitten natuurlijk ook weer heel veel
verschillende leerlingen. Binnen deze school ga je a-select de leerlingen trekken. Dit is handig wanneer het moeilijk is
om alle clusters te bereiken voor een steekproef. Kan anders ook duur en arbeidsintensief zijn.
PISA – steekproefmethode → Getrapte steekproefmethode. Er wordt gekeken naar de niveaus van de leerlingen. Er
worden dus scholen geselecteerd waarin vervolgens weer leerlingen worden gekozen (target cluster size, aantal

Resulterend in een getrapte steekproef:
- Twee-traps steekproef (1. Scholen, 2. Leerlingen)

,leerlingen per cluster, school die gekozen is):
- Simple random (scholen en leerlingen)
- Stratified (schoolkenmerken)
- Cluster (geografische locatie)
Hoofdstuk 3 – Descriptive statistics
Als we denken aan beschrijvende statistiek, zijn drie dimensies van belang:

• Centrum – “typische observatie” – centrummaten
• Variantie – “spreiding van observaties” – Spreidingsmaten
• Positie – “relatieve posities van observaties” – Positiematen
Centrummaten → Zijn getallen zoals bijvoorbeeld ‘gemiddelde’, ‘mediaan’ of ‘modus’. Door alleen naar
centrummaten te kijken, heb je vaak niet voldoende informatie of een te zwakke conclusie.
Spreidingsmaten → Hoe verschillen de mensen van elkaar? Bijvoorbeeld ‘standaarddeviatie’, ‘bereik’ of
‘interkwartiel-afstand’.
Positiematen → Geven de relatieve positie van een observatie. Bijvoorbeeld ‘mediaan’ of ook de ‘modus’.
Het maakt uit of je categorische of numerieke variabelen hebt welke soort statistiek je gaat gebruiken.
Zo gebruik je voor Nominaal bijvoorbeeld een staagdiagram. Wat vind je het lekkerste ijs? → Frequentie in het
diagram. Wel kan je de modus gebruiken → Smaak die het vaakst is gekozen.
Spreidingsmaat (variantie-ratio) → Hoe groot is de proportie van de meest voorkomende frequentie?
v = Variantie-ratio
fm = De frequentie van variabele (bijvoorbeeld aardbei)
N = Populatiegrootte


Dus: stel de frequentie is 12 en de populatiegrootte is 36 → 1 – 12/36.
Als deze 0 is, zal iedereen in deze frequentie zitten, dus bijvoorbeeld iedereen aardbei. Wanneer deze heel groot is,
betekent dit dat alle frequenties een beetje gelijk zijn verdeeld.
Tabel → Frequentieverdeling
Grafiek → Histogram
Tabel/ grafiek → Stamdiagram.
Interkwartiel-afstand → Een kwartiel is een positiemaat.
De grafiek hiernaast betekent:
- Bij het eerste kwartiel (25%) heeft 75% een hogere score en 25% een lagere score.
- Het tweede kwartiel (de mediaan) zit precies op de helft.
- Bij het derde kwartiel (75% heeft 25% een hogere score en 75% een lagere score.
Interkwartiel-afstand is de afstand tussen de eerste en het laatste kwartiel. 25% zit
dus onder de middelste twee kwartielen en 25% boven de twee kwartielen.
Informatie zet je in een boxplot:


mediaan




Q1 Q3

, Hierbij is de interkwartiel-afstand de afstand van 27 tot 51. Alle waardes die meer dan Q3 minder dan Q1, worden
als een puntje weergegeven (ouliers)
Uitleg boxplot:
Box → Het verschil tussen Q1 en Q3, dus het blokje
Whiskers → De lijnen aan de buitenkanten van het blokje (minimale tot maximale).
Lijn → In de box is de mediaan.
Outliers → De waarden die erboven liggen. Liggen ergens tussen 1,5 en 3x de interkwartiel-afstand van Q3 of Q1.
Extreme outliers → Liggen nog hoger dan je outliers.
Gemiddelde → Wordt vaak aangegeven met een kruisje. De outliers en de extreme waarden zorgen ervoor dat het
gemiddelde wat omhoog wordt geduwd, waardoor het gemiddelde hoger ligt dan de mediaan.
Wanneer je een figuur en maat kiest, is de meetschaal van de variabele, de scheefheid van de
verdeling en zijn outliers van belang.
Bivariate statistiek → Kijken hoe twee variabelen met elkaar samenhangen.
Bij twee categorische variabelen gebruiken we een kruistabel.
Bij twee kwantitatieve variabelen gebruiken we een spreidingsdiagram.

Hoorcollege 2.1
Hoofdstuk 4 – kansverdelingen
Er zijn twee regels van kansberekening die wij moeten weten:
1) P(A) → Kans dat uitkomst A plaatsvindt.
2) P(not A) = 1 – P(A) → Kans dat uitkomst A niet plaatsvindt. Dus 1 keer minder dan de
kans dat het wel voorkomt.
Er zijn ook een aantal kansverdelingen die we gebruiken in de statistiek (zit vooral in de steekproevenverdeling):
o Interpretatie van “lange-termijn relatieve frequentieverdeling”. Dit betekent dat als ik dit vaker doe, dat het
gemiddelde hetzelfde blijft.
o Verschil tussen discrete variabelen (niet oneindig) en continue variabelen (oneindig)
o 4 verdelingen:
• Binoinale verdeling
• Student’s T verdeling
• Chi-kwadraat verdeling
• (Standaard) Normale verdeling

y P(y)
Bij discrete variabelen is er een beperkte set aan mogelijke waarden. De kans voor elk van deze 0 0.01
waarden kan berekend worden. 1 0.03
Tabel hiernaast: y staat voor het aantal kinderen dat ouders willen. P(y) staat voor de frequentie van 2 0.60
hoe vaak het antwoord is gegeven. Dit is discreet, omdat een aantal kinderen niet 1,8 kan zijn 3 0.23
bijvoorbeeld. 4 0.12
5 0.01
Bij continue variabelen kan het antwoord op een vraag een oneindig aantal Total 1.0
mogelijke waarden hebben. De kans voor intervallen kan berekend woorden.




Populatie verdeling → De kans-/ of frequentieverdeling van de verschillende uitkomstmogelijkheden van een
variabele zoals deze in de totale populatie wordt waargenomen (groep waar je je uitspraken over wil doen).
Steekproefverdeling → De kans-/ of frequentieverdeling van de verschillende uitkomstmogelijkheden van een
variabele zoals deze in een specifieke steekproef wordt waargenomen (generaliseren naar populatie).

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur lolageuzinge. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €5,89. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

73314 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€5,89  5x  vendu
  • (0)
  Ajouter