Statistiek
Samenvatting
,Inhoudsopgave
H1 Introductie & Beschrijvende Grafische technieken................................................................................3
H2 Beschrijvende Numerieke Technieken(Maatstaven)............................................................................11
H3 Waarschijnlijkheid(Probability)............................................................................................................20
H4 Discrete distributies en willekeurige variabelen...................................................................................31
H5 Doorlopende waarschijnlijkheidsdistributies.......................................................................................41
H6 Datacollectie en steekproeftrekking.....................................................................................................51
H7 Schatting...............................................................................................................................................58
H8 Hypothesetoetsen................................................................................................................................63
H9 Hypotheses toetsen & Conclusie over de populatie.............................................................................75
H10 Conclusies over de populatie..............................................................................................................79
Formuleblad..............................................................................................................................................84
Binomiale Waarschijnlijkheid tabel........................................................................................................92
Poisson Waarschijnlijkheid Tabel...........................................................................................................93
Normale Waarschijnlijkheid Tabel.........................................................................................................94
Kritieke Waarden van t Tabel.................................................................................................................95
Chi-Kwadraat Tabel................................................................................................................................96
,H1 Introductie & Beschrijvende Grafische
technieken
Wat is Statistiek?
Introductie
Statistiek kan worden omschreven als het verkrijgen van informatie uit data. Statistiek kan in twee
soorten worden ingedeeld, namelijk beschrijvende statistiek en inferentiële statistiek:
● Beschrijvende statistiek (descriptive statistics) is een manier van statistiek die zich richt op het
samenvatten, organiseren en presenteren van data op een informatieve manier. Hierbij wordt
vaak gebruik gemaakt van grafieken en diagrammen om de data op een makkelijk leesbare
manier te presenteren;
● Inferentiële statistiek (inferential statistics) is een manier van statistiek om conclusies te kunnen
trekken over bepaalde kenmerken van de populatie, door gebruik te maken van een steekproef
(sample). Dit is kostenbesparend, omdat het lastig en duur is de gehele populatie te bereiken.
Essentiële concepten
Binnen de beschrijvende statistiek zijn er maatstaven die verschillende kenmerken van numerieke
gegevens laten zien:
● Maatstaven van de centrale locatie (typisch kenmerk), zoals de mediaan of het gemiddelde;
● Mediaan is de waarde in het midden, wanneer alle waarden op de juiste manier zijn
gerangschikt;
○ Bijvoorbeeld: 2 3 4 4 7 7 8 8 9. Hier is 7 de mediaan.
● Maatstaven van variabiliteit, zoals het bereik.
Binnen de inferentiële statistiek zijn er enkele belangrijke begrippen:
● De populatie is een gehele groep waarin de onderzoeker geïnteresseerd is. De populatie kan
bestaan uit mensen, maar ook uit voorwerpen. De beschrijvende maatstaf van de populatie
wordt de parameter genoemd. De parameter is de informatie die nodig is.
● Een steekproef is een set van data die genomen is uit de populatie. De beschrijvende maatstaf
van de steekproef is een statistic. De statistic wordt gebruikt om conclusies te trekken over
parameters.
● De statistische gevolgtrekking (statistical inference) is het proces van het maken van een
schatting, voorspelling of beslissing over de populatie, gebaseerd op de data uit de steekproef.
Aangezien deze gevolgtrekking niet altijd nauwkeurig is, worden de volgende twee maatstaven
gebruikt om de betrouwbaarheid te controleren:
○ Het confidentiële niveau (Confidence level) is de verhouding van het aantal keer dat een
schatting correct zal zijn.
○ Het significantieniveau (significance level) meet hoe vaak de conclusie verkeerd zal zijn.
■ Wanneer je dus een nulhypothese zou formuleren en deze zou testen met de
statistische gevolgtrekking, de kans “significantieniveau”% is dat je de
nulhypothese hebt verworpen, terwijl deze hypothese eigenlijk correct is.
Voorbeeld
, De populatie die we willen onderzoeken, bestaat uit 50.000 studenten van onze universiteit. We willen
meten hoeveel kopjes koffie de studenten per week drinken. We nemen een steekproef van 500
studenten. We ontdekken dat deze studenten gemiddeld 5 kopjes koffie per week drinken. Dit wordt de
statistische gevolgtrekking genoemd. Het confidentiële niveau is 90%, dus de schattingen die we maken
en gebaseerd zijn op de statistische gevolgtrekking (gemiddeld 5 kopjes per week), zullen 90% van de
tijd juist zijn. Het significantiniveau is 5%. Dit betekent dat, wanneer je een nulhypothese zou
formuleren en deze zou testen met de statistische gevolgtrekking, de kans 0,05 is dat je deze
nulhypothese verwerpt, terwijl deze hypothese eigenlijk juist is.
Toepassing van de statistiek in de bedrijfskunde
De voornaamste functie van statistische vakken in de bedrijfskunde is het demonstreren dat statistische
analyses een belangrijke rol spelen in alle aspecten van de bedrijfskunde. Er wordt gekeken naar
statistiek die toegepast wordt op het functionele gebied van de bedrijfskunde en naar de toepassing op
de beschrijvingen van achtergronden van bepaalde bedrijfskundige termen.
Beschrijvende grafische technieken I
In dit hoofdstuk bespreken we verschillende grafische technieken om data te beschrijven. Ook komen
verschillende soorten data en representatietechnieken aan bod.
Verschillende typen data
Eerst enkele belangrijke begrippen:
● Een variabele is een kenmerk van een populatie of een steekproef, bijvoorbeeld de prijs van een
aandeel;
● De waarden van een variabele zijn de mogelijke observaties van de variabele, bijvoorbeeld de
prijs van een aandeel tussen 0 en 100 dollar;
● Data zijn de geobserveerde waarden van een variabele. Data kan worden onderverdeeld in
interval, nominale en ordinale data:
○ Interval data zijn kwantitatieve (numerieke) data uitgedrukt in echte nummers, zoals
hoogte, gewicht, inkomen en afstand.
○ Nominale data zijn kwalitatieve (niet-numerieke), categorische data. De waarden zijn
geen nummers, maar woorden die de categorieën beschrijven. De volgorde van de
waarden heeft geen betekenis. Bijvoorbeeld, we kunnen de burgerlijke staat vermelden
met de volgende categorieën: Single, Getrouwd, Weduwe, Gescheiden.
○ Ordinale data lijken op nominale data, maar de volgorde van de waarden heeft bij
ordinale data wel een betekenis. De volgorde is dus van belang, zoals bij ‘Heel slecht,
slecht, goed, heel goed’.
Om nominale data samen te vatten, wordt gebruik gemaakt van een tabel waarin categorieën en de
tellingen van de categorieën staan. Dit wordt een frequentie distributie genoemd. Een relatieve
frequentie distributie verdeelt de categorieën en het aantal keer dat elke categorie voorkomt. Dit wordt
grafisch weergegeven door het gebruik van een staafdiagram en een taartdiagram.