STATISTIEK I
SAMENVATTING EXAMENPERIODE 1 – JANUARI 2022
1 INLEIDING
1.2 DE BETEKENIS VAN STATISTIEK
Statistiek is de wetenschap van het leren uit data en van het meten, controleren en communiceren van onzekerheid.
1.2.2 ENKELE DEFINITIES
De populatie is de volledige verzameling van objecten of personen waarover informatie wordt gewenst.
Elementen zijn de individuele leden van de populatie (objecten of personen).
De steekproef is een deelverzameling van de populatie die feitelijk zal onderzocht worden om informatie te
bekomen.
Een variabele is een eigenschap die bij de elementen van de populatie of steekproef varieert. Vaak worden er bij
een steekproef verschillende variabelen gemeten.
Data is de verzameling van gegevens die wordt bekomen door de variabelen te meten.
De verdeling van een variabele geeft aan welke waarden worden aangenomen en hoe vaak.
Bij inductie wordt het algemene besloten uitgaande van het bijzondere. We proberen op basis van een aantal
waarnemingen tot een algemeen besluit te komen. Bij deductie wordt het bijzondere besloten uitgaande van het
algemene.
1.3 EIGENSCHAPPEN VAN VARIABELEN
1.3.1 SCHAALFAMILIES
1.3.1.1 NOMINALE SCHAAL
Bij de nominale schaal worden de waarden van de variabelen gebruikt voor identificatie zonder dat ze een
hoeveelheid aanduiden. Variabelen gemeten op nominale schaal worden ook nominale vairabelen genoemd.
Nominaal drukt uit dat de waarden van de variabelen slechts ‘namen’ zijn.
o Voorbeeld 1: Geslacht – man, vrouw of andere
o Voorbeeld 2: Rekeningnummer – 37 0000 0000 2828, 73 0000 0000 6060, etc.
Statistiek I 1
,1.3.1.2 ORDINALE SCHAAL
De ordinale schaal erft alle eigenschappen van de nominale schaal samen met een extra eigenschap: de waarden
duiden een volgorde aan. Behalve om een volgorde weer te geven, is de waarde van de variabele niet van belang.
Variabelen gemeten op ordinale schaal worden ook ordinale variabelen genoemd. Ordinaal drukt uit dat de
waarden van de variabelen geordend kunnen worden.
o Voorbeeld 1: Uitslag wedstrijd – goud, zilver of brons
1.3.1.3 INTERVALSCHAAL
De intervalschaal erft alle eigenschappen van de ordinale schaal met de extra eigenschap dat verschillen tussen
waarden een betekenis hebben. Er is echter geen absoluut nulpunt (een getal dat aangeeft dat niets van de
variabele aanwezig is). Variabelen gemeten op intervalschaal worden ook intervalvariabelen genoemd. De
benaming interval drukt uit dat gelijke verschillen op de meetschaal (intervallen) duiden op gelijke verschillen in de
variabele.
o Voorbeeld 1: Temperatuur in °C – 0, 10, -30, etc.
1.3.1.4 RATIOSCHAAL
De ratioschaal erft alle eigenschappen van de intervalschaal én heeft daarbij ook een absoluut nulpunt. Variabelen
gemeten op ratioschaal worden ook ratiovariabelen genoemd. De benaming ratio drukt uit dat verhoudingen
(ratio’s) een betekenis hebben.
o Voorbeeld 1: Lengte in cm – 0, 1, 354, etc.
Het is vooral van belang om het onderscheid te kennen tussen de nominale, ordinale en interval/ratioschaal. Het
onderscheid tussen de intervalschaal en de ratioschaal is minder van belang.
1.3.2 DISCRETE EN CONTINUE VARIABELEN
Continue variabelen kunnen tussenwaarden aannemen; tussen elke twee willekeurige waarden ligt een derde
waarde. Dit impliceert dat er tussen twee waarden oneindig veel waarden kunnen liggen. We zeggen ook dat
variabelen gemeten op een continue schaal variëren.
o Voorbeeld 1: Lengte in cm (tussen 2 en 3 cm liggen er nog vele andere waarden: bv. 2.5 cm, 2.34 cm, etc.)
Bij discrete variabelen bestaan steeds twee waarden waar geen derde waarde kan tussen liggen. Dit impliceert dat
de variabele maar een eindig aantal waarden kan aannemen.
o Voorbeeld 1: Aantal kinderen (tussen 1 en 2 kinderen ligt geen derde waarde; het is niet mogelijk om 1.5
kinderen te hebben)
Het aantal volgers op Twitter is theoretisch gezien een discrete variabele, maar omdat deze variabele veel
verschillende waarden kan aannemen, wordt er ook gezegd dat ze bijna-continu is. In de praktijk zullen we
variabelen die bijna-continu zijn als continu beschouwen.
Statistiek I 2
, DEEL I: BESCHRIJVENDE STATISTIEK
2 VISUALISEREN VAN DATA
2.1 ONDERZOEK NAAR RACIALE VOORKEUR
2.1.2 DE POPULATIE EN DE STEEKPROEF
De wijze waarop men de steekproef zal nemen, is belangrijk. De steekproef moet immers een afspiegeling zijn van
de totale populatie. Een steekproef die een goede afspiegeling is van de populatie, wordt ook representatief
genoemd.
Er zijn verschillende technieken om (theoretisch) een representatieve steekproef te bekomen. Een voorbeeld is de
aselecte streekproef: men selecteert willekeurig x aantal objecten of personen uit de populatie. Dit is echter niet
haalbaar in de praktijk. Het bekomen van een steekproef uit een populatie zal bijgevolg een compromis zijn tussen
de theoretisch beste keuze en een praktisch haalbare keuze.
2.2 CIRKELDIAGRAM
Het cirkeldiagram is een grafische voorstelling die voornamelijk gebruikt wordt voor variabelen van nominaal
meetniveau.
De absolute frequentie van 𝑥 is het aantal keer dat de waarde 𝑥 in de steekproef voorkomt.
De absolute frequentieverdeling van 𝑋 is een tabel met twee rijen/kolommen waar de eerste rij/kolom de mogelijke
waarden van 𝑋 weergeeft en de tweede rij/kolom de overeenkomstige absolute frequenties.
De steekproefgrootte 𝑛 is gelijk aan het aantal elementen in de steekproef.
De relatieve absolute frequentie van 𝑥 is de absolute frequentie gedeeld door de steekproefgrootte 𝑛.
De verdeling van een variabele geeft het geheel van mogelijke waarden samen met de absolute of relatieve
frequenties.
Cirkeldiagrammen worden afgeraden om te gebruiken omdat het menselijk oog niet goed in staat is om de
oppervlaktes van een cirkeldiagram te beoordelen.
2.3 STAAFDIAGRAM
In een staafdiagram worden de verschillende waarden van de variabele horizontaal weergegeven en bij elke waarde
wordt een rechthoek getekend waarbij de hoogte gelijk is aan de absolute frequentie of de relatieve frequentie.
Alle rechthoeken moeten even breed zijn en de ruimte tussen twee rechthoeken moet ook steeds dezelfde zijn.
Staafdiagrammen worden gebruikt voor variabelen van nominaal of ordinaal niveau.
2.4 HISTOGRAM
Om een histogram te maken, moeten we eerst de data groeperen. We verdelen de data in klassen of intervallen
]𝑎, 𝑏].
De klassenbreedte van een interval ]𝑎, 𝑏] wordt gegeven door 𝑏 − 𝑎.
Statistiek I 3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper phoebevani. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.