STATISTIEK I
SAMENVATTING EXAMENPERIODE 1 – JANUARI 2022
1 INLEIDING
1.2 DE BETEKENIS VAN STATISTIEK
Statistiek is de wetenschap van het leren uit data en van het meten, controleren en communiceren van onzekerheid.
1.2.2 ENKELE DEFINITIES
De populatie is de volledige verzameling van objecten of personen waarover informatie wordt gewenst.
Elementen zijn de individuele leden van de populatie (objecten of personen).
De steekproef is een deelverzameling van de populatie die feitelijk zal onderzocht worden om informatie te
bekomen.
Een variabele is een eigenschap die bij de elementen van de populatie of steekproef varieert. Vaak worden er bij
een steekproef verschillende variabelen gemeten.
Data is de verzameling van gegevens die wordt bekomen door de variabelen te meten.
De verdeling van een variabele geeft aan welke waarden worden aangenomen en hoe vaak.
Bij inductie wordt het algemene besloten uitgaande van het bijzondere. We proberen op basis van een aantal
waarnemingen tot een algemeen besluit te komen. Bij deductie wordt het bijzondere besloten uitgaande van het
algemene.
1.3 EIGENSCHAPPEN VAN VARIABELEN
1.3.1 SCHAALFAMILIES
1.3.1.1 NOMINALE SCHAAL
Bij de nominale schaal worden de waarden van de variabelen gebruikt voor identificatie zonder dat ze een
hoeveelheid aanduiden. Variabelen gemeten op nominale schaal worden ook nominale vairabelen genoemd.
Nominaal drukt uit dat de waarden van de variabelen slechts ‘namen’ zijn.
o Voorbeeld 1: Geslacht – man, vrouw of andere
o Voorbeeld 2: Rekeningnummer – 37 0000 0000 2828, 73 0000 0000 6060, etc.
Statistiek I 1
,1.3.1.2 ORDINALE SCHAAL
De ordinale schaal erft alle eigenschappen van de nominale schaal samen met een extra eigenschap: de waarden
duiden een volgorde aan. Behalve om een volgorde weer te geven, is de waarde van de variabele niet van belang.
Variabelen gemeten op ordinale schaal worden ook ordinale variabelen genoemd. Ordinaal drukt uit dat de
waarden van de variabelen geordend kunnen worden.
o Voorbeeld 1: Uitslag wedstrijd – goud, zilver of brons
1.3.1.3 INTERVALSCHAAL
De intervalschaal erft alle eigenschappen van de ordinale schaal met de extra eigenschap dat verschillen tussen
waarden een betekenis hebben. Er is echter geen absoluut nulpunt (een getal dat aangeeft dat niets van de
variabele aanwezig is). Variabelen gemeten op intervalschaal worden ook intervalvariabelen genoemd. De
benaming interval drukt uit dat gelijke verschillen op de meetschaal (intervallen) duiden op gelijke verschillen in de
variabele.
o Voorbeeld 1: Temperatuur in °C – 0, 10, -30, etc.
1.3.1.4 RATIOSCHAAL
De ratioschaal erft alle eigenschappen van de intervalschaal én heeft daarbij ook een absoluut nulpunt. Variabelen
gemeten op ratioschaal worden ook ratiovariabelen genoemd. De benaming ratio drukt uit dat verhoudingen
(ratio’s) een betekenis hebben.
o Voorbeeld 1: Lengte in cm – 0, 1, 354, etc.
Het is vooral van belang om het onderscheid te kennen tussen de nominale, ordinale en interval/ratioschaal. Het
onderscheid tussen de intervalschaal en de ratioschaal is minder van belang.
1.3.2 DISCRETE EN CONTINUE VARIABELEN
Continue variabelen kunnen tussenwaarden aannemen; tussen elke twee willekeurige waarden ligt een derde
waarde. Dit impliceert dat er tussen twee waarden oneindig veel waarden kunnen liggen. We zeggen ook dat
variabelen gemeten op een continue schaal variëren.
o Voorbeeld 1: Lengte in cm (tussen 2 en 3 cm liggen er nog vele andere waarden: bv. 2.5 cm, 2.34 cm, etc.)
Bij discrete variabelen bestaan steeds twee waarden waar geen derde waarde kan tussen liggen. Dit impliceert dat
de variabele maar een eindig aantal waarden kan aannemen.
o Voorbeeld 1: Aantal kinderen (tussen 1 en 2 kinderen ligt geen derde waarde; het is niet mogelijk om 1.5
kinderen te hebben)
Het aantal volgers op Twitter is theoretisch gezien een discrete variabele, maar omdat deze variabele veel
verschillende waarden kan aannemen, wordt er ook gezegd dat ze bijna-continu is. In de praktijk zullen we
variabelen die bijna-continu zijn als continu beschouwen.
Statistiek I 2
, DEEL I: BESCHRIJVENDE STATISTIEK
2 VISUALISEREN VAN DATA
2.1 ONDERZOEK NAAR RACIALE VOORKEUR
2.1.2 DE POPULATIE EN DE STEEKPROEF
De wijze waarop men de steekproef zal nemen, is belangrijk. De steekproef moet immers een afspiegeling zijn van
de totale populatie. Een steekproef die een goede afspiegeling is van de populatie, wordt ook representatief
genoemd.
Er zijn verschillende technieken om (theoretisch) een representatieve steekproef te bekomen. Een voorbeeld is de
aselecte streekproef: men selecteert willekeurig x aantal objecten of personen uit de populatie. Dit is echter niet
haalbaar in de praktijk. Het bekomen van een steekproef uit een populatie zal bijgevolg een compromis zijn tussen
de theoretisch beste keuze en een praktisch haalbare keuze.
2.2 CIRKELDIAGRAM
Het cirkeldiagram is een grafische voorstelling die voornamelijk gebruikt wordt voor variabelen van nominaal
meetniveau.
De absolute frequentie van 𝑥 is het aantal keer dat de waarde 𝑥 in de steekproef voorkomt.
De absolute frequentieverdeling van 𝑋 is een tabel met twee rijen/kolommen waar de eerste rij/kolom de mogelijke
waarden van 𝑋 weergeeft en de tweede rij/kolom de overeenkomstige absolute frequenties.
De steekproefgrootte 𝑛 is gelijk aan het aantal elementen in de steekproef.
De relatieve absolute frequentie van 𝑥 is de absolute frequentie gedeeld door de steekproefgrootte 𝑛.
De verdeling van een variabele geeft het geheel van mogelijke waarden samen met de absolute of relatieve
frequenties.
Cirkeldiagrammen worden afgeraden om te gebruiken omdat het menselijk oog niet goed in staat is om de
oppervlaktes van een cirkeldiagram te beoordelen.
2.3 STAAFDIAGRAM
In een staafdiagram worden de verschillende waarden van de variabele horizontaal weergegeven en bij elke waarde
wordt een rechthoek getekend waarbij de hoogte gelijk is aan de absolute frequentie of de relatieve frequentie.
Alle rechthoeken moeten even breed zijn en de ruimte tussen twee rechthoeken moet ook steeds dezelfde zijn.
Staafdiagrammen worden gebruikt voor variabelen van nominaal of ordinaal niveau.
2.4 HISTOGRAM
Om een histogram te maken, moeten we eerst de data groeperen. We verdelen de data in klassen of intervallen
]𝑎, 𝑏].
De klassenbreedte van een interval ]𝑎, 𝑏] wordt gegeven door 𝑏 − 𝑎.
Statistiek I 3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller phoebevani. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.50. You're not tied to anything after your purchase.