Dit is een samenvatting van de video's van prof Claeys en assistent Nicolas Vamvas Ferrández. Deze samenvatting bevat alle formules en theorie die te kennen valt.
Deze samenvatting bevat oefeningen met hun oplossing.
Behaalde 16/20 op het examen.
Beste Delphine, 
sorry deze samenvatting is voor de les statistiek aan de VUB en is niet gebaseerd op een bepaald boek. 
Mvg Hanne
Statistiek 1
Module 1: Hoofdstuk 1
Hoe kan je iets meten?
- Speciale en preciese apparatuur
- Kijken naar jaarrekeningen
- Relevante steekproef, maar wat is een goede steekproef?
1. Aantal bedrijven (bv. veel bedrijven)
2. Regelmaat (min of meer zeker van gelijkaardigheid tussen verschillende KMO’s)
3. Karakteristieken (Statistieken)
Wat is statistiek?
Middel om met behulp van gegevens inzicht te krijgen in reëele problemen.
We kunnen data beschrijven met behulp van tabellen, grafieken en statistieken.
Op basis van een steekproef, kunnen we met behulp van gegevens die een zekere regelmaat en bepaalde
karakteristieke vertonen, conclusies over een bepaald (economisch) fenomeen veralgemenen.
Enkel door achtergrondkennis (bij ond economische kennis) krijgen data echt een betekenis.
Een statistische berekening of grafiek is slechts een deel van het antwoord, de interpretatie is het belangrijkst. Een
interpretatie is een textuele analyse.
De meeste fouten in statistiek zijn niet de rekenfouten maar het zijn fouten in de interpretatie.
In de praktijk wordt statistiek heel vaak gebruikt. (bv. Overboekingen Ryanair, leveringen optijd DHL,..)
Een steekproef is een selectie van een aantal observaties uit een grotere groep. De grotere groep noemen we de
populatie.
Variabelen
Een variabele is een eigenschap of een kenmerk van een object. Het kan verschillende waarden aannemen. We
meten de variabelen van objecten. We kunnen ook meerdere variabelen van éénzelfde object meten.
Soorten variabelen onderscheiden
Het verschil tussen de soorten is belangrijk omdat we ze anders gaan analyseren. Gemiddelde kan worden
toegepast op kwantitatief maar niet op kwalitatief. Ze worden ook niet op dezelfde manier weergegeven.
o Kwalitatief (betrekking op eigenschappen uitgedrukt in woorden niet in getallen bv. Ijssmaak)
o Kwantitatief ( steeds met een getal uitgedrukt bv. Prijs van een aandeel)
- Continu ( kunnen oneindig veel tussenwaarden aannemen tussen 2 waarden bv. Percentages )
- Discreet ( kunnen niet oneindig veel tussenwaarden aannemen bv. Aantal honden)
1
,Statistiek I 2016-2017 Hanne B.
Module 1: Hoofdstuk 2
Hoe kwantitatieve en kwalitatieve variabelen op verschillende niveaus kunnen gemeten worden.
Er zijn 4 niveaus :
- Nominaal-niveau
- Ordinaal-niveau
- Interval-niveau
- Ratio-niveau
Verschillende vragen om te weten welk niveau:
1. Kun je het ordenen van groot naar klein of van klein naar groot? Nee nominale schaal (bv. Kleur)
2. Wel ordenen? Is er een vaste meeteenheid (bv. Punten, m, kg,…)? Neen ordinale schaal (bv. Tevredenheid)
3. Ordenen en een vaste meeteenheid? Is er een absoluut nulpunt? Neen minstens interval schaal gemeten (bv.
Graden, IQ,…)
4. Ordenen en een vaste meeteenheid en een absoluut nulpunt? Ratio schaal (bv. Geld)
Absoluut nulpunt = er is effectief niets bv nul euro nul kinderen. (niet nul graden)
Frequentietabel opstellen en interpreteren
Een frequentietabel bestaat uit volgende elementen:
- de waarden die de variabelen kunnen aannemen
- de absolute frequentie (van die waarde) = het aantal keer dat een bepaalde waarde voorkomt
- de relatieve frequentie = hoeveel procent van het aantal ondervraagden een bepaalde waarde als antwoord geven,
uitgedrukt in percentage.
- de cummulatieve absolute frequentie = het aantal keer een waarde en alle waarden kleiner of minder als deze
waarde voorkomt
- de cummulatieve relatieve frequentie = hoeveel procent van het aantal ondervraagde een bepaalde waarde of een
kleinere of mindere waarde als deze waarde als antwoord hebben gegeven, in percentages.
minstens een ordinale schaal is vereist om een cummultatieve frequentie te berekenen.
Het verschil tussen kwalitatieve variabelen en kwantitatieve variabelen
Grafiek van kwalitatieve variabelen
- staafdiagram
- taartdiagram
- cirkeldiagram
- Pareto diagram = een staafdiagram, waar de categorieën getoond
worden met een dalende frequentie. Wordt vaak gebruikt om enkele
belangrijke elementen te beklemtonen t.o.v. de minder belangrijke
elementen. Soms toont men ook de cumultatieve frequentie in
dezelfde grafiek om de proportie van elke categorie aan te duiden.
Grafiek kwantitatieve variabelen
- stam- en bladdiagram = simpelste manier om een verdeling in een dataset te zien
Men splitst de gesorteerde reeks in hoofddigits (stam) en de volgende digits (de bladen)
2
,Statistiek I 2016-2017 Hanne B.
- Histogram = stap 1: de data in stijgende vorm sorteren , 2. Verdelen in klassen en de grenzen van de klassen
bepalen. 3. Tel de waarnemingen en wijs ze toe aan de klassen.
Elke groep heeft dezelfde breedte. De breedte van elk interval is (hoogste waarde – laagste waarde) / aantal
intervallen. De grafiek van een frequentie tabel heet histogram.
- Ogive = een grafiek van de cumulatieve percentages
- Frequentie polygnoom = punten van het histogram zijn verbonden
- Tijdreeks = de x-as stelt de tijd voor (bv. Jaartallen)
-…
Typische fouten bij het maken van een histogram
- Ongelijke intervallen in het histogram
- De verticale as slecht weergeven
- Het nulpunt vergeten
- Assen moeten namen hebben
- Gebruik een relatieve basis wanneer je data vergelijkt tussen groepen
3
,Statistiek I 2016-2017 Hanne B.
Grafische presentatie van data
- De ruwe gegevens zijn meestal niet geschikt of weinig bruikbaar om verstaanbare informatie te geven We
moeten data samen vatten
- We kunnen gegevens organiseren met Tabellen, diagram, figuur, grafiek
- Het type grafiek en tabel hangt af van de variabelen die we willen samenvatten
Onderzoeken van patronen in data
- Kijk naar het globale patroon: vorm (symmetrie) , centrum, spreiding (massa)
- Kijk naar de afwijkingen: uitschieters die buiten het patroon vallen
Omgaan met uitschieters
- Het opsporen van extreme waarden is een kwestie van inschatten
- Zoek steeds een verklaring voor elke uitschieter
- De reden is soms simpeler dan verwacht namelijk fouten, download probleem, …
Grafieken evalueren en verbeteren
- Staven volgens dalende frequentie voorstellen (orde/volgorde)
- Staven horizontaal/verticaal tekst horizontaal
- De kleuren van de grafiek
- De titel van de grafiek
- Elementen die de kijker kan afleiden verwijderen
Kies de juiste en meest effectieve grafiek
- om iets te verkrijgen over de data
- Wat voor data heb je: Hoeveel? En soort: Disreet of Continu? Wat is de structuur? Wat wil ik ermee weergeven?
Vier categorieën
1. Vergelijking
- Proportie van het geheel
- Taartdiagram beter als donuts, staafdiagram beter als taartdiagram
- Punten op verschillende lijnen of 1 lijn (ééndimensioneel) als staafdiagram weinig verschil toont
2. Evolutie
- variabele (the slope)
- neem elke waarde per categorie en verbind deze met een lijn (goed om meerdere evoluties te vergelijken )
- Geen verschillende schalen in 1 grafiek zetten
- 2 grafieken met de zelfde schaal in 1 grafiek verschillende grafieken onder elkaar
- Verschillende staafdiagrammen zorgen voor verwarring
- 2 puntendiagrammen dat verbonden zijn (voor en na)
3. Correlatie
- Puntendiagram (x,y-as)
- meer als 2 variabelen 2+ grafieken in 2dimensie
4. Distributie
- Toon al de gegevens (anders kan het soms niet duidelijk zijn)
- Boxplot (maar nog steeds beter om alle gegevens te tonen)
(5. Vergelijken van evolutie, correlatie en distributie)
- vergelijk deze verschillende grafieken in 1 of meerdere grafieken
4
, Statistiek I 2016-2017 Hanne B.
Module 2: Hoofdstuk 3
Centrum van de grafiek zoeken (drie manieren)
1. Rekenkundig gemiddelde = som van de getallen/aantal observaties
- vaak gebruikt
- gevoelig voor extreme waarden (uitschieters)
2. Geometrisch gemiddelde = de mate van verandering in een variabele over de tijd
- voor tijdreeksen
- in percentage
3. Gewogen gemiddelde
- voegt aan elke observatie een bepaald gewicht dat bepaald hoe belangrijk die waarde is
- Met Wi het gewicht van de ie observatie
- N = de som van alle gewichten
Voorbeeld: Wat is het gemiddelde tarief?
4. Mediaan = middelste waarde van een geordende reeks
- 50% van de getallen er voor liggen, 50% er achter
- Ongevoelig voor uitschieters (als er een uitschieter is zal de mediaan vaak hetzelfde blijven)
- positie = (n+1)/2
- de positie ≠ de mediaan
- met een oneven aantal nummers ligt de mediaan in het midden
- met een even aantal nummers is de mediaan het gemiddelde van de 2 middelste nummers
5. Percentielen = duiden de positie van een waarde t.o.v. de gehele dataset aan
- vb. De IQ-score van het 90e percentiel betekent dat 10% van de bevolking een hoger IQ- score heeft en 90% een
lagere IQ score
- pe percentiel = waarde gepositioneerd in de (p/100)(n+1)e positie in een geordende reeks
6. Kwartiel = waarde gepositioneerd in de (25/100)(n+1)e positie in een geordende reeks
- splitsen en reeks in 4 segmenten (met elk een gelijk aantal observaties)
- 25%, 50%, 75% van alle waarden
- 2e kwartiel = mediaan
7. Deciel = waarde gepositioneerd in de (10/100)(n+1)e positie in een
geordende reeks
- jij kijkt dus naar 10%, 20%, 30%, …
8. Modus = de meest frequent voorkomende waarde
- er kan ook geen modus zijn als alle waarden evenveel voorkomen
- er kunnen meerdere modussen zijn (als 2 waarden evenveel voorkomen)
- wordt niet beïnvloedt door extreme waarden (ongevoelig voor uischieters)
- zowel voor kwantitatieve als kwalitatieve data
5
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper BHanne. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.