Dit is een samenvatting van de video's van prof Claeys en assistent Nicolas Vamvas Ferrández. Deze samenvatting bevat alle formules en theorie die te kennen valt.
Deze samenvatting bevat oefeningen met hun oplossing.
Behaalde 16/20 op het examen.
Statistiek 1
Module 1: Hoofdstuk 1
Hoe kan je iets meten?
- Speciale en preciese apparatuur
- Kijken naar jaarrekeningen
- Relevante steekproef, maar wat is een goede steekproef?
1. Aantal bedrijven (bv. veel bedrijven)
2. Regelmaat (min of meer zeker van gelijkaardigheid tussen verschillende KMO’s)
3. Karakteristieken (Statistieken)
Wat is statistiek?
Middel om met behulp van gegevens inzicht te krijgen in reëele problemen.
We kunnen data beschrijven met behulp van tabellen, grafieken en statistieken.
Op basis van een steekproef, kunnen we met behulp van gegevens die een zekere regelmaat en bepaalde
karakteristieke vertonen, conclusies over een bepaald (economisch) fenomeen veralgemenen.
Enkel door achtergrondkennis (bij ond economische kennis) krijgen data echt een betekenis.
Een statistische berekening of grafiek is slechts een deel van het antwoord, de interpretatie is het belangrijkst. Een
interpretatie is een textuele analyse.
De meeste fouten in statistiek zijn niet de rekenfouten maar het zijn fouten in de interpretatie.
In de praktijk wordt statistiek heel vaak gebruikt. (bv. Overboekingen Ryanair, leveringen optijd DHL,..)
Een steekproef is een selectie van een aantal observaties uit een grotere groep. De grotere groep noemen we de
populatie.
Variabelen
Een variabele is een eigenschap of een kenmerk van een object. Het kan verschillende waarden aannemen. We
meten de variabelen van objecten. We kunnen ook meerdere variabelen van éénzelfde object meten.
Soorten variabelen onderscheiden
Het verschil tussen de soorten is belangrijk omdat we ze anders gaan analyseren. Gemiddelde kan worden
toegepast op kwantitatief maar niet op kwalitatief. Ze worden ook niet op dezelfde manier weergegeven.
o Kwalitatief (betrekking op eigenschappen uitgedrukt in woorden niet in getallen bv. Ijssmaak)
o Kwantitatief ( steeds met een getal uitgedrukt bv. Prijs van een aandeel)
- Continu ( kunnen oneindig veel tussenwaarden aannemen tussen 2 waarden bv. Percentages )
- Discreet ( kunnen niet oneindig veel tussenwaarden aannemen bv. Aantal honden)
1
,Statistiek I 2016-2017 Hanne B.
Module 1: Hoofdstuk 2
Hoe kwantitatieve en kwalitatieve variabelen op verschillende niveaus kunnen gemeten worden.
Er zijn 4 niveaus :
- Nominaal-niveau
- Ordinaal-niveau
- Interval-niveau
- Ratio-niveau
Verschillende vragen om te weten welk niveau:
1. Kun je het ordenen van groot naar klein of van klein naar groot? Nee nominale schaal (bv. Kleur)
2. Wel ordenen? Is er een vaste meeteenheid (bv. Punten, m, kg,…)? Neen ordinale schaal (bv. Tevredenheid)
3. Ordenen en een vaste meeteenheid? Is er een absoluut nulpunt? Neen minstens interval schaal gemeten (bv.
Graden, IQ,…)
4. Ordenen en een vaste meeteenheid en een absoluut nulpunt? Ratio schaal (bv. Geld)
Absoluut nulpunt = er is effectief niets bv nul euro nul kinderen. (niet nul graden)
Frequentietabel opstellen en interpreteren
Een frequentietabel bestaat uit volgende elementen:
- de waarden die de variabelen kunnen aannemen
- de absolute frequentie (van die waarde) = het aantal keer dat een bepaalde waarde voorkomt
- de relatieve frequentie = hoeveel procent van het aantal ondervraagden een bepaalde waarde als antwoord geven,
uitgedrukt in percentage.
- de cummulatieve absolute frequentie = het aantal keer een waarde en alle waarden kleiner of minder als deze
waarde voorkomt
- de cummulatieve relatieve frequentie = hoeveel procent van het aantal ondervraagde een bepaalde waarde of een
kleinere of mindere waarde als deze waarde als antwoord hebben gegeven, in percentages.
minstens een ordinale schaal is vereist om een cummultatieve frequentie te berekenen.
Het verschil tussen kwalitatieve variabelen en kwantitatieve variabelen
Grafiek van kwalitatieve variabelen
- staafdiagram
- taartdiagram
- cirkeldiagram
- Pareto diagram = een staafdiagram, waar de categorieën getoond
worden met een dalende frequentie. Wordt vaak gebruikt om enkele
belangrijke elementen te beklemtonen t.o.v. de minder belangrijke
elementen. Soms toont men ook de cumultatieve frequentie in
dezelfde grafiek om de proportie van elke categorie aan te duiden.
Grafiek kwantitatieve variabelen
- stam- en bladdiagram = simpelste manier om een verdeling in een dataset te zien
Men splitst de gesorteerde reeks in hoofddigits (stam) en de volgende digits (de bladen)
2
,Statistiek I 2016-2017 Hanne B.
- Histogram = stap 1: de data in stijgende vorm sorteren , 2. Verdelen in klassen en de grenzen van de klassen
bepalen. 3. Tel de waarnemingen en wijs ze toe aan de klassen.
Elke groep heeft dezelfde breedte. De breedte van elk interval is (hoogste waarde – laagste waarde) / aantal
intervallen. De grafiek van een frequentie tabel heet histogram.
- Ogive = een grafiek van de cumulatieve percentages
- Frequentie polygnoom = punten van het histogram zijn verbonden
- Tijdreeks = de x-as stelt de tijd voor (bv. Jaartallen)
-…
Typische fouten bij het maken van een histogram
- Ongelijke intervallen in het histogram
- De verticale as slecht weergeven
- Het nulpunt vergeten
- Assen moeten namen hebben
- Gebruik een relatieve basis wanneer je data vergelijkt tussen groepen
3
,Statistiek I 2016-2017 Hanne B.
Grafische presentatie van data
- De ruwe gegevens zijn meestal niet geschikt of weinig bruikbaar om verstaanbare informatie te geven We
moeten data samen vatten
- We kunnen gegevens organiseren met Tabellen, diagram, figuur, grafiek
- Het type grafiek en tabel hangt af van de variabelen die we willen samenvatten
Onderzoeken van patronen in data
- Kijk naar het globale patroon: vorm (symmetrie) , centrum, spreiding (massa)
- Kijk naar de afwijkingen: uitschieters die buiten het patroon vallen
Omgaan met uitschieters
- Het opsporen van extreme waarden is een kwestie van inschatten
- Zoek steeds een verklaring voor elke uitschieter
- De reden is soms simpeler dan verwacht namelijk fouten, download probleem, …
Grafieken evalueren en verbeteren
- Staven volgens dalende frequentie voorstellen (orde/volgorde)
- Staven horizontaal/verticaal tekst horizontaal
- De kleuren van de grafiek
- De titel van de grafiek
- Elementen die de kijker kan afleiden verwijderen
Kies de juiste en meest effectieve grafiek
- om iets te verkrijgen over de data
- Wat voor data heb je: Hoeveel? En soort: Disreet of Continu? Wat is de structuur? Wat wil ik ermee weergeven?
Vier categorieën
1. Vergelijking
- Proportie van het geheel
- Taartdiagram beter als donuts, staafdiagram beter als taartdiagram
- Punten op verschillende lijnen of 1 lijn (ééndimensioneel) als staafdiagram weinig verschil toont
2. Evolutie
- variabele (the slope)
- neem elke waarde per categorie en verbind deze met een lijn (goed om meerdere evoluties te vergelijken )
- Geen verschillende schalen in 1 grafiek zetten
- 2 grafieken met de zelfde schaal in 1 grafiek verschillende grafieken onder elkaar
- Verschillende staafdiagrammen zorgen voor verwarring
- 2 puntendiagrammen dat verbonden zijn (voor en na)
3. Correlatie
- Puntendiagram (x,y-as)
- meer als 2 variabelen 2+ grafieken in 2dimensie
4. Distributie
- Toon al de gegevens (anders kan het soms niet duidelijk zijn)
- Boxplot (maar nog steeds beter om alle gegevens te tonen)
(5. Vergelijken van evolutie, correlatie en distributie)
- vergelijk deze verschillende grafieken in 1 of meerdere grafieken
4
, Statistiek I 2016-2017 Hanne B.
Module 2: Hoofdstuk 3
Centrum van de grafiek zoeken (drie manieren)
1. Rekenkundig gemiddelde = som van de getallen/aantal observaties
- vaak gebruikt
- gevoelig voor extreme waarden (uitschieters)
2. Geometrisch gemiddelde = de mate van verandering in een variabele over de tijd
- voor tijdreeksen
- in percentage
3. Gewogen gemiddelde
- voegt aan elke observatie een bepaald gewicht dat bepaald hoe belangrijk die waarde is
- Met Wi het gewicht van de ie observatie
- N = de som van alle gewichten
Voorbeeld: Wat is het gemiddelde tarief?
4. Mediaan = middelste waarde van een geordende reeks
- 50% van de getallen er voor liggen, 50% er achter
- Ongevoelig voor uitschieters (als er een uitschieter is zal de mediaan vaak hetzelfde blijven)
- positie = (n+1)/2
- de positie ≠ de mediaan
- met een oneven aantal nummers ligt de mediaan in het midden
- met een even aantal nummers is de mediaan het gemiddelde van de 2 middelste nummers
5. Percentielen = duiden de positie van een waarde t.o.v. de gehele dataset aan
- vb. De IQ-score van het 90e percentiel betekent dat 10% van de bevolking een hoger IQ- score heeft en 90% een
lagere IQ score
- pe percentiel = waarde gepositioneerd in de (p/100)(n+1)e positie in een geordende reeks
6. Kwartiel = waarde gepositioneerd in de (25/100)(n+1)e positie in een geordende reeks
- splitsen en reeks in 4 segmenten (met elk een gelijk aantal observaties)
- 25%, 50%, 75% van alle waarden
- 2e kwartiel = mediaan
7. Deciel = waarde gepositioneerd in de (10/100)(n+1)e positie in een
geordende reeks
- jij kijkt dus naar 10%, 20%, 30%, …
8. Modus = de meest frequent voorkomende waarde
- er kan ook geen modus zijn als alle waarden evenveel voorkomen
- er kunnen meerdere modussen zijn (als 2 waarden evenveel voorkomen)
- wordt niet beïnvloedt door extreme waarden (ongevoelig voor uischieters)
- zowel voor kwantitatieve als kwalitatieve data
5
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur BHanne. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €4,99. Vous n'êtes lié à rien après votre achat.