Dit is een samenvatting van de video's van prof Claeys en assistent Nicolas Vamvas Ferrández. Deze samenvatting bevat alle formules en theorie die te kennen valt.
Deze samenvatting bevat oefeningen met hun oplossing.
Behaalde 16/20 op het examen.
Dear Delphine, sorry this summary is for the statistics lesson at the VUB and is not based on a certain book. Mvg Hanne
By: faridlamhasni • 7 year ago
By: ronny153 • 7 year ago
By: ah28 • 7 year ago
By: tomadam • 7 year ago
Show more reviews
Seller
Follow
BHanne
Reviews received
Content preview
Statistiek I 2016-2017 Hanne B.
Statistiek 1
Module 1: Hoofdstuk 1
Hoe kan je iets meten?
- Speciale en preciese apparatuur
- Kijken naar jaarrekeningen
- Relevante steekproef, maar wat is een goede steekproef?
1. Aantal bedrijven (bv. veel bedrijven)
2. Regelmaat (min of meer zeker van gelijkaardigheid tussen verschillende KMO’s)
3. Karakteristieken (Statistieken)
Wat is statistiek?
Middel om met behulp van gegevens inzicht te krijgen in reëele problemen.
We kunnen data beschrijven met behulp van tabellen, grafieken en statistieken.
Op basis van een steekproef, kunnen we met behulp van gegevens die een zekere regelmaat en bepaalde
karakteristieke vertonen, conclusies over een bepaald (economisch) fenomeen veralgemenen.
Enkel door achtergrondkennis (bij ond economische kennis) krijgen data echt een betekenis.
Een statistische berekening of grafiek is slechts een deel van het antwoord, de interpretatie is het belangrijkst. Een
interpretatie is een textuele analyse.
De meeste fouten in statistiek zijn niet de rekenfouten maar het zijn fouten in de interpretatie.
In de praktijk wordt statistiek heel vaak gebruikt. (bv. Overboekingen Ryanair, leveringen optijd DHL,..)
Een steekproef is een selectie van een aantal observaties uit een grotere groep. De grotere groep noemen we de
populatie.
Variabelen
Een variabele is een eigenschap of een kenmerk van een object. Het kan verschillende waarden aannemen. We
meten de variabelen van objecten. We kunnen ook meerdere variabelen van éénzelfde object meten.
Soorten variabelen onderscheiden
Het verschil tussen de soorten is belangrijk omdat we ze anders gaan analyseren. Gemiddelde kan worden
toegepast op kwantitatief maar niet op kwalitatief. Ze worden ook niet op dezelfde manier weergegeven.
o Kwalitatief (betrekking op eigenschappen uitgedrukt in woorden niet in getallen bv. Ijssmaak)
o Kwantitatief ( steeds met een getal uitgedrukt bv. Prijs van een aandeel)
- Continu ( kunnen oneindig veel tussenwaarden aannemen tussen 2 waarden bv. Percentages )
- Discreet ( kunnen niet oneindig veel tussenwaarden aannemen bv. Aantal honden)
1
,Statistiek I 2016-2017 Hanne B.
Module 1: Hoofdstuk 2
Hoe kwantitatieve en kwalitatieve variabelen op verschillende niveaus kunnen gemeten worden.
Er zijn 4 niveaus :
- Nominaal-niveau
- Ordinaal-niveau
- Interval-niveau
- Ratio-niveau
Verschillende vragen om te weten welk niveau:
1. Kun je het ordenen van groot naar klein of van klein naar groot? Nee nominale schaal (bv. Kleur)
2. Wel ordenen? Is er een vaste meeteenheid (bv. Punten, m, kg,…)? Neen ordinale schaal (bv. Tevredenheid)
3. Ordenen en een vaste meeteenheid? Is er een absoluut nulpunt? Neen minstens interval schaal gemeten (bv.
Graden, IQ,…)
4. Ordenen en een vaste meeteenheid en een absoluut nulpunt? Ratio schaal (bv. Geld)
Absoluut nulpunt = er is effectief niets bv nul euro nul kinderen. (niet nul graden)
Frequentietabel opstellen en interpreteren
Een frequentietabel bestaat uit volgende elementen:
- de waarden die de variabelen kunnen aannemen
- de absolute frequentie (van die waarde) = het aantal keer dat een bepaalde waarde voorkomt
- de relatieve frequentie = hoeveel procent van het aantal ondervraagden een bepaalde waarde als antwoord geven,
uitgedrukt in percentage.
- de cummulatieve absolute frequentie = het aantal keer een waarde en alle waarden kleiner of minder als deze
waarde voorkomt
- de cummulatieve relatieve frequentie = hoeveel procent van het aantal ondervraagde een bepaalde waarde of een
kleinere of mindere waarde als deze waarde als antwoord hebben gegeven, in percentages.
minstens een ordinale schaal is vereist om een cummultatieve frequentie te berekenen.
Het verschil tussen kwalitatieve variabelen en kwantitatieve variabelen
Grafiek van kwalitatieve variabelen
- staafdiagram
- taartdiagram
- cirkeldiagram
- Pareto diagram = een staafdiagram, waar de categorieën getoond
worden met een dalende frequentie. Wordt vaak gebruikt om enkele
belangrijke elementen te beklemtonen t.o.v. de minder belangrijke
elementen. Soms toont men ook de cumultatieve frequentie in
dezelfde grafiek om de proportie van elke categorie aan te duiden.
Grafiek kwantitatieve variabelen
- stam- en bladdiagram = simpelste manier om een verdeling in een dataset te zien
Men splitst de gesorteerde reeks in hoofddigits (stam) en de volgende digits (de bladen)
2
,Statistiek I 2016-2017 Hanne B.
- Histogram = stap 1: de data in stijgende vorm sorteren , 2. Verdelen in klassen en de grenzen van de klassen
bepalen. 3. Tel de waarnemingen en wijs ze toe aan de klassen.
Elke groep heeft dezelfde breedte. De breedte van elk interval is (hoogste waarde – laagste waarde) / aantal
intervallen. De grafiek van een frequentie tabel heet histogram.
- Ogive = een grafiek van de cumulatieve percentages
- Frequentie polygnoom = punten van het histogram zijn verbonden
- Tijdreeks = de x-as stelt de tijd voor (bv. Jaartallen)
-…
Typische fouten bij het maken van een histogram
- Ongelijke intervallen in het histogram
- De verticale as slecht weergeven
- Het nulpunt vergeten
- Assen moeten namen hebben
- Gebruik een relatieve basis wanneer je data vergelijkt tussen groepen
3
,Statistiek I 2016-2017 Hanne B.
Grafische presentatie van data
- De ruwe gegevens zijn meestal niet geschikt of weinig bruikbaar om verstaanbare informatie te geven We
moeten data samen vatten
- We kunnen gegevens organiseren met Tabellen, diagram, figuur, grafiek
- Het type grafiek en tabel hangt af van de variabelen die we willen samenvatten
Onderzoeken van patronen in data
- Kijk naar het globale patroon: vorm (symmetrie) , centrum, spreiding (massa)
- Kijk naar de afwijkingen: uitschieters die buiten het patroon vallen
Omgaan met uitschieters
- Het opsporen van extreme waarden is een kwestie van inschatten
- Zoek steeds een verklaring voor elke uitschieter
- De reden is soms simpeler dan verwacht namelijk fouten, download probleem, …
Grafieken evalueren en verbeteren
- Staven volgens dalende frequentie voorstellen (orde/volgorde)
- Staven horizontaal/verticaal tekst horizontaal
- De kleuren van de grafiek
- De titel van de grafiek
- Elementen die de kijker kan afleiden verwijderen
Kies de juiste en meest effectieve grafiek
- om iets te verkrijgen over de data
- Wat voor data heb je: Hoeveel? En soort: Disreet of Continu? Wat is de structuur? Wat wil ik ermee weergeven?
Vier categorieën
1. Vergelijking
- Proportie van het geheel
- Taartdiagram beter als donuts, staafdiagram beter als taartdiagram
- Punten op verschillende lijnen of 1 lijn (ééndimensioneel) als staafdiagram weinig verschil toont
2. Evolutie
- variabele (the slope)
- neem elke waarde per categorie en verbind deze met een lijn (goed om meerdere evoluties te vergelijken )
- Geen verschillende schalen in 1 grafiek zetten
- 2 grafieken met de zelfde schaal in 1 grafiek verschillende grafieken onder elkaar
- Verschillende staafdiagrammen zorgen voor verwarring
- 2 puntendiagrammen dat verbonden zijn (voor en na)
3. Correlatie
- Puntendiagram (x,y-as)
- meer als 2 variabelen 2+ grafieken in 2dimensie
4. Distributie
- Toon al de gegevens (anders kan het soms niet duidelijk zijn)
- Boxplot (maar nog steeds beter om alle gegevens te tonen)
(5. Vergelijken van evolutie, correlatie en distributie)
- vergelijk deze verschillende grafieken in 1 of meerdere grafieken
4
, Statistiek I 2016-2017 Hanne B.
Module 2: Hoofdstuk 3
Centrum van de grafiek zoeken (drie manieren)
1. Rekenkundig gemiddelde = som van de getallen/aantal observaties
- vaak gebruikt
- gevoelig voor extreme waarden (uitschieters)
2. Geometrisch gemiddelde = de mate van verandering in een variabele over de tijd
- voor tijdreeksen
- in percentage
3. Gewogen gemiddelde
- voegt aan elke observatie een bepaald gewicht dat bepaald hoe belangrijk die waarde is
- Met Wi het gewicht van de ie observatie
- N = de som van alle gewichten
Voorbeeld: Wat is het gemiddelde tarief?
4. Mediaan = middelste waarde van een geordende reeks
- 50% van de getallen er voor liggen, 50% er achter
- Ongevoelig voor uitschieters (als er een uitschieter is zal de mediaan vaak hetzelfde blijven)
- positie = (n+1)/2
- de positie ≠ de mediaan
- met een oneven aantal nummers ligt de mediaan in het midden
- met een even aantal nummers is de mediaan het gemiddelde van de 2 middelste nummers
5. Percentielen = duiden de positie van een waarde t.o.v. de gehele dataset aan
- vb. De IQ-score van het 90e percentiel betekent dat 10% van de bevolking een hoger IQ- score heeft en 90% een
lagere IQ score
- pe percentiel = waarde gepositioneerd in de (p/100)(n+1)e positie in een geordende reeks
6. Kwartiel = waarde gepositioneerd in de (25/100)(n+1)e positie in een geordende reeks
- splitsen en reeks in 4 segmenten (met elk een gelijk aantal observaties)
- 25%, 50%, 75% van alle waarden
- 2e kwartiel = mediaan
7. Deciel = waarde gepositioneerd in de (10/100)(n+1)e positie in een
geordende reeks
- jij kijkt dus naar 10%, 20%, 30%, …
8. Modus = de meest frequent voorkomende waarde
- er kan ook geen modus zijn als alle waarden evenveel voorkomen
- er kunnen meerdere modussen zijn (als 2 waarden evenveel voorkomen)
- wordt niet beïnvloedt door extreme waarden (ongevoelig voor uischieters)
- zowel voor kwantitatieve als kwalitatieve data
5
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller BHanne. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.41. You're not tied to anything after your purchase.