Uitwerkingen van alle hoorcolleges van statistiek uit blok 1.2 van jaar 1 Bedrijfskunde aan de RUG. Deze aantekeningen vormen alle tentamenstof voor dit vak.
Met deze samenvatting een 9 gehaald voor statistiek.
Probleem: Rauwe data is complex en moeilijk interpreteerbaar
Oplossing: Data samenvatten in grafiek en enkele getallen.
Populatie is de gehele groep (mensen/dingen/…) waarover we iets willen zeggen.
Parameters zijn waarden die berekend worden aan de hand van populatiedata. Sprake van zekerheid hierover.
Steekproef (sample) is het deel (subset) van de populatie dat daadwerkelijk onderzocht wordt.
Statistieken (statistics) zijn waarden die berekend worden aan de hand van steekproefdata. Dit is onzeker.
Aan de hand van een steekproef willen we iets kunnen zeggen over een populatie.
Voor parameters en statistieken worden verschillende symbolen gebruikt, omdat dit niet hetzelfde is.
Populatie: Hoofdletter Steekproef: Kleine letter
Er zijn verschillende soorten data, hier is de methode afhankelijk van.
1. Kwalitatieve data: Waarden zijn categoriën. Hier kan/mag je niet mee rekenen.
a. Ordinale data: Waarden hebben een hiërarchische volgorde.
b. Nominale data: Er is geen logische volgorde van de waarden.
2. Kwantitatieve data: Waarden zijn getallen waarmee je kan/mag rekenen.
a. Intervaldata: Zowel negatieve als positieve waarden zijn mogelijk
b. Ratiodata: Er is een werkelijk nulpunt, een negatieve waarde is onmogelijk.
c. Continu: Je kunt het tellen
d. Discreet: Alle mogelijke getallen
Grafische grafieken Het type data bepaalt welk type diagram geschikt is.
Kwalitatieve data:
- Frequentieverdelling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Staafdiagram (bar chart)
- Kruistabel (crosstab / contingency table)
Kwantitatieve data
- Frequentieverdeling (frequency distribution)
o Aantal groepen moet voldoende zijn om de data goed te beschrijven
o Breedte van de groep is (max-min)/aantal groepen
- Histogram
o Laat de kansverdeling zien, dus hoevaak welke waarden voorkomen
o Belangrijke informatie is of het histogram (ongeveer) symmetrisch is. Dit is makkelijk samen
te vatten.
o Asymmetrisch kan rechts scheef verdeeld (staart wijst naar rechts) of links scheef verdeelt
(staart wijst naar links).
- Spreidingsdiagram (scatter plot)
- Lijndiagram (line chart)
Staafdiagram Kruistabel
Frequentieverdeling
Lijndiagram
Spreidingsdiagram
Histogram
, Numerieke technieken Dit geeft meer detail dan een grafische weergave.
Er zijn drie categorieën van dingen die we uit kunnen rekenen.
- Centrale tendens middelpunt van een verdeling
Gemiddelde (mean) is de som van alle waarden gedeeld door aantal waarden.
Populatiegemiddelde:
Steekproefgemiddelde:
Nadeel: Gevoelig voor extreme waarden / uitschieters (outliers)
Mediaan is het middelpunt van de gesorteerde waarden. Dus het middelste getal. (50e percentiel)
Modus is de meest voorkomende/geobserveerde waarde (als deze bestaat). Er kunnen ook meerdere zijn.
Voordeel: Kan ook gebruikt worden bij categoriale data.
- Variabiliteit uitwijking rondom het gemiddelde
De variatie rondom het gemiddelde is op diverse manieren in een getal uit te drukken:
Bereik / spreidingsbreedte (range) is maximum – minimum.
Interkwartielafstand (interquartile range, IQR) is Q3 – Q1. (= minder gevoelig voor uitschieters)
Variantie / standaardafwijking (=standaarddeviatie)
- Delen door N-1 bij een steekproef
- Delen door N bij een populatie
Interpretatie: Hoe ver wijkt een observatie gemiddeld genomen af van het gemiddelde.
Hoe hoger de standaardafwijking, hoe meer afwijkingen/spreiding van het gemiddelde de getallen hebben…
Door de empirische regel kun je vrij nauwkeurig zeggen welk % van de data binnen een aantal
standaardafwijkingen van het gemiddelde ligt. De bel-vormige verdeling:
- Relatie tussen variabelen. Relatie tussen variabelen
2 maten van relatie tussen variabelen: X is de onafhankelijke variabele (independent variable)
Y is de afhankelijke variabele (dependent variable)
Covariantie (covariance)
Dit meet de richting van een lineaire relatie tussen 2 variabelen.
Populatiecovariantie:
Steekproefcovariantie:
- Cov(x,y) > 0 ⇒ x en y zijn geneigd in dezelfde richting te bewegen
- Cov(x,y) < 0 ⇒ x en y zijn geneigd in tegengestelde richting te bewegen
o Dus als X hoger wordt, wordt Y lager.
- Cov(x,y) = 0 ⇒ x en y zijn niet geneigd in dezelfde of tegengestelde richting te bewegen. (horizontaal?)
Correlatie (correlation)
Mate van zowel de richting als de sterkte van het lineaire verband tussen 2 variabelen.
Deze is makkelijker interpreteerbaar dan de covariantie.
Populatiecorrelatiecoëfficient: - Geen eenheid
- Ligt tussen −1 en 1
- Dichter bij −1: sterker negatief lineair verband
- Dichter bij 1: sterker positief lineair verband
- Dichter bij 0: zwakker lineair verband
- Belangrijk: een correlatie betekent nog niet dat er
perse een causaal verband is! Het kunnen volstrekt
ongerelateerde variabelen zijn!
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Willemijn3. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.