Beschrijvende statistiek geeft weer welke grafieken en variabelen je wanneer gebruikt, enkel om te beschrijven. Hier worden er nog geen verbanden of verschillen bekeken.
Hoofdstuk 1: Beschrijvende
statistiek
Beschrijvende statstei is het beschrijven van de gegevensverzameling vanuit de steekproef. Het
wordt gebruiit bij exploratieve data-anaalsse waarbij elie variabele individueel verient wordt. Je
werit eerst GRAFISCH (visueel), dana NUMERIEK (data-reducte).
Weergeven van verdelingen met GRAFIEKEN
Grafieken voor kaalitatieve variaeelen
Kwalitateve variabelen zijn categorische variabelen. Je iunt niets doen met woorden, daarom
worden ze in aantallen weergegeven (liefst in % (duidelijier)) . Ze iunnen worden weergegeven in
een staafdiagram of taartdiagram .
Grafieken voor kaantitatieve variaeelen
Geef de variate binnen verzameling van getallen weer. Een variatiepatroon van iwanttateve
variabelen is een verdelinag van de variabelen. Hierbij wordt er gebruiigemaait van
- Frequentetabel
- Grafische voorstelling
Stamdiagram: geef de vorm van de verdeling weer
Voorbeeld: Aantal doelpunten per seizoen van 10 ploegen
In de STAM iolom worden alle 1e getallen
weergegeven. In de BLAD iolom worden eniel
de laatste getallen weergegeven van ilein naar
groot.
Je ian ooi een rug-aan-rug stamdiagram maien waarbij 2 verdelingen met eliaar
worden vergeleien.
Eigenschappen:
Niet geschiit voor grote groepen of veel observates.
Histogrammena: Aantal (frequente) of % waarnemingen in eli interval.
De data wordt hierbij eerst verdeeld in ilassen van gelijke breedte. De ieuze van het
aantal ilassen is belangriji: Te weinig zorgt voor allemaal hoge bloiien in je histogram,
te veel zorgt voor het omgeieerde. In tegenstelling tot de staafdiagram worden er hier
geena ruimtes gelaten tussen de verschillende staafes.
Onderzoeien van verdelingen
Een iiji in de grafische voorstellingen zorgt voor een zicht op het globale patroon en
opvallende afwijiingen.
Eigenschappen verdelingen
De cenatrum van de verdeling wordt door de MEDIAAN (M) of het GEMIDDELDE ( x́ )
aangeduid.
De spreidinag is de RANGE tussen het minimum en maximum. Het is de spreiding
t.o.v. de centrummaat. Het geef aan in welie mate de data verspreid is van het
gemiddelde/mediaan. De modus is de score die het meest frequent vooriomt en
dus ooi de top van de grafiei is. (een top of verschillende is uni- of multmodaal)
De vorm van de verdeling ian scheef of symmetrisch zijn.
1
, De uitbijters zijn afwijiingen van de algemene vorm. Deze ian langs de minimum of
maximum iant vooriomen. Soms hebben ze een beteienis en mogen ze dan NIET
weggelaten worden (M gebruiken), indien ze een fout voorstellen en dus geen
beteienis hebben mogen ze WEL weggelaten worden ( x́ gebruiken). De uitbijters
hebben een invloed op het gemiddelde!
Tijdreeksgrafiekena: lijndiagrammen
Hierbij worden gegevens uitgezet tegen tjd of volgorde, waarbij de tijd altjd op de
horizonatale as wordt voorgesteld:
Verdelingen numeriek eeschrijven
Herhaling: Eerst iijien we naar de vorm van de verdeling op een GRAFISCHE manier. Deze geef ons
eniel een idee “OP HET ZICHT” en dus geen exacte gegevens. Vervolgens is er de NUMERIEK
beschrijving, met de cenatrum en spreidinag die wordt bereiend voor geliji welie iwanttateve
variabele.
Meten van het centrum: Gemiddelde en Mediaan
Rekenkundig gemiddelde of gemiddelde
Het gemiddelde bereienen doen we door alle waarnemingen op te tellen en deze te delen door het
1
n ∑ 1
aantal waarnemingen: x́ = . x . Het gemiddelde is GEEN resistente maat!
Mediaan
De mediaan is de middelste waarneming in geordende lijst. Bij een oneven lijst neem je het
middelste, bij een even lijst neem je het gemiddelde van de twee middelste. Om de posite van M te
(n+1)
vinden: . De mediaan is gemaiieliji af te lezen uit een STAMdiagram en is WEL een resistente
2
centrummaat.
Gemiddelde vs. Mediaan
Bij een ssmmetrische verdeling is het gemiddelde geliji aan de mediaan. Naarmate de verdelingen
schever worden, gaan de gemiddelde en mediaan verder uit eliaar liggen.
- Uitbijters corrigeren of weglaten x́
- Uitbijters erin laten M
Meten van spreiding: Kaartielen (M)
Kaartielen
Kwartelen worden gebruiit bij het beschrijven een verdeling: Centrummaat en spreidingsmaat. Een
spreidinagsmaat gaat de variabiliteit1 van een verdeling uitdruiien. De spreidinag is het verschil tussen
het maximum en het minimum. Resultaten iunnen een gelijie M en x́ hebben, maar een
verschillende spreiding.
1
Variabiliteit = spreiding
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper emiliea. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,99. Je zit daarna nergens aan vast.