Beschrijvende statistiek geeft weer welke grafieken en variabelen je wanneer gebruikt, enkel om te beschrijven. Hier worden er nog geen verbanden of verschillen bekeken.
Hoofdstuk 1: Beschrijvende
statistiek
Beschrijvende statstei is het beschrijven van de gegevensverzameling vanuit de steekproef. Het
wordt gebruiit bij exploratieve data-anaalsse waarbij elie variabele individueel verient wordt. Je
werit eerst GRAFISCH (visueel), dana NUMERIEK (data-reducte).
Weergeven van verdelingen met GRAFIEKEN
Grafieken voor kaalitatieve variaeelen
Kwalitateve variabelen zijn categorische variabelen. Je iunt niets doen met woorden, daarom
worden ze in aantallen weergegeven (liefst in % (duidelijier)) . Ze iunnen worden weergegeven in
een staafdiagram of taartdiagram .
Grafieken voor kaantitatieve variaeelen
Geef de variate binnen verzameling van getallen weer. Een variatiepatroon van iwanttateve
variabelen is een verdelinag van de variabelen. Hierbij wordt er gebruiigemaait van
- Frequentetabel
- Grafische voorstelling
Stamdiagram: geef de vorm van de verdeling weer
Voorbeeld: Aantal doelpunten per seizoen van 10 ploegen
In de STAM iolom worden alle 1e getallen
weergegeven. In de BLAD iolom worden eniel
de laatste getallen weergegeven van ilein naar
groot.
Je ian ooi een rug-aan-rug stamdiagram maien waarbij 2 verdelingen met eliaar
worden vergeleien.
Eigenschappen:
Niet geschiit voor grote groepen of veel observates.
Histogrammena: Aantal (frequente) of % waarnemingen in eli interval.
De data wordt hierbij eerst verdeeld in ilassen van gelijke breedte. De ieuze van het
aantal ilassen is belangriji: Te weinig zorgt voor allemaal hoge bloiien in je histogram,
te veel zorgt voor het omgeieerde. In tegenstelling tot de staafdiagram worden er hier
geena ruimtes gelaten tussen de verschillende staafes.
Onderzoeien van verdelingen
Een iiji in de grafische voorstellingen zorgt voor een zicht op het globale patroon en
opvallende afwijiingen.
Eigenschappen verdelingen
De cenatrum van de verdeling wordt door de MEDIAAN (M) of het GEMIDDELDE ( x́ )
aangeduid.
De spreidinag is de RANGE tussen het minimum en maximum. Het is de spreiding
t.o.v. de centrummaat. Het geef aan in welie mate de data verspreid is van het
gemiddelde/mediaan. De modus is de score die het meest frequent vooriomt en
dus ooi de top van de grafiei is. (een top of verschillende is uni- of multmodaal)
De vorm van de verdeling ian scheef of symmetrisch zijn.
1
, De uitbijters zijn afwijiingen van de algemene vorm. Deze ian langs de minimum of
maximum iant vooriomen. Soms hebben ze een beteienis en mogen ze dan NIET
weggelaten worden (M gebruiken), indien ze een fout voorstellen en dus geen
beteienis hebben mogen ze WEL weggelaten worden ( x́ gebruiken). De uitbijters
hebben een invloed op het gemiddelde!
Tijdreeksgrafiekena: lijndiagrammen
Hierbij worden gegevens uitgezet tegen tjd of volgorde, waarbij de tijd altjd op de
horizonatale as wordt voorgesteld:
Verdelingen numeriek eeschrijven
Herhaling: Eerst iijien we naar de vorm van de verdeling op een GRAFISCHE manier. Deze geef ons
eniel een idee “OP HET ZICHT” en dus geen exacte gegevens. Vervolgens is er de NUMERIEK
beschrijving, met de cenatrum en spreidinag die wordt bereiend voor geliji welie iwanttateve
variabele.
Meten van het centrum: Gemiddelde en Mediaan
Rekenkundig gemiddelde of gemiddelde
Het gemiddelde bereienen doen we door alle waarnemingen op te tellen en deze te delen door het
1
n ∑ 1
aantal waarnemingen: x́ = . x . Het gemiddelde is GEEN resistente maat!
Mediaan
De mediaan is de middelste waarneming in geordende lijst. Bij een oneven lijst neem je het
middelste, bij een even lijst neem je het gemiddelde van de twee middelste. Om de posite van M te
(n+1)
vinden: . De mediaan is gemaiieliji af te lezen uit een STAMdiagram en is WEL een resistente
2
centrummaat.
Gemiddelde vs. Mediaan
Bij een ssmmetrische verdeling is het gemiddelde geliji aan de mediaan. Naarmate de verdelingen
schever worden, gaan de gemiddelde en mediaan verder uit eliaar liggen.
- Uitbijters corrigeren of weglaten x́
- Uitbijters erin laten M
Meten van spreiding: Kaartielen (M)
Kaartielen
Kwartelen worden gebruiit bij het beschrijven een verdeling: Centrummaat en spreidingsmaat. Een
spreidinagsmaat gaat de variabiliteit1 van een verdeling uitdruiien. De spreidinag is het verschil tussen
het maximum en het minimum. Resultaten iunnen een gelijie M en x́ hebben, maar een
verschillende spreiding.
1
Variabiliteit = spreiding
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller emiliea. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.30. You're not tied to anything after your purchase.