Hoofdstuk 2: Beschrijvende Statistiek
1. Inleiding
Doel van beschrijvende statistiek:
o de gegevens uit de steekproef op een duidelijke en verantwoorde manier
voorstellen en samenvatten.
o Dit doen we voor één variabele aan de hand van:
frequentietabellen, die aanduiden hoe vaak de verschillende
uitkomsten voorkomen
grafische methoden, zoals staafdiagrammen en histogrammen,. . .
samenvattende numerieke getallen, zoals het steekproefgemiddelde,
de mediaan, de steekproefstandaarddeviatie, . .
Opm: Alles wat je besluit gaat over de gegevens van de steekproef
niet de populatie!!!!
o Voor twee variabelen onderzoeken we bovendien ook het verband tussen
beide variabelen
grafisch: puntenwolk
numeriek: kruistabel en/of correlatiecoëfficiënt
Afhankelijk van het meetniveau van de variabele!
Overzicht
1
, 2. Absolute en relatieve frequentie
2.1 Frequentieverdeling
Hoe zijn de uitkomsten van een variabele in een (steekproef)groep verdeeld?
We vertrekken van steekproefgegevens x 1 , . . . , x n voor een bepaalde
variabele X . We willen een antwoord formuleren op vragen als:
Zijn de gegevens ongeveer gelijk, of verschillend?
Indien sterk verschillend, hoe sterk? Op welke manier verschillen ze?
Kunnen we patronen of trends terugvinden?
Zijn er meerdere subgroepen of clusters te onderscheiden?
Verschillen enkele gegevens sterk van algemene tendens?
Overzicht:
2.2 Frequentieverdeling voor kwalitatieve variabelen (nominaal/ ordinaal)
Vb: Uit de Parent-Child Socialization Study (2013): n = 3 321
jongeren uit het derde middelbaar in Vlaanderen werden bevraagd.De doodstraf moet
opnieuw ingevoerd worden
Uitkomstenverzameling S = {1, 2, 3, 4} met
1 = Helemaal niet akkoord
2 = Niet akkoord
3 = Akkoord
4 = Helemaal akkoord
2
,Vb: Uit de Parent-Child Socialization Study (2013): n = 3 321
jongeren uit het derde middelbaar in Vlaanderen werden bevraagd.
Andere variabelen die ook gemeten werden:
Geslacht, S = {1 = man, 2 = vrouw} Nominaal
Geboortejaar, S = {1995, 1996, 1997, 1998} Metrisch, discreet
Richting, S = {1 = ASO, 2 = TSO, 3 = KSO, 4 = BSO} Nominaal
Meetniveau?
2.2.1 Algemeen
De uitkomstenverzameling is van de vorm
S = {m1,..., mk}
De absolute frequentie nj van uitkomst mj is het aantal metingen
xj die gelijk zijn aan mj .
De relatieve frequentie
is het aantal keer dat mj voorkomt als uitkomst in de steekproef gedeeld door de
grootte van de steekproef.
Men spreekt ook van de steekproefproportie (zie H6 en verder).
Deze informatie kunnen we samenvatten in een frequentietabel:
Merk op dat
de som van alle absolute frequenties nj gelijk is aan de steekproefgrootte n:
n1 + n2 + . . . + nk = n
de som van alle relatieve frequenties fj,n gelijk is aan 1:
3
, de som van alle percentages gelijk is aan 100%
Oefening: vul de ontbrekende gegevens in de frequentietabel aan.
Hoeveel avonden per week ga je uit?
2.2.2 Grafische voorstelling voor kwalitatieve variabelen
Een frequentietabel kan grafisch worden weergegeven met behulp van een
staafdiagram: op de horizontale as: de mogelijke uitkomsten mj , op de verticale as:
de waarde van n of f = n /n
4