Beschrijvende of descriptieve statistiek houdt zich bezig met het ordenen en presenteren
van gegevens in overzichtelijke tabellen en grafieken. Wanneer je gegevens (data) hebt
verzameld, wil je allereerst weten hoe die gegevens zijn samengesteld. Hierna kun je een
frequentietabel maken, een soort turftabel waarin van alle verzamelde gegevens wordt
aangegeven per categorie hoe vaak het voorkomt. De volgende stap in de analyse is het
samenvatten van de gegevens in enkele kengetallen of statische maten. We onderscheiden
drie soorten statistische maten: centrummaten, spreidingsmaten en scheefheidsmaten.
De bekendste centrummaat is het rekenkundig gemiddelde. De bekendste spreidingsmaat
is de standaarddeviatie. De standaarddeviatie is een maat voor de afwijking van de
gegevens ten opzichte van het gemiddelde.
Als een hele onderzoeksgroep of populatie te groot is om in zijn geheel te onderzoeken,
maken we gebruik van een steekproef. Indien de eenheden in de steekproef random
gekozen worden spreken we van een aselecte steekproef. Bij een aselecte steekproef
vormt de steekproefgroep een representatieve afspiegeling van de onderzoekspopulatie en
kunnen we aan de hand van de steekproefgegevens uitspraken doen over die populatie.
Door middel van statistische toetsing wordt nagegaan of de steekproefuitkomsten geldig
zijn (significant zijn).
Werkcollege:
- Beschrijvende statistiek: In kaart brengen gegevens die ik heb.
- Inductieve statistiek: Hoe trek ik conclusies op basis van het geheel? (Mag ik het op
basis van een hele groep concluderen?)
Het zal duidelijk zijn dat je altijd begint met beschrijvende statistiek. We willen immers eerst
weten hoe de verzamelde gegevens eruit zien. Onder de populatie verstaan we de totale
groep van onderzoekseenheden waarop het onderzoek zich richt. De onderzoekseenheden
hoeven niet per se personen te zijn (bv. huishoudens, bedrijven, gemeenten). De populatie
wordt afgebakend op basis van één of enkele gemeenschappelijke kenmerken. Er kunnen
verschillende redenen zijn om een steekproef te gebruiken: te duur, te veel tijd, de populatie
is niet bekend of vanwege ethische redenen (anoniem). Bij een aselecte steekproef heeft
elke onderzoekseenheid uit de populatie een gelijke kans om getrokken te worden. Hiervoor
hebben we een steekproefkader nodig (lijst met alle eenheden). Bij een gerichte
steekproef worden onderzoekseenheden niet op basis van toeval getrokken, maar op basis
van beschikbaarheid of willekeur, zoals bij een passantenonderzoek. Stel je gaat op dinsdag
bij het Educatorium staan is het niet representatief omdat bepaalde leerlingen op dinsdag
geen college hebben.
Vragen bij paragraaf 1.1:
1 Leg uit wat beschrijvende en inductieve statistiek inhoudt?
2 Leg het verschil uit tussen een aselecte- en gerichte steekproef.
3 Wanneer komt een steekproef van pas?
,1.2 Datamatrix: onderzoekseenheden en variabelen .
- Onderzoekseenheden: de groep waarover we in het onderzoek uitspraken willen doen.
Ook wel cases genoemd.
- Variabelen: de gemeten kenmerken of eigenschappen van de onderzoekseenheden.
Kwalitatieve variabelen bestaan uit categorieën, zoals geslacht en opleidingsniveau.
Kwantitatieve variabelen bestaan uit numerieke gegevens (getallen), zoals leeftijd en aantal
kinderen.
- Waarden: de uitkomsten of waarden in de tabel.
- Datamatrix: De verzamelde gegevens geef je weer in een datamatrix of gegevenstabel.
Een tabel heeft altijd een titel en een bronvermelding!
Vraag bij paragraaf 1.2:
4 Leg de 4 begrippen uit.
1.3 Typen variabelen: meetschalen .
Elke variabelen heeft een eigen meetschaal. De meetschaal geeft informatie over het type
gegevens en bepaalt welke statistische technieken er gebruikt mogen worden. Er worden
vier meetschalen onderscheiden:
Categorisch (kwalitatief)
1 – Nominale meetschaal
* Beperkt aantal categorieën
* Allesomvattend (iedere waarneming kan worden ingedeeld in een categorie)
* Wederzijds uitsluitend (iedere waarneming kan uitsluitend worden ingedeeld in één
categorie).
* Alle categorieën zijn gelijkwaardig, er is geen logische volgorde.
* Kwalitatieve kenmerken
* Voorbeeld: (man-vrouw) of (agrarisch-industrie-diensten).
* Uitgedrukt in percentages
2 – Ordinale meetschaal
* Beperkt aantal categorieën
* Allesomvattend (iedere waarneming kan worden ingedeeld in een categorie)
* Wederzijds uitsluitend (iedere waarneming kan uitsluitend worden ingedeeld in één
categorie).
* Alle categorieën zijn in een zinvolle volgorde geplaatst.
* Kwalitatieve kenmerken (geen getallen).
* Voorbeeld: (vmbo-havo-vwo).
* Uitgedrukt in percentages
Numeriek / kwantitatief)
3 – Interval meetschaal
* Meetwaarden zijn getallen
* Heeft geen absoluut nulpunt (arbitrair)
* Voorbeeld: temperatuur, Celsius en Fahrenheit meten beide temperatuur en je kunt niet
zeggen dat 20 graden twee keer zo warm is als 10 graden (Bij Fahrenheit: 20F en 68F).
Ook IQ en leeftijd zijn voorbeelden.
,4 – Ratio meetschaal
* Meetwaarden zijn getallen
* Heeft wel een absoluut nulpunt.
* Ook de verhouding tussen meetwaarden hebben betekenis.
* Voorbeelden: Leeftijd in jaren, afstand in km, reistijd in minuten.
Vragen bij paragraaf 1.3:
5 Leg het verschil uit tussen een nominale en ordinale meetschaal.
6 Leg het verschil uit tussen een interval en ratio meetschaal.
1.4 Typen variabelen: andere indelingen. .
Dichotome variabelen: nominaal met 2 categorieën.
* Het aandeel van een categorie wordt een proportie of fractie genoemd.
* bijvoorbeeld: (man (0) – vrouw (1)).
Rangnummers: ordinaal en oplopend.
* bijvoorbeeld (Amsterdam (1) – Rotterdam (2) – Den Haag (3)).
Discrete variabelen:
* Categorisch
* Gehele getallen (aantal kinderen in huishouden).
* Staafdiagram
* Nominaal en ordinaal
Continue variabelen:
* Doorlopende getallen (tussen elke twee waarden ligt theoretisch weer een nieuwe waarde).
* Geclassificeerde gegevens (ratio-interval naar ordinaal, inkomen naar inkomensklassen).
* Histogram
* Ratio en interval
Vragen bij paragraaf 1.4:
7 Wat zijn dichotome variabelen?
8 Wat zijn rangnummers?
9 Wat is het verschil tussen discrete en continue variabelen?
1.5 Samenhang en causaliteit .
Univariate analyse: onderzoeken van een afzonderlijke variabele.
Bivariate analyse: onderzoeken van samenhang tussen twee variabelen.
Multivariate analyse: onderzoeken samenhang van meer dan twee variabelen.
, Statistische samenhang: wederzijdse beïnvloeding van variabelen (sociale status –
woonwijk).
Causaliteit: Als de ene variabele de andere beïnvloedt.
De theoretische samenhang tussen variabelen kunnen we weergeven in een conceptueel
schema:
Bivariate causale relatie: inkomen type woonwijk
Bivariate wederzijdse relatie: sociale status type woonwijk
Multivariaat model: inkomen sociale status type woonwijk inkomen
Vragen bij paragraaf 1.5:
10 Leg uit wat een univariate analyse is.
11 Leg uit wat een bivariate (causale/wederzijdse) analyse is.
12 Leg uit wat een multivariate analyse is.
Oefening: opgave 1.1 en 1.2.
H2 Beschrijvende statistiek 1: frequentieverdelingen en grafieken .
2.1 Frequentieverdelingen .
Een frequentietabel is een overzicht van het aantal keren dat iedere waarde van een
variabele voorkomt. We noemen dit de frequentieverdeling. In een frequentietabel staan
zowel de absolute (aangeduid met f) als relatieve (f/n * 100) frequenties.
Cumulatieve frequenties geven het totaal aantal waarnemingen weer tot aan een bepaalde
bovengrens. Cumulatieve frequenties worden aangeduid met een hoofdletter F. Meestal
wordt er gewerkt met relatieve cumulatieve frequenties. Hiermee kunnen we zien hoeveel
procent van de waarnemingen beneden een bepaalde grenswaarde ligt. Tabel 2.2 is een
voorbeeld van een tabel met een normale en cumulatieve frequentieverdeling. Op pagina 22
van de bundel is deze tabel weergeven.
Een frequentietabel heeft altijd een titel en een bronvermelding. De titel bestaat uit het
tabelnummer, een beschrijving van de inhoud van de tabel, en – indien relevant – het tijdstip
waarop de gegevens betrekking hebben. De bron is verantwoordelijk voor de herkomst van
de gegevens, en het jaar waarin de gegevens werden verzameld of gepubliceerd. De bron
kan achter de titel worden gezet of onder de tabel. Bij zelf verzamelde gegevens is een
bronvermelding niet nodig.
In plaats van percentages kunnen de relatieve frequenties ook worden weergeven door
middel van proporties of fracties. Proporties worden berekend door de frequenties te delen
door het aantal waarnemingen (f/n), Proporties tellen op tot 1,00.
Voorbeeldtabel, zie de volgende pagina.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Dmeskers598. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.55. You're not tied to anything after your purchase.