Hoofdstuk 1: Statistische gegevens
1.1 inleiding
Om statistiek in een onderzoek te kunnen toepassen zijn numerieke gegevens nodig. Dat wil
zeggen: woorden worden omgezet in getallen.
In de rijen staan de analyse-eenheden, in de kolommen de variabelen. In de cellen staan
dan de getallen.
1.2 Vier soorten variabelen
In de statistiek worden de variabelen verdeeld in 4 meetniveaus:
1. nominaal: categorien worden alleen onderscheiden door naamgeving, zonder
rangorde. De gebruikte codes zijn willekeurig, zolang ze maar verschillend zijn. Dit
betekend dat men de codering ook mag veranderen zonder dat er inhoudelijk iets
verandert. burgerlijke staat.
2. ordinaal: deze kunnen niet willekeurig gecodeerd worden, want er is wel sprake van
rangorde.De verschillen mogen echter wel willekeurig zijn (als de volgorde maar juist
is, dus hbo=10, uni=19 mag. opleiding7
3. interval: Hiervan is wel bekend hoe groot de verschillen of intervallen tussen
opeenvolgende categorien precies zijn. Er is uiteraard ook rangorde. Maar er is geen
vast nulpunt (verhoudingen heeft dus geen zin). geboortejaar
4. ratio: dit zijn variabelen met een rangorde, gelijke afstanden tussen gelijke intervallen
en een absoluut nulpunt. er zijn ratio’s/verhoudingen te berekenen. temperatuur
-> dichotome variabelen: deze bstaan uit slechts 2 categorieën. Er is altijd een sprake van
rangorde in termen van wel of niet. man/vrouw. Wiskundig gezien heeft een dichotome
variabele de eigenschappen van een ratiovariabele, want men kan een van de categorien
opvatten als een nulpunt, ook is er maar een interval.
Meetniveaus zijn in 2 opzichten relevant:
- het is een karakteristieke bewerking. bijvoorbeeld bij nominale variabelen kan alleen
geteld worden hoeveel analyse eenheden dezelfde score hebben.
- het maakt het principe van meetniveaus gemakkelijker om te kiezen uit de vele
mogelijkheden van statistiek. Als een methode geschikt is voor variabelen van een
bepaald meetniveau, is deze ook geschikt voor variabelen die een hoger meetniveau
hebben.
1.3 Selectie van analyse-eenheden: de steekproeftrekking
Om met behulp van een beperkt aantal analyse-eenheden te kunnen generaliseren naar de
gehele populatie, is het gangbaar dat men gebruikmaakt van een zogenaamde steekproef.
Belangrijk is dat deze steekproef representatief is. Verschillende steekproeven:
1. enkelvoudige aselecte steekproef: 100% willekeur
2. gestratificeerde aselecte steekproef: er wordt eerst verdeeld in categorien en binnen
die categorien is het 100% willekeur
3. getrapte steekproef: er vinden een of meerdere aselecte voorselecties plaats voor ½.
4. clustersteekproef…
Als men voor kostenbesparing gaat, gaat men voor 3.
1.4 verzamelen van statistische gegevens
1. grootschalig veldonderzoek
2. experiment
, Statistiek als hulpmiddel
3. observatie
4. secundaire databronnen
1.5 kwaliteit van statistische gegevens
de kwaliteit van statistische gegevens hangt af van 4 peilers:
- geldigheid/validiteit: meet je het juiste
- betrouwbaarheid: vrij van toeval
- representativiteit:steekproef moet een juiste afspiegeling vormen van
onderzoekspopulatie
- ontbrekende gegevens: stel bijvoorbeeld je vraagt of mensen hoogte van inkomen
willen zeggen, vormt het voor de steekproef een probleem wanneer een groot
gedeelte van de welverdienenden dit bewust niet doet.
Hoofdstuk 2: beschrijvende statistiek
2.2 grafische beschrijvingen van een variabele
staafdiagram: nuttig wanneer variabelen van nominaal/ordinaal meetniveau zijn. Op de x-as
ziet men de betreffende variabelen, op de y-as het relatieve aandeel of de absolute
aantallen. De staven zijn even breed en staan los van elkaar.
taartdiagram: ook wel “pie chart” genoemd. Het bestaat uit een cirkel waarin de categorien
zijn weergegeven in segmenten. De oppervlakte van een segment geeft het relatieve
aandeel aan vvan de betreffende categorie. In de praktijk vooral gebruikt voor nominale
variabelen.
Histogram: Geschikt voor interval en ratiovariabelen. Bij interval en ratio variabelen
betekenen gelijke afstanden tussen de categorien ook gelijke inhoudelijke verschillen. De
open ruimtes tussen de staven zijn daarom verdwenen.
stamdiagram (stem-and-leaf plot): Er wordt onderscheid gemaakt tussen stam en blad. Als
stam is gekozen voor tientallen en staat elk blad voor 1 waarneming. Het is vooral geschikt
om de verdeling van een variabele te beschrijven als er niet te veel waarnemingen zijn. Het
gaat ook hier om interval en ratiovariabelen.
2.3 numerieke beschrijvingen van een variabele
Vaak wil men echter niet (alleen) de hele verdeling weergeven, maar ook bepaalde
kenmerken hiervan uitdrukken met getallen. Zie figuur 2.5
Een goede en veelgebruikte manier om dit dan ook te doen is door middel van een
frequentietabel.
2.3.1 maten voor het centrum van een verdeling
1. modus: hierbij vermeldt je de categorie die het meest voorkomt. (in tabel 2.6 is dit mbo,
hoogste aantal/frequentie). De modus wordt het meest op nominaal niveau toegepast,
kan ook op hogere.
2. mediaan: de mediaan is de categorie waarin de middelste waarneming ligt. De
mediaan wordt bijvoorbeeld vaak gebruikt bij het berekenen van de armoedegrens. De
mediaan is tamelijk ongevoelig voor extreme scores.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper svandenbroek. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.