1.1 Introductie in de statistische methodologie
In de afgelopen jaren is er een grote toename is het gebruik van statische methoden door sociale
wetenschappers. Dit hoofdstuk introduceert ‘de statistiek’ voor de sociale wetenschappen waarbij gebruik wordt
gemaakt van beschrijvende data waarmee men voorspellingen tracht te doen.
Het verzamelen van data is de basis van alle soorten van onderzoek waarbij observatiedata gebruikt worden
voor statistische analyses. De observatiedata over de eigenschappen/kenmerken die van belang zijn in
onderzoek worden data genoemd. Om data te verzamelen/genereren worden in de sociale wetenschappen veel
verschillende methoden gebruikt. Een gearchiveerde collectie aan data wordt een database genoemd.
Statistiek is breder dan enkel cijfers die gevormd worden dankzij de verkregen data. Statistiek biedt methoden
voor het verkrijgen en analyseren van data. Het biedt specifiek methoden voor:
- Design: een methode voor het plannen hoe de data voor het onderzoek verzamelt gaat worden. Bijv.
hoe men proefpersonen gaat selecteren voor een onderzoek.
- Beschrijven: een methode voor het samenvatten van de data om de informatie die verkregen is te
beschrijven. Dit kan gedaan worden door middel van het gebruik van een grafiek, tabel of het
weergeven van gemiddelde. Dit wordt ook wel beschrijvende statistiek genoemd.
- Inductie: het doen van voorspellingen op basis van de verzamelde data. Voorspellingen die gemaakt zijn
door het gebruiken van data wordt inductieve statistiek genoemd.
‘Beschrijven’ en ‘inductie’ zijn twee methoden om data te analyseren. In de sociale wetenschappen worden
beide manieren gebruikt om antwoord te geven of sociale verschijnselen.
1.2 Beschrijvende- en inductieve statistiek
Statistische analyses kunnen geclassificeerd worden als ‘beschrijvend’ of ‘inductief’, op basis van of het doel het
beschrijven van data is, of het maken van voorspellingen. Om dit verder uit te leggen worden de begrippen
populatie en steekproef hieronder uitgelegd.
De populatie is de totale set van subjecten die van belang zijn binnen een onderzoek. De steekproef omvat een
deel van de populatie waarover de data wordt verzameld. Dat wat de onderzoeker bestudeert/observeert zijn
de subjecten, meestal zijn dit personen (bijv. families, scholen of steden). Hierbij is het van belang dat de
steekproef personen omvat die een representatie zijn van de populatie die wordt onderzocht.
Beschrijvende statistiek vat alle informatie die verzameld is in het onderzoek samen. De beschrijvende statistiek
reduceert de data tot versimpelde en begrijpelijke taal, zonder daarbij al te veel informatie te verliezen. Dit kan
door het gebruik van grafieken, tabellen, gemiddelden en percentages. Beschrijvende statistiek is zowel handig
voor data die beschikbaar is over de gehele populatie als enkel beschikbaar voor een steekproef.
Inductieve statistiek tracht voorspellingen te doen over de gehele populatie, welke gebaseerd is op data van
steekproeven. Daarnaast kan inductieve statistiek voorspellingen doen over eigenschappen van een populatie
dankzij steekproeven die over het algemeen klein zijn in vergelijking met de populatie.
Een parameter is een numerieke samenvatting van de populatie. Een steekproefgrootheid is een numerieke
samenvatting van de steekproefdata. Meestal is men meer geïnteresseerd in de parameters.
De conceptuele populatie is een populatie die niet echt bestaat, maar hypothetisch is. Daarentegen bestaat een
actuele populatie wel echt.
1.3 De rol van computers en software binnen de statistiek
Software voor de analyse van statistische data organiseert data aan de hand van een databestand (file).
- Elke rij in een databestand omvat de observaties van een specifiek subjects (persoon) in de steekproef.
- Elke kolom in een databestand omvat de observaties van een bepaalde eigenschap.
, Hoofdstuk 2 Steekproeven en metingen
Om sociale fenomenen te analyseren met behulp van statistische analyses, zijn er twee methodes. Beschrijvende
statistiek vat de verzamelde data samen. Inductieve methoden gebruiken steekproeven om voorspellingen te
doen over populaties. Het selecteren van personen voor een steekproef staat centraal in dit hoofdstuk. Een
meting naar aanleiding van een steekproef moet valide zijn; wordt er met de steekproef daadwerkelijk gemeten
wat hij tracht te meten. Daarnaast moet een steekproef betrouwbaar zijn, is de steekproef consistent in de zin
dat hij dezelfde data zal opleveren wanneer hij weer wordt afgenomen.
2.1 Variabelen en hun metingen
Een variabele is een eigenschap die gemeten en uitgedrukt kan worden in een waarde. Dit onder de
proefpersonen in een steekproef of populatie. Verschillende personen hebben verschillende waardes van
eigenschappen. Voorbeelden van variabelen zijn: inkomen, leeftijd, aantal broers/zussen en geslacht. De
waarden die een eigenschap kan aannemen vormen het meetniveau.
- Een variabele kan kwantitatief genoemd worden wanneer hij een numerieke waardes heeft die de
eigenschap vertegenwoordigd/weergeeft. Bijvoorbeeld: inkomen, aantal broers/zussen en leeftijd.
- Een variabele kan kwalitatief (categorisch) genoemd worden, wanneer de meetschaal bestaat uit een
set aan categorieën. Bijvoorbeeld: huwelijkse staat (getrouwd, single, gescheiden).
Er wordt onderscheidt gemaakt tussen kwantitatief en kwalitatief omdat beide soorten variabelen verschillende
statistische methoden gebruiken om de data te analyseren.
Er kan onderscheidt gemaakt worden tussen verschillende meetniveaus:
- Nominaal: Hierbij is er sprake van ongeordende categorieën. Categorieën worden hier ‘gelabeld’ (naam,
getal) echter heeft dit geen waarde (ook niet als het een getal is). Het dient om onderscheid te maken.
Bijvoorbeeld: Yes (0), No (1). Married (1), Single (2), Widower (3).
- Ordinaal: Hierbij is er sprake van geordende categorieën, maar de afstanden tussen de categorieën zijn
ongelijk/hoeven niet gelijk te zijn. Voorbeeld: een podium met een nummer 1, 2 en 3. Daarbij is
duidelijk dat de nummer 1 het snelste is, dan de nummer 2 en dan de nummer 3. De onderlinge
verschillen maken niet uit. Er is hier sprake van ‘ranking’.
- Interval: Hierbij is er sprake van geordende categorieën en daarbij gelijke afstanden tussen deze
categorieën. Er is sprake van een rangorde. Er is geen absoluut nulpunt. (Kwantitatief)
- Ratio: Hierbij is er sprake van geordende categorieën en daarbij gelijke afstanden tussen deze
categorieën. En er is een betekenisvol/absoluut nulpunt. Denk aan: hoogte, gewicht, duur.
(Kwantitatief)
Door variabelen te classificeren draagt dit bij aan de keuze voor een statistische methode. Een variabele is
discreet wanneer deze een basiswaarde heeft die in een getal kan worden uitgedrukt en niet kan worden
onderverdeeld (bijv. 2, 3, 4). Een variabele is continu wanneer deze oneindig zijn door bijvoorbeeld komma’s te
gebruiken. Voor kwantitatieve variabelen is de scheiding tussen discrete en continue variabelen een beetje
onduidelijk. In de praktijk worden continue variabelen afgerond zodat ze discreet zijn (bijv. wanneer iemand 21
jaar is, zeggen we dat wanneer iemand tussen de 21 en 22 jaar oud is).
Samenvattend:
- Variabelen kunnen kwantitatief (numeriek) of categorisch (kwalitatief) zijn.
- Kwantitatieve variabelen worden gemeten op een intervalschaal.
- Categorische variabelen met ongeordende categorieën worden gemeten op nominale schaal.
- Categorische variabelen met geordende categorieën worden gemeten op ordinale schaal.
- Categorische variabelen (nominaal/ordinaal) zijn discreet.
- Kwantitatieve variabelen kunnen discreet en continu zijn.
- In de praktijk, kwantitatieve variabelen kunnen veel verschillende ‘waarden’ aannemen en worden vaak
gebruikt als continu.
2
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Puck1207. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.18. You're not tied to anything after your purchase.