Inleiding onderzoek
Statistical methods for the social sciences
Hoofdstuk 1 Introductie
1.1 Introductie tot statistische methodologie
Observatie: verzamelde informatie te gebruiken voor statistische analyses
Data: collectief verzamelde observaties over kenmerken
Database: bestaande gearchiveerde bestanden met data
Statistiek: een verzameling van methoden voor het verkrijgen en analyseren van data/gegevens
Methodes voor:
- Design: manier waarop het onderzoek is opgebouwd en de benodigde data verzameld
- Beschrijvend: samenvatten van de data, begrijpelijk maken van de informatie die ze geven
Beschrijvende statistieken: grafieken, tabellen en numerieke samenvattingen om
data in begrijpelijkere vormen weer te geven, zonder dat het ten koste gaat van de
informatie
- Inductief: voorspellingen maken gebaseerd op data (statistische referenties)
Statistische analyse: manieren van gegevens analyseren (beschrijvend/inductief)
1.2 Beschrijvende statistiek en inductieve statistiek
Methodes van analyseren van data kunnen beschrijvend zijn, waarbij de resultaten samengevat
worden of inductief waarbij eer voorspellingen worden getrokken vanuit de data.
Subject: entiteiten die in het onderzoek worden geobserveerd
Populatie: de totale verzameling van subjecten die van belang is voor het onderzoek
Steekproef: een selectie van de populatie waar de data van verzameld wordt en voorspellingen mee
gedaan kan worden over de gehele populatie
Als data beschikbaar is in een steekproef is een voorspellende benadering (inductie) mogelijk om
uitspraken te doen over de gehele populatie. Beschrijvende benadering kan bij zowel een steekproef
als bij data over de gehele populatie van het onderzoek
Parameter: een numerieke samenvatting binnen de populatie. Percentage populatie met keuze A
Steekproefgrootheid: een numerieke samenvatting van de steekproef data. Het percentage sample
met keuze A.
De voorspelling over een parameter wordt op de steekproefgrootheid gebaseerd. De waarde van de
parameters is groter dan de waarde van de steekproefgrootheid over een bepaalde steekproef.
Werkelijke populatie: de populatie is een set van werkelijke subjecten
Conceptuele populatie: een hypothetische populatie
1.3 De rol van computers in statistiek
Datafile: verwerkt data om te analyseren door statistische software
- Een rij bevat de observaties van een specifiek subject van de steekproef
- Een kolom bevat de observaties voor een bepaald kenmerk/variabele
, Hoofdstuk 2 Steekproef en meting
Een meting dient te voldoen aan:
- Validiteit: het onderzoek meet wat het zegt te meten
- Betrouwbaarheid; de resultaten zijn consistent met resultaten uit andere onderzoeken die
hetzelfde meten
2.1 Variabelen en hun meting
Spreiding: verschil in waarde van variabelen per subject of persoon
Variabele: een eigenschap of kenmerk die in waarde kan variëren tussen personen in een steekproef
of populatie. Symbool y of y1 (1 verwijst naar een persoon)
Meetniveau: de verschillende waarden van een variabele
Variabele classificaties:
- Het meetniveau bevat categorieën of getallen
- Het meetniveau bevat nummers of levels
Kwantitatieve variabelen: het meetniveau van de variabele heeft numerieke waardes. Variabelen die
bijvoorbeeld in aantal jaren studie, leeftijd, aantal broers en/of zussen of jaren studie worden
uitgedrukt. Uit kwantitatieve variabelen is een gemiddelde te berekenen.
Categorische variabelen: het meetniveau van de variabele bevat categorieën. Variabelen zijn
bijvoorbeeld burgerlijke status, land van afkomst, favoriete muziekgenre, religie. Deze variabelen
worden vaak ook kwalitatieve variabelen genoemd. Uit categorische variabelen is geen gemiddelde
te berekenen.
Interval niveau: een kwantitatief meetniveau, waar vaste intervallen, afstand in waarden, tussen de
getallen zit.
Nominaal niveau: een categorisch meetniveau, waarbij er geen verschil in waarde zit tussen de
categorieën. De ene categorie (ongehuwd) heeft niet meer waarde dan de ander (gehuwd).
Ordinaal niveau: een categorisch meetniveau waarbij er wel een opbouw in waarde is tussen de
verschillende categorieën. Bijvoorbeeld frequentie religie-uitoefening: vaak – soms – nooit.
Discreet meetniveau: de mogelijke waarden van een variabele worden gevormd door losstaande
getallen, zoals 1, 3, 3, 4, 5, etc.
Continu meetniveau: de mogelijke waarden van een variabele hebben een oneindig continuüm van
rationele getallen, zoals 1,87362…
Variabelen zijn kwantitatief of categorisch. Kwantitatieve variabelen worden gemeten op interval
niveau. Categorische variabelen zonder waardeordening worden gemeten op nominaal niveau,
categorische variabelen met waardeordening worden gemeten op ordinaal niveau.
Categorische variabelen, nominaal of ordinaal, zijn discreet. Kwantitatieve variabelen kunnen zowel
discreet als continu zijn.
2.2 Aselect
De kwaliteit van voorspellingen van een steekproef is afhankelijk van de mate waarin de steekproef
representatief is voor de gehele populatie. Aselect, oftewel willekeurigheid, is een methode.
Enkelvoudige aselecte steekproef: Iedere mogelijke combinatie om de steekproef van n subjecten
van de populatie te vormen heeft een gelijke kans geselecteerd te worden. Symbool n:
Steekproefgrootte Ook wel aselecte steekproef genoemd.
Om tot een aselecte selecte te komen is het steekproefkader nodig, waarin alle namen, cijfers of
waarden van de populatie in genoteerd staan. Alle mogelijke subjecten genummerd, waarnaar er set