Hoofdstuk 1: inleiding 23/10
Wat is statistiek?
Statistiek is een wetenschappelijke discipline die fungeert als een kennismethode om de
wereld beter te kennen en te begrijpen. Het speelt een cruciale rol in empirisch onderzoek,
waarbij gegevens systematisch worden verzameld en geanalyseerd om inzichten te
verkrijgen. Statistiek wordt daarbij gebruikt als een werktuig, een instrument of om
gegevens te bestuderen en verdelingen te onderzoeken. Door naar deze gegevens en
verdelingen te kijken, kan men patronen ontdekken en verbanden leggen. Om deze gegevens
toegankelijk en begrijpelijk te maken, worden ze vaak weergegeven in de vorm van grafieken
of kengetallen, wat helpt bij het beter begrijpen van de gegevens en het vergelijken van
verschillende verdelingen.
Als we dus empirisch onderzoek willen doen om een antwoord te bieden op
een vraagstelling, dan dienen we data te verzamelen en data te analyseren.
1. Probleemstelling
2. Onderzoeksontwerp en dataverzameling
3. Data-analyse
4. Rapportering
Waarom statistiek?
Om beweringen te ondersteunen, is het niet genoeg om alleen beweringen op zich te maken.
Er is nood aan empirisch bewijs; dat wil zeggen dat we data en gegevens nodig hebben om
de beweringen te controleren en te valideren. Het is essentieel om beweringen te toetsen
aan de werkelijkheid.
Data verzamelen volgens de regels van de kunst = onderzoeksmethoden
Data analyseren volgens de regels van de kunst = statistiek
• Probleemstelling
o Vergt substantiële (i.e. inhoudelijke) kennis van het vakgebied
• Onderzoek ontwerp & Dataverzameling
o Welke onderzoeksmethoden in functie van probleem- en vraagstelling?
o Overzicht van courante onderzoeksdesign in vakgebied
o Sterkte en zwakte van verschillende manieren van data verzamelen
(secundaire data, kwantitatieve data, kwalitatieve data…)
• Data-analyse
o Beschrijvende statistiek, inductieve statistiek, verklarende statistiek.
• Rapportering
o Literatuur opzoeken, refereren, wetenschappelijk taalgebruik
o Terugkoppeling
Logane Katalay Polsoc 1
,Soorten statistiek
1. Beschrijvende statistiek
Men beschrijft de wereld in cijfers door frequentievragen samen te vatten in kengetallen en
gebruik te maken van grafische technieken. Dit houdt in dat men grote hoeveelheden
gegevens ordent en synthetiseert, en deze herleidt tot samenvattende maten zoals
percentages en de mediaan, evenals visuele weergaven in de vorm van grafieken.
2. Inferentiële statistiek
Is een middel op met een beperkt aantal gegevens uitspraken te doen over een
breder geheel, over een volledige populatie. Men gaat uitspraken doen over de
volledige bevolking op basis van resultaten een steekproef uit die bevolking.
Extrapolatie = uitspraken over de volledige bevolking op basis van een toevalssteekproef uit
die bevolking.
Men gaat dus op basis van een steekproef een voorspelling doen.
3. Statitische analyse
Statistische analyse is gericht op het verklaren van verschillen en het onderzoeken van
samenhang tussen variabelen. Dit gebeurt met behulp van verschillende
regressietechnieken, zoals bivariate regressie, multivariate regressie, logistische regressie en
survivalanalyse. Enkele voorbeelden van samenhang- en verschilvragen zijn: wat is de relatie
tussen opleidingsniveau en inkomen? Hoe verhouden opleidingsniveau, inkomen en
onveiligheidsgevoelens zich tot elkaar? Wat is het verband tussen opleiding en gezondheid?
En hoe hangt leeftijd samen met de consumptie van digitale media?
Misleinding door statistiek?
Statistieken worden regelmatig gebruikt om mensen te misleiden. Uitkomsten van
een onderzoek kunnen gemanipuleerd worden bij:
• Verzamelen van gegevens = Kan door een slechte selectie van onderzoek personen
niet representatief zijn voor de bevolking die je wil onderzoeken. Of een te klein
Logane Katalay Polsoc 2
, aantal onderzochte personen. Maar kan ook door een slechte vraagstelling, waarbij
de vragen worden gestuurd naar een bepaald antwoord.
• Presentatie van de uitkomsten = door een deel van de grafiek te verwijderen, of de
schaal te manipuleren, of zelfs grafische aanpassingen doen aan de grafiek.
• Omschrijven van conclusies = Hierbij is het van belang om te vragen: Is het
geciteerde cijfer correct en geloofwaardig? Hoe is dit cijfer tot stand gekomen? Hoe
moet je het interpreteren? En op welke manier wordt het cijfer voorgesteld? Door
deze vragen te stellen, kun je beter doorzien of cijfers betrouwbaar zijn en correct
worden weergegeven.
EENDIMENSIONAAL
Hoofdstuk 2: Meten,
frequentieverdelingen en grafieken 30/10
Inleiding
De sociale wetenschappen hebben als primair doel het genereren van kennis over de sociale
werkelijkheid. Dit wordt gerealiseerd door middel van sociaalwetenschappelijk onderzoek,
waarbij dataverzameling een essentiële rol speelt. De onderzoeksresultaten wil je vaak op
een korte en overzichtelijke manier weergeven met gebruik van getallen, tabellen en
grafieken. Het samenvatten van de kenmerken van een groep onderzoekseenheden, ook wel
aangeduid als de onderzoekspopulatie, is een belangrijk aspect van deze presentatie.
Terminologie en kernbegrippen
Variabele = kenmerken van onderzoekseenheden waarin we geïnteresserd zijn. Bij sommige
kenmerken zijn de waarden een getal (leeftijd), bij andere kenmerken is dit niet het geval
(geslacht).
Datamatrix/ datset = cases (onderzoekseenheden): in rijen = records
Variabele (waarde varieert): in kolommen
Waarden: in cellen
Logane Katalay Polsoc 3