SAMENVATTING STATISTIEK
INLEIDING
WAT IS STATISTIEK
Statistiek is gegevens vertalen in kennis en inzicht, dus gegevens interpreteren en presenteren. Men
ziet statistiek als wetenschappelijke discipline. Een kennismethode om de wereld beter te kennen en
te begrijpen. Statistiek kan beschouwd worden als een werktuig, een instrument, een methode, …
Men doet hierbij onderzoek op basis van data, men gaat alsook kijken naar gegevens en verdelingen.
Die gegevens en verdeling gaat men weergeven op een manier om ze beter te begrijpen: grafisch en
aan de hand van kengetallen, maar men zal ook doen aan onderzoeken en vergelijkingen van de
verdelingen.
Men zal statistiek gebruiken om een bewering te staven, want een beweging op zich is niet
voldoende, er is nood aan empirie of onderzoek. Men kan niet zomaar data verzamelen, maar
volgens de regels van de kunst (inleiding onderzoeksmethoden), en men gaat ook de data analyseren
aan de hand van de juist technieken en met ruimte voor onzekerheid (statistiek). Als we dus
empirisch onderzoek willen doen om een antwoord te bieden op een vraagstelling, dan dienen we
data te verzamelen, en data te analyseren.
1. Probleemstelling
2. Onderzoeksontwerp en dataverzameling
3. Data-analyse
4. Rapportering
SOORTEN STATISTIEK
Beschrijvende statistiek Interferentie statistiek Statistisch analyse
Men gaat de wereld in cijfers Is een middel op met een Dit is een kennismethode
beschrijven. Hierbij is de basis de beperkt aantal gegevens gericht op de verklaring van
frequentievragen, die men gaat uitspraken te doen over een verschillen en samenhang.
samenvatten in ‘kengetallen’, en breder geheel, over een Men heeft hier: bivariaten
men gaat gebruik maken van volledige populatie. Men gaat regressie, multivariate
grafische technieken. Men gaat uitspraken doen over de regressie, …)
hierbij ordenen en synthetiseren van volledige bevolking op basis van
(een grote hoeveelheid) gegevens. resultaten een steekproef uit
En men gaat ze herleiden tot die bevolking.
samenvattende maten (bv.
Percentages, mediaan, …) en
1
,grafieken.
MISLEIDING DOOR STATISTIEK?
Statistieken worden regelmatig gebruikt om mensen te misleiden. Uitkomsten van een onderzoek
kunnen gemanipuleerd worden bij:
1.VERZAMELEN VAN GEGEVENS
Kan door een slechte selectie van onderzoek personen, niet representatief voor de bevolking die je
wil onderzoeken. Of een te klein aantal onderzochte personen. Maar kan ook door een slechte
vraagstelling, waarbij de vragen worden gestuurd naar een bepaald antwoord.
2. PRESENTATIE VAN DE UITKOMSTEN
Kan door een deel van de grafiek te verwijderen, of de schaal te manipuleren, of zelfs grafische
aanpassingen doen aan de grafiek.
3. OMSCHRIJVEN VAN DE CONCLUSIES
Zegt genoeg
HOOFDSTUK 1: METEN EN MEETSCHALEN
TERMINOLOGIE EN KERNBEGRIPPEN
ONDERZOEKSPOPULATIE
Alle leden van een welomschreven groep die je wil onderzoeken. Omvang en
het type kan sterk variëren (de Belgische bevolking, maar ook de studenten aan
de VUB, …) maar ze moeten wel duidelijk omschreven zijn.
STATISTISCHE EENHEID
Cases: elementen uit de bestudeerde bevolking: mensen, schapen, woningen, landen, regio’s,
kranten, .. ! => Statistiek bestudeerd de kenmerken van die bevolking
VARIABELE
Dat zijn kenmerken van onderzoekseenheden waarin we als onderzoeker geïnteresseerd zijn. Bij
sommige kenmerken zijn de waarden al een getal (leeftijd), bij andere kenmerken is dit niet het geval
(geslacht).
2
,DATAMATRIX CASES (WAARNEMINGSEENHEDEN)
In rijen = records Variabelen (waarde varieert): in kolommen
Waarden: in cellen
PARAMETERS
Dat zijn kengetallen die de verdeling weergeven van een kenmerk van een populatie.
Voorbeelden:
- m = gemiddelde van een populatie
- s = de standaardafwijking
- p = proportie van een populatie
STEEKPROEVEN
Dat zijn onderzoeken met betrekking tot een specifieke bevolkingsgroep (population). Vaak
onmogelijk om deze volledig te onderzoeken, dus men heeft een steekproef (sample) nodig. Men
heeft specifieke statistische technieken om conclusies te trekken over de volledige populatie op basis
van steekproefonderzoek zoals bij de interferentiële statistiek.
Dus één steekproef is een onderdeel van de populatie
STEEKPROEFSTATISTIEKEN (STATISTICS)
Deze omvatten de statistische kengetallen van een steelproef of schatters:
- x = gemiddelde steekproef
- s = standaardafwijking
Deze statistische maat of schatter is een numerieke samenvatting van de steekproef uit de populatie.
Opmerkingen! De beschrijvende statistiek is zowel toepasselijk op een populatie als op een
steekproef. Echter gebruiken we de notatie voor steekproeven, omdat die in het verder verloop van
3de opleiding ook het vaakst zal gebruikt worden.
, STATISTISCHE REEKS
Zijn reeks waarnemingen, voorbeeld: kijkgedrag van verschillende personen.
TIJDREEKS
Zijn reeks waarnemingen in de tijd. Het ogenblik van de waarnemingen is belangrijk voor de
interpretatie van de gegevens, voorbeeld: evolutie van kijkgedrag doorheen de tijd.
DIMENSIES VAN EEN REEKS
Is het aantal variabelen dat simultaan wordt waargenomen of bestudeerd:
o Unidimensionale reeks: één variabele (univariate reeks)
o Tweedimensionale reeks: twee variabelen (bivariate reeks)
o Multidimensionale reeks: meer dan twee variabelen
WAT IS METEN?
WAAROM METEN?
Men gaat bij het meten numerieke waarden aan objecten toekennen. Het laat ons toe om
vergelijkingen te maken; men heeft hierbij ook een standaard nodig om vergelijkingen te kunnen
maken: cm, el, …
Maar ook moderne standaarden en internationale overeenkomsten in verband met lengtematen,
tijdsmaten, gewicht, inhoud, … Statistiek heeft kortom nood aan standaarden. Voor sommige
eenheden is dat evident (leeftijd, bevolkingsdichtheid, …), voor andere is dat wat complexer
(opleidingsniveau, inkomen,..) tot zelfs zéér complex (armoede).
4