Hier staan de hoorcolleges 1.1 tm 6.2 van het vak statistiek 1 heel uitgebreid beschreven. Dit vak is van de opleiding Vrije Universiteit en werd bij mij gegeven tijdens de Premaster (PMC). Er staan veel voorbeelden in waarin uitgelegd wordt hoe je iets berekend. Het heeft mij ontzettend geholpen.
Statistiek: een praktische definitie
➔ Statistiek is een wetenschap dat gaat over het verzamelen, organiseren en het interpreteren
van numerieke feiten/kwalitatieve data, wat we data noemen. Het is erg data gedreven.
➔ Statistiek past erg binnen het empirisme. Je hebt 2 soorten wetenschap: Rationalisme (= met
logisch redeneren kom je tot nieuwe kennis) & Empirisme (= zintuigelijk waarnemen, kijk om
je heen, meet/observeer en vergelijk de data met elkaar).
Statistiek zit op de dataverzameling, het organiseren, visualiseren en interpreteren van de data.
Kansrekening vs. statistiek
Het verschil zit in de richting van de inferentie: deductie/inductie.
Kansrekening → gaat veelal uit van deductie (=van algemeen naar specifiek), d.w.z. gegeven dat we
alle details weten van een bepaalde populatie, hoe waarschijnlijk is dan een bepaalde (steekproef-
)uitkomst? Je weet precies hoe de wereld eruitziet. Je kent de wereld om je heen. Op basis hiervan
kun je voorspellingen doen over specifieke gevallen/instanties.
Voorbeeld deduceren: stel je hebt een vaas met 10 witte knikkers en 3 rode knikkers. Wat is dan de
kans dat ik zonder terugleggen 4 knikkers pak waarvan minimaal 1 of 2 rood zijn?
Statistiek → gaat veelal uit van inductie (=van specifiek naar algemeen). Je stelt vragen (samen met
methodologie) over de wereld om je heen (= empirisme) en je weet niet hoe die wereld eruitziet. Je
hebt een vermoeden door om je heen te kijken en je stelt op basis daarvan een hypothese op, je
neemt een steekproef en je wil op basis van de steekproef een uitspraak doen over de hele
populatie. Je maakt gebruik van rekenregels van kansberekening. Je wilt op basis van de resultaten
van de steekproef (specifiek) iets leren over de algemene wereld om ons heen.
Voorbeeld induceren: ik zie een trekking van knikkers en ik wil iets zeggen over hoe de vaas eruitziet.
Voorbeeld: 2 paar sokken liggen willekeurig verdeeld in een la in het donker. Zonder te kijken en
zonder terugleggen pak je 2 losse sokken. Wat is de kans dat de sokken samen een paar is?
Antwoord: 1/3 want…. 2/4 en 2/4 bij de eerste trekking en als je een groene sok hebt gepakt is de
kans op nog een groene sok nog maar 1/3 zonder terugleggen. 1/6 en 1/6 optellen is 1/3.
,Kansrekening:
Deductie: van algemeen naar specifiek
Populatie naar steekproef
Je hebt een theoretisch kader opgesteld, op basis van de theorie volgen voorspellingen en die
voorspellingen wil je terugzien in de data. Je doet voorspellingen over hoe de data eruit zouden
moeten zijn. Dus… als je theoretisch model klopt en je wilt het empirisch toetsen dan doet het model
voorspellingen over de data die bevestigt moeten worden.
Statistiek: je hebt een vermoeden = een empirische testbare hypothese.
Met de steekproef probeer je generaliserende uitspraken te doen over de populatie waaruit de
steekproef getrokken is. Dus… je probeert op basis van data die je genereert te doen aan
theorievorming. Op basis van data ga je al dan niet aanpassingen maken in het theoretisch gemaakt.
Je hebt namelijk geleerd van de data over hoe de wereld in elkaar steekt.
Samenvatting overeenkomsten en verschillen tussen kansrekening en statistiek
Kansrekening: veelal bekend, veronderstelde werelden. Je weet dat er maar 100 sokken zijn in de
wereld. Je krijgt specifieke voorvallen waarover je een uitspraak moet doen, bijvoorbeeld: wat is de
kans? Dat kun je uitrekenen. Hier heb je geen steekproef voor nodig.
Statistiek: je pakt uit de wereld van 100 sokken pak je 10 sokken en je weet niet hoe die 100 sokken
eruitzien. Op basis van de verdeling van sokken in de steekproef probeer je uitspraken te doen
waarvan je kunt zeggen of iets geldt voor de hele wereld van sokken. Denk aan verkiezingen polls. Je
gebruikt de steekproef om iets waardevols te zeggen over de nog onbekende populatie. Dit is altijd
onzeker. Het is de taak van de onderzoeker om ervoor te zorgen dat jouw steekproef zo goed
mogelijk uitspraak doet over de populatie. Dus zo betrouwbaar en valide mogelijk.
Statistische technieken (zoals: gemiddelde, standaarddeviatie, range, interkwartielafstand, minimum,
maximum) van kansrekening komen terug in de statistiek. Met statistische technieken kun je
uitspraak doen over de populatie en over de steekproef.
In de statistiek doe je eerst uitspraken/aannames/hypothese over hoe de populatie eruitziet.
Bij statistiek ga je vooral proberen aan te tonen dat iets niet waar is. (bijv: je bent vooral op zoek naar
de zwarte zwaan). Je hebt een hypothese (= een aanname over hoe de wereld eruitziet), je hebt een
steekproef. En op basis van de steekproef ga je de kans berekenen dat het onwaarschijnlijk is dat de
hypothese opgaat. Als het erg onwaarschijnlijk is dat de hypothese opgaat, zal het wel niet waar zijn.
Dit doe je net zo lang totdat de hypothese niet weerlegd wordt.
(Vanaf minuut 56:00 begint deel 2 van hoorcollege 1.1)
Definitie statistiek → Statistiek vindt plaats tussen verzamelen tot en met interpreteren. Statistiek is
nadenken over de steekproefprocedure, meetinstrumenten, etc.
Je hebt 2 soorten statistiek: beschrijvende statistiek en inferentiele statistiek
,Beschrijvende statistiek → het gebruikmaken van bepaalde statistieken om een bepaalde dataset
samenvattend weer te geven. Bijv: gemiddelde, modus, mediaan, spreiding, standaarddeviatie,
interkwartielafstand, minimum, maximum.
Inferentiele statistiek → interessanter, meer onzeker, het inductie aspect. Bijv: je hebt een
steekproef, van die steekproef kan je statistieken bepalen. Maar je wil een uitspraak doen voor de
hele populatie en niet alleen voor de steekproef. Je moet ervan uit kunnen gaan dat de steekproef
representatief is. Je gaat generaliseren van een specifiek voorval naar de populatie. Er is sprake van
onzekerheid omdat je niet zeker weet of de populatie er precies hetzelfde is als de steekproef.
Statistiek vs. Methodologie
Methodologie → het bouwplan van een onderzoeksvraag die je wilt beantwoorden. Methodologie
legt uit welk onderzoek je moet doen (bijv: tussen-groepen, binnen-groepen, longitudinaal, power,
correlationeel onderzoek). Je volgt een plan binnen je onderzoek waardoor je uitspraak kan doen
over je onderzoeksvraag. Je leert wat goed onderzoek is en wat belangrijk is.
Statistiek → gereedschapskist. Je hebt allerlei instrumenten om het bouwplan van het onderzoek uit
te voeren. Hoe bereken je de correlatie tussen twee variabelen? Hoe bepaal je het gemiddelde,
standaarddeviatie?
Op basis van theorie voorspel je hoe de data eruitziet. Je hebt een bepaald onderzoeksdesign en je
hebt statistieken nodig om te verzamelen, organiseren en interpreteren, om vervolgens tot de
conclusie te komen.
Methodologie en statistiek gaan samen: het bouwplan en de gereedschapskist.
Populatie → de totale set van deelnemers, relevant voor de onderzoeksvraag. Niet bekend.
Bijv: populatiegrootheid (parameter): gemiddeld aantal uren online zelfstudie per week
Steekproef → een deel van de populatie waarover data verzameld is. Wel bekend.
Bijv: steekproefgrootheid (statistic): gemiddeld aantal uren online zelfstudie per week
Inductie → op basis van de steekproefgrootheid wil je uitspraken doen over de onbekende
populatiegrootheid (=parameter). Inductie is een vorm van inferentiele statistiek.
Betrouwbaarheid & validiteit
Betrouwbaarheid → als je dezelfde meting uitvoert op hetzelfde, moet je op hetzelfde resultaat
uitkomen. Precieze, consistentie, kleine foutmarge, kleine standaardfout. Je kan je steekproef
betrouwbaarder maken door een grotere steekproef te trekken.
Validiteit → geeft aan in welke mate je steekproef representatief is. Zorg ervoor dat je steekproef
willekeurig getrokken is. Is datgene wat je meet een representatieve meting van het construct?
, Hoofdstuk 2: Sampling and Measurement
Variabelen, Meetschalen en Meetniveaus
Variabele → gemeten karakteristiek die kan verschillen tussen subjecten
Soorten variabelen: gedrags-, stimulus-, subject-, fysiologische- variabelen.
Je moet nadenken over welke statistische instrumenten/technieken kan je gebruiken om de
variabelen te beschrijven.
Meetschalen
- Categorisch/kwalitatief
Nominaal: Er hangt geen numeriek getal aan vast. Bijvoorbeeld: Wat is je lievelingskleur?
Ordinaal: Er zit een volgorde/orde in. Bijvoorbeeld: de Likert-schaal van zeer eens-zeer oneens.
- Kwantitatief/numeriek → meest gebruikt in de statistiek
Interval: gelijke afstand/hoeveelheid tussen opeenvolgende waarden (Graden Celsius).
Ratio: gelijke afstand (interval) en absoluut nulpunt (Graden Kelvin).
Discreet meetniveau = niet alle punten kunnen waargenomen woorden. Je hebt bijvoorbeeld niet 2,3
zussen. Je hebt 2 zussen of 3 zussen.
Continu meetniveau = oneindig deelbaar. Hoe oud ben je? Dit kan 29,9976 jaar oud.
Inferentiele statistiek → je kunt niet de hele populatie zien omdat het te groot/kostbaar/tijdrovend
is. Je neemt een representatieve sample. Er zijn 2 manieren waardoor een steekproef niet exact
dezelfde waarde geeft als de parameter die je wilt zien:
- Variatie: In de ene steekproef is het gemiddelde bijvoorbeeld anders dan in de andere
steekproef.
- Steekproeftrekking: Het leidt tot een vertekend en niet valide beeld van de populatie.
Problematischer.
Steekproefproblemen bij inferentiele statistiek
Doel: Betrouwbare en valide uitspraken over populatie obv een steekproef.
➔ Steekproefgrootheden dienen dan niet te verschillen van populatiegrootheden (parameter).
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper 614148. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.