Dit document bestaat uit een overzichtelijke samenvatting van het eerstejaarsvak Inleiding statistiek hoofdstuk 1 t/m 11. Ik heb de colleges gevolgd en het boek gelezen. Dit document is een samenvatting van alles wat ik hierin mee heb gekregen en het is in eigen woorden vertaald naar het Nederlands...
-------------------- Inleiding statistiek --------------------
Hoofdstuk 1 - Introductie
Wat is statistiek?
Statistiek is de wetenschap van data verzamelen, analyseren, blootstellen en interpreteren. Hiermee
wordt NIET bedoelt: statistiek als een verzameling van gegevens.
Wat we zien VS wat er echt is
Het groene vak laat zien wat een mens
waarneemt. Hierdoor ontstaat er een
negatieve relatie tussen de kwaliteit van een
boek en de kwaliteit van de film (gele lijn)
Om dit te kunnen begrijpen heb je een
statistisch redeneringsvermogen nodig.
Daarom dat we statistiek krijgen!
We krijgen statistiek om de wereld om ons
heen beter te begrijpen. De wereld bestaat
voortaan uit een grote hoeveelheid data.
Stel je wil weten of eenzaamheid toenam tijdens de lockdown of je wil weten hoeveel gevaarlijker
COVID-19 is voor mensen met kanker. Statistiek is de ENIGE manier om deze vragen zinvol te
benaderen!
Twee houdingen tegenover statistiek:
Statistiek als gereedschap
Je gebruikt het om je doel te dienen (bv. Een inferentie maken op basis van data). Je hebt
een pragmatische relatie met statistiek (bv. Om onderzoek te doen en de wereld te
begrijpen)
Statistiek als discipline
Over het verbeteren van statistiek. Over betere manieren om gegevens te modelleren,
conclusies te trekken, onzekerheid te kwantificeren.
Vooral nu: het begrijpen van enorme hoeveelheden data (gebruik nooit de term Big Data)
Populatie = de verzameling van alle individuen van belang in een bepaalde studie
Steekproef (sampling) = een verzameling individuen die is geselecteerd uit een populatie, meestal
bedoeld om de populatie in een onderzoeksstudie te vertegenwoordigen.
Variabele = een kenmerk of aandoening die voor verschillende individuen verandert of verschillende
waarden heeft.
De relatie tussen een populatie en een steekproef: De steekproef wordt geselecteerd UIT de
populatie. De resultaten van de steekproef worden gegeneraliseerd over de gehele populatie.
Data (meervoud) zijn metingen of waarnemingen. Een dataset is een verzameling metingen of
waarnemingen. Een datum (enkelvoud) is een enkele meting of waarneming en wordt gewoonlijk
een partituur of ruwe partituur genoemd.
1
,Parameters en statistieken
Bij het beschrijven van data is het nodig om te onderscheiden of de gegevens afkomstig zijn uit een
populatie of uit een steekproef. Een kenmerk dat een populatie beschrijft, bijvoorbeeld de
gemiddelde score voor de populatie, wordt een parameter genoemd. Een kenmerk dat een
steekproef beschrijft, wordt een statistiek genoemd. De gemiddelde score voor een steekproef is dus
een voorbeeld van een statistiek. Meestal begint het onderzoeksproces met een vraag over een
populatieparameter. De feitelijke gegevens zijn echter afkomstig uit een steekproef en worden
gebruikt om steekproefstatistieken te berekenen.
Beschrijvende en Inferentiële statistiek
Hoewel onderzoekers een verscheidenheid aan verschillende statistische procedures hebben
ontwikkeld om gegevens te ordenen en te interpreteren, kunnen deze verschillende procedures
worden ingedeeld in twee algemene categorieën.
Beschrijvende statistiek (Descriptive) = statistische procedures die worden gebruikt om
gegevens samen te vatten, te ordenen en te vereenvoudigen.
Inferentiële statistiek (Inferential) = bestaat uit technieken waarmee we steekproeven
kunnen bestuderen en vervolgens generalisaties kunnen maken over de populaties waaruit
ze zijn geselecteerd. Inferentie ~ gevolgtrekking
Sampling error
Steekproeffout is de natuurlijk voorkomende discrepantie of fout die bestaat tussen een
steekproefstatistiek en de overeenkomstige populatieparameter.
2
,Bovenstaand figuur toont een populatie van 1.000 studenten en 2 steekproeven, elk met 5 studenten
die uit de populatie werden geselecteerd. Merk op dat elk monster verschillende individuen bevat
met verschillende kenmerken. Omdat de kenmerken van elke steekproef afhankelijk zijn van de
specifieke personen in de steekproef, zullen de statistieken van steekproef tot steekproef verschillen.
Zo hebben de vijf leerlingen in steekproef 1 een gemiddelde leeftijd van 19,8 jaar en de leerlingen in
steekproef 2 een gemiddelde leeftijd van 20,4 jaar. Het is ook zeer onwaarschijnlijk dat de voor een
steekproef verkregen statistieken identiek zijn aan de parameters voor de gehele populatie.
Het basisconcept van steekproeffout: steekproefstatistieken variëren van steekproef tot steekproef
en verschillen doorgaans van de overeenkomstige populatieparameters.
Datastructuren, onderzoeksmethodes en statistiek
Correlatiemethode = Bij de correlatiemethode worden twee verschillende variabelen geobserveerd
om te bepalen of er een verband tussen bestaat. Wanneer de gegevens van een correlatieonderzoek
bestaan uit numerieke scores, wordt de relatie tussen de twee variabelen meestal gemeten en
beschreven met behulp van een statistiek die correlatie wordt genoemd. Vraag: Hoeveel variabelen
worden in een correlatieonderzoek voor elk individu gemeten en hoeveel groepen scores worden
verkregen?
Antwoord = 2 variabelen, 1 groep.
Correlatiegegevens bestaande uit niet-numerieke scores. Merk op
dat er twee metingen zijn voor elk individu: geslacht en voorkeur
voor mobiele telefoons. De cijfers geven aan hoeveel mensen er in
elke categorie zitten. Van de 50 mannen geven er bijvoorbeeld 30
de voorkeur aan tekst boven praten.
Bij de experimentele methode wordt één variabele gemanipuleerd terwijl een andere variabele
wordt waargenomen en gemeten. Om een oorzaak-en-gevolgrelatie tussen de twee variabelen vast
te stellen, probeert een experiment alle andere variabelen te controleren om te voorkomen dat ze
de resultaten beïnvloeden.
De onafhankelijke variabele is de variabele die door de onderzoeker wordt gemanipuleerd. Bij
gedragsonderzoek bestaat de onafhankelijke variabele meestal uit de twee (of meer)
behandelcondities waaraan proefpersonen worden blootgesteld. De onafhankelijke variabele bestaat
uit de eerdere condities die zijn gemanipuleerd voordat de afhankelijke variabele werd
waargenomen. De afhankelijke variabele is de variabele die wordt waargenomen om het effect van
de behandeling te beoordelen.
Individuen in een controleconditie krijgen de experimentele behandeling niet. In plaats daarvan
krijgen ze ofwel geen behandeling, ofwel een neutrale placebobehandeling. Het doel van een
controleconditie is om een basislijn te verschaffen voor vergelijking met de experimentele conditie.
Individuen in de experimentele conditie krijgen wel de experimentele behandeling.
In een niet-experimenteel onderzoek wordt de "onafhankelijke variabele" die wordt gebruikt om de
verschillende groepen scores te maken, vaak de quasi-onafhankelijke variabele genoemd.
Variabelen en metingen
Constructies en operationaliseringen
Constructen zijn interne attributen of kenmerken die niet direct kunnen worden waargenomen, maar
die nuttig zijn voor het beschrijven en verklaren van gedrag.
Een operationele definitie identificeert een meetprocedure (een reeks bewerkingen) voor het meten
van extern gedrag en gebruikt de resulterende metingen als een definitie en een meting van een
3
, hypothetisch construct. Merk op dat een operationele definitie twee componenten heeft. Ten eerste
beschrijft het een reeks bewerkingen voor het meten van een construct. Ten tweede definieert het
het construct in termen van de resulterende metingen.
Intelligence = construct A
Uni performance = construct B
Full scale IQ score obtained with
the WAIS IV test =
operationalisatie A
Average grade in all core
modules = operationalisatie B
Discrete en Continue variabelen
Sommige variabelen kunnen slechts uit een beperkt aantal categorieën bestaan. Bijvoorbeeld
geslacht, oogkleur, moedertaal. Maar ook aantal huisdieren, aantal broers en zussen, hoe vaak op
vakantie geweest. Er kan geen waarde zijn tussen 1 en 2 huisdieren (bijvoorbeeld ‘ik heb 1,3
huisdier). Deze variabelen worden discrete variabelen genoemd.
Andere variabelen kunnen alle waarden tussen twee punten aannemen. Bijvoorbeeld inkomen,
lengte, gewicht, snelheid. Je lengte kan in principe worden uitgedrukt als 1,7823235 meter. Een
waarde van een continue variabele (bv 1,75 meter) is dus eigenlijk een interval.
Het meten van variabelen
De nominale schaal (nominal scale)
Gaat over genoemde categorieën. Nominal = naam. Bijvoorbeeld hond, kat, hamster. Er is
geen onderscheid te maken tussen de categorieën op kwantitatief niveau! Je kuntn niet
zeggen een hond is meer dan een kat. Er is dus geen nul.
De ordinale schaal (ordinal scale)
Gaat over gerangschikte categorieën (bv 1 e, 2e, 3e). Geen gelijke afstand tussen de rangen.
Geen nul!
De intervalschaal (interval scale)
Bestaat uit even grote intervallen tussen waarden. Elke eenheid heeft dezelfde grootte.
Bijvoorbeeld temperatuur. Van 21 naar 26 graden en van 1 naar 6 graden hebben beide
hetzelfde verschil. Maar: we hebben geen echt nulpunt. Het is willekeurig gekozen. Nul
graden Celsius is als water naar ijs veranderd. Dit is willekeurig gekozen.
De ratio scale
Bestaat uit even grote intervallen tussen waarden. Elke eenheid heeft dezelfde grootte. Maar
nu hebben we wel een absolute nul. Bijvoorbeeld. Afstand: een afstand van nul betekent dat
je fiets niet van positie veranderd is.
Voorbeeld discrete variabelen:
Hoeveel huisdieren heb je? We vragen 10 mensen. Zij geven ons het aantal huisdieren
dat momenteel in hun huishouden leeft. Onthoud: het construct is ‘aantal huisdieren’.
De operationalisering is ‘het aantal huisdieren dat momenteel in het hoofdhuishouden
van een persoon woont’.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller SuzeN. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.52. You're not tied to anything after your purchase.