Kennisclip Statistiek en Wetenschappelijk onderzoek
(wetenschappelijk) onderzoek heeft 2 hoofddoelstellingen:
1. Het vergroten van ons inzicht in de werkelijkheid: maw de vergroting van ons kennen
2. Het leveren van een bijdrage aan de oplossing van problemen: maw de vergroting van ons kunnen
Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van informatie. We beschrijven de resultaten van een steekproef met
kerngetallen en figuren. We generaliseren de resultaten van de steekproef naar uitspraken over de
populatie met schattingen en toetsen.
Kennisclip continue uitkomsten beschrijven: locatiematen
Voorbeeld van een continue waarde: leeftijd, bloeddruk
Gemiddelde van een steekproef:
Tel alle waarnemingen op, deel door aantal waarnemingen
Mediaan van een steekproef: zet alle waarnemingen op volgorde laagst naar hoogst. Med =
middelste waarde = Q2
Andere quantielen:
Onder de eerste kwartiel (Q1) bevindt zich 25% van de waarnemingen
Onder de derde kwartiel (Q3) bevindt zich 75% van de waarnemingen
Bij een symmetrische verdeling komen het gemiddelde en de mediaan (bijna) overeen.
Gemiddelde bevat meer informatie, gevoelig voor uitschieters. Voorkeur
Mediaan minder gevoelig voor uitschieters, scheefheid, maar bevat minder informatie
Kennisclip continue uitkomsten beschrijven: spreidingsmaten
Steekproef standaarddeviatie
(standaardafwijkingen): ->
Ongeveer: gemiddelde afstand tot het
gemiddelde
Interkwartielafstand: verschil tussen Q3 en Q1.
Variantie, range
Recept boxplot:
Zet een streepje bij de mediaan.
Rond de mediaan loopt de box van Q1
tot Q3
Gegevens die meer dan 1.5x dan IQR van
de uiteinden van de box liggen worden
als uitbijter (=extreem) beschouwd, en
worden aangegeven met een stipje
De whiskers lopen van de kleinste tot
aan de grootste waarneming die geen
height uitbijter is
Bij symmetrische verdelingen: liever gemiddelde & SD
Bij scheve verdelingen/uitschieters aan 1 kant: mediaan & IQR
, Kennisclip samenhang twee continue variabelen beschrijven
Spreidingsdiagram: vorm van het verband is te beoordelen en evt uitbijters zijn vast te stellen.
Samenhang twee continue variabelen: correlatie: (Pearson's) correlatiecoëfficient r is een maat voor
lineaire samenhang tussen X en Y. -1 <r <1. r is dimensieloos. (r2 is een maat voor hoeveelheid
variantie verklaard door lineair verband tussen X en Y). Correlatie zegt niks over de helling van een
lineair verband! Bij correlatie gaat het over een lineair verband. Uitbijters kunnen een groot effect op
Pearson's correlatiecoëfficient hebben.
Sterkte wordt uigedrukt in de absolute waarde van r. richting wordt uitgedrukt in het teken van r (+
of -). Een zwakke correlatie ligt onder de 4?
Correlation does not imply a causal relationship! Geen correlatie betekent niet per se geen verband.
Aanwezigheid van correlatie duidt niet altijd op een werkelijk verband/causaliteit.
HC Toetsingstheorie
Kennis over statistiek is belangrijk: Om informatie in de wetenschappelijke literatuur op
waarheidsgehalte te beoordelen -> dit heet statistical literacy; Voor ontwerp van onderzoek; Voor
beschrijving van de gegevens in je eigen studie; Voor het trekken van conclusies voor de hele
populatie, obv de gegevens van je eigen steekproef -> dit is het onderdeel inferentiële statistiek en
die is gebaseerd op de toetsingstheorie
Kansvariabelen en verdelingen
Een kansvariabele X is een grootheid waarvan de uitkomst van het toeval afhankelijk is
(lichaamslengte). We kunnen ons afvragen: hoe is lengte verdeeld? Symmetrisch, scheef? Welke
locatiemaat is geschikt om deze steekproef te beschrijven? En welke spreidingsmaat?
Om onze kennis en kunde te vergroten proberen onderzoekers informatie te krijgen die voor een
hele populatie geldt. Dit doen we veelal door informatie te verzamelen bij een steekproef. De
informatie uit de steekproef is onvolledig en daardoor introduceren we onnauwkeurigheid. Want de
steekproef hangt van kans af.
Verdeling van steekproefgemiddelden
Stel: we nemen een steekproef van 100 mensen en meten systolische bloeddruk. Het
steekproefgemiddelde zegt ons niet alleen iets over deze 100 mensen maar ook iets over de
populatie waaruit de steekproef getrokken is. Nemen we 25 maal een steekproef van 100 mensen
dan krijgen we niet 25x hetzelfde steekproef-gemiddelde. Variabiliteit.
De standaardfout: variatie tussen steekproefgemiddelden. Voor een toevalsvariabele X geldt
. Geeft informatie over de nauwkeurigheid van X tov het populatiegemiddelde u.
gebruik de se(X) om betrouwbaarheidsintervallen voor het populatiegemiddelde u te construeren.
Standaarddeviatie is een spreidingsmaat. Wat is de gemiddelde afstand van alle waarnemingen tot
het gemiddelde. Hoe dicht/ver liggen de waarnemingen van elkaar. Hoeveel spreiding ligt er in de
populatie. De standaardfout is gebaseerd op deze spreiding.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Merel21. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.61. You're not tied to anything after your purchase.