Kennisclip Statistiek en Wetenschappelijk onderzoek
(wetenschappelijk) onderzoek heeft 2 hoofddoelstellingen:
1. Het vergroten van ons inzicht in de werkelijkheid: maw de vergroting van ons kennen
2. Het leveren van een bijdrage aan de oplossing van problemen: maw de vergroting van ons kunnen
Statistiek is de wetenschap, de methodiek en de techniek van het verzamelen, bewerken,
interpreteren en presenteren van informatie. We beschrijven de resultaten van een steekproef met
kerngetallen en figuren. We generaliseren de resultaten van de steekproef naar uitspraken over de
populatie met schattingen en toetsen.
Kennisclip continue uitkomsten beschrijven: locatiematen
Voorbeeld van een continue waarde: leeftijd, bloeddruk
Gemiddelde van een steekproef:
Tel alle waarnemingen op, deel door aantal waarnemingen
Mediaan van een steekproef: zet alle waarnemingen op volgorde laagst naar hoogst. Med =
middelste waarde = Q2
Andere quantielen:
Onder de eerste kwartiel (Q1) bevindt zich 25% van de waarnemingen
Onder de derde kwartiel (Q3) bevindt zich 75% van de waarnemingen
Bij een symmetrische verdeling komen het gemiddelde en de mediaan (bijna) overeen.
Gemiddelde bevat meer informatie, gevoelig voor uitschieters. Voorkeur
Mediaan minder gevoelig voor uitschieters, scheefheid, maar bevat minder informatie
Kennisclip continue uitkomsten beschrijven: spreidingsmaten
Steekproef standaarddeviatie
(standaardafwijkingen): ->
Ongeveer: gemiddelde afstand tot het
gemiddelde
Interkwartielafstand: verschil tussen Q3 en Q1.
Variantie, range
Recept boxplot:
Zet een streepje bij de mediaan.
Rond de mediaan loopt de box van Q1
tot Q3
Gegevens die meer dan 1.5x dan IQR van
de uiteinden van de box liggen worden
als uitbijter (=extreem) beschouwd, en
worden aangegeven met een stipje
De whiskers lopen van de kleinste tot
aan de grootste waarneming die geen
height uitbijter is
Bij symmetrische verdelingen: liever gemiddelde & SD
Bij scheve verdelingen/uitschieters aan 1 kant: mediaan & IQR
, Kennisclip samenhang twee continue variabelen beschrijven
Spreidingsdiagram: vorm van het verband is te beoordelen en evt uitbijters zijn vast te stellen.
Samenhang twee continue variabelen: correlatie: (Pearson's) correlatiecoëfficient r is een maat voor
lineaire samenhang tussen X en Y. -1 <r <1. r is dimensieloos. (r2 is een maat voor hoeveelheid
variantie verklaard door lineair verband tussen X en Y). Correlatie zegt niks over de helling van een
lineair verband! Bij correlatie gaat het over een lineair verband. Uitbijters kunnen een groot effect op
Pearson's correlatiecoëfficient hebben.
Sterkte wordt uigedrukt in de absolute waarde van r. richting wordt uitgedrukt in het teken van r (+
of -). Een zwakke correlatie ligt onder de 4?
Correlation does not imply a causal relationship! Geen correlatie betekent niet per se geen verband.
Aanwezigheid van correlatie duidt niet altijd op een werkelijk verband/causaliteit.
HC Toetsingstheorie
Kennis over statistiek is belangrijk: Om informatie in de wetenschappelijke literatuur op
waarheidsgehalte te beoordelen -> dit heet statistical literacy; Voor ontwerp van onderzoek; Voor
beschrijving van de gegevens in je eigen studie; Voor het trekken van conclusies voor de hele
populatie, obv de gegevens van je eigen steekproef -> dit is het onderdeel inferentiële statistiek en
die is gebaseerd op de toetsingstheorie
Kansvariabelen en verdelingen
Een kansvariabele X is een grootheid waarvan de uitkomst van het toeval afhankelijk is
(lichaamslengte). We kunnen ons afvragen: hoe is lengte verdeeld? Symmetrisch, scheef? Welke
locatiemaat is geschikt om deze steekproef te beschrijven? En welke spreidingsmaat?
Om onze kennis en kunde te vergroten proberen onderzoekers informatie te krijgen die voor een
hele populatie geldt. Dit doen we veelal door informatie te verzamelen bij een steekproef. De
informatie uit de steekproef is onvolledig en daardoor introduceren we onnauwkeurigheid. Want de
steekproef hangt van kans af.
Verdeling van steekproefgemiddelden
Stel: we nemen een steekproef van 100 mensen en meten systolische bloeddruk. Het
steekproefgemiddelde zegt ons niet alleen iets over deze 100 mensen maar ook iets over de
populatie waaruit de steekproef getrokken is. Nemen we 25 maal een steekproef van 100 mensen
dan krijgen we niet 25x hetzelfde steekproef-gemiddelde. Variabiliteit.
De standaardfout: variatie tussen steekproefgemiddelden. Voor een toevalsvariabele X geldt
. Geeft informatie over de nauwkeurigheid van X tov het populatiegemiddelde u.
gebruik de se(X) om betrouwbaarheidsintervallen voor het populatiegemiddelde u te construeren.
Standaarddeviatie is een spreidingsmaat. Wat is de gemiddelde afstand van alle waarnemingen tot
het gemiddelde. Hoe dicht/ver liggen de waarnemingen van elkaar. Hoeveel spreiding ligt er in de
populatie. De standaardfout is gebaseerd op deze spreiding.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Merel21. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,29. Je zit daarna nergens aan vast.