Volledige samenvatting van lessen en responsiecolleges van prof. Molenberghs.
Inclusief afbeeldingen, heel duidelijk en samenhangend
14/20 in eerste zit door dit document
IMWO: Statistiek
DEEL 1: FUNDAMENTELE CONCEPTEN
HOOFDSTUK 3: What is statistics?
2 bronnen van ruis/random variability
1) prijs betalen voor steekproef die moet selecteren
=> hoe groter steekproef, hoe elager ruis
=> eindige & kleine steekproef zorgt voor ruis
2) ook als hele populatie onderzoekt, sommige dingen niet op 100% precieze manier
waarneembaar
=> meetfouten
als 2groepsopzet:
vb. placebo vs actieve behandeling
-> IvoormetingI - InametingI = 0, dan nulhypothese
-> kan hierbij geen statistische uitspraken doen over causaliteit
=> info in andere domeinen zoeken (wel nog steeds randomisatie)
-> als metingen heel variabel, dan moet grote steekproef hebben
=> hoe wilder de ruis, hoe groter de steekproef
cross-over studie:
vb. 10 patiënten placebo, dan actieve behandeling
10 patiënten actieve behandeling, dan placebo
-> behandeling stapt van ene naar andere over in verschillende richting
reversibiliteit nodig:
-> behandelingen in verschillende volgorde kunnen uitvoeren zonder beïnvloedding
= carry-over
Statistics aims at drawing conclusions abot some population,
based on what has been observed in a random sample.
-> toetsingsparadigma: kan voorzichtig iets zeggen over populatie na uitvoeren van steekproef
,3.1 Population vs random sample
populatie
= hypothetische groep van huidige & toekomstige objecten, met speci eke conditie, waarover
conclusies gemaakt zullen worden
sample/steekproef
= subgroep van populatie waarop observaties gedaan zullen worden
-> elementen van steekproef moeten at random gekozen worden
=> zo kunnen observaties voor hele populatie gegeneraliseerd worden
=> steekproef mag niet stroken met het geheel
reproduceren
= opnieuw beginnen aan steekproef & hopen dat eenduidig antwoord krijgt
3.2 The aim of statistics
1) descriptive statistics
= geobserveerde data samenvatten & beschrijven zodat relevante aspecten expliciet
gemaakt worden/uitgelegd worden
vb. tabellen, gra eken, gemiddelden berekenen, …
2) inferential statistics
= bestuderen in welke mate de waargenomen trends/e ecten kunnen gegeneraliseerd
worden voor een algemene, oneindige populatie
=> overstap van steekproef naar populatie
-> correcte statistische methodologie & correcte interpretatie van resultaten nodig
μ = schatter: hoe zeker/onzeker van uitkomst
fi ff fi
,HOOFDSTUK 4: Summary statistics
A & B hebben dezelfde locatie, maar
andere spreiding
A & C hebben dezelfde spreiding, maar een
andere locatie
locatie = gemiddelde
spreiding ≠ locatie
4.1 Measures of location
= waar zijn de waarnemingen ongv gelokaliseerd?
sample average/sample mean
= gemiddelde
-> heel gevoelig voor uitschieters
sample median
= middelste waarneming
-> niet zo gevoelig voor uitschieters
sample mode
= modus
= meest voorkomende waarneming
-> niet altijd informatief
vb. zwarte punten ih verkeer
symmetrische vs scheve (skewed) data
symmetrisch: median = mean
skewed: median ≠ mean
-> mean kan sterk beïnvloed worden door uitschieters
==> als symmetrische data: mean gebruiken
==> als skewed data: median gebruiken
4.2 Measures of spread
= hoe gelijkend zijn de waarnemingen?
als spreiding, dan is onzekerheid naar gebruiker toe
=> als enkel kijkt naar gemiddelde: groep waar goed werkt, compenseert groep waar niet werkt
mean deviation from the mean
= gemiddelde afwijking
mean quadratic deviation from the mean
-> kwadratische functie van gemaakt
-> probleem: eenheden die ons niets meer zeggen (bvb. mm^2)
-> sterk beïnvloed door uitschieters
, sample standard deviation/standaarddeviatie
= steekproef standaarddeviatie
-> vierkantwortel van steekproefvariantie
-> sterk beïnvloed door uitschieters
deviatie = afwijking
-> zit geen fout in
fout = hoe juist of onjuist is gemiddelde berekend?
sample range
= bereik
=R
= max (xi) - min (xi)
-> sterk beïnvloed door steekproefgrootte n
=> grote steekproeven: meer kans voor extreme obeservaties
=> groter bereik
sample interquartile range
= bereik na verwijdering van 25% vd hoogste & 25% vd laagste waarden in steekproef
-> tegenhanger mediaan voor spreiding
=> uitersten weg
-> onafhankelijk van steekproefgrootte n
-> niet beïnvloed door uitschieters
symmetrische vs skewed data
symmetrisch: standaarddeviatie
skewed: interquartile range
4.3 Percentages
percentage: 0-100
proportie: 0-1
-> tss 2 getallen altijd oneiding # andere getallen
=> vaak zonder grenzen (-oneindig tot +oneindig)
=> normale verdeling: staarten heel dun, kans dat zoiets voorvalt is heel klein
-> steekproefgemiddelde = (# mensen die ziek zijn)/n , met n = totaal # mensen in steekproef
=> is dus waargenomen percentage/proportie van mensen met ziekte
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lisavandenberghe. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €15,49. Je zit daarna nergens aan vast.