Volledige samenvatting van lessen en responsiecolleges van prof. Molenberghs.
Inclusief afbeeldingen, heel duidelijk en samenhangend
14/20 in eerste zit door dit document
IMWO: Statistiek
DEEL 1: FUNDAMENTELE CONCEPTEN
HOOFDSTUK 3: What is statistics?
2 bronnen van ruis/random variability
1) prijs betalen voor steekproef die moet selecteren
=> hoe groter steekproef, hoe elager ruis
=> eindige & kleine steekproef zorgt voor ruis
2) ook als hele populatie onderzoekt, sommige dingen niet op 100% precieze manier
waarneembaar
=> meetfouten
als 2groepsopzet:
vb. placebo vs actieve behandeling
-> IvoormetingI - InametingI = 0, dan nulhypothese
-> kan hierbij geen statistische uitspraken doen over causaliteit
=> info in andere domeinen zoeken (wel nog steeds randomisatie)
-> als metingen heel variabel, dan moet grote steekproef hebben
=> hoe wilder de ruis, hoe groter de steekproef
cross-over studie:
vb. 10 patiënten placebo, dan actieve behandeling
10 patiënten actieve behandeling, dan placebo
-> behandeling stapt van ene naar andere over in verschillende richting
reversibiliteit nodig:
-> behandelingen in verschillende volgorde kunnen uitvoeren zonder beïnvloedding
= carry-over
Statistics aims at drawing conclusions abot some population,
based on what has been observed in a random sample.
-> toetsingsparadigma: kan voorzichtig iets zeggen over populatie na uitvoeren van steekproef
,3.1 Population vs random sample
populatie
= hypothetische groep van huidige & toekomstige objecten, met speci eke conditie, waarover
conclusies gemaakt zullen worden
sample/steekproef
= subgroep van populatie waarop observaties gedaan zullen worden
-> elementen van steekproef moeten at random gekozen worden
=> zo kunnen observaties voor hele populatie gegeneraliseerd worden
=> steekproef mag niet stroken met het geheel
reproduceren
= opnieuw beginnen aan steekproef & hopen dat eenduidig antwoord krijgt
3.2 The aim of statistics
1) descriptive statistics
= geobserveerde data samenvatten & beschrijven zodat relevante aspecten expliciet
gemaakt worden/uitgelegd worden
vb. tabellen, gra eken, gemiddelden berekenen, …
2) inferential statistics
= bestuderen in welke mate de waargenomen trends/e ecten kunnen gegeneraliseerd
worden voor een algemene, oneindige populatie
=> overstap van steekproef naar populatie
-> correcte statistische methodologie & correcte interpretatie van resultaten nodig
μ = schatter: hoe zeker/onzeker van uitkomst
fi ff fi
,HOOFDSTUK 4: Summary statistics
A & B hebben dezelfde locatie, maar
andere spreiding
A & C hebben dezelfde spreiding, maar een
andere locatie
locatie = gemiddelde
spreiding ≠ locatie
4.1 Measures of location
= waar zijn de waarnemingen ongv gelokaliseerd?
sample average/sample mean
= gemiddelde
-> heel gevoelig voor uitschieters
sample median
= middelste waarneming
-> niet zo gevoelig voor uitschieters
sample mode
= modus
= meest voorkomende waarneming
-> niet altijd informatief
vb. zwarte punten ih verkeer
symmetrische vs scheve (skewed) data
symmetrisch: median = mean
skewed: median ≠ mean
-> mean kan sterk beïnvloed worden door uitschieters
==> als symmetrische data: mean gebruiken
==> als skewed data: median gebruiken
4.2 Measures of spread
= hoe gelijkend zijn de waarnemingen?
als spreiding, dan is onzekerheid naar gebruiker toe
=> als enkel kijkt naar gemiddelde: groep waar goed werkt, compenseert groep waar niet werkt
mean deviation from the mean
= gemiddelde afwijking
mean quadratic deviation from the mean
-> kwadratische functie van gemaakt
-> probleem: eenheden die ons niets meer zeggen (bvb. mm^2)
-> sterk beïnvloed door uitschieters
, sample standard deviation/standaarddeviatie
= steekproef standaarddeviatie
-> vierkantwortel van steekproefvariantie
-> sterk beïnvloed door uitschieters
deviatie = afwijking
-> zit geen fout in
fout = hoe juist of onjuist is gemiddelde berekend?
sample range
= bereik
=R
= max (xi) - min (xi)
-> sterk beïnvloed door steekproefgrootte n
=> grote steekproeven: meer kans voor extreme obeservaties
=> groter bereik
sample interquartile range
= bereik na verwijdering van 25% vd hoogste & 25% vd laagste waarden in steekproef
-> tegenhanger mediaan voor spreiding
=> uitersten weg
-> onafhankelijk van steekproefgrootte n
-> niet beïnvloed door uitschieters
symmetrische vs skewed data
symmetrisch: standaarddeviatie
skewed: interquartile range
4.3 Percentages
percentage: 0-100
proportie: 0-1
-> tss 2 getallen altijd oneiding # andere getallen
=> vaak zonder grenzen (-oneindig tot +oneindig)
=> normale verdeling: staarten heel dun, kans dat zoiets voorvalt is heel klein
-> steekproefgemiddelde = (# mensen die ziek zijn)/n , met n = totaal # mensen in steekproef
=> is dus waargenomen percentage/proportie van mensen met ziekte
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lisavandenberghe. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $16.66. You're not tied to anything after your purchase.