Samenvatting Data-Analyse
TB134B
College 1
Steekproef: deel van de populatie die deelneemt aan onderzoek steekproefgrootheden, x
en s, bekend, variabel en vertellen iets over populatie
Populatie: de groep mensen of subjecten waarover je uitspraken wilt doen parameters,
mu en rho, onbekend, constant en in de populatie parameters werkelijk geïnterewseerd
Steekproefgemiddelde = som steekproefuitkomsten / aantal uitkomsten = x
Populatiegemiddelde = som populatieuitkomsten / aantal uitkomsten = u
Maatstaven voor centrale tendentie
- Mediaan middelste getal bij getallen op volgorde, kiezen bij scheve verdeling
- Modus meest voorkomende waarde, kiezen bij kwalitatieve data maar meestal
niet geschikt
- Gemiddelde, kiezen bij symmetrische verdeling
Spreidingsmaatstaven
- Bereik grootste waarneming min de kleinste waarneming, ongevoelig voor vorm
- Interkwartielafstand 75e percentiel – 25e percentiel
- Populatievariantie en standaarddeviatie som kwadraten afwijkingen van
gemiddelde / n
- Steekproefvariantie en standaarddeviatie som kwadraten afwijkingen van
gemiddelde / n – 1
Z-score : afstand tussen een meting en het gemiddelde, uitgedrukt in standaardafwijkingen
- Z = (x – x) / s
Outliers detecteren z-scores van ongeveer 3 zijn outliers en bij boxplot zijn metingen
buiten de grens verdacht
College 2
Stochast: random variabele, met kansfunctie berekend
Verdelingen:
- Bernoulli verdeling uitkomst is 1 of 0
- Uniforme verdeling fx = 1/ (b-a) , alleen kans bij een interval
- Normale verdeling symmetrische verdeling, oneindig doorlopen, empirische regel
Empirische regel: 68% tussen -1 en 1, 95% tussen -2 en 2 en 99,7% tussen -3 en 3
Discrete verdeling: geheel getal, munt of dobbelsteen
Continue verdeling: cijfers achter komma, aankomsttijden of lengte
Inverse van kans z-waarde en zo kan je dan bijvoorbeeld gemiddelde of
standaardafwijking bepalen
, Hypothese tesen kans berekenen, uitgaande dat persoon gelijk heeft, we dit of een
extremer steekproefresultaat vinden (= p-waarde)
College 3
Wortel N-wet : bij het trekken van meerdere steekproeven, n, wordt de standaardafwijking
ook wel de standaardfout de standaardafwijking gedeeld door de wortel van het aantal
steekproeven.
H0 behouden en H1 verwerpen p > a
H0 verwerpen en H1 aannemen p < a
Centrale limietstelling: bij n > 30, is de steekproevenverdeling altijd normaal verdeeld wat de
populatieverdeling ook is.
Eenzijdig toetsen H1 is bijvoorbeeld groter of kleiner
Tweezijdig toetsen H1 is niet H0, geen richting
Fouten bij het wel of niet verwerpen van H0:
Kritiek gebied: dit is de grens waarbij H0 wordt behouden of wordt verworpen, berekenen
door alfa gelijk te stellen aan de kans. Door middel van de inverse kan je de z-waarde
berekenen en zo kan je x afleiden.
College 4
Betrouwbaarheidsinterval: bijvoorbeeld 95%, dit houdt in dat de kans dat dit zo is 95% is en
hierbij een z-waarde kan worden bepaald.
- U = x ± z * s (of s/wortel n)
T-waarde: gebruik je in plaats van de z-waarde, omdat je nu de populatie standaardafwijking
niet weet en daarom de steekproef standaardafwijking neemt. Het aantal vrijheidsgraden is
nodig om de p-waarde te berekenen, dit is de steekproefgrootte n -1.
- Analyse, compare means, one sample t-test