STATISTIEK 1
TUTORIAL 1
Sample: steekproef, hetgeen waaraan je info gaat vragen
Unit: de eenheid waaraan je meet
Variable: hetgeen wat je meet
Quantitative variable continuous: dingen die je kan meten op schaal (lengte)
Quantitative variable discrete: dingen die je meet in aantallen (kinderen)
Qualitative variable nominal: kun je niet mee rekenen, niet op volgorde (haarkleur)
Qualitative variable ordinal: kun je niet mee rekenen, wel op volgorde (opleidingsniveau)
Sample bias: sommige delen van populatie zijn over- of ondergerepresenteerd
Simple random sampling (SRS): iedereen die meedoet heeft evenveel kans (lootjes trekken)
Undersampling: bepaalde groepen te weinig in sample
Non-response: bepaalde groep wil bijv. niet meedoen
Voluntary participation: men wil zelf meedoen (vaak heel positief of heel negatief)
Response bias: sociaal wenselijke antwoorden, niet eerlijk
Observational study: je observeert enkel
Experimental study: je experimenteert, alleen hierbij kan oorzaak-gevolg conclusie worden
getrokken
Frequency: hoe vaak iets voorkomt
Relative frequency: deel / alles (fractie, kun je naast elkaar leggen)
TUTORIAL 2
Streepje op kleine letter: gemiddelde (mean)
Median: middelste waarde
Outlier: extreme uitschietter
Symmetrische verdeling: mediaan en gemiddelde nagenoeg zelfde
Asymmetrische verdeling: gemiddelde is gevoelig voor outliers, is dan ook heel anders dan
mediaan
Range: verschil tussen maximum en minimum
Standard deviation: wortel uit variantie
Variance: (waarneming-gemiddelde)2 / n-1
N: sample size, aantal waarnemingen
Interquartile range: verschil tussen Q3 en Q1
Five-number summary: sample minimum, first quartile, median / second quartile, third
quartile, sample maximum
Law of large numbers: relatieve frequencies stabiliseren als het experiment vaak herhaalt
wordt, de frequency wordt beter bepaald
Y: mensen die te veel zout eten, bijv
P: y/n, kans dat iemand randoms te veel zout eet
Consistent estimatior: hoe groter de sample size, hoe dichter y/n komt bij de onbekende
waarde van p
Random phenomena: overal waar kans een rol speelt
Random variables: uitkomst van random phenomena
Probability distribution: lijst met uitkomsten (sample space) en lijst met kansen
Definitie Laplace: kans op een gebeurtenis = aantal uitkomsten in die gebeurtenis / totaal
aantal mogelijke uitkomsten
Statistische gebeurtenissen: complement van a, a met streepje (tegenovergestelde) = alle
uitkomsten waarbij a niet gebeurt , de uni van A en B = alle uitkomsten waarbij A gebeurt of
, B of allebei , als A en B niet overlappen = mutally exclusive / disjoint , intersection = alle
uitkomsten die zowel in A als in B zitten
Complement regel: kans op complement van a = 1 - kans op a
TUTORIAL 3
Multiplication law: 50% kans op een en 50% kans op ander is dus 25% kans. Als de
gebeurtenissen independent zijn. Kans op A en B = kans op A x kans op B
Addition law: als er twee dezelfde kansen zijn, mag je die fracties bij elkaar optellen. 0,25 +
0,25 = 0,5. Dit is als de gebeurtenissen disjoint of mutually exclusive zijn. Kans op A of B of
allebei = kans op A + kans op B.
General addition law: als men bijv. een laptop en een fiets heeft, tel je de dubbeltellingen 1
keer van de kans af. De kans op A of B of allebei = kans op A + kans op B – kans op
dubbeltellingen
Complement rule = kans dat iets niet gebeurt = 1 – de kans dat het wel gebeurt.
Expectation of a variable: E(y) = (wat je verwacht wat er uiteindelijk gebeurt) uitkomsten x de
kans dat die uitkomst optreedt. Dit allemaal bij elkaar optellen
Variance of y: Var(y) = ( mogelijke uitkomst – E(y))2 x bijbehorende kans op die uitkomst,
alles bij elkaar optellen
TUTORIAL 4
Binomial distribution: binomial coëfficiënt x kans op succes (tot de macht aantal successen)
x kans op mislukking (tot de macht aantal mislukkingen)
Binomial coefficient: n! / k! (n-k)! n= totale aantal getallen k= aantal successen
Binomial situation: je moet ‘n’ trekkingen hebben, onafhankelijk, elke trekking is of succes
of mislukking (dus ja/nee situatie), kans op succes moet in elke trekking hetzelfde zijn.
Verwachte waarde aantal successen = aantal trekkingen x kans
Variantie hierbij = (aantal trekkingen x kans) x (1-kans)
Standaard deviatie is de wortel van de variatie
Sampling fraction : aantal successen / aantal trekkingen = kans op succes
Variantie hierbij= kans x (1-kans) / aantal trekkingen. Standaard deviatie is wortel
Sampling fraction is een consistente schatter geeft uiteindelijk de echte kans weer.
Null hypothesis: er is niks aan de hand, geen verschil, hetgeen wat er getoetst wordt,
tegenovergestelde van de alternatieve hypothese.
Alternative hypothesis: stelling die je hoopt aan te tonen/te onderzoeken
TUTORIAL 5
Randomization + onafhankelijke waarnemingen zijn belangrijk in een design
N = sample size, y= control sample, π =kans, y ~ B(n, π )
Verwachte aantal n x π
Test statistic = y = bijv ‘aantal roofmijten dat kiest voor de geur’
Hypothese toets:
1. Opstellen van null en alternatieve hypothese H0 : π = 0.5 HA : π > 0.5
2. Omschrijf de test statistic (TS) y= aantal roofmijten dat kiest voor de geur
3. Verdeling van de TS als we uitgaan van de null hypothese y ~ Bin(100,0.5)
4. Schets de verdeling van TS als H0 uitgangspunt grafiekje !!!
5. Waarde / uitkomst TS y = 60
6. Bereken de p-waarde, kans op de TS of extremer p(y ≥ 60) = 0.0284
7. Formuleren conclusie 1. Vergelijk p-waarde met alpha 0.0284 < 0.05 2. Besluit H0
rejected of niet verwerp H0 3. Schrijft uit in woorden van Ha Er is aangetoond dat
roofmijten voorkeur voor de geur hebben. Gebruik de woorden van Ha & H0!