Tutorial 1
Statistiek
Begint bij je onderzoeksvraag
Definiëren van je populatie
o Zwangere vrouwen
o Je onderzoekt een deel van deze populatie, steekproef/sample
Deze definities in de samenvatting!
Unit, elementen in de populatie waar je informatie over wil vergaren, steekproef bestaat uit
een aantal units
Variabele, het ding dat je gaat meten bij de units
o Kwantitatief, met getallen weer te geven
Continuous, meten
Discreet, tellen
o Kwalitatief, niet met getallen weer te geven
Nominaal, kan je niet rangschikken
Ordinaal, (order) kan je rangschikken
Een steekproef trekken
o De steekproef die je trekt heeft invloed op de conclusie die je vervolgens kunt trekken
over de populatie
o Simple random sampling (SRS)
Elke steekproef van een bepaalde steekproef heeft een gelijke kans om getrokken
te worden
Relatief makkelijk
o Dingen die mis kunnen gaan:
Undersampling, mensen uitsluiten van de steekproef
Non-response, geen succesvol contact of geen deelname
Voluntary participation, de resultaten van de personen die niet mee willen doen
kunnen verschillen van de personen die wel mee willen doen
Response bias, niet eerlijk invullen van vragen
Observationeel/experimenteel onderzoek:
o Observationeel, je grijpt niet in op de situatie
o Experimenteel, ingrijpen op de situatie
Tutorial 2
Units, variables and study design
Mean, gemiddelde
o Formule:
o Gevoelig voor uitbijters
Mediaan, cijfer wat in het midden van de reeks zit
Standaardafwijking, s, variance
o Formule:
Interquartile range
o Niet gevoelig voor uitschieters
o Q1, eerste kwartiel, 25ste percentiel, 25 procent
o Bij aantal observaties rond je af naar boven (1,2 is de 2de observatie)
o Inter quartile range, IQR, Q3 - Q1
Five-number summary:
o Sample minimum
, o First quartile
o Median (second quartile)
o Upper quartile
o Sample maximum
Uitwerken in een boxplot
Frequentie -> probability
Law of large numbers, des te vaker je het experiment uitvoert, des te dichter de proportie bij
de echte kans komt
Random fenomeen, random variabele, variabele waarbij het resultaat kan variëren
o Discreet/continuos
o Nominaal/ordinaal (wel of niet)
Probability distribution
o De kans van iedere uitkomst van een random variabele
Relatieve frequentie
o Tabel (kansverdeling)
o Definitie van LaPlace
De kans dat een random unit uit de populatie een bepaalde eigenschap heeft, is
gelijk aan het aantal units dat de eigenschap heeft/het totaalaantal units
Verwachte waarde van p: p^ = y/n
Complement regel
o A = 1,3,5 dan is A complement (A met streepje) 2, 4, 6
o Union is dan 1,2,3,4,5,6
o Intersection is er niet, dus geen overlap, A en B zijn disjoint
Kenmerken van kansen
o P zit tussen 0 en 1
o P van de hele sample is altijd 1
o P van complement = 1 - P
Tutorial 3
Variantie
Formule:
o som(Observatie - gemiddelde)2/n-1 = S2
Rekenregels voor kansen
Productregel voor onafhankelijke kansen:
o P(A en B) = P(A) x P(B)
o Wanneer de uitkomst van deze vergelijking gelijk is aan de union (de kans dat iets in A
en/of B voorkomt) dan zijn ze onafhankelijk
Events die niet op dezelfde tijd voor kunnen komen zijn disjoint events
o P(A of B) = P(A) + P(B)
Union of two events (A B), zijn alle uitkomsten die bij A voorkomen en/of bij B
Intersection of two events (A B), zijn alle uitkomsten die bij A en B voorkomen
General addition law
o P(A of B) = P(A) + P(B) - P(A B)
o Kans dat A/B/AB voorkomen
o Kans op uitkomst A + kans op uitkomst B - kans op de uitkomst die in beide gevallen
wordt meegeteld
A = male passing on Y
B = female passing on y