Statistiek: analyse
HOODSTUK 1 T/M 10 + ARTIFICIAL INTELLIGENCE (inclusief H5,6,7 MOOC)
Examen:
- Combinatie theorie & praktijk
- Ligt meer nadruk op inzicht
- Alles wat in les gezien is
-------- = einde van les
HOOFDSTUK 1: basisbegrippen statistiek
Biologische systemen <-> deterministische systemen
Biologische systemen worden gekenmerkt door grote variabiliteit (stochastische systemen).
Wetmatigheden achterhalen in stochastische systemen is moeilijker.
Variabelen
- Kwalitatieve variabele
o Geordend
o Niet- geordend
- Kwantitatieve variabele: hoeveelheid (tellen, wegen, meten, …)
o Discreet
o Continu
Statische inferentie
➔ Doel: uitspraak over populatie of over het verschil tussen 2 of meerdere populaties op
basis van de kennis van een deel van de populatie.
Aselecte steekproef = elk element heeft dezelfde kans om in de steekproef voor te komen.
➔ Uitspraak over populatie
In de meeste gevallen in een steekproef niet aselect.
π = populatieparameter
N = populatie
n = steekproef
Signaal vs ruis
1e heeft meer ruis dan 2e
,Informatietype
Anekdotisch: wonderbaarlijke genezing, geen enkele waarheid
Observationele studie
- Verschillende variabelen worden geobserveerd
- Enkel associatie kan geclaimd worden, geen causaal verband
Gerandomiseerde studie
- At random interventie toekennen
- Causaal verband
Modellen in de wetenschap
Model is vereenvoudigde voorstelling van de realiteit.
Modellen zijn niet ‘juist’, maar meer of minder bruikbaar.
Verschillende onderverdelingen:
- Deterministisch vs stochastisch
- Beschrijvend vs verklarend
Deterministisch: zelfde input → zelfde output
➔ Perfect voorspelbaar
Descriptief: beschrijft verband tussen uitkomstvariabele en één of meer andere variabelen
zonder verklaring.
Verklarend: vertrekt vanuit biologische principes/ theorie om model op te zetten.
HOOFDSTUK 2: KANSREKENEN
Doel: het resultaat van een experiment is niet te voorspellen. Wel kan een model opgebouwd
worden dat de kans op een bepaald resultaat definieert.
Het universum Ω = de verzameling van alle mogelijke uitkomsten van een experiment.
Ω = {-,+,++,+++} of Ω = {(S),(M)} of Ω = {0,1,2,3…} of Ω = {(SSS), (MSS), (SMS), (MMS),
(MSM),(SMM),(MMM)}
Elementaire uitkomst = éen mogelijke uitkomst van het universum.
Gebeurtenis = deelverzameling van het universum.Deelverzameling A correspondeert met
het bezitten van eigenschap A. Complement AC correspondeert dan met het niet bezitten van
eigenschap A.
= lege verzameling van universum
Doorsnede van gebeurtenissen A1 en A2 = zowel A1 en A2
gaan op
Vereniging U van gebeurtenissen A1 en A2 = a1, A2 of
beiden gaan op
,Intuïtieve begrip kans
- Kansen bepaald vanuit een theoretisch model.
- Kansen bepaald voor een eindige populatie.
o Kans op een gebeurtenis A in populatie
▪ N(A) is aantal malen dat A optreedt in populatie
▪ N is totaal aantal elementen in populatie
P(A) = N(A)/N
- Kansen ‘geschat’ uit steekproef van oneindige populatie
o Kans op een gebeurtenis A in populatie kan geschat worden door relatieve
frequentie in de steekproef van grootte n door n(A)/n
o Hoe goed deze schatter is hangt af van de steekproefgrootte n en in de limiet
geldt:
Aftelbaar universum
Kans op elementaire uitkomst
- Neem aftelbaar universum
- Aan elke elementaire uitkomst wi is een getal pi geassocieerd zodat:
o pi > 0
o p1 + p2 + … = 1
Kans op gebeurtenis
- gebeurtenis A wordt gekarakteriseerd door deelverzameling A (A Ω)
- tel kansen pi op van elementaire uitkomsten in deelverzameling A, om de kans P(A)
te bepalen
, Somregel:
- Wat is de kans dat A of B (of beiden) zich voordoen?
Voorwaardelijke kans
- Wat is de kans dat A zich voordoet, gegeven dat B zich voordoet.
Onafhankelijke gebeurtenissen
- Gebeurtenissen A en B zijn afhankelijk als
- Kennis over B leert ons niets over A
Productregel:
- Als A en B onafhankelijk zijn dan wordt de kans dat A en B izch voordoen gegeven
door
- Immers
HOODSTUK 1 T/M 10 + ARTIFICIAL INTELLIGENCE (inclusief H5,6,7 MOOC)
Examen:
- Combinatie theorie & praktijk
- Ligt meer nadruk op inzicht
- Alles wat in les gezien is
-------- = einde van les
HOOFDSTUK 1: basisbegrippen statistiek
Biologische systemen <-> deterministische systemen
Biologische systemen worden gekenmerkt door grote variabiliteit (stochastische systemen).
Wetmatigheden achterhalen in stochastische systemen is moeilijker.
Variabelen
- Kwalitatieve variabele
o Geordend
o Niet- geordend
- Kwantitatieve variabele: hoeveelheid (tellen, wegen, meten, …)
o Discreet
o Continu
Statische inferentie
➔ Doel: uitspraak over populatie of over het verschil tussen 2 of meerdere populaties op
basis van de kennis van een deel van de populatie.
Aselecte steekproef = elk element heeft dezelfde kans om in de steekproef voor te komen.
➔ Uitspraak over populatie
In de meeste gevallen in een steekproef niet aselect.
π = populatieparameter
N = populatie
n = steekproef
Signaal vs ruis
1e heeft meer ruis dan 2e
,Informatietype
Anekdotisch: wonderbaarlijke genezing, geen enkele waarheid
Observationele studie
- Verschillende variabelen worden geobserveerd
- Enkel associatie kan geclaimd worden, geen causaal verband
Gerandomiseerde studie
- At random interventie toekennen
- Causaal verband
Modellen in de wetenschap
Model is vereenvoudigde voorstelling van de realiteit.
Modellen zijn niet ‘juist’, maar meer of minder bruikbaar.
Verschillende onderverdelingen:
- Deterministisch vs stochastisch
- Beschrijvend vs verklarend
Deterministisch: zelfde input → zelfde output
➔ Perfect voorspelbaar
Descriptief: beschrijft verband tussen uitkomstvariabele en één of meer andere variabelen
zonder verklaring.
Verklarend: vertrekt vanuit biologische principes/ theorie om model op te zetten.
HOOFDSTUK 2: KANSREKENEN
Doel: het resultaat van een experiment is niet te voorspellen. Wel kan een model opgebouwd
worden dat de kans op een bepaald resultaat definieert.
Het universum Ω = de verzameling van alle mogelijke uitkomsten van een experiment.
Ω = {-,+,++,+++} of Ω = {(S),(M)} of Ω = {0,1,2,3…} of Ω = {(SSS), (MSS), (SMS), (MMS),
(MSM),(SMM),(MMM)}
Elementaire uitkomst = éen mogelijke uitkomst van het universum.
Gebeurtenis = deelverzameling van het universum.Deelverzameling A correspondeert met
het bezitten van eigenschap A. Complement AC correspondeert dan met het niet bezitten van
eigenschap A.
= lege verzameling van universum
Doorsnede van gebeurtenissen A1 en A2 = zowel A1 en A2
gaan op
Vereniging U van gebeurtenissen A1 en A2 = a1, A2 of
beiden gaan op
,Intuïtieve begrip kans
- Kansen bepaald vanuit een theoretisch model.
- Kansen bepaald voor een eindige populatie.
o Kans op een gebeurtenis A in populatie
▪ N(A) is aantal malen dat A optreedt in populatie
▪ N is totaal aantal elementen in populatie
P(A) = N(A)/N
- Kansen ‘geschat’ uit steekproef van oneindige populatie
o Kans op een gebeurtenis A in populatie kan geschat worden door relatieve
frequentie in de steekproef van grootte n door n(A)/n
o Hoe goed deze schatter is hangt af van de steekproefgrootte n en in de limiet
geldt:
Aftelbaar universum
Kans op elementaire uitkomst
- Neem aftelbaar universum
- Aan elke elementaire uitkomst wi is een getal pi geassocieerd zodat:
o pi > 0
o p1 + p2 + … = 1
Kans op gebeurtenis
- gebeurtenis A wordt gekarakteriseerd door deelverzameling A (A Ω)
- tel kansen pi op van elementaire uitkomsten in deelverzameling A, om de kans P(A)
te bepalen
, Somregel:
- Wat is de kans dat A of B (of beiden) zich voordoen?
Voorwaardelijke kans
- Wat is de kans dat A zich voordoet, gegeven dat B zich voordoet.
Onafhankelijke gebeurtenissen
- Gebeurtenissen A en B zijn afhankelijk als
- Kennis over B leert ons niets over A
Productregel:
- Als A en B onafhankelijk zijn dan wordt de kans dat A en B izch voordoen gegeven
door
- Immers