Met deze samenvatting heb ik in de eerste zit meteen een 14/20 gehaald, het vat alle theorie samen die je moet kennen voor je oefeningen en de eventuele theoretische vragen die op het examen komen.
Iets verder in de samenvatting kan je uitgeschreven voorbeelden terug vinden, die er voor zorgen d...
, 1. Gezamelijke kansmassa, kansdichtheid, kansverdeling .................................................... 12
2. Marginale kansverdeling ................................................................................................ 12
3. Voorwaardelijke kansverdelingen ................................................................................... 12
3.1. Voorwaardelijke kansdichtheid ..................................................................................................... 12
3.2. Voorwaardelijke kansmassa .......................................................................................................... 12
3.3. Voorwaardelijke cumulatieve verdeling ........................................................................................ 13
3.4. Wet van totale kans ...................................................................................................................... 13
3.5. Regel van Bayes ............................................................................................................................. 13
4. onafhankelijkheid .......................................................................................................... 13
5. verwachtingswaarden bij toevalsvectoren ...................................................................... 13
6. Transformatie van toevalsvectoren ................................................................................. 14
6.1. Lineaire transformaties ................................................................................................................. 14
6.2. Sommen van onafhankelijke toevalsveranderlijken; convolutie .................................................. 15
6.3. Extremen van toevalsvectoren, orde-statistieken ........................................................................ 16
7. De multivariate normale verdeling.................................................................................. 16
7.1. De bivariate normale verdeling ..................................................................................................... 16
7.2. De multivariate normale verdeling ............................................................................................... 18
7.3. Marginale en voorwaardelijke verdelingen .................................................................................. 19
7.4. Lineaire transformaties van normale toevalsvectoren ................................................................. 19
H5: limietstellingen ......................................................................................................... 20
1. Wet van de grote aantallen ............................................................................................ 20
2. Centrale limietstelling .................................................................................................... 20
2.1. Interpretatie .................................................................................................................................. 20
H6: beschrijvende statistiek ............................................................................................ 21
1. Indeling van gegevens .................................................................................................... 21
1.1. Categorische variabelen/kwalitatieve variabelen ......................................................................... 21
1.2. Numerieke variabelen/ kwantitatieve variabelen ......................................................................... 21
2. Grafische methoden en tabellen ..................................................................................... 22
2.1. Frequenties weergeven ................................................................................................................. 22
2.2. Discrete variabalen en naalddiagrammen .................................................................................... 22
2.3. Stengel- en bladdiagram ............................................................................................................... 22
2.4. Histogram en frequentiepolygoon ................................................................................................ 23
2.5. Puntenwolken ............................................................................................................................... 23
3. Beschrijvende kengetallen van een steekproef ................................................................ 23
3.1. Kengetallen van ligging.................................................................................................................. 23
3.2. Kengetallen van spreiding ............................................................................................................. 24
3.3. Kengetallen van scheefheid .......................................................................................................... 25
3.4. Kengetallen van samenhang tussen steekproeven ....................................................................... 26
3.5. Boxplots ......................................................................................................................................... 27
H7: steekproeven ............................................................................................................ 27
1. Steekproef en populatie ................................................................................................. 27
2. Kenmerken van een goede steekproef ............................................................................ 28
H8: puntschatters ........................................................................................................... 29
1. Parameters en schatters ................................................................................................. 29
2. Criteria voor schatters .................................................................................................... 29
, 2.1. Vertekening (schat de formule wel wat we willen schatten?) ...................................................... 29
2.2. Variantie (geeft ons informatie over hoe nauwkeurig de schatter is) .......................................... 30
2.3. Gemiddelde kwadratische fout (efficiëntie, doeltreffendheid) .................................................... 31
2.4. Asymptotische criteria .................................................................................................................. 31
3. Methodes om schatters op te stellen .............................................................................. 32
3.1. De methode der momenten (MME) ............................................................................................. 33
3.2. De methode van maximale aannemelijkheid (MLE) ..................................................................... 33
H9: Intervalschatters....................................................................................................... 36
1. Betrouwbaarheidsinterval voor populatiegemiddelde van een normale
toevalsveranderlijke met bekende standaardafwijking (𝝈𝟐𝒊𝒔 𝒈𝒆𝒌𝒆𝒏𝒅, 𝝁 𝒊𝒔 𝒐𝒏𝒈𝒆𝒌𝒆𝒏𝒅) ........ 36
2. Betrouwbaarheidsinterval voor standaardafwijking ........................................................ 37
2.1. De Chi-kwadraat-verdeling (𝜒2) .................................................................................................... 37
2.2. De verdeling van de variantieschatter bij een onbekend gemiddelde .......................................... 38
2.3. Betrouwbaarheidsinterval voor populatievariantie ...................................................................... 39
3. Betrouwbaarheidsinterval voor populatiegemiddelde met onbekende standaardafwijking,
zowel gemiddelde als variantie zijn ongekend ......................................................................... 40
3.1. De student-t-verdeling .................................................................................................................. 40
3.2. Gebruik van de student-t-verdeling in betrouwbaarheidsintervallen .......................................... 40
4. Betrouwbaarheidsinterval voor de verhouding van twee populatievarianties .................. 42
4.1. De Fisher-F-verdeling .................................................................................................................... 42
4.2. Gebruik van de Fisher-F-verdeling in betrouwbaarheidsintervallen (optellen van een
betrouwbaarheidsinterval) .......................................................................................................................... 42
5. Benaderend betrouwbaarheidsinterval voor proporties .................................................. 43
6. minimale steekproefomvang voor betrouwbaarheidsintervallen (zie cursus) ....................... 43
H10: Hypothesetoetsen ................................................................................................... 44
1. Inleidend voorbeeld ....................................................................................................... 44
2. Formalisering en verdere begrippen................................................................................ 44
2.1. Het significantieniveau .................................................................................................................. 44
2.2. Aanvaardings-en verwerpingsgebied ............................................................................................ 45
2.3. Sterk besluit en zwak besluit ......................................................................................................... 45
2.4. Data snooping ............................................................................................................................... 46
2.5. Stappenplan voor het toetsen van hypothesen ............................................................................ 46
2.6. Het onderscheidingsvermogen ..................................................................................................... 46
2.7. Het verband tussen hypothesetoetsen en betrouwbaarheidsintervallen .................................... 47
3. Toetsen op parameters van 1 populatie .......................................................................... 48
3.1. Toetsen op populatiegemiddelden van normale veranderlijke bij onbekende 𝜎2 ....................... 48
3.2. Toetsen op variantie...................................................................................................................... 48
3.3. Toetsen op proporties ................................................................................................................... 49
4. Vergelijken van twee populaties ..................................................................................... 50
4.1. Vergelijken van gemiddelden van normaal verdeelde populaties ................................................ 50
4.2. Gepaarde toetsen .......................................................................................................................... 51
4.3. Vergelijken van varianties ............................................................................................................. 51
5. Toetsen op het volledige model ...................................................................................... 51
5.1. Grafische hulpmiddelen ................................................................................................................ 52
5.2. Aanpassingstabellen (goodness-of-fit) .......................................................................................... 53
1. Discrete toevalsveranderlijken
Een discrete toevalsveranderlijken kan enkel geïsoleerde waarden aannemen, dat wil
zeggen, een eindig aantal of een oneindig, maar wel aftelbaar aantal waarden. Met aftelbaar
bedoelt men dat de waarden geassocieerd kunnen worden met de getallen 1,2,3,…
→ Bijvoorbeeld, het aantal klanten in de winkel
1.1. Kansmassafunctie
De kansmassafunctie geeft voor iedere mogelijke waarde x die een discrete
toevalsveranderlijke kan aannemen de kans dat die waarde wordt aangenomen
→𝑝𝑋(𝑥) = 𝑃(𝑋 = 𝑥)
De eigenschappen:
- 0 ≤ 𝑝𝑋(𝑥) ≤ 1
- ∑𝑥 𝑝𝑋(𝑥) = 1
1.2. Cumulatieve verdelingsfunctie
De cumulatieve verdelingsfunctie geeft voor iedere reële waarde x de kans dat X kleiner of
gelijk is aan x
→𝐹𝑋(𝑥) = 𝑃(𝑋 ≤ 𝑥)
De eigenschappen:
- 0 ≤ 𝐹𝑋(𝑥) ≤ 1
2. Continue toevalsveranderlijken
Een continue veranderlijke kan een continuüm van waarden aannemen
→ Bijvoorbeeld, de maximumtemperatuur van morgen. (Deze kan zowel komma getallen,
als negatieve getallen aannemen.)
2.1. Kansmassafunctie
De kansmassafunctie bestaat NIET voor een continue toevalsveranderlijken, dit is heel
logisch want de kans dat de maximumtemperatuur morgen exact 2,534°C wordt is gelijk
aan nul.
→𝑝𝑋(𝑥 = 2,534) = 0
2.2. Cumulatieve verdelingsfunctie
De cumulatieve verdelingsfucntie geeft voor iedere reële waarde x de kans dat X kleiner of
gelijk is aan x.
→ 𝐹𝑋(𝑥) = 𝑃(𝑋 ≤ 𝑥)
De eigenschappen
- FX(x) is een stijgende (of alleszins niet-dalende), positieve functie, met waarden
kleiner dan 1
- lim 𝐹𝑋(𝑥) = 0
𝑥→−∞
- lim 𝐹𝑋(𝑥) = 1
𝑥→∞
- 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝐹𝑋(𝑏) − 𝐹𝑋(𝑎)
, 2.3. Kansdichtheidsfunctie
We hebben gezien dat het voor een continue toevalsveranderlijke X onmogelijk is dat de
kans gelijk aan x, groter is dan 0. Maar we kunnen wel inzien dat sommige waarden een
grotere kans hebben om ‘ongeveer’ voor te komen dan anderen. Om dit uit te drukken,
kijken we hoe snel de waarde van de cumulatieve verdeling FX(x) toeneemt als x een
beetje toeneemt.
→ Voorbeeld: een auto die een bepaalde snelheid heeft
De afgelegde afstand op een punt in de tijd is nul. (= kansmassafunctie, kans dat die op die
tijd x km heeft afgelegd)
Maar in de buurt van dat tijdspunt neemt de totale afgelegde afstand wel toe, die
toename per tijdseenheid is precies de snelheid.
→ 𝑓𝑋(𝑥) = 𝐹′𝑋(𝑥)
De eigenschappen
𝑥 ∞
- 𝐹𝑋(𝑥) = ∫−∞ 𝑓𝑋(𝑢)𝑑𝑢 → ∫−∞ 𝑓𝑋(𝑢)𝑑𝑢 = 1
𝑏
- 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) = 𝐹𝑋(𝑏) − 𝐹𝑋(𝑎) = ∫𝑎 𝑓𝑋(𝑥)𝑑𝑥
2.4. Kwantielfunctie en kwantielen
De kwantielfunctie is de inverse functie van de cumulatieve verdelingsfunctie. Ze geeft
voor elk getal tussen 0 en 1 weer hoe groot de waarde van x𝛼 zodat X met de kans 𝛼
onder die waarde ligt.
→𝑄𝑋(𝛼) = 𝑥𝛼 ⇔ 𝐹𝑋(𝑥𝛼) = 𝛼
- Mediaan=med(X)=QX(0,5)
- Benedenkwartiel=QX(1/4) 𝑄𝑋(𝛼) = 𝑥𝛼 ⇔ 𝐹𝑋(𝑥𝛼) = 𝛼
- Bovenkwartiel= QX(3/4)
3. Gemengde toevalsveranderlijken
Soms is een toevalsveranderlijke een beetje discreet en een beetje continu.
→ Voorbeeld 1: de hoeveelheid neerslag morgen. De kans dat er precies 3;152 liter
neerslag valt, is natuurlijk nul. Maar de kans dat er precies 0 liter neerslag valt, is echter
niet nul: er is namelijk een kans dat het niet regent, maar als het wel regent, dan is de
hoeveelheid continu verdeeld
→ Voorbeeld 2: de individuele wachttijd van een auto bij een verkeerslicht: als het licht op
groen staat, is de wachttijd exact nul, anders is de wachttijd uniform verdeeld op het
interval (0, t) waarbij t de duur van rood is bij dat verkeerslicht.
4. Verwachte waarde en variantie
4.1. Verwachte waarde
Als we de kansverdeling kennen, kunnen we berekenen wat de gemiddelde of verwachte
waarde is van X. Notatie verwachte waarde: E(X) of 𝜇𝑋
Discrete toevalsveranderlijken 𝜇𝑋 = 𝐸(𝑋) = ∑ 𝑥𝑝𝑋(𝑥)
𝑥
∞
Continue toevalsveranderlijken
𝜇𝑋 = 𝐸(𝑋) = ∫ 𝑥𝑓𝑋(𝑥)𝑑𝑥
−∞
, 4.1.1. Wanneer we niet de verwachte waarde van X, maar van W=w(X) willen weten
- X= uitslag van een spel
- W= de bijhorende winst
- W=w(X)= wanneer we uitslag X hebben, is W de winst
∞
→ 𝐸(𝑤(𝑋)) = ∫−∞ 𝑤(𝑥)𝑓𝑋(𝑥)𝑑𝑥
4.1.2. Verwachte waarde van een lineaire functie
→ 𝐸(𝑎𝑋 + 𝑏) = 𝑎 · 𝐸(𝑋) + 𝑏
4.2. Variantie en standaarddeviatie
De variantie is een maat voor de spreiding van een reeks waarden, dat wil zeggen de mate
waarin de waarden onderling verschillen.
→𝑣𝑎𝑟(𝑋) = 𝜎 2 𝑋 = 𝐸[(𝑋 − 𝜇𝑋)2 ]
Discrete toevalsveranderlijken 𝑣𝑎𝑟(𝑋) = ∑(𝑥 − 𝜇𝑋)2 𝑝𝑋(𝑥)
𝑥
∞
Continue toevalsveranderlijken
𝑣𝑎𝑟(𝑥) = ∫ (𝑥 − 𝜇𝑋)2 𝑓𝑋(𝑥)𝑑𝑥
−∞
De standaarddeviatie is de maat van schommelingen rond het gemiddelde, hoe groter de
variantie, hoe meer onzekerheid over het gemiddelde.
→𝜎𝑋 = √𝑣𝑎𝑟(𝑋)
4.3. De coëfficiënt van variatie
De coëfficiënt van variatie vergelijkt de standaarddeviatie rond een gemiddelde met het
gemiddelde zelf.
Hij is vooral belangrijk in situaties waar geldt: “hoe meer signaal, deste sterker ook de
fluctuaties), dus waar gemiddelde en variantie met elkaar verwerven zijn. (= de ruis wordt
als het ware vermenigvuldigd met het signaal)
𝜎𝑋
→ 𝑐. 𝑜. 𝑣. (𝑋) = 𝜇𝑋
4.4. Hogere orde momenten
Met behulp van momenten worden begrippen uit de beschrijvende statistiek
als gemiddelde, variantie, scheefheid en symmetrie bepaald. Een kansverdeling wordt
uniek vastgelegd door zijn momenten, mits deze bestaan.
→ Hogere orde momenten: 𝜇𝑘 = 𝐸(𝑋 𝑘 )
~
→ De centrale momenten: 𝜇 𝑘 = 𝐸[(𝑋 − 𝜇𝑥)𝑘 ]
Door te centraliseren wordt ervoor gezorgd dat het k-de centrale moment niet van lagere orde
momenten afhangt: het eerste centrale moment is per definitie nul, het tweede centrale
moment is
4.5. Scheefheid en symmetrie
𝐸[(𝑋−𝜇)3 ]
De scheefheid van een verdeling: 𝛾 = 𝜎3
- 𝑎𝑙𝑠 𝛾 > 0, 𝑖𝑠 𝑑𝑒 𝑣𝑒𝑟𝑑𝑒𝑙𝑖𝑛𝑔 𝑟𝑒𝑐ℎ𝑡𝑠𝑠𝑐ℎ𝑒𝑒𝑓
- 𝑎𝑙𝑠 𝛾 < 0, 𝑖𝑠 𝑑𝑒 𝑣𝑒𝑟𝑑𝑒𝑙𝑖𝑛𝑔 𝑙𝑖𝑛𝑘𝑠𝑠𝑐ℎ𝑒𝑒𝑓
,H3: kansmodellen
1. Discrete kansmodellen
1.1. 3 eenvoudige modellen
- Ontaarde of deterministische verdeling
Een ontaarde of deterministische verdeling in a voldoet aan P(X=a)=1 en alle andere
waarden hebben kans 0. De cumulatieve verdelingsfunctie: FX(x)= 0 voor x<a en FX(x)=1
voor x ≥a.
→ E(X)=a
→Var(X)=0
- Bernoulli- of binaire verdeling
p=P(X=1)
- Uniforme of homogene verdeling
Als we ons beperken tot uniforme verdelingen op gehele getallen, dan zijn er 2
parameters, namelijk l, het kleinste getal dat kan voorkomen en m, het grootste getal dat
1
kan voorkomen. 𝑝𝑋(𝑖) = (𝑚−𝑙+1) 𝑒𝑛 𝑃(𝑋 = 𝑥) = 0 𝑎𝑛𝑑𝑒𝑟𝑠
1.2. Binomiaalverdeling
X is binomiaal verdeeld als X het aantal successen is bij n onafhankelijke pogingen van een
Bernoulli-experiment met onveranderlijke succeskans P.
X-bin(n,p)
→ Kansmassafunctie, zoekt het aantal k successen.
1.3. De hypergeometrische verdeling
De binomiaalverdeling veronderstelt onafhankelijke Bernoulli-experimenten met
onveranderlijke succeskans. In andere situaties verandert de succeskans wel van poging
tot poging. (Bv: lotto-trekking, als na een trekking het element, succesvol of niet, niet
teruggelegd wordt. Verandert de verhouding succesvolle elementen in de volgende
trekking)
→ n= # pogingen
→ X= # successen bij n pogingen
→ N= populatiegrootte bij het begin
→ M= het # succesvolle elementen in de populatie bij het begin.
1.4. De negatief-binomiale en geometrische verdeling
De binomiale en hypergeometrische verdeling beschrijven het toevalsafhankelijk aantal
successen in een vast aantal, onafhankelijke herhalingen van Bernoulli-experimenten. De
negatief-binomiale en geometrische verdeling beschrijven het toevalsafhankelijk aantal
onafhankelijke herhaling tot een vast aantal successen.
→ Negatief-binomiale verdeling (met r= # successen)
→ Geometrische verdeling (met r=1)
, 1.5. Poisson-verdeling
De Poisson-verdeling telt het aantal aankomsten, gebeurtenissen binnen een vast
tijdsbestek van een Poisson-proces. Het is de kansverdeling van het aantal aankomsten
binnen een vaste tijdsspanne.
→Vb: aantal schadeclaims bij een verzekeringsmaatschappij per jaar
Het aantal bezoekers op een webpagina (niet het aantal hits)
2. Continue kansmodellen
2.1. De continue uniforme verdeling
Net zoals in het discrete geval, heeft de continue uniforme verdeling twee parameters, a
en b, begin- en eindpunt van het interval waarbinnen de toevalsveranderlijke altijd ligt.
→ Dichtheidsfunctie van een uniforme verdeling op (3, 8)
2.2. De exponentiële verdeling
De exponentiële verdeling is de verdeling van de wachttijd T op de eerste aankomst in een
Poisson-proces, dus, bijvoorbeeld de tijd die een winkelier moet wachten op zijn eerste
klant.
→ Deze verdeling heeft geen geheugen (= als de levensduur van een apparaat
exponentieel verdeeld is, betekent dit dat het apparaat enkel door toevallige pech stuk
gaat, niet door afslijting. Als een wachttijd exponentieel verdeeld is, dan betekent dit dat
de wachttijd op de eerste klant= de wachttijd na de 5de tot de 6de klant.)
→ Dichtheidsfunctie van een exponentiële verdeling met 𝜆 = 2
2.3. De erlang-verdeling
De wachttijd tot de rde aankomst in een Poisson-proces is Erlang verdeeld. De tijd tussen
de nde en n+rde aankomst is natuurlijk eveneens Erlang verdeeld.
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller LauraPauwelsKUL. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $14.55. You're not tied to anything after your purchase.