Hoofdstuk 3 Distributions
1. Discrete
Gaat over random variabelen/stochasten die discrete waarden kunnen aannemen. Dit kan de
uitkomst zijn van een experiment.
A. Bernoulli verdeling
• 2 uitkomsten: 1 of 0 / + of - / lukt of lukt niet etc.
o Het is een binaire uitkomst
• som moet gelijk zijn aan 1 bv p=0.8, q = 0.2
B. Binomiaal verdeling
• Experimenten herhalen (Bern 1, Bern 2, …)
• Wat is de kans dat je meerdere keren 0 of 1 uitkomt, wat is de kans dat ik meerdere keren
succes heb?
• Experimenten zijn onafhankelijk van elkaar
• Als je de onafhankelijken van die bernoulli verdelingen bij elkaar zet dan krijg je een
binomiaal verdeling
• Heeft verband met de normaal-verdeling onder bepaalde voorwaarden
o De discrete uitkomsten moeten veelvuldig zijn, niet 4 of 5 uitkomsten maar heel veel
mogelijke uitkomsten maw dat je van een discrete situatie tendeert naar een
continue situatie.
▪ Bv een as i.p.v. daar een paar streepjes op te hebben heb je er heel veel en
dus heel veel mogelijke uitkomsten en ga je dus meer tenderen naar een
continue verdeling
2. Continue verdeling
A. Uniforme verdeling
• De getallen tussen a en b hebben even veel kans om voor te komen U(a,b)
• “digital” computers, de meest natuurlijke verdeling die er bestaat. Elke digitale computer kan
random getallen genereren bv in Excel
• In de natuur komt dit heel weinig voor maar we gebruiken die bij computers om random
getallen te simuleren
• Bv. WO2: op een bepaald moment waren de Duitsers zeer ver gevorderd, ze waren Rusland
binnen gevallen enzo maar dan begon het tij te keren en moesten ze aan 2 fronten beginnen
vechten etc. De vooruitgang ging minder goed dan verwacht en dan hadden ze tanks
ontwikkeld en de anderen hadden hier veel schrik van. Ze moesten schatten in welke mate
de Duitse industrie in staat was om die taks te produceren, ze konden dit niet gewoon gaan
meten maar ze konden wel gebruik maken van een fout die ze hadden gemaakt. Ze waren
heel stipt en noteerde alles, ze hadden dus ook in elke tank een serienummer geplaatst. Dus
af en toe ging een tank stuk ofzo en kon men zo’n tank bemachtigen en gaan kijken naar het
serienummer. Ze gingen ervan uit dat de steekproef die ze hadden van die tanks dat die
uniform verdeelt was. Ze hadden allemaal evenveel kans om door de geallieerden in beslag
genomen te worden. Dus als die uniform verdeeld is kan je die gebruiken om het
gemiddelde, de spreiding etc. te berekenen. Zo kon men een voorspelling maken over de
1
, productiecapaciteit van de Duitsers. Zo konden ze concluderen dat de Duitse industrie niet
voldoende tanks kon produceren dus ze moesten er eigenlijk geen schrik van hebben.
B. Normaal verdeling
• N (gemiddelde, variantie) → (µ, ²)
o µ bepaalt de positie op de horizontale as,en ² bepaalt de breedte van die normaal
verdeling
• Een computer kan rechtstreeks geen normaal verdeelde veranderlijke genereren ondanks
dat dit een fenomeen is dat in de natuur wel veel voorkomt
• Uniforme getallen optellen om tot de normaal verdeling te komen Ui → N
• Som van normaal verdelingen dan krijg je opnieuw een normaal verdeling want de som van
normalen blijft normaal Ni → N
C. Chi-kwadraat verdeling
• X²(n)
o Bestaat met 1 of met 2 parameters, dit is met 1
• Scheve verdeling
• Som van normale verdeling in het kwadraat is de chi-kwadraat verdeling Ni² → X²
o De som van dingen die chi-kwadraat verdeelt zijn
• Verdeling van de variantie
o Als we uitspraken over de variantie willen doen hebben we de chi-kwadraat nodig
o Var (Xi) = f ( (Xi – het gemiddelde)²)
▪ Als Xi normaal verdeeld is dan heb je de som van normaal verdeelde
veranderlijke in het kwadraat daarom is de variantie een chi-kwadraat
verdeling
D. T- verdeling
• Lijkt op de normaal verdeling maar heeft een hogere kurtosis dan normaal verdeling
o Kurtosis heeft te maken met de gepiektheid van de verdeling
• T-verdeling is een normaalverdeling met bijkomende onzekerheid
o Maar als die onzekerheid wegebt bv doordat het aantal observaties die je bekijkt er
heel veel zijn en je weet dat die dataset T verdeeld is dan gaat die T verdeling steeds
meer lijken op een normaal verdeling
• T verdeling convergeert naar een normaal verdeling als je naar oneindig observaties gaat
• N/ X² → t
o Dus als je een parameter berekent uit een regressiemodel waarvan je op voorhand
weet dat die normaal verdeeld is en je deelt die door de variantie van die parameter
dan heb je normaal gedeeld door chi-kwadraat dan is die verhouding een t-verdeling
E. F- verdeling (Fischer)
• Gebruiken als we 2 Chi-kwadraten hebben
• X²(n) / X²(m) → F (n,m)
o De verhouding van 2 varianties, de 2 delen door elkaar en de mate waarin die
uitkomst afwijkt van 1 geeft een verschil in kwaliteit
▪ bv. bij het vergelijken van 2 machines
2
,Hoofdstuk 4
Soort van referentie hoofdstuk, kan je opzoeken voor extra info
5.17: praktijk, toepassing van de theorie die ervoor staat
1. Limiet Theorema/ central limit theorem
• Uit de populatie een kleine steekproef trekken om een onderzoek te doen maar dit moet
gebeuren op een aselecte manier (random). Waarbij iedereen even veel kans heeft om in de
steek proef te zitten. Als je gewoon op de markt gaat staan en voorbijgangers gaat
aanspreken dan heb je geen aselecte steekproef want mensen die niet naar de markt gaan
kunnen hier al niet in opgenomen worden dus dan is dit niet aselect en niet representatief
voor de gehele populatie. Het is dus eigenlijk zeer moeilijk om een echte aselecte steekproef
te nemen. (bv bij verkiezingen te weten komen wat ze van jouw partij denken)
• Het gemiddelde van de populatie (µ) is wat we te weten willen komen, (de gemiddelde
mening van de populatie over mijn partij) kan je uitdrukken op een schaal van 1 tot 10 bv
hoe goed vind je onze partij
• Ook de standaard variatie ², de natuurlijke spreiding in de populatie
• In de steekproef heb je n observaties en is dus veel kleiner dan de gehele populatie
• Uit die steekproef kan je nu een gemiddelde berekenen
• In welke maten kan je het gemiddelde van de steekproef gebruiken om een uitspraak te
doen over de populatie. Ja je kan dit doen maar er is een bepaalde mate van afwijking.
• Meerdere keren een onafhankelijke steekproef trekken, na de eerste steekproef gaat
iedereen terug in de ‘pot’ dus je kan ook nog in een andere steekproef voorkomen
• Dus het is aselect en onafhankelijk van elkaar
• (x1,x2,x3,…) → N( µ, ²/n )
o (eigenlijk X streep, staat voor de gemiddeldes)
o Verwachting µ, variantie
3
, 5.9
Tabel 5.4
• Zie tabel in handboek
• µ = µ0 (µ0 is een getal)
o µ ≥ µ0
o µ < µ0
• Bij een opstelling van een probleem moet je altijd een hypothese opstellen
• H0 = nulhypothese
o µ < µ0
o Als nulhypothese neem ik aan wat ik eigenlijk niet hoop te bewijzen met ons
onderzoek
• HA = alternatieve hypothese
o µ ≥ µ0
o Je gaat deze pas aanvaarden als het bewezen is of dat de kans dat deze onwaar is
voldoende klein is
Tabel 5.5
• Je kan een alfa fout maken of een bèta fout maken of je kan een correcte uitspraak doen en
voor alle 3 de scenario’s is er een bepaalde waarschijnlijkheid
• 4 grafieken onder elkaar
o Grafiek 3: dopingcontrole
▪ Stel je onderzoekt iemand en zijn waarde zitten boven de norm dan ga je
hem beschuldigen van doping inname en de nulhypothese verwerpen maar
wat is de kans dat je iemand beschuldigt die eigenlijk geen doping heeft
ingenomen?
• Grijze oppervlakte → type 1 fout, je kan de drempel hoger instellen
zodat je da kans op de alfa fout vermindert. Deze drempel kan je zelf
zo hoog of zo laag maken als je wilt
o Grafiek 2
▪ Stel je onderzoekt iemand die doping heeft genomen maar die ligt niet
boven de drempel, wat is de kans dat dit voorkomt?
• Grijze oppervlakte→ type 2 fout, de drempel waarde opschuiven
naar links om de bèta fout te verlagen
o Probleem: evenwicht zoeken tussen de 2, je kan niet beide doen. Als je het ene
verkleint gaat het het andere vergroten
o Oplossing? Steekproef vergroten, als je meer observaties gaat doen dan gaat die
nauwkeuriger worden en de vorm van je verdeling gaat spitser worden. Dan gaat
vanzelf de alfa en bèta fout kleiner worden. Je moet zelfs de drempels niet
aanpassen. De breedte van die 2 normaalverdelingen moet kleiner worden.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller hwstudent1999. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.30. You're not tied to anything after your purchase.