Samenvatting: statistiek
H1: Samenvatten en representeren van Data
1.1 verschillende soorten data
Kwalitatieve data
Het hier om een beperk aantal uitkomstcategorieën die niet numeriek zijn.
Een vb: kleur, man/vrouw, dood/levend,….
Al deze gegevens kunnen geplaatst worden in een categorisch systeem.
Eenvoudigste voorbeeld: dichotomie= een categorisch systeem met 2 categorieën (man/vrouw).
Als men meer dan 2 categorieën heeft:
- Niet geordende categorische systemen (nominale data)
- Geordende categorische systemen (ordinale data)
Nominale data: bloedgroepen A, B, AB, O
Ordinale data: ernstig, matig, goed
Kwantitatieve data
Dit zijn gegevens die een hoeveelheid uitdrukken en verkregen worden door meten, wegen,….
Dit zijn numerieke data en kan onderverdeeld worden:
- Discreet
- Continu
Het is discreet als de observaties van die uitgedrukt worden door gehele getallen.
Vb: aantal hartslagen, aantal zwangerschappen,…
Als het continu is kan de observatie elk numerieke waarde aannemen.
Vb: bloeddruk, lengte, gewicht,…
1.2 Voorstellen van data
Frequentietabel voor categorische systemen
Elk categorie van het systeem opschrijven en d.m.v. turven bepalen hoe dikwijls
elke categorie voorkomt, zo bekomen we de frequentie van elke categorie.
Frequentietabel voor discrete data
Wanneer we n gegevens hebben, worden deze in een niet-dalende volgorde
Xi Fi
gerangschikt.
8 1
➔ Gerangschikte tabel
10 1
Een grafische voorstelling van de frequentietabel is een staafdiagram. 11 2
12 4
14 1
15 1
Totaal 10
,Frequentietabel voor continue data
Overzichtelijk door een frequentietabel met klassenindeling
Werkwijze:
1. Zoek de grootste en kleinste gegevens (afgerond)
2. Feitelijke grootste en kleinste gegevens
3. Bereken het verschil tussen de feitelijke extreme waarden
4. Deel dit door uw intervallen (gekozen: 10, 20, …)
5. Uitkomst is de klassenbreedte
Klassengrenzen= zijn de feitelijke kleinste en grootste grens van een klasse, de onder- en bovengrens
worden niet bereikt.
Klassebreedte= het verschil tussen de grootste en de kleinste klassengrens van een klasse.
Klassenmidden= de helft van de som van de grootste en kleinste klassengrens van een klasse.
Klassenfrequentie= de klassenfrequentie fi van de i-de klassen is het aantal waarnemingsgetallen dat
tot deze klasse behoort. De getallen fi vindt men door te turven.
1.3 Data resumeren
Kengetallen voor locatie
De plaats van waar de observaties zicht bevinden zijn van belang.
Gemiddelde: om het centrum van een dataset te kenmerken kan men gebruik maken van een
gemiddelde.
𝑛
1
𝑓𝑜𝑟𝑚𝑢𝑙𝑒: 𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
Het gemiddelde wordt sterk beïnvloed door uitschieters -> mediaan
Mediaan: een rij van numerieke gegevens van groot naar klein gerangschikt en het mediaan is:
- Het middelste (oneven getallen)
- Gemiddelde van 2 middelste getallen (even getallen)
Een uitbreiding van het mediaan zijn de kwartielen.
Elke observatie in een geordende rij heeft een rangnummer.
niet-gehele rangnummers worden als volgt gedefinieerd:
𝑥(𝑖) + 𝑝(𝑥(𝑖+1) − 𝑥𝑖 )
rangnummers:
𝑛+1
- Eerste kwartiel (Q1): 4
𝑛+1
- Tweede kwartiel (Q2)/mediaan: 2
𝑛+1
- Derde kwartiel (Q3): 3 4
,Kengetallen voor spreiding
Een spreiding kan verschillende variabiliteit.
De variantie en de standaardafwijking
1
de variantie s2 van de numerieke gegevens: 𝑠 2 = ∑𝑛 (𝑥 − 𝑥̅ )2
𝑛−1 𝑖=1 𝑖
(177−200)2 +⋯.+(226−200)2
vb: 𝑠 2 = = 340
4
1
de standaardafwijking s van de numerieke gegevens: 𝑠 = √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
vb: 𝑠 = √340 = 18.4
het bereik van de numerieke gegevens: 𝑏𝑒𝑟𝑒𝑖𝑘 = 𝑚𝑎𝑥1≤𝑖≤𝑛 𝑥𝑖 − 𝑚𝑖𝑛1≤𝑖≤𝑛 𝑥𝑖 = 𝑥𝑛 − 𝑥1
vb: bereik = 226 − 177 = 49
de interkwartielafstand van numerieke gegevens: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 𝑄3 − 𝑄1
vb: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 17 − 9.75 = 7.25
De box-plot
De box-plot is een eenvoudige grafische samenvatting van enkele belangrijke kengetallen.
Opmerkingen:
1. De box-plot laat toe sommige belangrijke kengetallen van de dataset onmiddellijk af te lezen
2. Symmetrie of scheefheid direct af te lezen
3. Kan worden gebruikt om 2 of meerdere datasets te vergelijken
, H2: kansen
2.1 universum en gebeurtenissen
Het universum van een experiment is de verzameling van alle mogelijke uitkomsten van dit
experiment.
Regels:
- 𝐴𝑐 = 1 − 𝐴 (compliment)
- 𝐴1 ∩ 𝐴2 (doorsnede, “en”)
- 𝐴1 ∪ 𝐴2 (unie, “of”)
Deelverzamelingen van een universum zullen wij in het vervolg gebeurtenissen
2.2 het intuïtieve begrip kans
noemen.
Kans bij de eerste benadering.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑔𝑢𝑛𝑠𝑡𝑖𝑔𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛 𝑣𝑜𝑜𝑟 𝐴
De formule: 𝑃(𝐴) = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑚𝑜𝑔𝑒𝑙𝑖𝑗𝑘𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛
Dit geldt alleen voor een eerlijke kanswaarde (eerlijke dobbelsteen,…)
Kans bij de tweede benadering
Hierbij gaan we op voorhand onderstellingen opstellen: bij zoveel keer komen we zoveel keer dit uit.
𝑛(𝐴)
De formule: 𝑃(𝐴) = lim
𝑛→∞ 𝑛
Deze is algemener dan de eerste benadering maar het nadeel hieraan is dat deze oneindig lang moet
worden uitgevoerd. Dus stellen we axioma’s in.
De axiomatische definitie is de enige die een correcte voldoening geeft aan een kanstheorie.
2.4 voorwaardelijke kans
Voorwaardelijke kans
De voorwaardelijke kans van een gebeurtenis A, gegeven dat een gebeurtenis B is gegeven:
𝑃(𝐴∩𝐵)
Formule: 𝑃(𝐴/𝐵) = 𝑃(𝐵)
Hieruit kunnen we andere regels van uit afleiden:
𝑃(𝐴∩𝐵)
1. 𝑃(𝐵/𝐴) = 𝑃(𝐴)
2. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵)𝑃(𝐴)
3. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵/𝐴)𝑃(𝐵)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller SD100. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.82. You're not tied to anything after your purchase.