Samenvatting: statistiek
H1: Samenvatten en representeren van Data
1.1 verschillende soorten data
Kwalitatieve data
Het hier om een beperk aantal uitkomstcategorieën die niet numeriek zijn.
Een vb: kleur, man/vrouw, dood/levend,….
Al deze gegevens kunnen geplaatst worden in een categorisch systeem.
Eenvoudigste voorbeeld: dichotomie= een categorisch systeem met 2 categorieën (man/vrouw).
Als men meer dan 2 categorieën heeft:
- Niet geordende categorische systemen (nominale data)
- Geordende categorische systemen (ordinale data)
Nominale data: bloedgroepen A, B, AB, O
Ordinale data: ernstig, matig, goed
Kwantitatieve data
Dit zijn gegevens die een hoeveelheid uitdrukken en verkregen worden door meten, wegen,….
Dit zijn numerieke data en kan onderverdeeld worden:
- Discreet
- Continu
Het is discreet als de observaties van die uitgedrukt worden door gehele getallen.
Vb: aantal hartslagen, aantal zwangerschappen,…
Als het continu is kan de observatie elk numerieke waarde aannemen.
Vb: bloeddruk, lengte, gewicht,…
1.2 Voorstellen van data
Frequentietabel voor categorische systemen
Elk categorie van het systeem opschrijven en d.m.v. turven bepalen hoe dikwijls
elke categorie voorkomt, zo bekomen we de frequentie van elke categorie.
Frequentietabel voor discrete data
Wanneer we n gegevens hebben, worden deze in een niet-dalende volgorde
Xi Fi
gerangschikt.
8 1
➔ Gerangschikte tabel
10 1
Een grafische voorstelling van de frequentietabel is een staafdiagram. 11 2
12 4
14 1
15 1
Totaal 10
,Frequentietabel voor continue data
Overzichtelijk door een frequentietabel met klassenindeling
Werkwijze:
1. Zoek de grootste en kleinste gegevens (afgerond)
2. Feitelijke grootste en kleinste gegevens
3. Bereken het verschil tussen de feitelijke extreme waarden
4. Deel dit door uw intervallen (gekozen: 10, 20, …)
5. Uitkomst is de klassenbreedte
Klassengrenzen= zijn de feitelijke kleinste en grootste grens van een klasse, de onder- en bovengrens
worden niet bereikt.
Klassebreedte= het verschil tussen de grootste en de kleinste klassengrens van een klasse.
Klassenmidden= de helft van de som van de grootste en kleinste klassengrens van een klasse.
Klassenfrequentie= de klassenfrequentie fi van de i-de klassen is het aantal waarnemingsgetallen dat
tot deze klasse behoort. De getallen fi vindt men door te turven.
1.3 Data resumeren
Kengetallen voor locatie
De plaats van waar de observaties zicht bevinden zijn van belang.
Gemiddelde: om het centrum van een dataset te kenmerken kan men gebruik maken van een
gemiddelde.
𝑛
1
𝑓𝑜𝑟𝑚𝑢𝑙𝑒: 𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
Het gemiddelde wordt sterk beïnvloed door uitschieters -> mediaan
Mediaan: een rij van numerieke gegevens van groot naar klein gerangschikt en het mediaan is:
- Het middelste (oneven getallen)
- Gemiddelde van 2 middelste getallen (even getallen)
Een uitbreiding van het mediaan zijn de kwartielen.
Elke observatie in een geordende rij heeft een rangnummer.
niet-gehele rangnummers worden als volgt gedefinieerd:
𝑥(𝑖) + 𝑝(𝑥(𝑖+1) − 𝑥𝑖 )
rangnummers:
𝑛+1
- Eerste kwartiel (Q1): 4
𝑛+1
- Tweede kwartiel (Q2)/mediaan: 2
𝑛+1
- Derde kwartiel (Q3): 3 4
,Kengetallen voor spreiding
Een spreiding kan verschillende variabiliteit.
De variantie en de standaardafwijking
1
de variantie s2 van de numerieke gegevens: 𝑠 2 = ∑𝑛 (𝑥 − 𝑥̅ )2
𝑛−1 𝑖=1 𝑖
(177−200)2 +⋯.+(226−200)2
vb: 𝑠 2 = = 340
4
1
de standaardafwijking s van de numerieke gegevens: 𝑠 = √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
vb: 𝑠 = √340 = 18.4
het bereik van de numerieke gegevens: 𝑏𝑒𝑟𝑒𝑖𝑘 = 𝑚𝑎𝑥1≤𝑖≤𝑛 𝑥𝑖 − 𝑚𝑖𝑛1≤𝑖≤𝑛 𝑥𝑖 = 𝑥𝑛 − 𝑥1
vb: bereik = 226 − 177 = 49
de interkwartielafstand van numerieke gegevens: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 𝑄3 − 𝑄1
vb: 𝑖𝑛𝑡𝑒𝑟𝑘𝑤𝑎𝑟𝑡𝑖𝑒𝑙𝑎𝑓𝑠𝑡𝑎𝑛𝑑 = 17 − 9.75 = 7.25
De box-plot
De box-plot is een eenvoudige grafische samenvatting van enkele belangrijke kengetallen.
Opmerkingen:
1. De box-plot laat toe sommige belangrijke kengetallen van de dataset onmiddellijk af te lezen
2. Symmetrie of scheefheid direct af te lezen
3. Kan worden gebruikt om 2 of meerdere datasets te vergelijken
, H2: kansen
2.1 universum en gebeurtenissen
Het universum van een experiment is de verzameling van alle mogelijke uitkomsten van dit
experiment.
Regels:
- 𝐴𝑐 = 1 − 𝐴 (compliment)
- 𝐴1 ∩ 𝐴2 (doorsnede, “en”)
- 𝐴1 ∪ 𝐴2 (unie, “of”)
Deelverzamelingen van een universum zullen wij in het vervolg gebeurtenissen
2.2 het intuïtieve begrip kans
noemen.
Kans bij de eerste benadering.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑔𝑢𝑛𝑠𝑡𝑖𝑔𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛 𝑣𝑜𝑜𝑟 𝐴
De formule: 𝑃(𝐴) = 𝑎𝑎𝑛𝑡𝑎𝑙 𝑚𝑜𝑔𝑒𝑙𝑖𝑗𝑘𝑒 𝑔𝑒𝑣𝑎𝑙𝑙𝑒𝑛
Dit geldt alleen voor een eerlijke kanswaarde (eerlijke dobbelsteen,…)
Kans bij de tweede benadering
Hierbij gaan we op voorhand onderstellingen opstellen: bij zoveel keer komen we zoveel keer dit uit.
𝑛(𝐴)
De formule: 𝑃(𝐴) = lim
𝑛→∞ 𝑛
Deze is algemener dan de eerste benadering maar het nadeel hieraan is dat deze oneindig lang moet
worden uitgevoerd. Dus stellen we axioma’s in.
De axiomatische definitie is de enige die een correcte voldoening geeft aan een kanstheorie.
2.4 voorwaardelijke kans
Voorwaardelijke kans
De voorwaardelijke kans van een gebeurtenis A, gegeven dat een gebeurtenis B is gegeven:
𝑃(𝐴∩𝐵)
Formule: 𝑃(𝐴/𝐵) = 𝑃(𝐵)
Hieruit kunnen we andere regels van uit afleiden:
𝑃(𝐴∩𝐵)
1. 𝑃(𝐵/𝐴) = 𝑃(𝐴)
2. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴/𝐵)𝑃(𝐴)
3. 𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵/𝐴)𝑃(𝐵)
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper SD100. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,99. Je zit daarna nergens aan vast.