Dit betreft een uitgebreide samenvatting van het vak Statistiek I (A) uit de eerste gemeenschappelijke bachelor TEW, EW & handelsingenieur van het academiejaar met formules inclusief. De samenvatting is gebaseerd op de zelfgeschreven cursus van Prof. dr. David Vyncke, de essentie van deze cursus v...
Statistiek I (A)
Hoofdstuk 1: Inleiding
1. Statistiek en kansrekening
Statistiek:
= wetenschap van verzamelen, voorstellen, analyseren & interpreteren van gegevens.
Hulpwetenschap voor geneeskunde, psychologie, economie, scheikunde...
Taal om wetenschappelijke resultaten van verschillende disciplines te communiceren
Populatie:
= Verzameling van elementen of objecten die we willen bestuderen.
Variabielie:
= Één kenmerk of eigenschap van een populate waarop we ons concentreren.
Waarde varieert van element tot element
Stieiekproief:
= Deelverzameling van populate die bestudeerd wordt: populate teeoneindig groot is.
Stieiekproiefgiegievienis:
= Concrete meetwaarden van de kenmerken
Bieischrijviendie istatistiek:
= Eerste stap binnen de statstek:
Inzichtelijk voorstellen van de gegevens en deze analyseren
o M.b.v. tabellen, grafeken en samenvatende waarden (zoals gemiddeldde)
Vierklariendie of infierientilie istatistiek:
= Volgende stap binnen de statstek
Veralgemenen naar de populate van de besluiten uit de steekproefgegevens
o Zonder garante van zekerheid
Goede steekproef graad van betrouwbaarheid uitgedrukt als kans
Kanisriekiening:
= Studie van experimenten waarin het toeval een rol speelt
Uitkomst kan niet met zekerheid voorspeld worden
Probeert binnen omgeving van onzekerheid uitspraken te doen over uitkomsten door
kansen toe te kennen aan deze uitkomsten
o Mits een aantal onderstellingen of hypothesen i.v.m. het experiment
Bv. een muntstuk is “eerlijk”
Statistischie analseisie:
= Toetsen van de hypothesen, vertrekkend van de uitkomsten van het experiment in
de steekproef
Bij beperkte steekproefnformate kan de dergelijk besluit fout zijn
o Goede statstsche analyse beperkt de kans op een foute conclusie
2. Soorten gegevens en variabelen
Gegevens zijn er in overvloed, kunnen ook verzameld worden d.m.v. enquêtes, metngen...
Geven informate over één of meerdere variabelen van # elementen van populate
Onderscheid in variabelen en de bijhorende gegevens afankelijk van het meetniveau:
, 2.1. Kwalitatieve variabelen en gegevens
kwalitatievie of catiegoriischie variabielien
nominalie variabielie ordinalie variabielie
variabielie niet meetbaar op numerieke meetschaal
giegievienis enkel klasseren in categorieën klasseren in categorieën + ordenen
codie symbool of getal uitdrukking van rangorde
voorkeur: numeriek
biewierkin tellen tellen
g ordenen (zonder vaste meeteenheid)
2.2. Kwantitatieve variabelen en gegevens
Variabele is meetbaar op een numerieke meetschaal met vaste meeteenheid:
Onderscheid o.b.v. numerieke meetschaal:
intiervalischaal ratoischaal
nulpunt arbitraire keuze natuurlijk nulpunt, 0: eigenschap weg
biewierkin tellen tellen
g ordenen ordenen
optellen en aftrekken optellen en aftrekken
vermenigvuldigen en delen
Onderscheid o.b.v. aantal waarden:
o contnue variabele:
onaftelbaar oneindig veel waarden:
voor elke 2 mogelijke waarden bestaat een derde ertussen
o discrete variabele:
eindig of aftelbaar veel waarden
Opmerking:
Waarden van contnue variabelen worden soms als discreet voorgesteld.
Bv. lengte van een persoon afgerond tot op cm
,Hoofdstuk 2: Beschrijvende
statistiek
1. Voorstellen van gegevens
Steekproefgegevens worden weergegeven in een tabel of datamatrix:
Rijen: elementen
Kolommen: variabelen
1.1. Univariate kwalitatieve gegevens
(Abisolutie) friequientie:
= Aantal elementen in een categorie
Rielatievie friequientie:
= Verhouding van absolute frequente tot het totaal aantal elementen in de steekproef.
Weergave mogelijkheden:
Staafdiagram:
o Overzichtelijke weergave van absolute en relateve frequentes
Paretodiagram:
o Staafdiagram met categorieën gerangschikt volgens dalende frequente
Cumulate van de relateve frequentes:
Aandeel vertegenwoordigt door belangrijkste categorieën
Genoemd naar Italiaans econoom Vilfredo Pareto
“80% van vermogen is in handen van 20%”
Cirkeldiagram:
o Weergave van frequentes a.d.h.v. de groote van de cirkelsectoren
verhoudingen
1.2. Univariate kwantitatieve gegevens
Weergave mogelijkheden:
Stengel-en-blad diagram:
o Weergave van elementen zodat men beeld kan vormen van de frequentes,
met behoud van maximale informate over de individuele gegevens
Splitsen in 2 delen van elk getal:
Stengel: cijfer voor splitsingplaats
o Kan meerdere (dezelfde) bladeren bevaten
Bladeren: cijfer na splitsingplaats
o Genoteerd in toenemde volgorde aan de stengel
o Mogen meerdere cijfers bevaten
Splitsingplaats afankelijk van # gegevens en grooteorde
Staafdiagram:
o Overzichtelijke weergave van absolute en relateve frequentes
o Verliest zijn informateve waarde bij te groot # verschillend waarde
Oplossing: histogram
Histogram:
o Verdeling interval waarin alle gegevens liggen in klassen of deelintervallen
Rechthoek boven elk deelinterval met A= relateve frequente
, Gelijke klassebreedte (1)
Hoogte proportoneel met frequente (gelijk aan frequente)
Oppervlakte van alle rechthoeken = 1
Midden van elke klasse aangeduid op de horizontale as
Bepaling # klassen:
compromis tussen:
o Overzichtelijk beeld (weinig klassen)
Te weinig: uitgevlakt
o Gedetailleerd beeld (veel klassen)
Te veel: versplinterd
Standaard: √ ¿ gegevens met max. 20
Frequentepolygoon:
o Weergave verkregen door het verbinden van de middens van de toppen van
de rechthoeken uit het histogram
Verdeling van de assen blijft gelijk
Totale opp. van polygoon = 1
1.3. Bivariate gegevens
Weergave mogelijkheden van 2 kwalitateve variabelen:
Kruistabel:
o Kolommen: categorieën van de ene variabele
o Rijen: categorieën andere variabele
o Cellen: frequente van de gegevens voor combinate van beide variabelen
Meervoudig staafdiagram:
o Grafsche overzichtelijke weergave van een kruistabel:
frequentes kunnen naast elkaar (2D) of in de diepte (3DD) geordend
Kan ook gemaakt worden voor kwanttateve variabelen als:
Gegevens eerst worden opgedeeld in klassen
Stapeldiagram:
o Grafsche overzichtelijke weergave van een kruistabel:
Frequentes worden gestapeld per categorie
Per categorie wordt een staaf (100%) verdeeld in frequentes
Scaterdiagram of puntenwolk:
o Grafsche weergave van elk element van de steekproef in 2 dimensies:
Horizontale as: ene variabele
Vertcale as: andere variabele
Coördinaat van het element: waarden die het aanneemt per variabele
Verbanden opsporen tussen variabelen
2. Cumulatieve frequenties
Bij kwanttateve variabelen kan ook de (empirische) cumulateve verdelingsfuncte en de
bijhorende kwantelfuncte beschouwd worden.
2.1. Cumulatieve verdelingsfunctie
Empirisch cumulateve verdelingsfuncte ^
F n ( x ):
aantal waarnemingen ≤ x
=
n
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper dingske. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,99. Je zit daarna nergens aan vast.