Het document bevat een samenvatting van de volledige cursus: Statistiek voor Bedrijfskundigen 2, uit de richting Handelswetenschappen aan de Ugent (Universiteit Gent).
Extra uitleg en lesnotities werden aan de samenvatting toegevoegd.
De docent van dit vak is Brent Bleys
DE SAMENVATTING KA...
[Disclaimer: Statistiek 2 en de inhoud van het vak blijft jaar na jaar 1
hetzelfde. Deze samenvatting kan dus ook voor vorige en waarschijnlijk
volgende jaren gebruikt worden.] (Ugent: HW)
1) SCHATTEN VAN EEN PARAMETER ........................................................................................................................... 14
2) BETROUWBAARHEIDSINTERVAL VOOR EEN VERWACHTING BIJ EEN GROTE STEEKPROEF .................................................... 14
3) BETROUWBAARHEIDSINTERVAL VOOR EEN VERWACHTING BIJ EEN KLEINE STEEKPROEF ...................................................... 15
4) BETROUWBAARHEIDSINTERVAL VOOR EEN FRACTIE BIJ EEN GROTE STEEKPROEF ............................................................... 17
5) HET BEPALEN VAN DE STEEKPROEFOMVANG ............................................................................................................ 18
HOOFDSTUK 8: TOETSEN VAN EEN HYPOTHESE GEBASEERD OP ÉÉN ENKELE STEEKPROEF .............................. 19
0) INLEIDING ......................................................................................................................................................... 19
1) EN 2) ELEMENTEN VAN EEN TOETS ......................................................................................................................... 19
3) EEN HYPOTHESE TOETSEN OVER EEN VERWACHTING (GROTE STEEKPROEF) ..................................................................... 21
TOETSINGSPROCEDURE SAMENGEVAT ...................................................................................................... 22
4) OVERSCHRIJDINGSKANSEN .................................................................................................................................. 23
2
, 8.5 EEN HYPOTHESE TOETSEN OVER EEN VERWACHTING (KLEINE STEEKPROEF) .................................................................... 23
6) EEN HYPOTHESE TOETSEN OVER EEN FRACTIE (GROTE STEEKPROEF)............................................................................... 23
7) KANSEN OP EEN FOUT VAN DE TWEEDE SORT ........................................................................................................... 25
HOOFDSTUK 9: TOETSEN VAN EEN HYPOTHESE GEBASEERD OP TWEE STEEKPROEVEN .................................... 27
0) INLEIDING ......................................................................................................................................................... 27
1) HET VERGELIJKEN VAN TWEE POPULATIEVERWACHTINGEN: ONAFHANKELIJKE STEEKPROEVEN ............................................ 27
EXTRA HET VERGELIJKEN VAN TWEE POPULATIEVARIANTIES: ONAFHANKELIJKE STEEKPROEVEN (F-TOETS).................................. 29
2) HET VERGELIJKEN VAN TWEE POPULATIEVERWACHTINGEN: GEPAARDE WAARNEMINGEN ................................................. 31
3) HET VERGELIJKEN VAN TWEE POPULATIEFRACTIES: ONAFHANKELIJKE STEEKPROEVEN ........................................................ 33
HOOFDSTUK 10: HET ONTWERPEN VAN EXPERIMENTEN EN VARIANTIEANALYSE ............................................. 35
1) DE ELEMENTEN VAN EEN ONTWORPEN EXPERIMENT ................................................................................................... 35
2) HET VOLLEDIG GERANDOMISEERD ONTWERP: ÉÉN FACTOR ….[(MODEL) ANOVA: ANALYSIS OF VARIANCE] ......... 36
3) MEERVOUDIGE VERGELIJKINGEN VAN VERWACHTINGEN ........................................................................................... 40
4) FACTORIËLE EXPERIMENTEN (2 FACTOREN) ............................................................................................................. 40
HOOFDSTUK 13: ANALYSE VAN AANTALLEN ...................................................................................................... 41
1) AANTALLEN EN HET MULTINOMIALE EXPERIMENT ....................................................................................................... 41
2) HET TOETSEN VAN KANSEN OP CATEGORIEËN: DE TABEL MET ÉÉN RIJ [VERDELING] ...................................................... 41
3) HET TOETSEN VAN KANSEN OP CATEGORIEËN: DE TABEL MET RIJEN EN KOLOMMEN [AFHANKELIJKHEID] .............................. 43
4) EEN WAARSCHUWING BIJ HET GEBRUIK VAN CHIKWADRAAT-TOETSEN ........................................................................... 46
0) ALGEMEEN ....................................................................................................................................................... 47
1) KANSMODELLEN ................................................................................................................................................ 48
2) HET SCHATTEN VAN HET MODEL (OLS) [ORDINARY LEAST SQUARES REGRESSION] ......................................................... 49
3) MODELAANNAMES ............................................................................................................................................ 50
4) EEN SCHATTER VOOR σ2 ..................................................................................................................................... 51
5) BRUIKBAARHEID VAN HET MODEL (REGRESSIECOËFFICIËNTEN) .................................................................................... 51
6) DE CORRELATIECOËFFICIËNT ................................................................................................................................ 52
7) DE DETERMINATIECOËFFICIËNT .............................................................................................................................. 53
8) GEBRUIK VAN HET MODEL VOOR SCHATTINGEN EN VOORSPELLINGEN .......................................................................... 54
1) GEPASTE STATISTISCHE METHODES KIEZEN ................................................................................................................. 55
Overzicht van de geziene toetsen ............................................................................................................ 55
2) CONCREET ONDERZOEK BEKIJKEN/ ÊNQUETE ........................................................................................................... 55
3) OEFENING 11 DEEL 3 OVERLOPEN ....................................................................................................................... 55
A) Geeft het 95% betrouwbaarheidsinterval voor het gemiddeld aantal uur dat een arbeider werkt
per week. ..................................................................................................................................................... 56
B) Toets op basis van deze steekproef of we kunnen beslissen dat bedienden en erabeiders
gemiddeld evenveel uren werken per week. Gebruik α= 0.05 .............................................................. 57
Stap 1: F-toets .......................................................................................................................................... 57
Stap 2: verschiltoets (eigenlijke toets) ................................................................................................... 58
c) Toets of de drie groepen gemiddeld evenveel uur kloppen per week. gebruik α = 0.05 .............. 58
D) Bepaal de regressielijn die het loon van kaderleden schat op basis van het aantal uur dat men
werkt als je weet dat SSxy = -92.5. ............................................................................................................. 59
E) Wat is het verwachte effect op het loon (kaderleden) van 3uur lager werken per week. ............ 60
F) Test de bruikbaarheid van dit model als je weet dat sse = 2250090.11. Gebruik α = 0.05............... 60
6) IETS OVER HET EXAMEN ........................................................................................................................................ 61
Populatie:
♥ De verzameling experimentele eenheden
♥ bv. alle studenten aan de UGent, alle laptops die een bepaalde firma verkocht heeft
Variabele:
♥ Kenmerk of eigenschap van een individuele eenheid uit de populatie
♥ Bv. Lengte, levensduur, studieresultaat, ...
Steekproef:
♥ Deelverzameling van de populatie
♥ Bv. 20 willekeurig gekozen studenten of laptops, ...
Statistische gevolgtrekking:
♥ Veralgemening vanuit de steekproef naar de populatie
Betrouwbaarheidsmaat:
♥ Uitspraak over de (on)zekerheid van de statistische gevolgtrekking
1.1 SOORTEN VARIABELEN
Kwantitatieve versus kwalitatieve variabelen:
♥ Kwantitatieve: een getal (bv. Leeftijd)
♥ Kwalitatieve: een kenmerk (bv. Geslacht)
Discrete versus continue variabelen:
♥ Discrete variabele: kan eindig of aftelbaar oneindig aantal verschillende waarden
aannemen (bv. Aantal studenten) (aftelbaar oneindig: reële aftelbare getallen)
♥ Continue variabele: indien ook tussenliggende waarden mogelijk zijn (bv. Gewicht,
afstand, …)
Schalen:
♥ Nominale schaal (bv. geslacht)
+ ordening
♥ = Ordinale schaal (bv. mening bij enquête: zeer goed, goed, matig, slecht,…)
+ gelijke verschillen
♥ = Intervalschaal (bv. temperatuur in °C)
+ natuurlijk nulpunt
♥ = Ratioschaal (bv. inkomen)
, − Boxplot
♥ Parameters
− Centrale tendentie – ligging
− Spreiding [centrum, etc…]
− (ook vorm [afvlakking etc…])
Verklarende statistiek:
♥ Trekt conclusies over gehele groep op basis van deel (steekproef) van deze groep
1.3 PARAMETERS VAN LIGGING
Modus:
♥ Waarde van de variabele met het hoogste aantal waarnemingen (frequentie) (vb.
haarkleur)
Mediaan: [hier ordenbaarheid al een vereiste]
♥ Grenswaarde die de gerangschikte waarnemingen in twee gelijke groepen verdeelt
(kunnen ordenen)
♥ Bij oneven aantal gegevens: de middelste waarneming
♥ Bij even aantal gegevens: het rekenkundig gemiddelde van de twee middelste
waarnemingen
Rekenkundig gemiddelde: [minstens kwantitatieve variabele nodig]
♥ De som van alle waarnemingen x1, x2, …, xn, gedeeld door het totaal aantal
waarnemingen n
1.4 PARAMETERS VAN SPREIDING
Variantie:
♥ De gemiddelde gekwadrateerde afwijking van de waarnemingen ten opzichte van
het rekenkundig gemiddelde.
De standaarddeviatie (of standaardafwijking):
♥ De positieve vierkantswortel uit de variantie.
1.5 NOTITIE EN FORMULES
5
,2) STOCHASTISCHE VARIABELEN
Definitie:
♥ Variabele die numerieke waarden aanneemt bij de toevallige uitkomsten van een
experiment.
♥ Bij elke uitkomst wordt één en slechts één waarde aangenomen.
Twee soorten:
♥ Discrete stochastische variabelen
♥ Continue stochastische variabelen
Discrete kansveranderlijken
♥ Kunnen slechts een eindig of aftelbaar oneindig aantal
waarden aannemen
♥ Bv. Aantal ogen bij een worp met een dobbelsteen
♥ Experiment: gelijktijdig opwerpen van twee eerlijke muntstukken.
♥ Stochastische variabele x: aantal keer kruis.
Continue kansveranderlijken
♥ Neemt een oneindig en niet aftelbaar aantal waarden aan te vergelijken met interval
♥ of halfrechte op de reële getallenas
♥ Bv. Tijdsduur tussen 2 meldingen bij 112
2.1 KANSVERDELING EN KANSHISTOGRAM
Eigenschappen van de kansverdeling:
♥ p(x) ≥ 0 voor alle waarden van x
[voor elk van de waarden van x heb je een kans die minstens gelijk is aan 0, dus geen
negatieve waarden]
♥ ∑x p(x) = 1 [ de som van al die kansen moet = aan 1]
2.2 SAMENVATTINGSWAARDEN
Verwachtingswaarde:
♥ Gewogen gemiddelde van de mogelijke waarden van de variabele
♥ µ = E(x) = ∑ x p(x) [hier: 0x(1/4)+ 1x(1/2)+ 2x(1/4)= 1]
Variantie:
♥ Gewogen gemiddelde van de gekwadrateerde afwijkingen t.o.v. µ
♥ σ2 = E [ (x − µ)2 ] = ∑ (x − µ)2 p(x)
Standaardafwijking:
[zegt iets over de spreiding van de data, hoe groter hoe verder alles uit elkaar ligt, hoe
kleiner, hoe dichter alles bij elkaar]
♥ σ = √ σ2
6
, 2.3 CONTINUE KANSVERANDERLIJKE
De (kans)dichtheidsfunctie:
♥ De functie f(x) – die we de
(kans)dichtheidsfunctie noemen –
neemt hier de rol over van het
kanshistogram bij discrete
stochastische variabelen.
3.1 BINOMIAAL EXPERIMENT
Gekenmerkt door:
1. Rij van n identieke deelexperimenten
2. Elk deelexperiment heeft twee uitkomsten: s (‘succes’) en m (‘mislukking’)
3. De kans op s (en dus ook op m) is dezelfde bij elk deelexperiment.
4. De deelexperimenten zijn onafhankelijk van elkaar.
Aantal “successen” in een binomiaal experiment noemt men een binomiale stochastische
variabele.
3.2 BINOMIALE KANSVERDELING
Waarbij
♥ n = aantal deelexperimenten
♥ x = aantal keer “succes”; x is een element van {0,1,2,…,n}
♥ p = vaste kans op succes per deelexperiment
7
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper MK2002. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,99. Je zit daarna nergens aan vast.