Het document bevat een samenvatting van de volledige cursus: Statistiek voor Bedrijfskundigen 2, uit de richting Handelswetenschappen aan de Ugent (Universiteit Gent).
Extra uitleg en lesnotities werden aan de samenvatting toegevoegd.
De docent van dit vak is Brent Bleys
DE SAMENVATTING KA...
[Disclaimer: Statistiek 2 en de inhoud van het vak blijft jaar na jaar 1
hetzelfde. Deze samenvatting kan dus ook voor vorige en waarschijnlijk
volgende jaren gebruikt worden.] (Ugent: HW)
1) SCHATTEN VAN EEN PARAMETER ........................................................................................................................... 14
2) BETROUWBAARHEIDSINTERVAL VOOR EEN VERWACHTING BIJ EEN GROTE STEEKPROEF .................................................... 14
3) BETROUWBAARHEIDSINTERVAL VOOR EEN VERWACHTING BIJ EEN KLEINE STEEKPROEF ...................................................... 15
4) BETROUWBAARHEIDSINTERVAL VOOR EEN FRACTIE BIJ EEN GROTE STEEKPROEF ............................................................... 17
5) HET BEPALEN VAN DE STEEKPROEFOMVANG ............................................................................................................ 18
HOOFDSTUK 8: TOETSEN VAN EEN HYPOTHESE GEBASEERD OP ÉÉN ENKELE STEEKPROEF .............................. 19
0) INLEIDING ......................................................................................................................................................... 19
1) EN 2) ELEMENTEN VAN EEN TOETS ......................................................................................................................... 19
3) EEN HYPOTHESE TOETSEN OVER EEN VERWACHTING (GROTE STEEKPROEF) ..................................................................... 21
TOETSINGSPROCEDURE SAMENGEVAT ...................................................................................................... 22
4) OVERSCHRIJDINGSKANSEN .................................................................................................................................. 23
2
, 8.5 EEN HYPOTHESE TOETSEN OVER EEN VERWACHTING (KLEINE STEEKPROEF) .................................................................... 23
6) EEN HYPOTHESE TOETSEN OVER EEN FRACTIE (GROTE STEEKPROEF)............................................................................... 23
7) KANSEN OP EEN FOUT VAN DE TWEEDE SORT ........................................................................................................... 25
HOOFDSTUK 9: TOETSEN VAN EEN HYPOTHESE GEBASEERD OP TWEE STEEKPROEVEN .................................... 27
0) INLEIDING ......................................................................................................................................................... 27
1) HET VERGELIJKEN VAN TWEE POPULATIEVERWACHTINGEN: ONAFHANKELIJKE STEEKPROEVEN ............................................ 27
EXTRA HET VERGELIJKEN VAN TWEE POPULATIEVARIANTIES: ONAFHANKELIJKE STEEKPROEVEN (F-TOETS).................................. 29
2) HET VERGELIJKEN VAN TWEE POPULATIEVERWACHTINGEN: GEPAARDE WAARNEMINGEN ................................................. 31
3) HET VERGELIJKEN VAN TWEE POPULATIEFRACTIES: ONAFHANKELIJKE STEEKPROEVEN ........................................................ 33
HOOFDSTUK 10: HET ONTWERPEN VAN EXPERIMENTEN EN VARIANTIEANALYSE ............................................. 35
1) DE ELEMENTEN VAN EEN ONTWORPEN EXPERIMENT ................................................................................................... 35
2) HET VOLLEDIG GERANDOMISEERD ONTWERP: ÉÉN FACTOR ….[(MODEL) ANOVA: ANALYSIS OF VARIANCE] ......... 36
3) MEERVOUDIGE VERGELIJKINGEN VAN VERWACHTINGEN ........................................................................................... 40
4) FACTORIËLE EXPERIMENTEN (2 FACTOREN) ............................................................................................................. 40
HOOFDSTUK 13: ANALYSE VAN AANTALLEN ...................................................................................................... 41
1) AANTALLEN EN HET MULTINOMIALE EXPERIMENT ....................................................................................................... 41
2) HET TOETSEN VAN KANSEN OP CATEGORIEËN: DE TABEL MET ÉÉN RIJ [VERDELING] ...................................................... 41
3) HET TOETSEN VAN KANSEN OP CATEGORIEËN: DE TABEL MET RIJEN EN KOLOMMEN [AFHANKELIJKHEID] .............................. 43
4) EEN WAARSCHUWING BIJ HET GEBRUIK VAN CHIKWADRAAT-TOETSEN ........................................................................... 46
0) ALGEMEEN ....................................................................................................................................................... 47
1) KANSMODELLEN ................................................................................................................................................ 48
2) HET SCHATTEN VAN HET MODEL (OLS) [ORDINARY LEAST SQUARES REGRESSION] ......................................................... 49
3) MODELAANNAMES ............................................................................................................................................ 50
4) EEN SCHATTER VOOR σ2 ..................................................................................................................................... 51
5) BRUIKBAARHEID VAN HET MODEL (REGRESSIECOËFFICIËNTEN) .................................................................................... 51
6) DE CORRELATIECOËFFICIËNT ................................................................................................................................ 52
7) DE DETERMINATIECOËFFICIËNT .............................................................................................................................. 53
8) GEBRUIK VAN HET MODEL VOOR SCHATTINGEN EN VOORSPELLINGEN .......................................................................... 54
1) GEPASTE STATISTISCHE METHODES KIEZEN ................................................................................................................. 55
Overzicht van de geziene toetsen ............................................................................................................ 55
2) CONCREET ONDERZOEK BEKIJKEN/ ÊNQUETE ........................................................................................................... 55
3) OEFENING 11 DEEL 3 OVERLOPEN ....................................................................................................................... 55
A) Geeft het 95% betrouwbaarheidsinterval voor het gemiddeld aantal uur dat een arbeider werkt
per week. ..................................................................................................................................................... 56
B) Toets op basis van deze steekproef of we kunnen beslissen dat bedienden en erabeiders
gemiddeld evenveel uren werken per week. Gebruik α= 0.05 .............................................................. 57
Stap 1: F-toets .......................................................................................................................................... 57
Stap 2: verschiltoets (eigenlijke toets) ................................................................................................... 58
c) Toets of de drie groepen gemiddeld evenveel uur kloppen per week. gebruik α = 0.05 .............. 58
D) Bepaal de regressielijn die het loon van kaderleden schat op basis van het aantal uur dat men
werkt als je weet dat SSxy = -92.5. ............................................................................................................. 59
E) Wat is het verwachte effect op het loon (kaderleden) van 3uur lager werken per week. ............ 60
F) Test de bruikbaarheid van dit model als je weet dat sse = 2250090.11. Gebruik α = 0.05............... 60
6) IETS OVER HET EXAMEN ........................................................................................................................................ 61
Populatie:
♥ De verzameling experimentele eenheden
♥ bv. alle studenten aan de UGent, alle laptops die een bepaalde firma verkocht heeft
Variabele:
♥ Kenmerk of eigenschap van een individuele eenheid uit de populatie
♥ Bv. Lengte, levensduur, studieresultaat, ...
Steekproef:
♥ Deelverzameling van de populatie
♥ Bv. 20 willekeurig gekozen studenten of laptops, ...
Statistische gevolgtrekking:
♥ Veralgemening vanuit de steekproef naar de populatie
Betrouwbaarheidsmaat:
♥ Uitspraak over de (on)zekerheid van de statistische gevolgtrekking
1.1 SOORTEN VARIABELEN
Kwantitatieve versus kwalitatieve variabelen:
♥ Kwantitatieve: een getal (bv. Leeftijd)
♥ Kwalitatieve: een kenmerk (bv. Geslacht)
Discrete versus continue variabelen:
♥ Discrete variabele: kan eindig of aftelbaar oneindig aantal verschillende waarden
aannemen (bv. Aantal studenten) (aftelbaar oneindig: reële aftelbare getallen)
♥ Continue variabele: indien ook tussenliggende waarden mogelijk zijn (bv. Gewicht,
afstand, …)
Schalen:
♥ Nominale schaal (bv. geslacht)
+ ordening
♥ = Ordinale schaal (bv. mening bij enquête: zeer goed, goed, matig, slecht,…)
+ gelijke verschillen
♥ = Intervalschaal (bv. temperatuur in °C)
+ natuurlijk nulpunt
♥ = Ratioschaal (bv. inkomen)
, − Boxplot
♥ Parameters
− Centrale tendentie – ligging
− Spreiding [centrum, etc…]
− (ook vorm [afvlakking etc…])
Verklarende statistiek:
♥ Trekt conclusies over gehele groep op basis van deel (steekproef) van deze groep
1.3 PARAMETERS VAN LIGGING
Modus:
♥ Waarde van de variabele met het hoogste aantal waarnemingen (frequentie) (vb.
haarkleur)
Mediaan: [hier ordenbaarheid al een vereiste]
♥ Grenswaarde die de gerangschikte waarnemingen in twee gelijke groepen verdeelt
(kunnen ordenen)
♥ Bij oneven aantal gegevens: de middelste waarneming
♥ Bij even aantal gegevens: het rekenkundig gemiddelde van de twee middelste
waarnemingen
Rekenkundig gemiddelde: [minstens kwantitatieve variabele nodig]
♥ De som van alle waarnemingen x1, x2, …, xn, gedeeld door het totaal aantal
waarnemingen n
1.4 PARAMETERS VAN SPREIDING
Variantie:
♥ De gemiddelde gekwadrateerde afwijking van de waarnemingen ten opzichte van
het rekenkundig gemiddelde.
De standaarddeviatie (of standaardafwijking):
♥ De positieve vierkantswortel uit de variantie.
1.5 NOTITIE EN FORMULES
5
,2) STOCHASTISCHE VARIABELEN
Definitie:
♥ Variabele die numerieke waarden aanneemt bij de toevallige uitkomsten van een
experiment.
♥ Bij elke uitkomst wordt één en slechts één waarde aangenomen.
Twee soorten:
♥ Discrete stochastische variabelen
♥ Continue stochastische variabelen
Discrete kansveranderlijken
♥ Kunnen slechts een eindig of aftelbaar oneindig aantal
waarden aannemen
♥ Bv. Aantal ogen bij een worp met een dobbelsteen
♥ Experiment: gelijktijdig opwerpen van twee eerlijke muntstukken.
♥ Stochastische variabele x: aantal keer kruis.
Continue kansveranderlijken
♥ Neemt een oneindig en niet aftelbaar aantal waarden aan te vergelijken met interval
♥ of halfrechte op de reële getallenas
♥ Bv. Tijdsduur tussen 2 meldingen bij 112
2.1 KANSVERDELING EN KANSHISTOGRAM
Eigenschappen van de kansverdeling:
♥ p(x) ≥ 0 voor alle waarden van x
[voor elk van de waarden van x heb je een kans die minstens gelijk is aan 0, dus geen
negatieve waarden]
♥ ∑x p(x) = 1 [ de som van al die kansen moet = aan 1]
2.2 SAMENVATTINGSWAARDEN
Verwachtingswaarde:
♥ Gewogen gemiddelde van de mogelijke waarden van de variabele
♥ µ = E(x) = ∑ x p(x) [hier: 0x(1/4)+ 1x(1/2)+ 2x(1/4)= 1]
Variantie:
♥ Gewogen gemiddelde van de gekwadrateerde afwijkingen t.o.v. µ
♥ σ2 = E [ (x − µ)2 ] = ∑ (x − µ)2 p(x)
Standaardafwijking:
[zegt iets over de spreiding van de data, hoe groter hoe verder alles uit elkaar ligt, hoe
kleiner, hoe dichter alles bij elkaar]
♥ σ = √ σ2
6
, 2.3 CONTINUE KANSVERANDERLIJKE
De (kans)dichtheidsfunctie:
♥ De functie f(x) – die we de
(kans)dichtheidsfunctie noemen –
neemt hier de rol over van het
kanshistogram bij discrete
stochastische variabelen.
3.1 BINOMIAAL EXPERIMENT
Gekenmerkt door:
1. Rij van n identieke deelexperimenten
2. Elk deelexperiment heeft twee uitkomsten: s (‘succes’) en m (‘mislukking’)
3. De kans op s (en dus ook op m) is dezelfde bij elk deelexperiment.
4. De deelexperimenten zijn onafhankelijk van elkaar.
Aantal “successen” in een binomiaal experiment noemt men een binomiale stochastische
variabele.
3.2 BINOMIALE KANSVERDELING
Waarbij
♥ n = aantal deelexperimenten
♥ x = aantal keer “succes”; x is een element van {0,1,2,…,n}
♥ p = vaste kans op succes per deelexperiment
7
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller MK2002. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.58. You're not tied to anything after your purchase.