100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Summary Applied Statistics in Business and Economicsc van Douane/Seward €5,49
In winkelwagen

Samenvatting

Summary Applied Statistics in Business and Economicsc van Douane/Seward

9 beoordelingen
 949 keer bekeken  78 keer verkocht

Een samenvatting van zowel de hoorcolleges als het boek: Applied Statistics in Business and Economics

Voorbeeld 8 van de 50  pagina's

  • Ja
  • 17 oktober 2016
  • 50
  • 2016/2017
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (1)

9  beoordelingen

review-writer-avatar

Door: sahilkhan- • 2 jaar geleden

review-writer-avatar

Door: s00vu00 • 4 jaar geleden

review-writer-avatar

Door: semwierdsma • 4 jaar geleden

review-writer-avatar

Door: yilmazselcuk84 • 5 jaar geleden

review-writer-avatar

Door: ninac330 • 5 jaar geleden

review-writer-avatar

Door: tomevers1999 • 6 jaar geleden

review-writer-avatar

Door: kingg-arthurr • 6 jaar geleden

Bekijk meer beoordelingen  
avatar-seller
joeyyvdB123
Quantitative Research Methods II

 Data
Statistiek is de studie van het verzamelen, analyseren, interpreteren, presenteren en
organiseren van gegevens. Data zijn geobserveerde feiten.
De rol van data:
- Het suggereren van theorieën (pizza’s met een hoge prijs zijn minder populair).
- Het testen van hypotheses
of beweringen (adverteren
verhoogt de verkopen).
Data in een matrix:
Binnen een matrix staan de
variabelen (variables) bij de
kolommen en het geval waar het
om gaat in de rijen (subjects/cases).
Binnen de cellen staan de
geobserveerde feiten. Er kan veel
informatie uit een matrix worden
gehaald. Zo kan er op basis van één
variabele al iets kunnen worden
geconcludeerd. Ook kunnen verschillende variabelen met elkaar worden vergeleken.
Eén variabele  De gemiddelde leeftijd.
Twee variabalen  De correlatie tussen de leeftijd en lengte.
Types data:
- Scale  In woorden (categorical) of in cijfers (numerical).
- Countability  Hele getallen (discrete) of kommagetallen (continuous).
- Range  Oneindig (infinite) of begrensd (restricted).
- Coding  Nominale of ordinale categorieën in cijfers vervangen.
- Recoding  Het groeperen van categoriale of numerieke data.
Dummy  0 (nee) of 1 (ja).
Enige valkuilen:
- Er wordt data gemist.
- Dat gecodeerde categorieën als nummers worden behandeld.
- Data moet in de juiste unit worden genoteerd.

,Het verkrijgen van gegevens:
- Typen uit boeken
- Downloaden van online databases of algemene webpagina’s.
- Informatie uit al uitgevoerde onderzoeken.
- Zelf onderzoeken doen door middel van interviews, experimenten of observaties.
Meetniveaus:
- Ordinaal Hier is sprake van specifieke ordening tussen zaken. Denk hierbij aan
groot, groter en het grootst.
- Nominaal  Onderscheid maken tussen zaken. Namen zijn voorbeelden hiervan. Er
is geen specifieke ordening van zaken.
- Interval  Waarde kan geen 0 zijn.
- Ratio  Waarde kan wel 0 zijn.

 Data summaries
Er zijn twee soorten samenvattingen:
- Graphical summaries.
- Statistical summaries.
Numerical (Graphical summaries)  Scatterplot.
Numerieke data (Statistical summaries)  Mediaan, modus, gemiddelde, variantie,
standaardafwijking, minimum, maximum, range en skewness.
Numerieke data (box plot)  Minimum, eerste kwartiel (𝑄1 ), mediaan, derde kwartiel (𝑄3 )
en maximum.
Numerieke data (histogram)  Frequentieverdeling.
Categorische data (Graphical summaries)  Cirkeldiagram of staafdiagram.
Categorische data (Statistical summaries)  Frequenties, proporties of percentages.


Numerieke data (centrality):
1 𝑛
Gemiddelde  𝑥̅ = ∑ 𝑥
𝑛 𝑖=1 𝑖
𝑀𝑖𝑛𝑖𝑚𝑢𝑚+𝑚𝑎𝑥𝑖𝑚𝑢𝑚
Midrange 
2
Range  𝑀𝑎𝑥𝑖𝑚𝑢𝑚 − 𝑀𝑖𝑛𝑖𝑚𝑢𝑚
Median  Middelste getal.
Mode  Meest voorkomend getal.
Geomatric mean  De wortel van het product van de n aantal termen.
k% trimmed mean  Gemiddelde waar k% van de hoogste en laagste waarnemingen wordt
weggelaten.

,Numerieke data (dispersion):
1
Variance  𝑠 2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑛−1
Standard deviation  𝑠 = √𝑠 2
Interquartile range  𝐼𝑄𝑅 = 𝑄3 − 𝑄1
𝑠
Coefficient of variation  𝐶𝑉 = 𝑥̅

1
Standard deviation data as sample  √𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
1
Standard deviation population as sample  √𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2

Numerieke data (shape):
Skewness  Meetstaaf die de asymmetrie berekend.
1 x −x̅
Formule voor het berekenen van de skewness  𝑀3 ≈ 𝑛 ∑𝑛𝑖=1 ( is )3
x




Kurtosis  Meetstaaf die de mate van vlakte berekend
1 x −x̅
Formule voor het berekenen van de kurtosis  𝑀4 ≈ 𝑛 ∑𝑛𝑖=1 ( is )4 − 3
x




Verschillende datatypes:
- Twee numerieke data vectoren  Scatterplot, correlatie analyse.
- Eén numerieke data vector en één categoriale data vector.
- Twee categoriale data vectoren.

Samenvatting hangt af van verschillende factoren:
- Aard van de variabelen  numerical vs categorical, numerical: dicrete vs continuous
of categorical: binary or not.
- Aantal variabelen  Univariate, bivariate of multivariate.
- Range van de data/aantal categorieën.
- Niveau van detail en nauwkeurigheid.
- Publiek.

Risico van het samenvatten van data is dat je informatie kan verliezen.

,  Basic probability

Data as a random sample  Gegevens worden willekeurig uit de populatie verkregen.

1
Coin: 𝑃(ℎ𝑒𝑎𝑑𝑠) = 2
1
Die: 𝑃(𝑜𝑢𝑡𝑐𝑜𝑚𝑒 = 3) = 6

Types kansverdeling:

- Classical theory  Wat is de kans dat ik vijf gooi met een dobbelsteen?
- Empirical  Zelf onderzoek doen naar de kans van een bepaalde gebeurtenis aan de
hand van observaties.
- Subjective  Wat is de kans dat Nederland wereldkampioen wordt?

𝑃(𝐴) Kans op specifieke gebeurtenis A.
𝑃(𝐵) Kans op specifieke gebeurtenis B.

𝑃(𝐴⋃𝐵)  A of B of allebei.
𝑃(𝐴 ∩ 𝐵) Zowel A als B.

𝑃(𝐴′ ) = 1 − 𝑃(𝐴)  Complement van A.
𝑃(𝐵 ′ ) = 1 − 𝑃(𝐵)  Complement van B.

𝑃(𝐴⋃𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴∩𝐵)
𝑃(𝐴|𝐵) = 𝑃(𝐵)

Onafhankelijkheid test:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴) ∗ 𝑃(𝐵)

 Discrete distributions

0 < 𝑃(𝑥𝑖 ) < 1
∑𝑛𝑖=1 𝑃(𝑥𝑖 ) = 1

Notatie: 𝑃(𝑋 = 𝑥𝑖 ) 𝑜𝑟 𝑃𝑥 (𝑥𝑖 ) 𝑜𝑟 𝑃(𝑥𝑖 )

Naam van de variabele Mogelijke uitkomst

Cumulative distribution function: 𝐹𝑥 (𝑥) = 𝑃(𝑋 < 𝑥) = 𝐹(𝑥) = ∑𝑥𝑘=−∞ 𝑃(𝑋 = 𝑘)
Experiment met het gooien van een dobbelsteen:
1 1
𝑃(𝑋 = 2) = 6 𝑒𝑛 𝐹𝑥 (2) = 𝑃(𝑋 = 2) + 𝑃(𝑋 = 1) = 3

Expected value: 𝐸(𝑋) = ∑𝑛𝑖=1 𝑥𝑖 𝑃(𝑋 = 𝑥𝑖 )

,Bernoulli distribution:

Er is of succes of er is geen succes. Succes wordt genoteerd als 𝑃(𝑋 = 1) en geen succes
wordt genoteerd als 𝑃(𝑋 = 0).
X is aantal keren succes binnen een experiment. De kans van dat succes wordt bij de
Bernoulli distribution genoteerd als 𝜋 (0 < 𝜋 < 1).
𝑃(𝑋 = 1) = 𝜋
𝑃(𝑋 = 0) = 1 − 𝜋
𝑿~𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊(𝝅)  Bernoulli distribution met parameter 𝜋.
𝑬(𝑿) = 𝜋
𝑽𝒂𝒓(𝑿) = 𝜋(1 − 𝜋)
𝝈𝒙 = √𝜋(1 − 𝜋)
𝜋 𝑖𝑓 𝑥 = 1
𝑷𝑫𝑭: 𝑃(𝑥; 𝜋) = {
1−𝜋 𝑖𝑓 𝑥 = 0

Binomial distribution:

Y is aantal keren succes. De kans van dat succes wordt bij de Bionomial distribution
genoteerd als 𝜋 (0 < 𝜋 < 1).
𝑿~𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍(𝒏, 𝝅)  Binomial distribution met parameters n en 𝜋.
𝑬(𝑿) = 𝑛𝜋
𝑽𝒂𝒓(𝑿) = 𝑛𝜋(1 − 𝜋)
𝝈𝒙 = √𝑛𝜋(1 − 𝜋)
𝑷𝑫𝑭: 𝑃(𝑥; 𝑛; 𝜋) = (𝑛𝑥) ∗ 𝜋 𝑥 (1 − 𝜋)𝑛−𝑥
𝑪𝑫𝑭: 𝐹(𝑥; 𝑛; 𝜋) = ∑𝑥𝑘=0 𝑃(𝑥; 𝑛; 𝜋)

Voorbeeld:

𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(8,0.5)  Gebruik van formule.
𝑃(𝑋 = 3) = (82) ∗ 0,53 ∗ 0,55 = 0,2188
𝑃(𝑋 < 3) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) + 𝑃(𝑋 = 3) = 0,3634

𝑋~𝐵𝑖𝑛𝑜𝑚𝑖𝑎𝑙(8,0.5)  Gebruik
van tabel
𝑃(𝑋 = 3) = 0,2188
𝑃(𝑋 < 3) = 0,0039 + 0,0313 +
0,1094 + 0,2188 = 0,3634

𝑃(𝑋 < 𝑥) = 𝑃(𝑋 < 𝑥 − 1)
𝑃(𝑋 > 𝑥) = 1 − 𝑃(𝑋 < 𝑥)
𝑃(𝑋 > 𝑥) = 1 − 𝑃(𝑋 < 𝑥 − 1)
𝑃(𝑥 < 𝑋 < 𝑦) = 𝑃(𝑋 < 𝑦) − 𝑃(𝑋 < 𝑥)

,Poisson distribution:

X is aantal gebeurtenissen in een tijd interval.
Eén parameter λ  gemiddeld aantal gebeurtenissen tijdens een bepaald interval.
Als n > 20 is en 𝜋 ≤ 0,05  Gebruik Poisson verdeling.
𝑿~𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝝀)  Poisson distribution met parameter λ.
𝑬(𝑿) = 𝜆
𝑽𝒂𝒓(𝑿) = 𝜆
𝜆𝑥 𝑒 −𝜆
𝑷𝑫𝑭: 𝑃(𝑋 = 𝑥; 𝜆) = 𝑥!
𝑥 𝜆𝑘 𝑒 −𝜆
𝑪𝑫𝑭: 𝐹(𝑥; 𝜆) = ∑𝑘=0 𝑃(𝑘; 𝜆) = ∑𝑥𝑘=0 𝑘!

,Hypergeometric distribution:

De hypergeometric distribution is erg vergelijkbaar met de binomial distribution. Alleen is er
bij deze verdeling sprake van zonder terugleggen.
𝑛
𝑁
≤ 0,05  Dan is deze verdeling OK.
𝑿~𝑯𝒚𝒑(𝒏, 𝑺, 𝑵)  Hypergeometric distribution met parameters n, S en N.
𝑬(𝑿) = 𝑛𝜋
𝑁−𝑛
𝑽𝒂𝒓(𝑿) = 𝑛𝜋(1 − 𝜋) 𝑁−1
(𝑆 𝑁−𝑆
𝑥)( 𝑛−𝑥 )
𝑷𝑫𝑭: 𝑃(𝑋 = 𝑥) =
(𝑁
𝑛)

, Transformatieregels gemiddelde:

𝐸(𝑘 + 𝑋) = 𝑘 + 𝐸(𝑋)
𝐸(𝑎𝑋) = 𝑎 ∗ 𝐸(𝑋)
𝐸(𝑋 + 𝑌) = 𝐸(𝑋) + 𝐸(𝑌)

Transformatieregels varianties:

𝑉𝑎𝑟(𝑘 + 𝑋) = 𝑉𝑎𝑟(𝑋)
𝑉𝑎𝑟(𝑎𝑋) = 𝑎2 ∗ 𝑉𝑎𝑟(𝑋)
𝑉𝑎𝑟(𝑋 + 𝑌) = 𝑉𝑎𝑟(𝑋) + 𝑉𝑎𝑟(𝑌) + 2 𝐶𝑂𝑉(𝑋, 𝑌)

 Continuous distributions

𝐏𝐃𝐅: f(x)
𝑥
𝐂𝐃𝐅: F(X) = P(X < 𝑥) = ∫−∞ 𝑓(𝑦)𝑑𝑦

𝑬(𝑿) = 𝜇𝑥 = ∫−∞ 𝑥𝑓(𝑥)𝑑𝑥

𝑽𝒂𝒓(𝒙) = ∫−∞(𝑥 − 𝜇)2 𝑓(𝑥)𝑑𝑥
F(−∞) = 0 en F(∞) = 1
𝑏
𝑃(𝑎 < 𝑋 < 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥  Oppervlakte tussen a en b.

Uniform continuous distribution:

1
𝑷𝑫𝑭: 𝑓(𝑥; 𝑎; 𝑏) = (𝑥 ∈ [𝑎, 𝑏])
𝑏−𝑎
𝑥−𝑎
𝑪𝑫𝑭: 𝐹(𝑋) = 𝑥−𝑏
𝑎+𝑏
𝑬(𝑿) = 𝜇 = 2
(𝑏−𝑎)2
𝑽𝒂𝒓(𝑿) = 12

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper joeyyvdB123. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 57413 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,49  78x  verkocht
  • (9)
In winkelwagen
Toegevoegd