100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Introduction to the practice of Statistics - Moore, McCabe en Craig - 9th edition H1 t/m 7 $6.48
Add to cart

Summary

Samenvatting Introduction to the practice of Statistics - Moore, McCabe en Craig - 9th edition H1 t/m 7

9 reviews
 38 purchases
  • Course
  • Institution
  • Book

Samenvatting van het boek Moore - McCabe en Criag 9th edition H1 t/m 7 Hieronder een beschrijving wat er in de samenvatting staat: Hoofdstuk 1 (zonder Beyond the Basics: Density estimation) Hoofdstuk 2 (zonder 2.4 en 2.5) Hoofdstuk 3 (zonder Beyond the Basics: Capture-recapture) Hoofdstuk 4 (zonde...

[Show more]
Last document update: 5 year ago

Preview 4 out of 31  pages

  • No
  • Hoofdstuk 1 (zonder beyond the basics: density estimation) hoofdstuk 2 (zonder 2.4 en 2.5) hoofdstuk
  • June 7, 2019
  • October 9, 2019
  • 31
  • 2018/2019
  • Summary

9  reviews

review-writer-avatar

By: mandyswagers • 5 months ago

review-writer-avatar

By: MVerheul • 3 year ago

review-writer-avatar

By: quintylohman • 3 year ago

review-writer-avatar

By: kimjanse • 3 year ago

review-writer-avatar

By: ndanen • 3 year ago

review-writer-avatar

By: jeurnene • 4 year ago

review-writer-avatar

By: lhcpater • 4 year ago

Show more reviews  
avatar-seller
Hoofdstuk 1
1.1. Cases zijn de objecten beschreven als data (klanten, bedrijven, aantal deelnemers)
Label is een speciale variabele om de verschillende cases te onderscheiden
Een variabel is een karakterkenmerk van een case (hoogte, geslacht, salaris):
➔ Categorie variabel: plaats een case in een groep of categorie (man of vrouw)
➔ Kwantitatieve variabel: neemt numerieke waarderingen waar bewerkingen zoals optellen of
middeling zinvol zijn (hoogte in cm, salaris in dollars)
- Unit of measurement: beschrijving van welke kwantitatieve variabele (dollars, inches,
centimeters).
Variabelen kunnen verschillende waarden hebben voor verschillende cases of units.

Data beschrijven:
1. Wie? Welke objecten en hoeveel?
2. Wat? Hoeveel variabelen heeft het en wat zijn de exacte definities hiervan? (unit of
measurements)
3. Waarom? Wat is het doel van de data?

Instrumenten zijn nodig voor het meten van variabelen. Het is van belang dat je bij elk variabele echt
meet wat je wilt weten. Een slechte keuze van variabelen kan leiden tot misleidende conclusies.

1.2. Exploratory date analysis: data beschrijven
- Begin met onderzoeken van elke variabele op zichzelf. Dan naar de relaties tussen de
variabelen
- Begin met graph(s). Voeg dan numerieke samenvattingen van specifieke data toe

Categorie variabelen:
- Distribution of categorical variable: aantal, procent of proportion
- Staafdiagram: aantal of procenten
- Cirkeldiagram: procenten

Kwantitatieve variabelen:
1. Stemplot: geeft de verdeling van de numerieke waarden weer
➔ Back to back stemplot: om dingen te vergelijken, zie afbeelding >
2. Histogram: geeft alleen het aantal of procent weer dat binnen een klasse valt
- Scores verdelen in klasse van evenwichtige spreiding
- Frequentie van aantallen binnen de klasse
- Verschillende soorten: scheef naar links/recht of symmetrisch
- Unimodal: een grote piek binnen de histogram
- Outlier: een individuele waarde die buiten het patroon valt, uitleggen!

Timeplot: plot elke variabele die op een tijdstip werd gemeten. Altijd op de horizontale as

1.3. Zie afbeelding blz. 2. Modus: meest voorkomende cijfer
Mean x̄: gemiddelde waarde. Alles bij elkaar ∑ / n
Median: middelste waarde. n+ = de plaats van de mediaan. Die 2 cijfers bij elkaar / 2 = mediaan
Quartiles: Q1: 25%, Q3: 75%. Om kwartielen te berekenen:
1. M: vind de mediaan
2. Q1: mediaan van het stuk onder/links M
3. Q3: mediaan van het stuk boven/rechts M Five-number summary
4. Whiskers: lijnen tot het kleinste en grootste getal
5. Minimum en maximum getallen


1

,Interquartile range (IQR) = Q3 – Q1

Outlier: een sterke afwijking.
Zijn alleen als deze 1.5 x IQR onder of boven Q3 of Q1 ligt:
- Q1 – (1.5 x IQR)
- Q3 + (1.5 x IQR)

Modified boxplot: lijnen gaan naar de kleinste of grootste waarde vanuit de box,
die niet horen tot de IQR regel

Side-by-side boxplot: twee of meer boxplots om groepen te vergelijken op het
gebied van dezelfde variabelen

Standaarddeviatie (s): de mate van spreiding van getallen rondom het gemiddelde, √s2
Variantie (s2): mate waarin de waarden onderling verschillen




Een lineaire transformatie verandert de originele variabele x in een nieuwe variabele xnew:
xnew = a + bx.

1.4.
Density curves: een patroon die het algemene patroon van gegevens weergeeft maar onregelmatig
heden weglaat
➔ Is altijd op of boven de horizontale as
➔ Heeft een gebied precies onder zich
1. De median is het punt dat de curve verdeeld in 2 gelijke gebieden
2. De mean is het balans punt
* voor een symmetrische curve zijn de mean en median gelijk, de mean wordt weggetrokken als de
curve een ‘staart’ heeft.

Normaalverdeling = N(µ, σ)
µ = gemiddelde
σ = standaarddeviatie

68-95-99.7 rule:
- 68% van de waarden valt binnen σ van µ
- 95% van de waarden valt binnen 2σ van µ
- 99.7% van de waarden valt binnen 3σ van µ


2

,z-score vertelt hoeveel standaarddeviaties afwijken van het gemiddelde en in welke richting. Zie
tabel A in het boek.
De volgende formules worden nu gebruikt:

Soms worden gegevens voor de z-score gegeven (Tabel A)
➔ X = µ +zσ




Voorbeeld
Je haalt voor de toelatingstoets een 6.7. Het gemiddelde is een 5.5 en de SD is 1.481. Wat is de
proportie studenten die een 6.7 of lager heeft gehaald?

Z-score = (6.7 – 5.5)/1.481 = 0.81
Zie Tabel A voor P(z < 0.81)
P(z < 0.81)= 0.7910
Dus 0.791 (of 79.1%) van de studenten heeft een 6.7 of lager gehaald.


Cummulative proportions: verhoudingen van waarden in een verdeling die ligt op of beneden een
gegeven waarde.

Hoofdstuk 2
2.1.
Twee gemeten variabelen in hetzelfde geval zijn geassocieerd als een van de waarde van een
variabele iets zegt over de waarde van de andere variabele.
Belangrijke eigenschappen voor relaties tussen data:
1. Object: bepaal de objecten en hoeveel zijn er?
2. Categorie of kwantitatief: classificeer elke variabele als categorie of kwantitatief
3. Waarde: bepaal de waarde van elke variabele
4. Classificeer elke variabele als
- Respons/afhankelijke variabele: meet een uitkomst van een studie
- Explanatory/onafhankelijke variabele: verklaart of veroorzaakt veranderingen in de
respons variabele
5. Label: bepaal welke labels de variabelen hebben

2.2. Scatterplots
De meest gebruikte manier om de relatie tussen twee kwantitatieve variabelen weer te geven is
door middel van een scatterplot > spreidingsdiagram.
- De waarden van de ene variabelen komt op de horizontale as > explanatory variabele
- De waarden van de andere variabelen komt op de verticale as
- Elk object van data verschijnt als een ‘punt’
- Outlier: sterke afwijking

catterplot: puntjes geven de intersectie van X en Y waarden weer
Interpreteren van een scatterplot:
- Bekijk het algehele patroon en de afwijkingen

3

, 1. Vorm:
- Lineair: in een rechte lijn
- Curve: met een boog (non-lineair)
2. Richting:
- Positieve correlatie: hoge scores van de ene variabele hangen samen met hoge scores
van de andere variabele
- Negatieve correlatie: hoge scores van de ene variabele hangen samen met lage scores
van de andere variabele
3. Sterkte: hoe dichter de punten bij de lijn liggen, hoe sterker de relatie ertussen




Om een curve lineair te maken, kan er een transformatie plaats vinden. Dan worden originele
waarden vervangen door getransformeerde waarden en deze worden gebruikt voor de analyse.
➔ Meest belangrijke is de log transformatie: log(y)




Wanneer een variabele toe wordt gevoegd aan een scatterplot, gebruik je een andere kleur of
symbool of elke categorie.

Scatterplot smoothers: een methode om de relatie tussen twee kwantitatieve variabelen de
onderzoeken door een vloeiende curve in te brengen in data

2.3. Correlatie
De correlatie r meet de richting en sterkte van de lineaire relatie tussen twee kwantitatieve
variabelen. De correlatie tussen x en y is:


4

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller IlseGeers. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.48. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

68175 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling
$6.48  38x  sold
  • (9)
Add to cart
Added