100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Introduction to the Practice of Statistics. €2,99
In winkelwagen

Samenvatting

Samenvatting Introduction to the Practice of Statistics.

 281 keer bekeken  5 keer verkocht

Deze samenvatting is weliswaar uit de 5e druk, maar het enige verschil met de nieuwe druk is dat de volgorde een beetje is gewisseld. De stof is gelijk gebleven, en ik heb met mijn samenvatting een 7.4 op het vak gehaald.

Voorbeeld 3 van de 9  pagina's

  • Nee
  • H1 tot en met h4
  • 11 januari 2015
  • 9
  • 2014/2015
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (3)
avatar-seller
Araaanka
Introduction to the Practice of Statistics

H1 Looking at Data
Introduction
Statistiek:
- vat kwantitatieve data samen
- geeft daarbij onnauwkeurigheidsmarges aan
- essentieel hulpmiddel bij onderzoek doen.
Data heeft een context nodig om het te begrijpen!

Als je een onderzoek begint:
- Waarom? Wat voor doel heeft de data?
- Wie? Welke en hoeveel individuelen beschrijft de data?
- Wat? Hoeveel variabelen bevat de data? Wat zijn de exacte definities hiervan? Meeteenheid?
Variabelen: kenmerken van een individu
- Categorische variabelen: in groepen of categorieën
- Kwantitatieve variabelen: nummers
Een verkeerde keuze van variabelen kan leiden tot vertekende conclusies (=misleidend)

1.1 Displaying Distributions with Graphs
Exploratory data analysis: het simpel beschrijven van wat we zien (m.b.v. statistische gereedschappen
en ideeën). Twee basisstrategieën:
- Begin met het onderzoeken van de variabelen en daarna een relatie daartussen zoeken
- Begin met grafiek(en). Voeg numerieke samenvattingen toe of specifieke aspecten van de data.
De verdeling van categorische variabelen geven het absolute aantal of het percentage aan.
Twee manieren van grafische verwerking (vaak gebruikt bij kwalitatieve data):
- Bar graph: staafdiagram. Flexibeler en makkelijker te lezen.
- Pie Chart: cirkeldiagram. Gebruik je als je alle categorieën wilt gebruiken om te kijken of er een
relatie is.

Belangrijke principes:
- Nadat je de achtergrond van de data weet  plot de data! Grafische verwerking!
- Als je naar je plot kijkt: kijk naar de globale verdeling en naar opvallende afwijkingen.

Kwantitatieve data analyseren:
- Stemplot: geeft een snel beeld van de verdeling en meteen ook de werkelijke getallen. Werkt het
best met cijfers boven 0.
> maken van een stemplot
- Elke observatie in een stengel.. Het laatste cijfer komt in een blad.
- Stengel wordt een verticale kolom met de kleinste bovenaan
- Maak de blaadjes.
> Bij 1 categorie: rechts van de stengel.
> Bij meerdere categorieën (bijv. man-vrouw): 1 links en 1 rechts. (=back-to-
back stemplot)
De blaadjes moeten vanaf de stengel naar buiten in oplopende volgorde zijn.
Stemplots werken niet goed bij een groot aantal data! Je zou dan bijvoorbeeld de stengels moeten
splitsen. Dus 1 stengel met blaadjes van 0-4 en een stengel met blaadjes van 5-9.
- Histogram
> beter bij groot aantal data.
> verdeelt data in klassen : vorm is hier heel erg afhankelijk van!

, > geeft niet alle werkelijke data.
> maken van een histogram:
- deel de data in klassen
- tel het aantal scores binnen deze klassen (frequentie)
- maak het histogram: x-as de klassenverdeling.
> je kunt ook frequentiehistogrammen maken: vergelijken van verschillende verdelingen.
> histogrammen hebben geen ruimte tussen de staven, staafdiagram wel.
Je kunt het patroon van een grafische verwerking beschrijven d.m.v. vorm, centrum en spreiding.
> gemiddelde = centrum: 50% links en 50% rechts.
> heeft het 1 of meerdere modus(sen)  1 = unimodaal
> Verdeling symmetrisch of scheef? (linksscheef/rechtsscheef)
> Let op „ouliers‟!
 foutje in de data? Verbeteren!
 afwijkende groep/persoon? Apart rapporteren!
Data verzameld over de tijd  Time plot!
> Trend: lange tijd dalen of stijgen.
> Seasonal variation: patroon dat zich herhaalt op bekende regelmatige tussenpozen van tijd.
 hierdoor vaak „seasonally adjusting‟ om misleiding te voorkomen. (aanpassen van
de grafieken)

1.2 Describing Distributions with Numbers
Centrummaten:
- Gemiddelde: niet resistent voor uitbijters!
- Mediaan: meer resistent voor uitbijters. Vergeet niet de getallen op volgorde te zetten!
> Verdeling symmetrisch? Gemiddelde = mediaan!
> Verdeling scheef? Gemiddelde is niet mediaan!
> Wanneer gemiddelde < mediaan? Bij linksscheve verdeling!
Spreidingsmaten:
- Kwartielen:
> Eerste kwartiel: de helft van de eerste helft. (mediaan van de getallen links v/d mediaan =
25%)
> Derde kwartiel: de helft van de tweede helft. (de mediaan van de getallen rechts v/d
mediaan = 75%)
- Afstand eerste en laatste kwartiel = middelste 50% = IQR.
 5 number summary en de bijbehorende grafische verwerking: boxplot (side by side = 2 boxplots)
- minimum
- Q1
- mediaan
- Q3
- maximum
Als een getal meer dan 1,5 x IQR van het minimum of maximum af ligt  outlier  apart weergeven.
- Gemiddelde absolute afwijking
- Variantie


- Standaarddeviatie
Wortel variantie. Standaardafwijking. Som van de afwijkingen van alle observaties is altijd 0!
Standaarddeviatie is groot als de spreiding vanaf het gemiddelde ook groot is.
> niet resistent voor outliers.

Wanneer centrum- of spreidingsmaten?  5 number summary voor een asymmetrische verdeling,

, voor symmetrische verdeling: gemiddelde en standaarddeviatie, variantie, gemiddelde absolute
afwijking, IQR.

Lineaire transformaties:
xnew=a+bx
x: scores van alle proefpersonen op variabele x
a: optelconstante
b: vermenigvuldigingsconstante
- effect op gemiddelde : x new  a  bx
- effect op standaardafwijking: s  b s
x new x



DIA 22 van College 4a voor transformaties!

1.3 Density Curves and Normal Distributions
Empirische cyclus:
> Vraagstelling  zorgvuldige formulering
> Operationalisatie:  hoe meet je het begrip/de variabelen van de vraagstelling?
> Onderzoeksopzet:  experiment/survey?
> Data verzamelen  het meeste werk
> Data screenen  plaatjes maken
> Data reductie/resultaten  samenvattingsmaten voor centrum en spreiding en complete
verdeling
> Onzekerheidsmarges

Dichtheidscurve
- geeft aan hoeveel van de scores is een willekeurig interval liggen
- = BENADERING
- altijd boven de x-as
- totale oppervlakte onder de curve is 1
- geen frequenties en geen y-as
- gladgestreken beeld van de verdeling van de scores
- dus ook maten voor centrum en spreiding. Gemiddelde: wanneer µ
Normale verdeling (=symmetrisch, unimodaal): en wanneer ?
- gemiddelde = mediaan = modus  steekproef
Waarom normale verdeling belangrijk? µ  hele populatie
- veel verdelingen zijn in de praktijk normaal
- kansprocessen  normaal verdeeld
- nuttig bij bepalen van onzekerheidsmarges
- je kunt er mee rekenen! 
> 68-95-99.7 regel:
- 68% binnen gem en daar een
standaarddeviatie vanaf
- 95% binnen gem en daar twee standaarddeviaties vanaf
- 99.7% binnen gemiddelde en 3 standaarddeviaties daar vanaf.
Weergave normale verdelingen : N(gemiddelde,standaarddeviatie)

Om mee te werken/vergelijken  standaardiseren:
- x is normaal verdeeld x
- x – gemiddelde is normaal verdeeld. Gemiddelde is 0 z

- Z is normaal verdeeld  standaard normale verdeling. Gemiddelde is 0 en standaardafw 1

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Araaanka. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53068 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€2,99  5x  verkocht
  • (0)
In winkelwagen
Toegevoegd