100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Introduction to the Practice of Statistics. $3.20
Add to cart

Summary

Samenvatting Introduction to the Practice of Statistics.

 281 views  5 purchases
  • Course
  • Institution
  • Book

Deze samenvatting is weliswaar uit de 5e druk, maar het enige verschil met de nieuwe druk is dat de volgorde een beetje is gewisseld. De stof is gelijk gebleven, en ik heb met mijn samenvatting een 7.4 op het vak gehaald.

Preview 3 out of 9  pages

  • No
  • H1 tot en met h4
  • January 11, 2015
  • 9
  • 2014/2015
  • Summary
avatar-seller
Introduction to the Practice of Statistics

H1 Looking at Data
Introduction
Statistiek:
- vat kwantitatieve data samen
- geeft daarbij onnauwkeurigheidsmarges aan
- essentieel hulpmiddel bij onderzoek doen.
Data heeft een context nodig om het te begrijpen!

Als je een onderzoek begint:
- Waarom? Wat voor doel heeft de data?
- Wie? Welke en hoeveel individuelen beschrijft de data?
- Wat? Hoeveel variabelen bevat de data? Wat zijn de exacte definities hiervan? Meeteenheid?
Variabelen: kenmerken van een individu
- Categorische variabelen: in groepen of categorieën
- Kwantitatieve variabelen: nummers
Een verkeerde keuze van variabelen kan leiden tot vertekende conclusies (=misleidend)

1.1 Displaying Distributions with Graphs
Exploratory data analysis: het simpel beschrijven van wat we zien (m.b.v. statistische gereedschappen
en ideeën). Twee basisstrategieën:
- Begin met het onderzoeken van de variabelen en daarna een relatie daartussen zoeken
- Begin met grafiek(en). Voeg numerieke samenvattingen toe of specifieke aspecten van de data.
De verdeling van categorische variabelen geven het absolute aantal of het percentage aan.
Twee manieren van grafische verwerking (vaak gebruikt bij kwalitatieve data):
- Bar graph: staafdiagram. Flexibeler en makkelijker te lezen.
- Pie Chart: cirkeldiagram. Gebruik je als je alle categorieën wilt gebruiken om te kijken of er een
relatie is.

Belangrijke principes:
- Nadat je de achtergrond van de data weet  plot de data! Grafische verwerking!
- Als je naar je plot kijkt: kijk naar de globale verdeling en naar opvallende afwijkingen.

Kwantitatieve data analyseren:
- Stemplot: geeft een snel beeld van de verdeling en meteen ook de werkelijke getallen. Werkt het
best met cijfers boven 0.
> maken van een stemplot
- Elke observatie in een stengel.. Het laatste cijfer komt in een blad.
- Stengel wordt een verticale kolom met de kleinste bovenaan
- Maak de blaadjes.
> Bij 1 categorie: rechts van de stengel.
> Bij meerdere categorieën (bijv. man-vrouw): 1 links en 1 rechts. (=back-to-
back stemplot)
De blaadjes moeten vanaf de stengel naar buiten in oplopende volgorde zijn.
Stemplots werken niet goed bij een groot aantal data! Je zou dan bijvoorbeeld de stengels moeten
splitsen. Dus 1 stengel met blaadjes van 0-4 en een stengel met blaadjes van 5-9.
- Histogram
> beter bij groot aantal data.
> verdeelt data in klassen : vorm is hier heel erg afhankelijk van!

, > geeft niet alle werkelijke data.
> maken van een histogram:
- deel de data in klassen
- tel het aantal scores binnen deze klassen (frequentie)
- maak het histogram: x-as de klassenverdeling.
> je kunt ook frequentiehistogrammen maken: vergelijken van verschillende verdelingen.
> histogrammen hebben geen ruimte tussen de staven, staafdiagram wel.
Je kunt het patroon van een grafische verwerking beschrijven d.m.v. vorm, centrum en spreiding.
> gemiddelde = centrum: 50% links en 50% rechts.
> heeft het 1 of meerdere modus(sen)  1 = unimodaal
> Verdeling symmetrisch of scheef? (linksscheef/rechtsscheef)
> Let op „ouliers‟!
 foutje in de data? Verbeteren!
 afwijkende groep/persoon? Apart rapporteren!
Data verzameld over de tijd  Time plot!
> Trend: lange tijd dalen of stijgen.
> Seasonal variation: patroon dat zich herhaalt op bekende regelmatige tussenpozen van tijd.
 hierdoor vaak „seasonally adjusting‟ om misleiding te voorkomen. (aanpassen van
de grafieken)

1.2 Describing Distributions with Numbers
Centrummaten:
- Gemiddelde: niet resistent voor uitbijters!
- Mediaan: meer resistent voor uitbijters. Vergeet niet de getallen op volgorde te zetten!
> Verdeling symmetrisch? Gemiddelde = mediaan!
> Verdeling scheef? Gemiddelde is niet mediaan!
> Wanneer gemiddelde < mediaan? Bij linksscheve verdeling!
Spreidingsmaten:
- Kwartielen:
> Eerste kwartiel: de helft van de eerste helft. (mediaan van de getallen links v/d mediaan =
25%)
> Derde kwartiel: de helft van de tweede helft. (de mediaan van de getallen rechts v/d
mediaan = 75%)
- Afstand eerste en laatste kwartiel = middelste 50% = IQR.
 5 number summary en de bijbehorende grafische verwerking: boxplot (side by side = 2 boxplots)
- minimum
- Q1
- mediaan
- Q3
- maximum
Als een getal meer dan 1,5 x IQR van het minimum of maximum af ligt  outlier  apart weergeven.
- Gemiddelde absolute afwijking
- Variantie


- Standaarddeviatie
Wortel variantie. Standaardafwijking. Som van de afwijkingen van alle observaties is altijd 0!
Standaarddeviatie is groot als de spreiding vanaf het gemiddelde ook groot is.
> niet resistent voor outliers.

Wanneer centrum- of spreidingsmaten?  5 number summary voor een asymmetrische verdeling,

, voor symmetrische verdeling: gemiddelde en standaarddeviatie, variantie, gemiddelde absolute
afwijking, IQR.

Lineaire transformaties:
xnew=a+bx
x: scores van alle proefpersonen op variabele x
a: optelconstante
b: vermenigvuldigingsconstante
- effect op gemiddelde : x new  a  bx
- effect op standaardafwijking: s  b s
x new x



DIA 22 van College 4a voor transformaties!

1.3 Density Curves and Normal Distributions
Empirische cyclus:
> Vraagstelling  zorgvuldige formulering
> Operationalisatie:  hoe meet je het begrip/de variabelen van de vraagstelling?
> Onderzoeksopzet:  experiment/survey?
> Data verzamelen  het meeste werk
> Data screenen  plaatjes maken
> Data reductie/resultaten  samenvattingsmaten voor centrum en spreiding en complete
verdeling
> Onzekerheidsmarges

Dichtheidscurve
- geeft aan hoeveel van de scores is een willekeurig interval liggen
- = BENADERING
- altijd boven de x-as
- totale oppervlakte onder de curve is 1
- geen frequenties en geen y-as
- gladgestreken beeld van de verdeling van de scores
- dus ook maten voor centrum en spreiding. Gemiddelde: wanneer µ
Normale verdeling (=symmetrisch, unimodaal): en wanneer ?
- gemiddelde = mediaan = modus  steekproef
Waarom normale verdeling belangrijk? µ  hele populatie
- veel verdelingen zijn in de praktijk normaal
- kansprocessen  normaal verdeeld
- nuttig bij bepalen van onzekerheidsmarges
- je kunt er mee rekenen! 
> 68-95-99.7 regel:
- 68% binnen gem en daar een
standaarddeviatie vanaf
- 95% binnen gem en daar twee standaarddeviaties vanaf
- 99.7% binnen gemiddelde en 3 standaarddeviaties daar vanaf.
Weergave normale verdelingen : N(gemiddelde,standaarddeviatie)

Om mee te werken/vergelijken  standaardiseren:
- x is normaal verdeeld x
- x – gemiddelde is normaal verdeeld. Gemiddelde is 0 z

- Z is normaal verdeeld  standaard normale verdeling. Gemiddelde is 0 en standaardafw 1

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Araaanka. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $3.20. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

53068 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$3.20  5x  sold
  • (0)
Add to cart
Added