100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Summary Statistics The Art and Science of Learning from Data. Samengesteld door R.J. Zwitser en B.J.H Zijlstra €5,99
In winkelwagen

Samenvatting

Summary Statistics The Art and Science of Learning from Data. Samengesteld door R.J. Zwitser en B.J.H Zijlstra

 465 keer bekeken  10 keer verkocht

Algemene Methodenleer en Statistiek samenvatting tot en met HS 10 paragraaf 2.

Voorbeeld 4 van de 33  pagina's

  • Nee
  • Tot en met hs 10 paragraaf 2
  • 15 april 2016
  • 33
  • 2015/2016
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (1)
avatar-seller
ikoomen
Statistiek hoofdstuk 1 AF

1.1 Using Data to Answer Statistical Questions
Data is de verzamelde informatie van experimenten en onderzoeken.
Statistiek is het ontwerpen van studies en de data hiervan analyseren
door data te transleren tot kennis en begrip van de wereld om ons heen.
Statistiek is de kunst en de wetenschap van het leren van data.
Statistische probleemoplossing; 1) formuleren van een statistische vraag,
2) verzamelen van data, 3) analyseren van data en 4) interpretatie van
resultaten.

Hoofdcomponenten van statistiek voor het beantwoorden van een
statistische vraag:
- Design (hoe kennis verkrijgen)
- Description (samenvatten en analyseren van data)
o Er wordt veel weergegeven in een staafdiagram
- Inference (conclusie/discussie trekken, voorspellingen)
o Kansen wat de kansen voor de verschillende mogelijke
uitkomsten zijn en is fundamenteel voor statistic inference.

Beschrijvende statistiek: Methoden om gegevens mee samen te vatten.
Toetsende statistiek: Methoden om op basis van geobserveerde
gegevens uitspraken (of voorspellingen) te doen over een populatie.
Hieraan gerelateerd is de statistische conclusie validiteit: Is een
onderzoek zodanig opgezet dat op basis van statistiek een conclusie over
de hypothese(n) getrokken kan worden?

1.2 Sample Versus Population
De eenheden in een studie die we meten heten subjects.
Populatie is de totale set van eenheden waarin we geïnteresseerd zijn,
van een sample hebben we data (vaak random geselecteerd).

Kerndoel van descriptive statistics (beschrijvende statistiek) is het
verminderen van data tot versimpelde samenvattingen zonder het
vervormen van informatie of verliezen van veel informatie.
De absolute hoeveelheid van de steekproef is meer van belang dan de
relatieve hoeveelheid.
Een parameter is een getal dat een eigenschap van een populatie
weergeeft.
Statistic is een getal dat een eigenschap van een steekproef weergeeft.

1.3 Using Calculators and Computers
Gearchiveerde verzamelingen van datagegevens komen uit databases.
Applet is een klein applicatieprogramma voor het uitvoeren van een
specifieke taak.
Door een computer te gebruiken die een ‘wat als’ situatie creëert, wordt er
gebruik gemaakt van een simulatie.

,
, Statistiek hoofdstuk 2 AF

2.1 Different Types of Data
Er is variatie overal. Statistische methoden voorzien van manieren om
variatie te meten en te begrijpen.
Variabelen zijn de kenmerken die geobserveerd worden in een
onderzoek.
De waarden van gegevens die geobserveerd worden heten observaties.
Een observatie kan een nummer of categorie zijn.
- Categorische variabele; als het tot een categorie behoort
o De categorie met de hoogste frequentie heet de modal
category
- Kwantitatieve variabele; numerieke waarden bevat,
vertegenwoordigen van verschillende grootheden.
o Discreet; kunnen alleen gehele waarden zijn.
o Continu; kunnen ook niet gehele waarden zijn (een oneindige
reeks mogelijke waarden).
o De waarde die het meeste voorkomt heet de modus.

De proportie van de observaties die in een bepaalde categorie vallen is
de frequentie van observaties in die categorie gedeeld door het
totaalaantal observaties. Het percentage is de proportie keer 100.
Proporties en percentages worden ook wel relatieve frequenties
genoemd en dienen als samenvatting van de metingen in de categorische
variabele.
Frequency table is een lijst van mogelijke waarden voor een variabele,
samen met het nummer van observaties voor iedere waarde.

2.2 Graphical Summaries of Data
Twee manieren om categorische variabelen neer te zetten zijn een:
- Cirkeldiagram; iedere categorie heeft een punt van de cirkel. De
grootte van de punt correspondeert met het percentage observaties
per categorie.
- Staafdiagram; een verticale staaf voor iedere categorie. De hoogte
van de staaf correspondeert met het percentage observaties per
categorie. (Uit elkaar, niet aan elkaar). Is een bijzondere vorm van
Pareto chart (geordend bij hoogste->laagste). Het diagram laat het
Pareto principle zien; een kleine deelverzameling of categorieën
bevat het meest van de observaties.

Drie manieren om kwantitatieve variabelen neer te zetten zijn een
- Puntgrafiek; een punt voor iedere observatie op een horizontale
lijn. Het aantal puntjes boven 1 nummer representeert de frequentie
van die waarde. Kleine hoeveelheid datagegevens.
- Steelbladdiagram; elke observatie wordt gerepresenteerd door
een steel en een blad. De steel bevat alle cijfers, op de laatste na,
dit is het cijfer voor het blad. In logische volgorde. Truncate
(afkappen) de data door het laatste cijfer erbaf te halen.

, - Histogram; een grafiek dat staven gebruikt om de frequenties of de
relatieve frequenties weer te geven. Meestal 5-10 intervallen.
Grotere hoeveelheden datagegevens. Hier is meer flexibiliteit
mogelijk.


Een grafiek voor een dataset beschrijft de verdeling van de data. Dat zijn
de waarden die de variabele aanneemt en de frequentie van hoe vaak
iedere waarde voorkomt.
- Kijk naar het algehele patroon. Clustert het, of zit er een gat tussen?
- Heeft de grafiek 1 top?  unimodaal.
- Heeft de grafiek 2 toppen?  bimodaal.
- Het hoogste punt (waarde die het meeste voorkomt) is de modus.

De vorm van de verdeling kan symmetrisch of scheef zijn (links is de
linker staart langer, rechts is de rechterstaart langer). De staarten van de
verdeling zijn de hoogste en laagste waarden van de curve. De
verzameling van gegevens die over tijd verzamelt worden heet
tijdreeksen. Dit kan worden weergegeven met gebruik van een tijdplot
(of door een staafdiagram). Hier ga je opzoek naar een trend over de tijd
heen.

2.3 Measuring the Center of Quantitative Data
Het gemiddelde is het gemiddelde van de observaties. Dus de som van
de observaties gedeeld door het totaalaantal waarnemingen. x́ =
∑x
n
o Gemiddelde is het balanspunt.
o Bij een scheve verdeling zit het gemiddelde dichterbij de lange
staart.
o Het gemiddelde kan sterk worden beïnvloed door een
uitbijter, dit is waarde die een beetje buiten de rest valt.
De mediaan is de middelste waarde uit de observaties (gesorteerd van
klein naar groot). Bij een even aantal is het totaal+1 delen door 2. Bij
oneven aantal is het de middelste waarde.
o De mediaan is resistent voor het effect van uitbijters.
- Bij symmetrie, is het gemiddelde gelijk aan de mediaan.
- Scheef naar rechts, het gemiddelde is groter dan de mediaan.
- Scheef naar links, het gemiddelde is lager dan de mediaan.
Binaire data: heeft 2 waarden, namelijk 0 en 1.

2.4 Measuring the Variability of Quantitative Data
Het bereik is het verschil tussen de grootste en de kleinste observatie.
Het bereik wordt zeer sterk beïnvloed door uitbijters.
De afwijking van een observatie is verschil tussen de observatie en het
gemiddelde. x−x́
- Positief als de observatie boven het gemiddelde valt.
- Negatief als de observatie onder het gemiddelde valt.
- De som van de afwijkingen is altijd gelijk aan 0.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ikoomen. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 50155 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,99  10x  verkocht
  • (0)
In winkelwagen
Toegevoegd