Nederlandse samenvatting van het boek Introduction to the Practice of Statistics (Moore, McCabe & Craig, 2017) hoofdstuk 1 t/m 5.
Hoofdstuk 1: Looking at Data - distributions
Hoofdstuk 2: Looking at Data - Relationships
Hoofdstuk 3: Producing Data
Hoofdstuk 4: Probability: The Study of Randomness
H...
Introduction to the practice of statistics
Hoofdstuk 1
1.1 Data
- Statistiek is de wetenschap van het leren van data
o Data nummerieke of qualitatieve beschrijvingen van de objecten die we
willen bestuderen
- We construeren gegevens (data) door eerst te bepalen welke cases of units we willen
bestuderen
o Voor elke case of unit verzamelen we informatie (= variabelen)
- Begrippen
o Case onderwerp/voorwerp/persoon die bestudeerd wordt
o Label speciale variabele die wordt gebruikt om verschillende cases van
elkaar te onderscheiden
o Variabele kenmerk van een case
o Waarde wat de case scoort bij een variabele (bv man/vrouw, 20 jaar, 6
punten)
o Data alle verzamelde gegevens
- Verschillende soorten variabelen
o Categorisch verdeelt de case in groepen of categorieën
Kan omgezet worden naar kwantitatief (bv toetsscore A naar 4 en B
naar 3 etc)
o Kwantitatief geeft een nummer waarmee je dingen kan berekenen zoals
het gemiddelde
- Belangrijk om bij onduidelijkheid te vermelden in welke eenheid wordt gemeten
- Belangrijke vragen om te stellen als je een statistische studie van een ander bekijkt
om de achtergrond informatie te begrijpen en een volledig beeld te creëren (= key
characteristics)
o Wie
Welke case
Hoeveel cases
o Wat
Hoeveel variabelen
Precieze definities van de variabelen
Met welke eenheden wordt er gemeten
o Waarom
Welk doel heeft de data
Is de data geschikt voor de conclusies die we willen trekken
Welke specifieke vragen willen we beantwoorden
- Het is belangrijk om goede variabelen te kiezen voor je onderzoek, zorg ervoor dat
deze variabelen meten wat je moet weten
o Bij het kiezen van te weinig of verkeerde variabelen kan je verkeerde
conclusies trekken
, o Bv school A heeft 200 geslaagden en school B 100 betere variabele zou zijn
dat school A 50% geslaagden heeft en school B 100%
School A heeft hierbij 400 leerlingen en school B 100
o Je kan het ene variabele gebruiken om een ander variabele te berekenen
bij het vb is dit ook gedaan
1.2 Displaying Distributions with Graphs
- Denk als een ontdekkingsreiziger eerst beschrijven wat je ziet (= exploring data
analysis)
o Eerst elke variabele los bekijken, daarna relaties tussen de variabelen gaan
bekijken
o Begin met een grafiek en ga van daaruit verder werken
- Categorische variabelen
o Taartdiagram
Geeft aan hoeveel procent
Alle categorieën moeten worden gebruikt (evt sommige samenvoegen
als overig), want de taartdiagram moet in totaal 100% zijn
o Staafdiagram
Hoogte geeft aan hoeveel procent of een aantal
Geen vaste volgorde
- Het gebruiken van een categorie overig kan handig zijn, maar pas er wel mee op je
wilt geen belangrijke informatie in de overige categorie stoppen
- Kwantitatieve variabelen
o Bladdiagram
Werkt het best bij kleine hoeveelheden data die allemaal boven de 0
zijn
Steel kan heel veel cijfers bevatten, maar het blad bestaat altijd uit
slechts 1 cijfer
Toont alle waarden
Rug tegen rug bladdiagram
Steel in het midden en aan beide kanten een blad
Handig om 2 sets data mee te vergelijken
Splitten bij veel date
2x bv 1 in de steel en dan bovenste blad eenheden 0 t/m 4 en
onderste blad eenheden 5 t/m 9
Bij veel decimalen eerst afronden en daarna een bladdiagram maken
o Histogram
Handiger bij grotere datasets
Geeft niet elke afzonderlijke waarden weer, maar aantallen of
procenten
Deel de individuele waarden op in groepen, zorg dat je telkens even
grote sprongen maakt (bv steeds sprongen van 10 als één groep)
Elke waarde moet precies in 1 groep vallen
Tel hoeveel waarden er in elke groep zitten (= frequentie) zit dit in
een tabel (= frequentietabel)
Teken het histogram staven tegen elkaar aan
X-as waardes
, Y-as aantal of procenten
o Gebruik een histogram met procenten als je een
vergelijking wilt maken zoals in het voorbeeld van
school A en B
Extreme waarden worden weergegeven in een staart
Staart aan links lage extreme waarden
Staart aan rechts hoge extreme waarden
- Verschillen tussen staafdiagrammen en histogrammen
o Histogram geeft verschillende waardes weer over één variabele, staafdiagram
geeft verschillende variabelen weer
o Histogram zit aan elkaar vast, staafdiagram heeft witruimte om de
verschillende variabelen aan te tonen
- Als je je data begrijpt kan je het ‘plotten’, vervolgens bekijk je de geplotte data om te
kijken voor een patroon en voor uitschieters
- Na het maken van een grafiek stel je jezelf de vraag wat je ziet
o Het maken van een grafiek is namelijk geen doel, maar een middel
o Patroon kan je ontdekken door te kijken naar de vorm, midden en spreiding
van de grafiek
Let op outliers losse uitschieter
Niet altijd maximum of minimum, moet ver van de overige
scores vandaan liggen
Belangrijk om te zoeken waar de outlier vandaan komt, kan bv
ook door technisch mankement komen en dus onjuiste
informatie geven
o Dingen om op te letten bij het aflezen van de grafiek
Eén of meerdere pieken (= modes)?
Eén unimodel
Symmetrisch of overhangend naar één zijde?
Overhangend naar rechts hogere waarden
Overhangen naar links lagere waarden
- Als er veel tijd verstrijkt tussen het verzamelen van de gegevens is het belangrijk dit
te verwerken in de grafiek om onjuiste conclusies te voorkomen door bv nieuwe
technologie kan er sprake zijn van een andere situatie
o Timeplot
X-as tijd
Y-as waarde
1.3 Describing Distributions with Numbers
- Nummerieke analyses geven meer specifieke details dan grafieken
o Bij categorische variabelen gebruiken we de getallen/procenten uit de
taartdiagram of staafdiagram om mee te rekenen
- Korte beschrijving van een kwantitatieve variabele zou informatie moeten bevatten
over de vorm en zou cijfers moeten geven die informatie brengen over de
mediaan/gemiddelde en verspreiding
o Vorm aan de hand van histogram of steelbladdiagram
o Mediaan/gemiddelde en verspreiding dmv berekeningen
- We kunnen the center op 2 manieren berekenen
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper 0970722. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,99. Je zit daarna nergens aan vast.