1.1 Data gebruiken om statistische vragen te kunnen beantwoorden.
Statistiek: een gegeven die berekend is vanuit data.
× Gemiddeld inkomen
× Het aantal keer gescoord in een wedstrijd
× Percentage studenten met te hoog alcoholgebruik
Design: plan hoe data de onderzoeksvraag gaat beantwoorden.
Beschrijving: het samenvatten en analyseren van verzamelde data.
Inferentie (toetsing): beslissingen maken en voorspellingen doen gebaseerd op de data voor het verkrijgen
van een antwoord op de statistische vraag.
Probability: Een framewerk waarmee gezegd kan worden hoe groot de kans op bepaalde
uitkomsten zijn.
1.2 Sample versus populatie
We observeren samples maar zijn geïnteresseerd in populaties.
De populatie is de totale set van objecten waarin we geïnteresseerd zijn. Een sample is een subset van de
populatie waar we data van willen, vaak random geselecteerd.
Beschrijvende statistiek refereert naar methodes voor het samenvatten van de verzamelde data. De
samenvatting bestaat meestal uit grafieken en nummers zoals gemiddelden en percentages.
Toetsende statistiek: refereert naar methoden om beslissingen te maken of voorspellingen te doen over een
populatie, gebaseerd op de verzamelde data uit een sample van die populatie.
Populatie parameters: een parameter is een numerieke samenvatting van de populatie.
Sample statistieken: een statistiek is een numerieke samenvatting van een sample uit de populatie.
Random sampling: een sample kan een goede weergave van een populatie zijn, als elk object in de
populatie dezelfde kans heeft om in de sample opgenomen te worden.
, Agresti H2
2.1 Verschillende types data
Een variabele is een geobserveerde karakteristiek in een studie.
Categorisch: behoort tot een bepaalde categorie (studie, ja/nee, vrijgezel/getrouwd/relatie)
Kwantitatief: neemt een waarde dat een grootheid representeert (leeftijd, lengte)
× Discreet: een heel getal
× Continu: een kommagetal
2.2 Grafische samenvatting van data
Categorische variabelen:
× Een taartdiagram: een cirkel met een taartstuk voor elke categorie.
× Een staafdiagram: een staaf voor elke categorie.
Kwantitatieve variabelen:
× Een dotplot: een lijn met opgesomde dots.
× Een stem-and-leaf plot: de stam is het tiental of honderdtal, het blad geeft het aantal keer een eenheid
weer.
× Histogram: gebruikt een staaf voor het aantal keer voorkomen van een bepaald interval van uitkomsten.
2.3 Het centrum van kwantitatieve data meten
Gemiddelde: de som van alle observaties gedeeld door het aantal observaties.
Mediaan: de middelste waarde van de observaties als alle observaties gerangschikt zijn van klein naar groot.
× De mediaan is bestand tegen outliers.
Modus: de waarde die het vaakst voorkomt.
Het gemiddelde en de mediaan vergelijken bij een steekproefverdeling:
2.4 De variabiliteit van kwantitatieve data meten
Range: het bereik tussen de grootste en de kleinste observatie.
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller melaniebakker. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.05. You're not tied to anything after your purchase.