Statistics: The Art and Science of Learning from Data
Samenvatting van alle benodigde hoofdstukken voor het vak Beschrijvende Statistiek aan de UvA. Geschikt voor zowel bachelor studenten als Premaster studenten.
Basic Statistics: Chapter 2- Exploring Data with Graphs and Numerical Summaries
Basic Statistics: Chapter 1- The Art and Science of Learning from Data
All for this textbook (5)
Written for
Universiteit van Amsterdam (UvA)
Pedagogische Wetenschappen
Beschrijvende Statistiek
All documents for this subject (39)
1
review
By: jaraalders • 2 year ago
Seller
Follow
robinkraakman
Reviews received
Content preview
Beschrijvende statistiek
Sem 1 P 2
Inhoudsopgave
HC1 1 nov...................................................................................................................................................... 2
H1 Statistics: The art and science of learning from data.....................................................................................2
2.1 Different types of data...................................................................................................................................4
2.2 Graphical summaries of data.........................................................................................................................6
2.3 Measuring the center of quantitative data....................................................................................................8
HC2 5 nov...................................................................................................................................................... 9
2.4 Measuring the variability of quantitative data..............................................................................................9
2.5 Using measures of position to describe variability......................................................................................11
2.6 Recognizing and avoiding misuses of graphical summaries........................................................................14
HC 3-10 nov................................................................................................................................................. 14
3.1 The association between two categorical variables....................................................................................14
3.2 The association between two quantitative variables..................................................................................16
HC4-12 nov.................................................................................................................................................. 19
3.3 Predicting the outcome of a variable...........................................................................................................19
3.4 Cautions in analyzing associations...............................................................................................................21
HC 5-17 nov:................................................................................................................................................ 22
5.1 How probability quantifies randomness......................................................................................................22
5.2 Finding probabilities.....................................................................................................................................24
HC 6-19 nov................................................................................................................................................. 28
5.3 Conditional probability.................................................................................................................................28
5.4 Applying the probability rules......................................................................................................................30
HC 7-24 nov................................................................................................................................................. 31
6.1 Summarizing possible outcomes and their probabilities.............................................................................31
6.2 Probabilities for bell-shaped distributions...................................................................................................33
HC8 – 26 nov................................................................................................................................................ 34
6.3 Probabilities when each observation has two possible outcomes...............................................................34
7.1 How sample proportions vary around the population proportion...............................................................36
HC9-1 dec.................................................................................................................................................... 37
7.2 How sample means vary around the population mean...............................................................................37
8.1 Point and interval estimates of population parameters..............................................................................38
,HC10 – 3 dec................................................................................................................................................ 41
8.2 Constructing a confidence interval to estimate a population proportion....................................................41
8.3 Constructing a confidence interval to estimate a population mean............................................................42
HC11............................................................................................................................................................ 45
8.4 Choosing the sample size for a study...........................................................................................................45
9.1 Steps for performing a significance test.......................................................................................................46
HC12............................................................................................................................................................ 48
9.2 Significance tests about proportions............................................................................................................48
9.3 Significance tests about means....................................................................................................................50
HC13............................................................................................................................................................ 52
9.4 Decisions and types of errors in significance tests.......................................................................................52
9.5 Limitations of significance tests...................................................................................................................52
9.6 The likelihood of a type II error and the power of a test..............................................................................53
Categorische Proporties om de Proportie = aantal
variabele relatieve frequentie van in de categorie
observaties in een gedeeld door de
categorie samen te steekproefgrootte
vatten.
Kwantitatieve Gemiddelde om het
variabele midden van de
observaties samen te
vatten
HC1 1 nov
H1 Statistics: The art and science of learning from data
Data de informatie die we verzamelen met experimenten en surveys.
Infer een beslissing of verwachting bereiken door redeneren zonder
bewijs. Statistical inference doet dit door data te gebruiken als
bewijs.
Statistiek manier van denken over data en kwantificering van
onzekerheid. Het analyseren van data van een onderzoek.
Doel is vertalen van data in kennis en begrip van de wereld om
ons heen. Kunst en wetenschap van leren van data.
De drie componenten/stages van statistics om de statistische
vraagstelling te beantwoorden
1. Design
, het doel/statistische vraagstelling melden en plannen van
het verkrijgen van de data die nodig is om de statistische
vraagstelling te beantwoorden.
2. Beschrijving/descriptive statistics/beschrijvende
statistiek
Samenvatten en analyseren van de data die verkregen
is/verkennen/samenvatten van patronen in de data. Dus
enkel over de steekproef.
Deze beschrijvingen bestaan meestal uit grafische
weergaves en nummers zoals gemiddelde en percentages.
Doel is het verminderen van de data naar simpele
samenvattingen zonder al te veel informatie te verliezen.
(% zijn makkelijker te begrijpen dan een hele set aan data).
Kan ook gebruikt worden wanneer we data hebben van de
gehele populatie.
3. Inference/gevolgentrekking/inferential
statistics/toetsende statistiek
Beslissingen maken en voorspellingen maken gebaseerd op
de data voor het beantwoorden van de statistische vraag.
Gaat vaak over de populatie en niet alleen de steekproef.
Zijn dus manieren om beslissingen over voorspellingen te
maken over de populatie, gebaseerd op data die verkregen
is van een sample van de populatie.
Hierbij is een belangrijk onderdeel het rapporteren van de
verwachtte precisie van een voorspelling. Hoe dicht licht de
sample waarde bij de populatie waarde? (margin of error)
die is meestal net zo groot bij een sample
van 1000 en een populatie van 1 miljoen als
bij een sample van 1000 en een populatie
van 50 miljoen.
is een maat voor de verwachte variabiliteit
tussen de ene aselecte steekproef en de
volgende aselecte steekproef. En hoever dat
dus afwijkt van de populatiewaarden.
confidence interval zegt iets over hoe
vaak we verwachten dat de margin of error
klopt met de populatiewaarde
De vier componenten van statistisch probleem oplossen
1. Formuleren van statistische vraagstelling
(Design) heeft ook effect op beschrijving en
inference/gevolgentrekking. De soort vraag bepaald
namelijk hoe je statistische informatie
weergeeft/analyseert.
2. Verzamelen van data
(Design)
3. Analyseren van data
(Beschrijving en inference/gevolgentrekking)
4. Interpreteren van de resultaten
, Probability is een framework/kader voor het bepalen/weergeven hoe
waarschijnlijk verschillende mogelijke uitkomsten zijn.
Subjects de eenheden die we meten in een onderzoek. Meestal zijn dit
mensen. Kunnen ook scholen zijn of landen bijv.
Populatie de set van alle subjects van interesse, waar je een uitspraak
over wil doen. Meestal heb je alleen data van sommige van
deze subjects (de steekproef/sample).
Statisticstatistische gegevens over de sample. Numeriek overzicht van
de sample.
Parameter statistische gegevens over de populatie. Numeriek
overzicht van de bevolking/populatie. De ware parameter is
meestal onbekend. Daarom gebruiken we sample statistics om
de parameter waarde te schatten.
Random sampling wanneer elk subject in de populatie dezelfde kans
heeft om in de sample te komen. Nodig om de sample
representatief te maken voor de populatie.
Variatie in een gerandomiseerd is ongeveer even groot als de
margin of error dus
Experiment/gewone variatie zou je met dezelfde formule kunnen
berekenen. Is belangrijk om te bepalen of het
effect wat je denkt te zien van je manipulatie
daadwerkelijk door de manipulatie komt of
door variatie in de sample.
hoe groter de sample hoe kleiner de
variatie waarschijnlijk is
Wanneer het verschil tussen de
uitkomsten van twee behandelingen en de
verwachte variatie in de sample groot is, kan
gezegd worden dat de resultaten statistisch
significant zijn en dus dat de behandeling
waarschijnlijk werkt.
Data file grote hoeveelheden data zijn georganiseerd in data files.
Meestal in een spreadsheet.
2.1 Different types of data
Variabelen de karakteristieken die bestudeerd worden in een
onderzoek. Staan meestal in een kolom weergegeven in de
dataset. De waarde van een variabele varieert en verschilt
tussen de mensen. De datawaardes die we observeren zijn
observaties/waarnemingen. Deze observaties kunnen
nummers (centimeters bijv.) bevatten of categorieën (ja of
nee)
Categorical/categorische variabele
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller robinkraakman. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.60. You're not tied to anything after your purchase.