Statistics: The Art and Science of Learning from Data
Samenvatting voor het vak Beschrijvende Statistiek. Alle hoofdstukken uit het boek inclusief aantekeningen en oefenopgaves + uitwerkingen uit de colleges.
Samenvatting Beschrijvende en Inferentiele statistiek (BIS)
All for this textbook (1)
Written for
Universiteit van Amsterdam (UvA)
Pedagogische Wetenschappen
Beschrijvende Statistiek (70110102AY)
All documents for this subject (40)
2
reviews
By: Doortje19s • 2 year ago
By: ruthvisser • 2 year ago
Seller
Follow
uva2021
Reviews received
Content preview
Hoofdstuk 1; Statistics: The Art and Science of Learning from Data
Statistiek De wetenschap van het ontwerpen van een onderzoek en het analyseren van
de informatie die een onderzoek oplevert. Het uiteindelijke doel is het vertalen
van data naar kennis en begrip van de wereld om ons heen.
Kortom, statistiek is de kunst en wetenschap van het leren van data.
Data De informatie die wordt verzameld met experimenten en enquêtes
Statistische probleemoplossing is een onderzoeksproces dat uit vier componenten bestaat:
1. Een statistische vraag formuleren
2. Data verzamelen
3. Data analyseren
4. Resultaten interpreteren
De drie belangrijkste componenten voor het beantwoorden van een statistische vraag zijn:
1. Ontwerp: Aangeven wat het doel en/of statistische kwestie van interesse is en
plannen hoe data te verkrijgen die betrekking hebben op het onderwerp van het
onderzoek
2. Beschrijving: Samenvatten en analyseren van de verkregen data
3. Inferentie: Beslissingen nemen en voorspellingen doen op basis van de data om de
statistische vraag te beantwoorden
Verschil Beschrijving en inferenties
Beschrijving; beschrijven van wat de steekproef heeft opgeleverd. Wat waren de resultaten
van de steek
Inferenties; de resultaten van de steekproef generaliseren naar de populatie. Dus op basis van
de gegevens van de steekproef een conclusie trekken over de hele populatie.
Ontwerp Het plannen van het verkrijgen van data die licht werpen op de statistische d
kwestie van belang
Bijvoorbeeld:
- Hoe zou een experiment uitgevoerd kunnen worden om
betrouwbaar antwoord te kunnen geven op de vraag?
- Hoe worden de respondenten geselecteerd, zodat de gegevens een
goede voorspelling geven over de toekomst?
Beschrijving Het verkennen en samenvatten van patronen in de data bij steekproeven
Data wordt omgezet in cijfers en grafieken, zodat het makkelijk beoordeeld en
omschreven kan worden. Een beschrijvende statistische analyse combineert
meestal grafische en numerieke samenvattingen.
Het belangrijkste doel is om de gegevens te samenvatten zonder informatie te
vervormen of verliezen. Grafieken en getallen zoals percentages en
gemiddelden zijn gemakkelijker te begrijpen dan de hele set gegevens.
Beschrijvende statistiek is ook nuttig wanneer gegevens voor de gehele
bevolking beschikbaar zijn, zoals bij een volkstelling.
Bijvoorbeeld:
- Gegevens dat verzameld is met al doel ontdekken hoeveel tv
mensen kijken per week; het is makkelijker om het gemiddelde te
1
, berekenen of om een grafiek te gebruiken die laat zien hoe het
aantal uren tv-kijken per dag zich verhoudt tot het aantal uren per
week sporten
Inferentie Het nemen van beslissingen of het doen van voorspellingen op basis van de
data. Deze beslissingen en voorspellingen gaan meestal over grote groep
mensen en niet alleen over degenen die hebben deelgenomen aan het
onderzoek. Inferenties worden gebruikt wanneer gegevens alleen beschikbaar
zijn voor de steekproef, maar er een beslissing moet worden genomen of en
een voorspelling moet worden gedan over de hele populatie
Bijvoorbeeld:
- Bepalen dat iemand heeft gewonnen bij de verkiezingen door aan
mensen te vragen op wie ze hebben gestemd
Waarschijnlijkheid Berekenen hoe waarschijnlijk verschillende mogelijke uitkomsten
Probability zijn.
Variabele Een variabele is een attribuut dat waarden verandert tussen mensen of
dingen die worden bestudeerd.
Onderwerpen De eenheden die in een onderzoek onderzocht worden. Onderwerpen
kunnen scholen, landen of dagen zijn
Populatie Het totaal totale set van onderwerpen van interesse. Het uiteindelijke
doel van de meeste onderzoeken is om meer te weten te komen over
de populatie
Steekproef Elementen die worden gekozen binnen een populatie met de bedoeling
iets te weten te komen over de populatie waaruit ze zijn genomen.
Meestal is het te kostbaar en tijdrovend om gegevens van een hele
populatie te verkrijgen. Het is praktischer om gegevens voor een
steekproef te verzamelen en analyseren.
Bijvoorbeeld:
Een onderzoek met als doel de uitkomst van de gouverneursverkiezingen van 2010 in
Californië te voorspellen. De exitpoll onderzocht 3889 van de 9,5 miljoen mensen die hebben
gestemd.
De populatie is; de 9,5 miljoen mensen die hebben gestemd
De sample is; De 3889 mensen aan wie ze hebben gevraagd op wie ze hebben gestemd.
Steekproefstatistiek Elk getal dat is berekend op basis van uw steekproefgegevens.
Sample statisctic Wanneer de informatie zoals een gemiddelde, mediaan of een
ander soort statistiek afkomstig is uit de gegevens van de
steekproef, wordt dit een steekproefstatistiek genoemd.
Parameter Een numerieke samenvatting van de populatie.
2
,Statistiek Een numerieke samenvatting van een steekproef uit de
Statisctic populatie.
Verschil parameter en statistiek:
- Parameter gaat over de populatie en statistiek over de steekproef
Random sampling De steekproef wordt willekeurig gekozen en elk element in de
populatie heeft dezelfde kans om in de steekproef opgenomen
te worden. Dit zorgt ervoor dat de steekproef een goede
afspiegeling is van de populatie, door groepen in evenwicht te
houden op het gebied van andere factoren die de resultaten
kunnen beïnvloeden.
Foutenmarge Een maat voor de verwachte variabiliteit van de ene
willekeurige steekproef naar de volgende willekeurige
steekproef. De marge waarbinnen de resultaten gelden.
Bijvoorbeeld:
- Een monster van dezelfde grootte zou een aandeel van 29% kunnen
opleveren, terwijl een tweede 32% zou kunnen opleveren. Een
foutenmarge van plus of min 3 procentpunten betekent dat het
zeer waarschijnlijk is dat het populatiepercentage niet meer dan 3%
lager of 3% hoger is dan het gerapporteerde steekproefpercentage.
Dus als Gallup meldt dat 30% zich zorgen maakt over de kosten van
de gezondheidszorg, is het zeer waarschijnlijk dat in de hele
bevolking het percentage dat zich zorgen maakt over de kosten van
de gezondheidszorg tussen ongeveer 27% en 33% ligt (dat wil
zeggen, binnen 3% van
30%).
n Het aantal proefpersonen die in de steekproef zijn opgenomen
Statistisch significant Wanneer het verschil tussen de resultaten voor de twee
behandelingen zo groot is dat het zeldzaam zou zijn om zo'n
verschil te zien door gewone willekeurige variatie, wat
suggereert dat de resultaten alleen aan toeval te wijten zijn
Om statistische analyse gemakkelijker te maken, zijn grote datasets in een gegevensbestand
geordend. Dit bestand heeft meestal de vorm van een spreadsheet. Het is de manier waarop
statistische software de gegevens ontvangt. De meeste onderzoeken ontwerpen
experimenten of enquêtes om gegevens te verzamelen Vaak is het echter voldoende om
gebruik te maken van bestaande gearchiveerde verzamelingen van gegevensbestanden,
databases genoemd
3
, Hoofdstuk 2; Exploring Data with Graphs and Numerical Summaries
Variabele Een variabele is een attribuut dat waarden verandert tussen
mensen of dingen die worden bestudeerd. Een variabele is elk
kenmerk dat in een onderzoek wordt waargenomen. De term
variabele benadrukt dat gegevenswaarden variëren.
Variabiliteit Gegevenswaarden die variëren. De meest voorkomende maten
voor variabiliteit zijn het bereik, het interkwartielbereik (IQR), de
variantie en de standaardafwijking. hoe strak zijn de
waarnemingen clusteren rond een centrum
Categorische variabelen Variabelen die in te delen zijn in categorieën, zoals bijvoorbeeld
geslacht, haarkleur enz. Cijfers kunnen gebruikt worden om te
coderen, maar hebben geen betekenis.
Bijvoorbeeld; 1=meisjes en 2=jongens
Kwantitatieve variabelen Numerieke waarden die verschillende grootheden van de
variabelen weergeven. Kwantitatieve variabelen meten
"hoeveel" van iets. Met kwantitatieve variabelen is het mogelijk
om rekenkundige samenvattingen vinden, zoals gemiddelden.
- Discrete variabelen; geen tussenwaarden. Hele getallen.
Bijvoorbeeld; iemand heeft 2 kinderen en niet 2,2 kinderen.
- Continue variabelen; alle tussenliggende waarden hebben ook
betekenis.
Bijvoorbeeld; iemand is 1,7456m lang.
Verdeling Hoe de waarnemingen van een variabele zijn verdeeld over het
bereik van mogelijke waarden.
- Voor een categorische variabele zijn de mogelijke waarden de
verschillende categorieën, en elke waarneming valt in een van de
categorieën. De verdeling voor een categorische variabele toont
dan eenvoudig alle mogelijke categorieën en het aantal
waarnemingen dat in elke categorie valt. Kenmerken waarnaar
moet worden gezocht in de distributie van een categorische
variabele zijn de categorie met de grootste frequentie en meer in
het algemeen hoe vaak elke categorie werd waargenomen.
- Voor een kwantitatieve variabele wordt het hele bereik van
mogelijke waarden opgesplitst in afzonderlijke intervallen en wordt
het aantal waarnemingen dat in elk interval valt, gegeven.
Kenmerken om op te letten bij de verdeling van een kwantitatieve
variabele zijn de vorm, centrum, en variabiliteit.
Modale categorie Categorie met de grootste frequentie
Modus De waarde met de grootste frequentie
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller uva2021. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $10.30. You're not tied to anything after your purchase.