Statistics: The Art and Science of Learning from Data
Samenvatting voor het vak Beschrijvende Statistiek. Alle hoofdstukken uit het boek inclusief aantekeningen en oefenopgaves + uitwerkingen uit de colleges.
Samenvatting Beschrijvende en Inferentiële Statistiek (S_PMBIS) deeltentamen 2
Samenvatting Statistics: The Art and Science of Learning from Data - Statistiek 1
Samenvatting Beschrijvende en Inferentiele statistiek (BIS)
Alles voor dit studieboek (38)
Geschreven voor
Universiteit van Amsterdam (UvA)
Pedagogische Wetenschappen
Beschrijvende Statistiek (70110102AY)
Alle documenten voor dit vak (40)
2
beoordelingen
Door: Doortje19s • 2 jaar geleden
Door: ruthvisser • 2 jaar geleden
Verkoper
Volgen
uva2021
Ontvangen beoordelingen
Voorbeeld van de inhoud
Hoofdstuk 1; Statistics: The Art and Science of Learning from Data
Statistiek De wetenschap van het ontwerpen van een onderzoek en het analyseren van
de informatie die een onderzoek oplevert. Het uiteindelijke doel is het vertalen
van data naar kennis en begrip van de wereld om ons heen.
Kortom, statistiek is de kunst en wetenschap van het leren van data.
Data De informatie die wordt verzameld met experimenten en enquêtes
Statistische probleemoplossing is een onderzoeksproces dat uit vier componenten bestaat:
1. Een statistische vraag formuleren
2. Data verzamelen
3. Data analyseren
4. Resultaten interpreteren
De drie belangrijkste componenten voor het beantwoorden van een statistische vraag zijn:
1. Ontwerp: Aangeven wat het doel en/of statistische kwestie van interesse is en
plannen hoe data te verkrijgen die betrekking hebben op het onderwerp van het
onderzoek
2. Beschrijving: Samenvatten en analyseren van de verkregen data
3. Inferentie: Beslissingen nemen en voorspellingen doen op basis van de data om de
statistische vraag te beantwoorden
Verschil Beschrijving en inferenties
Beschrijving; beschrijven van wat de steekproef heeft opgeleverd. Wat waren de resultaten
van de steek
Inferenties; de resultaten van de steekproef generaliseren naar de populatie. Dus op basis van
de gegevens van de steekproef een conclusie trekken over de hele populatie.
Ontwerp Het plannen van het verkrijgen van data die licht werpen op de statistische d
kwestie van belang
Bijvoorbeeld:
- Hoe zou een experiment uitgevoerd kunnen worden om
betrouwbaar antwoord te kunnen geven op de vraag?
- Hoe worden de respondenten geselecteerd, zodat de gegevens een
goede voorspelling geven over de toekomst?
Beschrijving Het verkennen en samenvatten van patronen in de data bij steekproeven
Data wordt omgezet in cijfers en grafieken, zodat het makkelijk beoordeeld en
omschreven kan worden. Een beschrijvende statistische analyse combineert
meestal grafische en numerieke samenvattingen.
Het belangrijkste doel is om de gegevens te samenvatten zonder informatie te
vervormen of verliezen. Grafieken en getallen zoals percentages en
gemiddelden zijn gemakkelijker te begrijpen dan de hele set gegevens.
Beschrijvende statistiek is ook nuttig wanneer gegevens voor de gehele
bevolking beschikbaar zijn, zoals bij een volkstelling.
Bijvoorbeeld:
- Gegevens dat verzameld is met al doel ontdekken hoeveel tv
mensen kijken per week; het is makkelijker om het gemiddelde te
1
, berekenen of om een grafiek te gebruiken die laat zien hoe het
aantal uren tv-kijken per dag zich verhoudt tot het aantal uren per
week sporten
Inferentie Het nemen van beslissingen of het doen van voorspellingen op basis van de
data. Deze beslissingen en voorspellingen gaan meestal over grote groep
mensen en niet alleen over degenen die hebben deelgenomen aan het
onderzoek. Inferenties worden gebruikt wanneer gegevens alleen beschikbaar
zijn voor de steekproef, maar er een beslissing moet worden genomen of en
een voorspelling moet worden gedan over de hele populatie
Bijvoorbeeld:
- Bepalen dat iemand heeft gewonnen bij de verkiezingen door aan
mensen te vragen op wie ze hebben gestemd
Waarschijnlijkheid Berekenen hoe waarschijnlijk verschillende mogelijke uitkomsten
Probability zijn.
Variabele Een variabele is een attribuut dat waarden verandert tussen mensen of
dingen die worden bestudeerd.
Onderwerpen De eenheden die in een onderzoek onderzocht worden. Onderwerpen
kunnen scholen, landen of dagen zijn
Populatie Het totaal totale set van onderwerpen van interesse. Het uiteindelijke
doel van de meeste onderzoeken is om meer te weten te komen over
de populatie
Steekproef Elementen die worden gekozen binnen een populatie met de bedoeling
iets te weten te komen over de populatie waaruit ze zijn genomen.
Meestal is het te kostbaar en tijdrovend om gegevens van een hele
populatie te verkrijgen. Het is praktischer om gegevens voor een
steekproef te verzamelen en analyseren.
Bijvoorbeeld:
Een onderzoek met als doel de uitkomst van de gouverneursverkiezingen van 2010 in
Californië te voorspellen. De exitpoll onderzocht 3889 van de 9,5 miljoen mensen die hebben
gestemd.
De populatie is; de 9,5 miljoen mensen die hebben gestemd
De sample is; De 3889 mensen aan wie ze hebben gevraagd op wie ze hebben gestemd.
Steekproefstatistiek Elk getal dat is berekend op basis van uw steekproefgegevens.
Sample statisctic Wanneer de informatie zoals een gemiddelde, mediaan of een
ander soort statistiek afkomstig is uit de gegevens van de
steekproef, wordt dit een steekproefstatistiek genoemd.
Parameter Een numerieke samenvatting van de populatie.
2
,Statistiek Een numerieke samenvatting van een steekproef uit de
Statisctic populatie.
Verschil parameter en statistiek:
- Parameter gaat over de populatie en statistiek over de steekproef
Random sampling De steekproef wordt willekeurig gekozen en elk element in de
populatie heeft dezelfde kans om in de steekproef opgenomen
te worden. Dit zorgt ervoor dat de steekproef een goede
afspiegeling is van de populatie, door groepen in evenwicht te
houden op het gebied van andere factoren die de resultaten
kunnen beïnvloeden.
Foutenmarge Een maat voor de verwachte variabiliteit van de ene
willekeurige steekproef naar de volgende willekeurige
steekproef. De marge waarbinnen de resultaten gelden.
Bijvoorbeeld:
- Een monster van dezelfde grootte zou een aandeel van 29% kunnen
opleveren, terwijl een tweede 32% zou kunnen opleveren. Een
foutenmarge van plus of min 3 procentpunten betekent dat het
zeer waarschijnlijk is dat het populatiepercentage niet meer dan 3%
lager of 3% hoger is dan het gerapporteerde steekproefpercentage.
Dus als Gallup meldt dat 30% zich zorgen maakt over de kosten van
de gezondheidszorg, is het zeer waarschijnlijk dat in de hele
bevolking het percentage dat zich zorgen maakt over de kosten van
de gezondheidszorg tussen ongeveer 27% en 33% ligt (dat wil
zeggen, binnen 3% van
30%).
n Het aantal proefpersonen die in de steekproef zijn opgenomen
Statistisch significant Wanneer het verschil tussen de resultaten voor de twee
behandelingen zo groot is dat het zeldzaam zou zijn om zo'n
verschil te zien door gewone willekeurige variatie, wat
suggereert dat de resultaten alleen aan toeval te wijten zijn
Om statistische analyse gemakkelijker te maken, zijn grote datasets in een gegevensbestand
geordend. Dit bestand heeft meestal de vorm van een spreadsheet. Het is de manier waarop
statistische software de gegevens ontvangt. De meeste onderzoeken ontwerpen
experimenten of enquêtes om gegevens te verzamelen Vaak is het echter voldoende om
gebruik te maken van bestaande gearchiveerde verzamelingen van gegevensbestanden,
databases genoemd
3
, Hoofdstuk 2; Exploring Data with Graphs and Numerical Summaries
Variabele Een variabele is een attribuut dat waarden verandert tussen
mensen of dingen die worden bestudeerd. Een variabele is elk
kenmerk dat in een onderzoek wordt waargenomen. De term
variabele benadrukt dat gegevenswaarden variëren.
Variabiliteit Gegevenswaarden die variëren. De meest voorkomende maten
voor variabiliteit zijn het bereik, het interkwartielbereik (IQR), de
variantie en de standaardafwijking. hoe strak zijn de
waarnemingen clusteren rond een centrum
Categorische variabelen Variabelen die in te delen zijn in categorieën, zoals bijvoorbeeld
geslacht, haarkleur enz. Cijfers kunnen gebruikt worden om te
coderen, maar hebben geen betekenis.
Bijvoorbeeld; 1=meisjes en 2=jongens
Kwantitatieve variabelen Numerieke waarden die verschillende grootheden van de
variabelen weergeven. Kwantitatieve variabelen meten
"hoeveel" van iets. Met kwantitatieve variabelen is het mogelijk
om rekenkundige samenvattingen vinden, zoals gemiddelden.
- Discrete variabelen; geen tussenwaarden. Hele getallen.
Bijvoorbeeld; iemand heeft 2 kinderen en niet 2,2 kinderen.
- Continue variabelen; alle tussenliggende waarden hebben ook
betekenis.
Bijvoorbeeld; iemand is 1,7456m lang.
Verdeling Hoe de waarnemingen van een variabele zijn verdeeld over het
bereik van mogelijke waarden.
- Voor een categorische variabele zijn de mogelijke waarden de
verschillende categorieën, en elke waarneming valt in een van de
categorieën. De verdeling voor een categorische variabele toont
dan eenvoudig alle mogelijke categorieën en het aantal
waarnemingen dat in elke categorie valt. Kenmerken waarnaar
moet worden gezocht in de distributie van een categorische
variabele zijn de categorie met de grootste frequentie en meer in
het algemeen hoe vaak elke categorie werd waargenomen.
- Voor een kwantitatieve variabele wordt het hele bereik van
mogelijke waarden opgesplitst in afzonderlijke intervallen en wordt
het aantal waarnemingen dat in elk interval valt, gegeven.
Kenmerken om op te letten bij de verdeling van een kwantitatieve
variabele zijn de vorm, centrum, en variabiliteit.
Modale categorie Categorie met de grootste frequentie
Modus De waarde met de grootste frequentie
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper uva2021. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €9,49. Je zit daarna nergens aan vast.