100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting literatuur Beschrijvende Statistiek UvA, €6,39   In winkelwagen

Samenvatting

Samenvatting literatuur Beschrijvende Statistiek UvA,

 5 keer bekeken  0 keer verkocht

Een samenvatting van de literatuur per hoorcollege voor het vak Beschrijvende Statistiek aan de UvA.

Voorbeeld 3 van de 30  pagina's

  • Nee
  • 1 t/m 3, 5 t/m 9
  • 20 december 2022
  • 30
  • 2022/2023
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (38)
avatar-seller
evk2002
Literatuur hoorcollege 1 - woensdag 2 november 2022
➔ Hoofdstuk 1 Statistics: the art and science of learning from data
Definitie statistiek
Statistiek is de kunst en wetenschap van het ontwerpen van onderzoeken en het analyseren
van de gegevens die die onderzoeken opleveren. Het uiteindelijke doel is het vertalen van
data naar kennis en begrip van de wereld om ons heen. Kortom, statistiek is de kunst en
wetenschap van het leren van data.

4 componenten (stappen) van statistische probleemoplossing
1. formuleren van een statistische vraag
2. verzamelen van data
3. analyseren van data
4. interpreteren van data

Design
Het plannen van hoe je de data wil verkrijgen die informatie geeft over de statistische vraag
die je wil beantwoorden. Bijvoorbeeld: Hoe zou je een experiment kunnen uitvoeren die
betrouwbaar kan meten of het regelmatig innemen van vitamine C gunstig is?

Beschrijving (=description)
Het samenvatten en analyseren van de verkregen data. Hierbij worden vaak grafische en
numerieke samenvattingen gebruikt.

Gevolgtrekking (=inference)
Het maken van beslissingen en voorspellingen op basis van de verkregen data om de
statistische vraag te beantwoorden.
Probability (‘waarschijnlijkheid’) is hierbij van groot belang. Dit zegt iets over hoeveel kans er
is op verschillende uitkomsten.

Subjects, populaties en samples
Subjects zijn de entiteiten die worden gemeten. Dit zijn vaak mensen, maar dat hoeft niet zo
te zijn. Subjects kunnen ook scholen, gemeenten, landen, etc. zijn.
Populaties zijn alle subjects bij elkaar. In de praktijk hebben we vaak maar van een deel van
een populatie data.
Samples zijn het deel van de populatie waarvan data is verzameld. Er wordt vaak van een
sample data verzameld en niet van een gehele populatie, omdat dat erg duur en
time-consuming is.

Inferential statistics
Gaat over het nemen van beslissingen of het maken van voorspellingen over een hele
populatie, gebaseerd op de data van de sample.

Sample statistieken en populatie parameters
Sample statistieken zijn een numerieke samenvatting van de sample uit een populatie.
Parameters zijn een numerieke samenvatting van de gehele populatie. Deze zijn bijna altijd
onbekend, omdat het te duur is om een hele populatie te ondervragen en het is ook erg
time-consuming om dat te doen.
We gebruiken sample statistieken om schattingen te maken van de parameterwaarden.

,Random sampling
Wordt gebruikt om de sample meer representatief te maken voor de gehele populatie,
waardoor er makkelijker gegeneraliseerd kan worden. Hierdoor kan inference makkelijker
gedaan worden, en zullen conclusies en voorspellingen betrouwbaarder zijn. Dit verhoogt
dus de externe validiteit. (zelfde als bij Onderzoeksmethodologie)

Foutmarge (=margin of error)
De margin of error is een maat voor de verwachte variabiliteit van de ene willekeurige
steekproef naar de volgende.

1
approximate margin of error = x 100% waarbij n het aantal subjects is
𝑛

Om iets ‘zeer waarschijnlijk’ te kunnen noemen hanteren we een 95%
betrouwbaarheidsinterval. Dit wil zeggen dat 95 van de 100 keer iets correct is.

Data files
Er bestaan 2 regels voor het opstellen van een gegevensbestand (data file).
1. Iedere rij bestaat uit metingen van één specifiek subject (persoon).
2. Iedere kolom bestaat uit metingen van één specifiek kenmerk.

Databases
Zijn bestaande verzamelingen van gegevensbestanden (data files).

➔ Hoofdstuk 2 Exploring data with graphs and numerical summaries
Variabelen
Variabelen zijn de kenmerken die werden geobserveerd in een onderzoek. Dit kan
bijvoorbeeld gewicht zijn, maar ook andere zaken. Ze worden meestal in de kolommen van
data files gezet.

Variabelen zijn Kwantitatief of Categorisch
Een kwantitatieve variabele is wanneer waarnemingen worden omgezet in numerieke
waarden die verschillende grootheden van de variabele vertegenwoordigen. Het gaat dus
vooral om nummers.
Een categorische variabele is wanneer elke waarneming tot een reeks van verschillende
categorieën behoort. Bijvoorbeeld ‘ja’ of ‘nee’.

Discrete of Continuous
Kwantitatieve variabelen zijn discrete of continuous.
Een kwantitatieve variabele is discrete (=discreet) als de mogelijke waarden een reeks
afzonderlijke getallen vormen, zoals 0, 1, 2, 3, … Elke variabele met een eindige
hoeveelheid aan mogelijke waarden is discrete.
Een kwantitatieve variabele is continuous (=continu) als de mogelijke waarden een interval
vormen. Elke variabele met een oneindige hoeveelheid aan mogelijke waarden is
continuous.

, Distributie
De distributie van een variabele laat zien hoe de observaties zijn verdeeld over het bereik
van de mogelijke waarden.
Voor een categorische variabele zijn de mogelijke waarden alle verschillende
categorieën en valt iedere observatie onder 1 van de categorieën. Hierbij moet worden
gekeken naar de modale categorie, dat is de categorie met de hoogste frequentie, en naar
hoe vaak iedere categorie werd geobserveerd.
Voor een kwantitatieve variabele worden de mogelijke waarden opgedeeld in een
interval en wordt iedere observatie binnen een interval geplaatst. Hierbij moet worden
gekeken naar de shape, center en variabiliteit.
Shape: Zijn waarnemingen in bepaalde intervallen geclusterd en/of zijn ze dun
verspreid over andere?
Center: Waar valt een typische waarneming?
Variabiliteit: Hoe strak clusteren de waarnemingen rond een centrum?

Frequentietabellen
Een frequentietabel laat de mogelijke waarden voor een
variabele zien, samen met het aantal observaties van
iedere waarde.
De proporties en percentages van het aantal
observaties van iedere categorie kunnen ook worden
getoond in een frequentietabel.
Proporties: het aantal waarnemingen van die
categorie gedeeld door het totaal aantal
𝑎𝑎𝑛𝑡𝑎𝑙 𝑤𝑎𝑎𝑟𝑛𝑒𝑚𝑖𝑛𝑔𝑒𝑛 𝑖𝑛 1 𝑐𝑎𝑡𝑒𝑔𝑜𝑟𝑖𝑒
waarnemingen. 𝑡𝑜𝑡𝑎𝑎𝑙 𝑎𝑎𝑛𝑡𝑎𝑙 𝑤𝑎𝑎𝑟𝑛𝑒𝑚𝑖𝑛𝑔𝑒𝑛
Percentages: proportie x 100.
Proporties en percentages worden ook wel relatieve frequenties genoemd, en zijn een
makkelijke manier om de distributie van een categorische variabele op een numerieke
manier samen te vatten.

Grafieken voor categorische variabelen
Cirkeldiagrammen: zijn cirkels die voor iedere categorie een stukje van
de ‘taart’ (cirkel) hebben. De grootte van het stuk komt overeen met
het percentage van de observaties in die categorie.


Staafdiagrammen: laat voor iedere categorie een verticale staaf
zien. De hoogte van de staaf is het percentage van de observaties in
die categorie. Normaalgesproken zijn de staven voor iedere
categorie los van elkaar, en niet aan elkaar vast.




Pareto diagrammen: zijn staafdiagrammen waarin de categorieën
worden gerangschikt op hun frequentie. Degene die het meest
frequent voorkomt staat dan links.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper evk2002. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,39. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 75619 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€6,39
  • (0)
  Kopen