Samenvatting hoorcolleges en bijbehorende literatuur van Beschrijvende Statistiek.
Inclusief stap voor stap een uitleg van de formules en uitwerkingen.
Premaster (forensisch) Orthopedagogiek en Bachelor pedagogische wetenschappen.
Universiteit van Amsterdam.
Vakcode: (AY) & (7082S033AY)
Beschrijvende Statistiek
Hoorcollege 1: Belangrijke begrippen
Agresti & Franklin (2015) hfd. 1. & 2.1, 2.2. en 2.3
Fundamentele begrippen:
Populatie en steekproef
De verzameling van alle potentieel waarneembare elementen waarop een
onderzoeksvraag betrekking heeft. Bijv. alle mensen die je wilt onderzoeken
of een uitspraak over wilt doen. Het is vaak onmogelijk
om iedereen mee te nemen in je onderzoek, dus trekt
men een steekproef. Een steekproef is een groep
elementen die getrokken wordt uit de populatie.
Het is belangrijk dat je de populatie die je wilt
onderzoeken wel goed afbakent.
Variabele
Is een kenmerk geobserveerd in een onderzoek. 𝛍
Je hebt ook verschillen in variabelen:
★ Categorische variabele:
○ Waarden zijn categorieën (en soms te ordenen)
■ Bijv.: sekse (niet te ordenen)
■ In datasets zie je ze soms als getallen weergeven: 1 =
jongen, 2 = meisje.
■ Groot naar klein (wel te ordenen)
○ Hierbij is het getal niet de hoeveelheid van de variabele, maar
random.
★ Kwantitatieve variabele:
○ Numerieke waarde representeert hoeveelheid van de variabele.
■ Bijv. leeftijd. Het getal is de hoeveelheid en betekent dus
echt iets.
Je hebt binnen de kwantitatieve variabelen nog twee soorten:
● Discrete variabele:
○ Beperkt aantal mogelijke waarden, vaak zijn dit hele getallen.
■ Bijv.: aantal kinderen per gezin. Je hebt hierbij geen halve
getallen.
● Continue variabele:
○ Continuüm van oneindig aantal mogelijke waarden.
■ Bijv. lengte. Je kan ook 1.67 m lang zijn.
1
,Datafile
Verzameling van gegevens over kenmerk(en) geobserveerd in een studie.
Dus de verzameling van de variabelen. Dit kan je dan weergeven in SPSS (=
Statistical Package for the Social Sciences).
Beschrijvende en toetsende statistiek
Bij beschrijvende statistiek (descriptive statistics) ben je bezig met het
exploreren en het samenvatten van data. Wat zit er in de data en hoe
kunnen we dit weergeven?
Bijv. Gemiddeld aantal correct getelde blokjes in de steekproef is 9.
Daarnaast heb je ook nog toetsende statistiek (inferential statistics) hierbij
doet men uitspraken of voorspellingen over een populatie, gebaseerd op
data verzameld bij een steekproef uit de populatie.
Bijv. Met veel zekerheid kunnen we concluderen dat het aantal correct
getelde blokjes bij alle Nederlandse 3,5 jarige kinderen tussen de 7 en 11 ligt.
Statistic en parameter
Statistic is een getal dat een eigenschap van een steekproef weergeeft en
een numerieke samenvatting van data geeft verkregen uit een steekproef.
Dus weer beschrijvende statistiek en kijkend naar dat voorbeeld is het getal 9
(aantal correct getelde blokjes) dan een statistic.
Een parameter is een getal dat een eigenschap van een populatie
weergeeft. Meestal is de parameter onbekend, dus wil men die voorspellen
a.d.h.v. de statistics verkregen uit de steekproef. Het is namelijk soms
onmogelijk om aan de parameter te komen, want je kan bijv. niet alle 3,5
jarige kinderen in Nederland onderzoeken. Dus doet men een voorspelling
a.d.h.v. de statistics uit het onderzoek.
Dit is dus toetsende statistiek.
Samenvatten van data van één variabele (= beschrijvende statistiek)
Je kan het op een aantal verschillende manieren weergeven:
- Grafisch
- Centrummaten: representatieve waarde
- Spreidingsmaten: variatie in de data
Om te kijken naar welke weergave je wilt gebruiken is het van belang dat je
eerst kijkt naar wat voor variabele je hebt (categorisch of kwantitatief).
2
,Opties voor categorische variabelen:
★ Frequentietabel
Hierin wordt aangegeven hoe vaak (= frequentie) elke mogelijke categorie is
geobserveerd in de steekproef.
Bijv. Tellen van blokjes dit kan correct of incorrect gedaan worden en dit kan
je dan weergeven in een
frequentietabel.
Het percentage noemt men ook
wel relatieve frequenties. Dit
geeft weer hoe de frequentie is
t.o.v. de grootte van de
steekproef.
Zo ziet het eruit in SPSS.
Alleen geeft SPSS meer
informatie dan de tabel
hierboven.
Soms kan het namelijk zo zijn dat kinderen niet meer mee willen doen aan je
onderzoek. Dat waren in dit geval 2 kinderen (missing: 2). Dus eigenlijk had je
binnen de steekproef 52 kinderen, waarvan er 2 niet meededen, dus 50. Het
percentage wat SPSS dus weergeeft in de 2e kolom, is het percentage
gebaseerd op 100 % = 52 kinderen. Dat is 17,3; 78,8; 96,2.
En valid percent = het percentage uitgaande van 100 % = een totaal van 50.
Dus daarbij zijn de 2 missende kinderen niet meegenomen (18, 82, 100).
★ Cirkeldiagram of staafdiagram
De grootte van de taartpunten correspondeert met het
percentage observaties in de categorie. Dus 18% kon de
blokjes incorrect tellen en 82% telden de blokjes wel
correct.
Wanneer je teveel categorieën hebt, dan is een
cirkeldiagram niet meer zo overzichtelijk en gebruikt men
eerder een staafdiagram.
3
, In een staafdiagram correspondeert de hoogte van de
staven met de frequentie of het percentage observaties
in de categorie.
Tabel 1: exacte aantal, tabel 2: percentage.
Voor een vergelijking kan men het beste de percentages
nemen. Dan maakt namelijk de grootte van de
steekproef niet uit.
Zo kan je het relatief beter bekijken.
★ Modus/modale categorie
De categorie die het meest geobserveerd is, noemt men de modale
categorie. Het is dus niet het gemiddelde.
Je ziet hier dat 41 en dus
ook 82% de modale
categorie is.
In dit geval was dat de
categorie ‘correct’.
Opties voor kwantitatieve variabelen:
De modus kan ook informatief zijn bij kwantitatieve variabelen. Dit kan alleen
wanneer die kwantitatieve variabelen een beperkt aantal geobserveerde
waarden heeft. De modus is niet de frequentie, maar de hoogst
geobserveerde waarde.
Wanneer je veel meer geobserveerde waarden hebt, is het niet meer zo
informatief om de modus te weten.
Ditzelfde geldt voor een staaf -en cirkeldiagram. Er komt teveel informatie in
een cirkeldiagram, waardoor het overzicht minder wordt. In een
staafdiagram is het wel nog overzichtelijk. Zoals in het onderstaande
voorbeeld te zien is:
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller S8D8D. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.49. You're not tied to anything after your purchase.