Afronden in decimalen:
- In de tussenliggende berekeningen op 4 decimalen
- Het uiteindelijke antwoorden op 2 decimalen
Hoorcollege 1
Leerdoelen:
- Begrip van fundamentele begrippen die horen bij statistiek:
Steekproef en populatie
Variabele
‘statistic’ en parameter
Beschrijvende en toetsende statistiek
- Een passende centrummaat bij het type variabele kiezen en berekenen
- Data grafisch weergeven op een manier die past bij het type variabele
De informatie/ gegevens die wordt verzameld middels experimenten en vragenlijsten wordt
data genoemd. Statistiek zegt wat over deze data in de vorm cijfers/ getallen. Statistiek in
veldonderzoek is de manier van denken over de verzamelde data (geen massale nummers).
Statistiek = ontwerpen van studies en het analyseren van de data die deze studies
produceren. Het uiteindelijke doel van statistiek is het vertalen van de data in kennis en
begrip over de wereld om ons heen > ‘Statistics is the art and science of learning from data’.
Het oplossen van statische problemen is een proces dat bestaat uit vier verschillende
componenten:
1. Formuleren van een statische vraag
2. Data verzamelen
3. Analyseren van data
4. Resultaten interpreteren
Voorbeelden van gebruik van statische onderzoeken,
- Exit poll
- Conclusies trekken in medisch onderzoek
- Inzet van vragenlijsten om de overtuigingen van mensen te onderzoeken
Drie hoofdzaken van statistiek om statische vragen te beantwoorden:
1. Design: plannen hoe de data wordt verzameld. Het gaat hier om data dat
noodzakelijk is de vragen te kunnen beantwoorden. Er moet worden nagedacht hoe
de informatie wordt geanalyseerd en welke statistiek hier op toe wordt gepast.
a. Plannen van dataverzameling
b. Randomiseren of niet? Hoe wordt de informatie verzameld etc.
2. Description (beschrijving): Samenvatten en analyseren van de data dat is
verzameld. Beschrijven van de data doormiddel van het bepalen van centrummaten
(gemiddelde, mediaan), spreiding, range.
a. Vanuit de grote hoeveelheden data, een samenvatting maken om ze te
kunnen analyseren (ruwe data is teveel)
, 3. Inference (gevolgtrekkingen): Het maken van keuzes en voorspellingen is
gebaseerd op de verzamelde data. Met data over de steekproef, voorspellingen voor
de algehele populatie.
a. Maken van keuzes en voorspellingen gebaseerd op de data.
b. Manieren van dataverzameling,
i. Statische description (beschrijving) > statische beschrijving biedt
handige samenvattingen die ervoor zorgen om patronen in de data te
vinden.
ii. Statische inference (gevolgtrekking) > maken van voorspellingen en
beslissen welke geobserveerde data bruikbaar is.
1. Probability = waarschijnlijkheid / kans. Probability betreft het
kader om te kwantificeren hoe waarschijnlijk verschillende
mogelijke uitkomsten zouden zijn.
a. Kans
Een variabele is een eigenschap dat wordt gemeten zoals het aantal uren dat er per dag
televisie wordt gekeken.
Statistiek bestaat uit methoden voor het ontwerpen van onderzoekstudies, beschrijven van
de data en het maken van gevolgtrekkingen die gebaseerd zijn op de data om een statische
vraag te kunnen beantwoorden
Subjects (onderwerpen) zijn het geheel dat wordt gemeten in een onderzoek. Vaak zijn deze
onderwerpen mensen maar dit hoeft niet altijd! Onderwerpen kunnen ook scholen, staten of
dagen zijn. Voorbeelden van het meten van eigenschappen:
o Voor elke school
o Voor elk land
o Voor elke dag in het café
De populatie is de optelsom van alle onderwerpen. Er is sprake van een (monster/
steekproef) sample wanneer alleen een deel van de onderwerpen tot de populatie hoort. Niet
de gehele populatie wordt onderzocht. Een Sample wordt meestal gerandomiseerd
geselecteerd.
Het doel van vele studies is om meer te leren uit de populatie.
Betekenis van de fundamentele begrippen:
o Populatie: Populatie is het totaal van alle elementen, totaal van
alle personen waarin je geïnteresseerd bent
Nederlandse peuters voordat zij naar de
basisschool gaan
o Paramater > vaak onbekend
o Steekproef: Een steekproef is een klein deel uit de populatie die
wordt onderzocht omdat de al gehele populatie te groot om in zijn geheel te
onderzoeken is.
Meten bij 52, 3,5-jarige kinderen in Nederland
o Statistic > gemiddelde
,Er is veel variabiliteit tussen mensen in de wereld. Verschillende vormen van variabiliteit
Variatie tussen onderwerpen > verschil in gewicht tussen klasgenoten, favoriete sport
en religie
Verschillen tussen eigenschappen per onderwerp en veranderbaar over de tijd > de
hoeveelheid tijd geïnvesteerd in de studie in een dag. Dit kan per student verschillen.
Variabelen zijn de eigenschappen die in een studie geobserveerd worden. De term
benadrukt dat de data varieert.
o Variabelen: Een bepaald kenmerk van de steekproef dat wordt gemeten
o Categorische variabelen zijn variabelen die je kunt indelen in categorieën
zoals sekse (jongens of meisjes). De waarde die aan een categorie wordt
gekoppeld, heeft geen betekenis. Ze kunnen wel gebruikt worden om te
ordenen zoals opleidingsniveaus. Een observatie is categoriaal wanneer elke
observatie tot een set of categorieën hoort
Voorbeelden zijn: geslacht (man of vrouw), religie (katholiek,
joods etc.)
Belangrijkste kenmerken,
Relatieve hoeveelheid van de observatie in de
verschillende categorieën
Nominaal (geen ordening) of ordinaal (wel
ordenen)
o Kwantitatieve variabelen. De waarde bij kwantitatieve variabelen heeft wel
een betekenis. De waarde representeert hoeveel van de variabelen je hebt.
Zoals leeftijd
Er is sprake van een kwantitatieve observatie wanneer de observatie
wordt omgezet in gecijferde waarden die de verschillende groottes van
de variabelen weergeven.
Meten van hoeveel iets is
Opzoek naar het gemiddelde
Voorbeelden zijn: temperatuur, leeftijd, aantal broertjes en
zusjes, inkomen.
Belangrijkste kenmerken,
Centrummaat
Variabiliteit
Spreiding
o Discreet of continue
Discreet; set van afzonderlijke nummers zoals 0, 1, 2 en 3
Aantal dieren in een huishouden, kinderen in de familie.
De uitkomst van de variabele is een optelsom
Continue; mogelijke variabelen vormen een interval
Lengte, gewicht, leeftijd
Geen afzonderlijke getallen
We meten of 3,5-jarige kinderen vijf blokjes correct kunnen tellen (ja/nee). Dit is een
voorbeeld van een categorische variabele. Er wordt immers alleen maar gemeten of ze
correct kunnen tellen, er zijn twee categorieën.
o Statistic en parameter zijn een samenvatting van de verzamelde data. Zoals een
gemiddelde bij een statistic. Voornamelijk wordt er gebruik gemaakt van statistics
, omdat een parameter niet aanwezig is, de statistic wordt ingezet om iets te kunnen
zeggen over de parameter.
o Toetsende statistiek: De statistics worden gebruikt om iets te zeggen over de
parameters in de populatie.
o Verwijst naar manieren om beslissingen of voorspellingen te kunnen maken
over een populatie. Deze beslissingen en voorspellingen zijn gebaseerd op
een steekproef van de algehele populatie.
Wordt ingezet wanneer er data beschikbaar is voor alleen een
steekproef
o Beschrijvende statistiek: Beschrijven van de data, beschrijven van de steekproef.
Samenvatten van de data door bijvoorbeeld een gemiddelde.
o De methode van het samenvattend van de verzamelde data. De samenvatting
bestaat uit tekens en nummers zoals percentages
Grafische en nummerical samenvattingen
Het doel van beschrijvende statistiek is het vertalen van de data in
simpele samenvattingen zonder te veel informatie te verliezen
Worden ingezet wanneer er data beschikbaar is van de gehele
populatie (census).
In de meeste onderzoeken is er data van een steekproef aanwezig en niet data van de
gehele populatie. Beschrijvende statistiek wordt gebruikt bij het samenvatten van de data
van de steekproef en toetsende (inference) statistiek wordt ingezet om voorspellingen te
doen over die populatie.
Een belangrijk aspect van statische inference is het vaststellen van de precisie of de
voorspeling. De volgende vraag wordt gesteld: ‘In hoeverre komt de steekproef overeen met
de algehele populatie’. Gevolgen statistiek kan kenmerken van de algehele populatie
voorspellen ondanks dat de gekozen steekproef klein is ten opzichte van de grootte van de
populatie. De grootte van de steekproef is meer van belang dan de grootte in vergelijking tot
de totale populatie.
Sample statistic =
Een gecijferde samenvatting van de genomen steekproef uit de
populatie.
Worden gebruikt om de paramater statistics te schatten
Parameter statistic =
Een gecijferde samenvatting van de populatie.
Percentage van de populatie
Begrijpen van de populatie
De meeste waardes zijn onbekend
Gerandomiseerd is een sterke manier om goede steekproeven te ontwerpen en sterk voor uit
uitvoeren van experimenten.
De basis van gerandomiseerde steekproeven betreft het gegeven dat een steekproef een
goede representatie van de populatie is wanneer elk onderdeel in de populatie dezelfde kans
heeft aan de steekproef toegewezen te worden.
- Zorgt ervoor dat er sterke gevolgtrekkingen gemaakt kunnen worden (externe
validiteit)
- Goed laten verlopen van experimenten
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller LisanneStroot. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.33. You're not tied to anything after your purchase.