Samen met een medestudente maakte ik een uitgebreide samenvatting voor Statistiek I. Deze SV bevat alle nodige info:
* Slides;
* het boek en;
* eigen les notities.
Telkens met veel informatie en uitleg over formules en bewijzen.
Wijzelf haalden beiden zeer hoge punten voor dit vak (15/20). ...
1. LES 1: Hoofdstuk 2: Data statistisch onder de loep nemen
1.1 Case Jozef Knecht
Het bestuur van een jeugdvereniging kampt met een tekort aan middelen om hun activiteiten te
financieren. Daarom besluiten zij een gesponsord benefietgebeuren te organiseren. Concreet
zoeken zij 7 sportieve bekende Vlamingen (VB's) die bereid zijn om achtereenvolgens een uurtje te
fietsen en een uurtje te lopen. Vervolgens zoeken ze een sponsor die voor elke gelopen en gefietste
kilometer 3 euro willen ophoesten. Na enige moeite slagen zij erin om zowel de zeven sportieve VB's
als een geldschieter te vinden. Met het oog op een artikel in het verenigingstijdschrift besluit Jozef
Knecht om de resultaten in kaart te brengen. In eerste instantie besluit hij om de gegevens in een
overzichtelijke tabel te gieten. Ziehier het resultaat...
1.2 Basiswoordenschat van de statistiek
Datamatrix Het gegevensrooster, het (coherent) geheel van
rijden en kolommen
Bevat groot aantal statistische analyses,
systematisch geordende, numerieke gegevens
Rijen Meetwaarden, observaties voor specifiek
onderzoekselement, onderzoekselementen,
cases
Kolommen Meetwaarden voor een specifieke variabele,
variabelen
1.3 Onderzoekselementen
• Als ALLE mogelijke elementen werden onderzocht:
o Populatie met N onderzoekselementen
• Als SLECHTS EEN DEEL van een groter geheel aan elementen werd onderzocht:
o Steekproef met n onderzoekselementen
1
, • Onderzoek van het geheel: volkstelling – census
o = volledige populatie proberen ondervragen
o De dinosaurus van de statistiek want dit wordt niet meer gedaan omdat je nooit echt
de hele bevolking bereikt. Enkel het verzamelen is niet meer het enige doel.
o Selectiebias
▪ Je selecteert mensen
▪ Je bereikt nooit iedereen Bv. daklozen, zeevaarders
o Responsbias
▪ Niet iedereen vult ondervraging in of geeft antwoord
• Omdat ze niet willen
• Omdat ze niet bij de juiste mensen terechtkomen
o Oplossing: ‘virtuele volkstellingen’
▪ Datasets combineren, koppeling van bestaande
bestanden/enquêteresultaten o.b.v. steekproefgegevens
▪ Bv. verschillende volkstellingen (gemeenten, dorp,… -departementen)
combineren hun gegevens
1.3.1 Niet alle steekproeven hebben evenveel waarde
Bv. Literary Digest-schandaal (1936, Alf Landon vs. Franklin Roosevelt)
= Ze wouden voorspellen op wie de mensen zouden stemmen voor het ministerschap en probeerden
alle mensen die ze konden te bereiken.
• Straw poll:
o n=10 miljoen vragenlijsten naar stemgerechtigden uit telefoongidsen, abonneelijsten,
automobielregistraties → voorspelling maken
o 2,4 miljoen ingevuld teruggestuurd
▪ Wie zijn dit?
o Voorspelling: Alf Landon zou het ministerschap winnen
o Vertekende schatting door responsbias & selectiebias
▪ Als er zo weinig respons terug komt krijg je vaak een bepaalde groep en niet
de middengroep
▪ Voorspelling in 1936: toen hadden niet veel mensen een auto, telefoon of een
abonnement. Dus ze richtte zich eigenlijk uitsluitend op de rijkere klasse en
die stemden op de republikeinen
▪ Geen representatieve voorstelling van de samenleving
▪ Aanzienlijke non-respons
• Random sample/toevalssteekproeven: Bv. EAS
o George Gallup
o EAS = enkelvoudig aselecte steekproef
▪ Enkelvoud = niemand komt twee keer in de steekproef
▪ Aselecte = iedereen die stemgerechtigd was had een even grote kans om in de
steekproef terecht te komen
o Voorspelling: Franklin Roosevelt o.b.v. n=50 000
• Maar ook nu nog websurveys met vrijwillige respons
o Niet duidelijk of steekproef representatief is voor beoogde populatie
o Waardeloos m.b.t. uitspraken over een ruimere populatie
2
,1.3.2 Soorten steekproeven
• Enkelvoudig aselecte steekproef (EAS)
o (cf. onschuldige kinderhand en toevalsgetallen/cijfers)
o Iedereen krijgt een gelijke kans om gekozen te worden, geen enkel systematisch
verband
o ‘Onschuldige kinderhand’
• Gestratificeerde steekproef
o (voorinfo, Bv. aantal kiesmannen)
o Je gaat selectie of samenstelling nemen uit de populatie, maar met de juiste
verhouding Bv. verhouding mannen en vrouwen
o Voorkennis bij selectie uit steekproef
• Quotasteekproef
o (voorinfo, interviewer selecteert onderzoekselementen, moeilijker generaliseerbaar)
o Je selecteert a.d.h.v. bepaalde vooraf bepaalde socio-demografische criteria door de
interviewer wat het een subjectieve selectie maakt (mee oppassen!)
o Interviewer gaat selecteren o.b.v. bepaalde criteria (verschil met gestratificeerd!)
o Steeproef selecteren o.b.v. van quota
• Clustersteekproef
o (tweetrapssteekproef, Bv. Vlaamse scholen: provincie > scholen)
o Je gaat groeperen en vervolgens selecteren
o In verschillende stappen op geneste niveaus onderscheiden van eenheden
o Bv. tweetrapssteekproef = je kiest enkele provincies en daarvan enkele scholen
1.3.3 Aggregatieniveau van onderzoekselementen
Aggregatieniveau = ‘niveau van optelling’
Je moet je altijd afvragen wie of wat je gaat onderzoeken → bepaald het niveau
Niveau waarop je data gaat verzamelen → bepaald door onderzoeksvraag
• Micro: onderzoekselementen zijn individuen
o Bv. analyse van resultaten 7 VB’s Jozef Knecht
• Meso: onderzoekselementen zijn functioneel gegroepeerd
o Bv. analyse van resultaten topsporters, mediamensen etc.
• Macro: onderzoekselementen opgeteld per land (hoger niveau)
o Bv. analyse o.b.v. resultaten van alle VB’s, BN’ers etc.
• Ecologische meetfout: bij uitspraak die niet is gedaan op aggregatieniveau van
onderzoekselementen
o Bv. Je weet dat de ene school beter presteert dan een andere school dan kan je geen
klassen vergelijken met elkaar. Zorg dat je niet van niveau verwisselt in je conclusie.
• Multilevel-analyse
o Er zijn technieken waar je verschillende aggregatieniveaus opneemt maar dan doe je
dat vanaf het begin wanneer je data verzamelt.
1.4 Variabelen
Variabele = kenmerk van onderzoekselement, waarbij de uitkomsten kunnen variëren
3
, • Sociale wetenschappen: meten van `abstracte’ attitudes, `latent constructs’ of `verborgen’
variabelen Bv. het meten van motivatie is niet zo expliciet wat het moeilijk maar niet
onmogelijk maakt (serieuze uitdaging)
• Latent constructs meten (Bv. motivatie, mate van individualisme)
o Conceptualisering (Wat wil je meten? (= het variabele concept) Bv. intrinsieke
motivatie of demotivatie? Baken je concept goed af, zo goed mogelijk omschrijven)
o Indicering (Hoe ga je het meten? Welke empirische representanten? → welke items
ga je vragen om te de motivatie te achterhalen
▪ Validiteit (cf. ‘Meet je wat je wil weten?’) → weerspiegelt de score effectief de
mate van intrinsieke motivatie?
▪ Meetschaal Bv. je hebt 5 items over motivatie en die geef je scores om te
kunnen verwerken (behelst best meerdere indicatoren)
o Operationalisering (Hoe ga je het registreren? Hoe met indicator omgaan?)
▪ Interpersoon betrouwbaarheid = is de persoon die de bevraging doet
betrouwbaar want dit heeft invloed op de antwoorden
▪ Intertemporele / test-retest betrouwbaarheid = de antwoorden mogen niet
afhangen van de tijd of plaats Bv. je bevraagt de leerlingen 5 min voor de bel
gaat op een vrijdag dan ga je minder betrouwbare antwoorden krijgen
1.5 Meetniveau van variabelen
= opdelen in groepen, 4 verschillende meetniveaus:
• Leeftijd
• Looncategorie
• Gewicht
• Geslacht
• Geboorteland
• Aantal sterren
• Temperatuur (°C)
• Mate van overeenkomst
1.5.1 Kwantitatieve meetniveaus
= ‘numerieke meetwaarden’ rekenkundige bewerkingen OK, betekenisvolle verschillen/afstanden
= uitkomsten die we numeriek berekenen/meten met een gelijke betekenis = metrische variabelen
• Ratio meetniveau (Bv. afstand in km)
o Gelijke verschillen hebben gelijke betekenis
Bv. verschil tussen 1km en 4km = verschil tussen 12km en 15km
o Natuurlijk nulpunt (negatieve afstand is niet mogelijk)
▪ Gevolg:
• Verhoudingen zijn zinvol (i.e. hebben eenduidige interpretatie)
• Zinvol, want hangt niet af van de meeteenheid
• 0 = kenmerk ontbreekt/is er niet (Bv. 0 km = er is geen afstand dus
negatief is niet mogelijk!)
▪ Bv. 20km/10km = 2 → “20km is 2 keer zo ver als 10km”
▪ Immers: Afstand(mijl) = (1/1,61) . Afstand(km) (cf. Y = aX)
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller tinebastiaensen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.23. You're not tied to anything after your purchase.