Samenvatting statistiek 1
Hoofdstuk 1: Inleiding over statistiek.
Statistiek = de wetenschap v/h verzamelen, organiseren, presenteren, analyseren en interpreteren
van gegevens of data volgens een numerieke logica.
Beschrijvende statistiek: beschrijven van steekproef/populatiegegevens met behulp van tabellen,
grafieken en kengetallen.
Inferentiële statistiek: op basis van steekproefgegevens uitspraken doen over de populatie.
Hoofdstuk 2: Data statistisch onder de loep genomen
Onderzoek elementen:
Populatie (N) = de groep waarover het onderzoek een uitspraak wil doen.
Bv: ‘de Amerikaanse mannen’ (60 miljoen mensen)
Steekproef (n) (sample) = een selectie uit de totale populatie, waarop je het onderzoek uitvoert.
Bv: 5300 Amerikaanse mannen die geïnterviewd werden.
Populatie-onderzoek (volkstelling) = een onderzoek waarbij men streeft om een aantal
karakteristieken van een volledige bevolking in kaart te brengen.
Soorten steekproeven
Literary Digest: straw poll
- Selectiebais = vertekening in wie hij benaderde. Geen goede doorsnee v/d hele bevolking.
- Non-respons = Vertekening in de antwoorden van deelnemers.
Enkelvoudige aselecte steekproef (EAS) = elk lid v/d populatie heeft even veel kans om in de
steekproef terecht te komen.
- Ook wel: Toevalssteekproef
Variante:
o Clustersteekproef (tweetrapssteekproef): eerst een random selectie van bv alle
gemeenten van België en dan een random steekproef van leerlingen uit die
gemeenten
o Gestratificeerde steekproef (voorkennis gebruiken): bv een groep evenveel mannen
en vrouwen, iemand trekt uit de pot 50 namen. Je neemt een pot van vrouwen en een
pot mannen, uit beide trekt deze persoon 25 mensen.
Convenience steekproef:
- Probleem van selectiebias: vertekening in wie hij benaderde.
Quotasteekproef: men maakt gebruik van voorkennis bij de selectie v/d onderzoek elementen.
Populatie
→ Selectiebias
Steekproef
→ Non-responsbias
Deelnemers/ respondenten. → Responsbias
1
,Datamatrix
Variabelen
Onderzoekselementen of cases.
Observaties of meetwaarden
→ Dit is een datamatrix = tabel
Aggregatieniveau
= hun niveau van optelling. Analyse van puntverdelingen
- Micro: onderzoekselementen zijn individuen
o Bv: analyse van resultaten: 7 BV’s Jozef Knecht
- Meso: onderzoekselementen zijn functioneel gegroepeerd
o Analyse van resultaten: topsporters, mediamensen…
- Macro: onderzoekselementen opgeteld per land
o Bv: analyse obv resultaten van alle BV’s, BN’ers…
- Ecologische meetfout: bij uitspraak die niet is gedaan op aggregatieniveau van onderzoek
elementen
- Multilevel-analyse
Variabelen
= kenmerk van onderzoek element, waarbij de uitkomst kunnen variëren.
→ Meten van ‘abstracte’ attitudes, latent construct of ‘verborgen’ variabelen.
Latent construct meten (bv: motivatie)
- Conceptualisering: wat wil ik meten?
- Indicering: hoe ga ik dit meten? Welke empirische representanten?
o Meetschaal
- Operationalisering: hoe ga je het registreren?
o Interpersoon betrouwbaarheid: tussen personen betrouwbaarheid
o Intertemporele/test-rest betrouwbaarheid: verschillen tussen de metingen op
bepaalde momenten dat je niet kan terugkomen op de momenten dat ze gemeten
zijn. Je moet altijd op dezelfde manier te werk gaan.
2
,Meetniveau van variabelen
Kwalitatieve meetniveaus: alfanumerieke meetwaarden: je kan er geen som van maken.
Bv: woorden of codes
Bv: geboorteland, looncategorie, mate van overeenkomst….
- Nominaal meetniveau: je krijgt als antwoord verschillende categorieën, maar geen rangorde.
o Disjuncte en exhaustieve categorieën, zonder rangorde
o Bv: politieke voorkeur, postnummer gemeente, geslacht (M/V – 1/2), huidskleur….
- Ordinaal meetniveau: de antwoorden zijn geordend. De waarden stellen niks voor.
o Disjuncte, exhaustieve en geordende categorieën.
o Kan een orde zijn van a-b-c weergegeven i.p.v. 1-2-3.
o Bv: aantal sterren van een hotel….
Kwantitatieve meetniveaus: numerieke meetwaarden: rekenkundige bewerkingen
- Ratio meetniveau: numerieke info geven, er kan een natuurlijk nulpunt zijn.
o Natuurlijk nulpunt: negatieve afstand is niet mogelijk. (één exact getal)
▪ Gevolg: verhoudingen zijn zinvol.
▪ Bv: 20km/10km is 2 → 20km is 2 keer zo ver als 10km.
o Gelijke verschillen hebben gelijke betekenis
▪ Bv: verschil tussen 1km en 4km is verschil tussen 12km en 15km.
o Bv: Afstand in km, inhoud flesje cola, leeftijd, gewicht…
- Interval meetniveau:
o Gelijke verschillen hebben gelijke betekenis
▪ Bv: verschil tussen 10°C en 15°C is verschil tussen 15°C en 20°C.
o Geen natuurlijk nulpunt: negatieve temperatuur is mogelijk
▪ Gevolg: verhoudingen zijn niet zinvol (geen eenduidige interpretatie)
▪ Bv: 20°C/5°C = 4, maar we zeggen niet “20°C is 4 keer zo warm als 5°C”
o Bv: temperatuur in °C…
(de waarde 0 (nul) heeft geen betekenis)
Discreet of continu
- Discreet: aftelbare uitkomstenruimte: kunnen ‘slechts’ een afteblaar aantal waarden
aannemen.
o Je kent cijfers toe aan variabele, maar tussen opeenvolgende cijfers, bestaan geen
andere cijfers
o Kommagetallen mogen, maar wanneer je twee opeenvolgende uitkomsten zitten (12
– 12,5) dan gaan tussen die twee uitkomsten geen andere niet zitten.
o Bv: gezinsomvang, % alcohol op fles wijn…
o Bv: schoenmaat: 37 – 37,5 – 38 (hier tussen zitten geen maten meer)
- Continu: niet aftelbare uitkomstenruimte: kunnen en niet aftelbaar aantal waarden
aannemen.
o Tussen twee opeenvolgende cijfers zitten ontelbaar veel andere cijfers
o Alle waarden tussen een zeker min en max mogelijk
o Kommagetallen met oneindig veel decimalen mogelijk.
o Alle reële waarden die niet aftelbaar zijn.
o Bv: gewicht, temperatuur
o Bv: Tijdsduur (1min - 1,30 min → 30 sec en … 100ste sec …)
, Opwaarderen van meetniveau
Dichotome variabelen: → gebruiken variabele op elke meetniveau
- Slecht twee nominale waarden
o Bv: geslacht: vrouw = 0; man = 1
- Komt overeen met al dan niet bezitten van bepaald kenmerk: natuurlijke orde (cf. ordinaal
meetniveau).
- Slechts 1 afstand tussen meetwaarden; gelijke verschillen hebben gelijke betekenis (cf.
kwantitatief meetniveau)
→ Nominale variabelen behandelen op kwantitatief niveau
0 en 1 interpreteren als een kenmerk.
Gaan de nominale of ordinale dichotome omzetten naar een dummy variabelen.
→ Meerdere categorieën → dummys
Kwalitatieve variabele met k categorieën omzetten in k-1 dummy-variabelen
- Bv: 10 provincies: Antwerpen =1; Limburg = 2; …
o Dummy 1:
▪ Waarden 0 als niet woonachtig in Antwerpen
▪ Waarden 1 als wel woonachtig in Antwerpen
o Dummy 2:
▪ Waarden 0 als niet woonachtig in Limburg
▪ Waarden 1 als wel woonachtig in Limburg
o Enz. tot dummy 9
De laatste variabelen doen we niet. Als de eerste 9 gedaan zijn, mensen die niet vallen onder dummy
1-9 zullen vallen onder dummy 10.
Downscaling van meetniveau:
- Kwalitatieve variabele worden slechts op ordinaal niveau gemeten en/of geanalyseerd.
- Bv: gezinsinkomen: laag/midden/hoog
- Voordelen:
o Respondenten sneller bereid te antwoorden
o Gemakkelijker te interpreteren
o Geschikter voor communicatie gericht op breder publiek
- Nadelen:
o Verlies aan informatie
o Analytische mogelijkheden worden sterk beperkt: bv geen gemiddeld inkomen
o Rekening houden met ordinaal meetniveau
Frequentieverdeling
= tabel/grafiek met
- Alle verschillende meetwaarden (1e kolom/op X-as)
- Bijhorend aantal keren/percentage dat meetwaarde voorkomt (frequentie) (2 e kolom/op Y-
as)
Absolute frequenties (fi): aantal keren dat een frequentie voorkomt
- Som van alle absolute frequenties = ∑ 𝑓𝑖 = n (of N)
-
Relatieve frequenties (fi*): een percentages
- Som van alle relatieve frequenties = ∑ 𝑓𝑖∗ = 1 = 100%
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller seppelienvos. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.27. You're not tied to anything after your purchase.