lOMoAR cPSD| 32999376
Samenvatting statistiek 1
1
, lOMoAR cPSD| 32999376
Leerpad 1
Wetenschappelijk onderzoek op basis van empirische cyclus
1.1 de empirische cyclus: grondschema
empirische cyclus = methode die ons in staat stelt om kennis te verwerven via
systematische observatie
→wereld zien hoe werkelijk is i.p.v. zoals we zouden willen
Wisselwerking tussen 5 begrippen
1. observatie: waarnemen en verzamelen van empirisch feitenmateriaal
2. inductie: formuleren van hypotheses o.b.v. observatie
3. deductie: opstellen van voorspellingen o.b.v. hypotheses
4. toetsing: aftoetsen van voorspelling o.b.v. nieuw empirisch feitenmateriaal
5. evaluatie: resultaat van toetsing kritisch beoordelen
door dit proces herhalen (cyclus) => kennis verwerven
1.2 statistiek binnen empirische cyclus
Statistiek = wetenschap van het leren uit data en van het meten, controleren en
communiceren van onzekerheid
Statistische geletterdheid = vermogen om te redeneren door middel van
statistiek en data
Statistische kennis in fases wetenschappelijke studie:
1. formuleren onderzoeksvraag die beantwoord kan worden d.m.v. data
2. ontwerpen van studie en verzamelen van data
3. verkennen van verzamelde data via beschrijvende analyses
4. formuleren van conclusies die verder reiken dan geobserveerde data via
inductieve analyses
2
, lOMoAR cPSD| 32999376
Deel 1: een beschrijvende analyse
2. onderzoek naar smartphonegebruik en mentaal welzijn
wetenschappelijk artikel uit 4 paragrafen:
1. introductie: 2 doelen: samenvatting van literatuur over onderwerp en
motivering waarom nieuwe studie wordt uitgevoerd
2. methodes: verduidelijking deelnemers: wie, hoe geselecteerd, wat
gemeten? Toelichting hoe data geanalyseerd zal worden
3. resultaten: uitgeschreven tekst + tabellen, figuren t.o.v. analyses en
conclusies (t.o.v. = ter ondersteuning van)
4. discussie: formuleren conclusies, afsluitende opmerkingen, open vragen
voor vervolgonderzoek
onderzoeksvraag = is er samenhang tussen smartphonegebruik en mentaal welzijn
2.2 methode: hoe werd studie uitgevoerd?
2.2.1 proefpersonen en steekproeftrekking
Populatie = De volledige verzameling van objecten of personen waarover informatie wordt
gewenst
Onderzoek: adolescenten specifiek scholieren in Engeland die 15 jaar werden in 2013-2014
Observationele eenheden = eenheden (vaak personen) waarvoor men data zal verzamelen
Onderzoek: scholieren
Steekproef = deelverzameling van populatie die zal onderzocht worden om informatie te
bekomen
→Vaak onmogelijk om volledige populatie te bestuderen
Steekproefkader = lijst met informatie over personen in de populatie die we
gebruiken om steekproef samen te stellen
Onderzoek: National Pupil Database
Representatieve steekproef = steekproef die goede weerspiegeling is van
populatie en haar karakteristieken die we wensen te onderzoeken
3
, lOMoAR cPSD| 32999376
Onderzoek: niet representatief DUS populatie herdefiniëren o.b.v. steekproefkader
= i.p.v. alle Engelse scholieren… →alle Engelse scholieren die geen les volgden aan
onafhankelijke school
Enkelvoudige aselecte steekproeftrekking of enkelvoudige lukrake steekproeftrekking =
elke steekproef heeft dezelfde kans om gekozen te worden
Proportioneel gestratificeerde steekproeftrekking = populatie indelen in aantal strata en
binnen elke stratum voeren we enkelvoudige aselecte steekproeftrekking uit → proportie
personen per stratum in steekproef = in populatie
Gemakshalve steekproefstrekkingen = personen die gemakkelijk bereikbaar zijn hebben
grotere kans om tot steekproef te behoren
Resulteren in selectiebias: sommige groepen over- of ondervertegenwoordigd
Steekproefgrootte n = aantal elementen in steekproef waarvoor we data hebben verzameld
Non-responders = personen die niet deelnemen aan studie maar wel uitgenodigd zijn
Resulteren in non-respons bias
2.2.2 metingen
Variabelen = karakteristieken van observationele eenheden die we wensen te onderzoeken
→ verschillende/ variëren van eenheid tot eenheid
3 categorieën van variabelen in de studie:
1. uitkomstvariabele
a. hoofdvariabele, wensen inzicht verkrijgen en verklaren waarom variabele
varieert
i. mentaal welzijn
→geoperationaliseerd via Mental Well-Being Scale
2. verklarende variabelen
a. = voorspellende variabelen of predictoren
b. Laten ons in staat stellen om begrijpen waarom uitkomstvariabele varieert
i. gem. uur per dag smartphone per week of weekend
→ geoperationaliseerd door zelfrapport met ≠ keuzes
3. controle variabelen
a. groepen kunnen substantieel verschillen van elkaar bij vergelijken
=via controle variabelen dit in rekening brengen
b. vb. geslacht, etniciteit, regio
operationaliseren = meetbaar maken van eigenschappen die men wenst te bestuderen
crosss-sectionele studie = type studie waarbij men variabelen op slechts 1 moment in de
4
, lOMoAR cPSD| 32999376
tijd bevragen
longitudinale studie = type studie waarbij men 1 of meerdere variabelen op verschillende
momenten in de tijd bevraagd
observationele studie = type studie waarbij men enkel observeert zonder interventie uit
te voeren
experimentele studie = type studie waarbij men interventie uitvoert om impact van die
interventie te onderzoeken
2.2.4 analysestrategie/protocol
Replicatie = herhaling van studie volgens dezelfde methodes als oorspronkelijke studie
waarbij conclusies in lijn zijn met die van oorspronkelijke studie
HARKing = hypothesizing after the results are known = men gaat onderzoekshypothese
opstellen o.b.v. bevindingen in data en vervolgens diezelfde data gebruiken om deze
hypotheses te toetsen
➔ geen goede manier = in strijd met grondplan empirische cyclus
stelt dat we nieuwe data moeten gebruiken om hypothese te toetsen
protocol = document waarin onderzoekers schetsen wat doel is van studie, welke
variabelen ze zullen meten, welke hypotheses ze zullen onderzoeken,…
Kwalitatieve variabelen: nominaal/ordinaal
Kwantitatieve variabelen: interval/ ratio discreet/continu
Nominale schaal = waarden van variabele worden gebruikt vooridentificatie zonder dat ze
een hoeveelheid aanduiden
Bv. Variabele: Geslacht Waarden: Man of vrouw
Variabele: Nummer van de tram Waarden: 1, 4, 22...
Ordinale schaal = De waarden duiden volgorde aan, het verschil in waarden hoeft niet
gelijk te zijn
Bv. Variabele: Uitslag wedstrijd Waarden: Goud, zilver,brons
5
, lOMoAR cPSD| 32999376
Intervalschaal = Verschillen tussen waarden hebben betekenis en zijn gelijk
→geen absoluut nulpunt = niets van devariabele aanwezig is
Bv. Variabele: Temperatuur in °C Waarden: 02, 10, -30
Bv. Variabele: IQ Waarden: 96, 100, 130
Ratioschaal = Heeft absoluut nulpunt
Bv. Variabele: Lengte in cm Waarden: 0, 1, 354...
Bv. Variabele: Geldbedrag in euro Waarden: 0, 5, 2400...
1.3.1 Discrete en continue variabelen
Continue variabelen = kunnen tussenwaarden aannemen, tussen tweewaarden
kunnen oneindig veel andere waarden liggen
Bv. Lengte in cm: Tussen 2 en 3 cm Waarden: 2.5, 2.67...
Discrete variabelen = variabele kan maar eindig aantal waardenaannemen
Bv. Het aantal kinderen: Geen 1.5 kind
Bv. Het aantal keer werpen met een munt: Geen 1.5 keer
1. Het verschil tussen 20°C en 30°C blijft behouden bij de omzetting naar
Fahrenheit.
2. 0 = geen absoluut nulpunt WANT nog steeds temperatuuraanwezig is. In
Fahrenheit zou 0 gelijk zijn aan 32.
6
, lOMoAR cPSD| 32999376
Leerpad 2
1. Frequenties, odds en staafdiagram
Beschrijvende analyse = inzicht krijgen in data via figuren/ getallen/ tabellen
Verdeling van variabele = staat centraal → welke waarden en hoe vaak
Univariate variabelen = de variabelen 1 per 1 gaan bekijken
Binaire variabelen = variabele die 2 waarden kan geven
Soorten variabelen:
- Kwalitatieve variabele (categorisch) → kenmerken als waarden
o Nominaal
o Ordinaal = we kunnen de waarden ordenen vb. goud, zilver, brons
- Kwantitatieve variabelen (numeriek) → getallen als waarden
o →
▪ Interval
▪ Ratio
o →
▪ Discreet = variabele heeft beperkt aantal waarden
▪ Continu = variabele heeft onbeperkt aantal waarden
Frequenties en odds
- Abosulute frequentie = aantal keer dat waarde van variabele voorkomt in steekproef
- Relatieve frequentie = absolute frequentie gedeeld door steekproefgrootte
o Synoniem: proportie
- Odds/frequentieverhouding = Fr / n – Fr
o = aantal keer dat waarde van variabele wordt aangenomen gedeeld door aantal
keer dat een andere waarde wordt aangenomen
o Hoe interpreteren? Per x aantal ‘noemer’ zijn er x aantal (teller)
▪ vb per 10 jongens zijn er 11 meisjes
Gedepriveerd = criminaliteitscijfer te hoog en tewerkstelling te laag
➔ In het onderzoek: waarschijnlijk een non-response bias
o hoe nog beter weten? Vb vergelijken met andere studie over andere regio
7
, lOMoAR cPSD| 32999376
2. centrum- en spreidingsmaten
steekproefmediaan (mdx) = middelste waarde na ordenen →geven ons idee over ‘centrum’ van verdeling
modus = waarde die het vaakst voorkomt
= zijn centrummaten
conventieteken:
- onderaan → waar het start (vb waarde 1, i = 1)
- bovenaan →waar het eindigt: n
Antwoord work-out
- Vraag 1: door de wijze waarop de variabele gepersonaliseerd geweest is, max waarde van
scholier = 7 of meer uur dus onderschatting
- Vraag 2:
Als de laatste waarde nu 7 of 10 heeft, de mediaan blijft 3
- Vraag 3:
Modus niet altijd de geschikte centrummaat
8
, lOMoAR cPSD| 32999376
spreidingsmaten = kwantificeren de spreiding (= variantie) van een variabele in de steekproef
=hoe sterk varieert de variabele?
eigenschappen:
- nooit negatief
- nul indien geen spreiding
- nemen toe als spreiding toeneemt
variatiebreedte: max-min
standaardafwijking of standaarddeviatie:
≈ gemiddelde afstand tussen de waarde en het steekproefgemiddelde
functie? Manier om variabiliteit te gaan definiëren
variantie: s^2x
interkwartielafstand IQR: Q3-Q1
kwartielen = als we elementen in steekproef ordenen van klein naar groot en opdelen in 4 gelijke stukken
- Q1: waarde van variabele zodat 25% een waarde heeft kleiner dan deze waarde
- Q2 / mediaan: waarde van variabele zodat 50% waarde heeft die kleiner/groter is dan deze waarde
- Q3: waarde van variabele zodat 75% een waarde heeft kleiner dan deze waarde
Antwoord work-out
- Vraag 1: het maximale was 7 uur, maar mocht de werkelijke waarde 9 uur zijn, zal het een
onderschatting zijn
- Vraag 2: kwartielen hebben hier geen last van want het 3 de kwartiel is 5 en 6, niet 7
9