Analysemethoden en technieken (sem. 1, per. 2, 2020) samenvatting EINDTENTAMEN
Anne Vlassak en Kim Tigchelaar
1. Literatuur
2. Sowiso
3. R Studio
1.Literatuur
Week 5
Belangrijk om hieruit mee te nemen zijn de belangrijkste redenen waardoor bad data ontstaat, welke
vormen hiervan zijn en hoe je dit als onderzoeker kan oplossen.
De Veaux & Hand
Bad data (geen kwaliteit) is de basis voor slecht onderzoek. Data kunnen worden vervormd vanaf het begin
tijdens de eerste inzamelingsfase of ze kunnen vervormd zijn wanneer de gegevens worden
getranscribeerd, overgedragen, samengevoegd of gekopieerd. Ten slotte kunnen ze verslechteren, van
definitie veranderen of op een andere manier transformaties ondergaan die ze minder representatief
maken voor het originele onderliggende proces zijn ze ontworpen om te meten.
Missing Data:
• 2 manieren
o Volledige gegevens niet aanwezig in de dataset
▪ Op deze manier worden niet bedoelde conclusies getrokken
o Individuele velden niet aanwezig in de dataset
▪ Invloed op de verdeling, steekproefvomring
▪ Steekproefvorming
Distortion Data: (vervorming)
• 2 manieren
o Door instrumenten:
▪ Floor and ceiling effects
• Instrumenten: mechanisch, elektronisch en/of vragenlijsten
o Door mensen:
▪ Verkeerde interpertatie
▪ Verkeerd opnemen van de waardes
Alan Bryman (2012)
Betrouwbaarheid (reliability),
• ‘Als iemand hetzelfde onderzoek uitvoert, komt hij op dezelfde conclusies.'
• Vaak kwantitatief!
Validiteit (validity)
• Volgens Bryman het belangrijkste criterium
• Integriteit van de conclusies
, 2
o Measurement/construct validity
▪ Of de gestelde vraag echt verband houdt met het concept wat onderzocht wordt
• Meet een IQ test echt de versquaredllende niveaus van intelligentie?
o Internal validity
▪ Of er een causaal verband tussen twee variabelen bestaat
▪ X veroorzaakt Y: geen andere variabele is betrokken bij deze oorzaak
▪ X = independent variabele, Y = depedent variabele
▪ how confident can we be that the independent variable really is at least in part responsible
for the variation that has been identified in the dependent variable?
o External validity
▪ Kunnen de resultaten gegeneraliseerd worden?
▪ Focus op de respondenten; zijn zij representatief voor het te onderzoeken concept?
o Ecological validity
▪ Of de resultaten van een onderzoek corresponderen met het dagelijks leven,
iemands natuurlijke habitat.
▪ If research findings are ecologically invalid, they are in a sense artefacts of the social
scientist’s arsenal of data collection and analytic tools.
Reproduceerbaarheid (replication).
• ‘Iemand moet hetzelfde onderzoek kunnen uitvoeren'
• Procedure moet in detail worden uitgelegd!
Trustworthiness
De hierboven genoemde aspecten zijn vooral bedoeld voor kwantitatieve onderzoeksmethoden.
Verschillende onderzoekers hebben zich gebogen over of zij ook toegepast konden worden op kwalitatief
onderzoek. Thrustworthiness is een criterium die meet hoe goed een kwalitatief onderzoek is. Deze
hebben een parallel met de kwantitatieve criteria, hier bovengenoemd:
• Credibility: internal validty: hoe goed zijn de resultaten te geloven?
• Transferability: External validty: zijn de resultaten ook toepasbaar op andere contexten
• Dependability: reliability: zijn de resultaten ook op een ander moment toepasbaar
• Confirmability: objectivity: heeft de onderzoeker zijn eigen opvattingen weggecijferd tijdens het
doen van het onderzoek.
Week 6
N.b. Hoewel de literatuur een belangrijke basis legt voor de opdrachten zal deze niet getoetst worden op de
deeltoets. Enige kennis van deze literatuur is wel belangrijk ter voorbereiding van de werkgroep.
APA: handvat: doorlezen voor inleveren van verslag
Miller (2004) heeft in zijn boek 7 basisprincipes uitgewerkt voor het beschrijven van statistiek:
- Geef de context van de cijfers
- Kies goede, herkenbare voorbeelden
- Gebruik de taal van de doelgroep; definiëren van de begrippen
- Kies wanneer je cijfers, tekst, tabel of een figuur presenteert
- Rapporteer en interpreteer de nummers in de tekst
- Geef zowel de richting als grootte van het effect
- Veel cijfers? Geef een samenvatting van het patroon
, 3
2.Sowiso
Week 5
Statistical inference: het proces van het doen van een uitspraak over een populatie op basis van de steekproef
(sample) data. Er zijn 2 manieren om dit te doen: parameter estimation en hypothesis testing.
Parameter estimation
Parameter estimation: steekproef data gebruiken om de parameters van de populatie te schatten.
a. Point estimates: een enkele waarde die de beste schatting is voor de populatie parameter, geeft geen
inzicht over de precisie van de schatting.
Voorbeeld: het steekproef gemiddelde x̄ gebruiken als het populatie gemiddelde μ of de steekproef
proportie p̂ gebruiken als populatie proportie π.
b. Confidence intervals (CI): een verzameling van waardes gebaseerd op steekproef data die een grote
waarschijnlijkheid hebben om de echte waarde van de populatie te zijn.
Voorbeeld: stel je hebt een CI van 95%, dat betekent dat het voor 95% zeker is dat de sample die
geselecteerd gaat worden een CI met daarin de echte waarde van de parameter produceert. Als we 100
samples zouden nemen zouden dus 95 daarvan een CI hebben met de echte waarde erin, en 5 daarvan niet.
Je kunt dit pas zeker weten als de echte waarde van de parameter bekend is.
i. Confidence level: de waarschijnlijkheid dat een random confidence interval de doel parameter bevat.
De wiskunde achter confidence intervals:
Voor het maken van een CI voor een populatie met gemiddelde μ moeten we gebruik maken van de sampling
distribution of the sample mean. De sample mean x̄ volgt een verdeling als voldaan is aan één van de
volgende condities:
• De populatie waaruit de sample is genomen is normaal verdeeld.
• De sample is groot genoeg voor het toepassen van de Central Limit Theorem (n ≥ 30).
Margin of error (ME): bepaald de breedte van het confidence interval voor een populatie gemiddelde μ, wordt
berekend door de afstand tussen x̄ en de ondergrens L of tussen x̄ en de bovengrens U.
, 4
Het berekenen van de ME doe je met:
Waarbij z* de critical value van de standaard normaal verdeling is, zo dat:
Berekenen van critical value z* doe je zo:
In R: qnorm(p) = (100+C) / 200, mean = 0, sd = 1, lower.tail = TRUE)
De ME van de CI van het populatie gemiddelde is afhankelijk van 3 factoren:
1) Hoe hoger de confidence level, hoe kleiner de ME en hoe breder de CI.
2) Hoe groter de standaard deviatie van de populatie, hoe groter de ME en hoe breder de CI.
3) Hoe groter de sample size, hoe kleiner de ME en hoe smaller de CI.
Aannemend dat de sampling distribution of the sample mean normaal verdeeld is, is de algemene formule voor een
CI van C% (bijvoorbeeld dus 95%) voor de populatie met gemiddelde μ en een random sample size van n:
Als je niet wil dat je ME voor een C% CI groter is dan k, dan geldt voor de minimale sample size:
Let op: afgerond op het eerst volgende hele getal!
Naast het bepalen van een CI voor het populatiegemiddelde μ kun je dit ook doen voor de populatie proportie π. De
proportie is de fractie van een groep die een bepaald karakteristiek vertoont. Hier wordt gebruik gemaakt van de
sampling distribution of the sampling proportion. De sample proportion p̂ volgt een verdeling als
aan allebei de volgende condities is voldaan:
1. Er zijn minstens 10 positieve gevallen: n * π ≥ 10
2. Er zijn minstens 10 negatieve gevallen: n *(1 – π) ≥ 10
Aangezien de waarde van π onbekend is kunnen we deze condities niet checken. De oplossing hiervoor is het gebruik
van p̂ in plaats van π en kijken of er aan de condities wordt voldaan. Dit betekent ook dat we de standaard error van
de proportie niet kunnen berekenen. Ook daarvoor gebruiken we dus p̂ in plaats van π.
0
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller annevlassak8. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.40. You're not tied to anything after your purchase.