100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Analysemethoden & Techniek deel 2(5072ANTE6Y) €10,49   In winkelwagen

Samenvatting

Samenvatting Analysemethoden & Techniek deel 2(5072ANTE6Y)

 6 keer bekeken  0 keer verkocht

Uitgebreide samenvatting AMT: literatuur (Veaux, Miller, Bryman, Hand) behandelde statistiek en uitwerking in R

Voorbeeld 4 van de 41  pagina's

  • 23 november 2021
  • 41
  • 2020/2021
  • Samenvatting
Alle documenten voor dit vak (4)
avatar-seller
annevlassak8
1

Analysemethoden en technieken (sem. 1, per. 2, 2020) samenvatting EINDTENTAMEN
Anne Vlassak en Kim Tigchelaar
1. Literatuur
2. Sowiso
3. R Studio

1.Literatuur
Week 5
Belangrijk om hieruit mee te nemen zijn de belangrijkste redenen waardoor bad data ontstaat, welke
vormen hiervan zijn en hoe je dit als onderzoeker kan oplossen.

De Veaux & Hand
Bad data (geen kwaliteit) is de basis voor slecht onderzoek. Data kunnen worden vervormd vanaf het begin
tijdens de eerste inzamelingsfase of ze kunnen vervormd zijn wanneer de gegevens worden
getranscribeerd, overgedragen, samengevoegd of gekopieerd. Ten slotte kunnen ze verslechteren, van
definitie veranderen of op een andere manier transformaties ondergaan die ze minder representatief
maken voor het originele onderliggende proces zijn ze ontworpen om te meten.

Missing Data:

• 2 manieren
o Volledige gegevens niet aanwezig in de dataset
▪ Op deze manier worden niet bedoelde conclusies getrokken
o Individuele velden niet aanwezig in de dataset
▪ Invloed op de verdeling, steekproefvomring
▪ Steekproefvorming

Distortion Data: (vervorming)
• 2 manieren
o Door instrumenten:
▪ Floor and ceiling effects
• Instrumenten: mechanisch, elektronisch en/of vragenlijsten
o Door mensen:
▪ Verkeerde interpertatie
▪ Verkeerd opnemen van de waardes



Alan Bryman (2012)

Betrouwbaarheid (reliability),
• ‘Als iemand hetzelfde onderzoek uitvoert, komt hij op dezelfde conclusies.'
• Vaak kwantitatief!

Validiteit (validity)

• Volgens Bryman het belangrijkste criterium
• Integriteit van de conclusies

, 2

o Measurement/construct validity
▪ Of de gestelde vraag echt verband houdt met het concept wat onderzocht wordt
• Meet een IQ test echt de versquaredllende niveaus van intelligentie?
o Internal validity
▪ Of er een causaal verband tussen twee variabelen bestaat
▪ X veroorzaakt Y: geen andere variabele is betrokken bij deze oorzaak
▪ X = independent variabele, Y = depedent variabele
▪ how confident can we be that the independent variable really is at least in part responsible
for the variation that has been identified in the dependent variable?
o External validity
▪ Kunnen de resultaten gegeneraliseerd worden?
▪ Focus op de respondenten; zijn zij representatief voor het te onderzoeken concept?
o Ecological validity
▪ Of de resultaten van een onderzoek corresponderen met het dagelijks leven,
iemands natuurlijke habitat.
▪ If research findings are ecologically invalid, they are in a sense artefacts of the social
scientist’s arsenal of data collection and analytic tools.

Reproduceerbaarheid (replication).
• ‘Iemand moet hetzelfde onderzoek kunnen uitvoeren'
• Procedure moet in detail worden uitgelegd!

Trustworthiness
De hierboven genoemde aspecten zijn vooral bedoeld voor kwantitatieve onderzoeksmethoden.
Verschillende onderzoekers hebben zich gebogen over of zij ook toegepast konden worden op kwalitatief
onderzoek. Thrustworthiness is een criterium die meet hoe goed een kwalitatief onderzoek is. Deze
hebben een parallel met de kwantitatieve criteria, hier bovengenoemd:

• Credibility: internal validty: hoe goed zijn de resultaten te geloven?
• Transferability: External validty: zijn de resultaten ook toepasbaar op andere contexten
• Dependability: reliability: zijn de resultaten ook op een ander moment toepasbaar
• Confirmability: objectivity: heeft de onderzoeker zijn eigen opvattingen weggecijferd tijdens het
doen van het onderzoek.

Week 6
N.b. Hoewel de literatuur een belangrijke basis legt voor de opdrachten zal deze niet getoetst worden op de
deeltoets. Enige kennis van deze literatuur is wel belangrijk ter voorbereiding van de werkgroep.

APA: handvat: doorlezen voor inleveren van verslag

Miller (2004) heeft in zijn boek 7 basisprincipes uitgewerkt voor het beschrijven van statistiek:
- Geef de context van de cijfers
- Kies goede, herkenbare voorbeelden
- Gebruik de taal van de doelgroep; definiëren van de begrippen
- Kies wanneer je cijfers, tekst, tabel of een figuur presenteert
- Rapporteer en interpreteer de nummers in de tekst
- Geef zowel de richting als grootte van het effect
- Veel cijfers? Geef een samenvatting van het patroon

, 3

2.Sowiso

Week 5
Statistical inference: het proces van het doen van een uitspraak over een populatie op basis van de steekproef
(sample) data. Er zijn 2 manieren om dit te doen: parameter estimation en hypothesis testing.

Parameter estimation
Parameter estimation: steekproef data gebruiken om de parameters van de populatie te schatten.
a. Point estimates: een enkele waarde die de beste schatting is voor de populatie parameter, geeft geen
inzicht over de precisie van de schatting.
Voorbeeld: het steekproef gemiddelde x̄ gebruiken als het populatie gemiddelde μ of de steekproef
proportie p̂ gebruiken als populatie proportie π.
b. Confidence intervals (CI): een verzameling van waardes gebaseerd op steekproef data die een grote
waarschijnlijkheid hebben om de echte waarde van de populatie te zijn.
Voorbeeld: stel je hebt een CI van 95%, dat betekent dat het voor 95% zeker is dat de sample die
geselecteerd gaat worden een CI met daarin de echte waarde van de parameter produceert. Als we 100
samples zouden nemen zouden dus 95 daarvan een CI hebben met de echte waarde erin, en 5 daarvan niet.
Je kunt dit pas zeker weten als de echte waarde van de parameter bekend is.
i. Confidence level: de waarschijnlijkheid dat een random confidence interval de doel parameter bevat.

De wiskunde achter confidence intervals:




Voor het maken van een CI voor een populatie met gemiddelde μ moeten we gebruik maken van de sampling
distribution of the sample mean. De sample mean x̄ volgt een verdeling als voldaan is aan één van de
volgende condities:
• De populatie waaruit de sample is genomen is normaal verdeeld.
• De sample is groot genoeg voor het toepassen van de Central Limit Theorem (n ≥ 30).
Margin of error (ME): bepaald de breedte van het confidence interval voor een populatie gemiddelde μ, wordt
berekend door de afstand tussen x̄ en de ondergrens L of tussen x̄ en de bovengrens U.

, 4




Het berekenen van de ME doe je met:




Waarbij z* de critical value van de standaard normaal verdeling is, zo dat:




Berekenen van critical value z* doe je zo:
In R: qnorm(p) = (100+C) / 200, mean = 0, sd = 1, lower.tail = TRUE)
De ME van de CI van het populatie gemiddelde is afhankelijk van 3 factoren:
1) Hoe hoger de confidence level, hoe kleiner de ME en hoe breder de CI.
2) Hoe groter de standaard deviatie van de populatie, hoe groter de ME en hoe breder de CI.
3) Hoe groter de sample size, hoe kleiner de ME en hoe smaller de CI.

Aannemend dat de sampling distribution of the sample mean normaal verdeeld is, is de algemene formule voor een
CI van C% (bijvoorbeeld dus 95%) voor de populatie met gemiddelde μ en een random sample size van n:




Als je niet wil dat je ME voor een C% CI groter is dan k, dan geldt voor de minimale sample size:

Let op: afgerond op het eerst volgende hele getal!


Naast het bepalen van een CI voor het populatiegemiddelde μ kun je dit ook doen voor de populatie proportie π. De
proportie is de fractie van een groep die een bepaald karakteristiek vertoont. Hier wordt gebruik gemaakt van de
sampling distribution of the sampling proportion. De sample proportion p̂ volgt een verdeling als
aan allebei de volgende condities is voldaan:

1. Er zijn minstens 10 positieve gevallen: n * π ≥ 10
2. Er zijn minstens 10 negatieve gevallen: n *(1 – π) ≥ 10
Aangezien de waarde van π onbekend is kunnen we deze condities niet checken. De oplossing hiervoor is het gebruik
van p̂ in plaats van π en kijken of er aan de condities wordt voldaan. Dit betekent ook dat we de standaard error van
de proportie niet kunnen berekenen. Ook daarvoor gebruiken we dus p̂ in plaats van π.
0

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper annevlassak8. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €10,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 76449 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€10,49
  • (0)
  Kopen