Samenvatting

Samenvatting 4.4 applied multivariate data analysis (Field)

Name: 4.4 applied multivariate data analysis (Field)
SKU: doc_933638
Rating: 4.33 (3 reviews)
Author: tamaradolk

Beoordeling

4,3

(3)

Verkocht

Pagina's

Geüpload op

03-01-2021

Geschreven in

2019/2020

Nederlandse samenvatting van de hoofdstukken 2, 5, 8, 10, 11, 12, 13, 14, 15 (Field, 2013). Deze samenvatting heeft mij goed geholpen het tentamen te halen :). Inclusief begrippen, formules, belangrijke grafieken. Erg gestructureerd, hoofdstukken en paragrafen zijn vermeld.

Meer zien Lees minder

Instelling

Vak

Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Meld schending auteursrecht

Gekoppeld boek

Andy Field Discovering Statistics Using IBM SPSS

Uitgave:maart 2013
ISBN:9781446249185
Druk:4

Geschreven voor

Instelling: Erasmus Universiteit Rotterdam (EUR)
Studie: Pedagogische Wetenschappen
Vak: 4.4 Applied Multivariate Data Analysis

Alle documenten voor dit vak (3)

Documentinformatie

Heel boek samengevat?: Nee
Wat is er van het boek samengevat?: H2, h5, h8, h10, h11, h12, h13, h14, h15
Geüpload op: 3 januari 2021
Bestand laatst geupdate op: 3 januari 2021
Aantal pagina's: 68
Geschreven in: 2019/2020
Type: Samenvatting

Onderwerpen

field
applied multivariate data analysis
blok 44

Voorbeeld van de inhoud

Samenvatting Blok 4.4

Field (2013)

H2, H5, H8, H10, H11, H12, H13, H14, H15

,H2 – Everything you never wanted to know about statistics

Par. 2.2 Building statistical models
We bouwen (statistische) modellen van processen in de wereld om een poging te doen om
te voorspellen hoe deze processen opereren onder zekere omstandigheden.
A.d.h.v. modellen (theorieën) kunnen we processen testen om zo nieuwe kennis te vergaren.
We willen a.d.h.v. de modellen accurate voorspellingen maken over de echte wereld.

De mate waarin een statistisch model de verzamelde gegevens (observed data)
vertegenwoordigt, is de fit van het model.
Goed vertegenwoordigd? à good fit: hiermee kun je accurate voorspellingen doen over de
echte wereld.
Moderate fit à niet compleet betrouwbare, accurate voorspelling.
Poor fit à compleet anders dan de situatie in het echt, geen overeenkomsten,
voorspellingen met dit model zijn compleet inaccuraat = slecht.

Par. 2.3 Populations and samples
Wetenschappers zijn geïnteresseerd in de general population om general conclusions te
trekken.
We verzamelen data van een deel van de populatie = sample.
Hieruit trekken we conclusies voor de hele populatie. Hoe groter de steekproef hoe beter.

Wetenschappers (gedrag/sociaal) proberen data vaak te beschrijven met linear models.
Dit zorgt voor 2 typen bias:
1. Veel modellen in de wetenschappelijke literatuur zijn misschien niet degenen die het
beste pasten (omdat er geen non-lineair models zijn geprobeerd).
2. Veel datasets zijn niet gepubliceerd omdat het lineaire model niet paste en
wetenschappers niet hebben gekeken naar niet-lineaire modellen.

Belangrijk om je data altijd eerst te plotten.

Par. 2.4 Statistical models
De data die we observeren kan voorspeld worden door het passende model en een beetje
error:

Outcomei = (model) + errori

Het model in de vergelijking hangt af van:
1. het ontwerp van het onderzoek
2. type data
3. wat je wilt bereiken met het model

Statistische modellen bestaan uit variabelen en parameters.
Variabelen = gemeten constructies die variëren over mensen/dingen in de steekproef.
Parameters = worden geschat op basis van de data (i.p.v. gemeten) en zijn meestal
constanten waarvan wordt aangenomen dat ze een fundamentele waarheid
vertegenwoordigen over de relaties tussen variabelen in het model.
Voorbeelden parameters:
• Mean, median (die schatten het centrum van de distributie).
• Correlatie, regressiecoëfficiënt (schatten de relatie tussen 2 variabelen).

Als we alleen geïnteresseerd zijn in het samenvatten van de uitkomst, zoals we doen
wanneer we een gemiddelde berekenen, dan zullen we geen variabelen in het model
hebben, alleen een parameter, dus bijv:

, Outcomei = (b) + errori
Vaak willen we echter een uitkomst van een variabele voorspellen. We geven meestal
voorspellende variabelen aan met de letter x, dus:
Outcomei = (bXi) + errori
Nu voorspellen we de waarde van de uitkomst voor een bepaalde entiteit (i) op basis van de
score op de voorspellende variabele (Xi). Aan de voorspellende variabele is een parameter
(b) gekoppeld, die ons iets vertelt over de relatie tussen de voorspeller (Xi) en de uitkomst.
Als we een uitkomst van 2 voorspellers willen voorspellen kunnen we ook een andere
voorspeller toevoegen:
Outcomei = (b1X1i + b2X2i) + errori

à We kunnen de waarden van een uitkomstvariabele voorspellen op basis van een soort
model. De vorm van het model verandert, maar er zal altijd sprake zijn van error en er zullen
altijd parameters zijn die ons vertellen over de vorm van het model.

We kunnen steekproefgegevens gebruiken om te schatten wat de populatieparameters
waarschijnlijk zullen zijn. Daarom gebruiken we het woord schatting, want wanneer we
parameters berekenen op basis van steekproefdata, zijn dit slechts schattingen (d.w.z. een
‘beste schatting’) van wat de echte parameter in de populatie is.

Par. 2.4.2 Assessing the fit of a model: sums of squares and variance revisited
Met de meeste statistische modellen kunnen we bepalen of het model juist is door te kijken
hoe verschillend onze echte gegevens zijn van het model dat we hebben gemaakt.
Voorbeeld: gemiddelde = 2.6, docent scoort 1.
Outcomedocent1 = gem. + errordocent1
1 = 2.6 + errordocent1
errordocent1 = 1-2.6 = -1.6 (=error).

Deviatie is een ander woord voor errror.
Error = deviatie = residual = deviation
Deviance = outcomei – modeli
dus error = waargenomen score – voorspelde score

We willen de nauwkeurigheid/’fit’ van het model in het algemeen weten. We kunnen niet
deviaties bij elkaar optellen, want sommigen zijn positief en sommigen negatief, dus dan
eindtotaal 0.
Om dit probleem op te lossen à kwadrateren.

Hoe meer data, hoe hoger de SS.

Om de gemiddelde fout in de populatie te schatten, moeten we niet delen door het aantal
scores dat bijdraagt aan het totaal, maar door de degrees of freedom (df) = het aantal scores
dat wordt gebruikt om het totaal te berekenen gecorrigeerd voor het feit dat we proberen de
populatiewaarde te schatten.

Statistisch gezien hebben de degrees of freedom betrekking op het aantal observaties dat
vrij kan variëren.
Als we één parameter constant houden, moeten de vrijheidsgraden één lager zijn dan het
aantal scores dat is gebruikt om die parameter te berekenen.
Dus N-1.

Wanneer ons model het gemiddelde is, heeft de gemiddelde kwadratische fout een speciale
naam: de variantie.

, Als de variantie groot is, is de mean geen goede representatie van de geobserveerde scores
à poor fit.

Par. 2.4.3 Estimating parameters
De mean is de parameter/score met de minste error in totaal. Het is de beste fit dan elke
andere waarde à using mean to minimize error à minimizing the sum of squared error =
method of least squares.

Par. 2.5 Going beyond the data
Par. 2.5.1 The standard error
Standaard deviatie vertelt hoe goed het gemiddelde de steekproef representeert. Dit is
belangrijk om te weten omdat je conclusies wilt trekken over de populatie.

Sampling variation = steekproeven variëren omdat ze verschillende mensen uit de populatie
bevatten.
Alle samples samen vormen een sampling distribution = de frequentieverdeling van
steekproefgemiddelden uit dezelfde populatie.
Sampling distributions zijn er meer voor het idee, maar komen in het echte leven eigenlijk
niet voor.
We kunnen de sampling distribution gebruiken om te kijken hoe goed een sample de
populatie representeert.

De standaard deviatie van sample means is de standard error of the mean (SE) of standard
error. In de echte wereld kunnen we niet honderden steekproeven verzamelen en dus
vertrouwen we op benaderingen van de standard error.

Central limit theorem = naarmate steekproeven groter worden (groter dan 30) heeft de
steekproefverdeling een normale verdeling met een gemiddelde gelijk aan het
populatiegemiddelde en een standaard deviatie van:

Dit is de formule van de standard error!!
!! Note: we hebben het nu steeds over de mean, maar elke parameter kan een sampling
distribution en standard error hebben.

Par. 2.5.2 Confidence Intervals
We kunnen grenzen berekenen waar de populatie binnenvalt. Zulke grenzen heten
confidence intervals. Ze vertellen ons de kans dat ze de echte waarde bevatten van de
parameter die we proberen te schatten (bijv. gemiddelde).

95% confidence intervals, maar ook 99%,
à Als we van 100 steekproeven het gemiddelde berekenen en vervolgens een
betrouwbaarheidsinterval voor het gemiddelde hadden berekend, zan zouden 95 van deze
steekproeven en dan het confidence interval ervan de echte waarde van de populatie mean
bevatten.

Normal distribution à mean=0, standaard deviatie=1
à 95% van z-scores valt tussen -1.96 en 1.96. We weten van Central limit theorem dat in
grote steekproeven (>30) de sampling distribution normaal verdeeld is.

De mean is altijd in het centrum van het CI. Als het interval klein is, ligt de sample mean erg
dicht bij de populatie (true) mean.

€6,69

Krijg toegang tot het volledige document:

Gekocht door 29 studenten

100% tevredenheidsgarantie

Direct beschikbaar na je betaling

Lees online óf als PDF

Geen vaste maandelijkse kosten

Maak kennis met de verkoper

tamaradolk

4,3

(3)

Beoordelingen van geverifieerde kopers

Alle 3 reviews worden weergegeven

renskalkhoven Psychologie · 6 beoordelingen

3 jaar geleden

wvaneenige Psychologie · 15 beoordelingen

4 jaar geleden

sddj Orthopedagogiek · 4 beoordelingen

4 jaar geleden

4,3

3 beoordelingen

Betrouwbare reviews op Stuvia

Alle beoordelingen zijn geschreven door echte Stuvia-gebruikers na geverifieerde aankopen.

Maak kennis met de verkoper

tamaradolk Erasmus Universiteit Rotterdam

Bekijk profiel

Volgen

Verkocht

Lid sinds

10 jaar

Aantal volgers

Documenten

Laatst verkocht

1 jaar geleden

Pedagogische Wetenschappen

4,3

3 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper tamaradolk. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,69. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 42151 samenvattingen verkocht Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Samenvatting 4.4 applied multivariate data analysis (Field)

Gekoppeld boek

Geschreven voor

Documentinformatie

Onderwerpen

Voorbeeld van de inhoud

Meer vakken binnen Erasmus Universiteit Rotterdam (EUR) > Pedagogische Wetenschappen

Beoordelingen van geverifieerde kopers

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?