100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Hoorcolleges Data Analyse €4,99   In winkelwagen

Samenvatting

Samenvatting Hoorcolleges Data Analyse

3 beoordelingen
 116 keer bekeken  9 keer verkocht

2020! Alle hoorcolleges van Data-Analyse dit jaar (Psychologie, jaar 2, Radboud Universiteit).

Voorbeeld 4 van de 34  pagina's

  • 10 mei 2020
  • 34
  • 2019/2020
  • Samenvatting
Alle documenten voor dit vak (27)

3  beoordelingen

review-writer-avatar

Door: Squidjuice • 1 jaar geleden

Nice summary with handy tables that provide an easy way to learn! This summary helped me achieve an 8 for this dreaded course.

review-writer-avatar

Door: moniekvandekraats • 1 jaar geleden

review-writer-avatar

Door: erikwesterweel • 4 jaar geleden

avatar-seller
elinemeuleman
Data-analyse
College 1: Data preparatie
1. Conversie
 Omzetten excel-bestand of text bestand naar SPSS
 Open  Filetype

Text bestand:
 Hoe is het gecodeerd in het tekst bestand?
 Bestanden met een extensie .csv  Comma bestanden
o Die bestanden heten in SPSS delimited  Tussen de stukjes data staat een comma
en dat duidt aan dat er een nieuw datapunt komt. Bij een return komt een nieuw
subject.
o In Nederland gebruiken we een comma voor decimalen, dus je kan ook een
semicolon (;) gebruiken. Of een tab.
 Je kan ook gebruik maken van een fixed format  Buiten het bestand wordt met een syntax
aangegeven welke getallen op welke plek horen. Dan hoeft er geen scheiding tussen de
getallen te staan, een bestand met alleen getallen achter elkaar.

2. Merge. Data  Merge files
Samenvoegen/koppelen van bestanden
 Als er iets fout gaat, is het wel bij het koppelen van twee bestanden naar één bestand

Twee manieren van merge:
 ADD CASES  in de bestanden staan verschillende personen (bv. nederlanders en chinezen
die je wilt samenvoegen). Je moet dan bij iedereen dezelfde variabelen hebben.
o De files moeten identieke variabelen namen hebben
 ADD VARIABLES  je hebt twee bestanden over dezelfde personen maar met verschillende
variabelen.
o De files moeten identieke personen hebben, maar verschillende variabele namen.
o Een ID is nodig, een key variabele  Hoe weet je nou dat het
hetzelfde persoon is? Als mensen worden geïdentificeerd met
namen, maar vaak worden dan ineens tweede letters
weggelaten etc.
o One-to one vs many-to-one
 One-to-one  In het ene bestand staan 30 studenten,
in de andere ook 30 studenten.
 Many-to-one  In het ene bestand staan scholen met
daarin leerlingen, in de ander het budget per school. In
het ene bestand staan dan 1000 leerlingen, in de ander
per 10 scholen het budget en dat budget moet
gekoppeld worden aan elke leerling.

Extra’s bij merge:
 Als je er twee wilt mergen, hou dan beide bestanden open.
 Lookup table: waarin moet worden opgezocht?  Bijvoorbeeld wanneer je één bestand hebt
met per subject een nummer en één bestand waarin de betekenis van elk nummer staat.

,Problemen bij merge:
 Je kan niet op OK drukken >>
 Er staat niks bij key variables
 Oplossing: als je bij variable view kijkt, moeten de variabelen van
hetzelfde “type” zijn: bv. allebei numeric.
o Je kan het zien aan dat de getallen hetzelfde uitgelijnd moet
zijn (bv. allebei links in het hokje)

Andere problemen bij de key variables:
 Ze moeten uniek zijn  maar één keer voorkomen
 File contention problem  laptop opnieuw opstarten

3. Aggregate
Je begint met een score per item, maar uiteindelijk wil je met totaalscores werken. Optellen is een
vorm van aggregeren. Dus je gaat van micro data naar aggregated data.
 Je wilt het in de SPSS data hebben staan, niet in de output.
 Data  Aggregrate
o “Groep” als break-variable  onafhankelijke variabele
o “Y1” en “Y2” als summaries of variables  afhankelijke variabele
o Bij Functions kan je kiezen dat je bijvoorbeeld het gemiddelde of de standaard
afwijking wil. Wil je meerdere dingen? Dan moet je ze kopiëren en opnieuw bij
Functions kiezen.

Als je ze in een nieuwe dataset wil  Kies bij save de optie create a new dataset containing only the
aggregated variables.

4. Restructure
Je maakt de data van breed naar lang.




 Bij breed (wide) staan de scores van de condities naast elkaar in verschillende variabelen
 Bij lang (long) staan ze onder elkaar; de conditie staat als aparte variabele in het bestand
 Als je van breed naar lang wil  Variables into cases
 Als je van lang naar breed wil  Cases into variables
 De conditie is de within-subjectfactor en de score is de afhankelijke variabele.
o Identifier = nummer van subject
o Index = within subjectfactor  verschilt per kolom in de brede versie
o Target = afhankelijke variabele

,College 2: Power en effect size
Het doel is om zelf de power te kunnen berekenen met een programma.

Foutsoorten
H0
Waar Onwaar
Toets Behoud  Type 2 fout

Verwerp Type 1 fout 
Type I fout: Als de nulhypothese waar is en je verwerpt hem, klopt je conclusie niet terwijl je analyse
wel kan kloppen. Je kan een significant resultaat krijgen, terwijl het eigenlijk niet niet-significant is,
wanneer je pech hebt met je steekproef. Een grote steekproef is meestal representatief, maar je kunt
ook toevallig een rare steekproef trekken (bv. van de 100 meisjes toevallig 5 jongens trekken).

Pech of geluk hebben kan je wel beïnvloeden.

Foutkansen
H0
Waar Onwaar
Toets Behoud 1-a b

Verwerp a 1-b
 Als de nulhypothese waar is, is de kans om de nulhypothese te verwerpen gelijk aan alpha.
De omgekeerde kans wordt vaak gebruik voor het betrouwbaarheidsinterval.
 Als de nulhypothese onwaar is, is de kans om deze te verwerpen gelijk aan bèta. De power is
gelijk aan 1 – bèta. De power is de kans dat je geen type II fout maakt, als de nulhypothese
waar is.

Foutkansen
H0
Waar Onwaar
Toets Behoud Betrouwbaarheid

Verwerp Significantie-niveau Power

Power is de kans dat je geen type II fout maakt als de nulhypothese onwaar is.
De kans dat je een inbreker detecteer wanneer deze er is.
Het significantieniveau is de kans op een vals alarm (H0 is waar, maar wordt verworpen).

, Diagnose
Ziekte
Nee Ja
Test Negatief Specificiteit

Positief Sensitiviteit
 Sensitiviteit komt overeen met de power op de statistiek. Dit is dus het percentage terecht
positieve uitslagen onder de patiënten (de zieke personen).


Factoren in power-analyse




Power hangt af van:
 Het significantieniveau  Een groter significantieniveau verhoogt de power en maakt een
test krachtiger.
 Effect grootte
 Grootte van de steekproef  Het verhogen van de power zal leiden tot een grotere sample.
 Je design
 De analyse die je doet  De ene analyse leidt tot een andere power.

Relatie sensitiviteit – specificiteit




Je hebt twee populaties: een zieke en gezonde populatie. Er is altijd wel een beetje overlap. Stel je
legt de grens bij score X (cutoff score). Als je de cut-off hoger maakt, wordt de specificiteit beter
maar de sensitiviteit wordt kleiner. Als je de een verbetert, wordt de ander slechter.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper elinemeuleman. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 72042 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€4,99  9x  verkocht
  • (3)
  Kopen