Data-analyse
College 1: Data preparatie
1. Conversie
Omzetten excel-bestand of text bestand naar SPSS
Open Filetype
Text bestand:
Hoe is het gecodeerd in het tekst bestand?
Bestanden met een extensie .csv Comma bestanden
o Die bestanden heten in SPSS delimited Tussen de stukjes data staat een comma
en dat duidt aan dat er een nieuw datapunt komt. Bij een return komt een nieuw
subject.
o In Nederland gebruiken we een comma voor decimalen, dus je kan ook een
semicolon (;) gebruiken. Of een tab.
Je kan ook gebruik maken van een fixed format Buiten het bestand wordt met een syntax
aangegeven welke getallen op welke plek horen. Dan hoeft er geen scheiding tussen de
getallen te staan, een bestand met alleen getallen achter elkaar.
2. Merge. Data Merge files
Samenvoegen/koppelen van bestanden
Als er iets fout gaat, is het wel bij het koppelen van twee bestanden naar één bestand
Twee manieren van merge:
ADD CASES in de bestanden staan verschillende personen (bv. nederlanders en chinezen
die je wilt samenvoegen). Je moet dan bij iedereen dezelfde variabelen hebben.
o De files moeten identieke variabelen namen hebben
ADD VARIABLES je hebt twee bestanden over dezelfde personen maar met verschillende
variabelen.
o De files moeten identieke personen hebben, maar verschillende variabele namen.
o Een ID is nodig, een key variabele Hoe weet je nou dat het
hetzelfde persoon is? Als mensen worden geïdentificeerd met
namen, maar vaak worden dan ineens tweede letters
weggelaten etc.
o One-to one vs many-to-one
One-to-one In het ene bestand staan 30 studenten,
in de andere ook 30 studenten.
Many-to-one In het ene bestand staan scholen met
daarin leerlingen, in de ander het budget per school. In
het ene bestand staan dan 1000 leerlingen, in de ander
per 10 scholen het budget en dat budget moet
gekoppeld worden aan elke leerling.
Extra’s bij merge:
Als je er twee wilt mergen, hou dan beide bestanden open.
Lookup table: waarin moet worden opgezocht? Bijvoorbeeld wanneer je één bestand hebt
met per subject een nummer en één bestand waarin de betekenis van elk nummer staat.
,Problemen bij merge:
Je kan niet op OK drukken >>
Er staat niks bij key variables
Oplossing: als je bij variable view kijkt, moeten de variabelen van
hetzelfde “type” zijn: bv. allebei numeric.
o Je kan het zien aan dat de getallen hetzelfde uitgelijnd moet
zijn (bv. allebei links in het hokje)
Andere problemen bij de key variables:
Ze moeten uniek zijn maar één keer voorkomen
File contention problem laptop opnieuw opstarten
3. Aggregate
Je begint met een score per item, maar uiteindelijk wil je met totaalscores werken. Optellen is een
vorm van aggregeren. Dus je gaat van micro data naar aggregated data.
Je wilt het in de SPSS data hebben staan, niet in de output.
Data Aggregrate
o “Groep” als break-variable onafhankelijke variabele
o “Y1” en “Y2” als summaries of variables afhankelijke variabele
o Bij Functions kan je kiezen dat je bijvoorbeeld het gemiddelde of de standaard
afwijking wil. Wil je meerdere dingen? Dan moet je ze kopiëren en opnieuw bij
Functions kiezen.
Als je ze in een nieuwe dataset wil Kies bij save de optie create a new dataset containing only the
aggregated variables.
4. Restructure
Je maakt de data van breed naar lang.
Bij breed (wide) staan de scores van de condities naast elkaar in verschillende variabelen
Bij lang (long) staan ze onder elkaar; de conditie staat als aparte variabele in het bestand
Als je van breed naar lang wil Variables into cases
Als je van lang naar breed wil Cases into variables
De conditie is de within-subjectfactor en de score is de afhankelijke variabele.
o Identifier = nummer van subject
o Index = within subjectfactor verschilt per kolom in de brede versie
o Target = afhankelijke variabele
,College 2: Power en effect size
Het doel is om zelf de power te kunnen berekenen met een programma.
Foutsoorten
H0
Waar Onwaar
Toets Behoud Type 2 fout
Verwerp Type 1 fout
Type I fout: Als de nulhypothese waar is en je verwerpt hem, klopt je conclusie niet terwijl je analyse
wel kan kloppen. Je kan een significant resultaat krijgen, terwijl het eigenlijk niet niet-significant is,
wanneer je pech hebt met je steekproef. Een grote steekproef is meestal representatief, maar je kunt
ook toevallig een rare steekproef trekken (bv. van de 100 meisjes toevallig 5 jongens trekken).
Pech of geluk hebben kan je wel beïnvloeden.
Foutkansen
H0
Waar Onwaar
Toets Behoud 1-a b
Verwerp a 1-b
Als de nulhypothese waar is, is de kans om de nulhypothese te verwerpen gelijk aan alpha.
De omgekeerde kans wordt vaak gebruik voor het betrouwbaarheidsinterval.
Als de nulhypothese onwaar is, is de kans om deze te verwerpen gelijk aan bèta. De power is
gelijk aan 1 – bèta. De power is de kans dat je geen type II fout maakt, als de nulhypothese
waar is.
Foutkansen
H0
Waar Onwaar
Toets Behoud Betrouwbaarheid
Verwerp Significantie-niveau Power
Power is de kans dat je geen type II fout maakt als de nulhypothese onwaar is.
De kans dat je een inbreker detecteer wanneer deze er is.
Het significantieniveau is de kans op een vals alarm (H0 is waar, maar wordt verworpen).
, Diagnose
Ziekte
Nee Ja
Test Negatief Specificiteit
Positief Sensitiviteit
Sensitiviteit komt overeen met de power op de statistiek. Dit is dus het percentage terecht
positieve uitslagen onder de patiënten (de zieke personen).
Factoren in power-analyse
Power hangt af van:
Het significantieniveau Een groter significantieniveau verhoogt de power en maakt een
test krachtiger.
Effect grootte
Grootte van de steekproef Het verhogen van de power zal leiden tot een grotere sample.
Je design
De analyse die je doet De ene analyse leidt tot een andere power.
Relatie sensitiviteit – specificiteit
Je hebt twee populaties: een zieke en gezonde populatie. Er is altijd wel een beetje overlap. Stel je
legt de grens bij score X (cutoff score). Als je de cut-off hoger maakt, wordt de specificiteit beter
maar de sensitiviteit wordt kleiner. Als je de een verbetert, wordt de ander slechter.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper elinemeuleman. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,99. Je zit daarna nergens aan vast.