Nice summary with handy tables that provide an easy way to learn! This summary helped me achieve an 8 for this dreaded course.
By: moniekvandekraats • 1 year ago
By: erikwesterweel • 4 year ago
Seller
Follow
elinemeuleman
Reviews received
Content preview
Data-analyse
College 1: Data preparatie
1. Conversie
Omzetten excel-bestand of text bestand naar SPSS
Open Filetype
Text bestand:
Hoe is het gecodeerd in het tekst bestand?
Bestanden met een extensie .csv Comma bestanden
o Die bestanden heten in SPSS delimited Tussen de stukjes data staat een comma
en dat duidt aan dat er een nieuw datapunt komt. Bij een return komt een nieuw
subject.
o In Nederland gebruiken we een comma voor decimalen, dus je kan ook een
semicolon (;) gebruiken. Of een tab.
Je kan ook gebruik maken van een fixed format Buiten het bestand wordt met een syntax
aangegeven welke getallen op welke plek horen. Dan hoeft er geen scheiding tussen de
getallen te staan, een bestand met alleen getallen achter elkaar.
2. Merge. Data Merge files
Samenvoegen/koppelen van bestanden
Als er iets fout gaat, is het wel bij het koppelen van twee bestanden naar één bestand
Twee manieren van merge:
ADD CASES in de bestanden staan verschillende personen (bv. nederlanders en chinezen
die je wilt samenvoegen). Je moet dan bij iedereen dezelfde variabelen hebben.
o De files moeten identieke variabelen namen hebben
ADD VARIABLES je hebt twee bestanden over dezelfde personen maar met verschillende
variabelen.
o De files moeten identieke personen hebben, maar verschillende variabele namen.
o Een ID is nodig, een key variabele Hoe weet je nou dat het
hetzelfde persoon is? Als mensen worden geïdentificeerd met
namen, maar vaak worden dan ineens tweede letters
weggelaten etc.
o One-to one vs many-to-one
One-to-one In het ene bestand staan 30 studenten,
in de andere ook 30 studenten.
Many-to-one In het ene bestand staan scholen met
daarin leerlingen, in de ander het budget per school. In
het ene bestand staan dan 1000 leerlingen, in de ander
per 10 scholen het budget en dat budget moet
gekoppeld worden aan elke leerling.
Extra’s bij merge:
Als je er twee wilt mergen, hou dan beide bestanden open.
Lookup table: waarin moet worden opgezocht? Bijvoorbeeld wanneer je één bestand hebt
met per subject een nummer en één bestand waarin de betekenis van elk nummer staat.
,Problemen bij merge:
Je kan niet op OK drukken >>
Er staat niks bij key variables
Oplossing: als je bij variable view kijkt, moeten de variabelen van
hetzelfde “type” zijn: bv. allebei numeric.
o Je kan het zien aan dat de getallen hetzelfde uitgelijnd moet
zijn (bv. allebei links in het hokje)
Andere problemen bij de key variables:
Ze moeten uniek zijn maar één keer voorkomen
File contention problem laptop opnieuw opstarten
3. Aggregate
Je begint met een score per item, maar uiteindelijk wil je met totaalscores werken. Optellen is een
vorm van aggregeren. Dus je gaat van micro data naar aggregated data.
Je wilt het in de SPSS data hebben staan, niet in de output.
Data Aggregrate
o “Groep” als break-variable onafhankelijke variabele
o “Y1” en “Y2” als summaries of variables afhankelijke variabele
o Bij Functions kan je kiezen dat je bijvoorbeeld het gemiddelde of de standaard
afwijking wil. Wil je meerdere dingen? Dan moet je ze kopiëren en opnieuw bij
Functions kiezen.
Als je ze in een nieuwe dataset wil Kies bij save de optie create a new dataset containing only the
aggregated variables.
4. Restructure
Je maakt de data van breed naar lang.
Bij breed (wide) staan de scores van de condities naast elkaar in verschillende variabelen
Bij lang (long) staan ze onder elkaar; de conditie staat als aparte variabele in het bestand
Als je van breed naar lang wil Variables into cases
Als je van lang naar breed wil Cases into variables
De conditie is de within-subjectfactor en de score is de afhankelijke variabele.
o Identifier = nummer van subject
o Index = within subjectfactor verschilt per kolom in de brede versie
o Target = afhankelijke variabele
,College 2: Power en effect size
Het doel is om zelf de power te kunnen berekenen met een programma.
Foutsoorten
H0
Waar Onwaar
Toets Behoud Type 2 fout
Verwerp Type 1 fout
Type I fout: Als de nulhypothese waar is en je verwerpt hem, klopt je conclusie niet terwijl je analyse
wel kan kloppen. Je kan een significant resultaat krijgen, terwijl het eigenlijk niet niet-significant is,
wanneer je pech hebt met je steekproef. Een grote steekproef is meestal representatief, maar je kunt
ook toevallig een rare steekproef trekken (bv. van de 100 meisjes toevallig 5 jongens trekken).
Pech of geluk hebben kan je wel beïnvloeden.
Foutkansen
H0
Waar Onwaar
Toets Behoud 1-a b
Verwerp a 1-b
Als de nulhypothese waar is, is de kans om de nulhypothese te verwerpen gelijk aan alpha.
De omgekeerde kans wordt vaak gebruik voor het betrouwbaarheidsinterval.
Als de nulhypothese onwaar is, is de kans om deze te verwerpen gelijk aan bèta. De power is
gelijk aan 1 – bèta. De power is de kans dat je geen type II fout maakt, als de nulhypothese
waar is.
Foutkansen
H0
Waar Onwaar
Toets Behoud Betrouwbaarheid
Verwerp Significantie-niveau Power
Power is de kans dat je geen type II fout maakt als de nulhypothese onwaar is.
De kans dat je een inbreker detecteer wanneer deze er is.
Het significantieniveau is de kans op een vals alarm (H0 is waar, maar wordt verworpen).
, Diagnose
Ziekte
Nee Ja
Test Negatief Specificiteit
Positief Sensitiviteit
Sensitiviteit komt overeen met de power op de statistiek. Dit is dus het percentage terecht
positieve uitslagen onder de patiënten (de zieke personen).
Factoren in power-analyse
Power hangt af van:
Het significantieniveau Een groter significantieniveau verhoogt de power en maakt een
test krachtiger.
Effect grootte
Grootte van de steekproef Het verhogen van de power zal leiden tot een grotere sample.
Je design
De analyse die je doet De ene analyse leidt tot een andere power.
Relatie sensitiviteit – specificiteit
Je hebt twee populaties: een zieke en gezonde populatie. Er is altijd wel een beetje overlap. Stel je
legt de grens bij score X (cutoff score). Als je de cut-off hoger maakt, wordt de specificiteit beter
maar de sensitiviteit wordt kleiner. Als je de een verbetert, wordt de ander slechter.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller elinemeuleman. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.35. You're not tied to anything after your purchase.