100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Uitgebreide samenvatting van Hoorcolleges Data-analyse 2021

Beoordeling
-
Verkocht
-
Pagina's
45
Geüpload op
31-05-2021
Geschreven in
2020/2021

Uitgebreide samenvatting van de Hoorcolleges van het vak Data-analyse 2021. Hierin staan voorbeelden van situaties met een uitleg erbij die in de hoorcolleges is gegeven. Er staat zo min mogelijk puntsgewijs uitgelegd hoe en wat, dus alles staat er zo uitgebreid mogelijk zodat het hopelijk begrijpelijk is om terug te lezen na de hele cursus gevolgd te hebben. Er staan zes colleges in uitgelicht met de volgende onderwerpen: (1). Inleiding (wat is de bedoeling van de cursus?): hierin wordt uitgelegd wat Conversion, Merge en Restructure betekenen; (2). Soorten analyses: onderzoeken van assumpties, waarin wordt uitgelegd wat lineariteit, normaliteit en homogeniteit inhouden en hoe je deze kunt onderzoeken; (3). Power en Effect size, de poweranalyse wordt uitgelegd, wat beïnvloed power?, hoe werk je met power?; (4). Contrasten, het gaat hier over de Familywise error rate (FWER) en de False discovery rate (FDR), verschillende protectie procedures worden toegelicht, en verschillende contrasten worden uitgelegd en vergeleken met elkaar; (5). Generalized Linear Models, binaire variabelen worden uitgelegd, het verschil tussen GLM en GLZ (generalized linear models) wordt duidelijk, linkfuncties en distributiefuncties worden uitgelicht, de keuze van verdelingen wordt duidelijk en er komen verschillende processen aan de orde (Bernoulli en Poisson proces), daarna worden nog voorbeelden van vier belangrijkste verdelingen weergegeven, met aan het einde hiervan nog een voorbeeldopgave om te kijken of je de vier belangrijkste verdelingen een beetje snapt; (6). Resumé college: dit is het laatste college waarin nog wat handige tips staan uitgelicht die in principe al wel zijn besproken, maar nu staat het meeste nog een keer bij elkaar.

Meer zien Lees minder










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
31 mei 2021
Aantal pagina's
45
Geschreven in
2020/2021
Type
College aantekeningen
Docent(en)
Jules ellis & inge rabeling
Bevat
Alle colleges

Onderwerpen

Voorbeeld van de inhoud

Samenvatting colleges Data Analyse 2021
Radboud Universiteit Nijmegen – Colleges van Jules Ellis

College 1 – Wat willen we met deze cursus?
Achtergrond
Leerplan onderzoeksvaardigheden: de analyse van sterke en zwakke punten.
Zwakke punten: er is weinig onthouden van statistiek2 meestal, omdat er in de tussentijd niet veel
meer mee is gedaan; het tweede ding is dat veel studenten weinig probleemoplossend vermogen
hadden en dus snel stopten met het zelf oplossen van casussen; studenten hadden ook maar weinig
verschillende vragen, dus een minder onderzoekende houding; de lange-termijn commitment.
Verbeteracties voor deze zwakke punten: o.a. de opbouw van deze cursus, meer op
onderwijsmethode gericht, i.p.v. op hoe het tentamen eruit komt te zien.

Cursusdoelen
• Automatiseren van SPSS-vaardigheden
• Ontwikkelen van onderzoekende houding bij
data-analyse
• Vergroten van leervermogen in data-analyse

Studenten zouden nu op het niveau ‘bewust vaardig’
moeten zitten. Daarop zouden studenten sowieso moeten
zitten zodra ze statistiek2 voldoende hebben afgerond.
Waar studenten naartoe moeten gaan is ‘onbewust
vaardig’. Dit kun je vergelijken met autorijden: je kunt een
gesprek voeren met iemand die naast je zit, een radio
desnoods tegelijkertijd aan hebben staan en ondertussen
voer je alle handelingen zoals sturen, schakelen, etc. uit.
Om op dit niveau te komen worden er weer veel opgaven
met bekende procedures gegeven die opgelost moeten
worden. Tegelijkertijd krijg je ook moeilijkere problemen
gegeven, alleen dan kun je op een hoger niveau komen.
Hierbij moet je de data op de goede plaats krijgen
(“boekhouden”), je krijgt nieuwere vormen van de analyse
en je krijgt uiteindelijk geheel nieuwe analyses.

In de onderzoekende houding is het de bedoeling dat je veel vragen moet gaan stellen om alles uit de
data te kunnen halen wat erin zit. Dus: geen genoegen nemen met 1 analyse; alles uit de data halen
wat erin zit; zelf vragen bij de uitkomsten stellen; deze vragen onderzoeken met nieuwe analyses; met
meerdere analyses belichten.


Het vergroten van leervermogen betekent ook dat je problemen kunt oplossen. Dit is een kwaliteit die
goed is om te ontwikkelen, ook voor de rest van je leven. Eerst heb je een obstakel, en daar moet je
mee zien te dealen. Zou je dan steeds dezelfde strategie moeten blijven gebruiken als het de eerste
paar keer niet lukt? → Nee, het is de bedoeling om meerdere strategieën te gebruiken totdat het wel
lukt.




1

,Datapreparatie
Normaal heb je een standaard dataset in SPSS gegeven, doe je
een analyse en krijg je een output. Bij data-analyse zal dit toch
wat anders gaan dan gewend bij Statistiek2. De volgende
mogelijkheden die zijn weergegeven staan allemaal in de balk
bovenin SPSS. Conversie staat wel bij het file-menu.
1. Conversion
2. Merging
3. Aggregate
4. Restructure

1. Conversion (Open, filetype)
Je kunt beginnen met data die je in Excel hebt ingevoerd en die
je wilt omzetten naar een SPSS-bestand. De andere
mogelijkheid is dat je een tekstbestand hebt die je wilt inlezen
in SPSS. Van Excel naar SPSS is niet zo moeilijk → file → open,
file type aangeven → bestand opzoeken (eventueel aangeven welk blad uit excel gelezen moet
worden) → data staat in SPSS. Met tekstbestanden ligt dit moeilijker. De bestanden moeten een .csv
naam hebben. Het is moeilijk te bepalen waar welke tekst ligt gecodeerd. Deze .csv bestanden heten
in SPSS termen ‘delimited’: tussen de verschillende stukjes data staat steeds een
symbool/karakter/letter, wat aangeeft dat je op een nieuw datapunt komt. Er kunnen verschillende
manieren gebruikt worden om de scores voor een subject aan te geven. Met een comma value zijn op
de eerste regel de getallen: 1, 238, 275 en 22 de waarden voor subject 1. Voor subject 2 zijn de
waarden: 1, 8 , 9 en 7. Aangezien Nederlanders een comma normaal gebruiken om een decimaal aan
te geven kan er ook gewerkt worden met puntcomma’s en een tab tussen de waarden. Naast
delimited, bestaat er ook een fixed manier. Hier staan spaties tussen de verschillende waarden om
duidelijk te maken dat het verschillende waarden zijn en ze niet bij elkaar horen. Er is ook een fixed
manier waarop alle getallen juist allemaal achter elkaar geplakt zijn.




2. Merge (het koppelen van bestanden)
Twee bestanden samenvoegen tot één bestand. Dit kan
op twee manieren: via Add cases, en Add variables. Bij Add
cases heb je eigenlijk twee bestanden die gaan over
verschillende subjecten (eentje over chinezen en de
andere over nederlanders, maar deze wil je samenvoegen
tot één bestand waarin alles staat over zowel chinezen als
nederlanders). Je moet dan wel bij allebei de bestanden
dezelfde variabelen hebben gemeten. De andere
mogelijkheid is met Add variables. Hierin wil je twee


2

, bestanden juist naast elkaar zetten. Dit gebruik je in een situatie waarin de gemeten dingen over
dezelfde personen gaan, maar er in beide bestanden allebei andere variabelen zijn gemeten van
diezelfde personen.

Add cases → de bestanden moeten identieke
variabele namen hebben.
Add variables → het bestand moet identieke
subjecten hebben, maar verschillende variabele
namen (id-variable is benodigd: een key-variable).
Zo’n key-variable moet uniek zijn, want anders zijn
de bestanden niet te koppelen!

Er zijn one to one merge Add variables & many to
one merge Add variables. Vooral bij many to one
kan er veel mis gaan.

Er zijn in SPSS numerieke en string
variabelen. De numerieke variabelen
worden gezien als waarden waarmee
gerekend kan worden, de string
variabelen zijn eigenlijk stukken tekst die
ook cijfers kunnen zijn, maar worden wel
gezien als pure tekst.




→ computer afsluiten als er zich een file
contention problem voordoet.

3. Aggregate (in het databestand variabelen toevoegen voor gemiddelde en
SD’s i.p.v. in de output)
Als je deze data niet als nieuwe variabelen wilt toevoegen in het
databestand, maar in een nieuw databestand, dan moet je via Aggregate
Data kiezen voor een ‘Create a new dataset’ en het een nieuwe naam geven.
Wat je dan krijgt is dat je alleen de variabelen die je wilde hebben in je
dataset dan in een nieuwe dataset krijgt, zonder de oorspronkelijke data uit
het oude bestand dat er al in stond.


4. Restructure (van breed naar lang maken of
andersom)
Dezelfde data kan lang worden weergegeven waarbij
iedere persoon meerdere rijen heeft voor zijn data: de
afhankelijke variabele staat in slechts één kolom. Maar
ook breed waarbij iedere persoon slechts één rij in
gebruik heeft waarin dezelfde data staan. Het heet
Cases into variables als je van lang naar breed gaat, en
het heet Variables into cases wanneer je van breed
naar lang gaat.


3

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
robinalink Radboud Universiteit Nijmegen
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
52
Lid sinds
6 jaar
Aantal volgers
45
Documenten
31
Laatst verkocht
6 maanden geleden

3,7

6 beoordelingen

5
2
4
2
3
0
2
2
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen