100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting/Lesnotities Kwantitatieve Data-analyse (prof: Cecil Meeusen) €6,99
In winkelwagen

Samenvatting

Samenvatting/Lesnotities Kwantitatieve Data-analyse (prof: Cecil Meeusen)

 92 keer bekeken  3 keer verkocht

Dit document omvat de (uitgebreide) samenvatting van al mijn lesnotities, spss-voorbeelden, ppt's, etc. Met het blokken van enkel deze samenvatting heb ik zelf 16/20 behaald.

Voorbeeld 4 van de 94  pagina's

  • 20 februari 2023
  • 94
  • 2022/2023
  • Samenvatting
Alle documenten voor dit vak (1)
avatar-seller
manouswinnen
KWANTITATIEVE  DATA-­‐ANALYSE


1.    INLEIDING  +  HERHALING  BASISCONCEPTEN
INLEIDING
VOORKENNIS
-­‐   Univariate  statistieken  (bv.  gemiddelde,  standaarddeviatie)
-­‐   Bivariate  statistieken,  samenhang  (bv.  correlatie,  chi-­‐kwadraat)  -­‐  Inductieve  statistiek  (bv.  hypothesetesten)
-­‐   Analyse  van  de  afhankelijkheid  (bv.  regressie  analyse)
-­‐   Datareductie  (bv.  exploratieve  factor  analyse)
-­‐   Mediatie  &  moderatie
-­‐   Confirmatorische  factor  analyse  &  structurele  modellen


INHOUD
1.   Nieuwe  statistische  methode
a.   Categorische  data:  kruistabel,  logistische  regressie,  multinomiale  logistische  regressie
b.   Geclusterde  data:  multilevel  analyse
2.   Statistische  software:  SPSS
3.   Vaardigheden
a.   Analyseren  ruwe  data
b.   Interpreteren  van  statistische  modellen
c.   Rapporteren  van  resultaten
d.   Selecteren  van  juiste/meest  geschikte  methode  om  vraag  te  beantwoorden


AFHANKELIJKE  (Y)  VARIABELE  IS  CONTINU
Meervoudige  lineaire  regressie  =  gaat  na  wat  het  effect  is  van  OV’s   op  AV  (y).  Effect  van  X  op   Y  (zonder   extreme
causaliteit  te  definiëren).  We  spreken  ook  over  ‘onder  controle  van’.


Mediatie:  het  verband  tussen  x  en  y  wordt  verklaard  door  z.  Het  effect  van  X  op  Y  proberen  verklaren  aan  de  hand  van
mechanisme.  Er  zijn  tussenliggende  mechanisme  waarom  x  gerelateerd  is  aan  y.


Moderatie:  verband/effect  tussen  x  en  y  hangt  af  van  z.  Voorbeeld:  voor  hoog  opgeleide  is  er  wel  een  effect,  voor  laag
opgeleiden  niet.  Het  bepaalt  de  sterkte.


Factoranalyse  =  data-­‐reductie:  verschillende  items  samentrekken/reduceren  tot  één  latente  variabele/factor.


Structural  equation  model  (SEM)  =  combi  van  factor  analyse  en  mediatie  modellen.


AFHANKELIJKE  (Y)  VARIABELE  IS  CATEGORISCH
Logistische  regressie:  regressie  waarbij  AV  een  categorische  variabele  is  met  twee  categorieën  (dichotoom)  (machine
learning)


Multinomiale  logistische  regressie:  regressie  waarbij  AV  een  categorische  variabele  is  met  meerdere  categorieën


ANDER
Multilevel   analyse:   AV   is   continu.   Je   wilt   het   vergelijken   tussen   bv.   verschillenden   landen.   Tweede   niveau   eraan
toevoegen.  Gegevens  van  verschillende  niveaus  worden  in  één  databestand  gezet  zodat  de  gegevens  tegelijkertijd  in
een  analyse  kunnen  worden  opgenomen.


BASISCONCEPTEN
MEETNIVEAU
1.   Nominaal:  kan  je  niet  ordenen.  Classificeren  in  categorieën.  Voorbeeld:  gender
2.   Ordinaal:  categorieën  kunnen  geïnterpreteerd  worden  in  meer  en  minder  /  hoger  en  lager…  MAAR:  geen  vaste
meeteenheid,  verschillen  niet  in  termen  van  een  bepaalde  hoeveelheid.  Voorbeeld:  opleidingsniveau
3.   Metrisch:  vaste,  kwantificeerbare  meeteenheid
a.   Discreet:  geen  tussenwaarden  tussen  categorieën.  Voorbeeld:  leeftijd
b.   Continu:   kan   alle   waarden   aannemen   en   elke   waarde   zal   waarschijnlijk   maar   1x   waargenomen
worden.
c.   Quasi-­‐metrisch


à  Hiërarchie  van  meetniveaus:  methode  waarmee  je  gaat  werken,  hangt  af  van  het  meetniveau!

1

,à  Antwoordschaal  altijd  interpreteren  o.b.v.  vraagstelling!!  (zie  voorbeeld  oefening  ppt  à  laatste  is  nominaal,  niet
ordinaal,  omdat  het  een  kennisvraag  is.  Het  maakt  niet  uit  welk  antwoord  je  eerst  zet,  het  is  niet  echt  een  ordening)






A.   CENTRUMMATEN
Centrummaat  =  Maten  om  centraliteit  van  verdeling  weer  te  geven
a.   Modus  =  grootste  categorie  (categorie  die  het  meest  voorkomt)
b.   Mediaan  =  opdelen  in  twee  gelijke  delen  (aan  de  ene  kant  50%  van  gegevens  en  ook  aan  de  andere
kant)
c.   Gemiddelde
d.   Getrimd   gemiddelde   =   gemiddelde
zonder   uitschieters   (omdat   gemiddelde
zeer  afhankelijk  is  van  die  uitschieters)
e.   Uitschieters  =  extreme  waarden,  die  niet
hetzelfde   patroon   volgen   als   de   andere
waarden   (kan   betekenis   hebben   OF
meetfout)







B.   SPREIDINGSKENMERKEN
a.   Interkwartielafstand  =   verschil  tussen  het  derde   en  eerste   kwartiel  =   de     vijftig  procent  middelste
gegevens  rond  de  mediaan
b.   Bereik  =  Verschil  tussen  grootste  en  kleinste  waarden
c.   Standaarddeviatie  /  variantie  =  Uitdrukking  van  spreiding  rond  het  gemiddelde


Formule   variantie=je  gaat  voor   elk  gegeven  kijken
wat   de   deviatiescore   is   van   dat   punt,   dus   kijken
hoeveel  de  score  afwijkt  van  het  gemiddelde  (van
elke  score   het  gemiddelde   aftrekken).   Dat   verschil
wordt  gekwadrateerd    omdat  1)  we  willen  werken
met   positieve   getallen   aangezien   je   wilt   gaan
sommeren   en   dat   is   niet   mogelijk   met   –   en   +
getallen   want   dan   krijg   je   nul   (som   van
deviatiescores   is   altijd   nul)   en   2)   grote   verschillen
zullen  een  groter  gewicht  krijgen  om  mee  te  tellen
in  de  berekening  van  de  spreiding.  Die  afstanden  ga  je  sommeren  om  te  kijken  hoeveel  afwijking  je  hebt  t.o.v.  het
gemiddelde.  dit  deel  je  door  n-­‐1  (of  n,  afhankelijk  van  of  je  werkt  met  populatie  of  steekproefdata).



2

,à  Verschil  standaarddeviatie  en  variantie:  standaard-­‐afwijking  is  de  vierkantswortel
van  de  variantie.
à  grote  SD  =  grote  spreiding  =  respondenten  gaven  heel  verschillende  antwoorden.


Boxplot:  gaat  visueel  weergeven  hoe  de  verdeling  van  de  variabele  eruit  ziet



C.   STANDAARDISEREN
Standaardiseren  =  wie  wijkt  relatief  gezien  het  meeste  af?  Wie  het  minste?
à   Transformatie   uitvoeren   op   onze   oorspronkelijke   waarde   om   dat   te   kunnen
uitdrukken  in  standaardafwijkingen  bv.
Formule:



à  Z-­‐transformatie:  van  elke  waarde  het  gemiddelde  aftrekken  en  delen  door  de  SD.
à   interpretatie:   de   respondent   wijkt   …   SD   af   van   het   gemiddelde.   Zo   kan   je  in   één   oogopslag   concluderen   welke
respondent  er  (minder)  fel  afwijkt  van  het  gemiddelde.


BELANGRIJK:  coderen  van  missende  waarden!  Niet  vergeten!


D.   NORMALE  VERDELING
Typisch  aan  een  normale  verdeling  is  dat  68  %  van  de  gegevens
zich  bevindt  binnen  het  [gemiddelde  –  SD;  gemiddelde    +  SD].
95%   van   de   gegevens     ligt   op   het   [gemiddelde   –   1.96   SD;
gemiddelde  +  1.96  SD].
à  Er  kunnen  dus  gebieden  worden  afgebakend  die  een  bepaald
percentage   van   de   respondenten   bevat.   Voorbeeld:   iemand
met  een  score  lager  dan  70  of  hoger  dan  110  is  uitzonderlijk.  Er
is  in  totaal  maar  5%  (2x  2.5%)  die  dit  zouden  scoren.



E.   STANDAARD  NORMALE  VERDELING

















Standaard  normale  verdeling  =  Dichtheidsfunctie  van  de  normale  verdeling,  maar  dan  met  gestandaardiseerde  scores.
We  gaan  van  een  normale  verdeling  naar  een  standaard  normale  verdeling  door  alle  geobserveerde  waarden  te  gaan
standaardiseren.  Als  we  die  dan  plotten,  krijgen  we  deze  verdeling.  Gemiddelde  is  steeds  0  en  SD  1.  Je  proporties  kan
je  uitdrukken  in  1  en  -­‐1  SD  bevindt  zich  68%  van  de  observaties  etc.

3

, INDUCTIEVE  STATISTIEK
DOEL
Inductieve   statistiek   =   Van   steekproef   naar
populatie   gaan.   Wat   zegt   die   steekproef   en
gemiddelde  ons  over  die  populatie?  We  willen
bepaalde   kansenuitspraken   doen   over   de
populatie.
à   Onzekere   factor   in   kaart   brengen:   hoe
zeker   ben   ik   van   mijn   steekproef?   Hoe
nauwkeurig  is  die  of  hoe  ver  wijkt  die  af?


We  gaan  altijd  fouten  maken  wanneer  we  dat
doen.  De  perfecte  steekproef  bestaat  niet  (=foutenmarge).  Een  steekproef  is  altijd  maar  een  stukje  uit  de  populatie
dus  nooit  de  perfecte  weerspiegeling.


Wet  van  grote  aantallen  =  hoe  groter  n,  hoe  dichter  het  steekproefgemiddelde  bij  het  populatiegemiddelde  zal  liggen.


HYPOTHESETEST:  LOGICA
1.   Formuleren  van  nul-­‐  en  alternatieve  hypothese
o   Kan  je  hetgeen  je  vindt  zomaar  veralgemenen  naar  de  populatie?
o   Nul-­‐  en  alternatieve  hypothese  voor  verschil,  relatie  en  effect
o   Achter  elke  p-­‐waarde  zit  een  nulhypothese  (prof  vraagt  op  examen  graag  naar  wat  de  nulhypothese  is)
o   Voorbeelden:
T-­‐test:  verschil  in  gemiddelde  tussen  twee  groepen
•   H0:  Mannen  en  vrouwen  verschillen  niet  in  hun  houding  tegenover  werklozen  (μman
=  μvrouw)
•   Ha:  Mannen  en  vrouwen  verschillen  in  hun  houding  tegenover  werklozen  (μman  ≠
μvrouw)
Correlatie
•   H0:  Er  is  geen  correlatie  (samenhang)  tussen  leeftijd  en  houding  tegenover
werklozen  (r  =  0)
•   Ha:  Er  is  een  negatieve  correlatie  (samenhang)  tussen  leeftijd  en  houding  tegenover
werklozen  (r  <  0)
Effect
•   H0:  Opleiding  geeft  geen  effect  op  houding  tegenover  werklozen  (β  =  0)
•   Ha:  Opleiding  heeft  een  positief  effect  op  houding  tegenover  werklozen  (β  >  0)
2.   Bepalen  van  kritieke  gebied  en  significantieniveau
o   Hoe  aannemelijk  is  de  nulhypothese?
o   Wat  voor  steekproefstatistiek  zouden  we  moeten  bekomen,  indien  de  nulhypothese  klopt?











3.   Bereken  steekproefstatistieken,  gegeven  de  nulhypothese  en  testwaarden  bepalen
o   Nulhypothese  is  opgesteld  (stap  1)
o   Significantie  niveau  is  bepaald  (stap  2)
o   Nu:  steekproef  trekken  om  nulhypothese  te  evalueren
§   Berekenen  steekproefstatistiek  (gemiddelde,  correlatie,  regressie  coëfficiënt...)
o   Indien  nulhypothese  klopt,  hoe  uitzonderlijk  is  ons  steekproefresultaat  dan?  Voorbeeld:  Hoe  extreem
is  het  gevonden  steekproefgemiddelde,  gegeven  het  vooropgestelde  populatiegemiddelde?

4

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper manouswinnen. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53340 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€6,99  3x  verkocht
  • (0)
In winkelwagen
Toegevoegd