Dit document omvat de (uitgebreide) samenvatting van al mijn lesnotities, spss-voorbeelden, ppt's, etc. Met het blokken van enkel deze samenvatting heb ik zelf 16/20 behaald.
INHOUD
1. Nieuwe statistische methode
a. Categorische data: kruistabel, logistische regressie, multinomiale logistische regressie
b. Geclusterde data: multilevel analyse
2. Statistische software: SPSS
3. Vaardigheden
a. Analyseren ruwe data
b. Interpreteren van statistische modellen
c. Rapporteren van resultaten
d. Selecteren van juiste/meest geschikte methode om vraag te beantwoorden
AFHANKELIJKE (Y) VARIABELE IS CONTINU
Meervoudige lineaire regressie = gaat na wat het effect is van OV’s op AV (y). Effect van X op Y (zonder extreme
causaliteit te definiëren). We spreken ook over ‘onder controle van’.
Mediatie: het verband tussen x en y wordt verklaard door z. Het effect van X op Y proberen verklaren aan de hand van
mechanisme. Er zijn tussenliggende mechanisme waarom x gerelateerd is aan y.
Moderatie: verband/effect tussen x en y hangt af van z. Voorbeeld: voor hoog opgeleide is er wel een effect, voor laag
opgeleiden niet. Het bepaalt de sterkte.
Factoranalyse = data-‐reductie: verschillende items samentrekken/reduceren tot één latente variabele/factor.
Structural equation model (SEM) = combi van factor analyse en mediatie modellen.
AFHANKELIJKE (Y) VARIABELE IS CATEGORISCH
Logistische regressie: regressie waarbij AV een categorische variabele is met twee categorieën (dichotoom) (machine
learning)
Multinomiale logistische regressie: regressie waarbij AV een categorische variabele is met meerdere categorieën
ANDER
Multilevel analyse: AV is continu. Je wilt het vergelijken tussen bv. verschillenden landen. Tweede niveau eraan
toevoegen. Gegevens van verschillende niveaus worden in één databestand gezet zodat de gegevens tegelijkertijd in
een analyse kunnen worden opgenomen.
BASISCONCEPTEN
MEETNIVEAU
1. Nominaal: kan je niet ordenen. Classificeren in categorieën. Voorbeeld: gender
2. Ordinaal: categorieën kunnen geïnterpreteerd worden in meer en minder / hoger en lager… MAAR: geen vaste
meeteenheid, verschillen niet in termen van een bepaalde hoeveelheid. Voorbeeld: opleidingsniveau
3. Metrisch: vaste, kwantificeerbare meeteenheid
a. Discreet: geen tussenwaarden tussen categorieën. Voorbeeld: leeftijd
b. Continu: kan alle waarden aannemen en elke waarde zal waarschijnlijk maar 1x waargenomen
worden.
c. Quasi-‐metrisch
à Hiërarchie van meetniveaus: methode waarmee je gaat werken, hangt af van het meetniveau!
1
,à Antwoordschaal altijd interpreteren o.b.v. vraagstelling!! (zie voorbeeld oefening ppt à laatste is nominaal, niet
ordinaal, omdat het een kennisvraag is. Het maakt niet uit welk antwoord je eerst zet, het is niet echt een ordening)
A. CENTRUMMATEN
Centrummaat = Maten om centraliteit van verdeling weer te geven
a. Modus = grootste categorie (categorie die het meest voorkomt)
b. Mediaan = opdelen in twee gelijke delen (aan de ene kant 50% van gegevens en ook aan de andere
kant)
c. Gemiddelde
d. Getrimd gemiddelde = gemiddelde
zonder uitschieters (omdat gemiddelde
zeer afhankelijk is van die uitschieters)
e. Uitschieters = extreme waarden, die niet
hetzelfde patroon volgen als de andere
waarden (kan betekenis hebben OF
meetfout)
B. SPREIDINGSKENMERKEN
a. Interkwartielafstand = verschil tussen het derde en eerste kwartiel = de vijftig procent middelste
gegevens rond de mediaan
b. Bereik = Verschil tussen grootste en kleinste waarden
c. Standaarddeviatie / variantie = Uitdrukking van spreiding rond het gemiddelde
Formule variantie=je gaat voor elk gegeven kijken
wat de deviatiescore is van dat punt, dus kijken
hoeveel de score afwijkt van het gemiddelde (van
elke score het gemiddelde aftrekken). Dat verschil
wordt gekwadrateerd omdat 1) we willen werken
met positieve getallen aangezien je wilt gaan
sommeren en dat is niet mogelijk met – en +
getallen want dan krijg je nul (som van
deviatiescores is altijd nul) en 2) grote verschillen
zullen een groter gewicht krijgen om mee te tellen
in de berekening van de spreiding. Die afstanden ga je sommeren om te kijken hoeveel afwijking je hebt t.o.v. het
gemiddelde. dit deel je door n-‐1 (of n, afhankelijk van of je werkt met populatie of steekproefdata).
2
,à Verschil standaarddeviatie en variantie: standaard-‐afwijking is de vierkantswortel
van de variantie.
à grote SD = grote spreiding = respondenten gaven heel verschillende antwoorden.
Boxplot: gaat visueel weergeven hoe de verdeling van de variabele eruit ziet
C. STANDAARDISEREN
Standaardiseren = wie wijkt relatief gezien het meeste af? Wie het minste?
à Transformatie uitvoeren op onze oorspronkelijke waarde om dat te kunnen
uitdrukken in standaardafwijkingen bv.
Formule:
à Z-‐transformatie: van elke waarde het gemiddelde aftrekken en delen door de SD.
à interpretatie: de respondent wijkt … SD af van het gemiddelde. Zo kan je in één oogopslag concluderen welke
respondent er (minder) fel afwijkt van het gemiddelde.
BELANGRIJK: coderen van missende waarden! Niet vergeten!
D. NORMALE VERDELING
Typisch aan een normale verdeling is dat 68 % van de gegevens
zich bevindt binnen het [gemiddelde – SD; gemiddelde + SD].
95% van de gegevens ligt op het [gemiddelde – 1.96 SD;
gemiddelde + 1.96 SD].
à Er kunnen dus gebieden worden afgebakend die een bepaald
percentage van de respondenten bevat. Voorbeeld: iemand
met een score lager dan 70 of hoger dan 110 is uitzonderlijk. Er
is in totaal maar 5% (2x 2.5%) die dit zouden scoren.
E. STANDAARD NORMALE VERDELING
Standaard normale verdeling = Dichtheidsfunctie van de normale verdeling, maar dan met gestandaardiseerde scores.
We gaan van een normale verdeling naar een standaard normale verdeling door alle geobserveerde waarden te gaan
standaardiseren. Als we die dan plotten, krijgen we deze verdeling. Gemiddelde is steeds 0 en SD 1. Je proporties kan
je uitdrukken in 1 en -‐1 SD bevindt zich 68% van de observaties etc.
3
, INDUCTIEVE STATISTIEK
DOEL
Inductieve statistiek = Van steekproef naar
populatie gaan. Wat zegt die steekproef en
gemiddelde ons over die populatie? We willen
bepaalde kansenuitspraken doen over de
populatie.
à Onzekere factor in kaart brengen: hoe
zeker ben ik van mijn steekproef? Hoe
nauwkeurig is die of hoe ver wijkt die af?
We gaan altijd fouten maken wanneer we dat
doen. De perfecte steekproef bestaat niet (=foutenmarge). Een steekproef is altijd maar een stukje uit de populatie
dus nooit de perfecte weerspiegeling.
Wet van grote aantallen = hoe groter n, hoe dichter het steekproefgemiddelde bij het populatiegemiddelde zal liggen.
HYPOTHESETEST: LOGICA
1. Formuleren van nul-‐ en alternatieve hypothese
o Kan je hetgeen je vindt zomaar veralgemenen naar de populatie?
o Nul-‐ en alternatieve hypothese voor verschil, relatie en effect
o Achter elke p-‐waarde zit een nulhypothese (prof vraagt op examen graag naar wat de nulhypothese is)
o Voorbeelden:
T-‐test: verschil in gemiddelde tussen twee groepen
• H0: Mannen en vrouwen verschillen niet in hun houding tegenover werklozen (μman
= μvrouw)
• Ha: Mannen en vrouwen verschillen in hun houding tegenover werklozen (μman ≠
μvrouw)
Correlatie
• H0: Er is geen correlatie (samenhang) tussen leeftijd en houding tegenover
werklozen (r = 0)
• Ha: Er is een negatieve correlatie (samenhang) tussen leeftijd en houding tegenover
werklozen (r < 0)
Effect
• H0: Opleiding geeft geen effect op houding tegenover werklozen (β = 0)
• Ha: Opleiding heeft een positief effect op houding tegenover werklozen (β > 0)
2. Bepalen van kritieke gebied en significantieniveau
o Hoe aannemelijk is de nulhypothese?
o Wat voor steekproefstatistiek zouden we moeten bekomen, indien de nulhypothese klopt?
3. Bereken steekproefstatistieken, gegeven de nulhypothese en testwaarden bepalen
o Nulhypothese is opgesteld (stap 1)
o Significantie niveau is bepaald (stap 2)
o Nu: steekproef trekken om nulhypothese te evalueren
§ Berekenen steekproefstatistiek (gemiddelde, correlatie, regressie coëfficiënt...)
o Indien nulhypothese klopt, hoe uitzonderlijk is ons steekproefresultaat dan? Voorbeeld: Hoe extreem
is het gevonden steekproefgemiddelde, gegeven het vooropgestelde populatiegemiddelde?
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller manouswinnen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.59. You're not tied to anything after your purchase.