HOOFDSTUK 1: VAN PROBLEEM NAAR ANALYSE
Probleemkenmerk Focus op kenmerk van het probleem
Probleemrelatie
Focus op samenhang tussen variabelen (vb leeftjid en bestaansonszekerheid)
= > in welke mate kan het verband verklaard worden door andere relevante
kenmerken?
Datareductie of
synthese Wanneer er verschillende uitspraken of items bevraagd zijn geweest in een
survey en men wilt achterhalen wat deze informatie zegt over de attitudes of
opinies van respondenten over bepaalde maatschappelijke thema’s
= > veelheid aan indicatoren herleiden tot enkele achterliggende concepten of
dimensies
Manifeste variabele
Variabele die rechtstreeks werd opgemeten bij analyse eenheden (vb leeftijd van
respondenten, opleidingsniveau)
= > nominaal of ordinaal niveau
Latente variabele
Variabele die niet rechtstreeks werd opgemeten bij de analyse eenheden (vb
complexe schalen die worden berekend obv verschillende manifeste items)
= > interval of rationiveau
Symmetrische
samenhang Er wordt geen onderscheid gemaakt tussen verklarende variabele en te
verklaren variabele
Asymmetrische
samenhang Een onafhankelijke (verklarende) variabele oefent een lineair (causaal) effect uit
op een afhankelijke (te verklaren) variabele
Causaal effect
Een niet-lineair effect
De verandering in de afhankelijke variabele ten gevolge van eenzelfde
verandering in de onafhankelijke variabele wordt gradueel groter of kleiner
Lineair effect
Een eenzelfde verandering in de onafhankelijke variabele heeft steeds eenzelfde
verandering in de afhankelijke variabele tot gevolg
Interactie-effect
Een asymmetrische samenhang waarbij de combinatie van twee of meer
onafhankelijke variabelen een causaal effect uitoefent op de afhankelijke
variabelen
Schijnbare causaliteit
De samenhang tussen de variabelen verdwijnt na een controle voor een andere
variabele
Vb samenhang tussen werk en overgewicht verdwijnt na controle voor leeftijd
Indirecte causaliteit Wanneer de samenhang tussen twee variabelen niet wegverklaard wordt na
1
, controle voor een andere variabele, maar wel verdwijnt. De variabele die wordt
toegevoegd duidt dan op een tussenliggend of intermediair verband, en verbind
de twee oorspronkelijke variabelen
Suppressie van
samenhang Wanneer het zwakke verband tssn 2 variabelen het resultaat is van twee
tegengestelde effecten die elkaar opheffen, maar doordat een 3 e variabele
wordt toegevoegd, wordt dit verband wel zichtbaar
= > suppressorvariabele: verband wordt slechts zichtbaar na controle voor de
suppressorvariabele
Interactieve structuur
Wanneer twee effecten nt zomaar opgeteld kunnen worden, het effect van
leeftijd varieert bv in functie vd beroepsgroep
Convergente causale
structuur De invloed van meerder verklarende (onafhankelijke) variabelen wordt
onderzocht op een te verklaren (afhankelijke) variabele
Vb. invloed van politiek vertrouwen én invloed van vertrouwen in instellingen op
het al dan niet bijdragen aan de maatschappij
Multicollineariteit
Als er een sterk lineair verband is tussen verklarende variabelen, spreek je van
multicollineariteit. Multicollineariteit kan ertoe leiden dat de
regressiecoëfficiënten in je regressiemodel slechter worden geschat.
Meervoudige regressie
Een meervoudige of multipele regressieanalyse is een uitbreiding van de
enkelvoudige regressie waarbij twee of meer verklarende variabelen worden
gebruikt om de afhankelijke variabele (Y) te voorspellen of verklaren. Voorbeeld:
Je wilt naast lengte ook geslacht gebruiken om iemands gewicht te voorspellen
Dummy-regressie
Een dummy-regressie is een analyse die begint bij een onafhankelijke
dummyvariabele en kijkt wat het effect is op de afhankelijke variabele. Men
bekijkt bijvoorbeeld het effect van geslacht op politieke voorkeur.
Het gebruik van dummy-variabele laat toe om zowel effecten van categorische
als kwantitatieve onafhankelijke variabele te onderzoeken.
T-test
Een t-test is een test die gebruikt wordt bij variabele vergelijking. Het wordt
gebruikt om de gemiddelden van maximaal twee groepen met elkaar te
vergelijken. Je kunt de t-test bijvoorbeeld gebruiken om te analyseren of
moedertaalsprekers gemiddeld sneller spreken dan niet-moedertaalsprekers.
F-test
Een F-test is een test die gebruikt wordt bij modelvergelijking. De F-waarde
wordt vergeleken met een theoretische F-verdeling om te bepalen hoe
waarschijnlijk het is dat de F-waarde per toeval wordt verkregen. Deze
2
, waarschijnlijkheid is de significante waarde. Als de significantie kleiner is dan het
significantieniveau, zijn de gemiddelden significant verschillend.
De f-test wordt gebruikt om twee varianties met elkaar te vergelijken van twee
modellen.
Logistische regressie
In de statistiek wordt logistische regressie gebruikt om
een dichotome uitkomstvariabele te relateren aan een of meer variabelen.
Logistische regressieanalyse kan gezien worden als de techniek die het meest bij
lineaire regressie aansluit, en is hierbij tevens het alternatief voor lineaire
regressie in het geval de gemeten variabele niet continu van aard is (metrisch of
ratiomeetniveau).
Multinomial logit model
Een multinominaal logistische regressie model wordt gebruikt om het effect van
voorspellers op een nominale uitkomstmaat te analyseren. De uitkomstmaat
bestaat uit (meer dan twee) categorieën, die niet een logische ordening hebben.
Het is een uitbreiding op de logistische regressie want er wrdt geen gebruik
gemaakt van dummy onafhankelijke variabele maar van polytome
onafhankelijke variabele.
Principale
Componentenanalyse Is een methode waarbij men nieuwe latente variabelen of schalen tracht te
construeren die achtereenvolgens een maximale hoeveelheid aan informatie uit
de oorspronkelijke items extraheren.
Principale Factoranalyse
Hierbij wordt de informatie van elk item uitgesplitst in informatie die opgedeeld
wordt met andere items en informatie die eigen is aan elk item.
HOOFDSTUK 2: MEET EN MEETNIVEAUS
Equivalentieklasse Deelverzameling van de populatie P die alle elementen (statistische eenheden)
groepeert die voor het bestudeerde kenmerk als equivalent (gelijkwaardig)
kunnen worden beschouwd.
Meetschaal
Aan elke equivalentieklasse vh ongeschaalde kenmerk wordt een eigen waarde
(kwalitatief of kwantitatief) toegekend
= > meetschaal is de verzameling X van waarden
EIGENSCHAPPEN:
1. Ordenbaarheid
2. Het bestaan van een meeteenheid
3. Het bestaan van een absoluut nulpunt
=> als er een absoluut nulpunt bestaat komen neg waarden nt voor
, Kwalitatieve waarden of
modaliteiten Vb. mensen die in provincie Antwerpen wonen krijgen in de dataset de tekst
‘Antwerpen’ als waarde voor de variabele woonplaats
Kwantitatieve waarden = > Aan elke waarde van het ongeschaalde kenmerk wordt een eigen, specifiek
getal toegekend
= > De waarden die aan equivalentieklassen werden toegekend, weerspiegelen
de relaties die in realiteit bestaan tussen de equivalentieklassen, en énkel die
relaties.
Dummyvariabele
Zo kan je kenmerken van een lager meetniveau (ordinaal en nominaal) toch
gebruiken als kenmerken van een hoger meetniveau
= Categorische variabelen (nominaal/ordinaal) met twee categorieën waarbij
gebruik wordt gemaakt van 0/1-codering
= > je kan ook dummyvariabelen gebruiken met categorische variabelen met
meer dan 2 categorieën: polytome variabelen met k categorieën worden hierbij
omgezet naar een set van (k-1) dummyvariabelen
= > categorie die = 0: referentiecategorie
= > de categorieën met waarde 1 worden voor de verschillende design
variabelen vergeleken tov een specifieke referentiecategorie
Effectcodering
= > categorische variabele met K categorieën wordt ook omgezet naar (k-1)
cato’s, maar er wordt nu gebruik gemaakt vd waarden -1, 0, 1: zodat het
ongewogen rekenkundige gemiddelde voor elke designvariabele telkens 0
bedraagt
= > bij effectcodering is het ongewogen rekenkundige gemiddelde altijd gelijk
aan 0
= > de categorieën met waarde 1 worden voor de verschillende design
variabelen vergeleken tov de gemiddelde waarde vd afhankelijke variabele
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lunaverdickt. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.43. You're not tied to anything after your purchase.