Analyse 1
Kinderen van ouders met psychiatrische en/of verslavings- problemen (KOPP). KOPP-kinderen hebben
een verhoogde kans om zelf problemen te ontwikkelen.
Inhoud analyse 1:
- Beschrijven; gegevens samenvatten, visuele weeergaven, verbanden beschrijven tussen 2 of
meer variabelen.
- Uitleg principe van toetsing adhv; kansverdelingen en een z-toets voor 1 gemiddelde.
- Leren gebruiken van computerprogramma SPSS versie 27
Benodigdheden: grasple, geen grafische rekenmachine, spss, studieboek.
Oefenen statistiek: grasple= online oefenplatform met korte herhaling van de stof en oefenmateriaal, en
de verdiepingsopgaven op brightspace= deze opdrachten zijn moeilijker en lijken meer op het tentamen.
Spss onvoldoende/voldoende
Statistiek toets een cijfer
Terminologie:
- Datamatrix: voorbeeld van gegevens uit een steekproef. SPSS of EXCEL.
- Variabele: iets wat je meet wat kan veranderen, staat in de kolommen.
- Eenheid: horizontale rij.
- Score: wat in de losse cijfers staat.
Internaliserende problemen: van binnen uit zoals angst.
Afhankelijke variabele: gevolg, de te verklaren variable, uitkomst.
Onafhankelijke variabele: oorzaak, verklaring voor afhankelijk variabele, voorspeller.
Zoals psychische problemen van ouders zijn oorzaak van internaliserende problemen voor kinderen.
Maar andersom, problemen bij kinderen zoals een heftige depressie kan ook problemen mentaal
opleveren voor de ouders.
Dus welke afhankelijk is hangt af van je hypothese. Het kan beide kanten opgaan.
Oorlogssituatie kan ook ontstaan-> dat is dan de afhankelijke variabele, als het beide kanten op kan
gaan.
Categorische variabelen:
- Nominaal: waarden geven categorieen aan (geen volgorde); bijv. geslacht, etniciteit
(willekeurige groepen)
- Ordinaal: oplopende categorieen (waarden geven een volgorde aan zoals dat ze oplopen)
intervallen hoeven niet gelijk te zijn; opleidingsniveau, SES klasse.
,Kwantitatieve variabelen:
- Interval: waarden geven volgorde aan, gelijke intervallen zoals graden, cito score, IQ
- Ratio: waarden geven volgorde aan, gelijke intervallen en hebben een absoluut nulpunt zoals
het aantal mensen, lengte, gewicht, maakt het mogelijk te zeggen A is 2x zo lang als B.
Schema meetniveaus makkelijk ezelsbruggetje
Spss zegt voor zowel ratio als interval scale. Onderscheid vinden ze niet belangrijk.
- Discrete variabelen: kan slechts een bepaald aantal waarden aannemen; bijv aantal fouten,
aantal mensen, prijs van een product
- Continue variabelen: onbeperkt aantal waarden, tussen de twee gegevens zit altijd een derde,
scores zijn altijd afgeronde getallen (benadering van de feitelijke score) zoals lengte en
reactiesnelheid.
Gegevens ordenen en samenvatten aan de hand van frequentieverdeling.
- Eerste stap onderzoeksgroep beschrijven zoals leeftijd, aantal deelnemers
Proportie en percentage eraan toevoegen-> relatieve frequentieverdeling. Proportie= 0.25 percentage=
25%.
Proportie: waarin we geinteresseerd zijn= frequentie: totaal. Pi= Fi/N
Percentage: proportie x 100
Je moet kiezen of je de informatie relatief of absoluut weer wilt geven.
Absoluut is handig als je informatie wilt geven over exacte hoeveelheden of als het gaat om kleine
aantallen.
Relatief kan handig zijn als je groepen wil gaan vergelijken met ongelijke groepsgrootte.
Met cumulatieve relatieve frequenties kun je de relatieve positie van iemand weergeven in het geheel.
Cumulatieve relatieve frequentie: cfi = sigma (we nemen de som) 1e frequentie + 2e frequentie.
Cumulatieve proportie: cfi/ N (totaal)
Cumulatief percentage: cfi/ N x 100
Ze worden veel gebruikt in diagnostisch proces zoals bij dyslexie-> score van een leerling bij de laagte
10% dan zijn er problemen.
Percentielen:
- Van score X naar percentiel P: welk percentiel hoort er bij een Client zijn score X oftewel,
hoeveel procent van de groep scoort gelijk aan, lager dan of hoger dan de client.
- Van percentiel P naar score X: welke score hoort bij P10, welke score of lager moet iemand
halen om bij de laagste 10 procent van de groep te horen?
,Als er mensen niet op een enquete hebben gereageerd, kan je een valid percentage opstellen. Dan doe
je alsof ze wel hadden gereageerd. Anders moet je de gemiste antwoorden als percentage eronder
zetten zodat je tot de 100% komt.
Als je een onderzoek aan het doen bent is het beter om het echte percentage te geven en dus ook de
missings als percentage opgeven, je moet goed nadenken of de ontbrekende gegevens daadwerkelijk
willekeurig zijn of bijv het gevolg van schaamte of iets dergelijks. Dan is het valid percentage
vertekenend.
Percentages ronden we af naar beneden.
Mediaan: gemiddelde van de 2 middelste waarden als ze van laag naar hoog staan.
12/9/2023
Centrummaten: geven aan rond welke waarde/score de onderzoekselementen gecentreerd liggen.
Vatten frequentieverdeling samen, vergelijken groepen. Eenvoudig model voor het schatten van een
waarde.
- Modus: meest voorkomende waarde; als alle waarden even frequent voorkomen is er geen
modus. Meer dan 1 waarde met hoogste frequentie: bimodaal of multimodaal.
- Mediaan: de waarde van de middelste waarneming wanneer de waarnemingen in volgorde van
laag naar hoog staan. (=P50/ 50%), bij een even aantal waarnemingen ga je precies tussen de 2
middelste waarnemingen zitten. Kan alleen bij ordinale variabelen. Nadeel: je kunt er niet goed
mee verder rekenen. Wordt alleen gebruikt om mee te beschrijven.
- Gemiddelde: de som van alle scores gedeel door het aantal scores. Gevoelig voor uitschieters en
op interval niveau te gebruiken.
Steekproef-gemiddelde:
Populatie-gemiddelde: μ
K staat voor groepen.
Gewogen gemiddelde bij een frequentieverdeling.
Wanneer welke centrum maat? Hangt af van:
- Meetniveau
- Aanwezigheid van uitschieters/ exterme waarden
- Scheefheid
, Extreme waarden hebben meer invloed op het gemiddelde dan op de mediaan. Dus in dat geval is de
mediaan een betere indicatie voor het centrum van de verdeling dan het gemiddelde.
Scheefheid van een frequentieverdeling: de verdeling is niet symmetrisch, in tegenstelling tot de
normale verdeling.
Normale verdeling: klokvormig, symmetrisch en eentoppig.
- Negatief scheef is links laag: gemiddelde- mediaan- modus.
- Positief scheef is bij een rechts scheve verdeling: modus- mediaan- gemiddelde.
De mate van scheefheid kan worden uitgedrukt in een cijfer (Skewness)
SPSS vink onder ‘distribution’ ‘skewness’ aan.
Bij een skewness > 1 of < -1 spreek je van een scheve, niet symmetrische verdeling. Je moet dit altijd
rapporteren.
Waarom spreidingsmaten?
- Niet alle scores zijn hetzelfde, er is dus sprake van spreiding in de scores
- Centrummaat geeft geen info over de verdeling van de scores
- Centrummaat is een zwak model van de werkelijkheid→ spreidinsmaten als uitbreiding op het
model.
Soorten spreidingsmaten:
- Range: variatiebreedte- bereik- spreidingsbreedte→ hoogste score – laagste score. Nadeel: ook
erg gevoelig voor uitschieters. Formule: Xmax – Xmin
- Interkwartielafstand: IKA. Kwartielen delen de frequentieverdeling in 4 gelijke delen.
IKA= Q3 – Q1. IKA= afstand waarover de middelste heflt van alle waarnemingen ligt (50%).
Q1: 1e kwartiel→ P25 etc.
Q3 is de mediaan van de onderste helft van de verdeling.
Q2 is de mediaan van het geheel.
3 5 7 10 13 15 17
Je mag zelf kiezen of je de mediaan meetelt bij het berekenen van de mediaan
Niet meetellen
10: mediaan
Q1: 5