100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
samenvatting statistiek 2 €8,49
In winkelwagen

Samenvatting

samenvatting statistiek 2

 9 keer bekeken  0 keer verkocht

In deze samenvatting wordt het boek 'inductieve statistiek voor de gedragswetenschappen' te samen met powerpoint uit de les behandeld. Het gaat hier over het vak statistiek 2 aan de AP hogeschool.

Voorbeeld 4 van de 53  pagina's

  • Ja
  • 29 december 2023
  • 53
  • 2023/2024
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alles voor dit studieboek (3)
Alle documenten voor dit vak (11)
avatar-seller
chloegrotelli
Statistiek 2

1. Statistiek 1 in vogelvlucht
1.1 variabele operationaliseren en meten
- Met operationaliseren bedoelen we = variabelen meetbaar maken.
- Variabelen kunnen … zijn:
 Kwantitatief of kwalitatief
 Kwantitatieve: dingen die te maken hebben met cijfers
 Kwalitatief: hebben niets te maken met cijfers (haarkleur, geslacht,…) kan je wel
meten maar kan niet uitgedrukt worden in een getal
 Continu of discreet
 Continu: veel opeenvolgende waarde
 Discreet: beperkte keuzemogelijkheden (zoals geslacht en haarkleur daar zijn geen
oneindig veel keuzemogelijkheden in)
 Opgedeeld in verschillende meetniveaus (nominaal, ordinaal, interval, ratio)
 Nominaal: categoriaal ( geslacht, haarkleur,…)
 Ordinaal: rangschikken van klein naar groot
 Interval: de verschillen tussen de waarde is betekenisvol en er kunnen bewerkingen
tussen gemaakt worden (temperatuur: wij hebben celsius en fahrenheit beide
hebben een andere nulpunt maar tussen de verschillen is hetzelfde, 1 graad verschil
is in fahrenheit ook 1 graad verschil)
 Ratio: er is sprake van een vastnulpunt (er is geen negative equivalent zoals bij
gewicht)
 Onafhankelijk of afhankelijk
 Onafhankelijk: kan een invloed uitoefenen op de afhankelijke variabele
 Afhankelijke: wat je gaat meten
 Variabele zijn allerei zaken die je kan meten aan de hand van cijfers, geslacht,… die iets kunnen
zeggen over de persoon of het object
 Sommige variabele zijn makkelijker meetbaar dan andere
- Twee voorwaarden voor meten:
 Betrouwbaarheid (hoe goed meet de test wat we willen meten?)
 Validiteit (meet de test wat we willen meten?)

1.2 Steekproeven
- Definitie: het deel van de populatie dat wordt onderzocht, hierop doen we beroep wanneer de populatie te
groot is om helemaal te onderzoeken
- Belangrijk doel van de inductieve statistiek: verantwoorde uitspraken doen over de populatie aan de
hand van een steekproef.
 We willen wél uitspraken doen over de gehele populatie, dus de steekproef moet een goede
afspiegeling zijn van de populatie.

1.2.1 soorten steekproeven
A) aselecte steekproeven
1. volledig aselecte steekproef
= definitie: elk element van de populatie een gelijke kans geven om in de steekproef te worden
opgenomen
 nadeel: het is niet altijd representatief
2. gestratificeerde steekproef
= alle deelpopulaties evenredig aan bod laten komen in de steekproeftrekking.
 Voordeel: wel mogelijk om representativiteit te bereiken (als de steekproef goed wordt
samengesteld)
3. Clustersteekproef
= populatie verdelen in gelijkaardige clusters en daarna binnen elke geselecteerde cluster een aselecte
steekproef trekken.
 Voordeel: spaart kosten en tijd
 Nadeel: minder nauwkeurig, minder representatief
B) niet-aselecte steekproeven
1. sneeuwbalsteekproef
= Onderzoeker vertrekt van één respondent aan wie vervolgens gevraagd wordt andere respondenten
te contacteren
 Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
 Nadeel: kans is groot dat mensen sterk op elkaar lijken
2. Gelegenheidssteekproef
= Keuze van respondenten wordt overgelaten aan ondervrager (nl. mensen die men makkelijk kan
vinden)


1

,  Voordeel: goedkoop, snel
 Nadeel: niet geschikt voor populatieschattingen
3. Quotasteekproef
= onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in steekproef (bv. verdeling
jongens/meisjes).
- Conclusie: niet-aselecte steekproeven zijn niet altijd geschikt voor inductieve statistiek!
- Belang van goede steekproef
 een goede steekproefselectie is essentieel in onderzoek
 bewustwording van het belang van steekproefselectie
 keuze voor steekproef steeds kunnen onderbouwen of doordacht kunnen bediscussiëren

1.3 frequentieverdelingen
= de eerste verkenning van de data

- Er zijn verschillende soorten frequenties:
 Absolute frequenties
 je gaat kijken hoeveel keer een bepaalde waarde voorkomt in de steekproef
 Relatieve frequenties
 het relatieve getal in vergelijking met de waarde van de steekproef
- Verschillende visuele voorstellingen (afhankelijk van meetniveau):
 Taartdiagram (nominaal)
 Staafdiagram (nominaal of ordinaal)
 Stamdiagram/histogram/boxplot (interval)
- Percentielscores: plaats van een score in het geheel
 Kwartiel
 Deciel

1.4 Centrummaten
- Modus = waarde die het meest voorkomt (elk meetniveau).
- Mediaan = middelste waarde bij gerangschikte waarnemingen (minimum ordinaal).
- Gemiddelde = som van alle waarden gedeeld door aantal waarnemingen (minimum interval).
 ! Bij een symmetrische verdeling: modus = mediaan = gemiddelde:
 Mediaan minder gevoelig voor extreme waarden.
 Gemiddelde consistenter over verschillende steekproeven

1.5 Spreidingsmaten
= toont hoe ver scores uit elkaar liggen

 Interkwartielafstand = P75 – P25
- Variantie (s²):
 afwijking van elke uitslag ten opzichte van gemiddelde
 deze afwijking kwadrateren
 gemiddelde van deze gekwadrateerde afwijkingsscores
- Standaarddeviatie (s):
 de vierkantswortel van de variantie

- Standaardscores (Z-scores):

1.6 De normaal verdeling
- Geobserveerde gegevens die passen in theoretische verdeling
P ro ba bility




0.5
De nsity




(model) bieden meer mogelijkheden voor verwerking.
 Veelgebruikt model: normale verdeling. 0.4

 Geeft de kans op het voorkomen van een bepaalde waarde. 0.3
- Normale verdelingen verschillen enkel in gemiddelde en 0.2
standaarddeviatie. De curve is altijd klokvormig en 0.1
symmetrisch. 0
 Dankzij dit specifieke model kunnen gemakkelijk observaties -4 -3 -2 -1 0 1 2 3 4
afgeleid worden.

1.6.1 Transformaties van verdelingen
- Niet alle data zijn normaal verdeeld, en om makkelijk berekeningen te maken is Histogram


het nuttig om een verdeling te transformeren zodat ze de normale verdeling 45
40
Absolute Frequenties




35

benadert. 30
25


- Vormkenmerken van een verdeling: 20
15
10

 Centrummaat (gemiddelde, mediaan, modus) 5
0


 Spreidingsmaat (standaard-deviatie)
0 20 40 60 80
Metingen X


 Kurtosis: gepiektheid


2

,  Skewness: scheefheid




- Lineaire transformaties (bv. standaardiseren): enkel gemiddelde en standaarddeviatie veranderen.
- Normaliserende transformaties: ook kurtosis en skewness veranderen zodat de normale verdeling
benaderd wordt.

1.7 Kruistabellen
= het bestuderen van samenhangen tussen variabele

- Afhankelijk van meetniveau:
 Nominaal en nominaal: kruistabel
 Nominaal en ordinaal: kruistabel
 Interval en interval: correlatie
- Drie maten van samenhang bij kruistabellen:
 Chi-kwadraat (niet geschikt voor kleine steekproeven)
 Contingentiecoëfficiënt (variabelen met 2 niveaus)
 Cramer’s V (variabelen met meer dan 2 niveaus)

1.8 Correlaties
= hebben hetzelfde doel als kruistabellen maar gaan samenhang tussen interval- of ratiovariabelen na.

- Hoge correlatie is bv .75 (positief verband) maar ook -.85 (negatief verband).
- Covariantie: hetzelfde als de correlatie, maar is geen gestandaardiseerde maat (omdat er niet wordt
gedeeld door de standaarddeviatie in de formule)


2. Inductieve statistiek in onderzoek
- Het nut van statistiek: we hanteren statistiek als hulplmiddel bij empirisch onderzoek dat erop gericht is
algemeen geldende uitspraken te doen over wetmatigheden in de realiteit
 We willen vanuit een beperkt aantal observaties uitspraken kunnen doen over de mens in het
algemeen

2.1 De empirische cyclus
- vraagstelling
 Elk onderzoek moet beginnen met een
duidelijk geformuleerde vraagstelling, het
moet duidelijk zijn wat we bedoelen
 Dit heeft als gevolg dat we duidelijk
kunnen vaststellen wat onze variabele
zijn
- Operationaliseren
 Na de bepaling van de variabele moeten
we deze kunnen operationaliseren!
 Operationaliseren = We hebben
geschikte meetinstrumenten nodig: dit
zijn meestal vragenlijsten
- Steekproef bepalen
 Nadat we bepaald hebben hoe we alle
variabele zullenmeten kunnen we de
nodige respondenten of deelnemers verzamelen door een steekproef te trekken
 Er zijn verschillende manier van steekproef trekking
- Gegevens verzamelen
 Onze gegevens gaan we precies zo verzamelen zoals we onszelf hebben voorgeschreven in de
operationalisatiefase
 We behandelen alle deelnemers dus consequent volgens de procedure die we hebben vastgelegd
- Beschrijvende statistiek
 Nadat we alle nodige gegevens verzameld hebben zullen we een eerste blik werpen op de resultaten
door de verzamelende gegevens op verschillende manieren te beschrijven
 We kunnen centrummaten en spreidingsmaten bekijken
 Frequentietabellen maken
 Grafieken tonen om een eerst zicht te krijgen op de aard van de gegevens
- Inductieve statistiek



3

,  Die beschrijvingen geven ons nog geen informatie over verbanden tussen variabele of verschillen
tussen groepen
 We beroepen daarvoor op verdergaande analyses van de gegevens (inductieve statistiek)
 Samengevat: we kunnen zeggen dat we met behulp van inductieve statistiek nagaan of de
verschillen en verbanden uit onze data betekenisvol genoeg zijn om te veronderstellen dat
ze zich ook in de bredere populatie op dezelfde manier voordoen
- Conclusies trekken
 Op basis van de analyses die we gemaakt hebben kunnen we uiteindelijk een aantal conclusies
trekken en een duidelijk antwoord geven op de vraagstelling die we in fase 1 hebben geformuleerd

2.2 Problemen in de inductieve statistiek
- Er is duidelijk gemaakt dat inductieve statistiek een belangrijk deel uitmaakt van de empirische cyclus
 Aan de hand van de inductieve statistiek zullen we vanuit onze zorgvuldig verzamelde maar beperkte
dataset conclusies trekken over de gehele populatie
 Hoe nauwgezet en plichtsbewust hebben verzameld hebben, betreft het niet de hele populatie
 Het komt erop neer dat we bijna nooit gegevens kunnen hebben over een complete
populatie
 Gelukkig kunnen we ons behlepen door het trekken van steekproeven
 We verzamelen gegevens over een beperkt aantal onderzoekseenheden en leiden
daaruit conclusies af
- Daar stelt zich het kernprobleem van de inductieve statistiek: “welke garanties hebben we dat onze
conclusies ook geldig zijn voor de rest van de populatie?”
 onderzoek meestal in steekproeven
 steekproef geen perfecte afspiegeling van populatie
 foutieve variatie mogelijk alsook toevallige meetfouten
- We zijn dus nooit 100% zeker van conclusies, statistiek berust daarom op kansberekening
 Het is niet erg dat we geen zekerheid hebben over onze conclusies, het is wel belangrijk om te weten
hoe groot onze onzekerheid is
 inschatten hoe zeker we zijn van onze conclusies
 kansberekening nodig (bv: “We concluderen met 95% zekerheid dat vrouwen meer
levenstevredenheid ervaren dan mannen”)
- Wanneer zijn zulke uitspraken geoorloofd? -> significantie

2.3 Statistische significantie
- Stel we willen een onderzoek en willen te weten komen of het beluisteren van emo-rock leidt tot meer
depressievere gevoelens bij jongeren dan bij het luisteren naar hiphop
 Een groep luistert gedurende een uur naar emo-rock de andere naar hiphop
 Na dat uur leggen ze een depressievragenlijst af van alle deelnemers, ze krijgen een bepaalde
depressiescore op basis van die vragenlijst
 Uiteraard zullen deze scores verschillen ongeacht welke muziek ze hebben beluisterd
 Er is dus een zekere variabiliteit zijn in die scores zowel binnen de groepen als tussen de groepen
 In eerste instantie zullen we de gemiddelde depressiescores berekenen en met elkaar
vergelijken -> deze zullen niet gelijk zijn aan elkaar
 De mate gemiddelde van elkaar verschillen kan echt variëren: het kan gaan over een klein of
een groot verschil
- De centrale vraag in de toetsende fase van dit onderzoek is nu of dat gevonden verschil tussen beide
groepen al dan niet statistisch significant is
 Er zijn 2 mogelijkheden:
 Ofwel is het gevonden verschil tussen de gemiddelde depressiescore van beide
groepen eerder klein en te wijten aan de toevallige variabiliteit in onze steekproef
 Ofwel is het verschil groot genoeg om te beweren dat de verschillende muzikale
behandeling van beide groepen ervoor gezorgd heeft dat de ene groep minder
depressief is dan de andere
 In het laatste geval spreken we van een significant verschil
 Het beslissen of een verschil significant is of niet doen we aan de hand van
hypothesetoetsing
 Statistische significantie helpt ons dus om onze hypothesen te toetsen. Het helpt ons
inschatten wanneer een waargenomen verband/verschil groot genoeg/betekenisvol is.
- Als het verschil statistisch significant is , is het zeer waarschijnlijk dat het toevallige fouten zijn
- Al het niet verschil statistisch significant is, is het verschil zodanig klein

2.4 Kansberekening en hypothesetoetsing
2.4.1 kansberekening
- Kansberekening is ene hulpmiddel bij hypothesetoetsing
ervan uitgaan dat er in
- bij het beantwoorden van een vraag die we stellen bij een
werkelijkheid geen verschil is
onderzoek zullen we de zaken even omkeren:


kans berekenen dat we in dat 4

geval die observaties doen

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper chloegrotelli. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €8,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53340 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€8,49
  • (0)
In winkelwagen
Toegevoegd