Resume

Statistiek 2 samenvatting

24 vues 2 fois vendu

Cours
Statistiek 2

Établissement
Artesis Plantijn Hogeschool Antwerpen (Artesis)

Beknopte amenvatting adhv boek Inductieve statistiek voor de gedragswetenschappen, powerpoints en lessen van lector Peter Laureys

[Montrer plus]

Aperçu 8 sur 53 pages

Voir l'exemple

Publié le 18 juin 2021
Nombre de pages 53
Écrit en 2020/2021
Type Resume

ketykatalin Membre depuis 4 année 49 documents vendus

€6,49

Ajouté

Ajouter au panier Ajouter au liste de veux

Garantie de satisfaction à 100%
Disponible immédiatement après paiement
En ligne et en PDF
Tu n'es attaché à rien

N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout

Statistiek 2
Waarom statistiek?
Stel: Het nuttigen van een sportdrank zorgt voor 4% meer tevredenheid in bed dan
het nuttigen van een pepdrank.
Welk drankje kies je bij de volgende gelegenheid?
Er is een interactie-effect: bij dames leidt de sportdrank tot 30% meer tevredenheid,
terwijl bij heren net de pepdrank zorgt voor meer tevredenheid. Omdat het effect bij
dames groter is, is er een overall effect van sportdrank.
Statistische kennis vermijdt té snelle en té simpele conclusies!

Statistiek 1
Variabelen operationaliseren en meten
• operationaliseren = variabelen meetbaar maken
• variabelen: (bv leeftijd, man/vrouw,..)
o continu of discreet
o meetniveau: nominaal (geen rangorde), ordinaal (schaal), interval (geen
0 punt bv: intelligentie), ratio (absolute 0 punt er is geen negatieve bv:
cm,kg)
o onafhankelijk / afhankelijk
• 2 voorwaarden voor meten:
o validiteit (meet de test wat we willen meten?)
 Interne validiteit:
 Externe validiteit:
 Generaliseerbaarheid over situaties: hoe hard komt het over met
de realiteit
o betrouwbaarheid (hoe goed meet de test wat we willen meten?)

Steekproeven = het deel van de populatie dat wordt onderzocht, wanneer de
populatie te groot is om helemaal te onderzoeken

-> doel van de inductieve statistiek: verantwoorde uitspraken doen over de populatie
aan de hand van een steekproef

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
We willen wél uitspraken doen over de gehele populatie, dus de steekproef moet een
goede afspiegeling zijn van de populatie.

Onderzoek doen bij depressieve patiënten uit het UZA om uitspraken te doen over
depressieven in het algemeen. Goede steekproef? Hangt af wat men wil meten, niet
altijd representatief

Soorten steekproeven
Aselecte steekproeven – elk element uit populatie heeft zelfde kans om voor te
komen
1. Aselecte steekproef: uit een zak namen trekken
Uit de lijst van alle Vlaamse leerlingen SO randomgewijs 2000 leerlingen selecteren
om het gemiddelde IQ van Vlaamse leerlingen SO na te gaan. – Was het een goed
samengestelde groep? Zat er hoogbegaafd en laagbegaafd ertussen?

Nadeel: niet altijd representatief!

2. Gestratificeerde steekproef: uit deelpopulaties bv: aso,bso

Eerst percentages nagaan van ASO, TSO en BSO leerlingen, en daarna uit elke
deelpopulatie een aselecte steekproef trekken zodat de
percentages in de steekproef dezelfde zijn als in de
populatie.

Voordeel: wel mogelijk om representativiteit te bereiken
(als de steekproef goed wordt samengesteld)

Kijkcijfers: panel van 1500 gezinnen, samengesteld zodat ze de totale Belgische
bevolking representeren

3. Clustersteekproef: subgroepen maken en hieruit kiezen

= populatie verdelen in gelijkaardige clusters en daarna aselecte steekproef trekken
uit deze clusters. Vervolgens binnen elke geselecteerde cluster een aselecte
steekproef trekken.

De populatie leerlingen verdelen in clusters volgens provincie. Aselect 3 provincies
trekken. Elke provincie verdelen in clusters volgens school en 4 scholen aselect

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
trekken. Ten slotte binnen elke geselecteerde school een aselecte steekproef van 40
leerlingen trekken.

Voordeel: spaart kosten en tijd
Nadeel: minder nauwkeurig, minder representatief

Niet-aselecte steekproeven – niet toevallig samengestelde steekproef: niet altijd
geschikt voor inductieve statistiek!
1. Sneeuwbalsteekproef: op zoek naar zware druggebruikers en via deze mensen
nog meer mensen benaderen om mee te doen

Onderzoeker vertrekt van één respondent aan wie vervolgens gevraagd wordt andere
respondenten te contacteren

Voordeel: mensen die moeilijk bereikbaar zijn worden makkelijker bereikt
Nadeel: kans is groot dat mensen sterk op elkaar lijken

2. Gelegenheidssteekproef: bv op de meir

Keuze van respondenten wordt overgelaten aan ondervrager (nl. mensen die men
makkelijk kan vinden) Vb. 1e jaars psychologie, op straat

Voordeel: goedkoop, snel
Nadeel: niet geschikt voor populatieschattingen

3. Quotasteekproef: uit elke groep een aantal mensen uitkiezen

Onderzoeker bepaalt kenmerken van de populatie die men ook wil zien in steekproef
(bv. verdeling jongens/meisjes).
Onderzoeker zorgt ervoor dat hij aan dat aantal komt (= quotum). Hoe hij aan dat
aantal komt is niet belangrijk (bv. via gelegenheidssteekproef).

Frequentieverdelingen
= eerste verkenning van de data
verschillende frequenties:
• absolute frequenties
• relatieve frequenties

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
• absolute cumulatieve frequenties
• cumulatieve percentages
verschillende visuele vormen:
• taartdiagram (nominaal)
• staafdiagram (nominaal, ordinaal)
• histogram (interval)
percentielscores: plaats van een score in het geheel

Centrummaten
• modus – waarde die het meest voorkomt
• mediaan – middelste waarde bij gerangschikte waarnemingen
• gemiddelde – som van waarden gedeeld door aantal waarnemingen

• bij symmetrische verdeling: modus = mediaan = gemiddelde

• mediaan minder gevoelig voor extreme waarden
• gemiddelde consistenter over verschillende steekproeven

Spreidingsmaten
• hoe ver liggen de scores uit elkaar?
• variatiebreedte (verschil tss grootste min kleinste)
• interkwartielafstand (P75 – P25)
• variantie
• standaarddeviatie
• standaardscores (Z-scores):
P r o b a b ility D e n s ity

De normale verdeling 0.5

• geobserveerde gegevens die passen in 0.4

theoretische verdeling (model) bieden meer 0.3

mogelijkheden voor verwerking 0.2

• veelgebruikt model 0.1

• geeft de kans op het voorkomen van een 0
-4 -3 -2 -1 0 1 2 3 4
bepaalde waarde
• normale verdelingen verschillen enkel in gemiddelde en standaarddeviatie. De
curve is altijd klokvormig en symmetrisch.

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
• dankzij dit specifieke model kunnen gemakkelijk observaties afgeleid worden:
kleinst of grootste score

Transformaties van verdelingen
Vormkenmerken van een verdeling:
• centrummaat (gemiddelde, mediaan, modus)
• linksscheef, rechtsscheef
• spreidingsmaat (standaarddeviatie)
• kurtosis: gepiektheid
• skewness: scheefheid
• Lineaire transformaties (bv. standaardiseren):
enkel gemiddelde en standaarddeviatie veranderen
• Normaliserende transformaties: ook kurtosis en skewness veranderen zodat
de normale verdeling benaderd wordt

Kruistabellen
• Wat als we de samenhang tussen variabelen willen bestuderen?
• Afhankelijk van meetniveau:
o nominaal en nominaal: kruistabel
o nominaal en ordinaal: kruistabel
o interval en interval: correlatie
• 3 maten van samenhang bij kruistabellen:
o Chi-kwadraat (niet geschikt voor kleine steekproeven)
o Contingentiecoëfficiënt (variabelen met 2 niveaus)
o Cramér’s V (variabelen met meer dan 2 niveaus)

Correlatie
• zelfde doel als kruistabellen: samenhang van variabelen nagaan
• verschil: variabelen op interval- of rationiveau
• hoge correlatie is bv .75 maar ook -.85
• covariantie: zelfde als correlatie, maar niet gestandaardiseerd (niet delen door
stdev in formule)

Lineaire regressie
• hoe de correlatie gebruiken om voorspelling te maken? -> regressie:
X = gekende variabele

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
Y = voorspelling

HOOFDSTUK 1

Statistiek 2
Nut van toetsende statistiek?
• Kunnen mannen beter kaartlezen dan vrouwen?
• Score op test kaartlezen (40 deelnemers):

• Conclusie?
>> statistiek biedt regels om te beslissen
Dus zekerheid en houvast!?
• niet helemaal: statistiek berust op kansberekening
 onderzoek meestal in steekproeven
 steekproef geen perfecte afspiegeling van populatie
 foutieve variatie mogelijk
 inschatten hoe zeker we zijn van onze conclusies
 kansberekening nodig
• nooit 100% zeker van conclusie
 bv: “We concluderen met 95% zekerheid dat vrouwen meer
levenstevredenheid ervaren dan mannen”

• wanneer zijn zulke uitspraken geoorloofd?
>> significantie

Wat is significantie?
• op basis van steekproeven geen zekerheden
• wanneer dan verschillen/verbanden?
>> als we besluiten dat iets “statistisch significant” is

• bv. verschil tussen scores kaartlezen 51/60 en 39/60 is significant, tussen 42/60 en
47/60 is niet significant.

• bv. verband tussen lengte en gewicht is significant, verband tussen lengte en
hoeveelheid hersenen is niet significant.

,N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout
Hypothesetoetsing
Nodig om tot die significantie te komen: hypothesetoetsing
• stel: onderzoek naar effect van muziek op depressie
• deelnemers luisteren 1u naar emo-rock of hip-hop
• emo-rock luisteraars zijn meer depressief dan hip-hop luisteraars
• maar kan dat toevallig zijn? Is het niet waarschijnlijk om zo’n verschil te
observeren ook al is er geen invloed van muziek?

dus:
• we veronderstellen even dat muziek geen invloed heeft
• we berekenen hoe waarschijnlijk het is om onze scores te observeren
• als dit heel waarschijnlijk is, besluiten we dat er geen verschil is
• als dit heel onwaarschijnlijk is, besluiten we dat er wel een verschil is

Statistische significantie nagaan dmv kansberekening:
Is het geobserveerde verschil groot genoeg om significant te zijn? Bv:

•

, N = omvang van de populatie/steekproefgrootte V/D = verschil
n = omvang van de steekproef s = afwijkingsscore r = correlatie σ=stand.af.
Significant = veelbetekenend p = kansen op 1000 k = aantal categorieen
T = verwachtte waarde SE= standaartfout

Hoe moeten we die kans berekenen?
 op basis van kansverdelingen (bv: standaardnormale verdeling)
 met behulp van verschillende toetsen
Wat is dan een “grote” en een “kleine” kans?
 Kleine: 5% of 0.05 meest courant
 Grote: 25%

Toetsingssituaties zijn heel uiteenlopend:
o verschil in depressie bij verschillende muziek?
o verschil in depressie vóór en na beluisteren van muziek?
o verschil in depressie bij verschillende muziek en 2 methoden gedragstherapie?
o 500 deelnemers of slechts 20?
o …
bijgevolg ook uiteenlopende toetsen

Misbruik van statistiek
Onduidelijke steekproef
“95% van de Belgen is tevreden over Activia” – hoe komt dat? Wie zijn die 95%?

Gebrek aan context
“Duracell-batterijen gaan tot 5 maal langer mee” – langer dan wat?

Interne validiteit
Laat het onderzoeksopzet toe om causale conclusies te trekken?

Ongeoorloofde causale conclusie
>> interne validiteit : Mate waarin we met een onderzoeksontwerp causale
conclusies kunnen trekken over effect van OnafVar op AfVar
Ontstaat als 3 voorwaarden aanwezig zijn:
1. Effect van OV op AV in voorspelde richting
2. Oorzaak moet in tijd voorafgaan aan gevolg

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur ketykatalin. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €6,49. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

79223 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!

Populaire universiteiten

Populaire hogescholen

Populaire studieboeken voor Communicatie en Taal

Populaire studieboeken voor Economie en Bedrijf

Populaire studieboeken voor Exact en Informatica

Populaire studieboeken voor Gedrag en Maatschappij

Populaire studieboeken voor Gezondheid en Geneeskunde

Populaire studieboeken voor Recht en Bestuur

Resume

Statistiek 2 samenvatting

Infos sur le Document

Sujets

École, étude et sujet

Vendeur

Avis reçus

Aperçu du contenu