een volledige samenvatting van het vak Communicatie Wetenschappelijk Onderzoek 1 aan UGent, gegeven door Gino Verleye. Dit deel bevat alle theorielessen: slides én notities.
,7. Hypothesetoetsing ........................................................................................................... 44
7.1. Geen hypothesetoetsing zonder hypothesen.......................................................... 44
7.2. Eenzijdig of tweezijdig toetsen ............................................................................. 45
7.3. Aanvaarding- en betrouwbaarheidsinterval ........................................................... 45
7.4. Fouten van de eerste en de tweede soort ............................................................... 48
9. Verwachtingen ................................................................................................................. 57
9.1. T-toetsen ................................................................................................................ 58
9.2. Non-parametrische varianten van de t-test ............................................................ 64
10. Andere parametrische toetsen ....................................................................................... 67
10.1. Één factor Anova ................................................................................................... 67
10.2. Kruskall Wallis ...................................................................................................... 68
10.3. Vergelijking ANOVA en Kruskall-Wallis ............................................................ 68
, lOMoAR cP SD
1. Herhaling basisconcepten
1.1. Meetniveaus
Meetniveau Volgorde Vaste Natuurlijk Voorbeeld
(van laag naar hoog) afstanden nulpunt
Nominaal GEEN Vb: sporten, godsdienst, geslacht,
nummering in een sportwedstrijd
Ordinaal WEL GEEN Vb: sterren van hotels: wel een
volgorde maar het verschil er tussen
kan je niet uitdrukken in cijfers
Interval WEL WEL GEEN Vb: temperatuur: het nulpunt is een
algemene afspraak, niet natuurlijk
maar er is wel een vaste afstand
tussen 1° en 2°C
Ratio WEL WEL WEL Vb:
- punten examen: alles fout = 0
- geld spaarrekening: van mensen
vergelijken maar je kan niet onder 0
a) Categorische variabelen
Nominaal niveau
o Niet meetbaar, enkel identificeerbaar.
o Aan elke categorie wordt getal toegekend ter herkenning, niet om er bewerkingen
mee uit te voeren.
o Alle waarden staan op hetzelfde niveau.
o Vb: Geslacht: Man = 1, vrouw = 2
Ordinaal niveau
o Schaal geeft rangorde weer.
o Er wordt echter enkel gemeten of iets meer of minder is, maar niet in welke mate.
o Je kan zaken niet optellen, vermenigvuldigen, delen enz. geen berekeningen
mee doen omdat er geen gelijke afstanden tussen de categorieënis
b) Metrische variabelen
Intervalniveau
o Afstand tussen categorieën is gelijk
o Het verschil tussen de waarden heeft nu wel een betekenis en heeft dus een
meeteenheid maar geen nulpunt.
o Bewerkingen zijn mogelijk.
Rationiveau
o Zelfde als interval, maar met een natuurlijk nulpunt
1.2. Univariate parameters
a) Maten van centraliteit
= deze waarden zijn informatief over het zwaartepunt van de verdeling
Modus X0
= de waarde die het meest voorkomt.
Vanaf nominaal niveau.
Mediaan
= de middelste waarde. Wordt bepaald in cumulatief percentage: eerste waarde die
groter of gelijk is aan 50% zoeken en dan de corresponderende Xi nemen.
Kan vanaf ordinaal niveau wat je moet kunnen sorteren om de middelste te kunnen
vinden.
Ongevoelig voor uitschieters, wordt dus vaak samen met rekenkundig gemiddelde
gerapporteerd.
Het rekenkundig gemiddelde
= vanaf intervalniveau.
= waarden optellen en delen door aantal waarnemingen:
Zeer gevoelig voor uitschieters => in combinatie met de mediaan is het beeld juister
(uitschieters hebben geen invloed op mediaan)
Te gebruiken vanaf intervalniveau
Spss berekent ook het gemiddelde voor variabelen op nominaal
of ordinaal niveau steeds goed opletten
Ultieme parameter van centraliteit.
b) Maten van spreiding
= essentiële doelstelling van het voorspellen in de statistiek.
= bij inferentiële statistiek betekent de spreiding ook een bepaalde onzekerheid
heeft 3 rollen:
De spreiding vertelt iets over de heterogeniteit/homogeniteit van de data
Vertelt iets over de onzekerheid: hoe groter de spreiding, hoe groter de onzekerheid
Maat van kwaliteit (standaarafwijking)
adhv 2 parameters:
Variantie(breedte) sx²
= verschil tussen de grootste en de kleinste waarneming en vertelt dus over
welk interval we data kunnen verwachten
= range
= (individueel resultaat – gemiddelde)²
aantal (n)
Standaardafwijking sx
= gemiddelde afwijking tov het gemiddelde
= procedure om discrepanties tov het gemiddelde te nemen en tot een bepaalde
macht te verheffen is klassiek: dit heet een centraal moment
= vierkantswortel uit de variantie: sx = √s²
c) Vorm
Als referentie neemt men de normale verdeling:
Symmetrisch qua frequentiedichtheid
Is geen theoretisch concept
Veel respondenten (grote n) leidt automatisch tot een normaalverdeling
Vormparameters vallen traditioneel uiteen in 2 soorten:
Informatie over de scheefheid = symmetrie = skewness
o De empirische coëfficiënt van Pearson:
▪ als de waarde 0 is, is de verdeling eerder symmetrisch.
▪ bij positieve waarden is de verdeling links asymmetrisch verdeeld.
▪ bij negatieve waarde is hij eerder rechts asymmetrisch verdeeld.
▪ quick & dirty
▪ gemiddelde > mediaan rechts asymmetrisch
o De parameter van Fisher:
▪ als deze waarde 0 is, is de verdeling symmetrisch:
▪ bij positieve waarden is de verdeling links asymmetrisch verdeeld.
▪ bij negatieve waarde is hij eerder rechts asymmetrisch verdeeld.
▪ deze parameter berekend SPSS
Informatie over de afplatting = kurtosis
o Fisher G2:
▪ Klassieke parameter
▪ Waarde = 0: afplattingsgraad zoals de normale verdeling.
▪ Negatieve waarde: verdeling is platter dan de normale
▪ Positieve waarde: scherper dan de normale verdeling
a) Covariantie Sxy
= liniaire samenhang wordt hierdoor gemeten: in hoeverre hangen de variabelen met elkaar
samen? Afhankelijk van de schaal van de variabelen.
b) Correlatie r
= hetzelfde als covariantie, maar gestandaardiseerd dus onafhankelijk van de schaal
= sterkte van de relatie/samenhang tussen 2 variabelen (0 = geen relatie)
Correlatie r is begrenst tussen – 1 en + 1. Hoe dichter bij de waarden 1 of -1, hoe meer de
punten op een rechte liggen (sterk lineair verband).
Correlatie r wordt beïnvloed door uitschieters.
Het meet de richting en de sterkte van de lineaire relatie tussen twee kwantitatieve
variabelen.
Het is het gemiddelde van de producten van de gestandaardiseerde waarden van n.
Als r positief is: positief verband tussen de variabelen.
Als r negatief is: negatieve samenhang tussen de variabelen.
Wanneer er een verband/samenhang/relatie is, kan men voor spellingen doen
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur MarketeerGent. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €3,48. Vous n'êtes lié à rien après votre achat.