een volledige samenvatting van het vak Communicatie Wetenschappelijk Onderzoek 1 aan UGent, gegeven door Gino Verleye. Dit deel bevat alle theorielessen: slides én notities.
,7. Hypothesetoetsing ........................................................................................................... 44
7.1. Geen hypothesetoetsing zonder hypothesen.......................................................... 44
7.2. Eenzijdig of tweezijdig toetsen ............................................................................. 45
7.3. Aanvaarding- en betrouwbaarheidsinterval ........................................................... 45
7.4. Fouten van de eerste en de tweede soort ............................................................... 48
9. Verwachtingen ................................................................................................................. 57
9.1. T-toetsen ................................................................................................................ 58
9.2. Non-parametrische varianten van de t-test ............................................................ 64
10. Andere parametrische toetsen ....................................................................................... 67
10.1. Één factor Anova ................................................................................................... 67
10.2. Kruskall Wallis ...................................................................................................... 68
10.3. Vergelijking ANOVA en Kruskall-Wallis ............................................................ 68
, lOMoAR cP SD
1. Herhaling basisconcepten
1.1. Meetniveaus
Meetniveau Volgorde Vaste Natuurlijk Voorbeeld
(van laag naar hoog) afstanden nulpunt
Nominaal GEEN Vb: sporten, godsdienst, geslacht,
nummering in een sportwedstrijd
Ordinaal WEL GEEN Vb: sterren van hotels: wel een
volgorde maar het verschil er tussen
kan je niet uitdrukken in cijfers
Interval WEL WEL GEEN Vb: temperatuur: het nulpunt is een
algemene afspraak, niet natuurlijk
maar er is wel een vaste afstand
tussen 1° en 2°C
Ratio WEL WEL WEL Vb:
- punten examen: alles fout = 0
- geld spaarrekening: van mensen
vergelijken maar je kan niet onder 0
a) Categorische variabelen
Nominaal niveau
o Niet meetbaar, enkel identificeerbaar.
o Aan elke categorie wordt getal toegekend ter herkenning, niet om er bewerkingen
mee uit te voeren.
o Alle waarden staan op hetzelfde niveau.
o Vb: Geslacht: Man = 1, vrouw = 2
Ordinaal niveau
o Schaal geeft rangorde weer.
o Er wordt echter enkel gemeten of iets meer of minder is, maar niet in welke mate.
o Je kan zaken niet optellen, vermenigvuldigen, delen enz. geen berekeningen
mee doen omdat er geen gelijke afstanden tussen de categorieënis
b) Metrische variabelen
Intervalniveau
o Afstand tussen categorieën is gelijk
o Het verschil tussen de waarden heeft nu wel een betekenis en heeft dus een
meeteenheid maar geen nulpunt.
o Bewerkingen zijn mogelijk.
Rationiveau
o Zelfde als interval, maar met een natuurlijk nulpunt
1.2. Univariate parameters
a) Maten van centraliteit
= deze waarden zijn informatief over het zwaartepunt van de verdeling
Modus X0
= de waarde die het meest voorkomt.
Vanaf nominaal niveau.
Mediaan
= de middelste waarde. Wordt bepaald in cumulatief percentage: eerste waarde die
groter of gelijk is aan 50% zoeken en dan de corresponderende Xi nemen.
Kan vanaf ordinaal niveau wat je moet kunnen sorteren om de middelste te kunnen
vinden.
Ongevoelig voor uitschieters, wordt dus vaak samen met rekenkundig gemiddelde
gerapporteerd.
Het rekenkundig gemiddelde
= vanaf intervalniveau.
= waarden optellen en delen door aantal waarnemingen:
Zeer gevoelig voor uitschieters => in combinatie met de mediaan is het beeld juister
(uitschieters hebben geen invloed op mediaan)
Te gebruiken vanaf intervalniveau
Spss berekent ook het gemiddelde voor variabelen op nominaal
of ordinaal niveau steeds goed opletten
Ultieme parameter van centraliteit.
b) Maten van spreiding
= essentiële doelstelling van het voorspellen in de statistiek.
= bij inferentiële statistiek betekent de spreiding ook een bepaalde onzekerheid
heeft 3 rollen:
De spreiding vertelt iets over de heterogeniteit/homogeniteit van de data
Vertelt iets over de onzekerheid: hoe groter de spreiding, hoe groter de onzekerheid
Maat van kwaliteit (standaarafwijking)
adhv 2 parameters:
Variantie(breedte) sx²
= verschil tussen de grootste en de kleinste waarneming en vertelt dus over
welk interval we data kunnen verwachten
= range
= (individueel resultaat – gemiddelde)²
aantal (n)
Standaardafwijking sx
= gemiddelde afwijking tov het gemiddelde
= procedure om discrepanties tov het gemiddelde te nemen en tot een bepaalde
macht te verheffen is klassiek: dit heet een centraal moment
= vierkantswortel uit de variantie: sx = √s²
c) Vorm
Als referentie neemt men de normale verdeling:
Symmetrisch qua frequentiedichtheid
Is geen theoretisch concept
Veel respondenten (grote n) leidt automatisch tot een normaalverdeling
Vormparameters vallen traditioneel uiteen in 2 soorten:
Informatie over de scheefheid = symmetrie = skewness
o De empirische coëfficiënt van Pearson:
▪ als de waarde 0 is, is de verdeling eerder symmetrisch.
▪ bij positieve waarden is de verdeling links asymmetrisch verdeeld.
▪ bij negatieve waarde is hij eerder rechts asymmetrisch verdeeld.
▪ quick & dirty
▪ gemiddelde > mediaan rechts asymmetrisch
o De parameter van Fisher:
▪ als deze waarde 0 is, is de verdeling symmetrisch:
▪ bij positieve waarden is de verdeling links asymmetrisch verdeeld.
▪ bij negatieve waarde is hij eerder rechts asymmetrisch verdeeld.
▪ deze parameter berekend SPSS
Informatie over de afplatting = kurtosis
o Fisher G2:
▪ Klassieke parameter
▪ Waarde = 0: afplattingsgraad zoals de normale verdeling.
▪ Negatieve waarde: verdeling is platter dan de normale
▪ Positieve waarde: scherper dan de normale verdeling
a) Covariantie Sxy
= liniaire samenhang wordt hierdoor gemeten: in hoeverre hangen de variabelen met elkaar
samen? Afhankelijk van de schaal van de variabelen.
b) Correlatie r
= hetzelfde als covariantie, maar gestandaardiseerd dus onafhankelijk van de schaal
= sterkte van de relatie/samenhang tussen 2 variabelen (0 = geen relatie)
Correlatie r is begrenst tussen – 1 en + 1. Hoe dichter bij de waarden 1 of -1, hoe meer de
punten op een rechte liggen (sterk lineair verband).
Correlatie r wordt beïnvloed door uitschieters.
Het meet de richting en de sterkte van de lineaire relatie tussen twee kwantitatieve
variabelen.
Het is het gemiddelde van de producten van de gestandaardiseerde waarden van n.
Als r positief is: positief verband tussen de variabelen.
Als r negatief is: negatieve samenhang tussen de variabelen.
Wanneer er een verband/samenhang/relatie is, kan men voor spellingen doen
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller MarketeerGent. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.73. You're not tied to anything after your purchase.