Communicatiewetenschap: Methoden van communicatie onderzoek en statistiek
B: Beschrijvende Statistiek
Inhoud
Inleiding..........................................................................................................................................1
H1: Basiselementen........................................................................................................................1
H2: Centrummaten.........................................................................................................................3
H3: spreiding...................................................................................................................................4
H4: bewerken van je data...............................................................................................................6
H5: Associatiematen op nominaal niveau.......................................................................................8
H6: Associatiematen op ordinaal niveau.......................................................................................10
H7: Tabelsplitsing..........................................................................................................................12
H8: Associatiematen op interval- en rationiveau..........................................................................12
H9: Associatiematen: tot slot........................................................................................................16
H10: Schaalconstructie.................................................................................................................17
Inleiding
Beschrijvende statistiek: je beperkt je tot uitspraken over een groep onderzoekseenheden waarvan
je de gegevens hebt.
Bij een steekproef zegt de beschrijvende statistiek iets over de steekproef en niet over de
populatie waaruit die steekproef afkomstig is.
Inferentiële statistiek: je doet met een bepaalde mate van waarschijnlijkheid uitspraken over de hele
populatie (die je niet volledig onderzocht hebt)
Op basis van steekproefgegevens maak je dan een schatting van een populatiewaarde
Gemiddelde in de populatie: μ (mu)
Gemiddelde in een steekproef: x of M (mean)
Standaarddeviatie in een populatie: σ (sigma)
Standaarddeviatie van een steekproef: S
H1: Basiselementen
Objecten/onderzoekseenheden: personen of zaken over wie je iets zegt
Variabel: kenmerk van de onderzochte artikelen
Variabelennamen: namen die boven kolommen van een datamatrix staan
Variabelenlabel: hierin maak je duidelijk wat je feitelijk bedoeld met die variabelennaam
Waarden/values: getallen die in de matrix staan
Valuelabel: hierin wordt aangegeven wat wordt bedoeld met de waarden
Frequentietabel: een variabele (kenmerk) met de daarbij behorende waarden kun je hierin op een
overzichtelijke manier presenteren
Percentages(percent) = absolute frequentie(frequency)/totaal aantal eenheden
Geldig percentage(valid percent)
Cumulatieve percentage (cumulative percent)
Absolute frequentie: het aantal keer dat een bepaalde waarde voorkomt
Missing values: ontbrekende waarden
Grafieken bij frequentieverdeling: taart-,cirkel- of staafdiagram te gebruiken
- Taart- of cirkeldiagram wordt meestal gebruikt om aan te geven wat relatief vaak voorkomt
(percentages)
- Staafdiagrammen worden meestal gebruikt om absolute aantallen weer te geven
1
,Communicatiewetenschap: Methoden van communicatie onderzoek en statistiek
B: Beschrijvende Statistiek
Allemaal alleen gebruikt wanneer een variabele niet zo heel veel waarden heeft. Anders
wordt het onoverzichtelijk
Kruistabel: je gebruikt twee variabelen tegelijk in je analyse
- Totaalpercentages: het totaal aantal onderzoekseenheden wordt op 100% gesteld en
vervolgens worden de cel percentages berekend
- Kolompercentages: de onderzoekseenheden in de kolommen worden op 100% gesteld en
vervolgens worden de percentages berekend
- Rijpercentages: de onderzoekseenheden in de rijen worden op 100% gesteld en vervolgens
worden de percentages berekend.
Operationalisatie: het meetbaar maken van je variabelen in één of meerdere vragen
- In methoden deel van je onderzoek neem je een gedeelte op waarbij je verantwoordt welke
vragen je stelt om welke variabelen te meten en welke antwoorden (waarden) je opneemt.
- Sommige variabelen (geslacht, demografische kenmerken) hoeven niet altijd helemaal
onderbouwd te worden.
Onafhankelijke variabele: de variabele die invloed uitoefent, meestal aangegeven door een x
Als de waarde van deze x verandert, heeft dat gevolgen voor de andere variabele
Leeftijd, sekse en geslacht
Afhankelijke variabele: de variabele die wordt beïnvloed, meestal aangegeven door een y
Vier meetniveau ’s:
1. Nominaal
2. Ordinaal
3. Interval
4. Ratio
Nominaal meetniveau
- Je kan niet rekenen met de waarden die je aan de variabelen hebt gegeven
- Numerieke waarde is slechts een naamgeving en heeft als getal geen betekenis
- Bijv. Geslacht, politieke partijen, beroep, religie, woonplaats, favoriete televisiezender, type
koffiedrinker en krant die je leest
- Centrummaat: modus
Ordinaal meetniveau
- Wel sprake van een rangordening (volgorde is van belang, ze staan in respectievelijke
volgorde)
- De intervallen tussen de waarden hebben geen betekenis
- Bijv. Opleiding, schaal (bij beantwoording van vragen), inkomensklasse, leeftijdsgroepen
- Centrummaten: modus en mediaan. Mediaan is meest geschikt
Interval meetniveau
- Er is sprake van rangordening + de intervallen hebben een betekenis
- Bijv. Temperatuur, geboortejaar
Het nulpunt is arbitrair, er is geen absoluut nulpunt, we hebben zelf een nulpunt afgesproken
- Centrummaten: modus, mediaan en gemiddelde. Gemiddelde is meest geschikt
Ratio meetniveau (scale)
- Er is sprake van rangordening + de intervallen hebben betekenis + er is een natuurlijk nulpunt
aanwezig
- Het quotiënt (het resultaat van deling) heeft ook betekenis
2
, Communicatiewetenschap: Methoden van communicatie onderzoek en statistiek
B: Beschrijvende Statistiek
- Bijv. Lengte, gewicht, aantal facebook vrienden
- Numeriek: variabelen op interval- en rationiveau, ze hebben een numerieke eigenschap
waarmee je kunt rekenen
- Centrummaten: modus, mediaan en gemiddelde. Gemiddelde is meest geschikt
Meestal kies je als onderzoeker een zo hoog mogelijk meetniveau, zodat je daar later meer analyses
mee kunt uitvoeren. Echter hebben sommige variabelen een vaststaand meetniveau
Nominaal Ordinaal Interval Ratio
Classificatie Classificatie Classificatie Classificatie
Rangorde Rangorde Rangorde
‘vaste’ meeteenheid ‘vaste’ meeteenheid
Absoluut nulpunt
Continue meetschaal: alle mogelijke waarden kunnen de uitkomst zijn van de meetprocedure (niet
alleen bijv. de waarden 1 en 2, maar ook 1,2 en 1,75)
Discrete meetschaal: is beperkt tot een telbaar aantal waarden, waarvoor je in regel gehele getallen
gebruikt
Een continue verschijnsel wordt vaak toch met een discrete meetschaal gemeten, maar dan hebben
tussenliggende waarden wel een betekenis.
Bijv. (Leef)tijd en afstanden (want dit kan in uren, minuten, seconden etc.)
Univariaat: 1 variabele
Bivariaat: 2 variabele (o.a. kruistabel)
Multivariaat: meer dan 2 variabele (meestal 1 afhankelijke en meerdere onafhankelijke variabele)
H2: Centrummaten
Centrummaat: een getal dat aangeeft rond welke (centrale) waarde de uitkomsten van een serie
waarnemingen liggen. Er zijn drie verschillende: modus, mediaan en gemiddelde
Modus: de waarde met de hoogste frequentie
- Komt het meeste voor
- Kan bij alle meetniveaus gebruikt worden maar geeft niet altijd zinnige informatie
- Meest geschikt voor Nominaal niveau (tevens ook de enige mogelijke centrummaat)
Mediaan: de middelste waarneming na rangordening van de data van laag naar hoog. Het is de
waarneming waar 50% van de onderzoekseenheden onder ligt en 50% boven.
- Niet te gebruiken op Nominaal niveau (want er moet een rangorde in de waarde zitten)
- Wel te gebruiken op Ordinaal , interval en ratio niveau
- Meest geschikt voor Ordinaal niveau
- Hoe uit te rekenen?: sorteer de waarnemingen op grote. Kijk wat het middelste getal is. Als er
geen middelste getal is tel je de twee middelste waarden bij elkaar op en deel je dat getal
door twee.
Gemiddelde: alle waarnemingen bij elkaar op te tellen en te delen door het totaal aantal
waarnemingen (n)
- Wordt alleen gebruikt op interval- en ratio niveau
- Symbool: x
In wetenschappelijke artikelen wordt vaak de M (Mean) gebruikt
- Sigma: de som van
- Bij frequentie tabel vermenigvuldig je voor elke groep de waarde van x met de frequentie; de
producten van alle groepen tel je bij elkaar op en deel je door het totaal aantal
onderzoekseenheden .
3