In deze samenvatting zijn alle colleges van Beschrijvende statistiek van Communicatiewetenschap aan de Radboud Universiteit op een duidelijke en overzichtelijke manier samengevat.
Beschrijvende statistiek
Introductie
Wat is statistiek?
Door middel van statistiek worden numerieke gegevens geclassificeerd, samengevat,
georganiseerd, geanalyseerd en geïnterpreteerd.
Statistiek is een hulpmiddel om een onderzoeksvraag te beantwoorden.
Door middel van statistiek wordt er wetenschappelijk bewezen aantonen op basis
van empirische gegevens met een empirisch waargenomen resultaat.
Er zijn twee verschillende soorten statistiek.
Beschrijvende statistiek doet alleen een uitspraak over een steekproef (n).
Toetsende statistiek doet een uitspraak over de populatie (N).
In deze cursus hebben we het over beschrijvende statistiek.
In de empirische cyclus is wordt er gebruik gemaakt van statistiek bij de analyse van
gegevens.
Verzamelen statistische gegevens
Er zijn verschillende manieren om statistische gegevens te verzamelen.
Grootschalig veldonderzoek/survey.
Experiment.
Observatie.
Secundaire databronnen.
Onderzoekseenheden, variabelen en waarden
De onderzoekseenheden zijn de eenheden waarover je een uitspraak wil doen.
Bijvoorbeeld individuen, huishoudens, dorpen, etc.
De variabelen zijn de eigenschappen van de onderzoekseenheden.
Bijvoorbeeld sekse, leeftijd bij individuen.
Bijvoorbeeld bruto inkomen, samenstelling bij huishoudens.
Bijvoorbeeld aantal inwoners, relatieve groenoppervlakte bij dorpen.
De waarden zijn de scores die de onderzoekseenheid kan halen op de variabelen.
Bijvoorbeeld man/vrouw bij sekse, 0-100 bij leeftijd.
Bijvoorbeeld 0 tot en ment miljoen bij bruto inkomen, traditioneel
gezin/eenouder gezin/ samengesteld gezin/single/stel zonder kinderen bij
huishoudens.
Bijvoorbeeld 0 tot en met ….. bij aantal inwoners, 0%-100% bij groenoppervlakte.
Al deze gegevens worden samen in een datamatrix verwerkt.
De onderzoekseenheden staan bij de rijen.
De variabelen staan boven de kolommen.
De waarden staan in de cellen.
In de statistiek wordt er gewerkt met numerieke variabelen (getallen).
Er kan niet gewerkt worden met alfanumerieke variabelen (woorden) string
variabelen/ tekstvelden.
Deze moeten worden omgezet in numerieke variabelen, wil je er een statistische
analyse op uitvoeren.
Meetniveaus van variabele
Eigenschappen van de waarden op de variabele bepalen het meetniveau.
Er zijn 4 verschillende meetniveaus.
Nominaal categorieën zonder een rangorde, worden alleen onderscheiden
door de naamgeving (kwalitatieve/categorische variabele).
1
, Bachelor jaar 1 - 2018
Dichotome variabele 2 categorieën, statistisch gezien is dit een aparte
groep (kan in principe worden gezien als variabele van ratio meetniveau).
Ordinaal categorieën met een rangorde, maar de afstand tussen de
verschillende categorieën is niet gelijk (kwalitatieve/categorische variabele).
Interval categorieën met een rangorde en de afstand tussen de verschillende
categorieën is gelijk, maar er is geen absoluut nulpunt, dus verhoudingen kunnen
anders zijn (kwantitatieve/continue variabele).
Ratio categorieën met een rangorde en de afstand tussen de verschillende
categorieën is gelijk en er bestaat een absoluut nulpunt, dus de verhoudingen zijn
altijd gelijk (kwantitatieve/continue variabele).
Meetniveaus zijn door twee redenen interessant.
Bij elk meetniveau hoort een karakteristieke bewerking.
Afhankelijk van het meetniveau kies je voor een bepaalde analysemethode.
De operationalisatie bepaalt het meetniveau.
Geldige waarden en ontbrekende waarden
De waarden zijn scores die de onderzoekseenheid kan halen op de variabelen.
Er zijn ontbrekende waarden als de informatie in een spreadsheet niet volledig is, dit
kan door verschillende redenen komen.
Respondent heeft een vraag onbewust niet beantwoord.
Respondent heeft een vraag bewust niet beantwoord.
Respondent weet het antwoord op de vraag niet en er is geen optie ‘weet
niet’.
Respondent wilt geen antwoord geven op de vraag en er is geen optie ‘wil
ik niet zeggen’.
Niet mogelijk informatie te verzamelen door andere redenen.
Ontbrekende waarden worden in een spreadsheet vaak aangeduid met een specifieke
waarde bijvoorbeeld 99 of 999.
Voor statistische analyse is het belangrijk om dit onderscheid te maken om te
voorkomen dat deze waarde (bijvoorbeeld 999) als geldige waarde wordt meegenomen.
Statistische analyse
Aan de hand van de relatie tussen variabelen kies je een soort analyse.
Univariate analyse beschrijven van één enkele variabele (geen relaties).
Bivariate analyse beschrijven van een samenhang/relatie tussen twee
variabelen.
Multivariate analyse beschrijven van een samenhang/relatie tussen meer dan
twee variabelen.
Trivariate analyse bij drie variabele, bij meer is het een multivariate
analyse.
Hierna moet je nog kiezen tussen grafisch of numeriek weergeven.
Conclusies kunnen beter worden getrokken op basis van numerieke analyses dan op
grafische analyses.
Grafische analyses kunnen wel goed worden gebruikt ter illustratie.
Stappen
Er zijn dus verschillende stappen die je moet doorlopen.
1. Kiezen tussen beschrijvende of toetsende statistiek.
2. Kiezen voor een univariate, een bivariate of een mulitvariate analyse.
3. Kiezen tussen grafisch of numeriek weergeven.
4. Het meetniveau van de variabele is bepalend voor welke breedteanalyse je moet
kiezen.
2
, Bachelor jaar 1 - 2018
Welke soort grafische of numerieke analyse.
Univariate analyse: één variabele beschrijven
Kwalitatieve variabele Kwantitatieve variabele
Grafisch Staafdiagram (bar chart). Histogram.
Stacked bar. Stamdiagram.
Taartdiagram (pie chart). Boxplot.
Boxplot (ordinale
variabele).
Numeriek Frequentietabel Frequentietabel
Centrum- en Centrum- en
spreidingsmaten. spreidingsmaten.
Univariate statistiek (grafisch)
Grafisch een kwalitatieve variabele beschrijven
Een kwalitatieve variabele kun je op verschillende manieren grafische benaderen.
Een staafdiagram (barchart).
De frequentie uitgedrukt in de hoogte van een staaf.
Er wordt een absolute frequente uitgedrukt (f).
Er ontstaat een inzicht in de onderlinge verhoudingen.
Een taartdiagram (piechart).
De frequentie wordt uitgedrukt in de oppervlakte.
Er wordt een relatieve frequentie uitgedrukt (p).
Er ontstaat een inzicht
in delen ten opzichte
van het geheel.
Vaak alleen gebruikt bij
nominale variabelen,
met weinig categorieën,
waarvan een paar
relatief veel
respondenten bevatten
(overzichtelijk).
Bij kleine percentages ‘pie in pie’.
Een boxplot (stacked bar).
Sunburst grafiek vergelijkbaar met een taartdiagram.
Grafisch een kwantitatieve variabele beschrijven
Een kwantitatieve variabele kun je op verschillende manieren grafisch benaderen.
Een histogram.
3
, Bachelor jaar 1 - 2018
De staven liggen dicht tegen elkaar aan, omdat het geen ‘echte’
categorieën zijn.
De ruimte tussen de staven is weggelaten, want de categorieën zijn van
gelijke afstanden, dus anders wordt er waarde gehecht aan de ruimtes
tussen de staven.
Stamdiagram.
Een weergaven van interval- en ratiovariabele.
Wordt alleen gebruikt bij een kleine steekproef, anders erg veel werk en
onoverzichtelijk.
Univariate statistiek (numeriek)
Meetniveau variabele
De eigenschappen van de waarden op de variabele bepalen het meetniveau.
Er bestaan 4 meetniveaus.
Kwalitatieve variabele. (categorische variabelen).
Nominaal Categorieën.
Ordinaal Categorieën en rangorde van categorieën is mogelijk.
Kwantitatieve variabelen (continue variabelen).
Interval Categorieën en rangorde van de categorieën is mogelijk en de
afstand tussen de categorieën is gelijk.
Ratio categorieën en rangorde van de categorieën is mogelijk en de
afstand tussen de categorieën is gelijk en er is een absoluut nulpunt (dus
verhoudingen zijn betekenisvol).
Statistische analyse
Welke statistische analyse wordt gebruikt, hangt af van de relatie tussen de variabelen.
Er zijn 3 verschillende statistische analyses.
Univariate analyse beschrijven van één enkele variabele (geen relatie).
Bivariate analyse beschrijven van een samenhang/relatie tussen twee
variabelen.
Multivariate analyse beschrijven van een samenhang/relatie tussen meer dan
twee variabelen.
Univariate analyse
Kwalitatieve variabele Kwantitatieve variabele
Grafisch Staafdiagram (bar chart). Histogram.
Taartdiagram (pie chart). Boxplot.
Boxplot.
Numeriek Frequentietabel. Frequentietabel.
Centrum- en Centrum- en
spreidingsmaten. spreidingsmaten.
Numerieke beschrijving van variabele: frequentietabel
Variabelen kun je numeriek omschrijven door middel van frequentietabel.
Een frequentietabel is een opsomming van alle categorieën met hun frequenties.
Er wordt dan heel veel informatie gegeven, daarom is het minder overzichtelijk
bij veel categorieën en wordt het dus vooral gebruikt bij weinig categorieën.
Bij een frequentietabel moet er altijd opgelet worden met de missing variabele.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller aniquealbers1. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.71. You're not tied to anything after your purchase.