BESCHRIJVENDE EN INFERENTIËLE STATISTIEK
DEEL 1:
KENNISCLIP 1
STATISTISCHE CONCEPTEN
Hoe zien kwantitatieve data eruit?
Variabelen: zijn kenmerken van iets of iemand (de kenmerken van het geheel)
Cases: zijn het iets of iemand (geheel)
Om het een variabel te mogen noemen moet het variëren.
Levels of measurement;
Categoriale variabelen:
Nominale variabele, bestaat uit verschillende categorieën die van elkaar verschillen. Maar
geen volgorde hebben, het is daardoor niet mogelijk om te zeggen dat iets beter, of meer is
dan het ander.
Ordinal variabele, bestaat uit verschillende categorieën die van elkaar verschillen. Maar
heeft ook een volgorde. Maar je weet niet hoe deze onderling van elkaar verschillen
Kwantitatieve:
- Discreet, als het mogelijk is dat categorieën een set aparte nummers vormen (hele
getallen)
- Continue, als het mogelijk is dat de waarden een interval vormen (regio van waardes)
Interval, wel verschillende categorieën en rangorde, maar ook vergelijkbare intervallen
tussen de categorieën.
Ratio, het is vergelijkbaar met het interval niveau, maar het heeft ook een nulpunt met
betekenis.
De methode die we gebruiken om data te analyseren afhangt van het niveau waarop de
variabelen gemeten zijn. Maar in de praktijk is het onderscheid soms niet zo duidelijk. Je
mag als je een ordinal variabelen hebt die gemeten is op een schaal met tien categorieën of
meer dan mag je deze variabelen analyseren alsof het een kwantitatieve variabele is.
,KENNISCLIP 2
DATA BESCHRIJVEN
Tabellen
Datamatrix, is een overzicht van alle cases en variabelen.
Waarbij de cases op verticale as (rijen) staan en de
variabelen boven aan op de horizontale as (cellen). Voor
alle statistische analyses.
Als je wil laten zien aan andere dan maak je een
samenvatting van de informatie.
Frequentietabel, laat zien hoe de waarden van een
variabele verdeeld zijn. Alle mogelijke waardes, en dan
hoe vaak deze voorkomt. Relatief, percentage.
Cumulatieve percentage, is het bij elkaar optellen van de
opvolgende waardes. Is niet handig bij kwantitatieve
data, dan wordt er een ordinale categorieën gemaakt,
tussen bepaalde waardes.
Het is gemakkelijk om van kwantitatieve variabelen,
ordinale variabele te maken maar andersom is niet
mogelijk
KENNISCLIP 3
DATA BESCHRIJVEN
Grafieken
Nominaal:
Cirkeldiagram, het voordeel is dat je gemakkelijk kan aflezen welke percentage.
Staafdiagram, het voordeel is dat je gemakkelijke de waardes af kan lezen, de exacte
nummers.
Je kan beter een staafdiagram gebruiken naarmate het aantal categorieën in een variabele
toeneemt.
Kwalitatieve:
Puntplot, is makkelijk als je weinig metingen hebt.
Histogram, is gemakkelijk als je meer metingen hebt het is vergelijkbaar met een
staafdiagram want het gebruikt ook staven om de frequentie of relatieve frequentie van de
mogelijke waarden van een variabelen te laten zien. Maar er een belangrijk verschil, bij een
histogram raken de staven elkaar. Dit staat voor de waarden van een interval ratio variabele
, een onderliggende continue schaal representeren. De intervallen moeten even groot zijn, de
hoeveelheid maakt niet uit.
KENNISCLIP 4
MATEN VAN CENTRALITEIT
Modus, mediaan en gemiddelde
Modus, is de waarde die het vaakst voorkomt. Wordt vaak gebruikt als maat van centrale
tendens wanneer een variabele op een nominaal of ordinaal niveau gemeten wordt.
Mediaan, om de mediaan te vinden moeten we eerst alle waarden van laag naar hoog
ordenen. Dan moet je de middelste kiezen, dus anders de twee waardes delen door 2.
Gemiddelde, is de soms van alle waarden gedeeld door het aantal observaties.
Formule;
Het gemiddelde van variabele x, gesymboliseerd als x-
streepje, gelijk staat aan de som van alle waarden van x
gedeeld door de steekproefgrootte, die gesymboliseerd
is door n.