Samenvatting Grasple
Hoofdstuk 1
1.1 Basisbegrippen
Variabelen
Alles wat in een onderzoek gemeten, uitgevraagd of bijgehouden wordt zijn variabelen. Een variabele
is een eigenschap die verschillende waarden heeft voor verschillende individuen, zoals leeftijd of
geslacht. Informatie = data
Een dataset bevat informatie over alle participanten en alle variabelen.
Een dataset ziet er als volgt uit: op elke rij staat een participant, dus het aantal rijen staat gelijk aan
het aantal participanten in het onderzoek. Elke kolom staat voor een variabele.
Frequenties
Hoe vaak bepaalde waardes voorkomen noemen we de Frequentie.
Een tabel waarin je per waarde aangeeft hoe vaak deze voorkomt, noem je een frequentietabel.
Je kunt frequenties uitdrukken in getallen (absolute frequentie), als percentage (relatieve
frequentie), ten opzichte van alleen geldige antwoorden (geldige frequentie) en opgeteld bij
voorgaande groepen (cumulatieve frequentie).
Observatie = waarde
Kruistabellen
Een kruistabel is een frequentietabel voor de combinaties van twee variabelen. Je zet dan de
frequentie van elke combinatie neer waar de rij en kolom elkaar kruisen.
Je kunt kruistabel maken als er niet te veel groepen zijn. Daarom kun je dit vooral maken op
nominaal/ordinaal niveau.
Meetniveaus
Dit komt omdat er verschillende meetniveaus zijn. Het meetniveau van je variabele bepaalt welke
statistische tools je wel en niet kunt gebruiken. Om daar de juiste keuze in te maken, moet je het
meetniveau van je variabelen weten. Er zijn 3 verschillende meetniveaus.
Je kunt alle variabelen verdelen in twee soorten:
Categorische variabelen (gemeten in groepen/categorieën)
Meetniveaus:
1. Nominaal: een kwalitatieve classificatie zonder ordening.
2. Ordinaal: een kwalitatieve classificatie met een logische ordening.
Continue variabelen (gemeten op een schaal)
= Metrisch/ratio/scale: worden gemeten op een numerieke schaal en zijn kwantitatieve
variabelen.
Centrummaten
Het centrum van je data is het punt waar het grootste deel van je data geconcentreerd is. Manieren
om dat punt te bepalen worden Centrummaten genoemd.
Er zijn 3 Centrummaten:
1. De Mediaan
2. De Modus
3. Het Gemiddelde
,Mediaan
Een van de centrummaten: de Mediaan: de middelste waarde
De Mediaan is handig omdat deze minder wordt beïnvloed door uitschieters (zoals de oma van 105
jaar).
Je vindt de Mediaan in vier stappen:
1. Zet alle waardes op volgorde van klein naar groot.
2. Tel hoeveel waardes er totaal zijn.
3. Deel het totaal aantal waardes door twee en rond af naar boven.
4. Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden.
Bij een oneven aantal waarden is dat de waarde in het midden.
Bij een even aantal waarden is de middelste waarde het gemiddelde van de middelste twee waarden.
Modus
Een van de centrummaten: de Modus: welke waarde komt het meeste voor.
De Modus vinden:
1. Tel hoe vaak elke waarde voorkomt.
2. De waarde die het meeste voorkomt is de Modus.
3. Komen er twee waardes even vaak voor? Dan zijn er twee 'modi'.
Het gemiddelde
Een van de centrummaten: het Gemiddelde.
Bij Metrische data rekenen we vaak het gemiddelde uit. Alle waardes zijn vaak net anders, dus komt
er geen één waarde het meeste voor.
Het gemiddelde vinden:
1: Tel alle waardes bij elkaar op
2: Deel door het aantal waardes
Die stappen kunnen we ook een stuk korter opschrijven. Voor elke stap is er een symbool:
Een waarde wordt aangegeven met X
Als je de som (alle waarden bij elkaar optellen) van iets neemt, gebruik je de Griekse
hoofdletter Sigma Σ
Het aantal waardes is n
De gemiddelde waarde geef je aan door een streepje boven de waarde te zetten: ‾X
Soms wordt het gemiddelde ook weergegeven met de Griekse letter: μ
Nu kunnen we de stappen veel korter opschrijven:
Gemiddelde = Optellen ( alle waardes )
Aantal waardes
En als we dan ook nog de symbolen gebruiken:
‾X = Σ (X)
n
, 1.2 Spreidingsmaten
Spreiding
Het is belangrijk om ook naar spreiding te kijken en niet alleen naar de centrummaat.
Spreiding is een term voor hoe veel data van elkaar verschillen en afwijken van de centrummaat.
De spreiding is groter als de data meer verspreid is, bijvoorbeeld als er een groot verschil is in de
hoeveelheid mensen die elk uur reizen, en weinig waardes hetzelfde zijn. Dit kun je zien door o.a. een
dotplot.
Maten van spreiding
Soms is het moeilijk om spreiding met het blote oog te zien, vooral als de verschillen klein zijn.
Daarom is het beter om spreiding in te schatten met een getal. We gebruiken hiervoor de
zogenoemde maten van spreiding.
We kennen o.a. de volgende maten van spreiding:
Bereik
Gemiddelde absolute afwijking
Variantie
Standaarddeviatie
Bereik
Bereik is de afstand van de grootste tot de kleinste waarde.
Oftewel:
Bereik = Maximum – Minimum
Spreidingsdiagram
Je maakt een spreidingsdiagram als je wilt zien of er een relatie is tussen twee variabelen op
interval/ratio niveau.
Je maakt een spreidingsdiagram als volgt:
1. Maak een grafiek met twee assen.
2. Pak een combinatie van twee variabelen.
3. Zoek op de horizontale x-as de waarde van de ene variabele, en op de verticale y-as de waarde van
de andere variabele.
4. Waar ze elkaar kruisen, zet je een stip neer.
5. Herhaal dit voor alle andere waardes en je hebt een spreidingsdiagram.
Het handige van een spreidingsdiagram is dat je heel snel kunt zien of er een relatie/verband is
tussen de twee variabelen.
Als de stippen samen schuin omhoog lijken te gaan noemen we dat een positief verband.
Als de stippen schuin naar beneden lijken te gaan noemen we een negatief verband.
Als de stippen horizontaal lopen is er geen verband/relatie tussen de variabelen.
Gemiddelde afwijking
De afwijking kijkt naar het verschil tussen de individuele waarden en het gemiddelde.
De gemiddelde afwijking is het gemiddelde van alle afwijkingen.
Deze kan je zien als een gebalanceerde wip, waarbij er evenveel gewicht op de negatieve afwijkingen
staat als op de positieve afwijkingen.
Een goede maat van spreiding wordt hoger als er meer spreiding is.
De gemiddelde afwijking is altijd 0.
De gemiddelde afwijking op deze manier berekend is daarom nog geen goede maat van spreiding.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller quintydp. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.32. You're not tied to anything after your purchase.