Tentamenstof week B1
Samenvatting H13 wat is onderzoek
13.1.1 Variabelen
Een variabele is een kenmerk van een object. Een variabele bestaat uit een verzameling
categorieën, dat zijn alle waarden die de variabele kan aannemen.
Onafhankelijk of afhankelijk?
Onafhankelijke variabelen heten ook wel oorzaakvariabelen omdat ze een situatie
manipuleren: de onafhankelijke variabele zelf ligt vast, maar deze veroorzaakt een
verandering. Afhankelijke variabelen zijn variabelen die veranderen onder invloed van de
onafhankelijke variabelen. Ook wel effect variabele of gevolgvariabele genoemd.
13.1.2 Software bij kwantitatieve analyse
-
13.1.3 Stapsgewijze voorbereiding van de analyse
Bij kwantitatieve analyse bestaat voorbereiding uit het invoeren van ruwe gegevens in een
databestand. Er zijn 3 manieren waarop ruwe onderzoeksgegevens beschikbaar zijn: nieuwe
gegevens die je zelf invoert, nieuwe gegevens die via een online tool worden ingevoerd en
bestaande gegevens uit eerder onderzoek.
Datamatrix is een rechthoekig blad, zoals een werkblad in Excel, met rijen en kolommen
waarin je alle verzamelde waarden per eenheid noteert tijdens of na afloop van de
dataverzameling.
Cases: de eenheden waarvan je de gegevens hebt verzameld, samengebracht in een
document.
13.2 Meetniveaus van variabelen
1. Nominaal: discrete variabelen die bestaan uit losse categorieën waar niet mee
gerekend kan worden (kwalitatief). → automerk.
2. Ordinaal: variabelen met een rangorde waar niet mee gerekend kan worden
(kwalitatief). → mavo/havo/vwo, het sterrensysteem bij een hotel.
3. Interval: categorieën met gelijke, numerieke waarden (kwantitatief), maar geen
natuurlijk nulpunt en intervallen staan in statistische zin niet in gelijke verhouding
met elkaar. → de tijd als tijdsaanduiding, niet als tijdsduur, de temperatuur in graden
Celsius.
4. Ratio: numerieke variabelen waarmee gerekend kan worden, met een natuurlijk
nulpunt en gelijke, betekenisvolle verhoudingen. → alle percentages, inkomen,
leeftijd, gewicht, aantal vragen goed op een toets.
Dummyvariabele: speciale dichotome variabele die slechts 2 waarden aanneemt, 0 en 1.
Dichotome variabele: kenmerkt met slecht 2 antwoordmogelijkheden.
13.3 De volgende stap in de voorbereiding: hypothesen formuleren
13.3.1 Doel van hypothesevorming
Een hypothese is een toetsbare veronderstelling over de uitkomsten van je analyses in je
populatie. Hypothesen maak je als je een uitspraak wilt doen over een situatie of een
eigenschap in je populatie.
,13.3.2 Hypothesen formuleren
Hypothesen worden opgesteld in 2 delen:
1. Een nulhypothese: de basisveronderstelling, ook wel H0 genoemd, die gehandhaafd
blijft zolang er onvoldoende bewijs is voor het alternatief.
2. Een alternatieve hypothese: de alternatieve veronderstelling, ofwel H1. Dit zijn
meestal de aannames die wel een verband, een verschil of een effect
veronderstellen.
Eenzijdige hypothese: er is een richting in de verwachting.
Tweezijdige hypothese: er is geen richting in de verwachting.
Significantie: de kans dat het gevonden resultaat in de steekproef op toeval berust, is
verwaarloosbaar klein.
Samenvatting H14 wat is onderzoek
14.1 Beschrijvende analyse systematisch aanpakken
-
14.1.1 Keuzes voor verdieping in de analyse
Kwantitatieve analyse: cijfermatige verwerking van verzamelde gegevens om zo een
antwoord op de onderzoeksvragen te kunnen geven.
Univariate analyse: statistische analyse van 1 variabele (frequentieverdelingen, grafieken en
kengetallen).
Bivariate analyse: statistische analyse van 2 variabelen.
Multivariate analyse: statistische analyse van meer dan 2 variabelen.
Een kengetal geeft een samenvatting van een kenmerk door middel van 1 bepaalde
eigenschap.
14.1.2 Stappenplan beschrijvende analyse
-
14.2 Percentages en frequentietabellen
Frequentietabel: tabel waarin wordt aangegeven hoe vaak scores voorkomen (i.r.t. het
totaal).
Absolute frequentie: het aantal waarnemingen per categorie.
Relatieve frequentie: het aantal waarnemingen t.o.v. het totale waarnemingen.
Percenteren: het uitdrukken van relatieve frequenties in percentages.
Valide percentage: geldig percentage, alleen van diegenen van wie de score genoteerd is.
14.3 Grafieken van één variabele
,14.4 Kengetallen
Met een kengetal vat je eigenschappen van variabelen samen in 1 maat. Er zijn 2 soorten
kengetallen: eigenschappen van het middel en eigenschappen van de verdeling in een
variabele.
14.1 Centrummaten
Modus: meest voorkomende getal (vanaf nominaal niveau).
Biomodaal: als een variabele 2 modi (pieken) heeft.
Mediaan: middelste getal van een verdeling.
Rekenkundig gemiddelde: de som van alle scores, gedeeld door het totale aantal
waarnemingen.
Gewogen gemiddelde: de som van alle scores maal hun gewicht, gedeeld door het totale
aantal waarnemingen.
14.4.2 Spreidingsmaten
Spreidingsmaat: kengetal dat de spreiding van een variabele beschrijft.
Variatiebreedte: maximum- minus minimumscore.
Variantie: gemiddelde gekwadrateerde afwijking van het gemiddelde.
Standaardafwijking/standaarddeviatie: afgeleide van de variantie (wortel), ofwel de
spreiding van een variabele.
, Normale verdeling: symmetrische verdeling waarbij 68% binnen 1x de standaarddeviatie
vanaf het gemiddelde valt, 95% binnen 2x de standaarddeviatie en 99% binnen 3x de
standaarddeviatie vanaf het gemiddelde.
1-sigma-, 2-sigma- en 3-sigma-interval: standaardintervallen volgends de empirische regel.
Gauss-kromme: klokvorm die optreedt bij de grafiek van een verdeling, als deze normaal is.
14.5 Kruistabellen
Kruistabel: frequentietabel van 2 variabelen tegelijk.
Rijpercentage: percentage van het rijtotaal.
Kolompercentage: percentage van het kolomaantal.
Celpercentage: percentage van het gehele totaal.
Onafhankelijke variabelen worden zoveel mogelijk in kolommen geplaatst.
Afhankelijke variabelen worden zoveel mogelijk in rijen geplaatst.
14.6 Grafieken van 2 variabelen
• Staafdiagram
• Spreidingsdiagram
• Lijngrafiek
Samenvatting H2.5 statistiek in stappen
2.5 Spreidingsmaten
Een spreidingsmaat geeft antwoord op de vraag hoe de waarnemingen liggen ten opzichte van
elkaar, met andere woorden hoe de scores in de variabele zijn verdeeld.
2.5.1 Variatiebreedte en interkwartielafstand
Variatiebreedte
De eenvoudigste manier om de spreiding van een kenmerk weer te geven is met behulp van de
variatiebreedte. Dat betreft de hele bandbreedte van waarnemingen, van het minimum tot aan het
maximum. Variatiebreedte is het verschil tussen minimum en maximumscore in een set.
Interkwartielafstand
De interkwartielafstand is een maat waarbij je naar de middelste 50% van je waarneming
kijkt. Deze maat kan worden gebruikt voor variabelen vanaf ordinaal meetniveau. De
interkwartielafstand is het verschil tussen het 75e en het 25e percentiel in een verdeling,
ofwel de middelste 50% van alle waarnemingen.
2.5.2 variantie van een populatie
Variantie is de maat die aangeeft hoe waarnemingen verspreid liggen t.o.v. het gemiddelde.
Ofwel de gemiddelde gekwadrateerde afwijking van het gemiddelde. Bij een grote variantie
liggen de waarnemingen meer verspreid dan bij een kleine variantie. Lees blz. 65 en 66.
2.5.3 Variantie van een steekproef
Wat zijn vrijheidsgraden en wanneer gebruik je ze?
Vrijheidsgraden gebruik je als restrictie omdat je in een steekproef een schatting gebruik van
een maat in de populatie. Het aantal vrijheidsgraden geeft het aantal eenheden in een
verzameling die je vrij kunt schatten, afhankelijk van de statistische grootheid. Als je
vervolgens deze statistische maat berekent, een bepaalde statistische grootheid, kun je voor
deze onzekerheid corrigeren door niet de gehele steekproefomvang in je formule op te