Samenvatting Basis Kwantitatief onderzoek - Boek
SPSS - http://www.onderzoekenspss.nl/spss-handleiding/spss-data-bewerken.html
Hoofdstuk 1 Wat is statistiek
Statistiek beschrijft een geheel van instrumenten en technieken die worden gebruikt voor het
beschrijven, ordenen en interpreteren van informatie of gegevens
Descriptieve statistiek
Beschrijvende statistieken worden gebruikt om de kenmerken van een verzameling gegevens. De
verzameling wordt soms een gegevensreeks (data set) of gewoon gegevens (data) genoemd.
Inferentiële statistiek
Inferentie statistieken zijn vaak (maar niet altijd) de volgende stap nadat je gegevens hebt verzameld
en samengevat. Inferentie statistieken worden gebruikt om conclusies te trekken op basis van een
kleinere groep (sample) gegevens over een mogelijk grotere groep.
Hoofdstuk 2 Sigma Freud and Desriptive statistics
Uitkomsten in de vorm van gemiddelden – Voorbeelden in het BOEK
Gemiddelden, ook wel maten van centrale tendens (measures of central tendency) genoemd, zijn er in
drie smaken: het gemiddelde (mean), de mediaan (median) en de modus (mode). Elk geeft een ander
soort informatie over een verdeling van scores en is eenvoudig te berekenen en te interpreteren.
Mean (M)
Is het gewoon het gemiddelde van iets, dus alles optellen en delen door het aantal.
- De letter X met een streep erboven (ook wel "X-balk" genoemd) is
de gemiddelde waarde van de groep scores of het gemiddelde;
- De ∑, of de Griekse letter sigma, is het sommatieteken, dat
aangeeft dat alles wat er na komt bij elkaar opgeteld moet worden;
- De X is elke individuele score in de groep scores; en
- De n is de grootte van de steekproef waaruit u het gemiddelde
berekent. In de formule stelt een kleine n de steekproefgrootte voor
waarvoor het gemiddelde wordt berekend. Een grote N (← zoals
deze) staat voor de populatiegrootte. In sommige boeken en
tijdschriftartikelen wordt geen onderscheid gemaakt tussen beide.
- Ten slotte is het gemiddelde zeer gevoelig voor extreme scores, OUTLIERS. Een extreme
score kan het gemiddelde in de ene of de andere richting trekken en het minder representatief
maken voor de verzameling scores en minder bruikbaar als maat voor de centrale tendens. Dit
hangt natuurlijk allemaal af van de waarden waarvoor het gemiddelde wordt berekend.
Gewogen gemiddelde
Er kunnen zich situaties voordoen waarin meer dan één waarde voorkomt en je een gewogen
gemiddelde wilt berekenen. Een gewogen gemiddelde kan gemakkelijk worden berekend door de
waarde te vermenigvuldigen met de frequentie van voorkomen, het totaal van alle producten op te
tellen en dan te delen door het totale aantal gevallen.
Volg de volgende stappen om een gewogen gemiddelde te berekenen:
1. Maak een lijst van alle waarden in de steekproef waarvoor het gemiddelde wordt berekend, zoals
die in de kolom met het label Waarde (de waarde van X) in de volgende tabel.
2. Noem de frequentie waarmee elke waarde voorkomt.
3. Vermenigvuldig de waarde met de frequentie, zoals aangegeven in de derde kolom.
4. Tel alle waarden in de kolom Waarde × Frequentie bij elkaar op.
5. 5. Deel door de totale frequentie.
,Median (Med of Mdn)
De mediaan wordt gedefinieerd als het midden van een reeks scores. Het is het punt waar de helft, of
50%, van de scores boven en de helft, of 50%, onder ligt.
Volg deze stappen om de mediaan te berekenen:
1. Zet de waarden in volgorde, van hoog naar laag of van laag naar hoog.
2. Zoek de middelste score. Dat is de mediaan.
Bij een even aantal waarden is de mediaan gewoon het gemiddelde van de twee middelste waarden.
Bij een oneven is het namelijk makkelijk, als er vijf waardes zijn is de derde de mediaan, want twee
aan de ene kant en twee aan de andere kant.
Wat als de twee middelste waarden hetzelfde zijn? Dan is de mediaan gelijk aan beide middelste
waarden.
Mediaan kan je beter gebruiken dan een gemiddelende in sommige gevallen omdat een mediaan niet
gevoelig is voor extreme score’s
BELANGRIJK
- Waar het gemiddelde het middelpunt is van een reeks waarden, is de mediaan het middelpunt
van een reeks gevallen.
- Omdat de mediaan geeft om hoeveel gevallen er zijn, en niet om de waarden van die gevallen,
tellen extreme scores (outliers) niet mee, simpelweg, die worden niet echt meegenomen.
*Percentile points
Als je iets weet over medianen, moet je ook iets weten over percentielpunten. Percentielpunten
worden gebruikt om het percentage van gevallen gelijk aan en onder een bepaald punt in een
verdeling of reeks scores te definiëren. Als een score bijvoorbeeld "op het 75e percentiel" ligt,
betekent dit dat de score op of boven 75% van de andere scores in de verdeling ligt. De mediaan is
ook bekend als het 50e percentiel, omdat dit het punt is waaronder 50% van de gevallen in de
verdeling valt. Andere percentielen zijn ook nuttig, zoals het 25e percentiel, vaak Q1 genoemd, en het
75e percentiel, Q3 genoemd percentiel, aangeduid als Q3. Dus wat is Q2? De mediaan, natuurlijk.
Mode
De modus is de waarde die het meest voorkomt. Hier is geen formule voor.
Volg deze stappen om de modus te berekenen:
1. Maak een lijst van alle waarden in een verdeling, maar vermeld elke waarde slechts eenmaal.
2. Tel het aantal keren dat elke waarde voorkomt.
3. De waarde die het vaakst voorkomt is de modus.
Maar mode is dus niet het gatal/de waarde maar het geval. Dus in het voorbeeld waren 140
Independants (naast Republikeinen en Democraten) dus was 140 het meest maar de mode is dan
Indepentents en niet 140.
Als elke waarde in een verdeling
even vaak voorkomt, is er niet
echt sprake van één modus. Maar
als meer dan één waarde even
vaak voorkomt, dan is de
verdeling multimodaal. De reeks
scores kan bimodaal zijn (met
twee modi) Zoals in het
voorbeeld, 45.
, Soorten van meten – Measurements Soort hangt af van de soort data die je meet.
Nomial level of measurement (minst precies)
Het nominale meetniveau wordt gedefinieerd door de kenmerken van een uitkomst die in één en
dezelfde klasse of categorie passen. Geslacht kan bijvoorbeeld een nominale variabele zijn (vrouw en
man), evenals etniciteit (blank of Afro-Amerikaans) en politieke voorkeur (Republikein, Democraat
of Onafhankelijk). Variabelen op nominaal niveau zijn "namen" (nominaal in het Latijn), en het
nominale niveau kan het minst precieze meetniveau zijn. Nominale meetniveaus hebben categorieën
die elkaar uitsluiten; politieke gezindheid kan bijvoorbeeld niet zowel Republikein als Democraat
zijn.
Ordinal level of measurement
De ord in ordinaal meetniveau staat voor volgorde, en het kenmerk van de dingen die hier gemeten
worden is dat ze geordend zijn. Het perfecte voorbeeld is een rangorde van kandidaten voor een baan.
Als we weten dat Russ op nummer 1 staat, Sheldon op nummer 2, en Hannah op nummer 3, dan is dit
een ordinale rangschikking. We hebben geen idee hoeveel hoger Russ op deze schaal staat ten
opzichte van Sheldon dan Sheldon ten opzichte van Hannah. We weten alleen dat het "beter" is om #1
te zijn dan #2 dan #3, maar niet met hoeveel.
Interval leven of measurement
Wanneer we het hebben over het intervalniveau van meten, is een test of een beoordelingsinstrument
gebaseerd op een onderliggend continuüm zodat we kunnen praten over hoeveel meer een hogere
prestatie is dan een mindere. Als je bijvoorbeeld 10 woorden goed krijgt bij een woordenschattoets, is
dat twee keer zoveel als wanneer je 5 woorden goed krijgt. Een onderscheidend kenmerk van schalen
op intervalniveau is dat de intervallen of ruimtes of punten langs de schaal gelijk zijn aan elkaar.
Ratio leven of measurement (meest precies)
Een beoordelingsinstrument op ratio niveau wordt gekenmerkt door de aanwezigheid van een
absoluut nulpunt op de schaal. Die nul betekent de afwezigheid van de eigenschap die wordt gemeten.
CONCLUSIE H 2
1. Gebruik de modus wanneer de gegevens categorisch van aard zijn en de waarden slechts in
één klasse passen, zoals haarkleur, politieke voorkeur, woonplaats en godsdienst. Wanneer dit
het geval is, worden deze categorieën wederzijds exclusief genoemd.
2. Gebruik de mediaan wanneer je extreme scores hebt en je het gemiddelde (berekend als het
gemiddelde) niet wilt vertekenen, zoals wanneer de variabele van belang inkomen is,
uitgedrukt in dollars.
3. Gebruik ten slotte het gemiddelde wanneer je gegevens hebt die geen extreme scores bevatten
en niet categorisch zijn, zoals de numerieke score op een test of het aantal seconden dat het
duurt om 50 meter te zwemmen.