STATISTIEK – Samenvatting 2019 – 2020
INLEIDING
Statistiek is één stap in het onderzoeksproces
- Statistiek is een methodologische ondersteuning (hulpmiddel) van het wetenschappelijk onderzoek.
- Statistiek is een middel om de gegevens (DATA) van kwantitatief onderzoek weer te geven.
o Kwantitatief = gaat om het VERKLAREN van gedrag.
o Onderzoek = op basis van waarnemingen ware en algemene uitspraken doen over de werkelijkheid.
De uitspraken die humane wetenschappers doen, verschillen van de uitspraken van natuurwetenschappers
- Natuurwetenschappers doen deterministische uitspraken.
o Vb: de wet van de zwaartekracht is een wetmatigheid die ervoor zorgt dat als ik een voorwerp
loslaat, dit naar beneden valt. Dat is voor ALLE voorwerpen het geval.
- Humane wetenschappers (vb: psychologen, veiligheidsadviseurs,…) doen probabilistische uitspraken.
o Vb: We hebben vastgesteld dat frustratie agressie bevordert, maar dat is geen deterministische wet.
Het is waarschijnlijk dat als mensen gefrustreerd geraken ze agressief zullen reageren. Niets is zo
veranderlijk als de mens en zo afhankelijk van de context.
o Waarschijnlijk? Statistiek is een hulpmiddel om te bepalen hoe waarschijnlijk dit is!
HOOFDSTUK 1: Hoe bereid ik mij voor op statistiek met Excel
Fasen van de onderzoekscyclus
- Statistiek = bruikbaar in de laatste fase van jouw onderzoekscyclus:
o Laatste fase van de onderzoekscyclus = analyseren van data en rapporteren over de analyses.
o Onderzoekscyclus om hypotheses te toetsen.
o Nagaan of vooropgestelde verwachtingen (o.a. literatuurstudie) bevestigd worden of niet.
- Het doel is om inzicht te krijgen.
Hoe analyseer ik mijn data? Een gebruikswijzer…
- Voor de keuze van een statistische analyse techniek zijn de antwoorden op volgende vragen van belang:
o Gaat het in de vraagstelling om frequenties, een verschil of een samenhang. Of een combinatie?
o Wat is het meetniveau van de gegevens die je hebt verzameld?
o Gaat het om een steekproef of een populatie?
1
,- Gaat het in de vraagstelling om frequenties, een verschil of Voorbeeldvragen:
-Hoeveel Nederlanders krijgen zorgtoeslag?
een samenhang. Of een combinatie daarvan? -Hoeveel Nederlanders ontvangen huurtoeslag?
o Frequentie: vragen waarbij het gaat over hoe vaak of -Hoe eenzaam voelen Nederlanders zich?
-Is er een verschil in tevredenheid over het keven dat men
in welke mate iets voorkomt. leidt tussen: mensen met en zonder partner.
o Verschilvraag -Is er een verschil in eenzaamheid tussen mannen en
vrouwen?
o samenhangvraag -Is er tussen mannen en vrouwen een verschil in
- Een variabele = een eigenschap/kenmerk van de tevredenheid over het leven dat men leidt?
-Is er een relatie tussen de mate van tevredenheid over het
onderzoekseenheid (proefpersoon, huishouden, groep,…) leven en leeftijd?
-Bestaat er een relatie tussen geld en geluk?
o Er kunnen verschillende waardes toegekend worden
aan dit kenmerk. → Het kenmerk varieert = een VARIABELE.
- Meetniveaus
o Nominaal : alleen onderscheidend.
▪ Er is zijn twee categorieën/ waarden, dus er is wel een verschil, maar het ene is niet
meer/minder dan het andere. Een nominale variabele is vaak dichotoom.
▪ Enkel modus (= meest voorkomende waarneming) berekenen.
o Ordinaal : onderscheidend en ordening aanbrengen.
▪ Er is sprake van meer/minder, maar dit kan niet in getallen uitgedrukt worden.
▪ Enkel modus en mediaan (= middelste getal van oplopende getallenreeks) berekenen.
o Interval : onderscheidend en ordening aanbrengen.
▪ Er is een verschil tussen categorieën en het kan in getallen uitgedrukt worden. Er is geen
nulpunt (vb: IQ).
▪ Zowel modus, mediaan en gemiddelde berekenen.
o Ratio : onderscheidend en ordening aanbrengen.
▪ Er is een verschil tussen categorieën en het kan uitgedrukt worden in getallen. Er is een
absoluut nulpunt (vb: leeftijd, gewicht).
▪ Zowel modus, mediaan en gemiddelde berekenen.
- Gaat het om een populatie of een steekproef?
o Beschrijvende = deductieve statistiek: onderzoek bij een populatie en als alle eenheden waarover je
uitspraak wil doen, deelnemen aan het onderzoek. Het doel van beschrijvende statistiek is om op
een overzichtelijke en inzichtelijke manier de gegevens te presenteren.
▪ Parameters van positie/centraliteit: bepalen aan de hand van het meetniveau.
▪ Parameters van spreiding: best met interval - en ratio meetniveau:
• Variantie: gemiddelde afstand van de waarnemingen tot het gemiddelde.
• Standaardafwijking (= SD)
o Verklarende = inductieve = inferentiële statistiek: het maakt een kansberekening op basis van een
steekproef (= onderzoekseenheden die geselecteerd werden). Op basis van een beperkt aantal
gegevens wordt getracht om algemene uitspraken te formuleren over de gehele populatie.
▪ Steekproef: onzekerheid! Is het wel representatief? → voorzichtig zijn met uitspraken!
2
,Enkele algemene statistische begrippen
Hypothese
- Hypothese is (in de een empirische wetenschap) een stelling die (nog) niet bewezen is en die dient als
uitgangspunt voor een experiment of voor een gerichte waarneming.
- 0-hypothese: geen verband. Vb: er is geen verband tussen stress en immuniteit.
- Alternatieve hypothese: er is wel een verband. Vb: langdurige blootstelling aan stress leidt tot
aantasting van immuniteit.
➔ Bewijs voor de alternatieve hypothese is er wanneer we de 0-hypothese kunnen verwerpen MAAR … er
is altijd onzekerheid. Statistiek dient om de ‘mate van onzekerheid’ in kaart te brengen.
Normaalverdeling = Gausscurve
- Belang van spreiding + positie/centraliteit!!
- Het gemiddelde kun je dus NIET gebruiken om afdelingen/ziekenhuizen te vergelijken → mediaan wel.
Vrijheidsgraden
- Degrees of Freedom = DF.
- In de statistiek houdt het aantal vrijheidsgraden verband met het aantal onafhankelijke waarnemingen
waarmee een steekproefgrootheid wordt bepaald.
o Steekprofgrootheid = een functie op de uitkomsten in een steekproef. Meestal (niet altijd!) een
schatter van populatieparameters. Vb: gemiddelde, variantie, …
- Het geeft dus de mate aan waarin scores kunnen variëren.
Standaardfout
- In Excel kan je de standaardfout berekenen: de fout geeft aan in hoeverre
het gevonden steekproefgemiddelde een betrouwbare schatting is van het populatiegemiddelde.
- De standaardfout wordt bepaald door (1) de steekproefgrootte (= aantal samples) en (2) de
homogeniteit (= standaarddeviatie) van de steekproef.
- Hoe groter de steekproef, hoe nauwkeuriger we uitspraken kunnen doen.
Significant
- Significant verschil = de kans dat je het geobserveerde verschil in de steekproef ook terug zou vinden in de
populatie groot genoeg is. Het gaat dus om de aannemelijkheid dat een correlatie niet op toeval berust.
- p-waarde is een waarde die aangeeft hoe uitzonderlijk en consistent de resultaten van jouw onderzoek zijn.
In elk onderzoek heeft toeval een effect op de verkregen resultaten. Hoe kleiner de p-waarde, hoe groter de
kans dat jouw resultaten NIET te wijten zijn aan toeval.
- In dit OPO houden we de minimale grens van 5% aan, dus je mag systematisch significantie rapporteren
vanaf 0,05 (p < 0,05). D.w.z.: bekom je een p-waarde die kleiner is dan 5% of 0,05 OF STRENGER NOG een
p-waarde die kleiner is dan 1% of 0,01, dan zeggen we dat het bekomen resultaat (verschil of verband)
statistisch significant is (en dus niet het gevolg van toevallige fluctuaties in de steekproef).
3
, Excel en de statistische functies ervan Installeren
- Klik linksboven in je Excel op ‘Bestand’.
- Klik op ‘Opties’.
- Klik dan op ‘Invoegtoepassingen’
- Klik onderaan in het kader op ‘start’.
- Vink daarna de invoegtoepassingen “analysis toolpak” en “analysis toolpak VBA” aan en druk op ‘OK’.
- Excel installeert nu de benodigde statistische functies.
- In te tabblad gegevens is nu een nieuw tabblad ingevoegd: ‘Gegevensanalyse’.
HOOFDSTUK 2: Hoe breng ik mijn gegevens in de computer?
Hoe maak ik een codeerschema of codeboek?
Kwalitatieve (= discrete) variabele Kwantitatieve (= continue) variabele
Categorisch = categorie als antwoord op de vraag Numeriek = numerieke gegevens als antwoord
Ordinaal en nominaal Interval en ratio
Vb: hoogst behaalde opleiding Vb: leeftijd
Mutueel exclusief: door deel uit te maken van een
categorie, sluit je automatisch de andere
categorieën uit.
- Het moet duidelijk zijn hoe gegevens gelezen moeten worden:
o Dat geef je aan in een codeboek (= legende)
o Gegevens worden best altijd numeriek verwerkt (dus als een getal).
- Bij een nominale variabele los je dit op door een cijfer toe te kennen eraan. Vb: geslacht →man (1) en een
vrouw (2). Dit kan ook met (a) of (b) of (x) en (y) → Dit zijn codes en die leg je best vast in een codeboek,
anders zou je d betekenis ervan kunnen vergeten.
- Voorbeeld codeboek:
- System missing values: vraag is
niet van toepassing voor
respondent.
- User missing values: respondent
antwoord niet, ook al is de vraag
- Coderen van toepassing voor hem.
o ONTBREKENDE GEGEVENS: het is het makkelijkst is om de cel LEEG te laten → dus blanco en
geen 0 intypen!
o Tip: codeer zoveel mogelijk in de lees- en schrijfrichting. Vb: bij een vijpuntsschaal = absoluut
niet = code 1 en bij absoluut wel = code 5
o Het is belangrijk om de gegevens zo ruw mogelijk in te voeren! Zo worden minder fouten
gemaakt. Dus: geen klassen op voorhand opmaken (vb: bij leeftijd).
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller goedelecarton. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.26. You're not tied to anything after your purchase.