Samenvatting filmpjes blok 1.4
Rekenvolgorde: BODMAS (haakjes, machten, vermenigvuldigen/delen, optellen/aftrekken)
Altijd rekenen van links naar rechts, reken door met ‘ans’, laat je rekenmachine zo veel mogelijk
rekenen, gebruik evenveel decimalen als gegeven in de vraag.
i staat voor individu, voor de i kunnen alle waarden voor individuen
worden ingevuld.
De X- Bar betekent het ‘gemiddelde’
In statistiek betekent π een verhouding
Σ betekent dat we alles willen opsommen wat er achter de sigma komt:
Als we over verhoudingen spreken is het altijd een waarde tussen 0 en 1
Een verhouding is makkelijk om mee te berekenen, je neemt het aantal
observaties en deelt het door het totaal.
Een percentage bereken je door een verhouding te vermenigvuldigen met 100 (dus schaal van 0 tot
100)
Onderzoeksvragen in sociaal onderzoek gaan over populaties. Van deze populatie wordt een
steekproef genomen, die representatief is voor de populatie. Small data worden gebruikt om
conclusies te trekken over de big data. Echter is de steekproef nooit geheel representatief. Er kan het
best een random steekproef worden geselecteerd -> iedereen heeft evenveel kans om tot de
steekproef te behoren. Veel steekproeven zijn dit niet -> convenience/ gemakssteekproef: sommige
respondenten kunnen makkelijker bereikt worden.
Je moet jezelf afvragen of het verschil maakt hoe je je steekproef selecteert en of het effect heeft op
je resultaten.
Beschrijvende statistieken: statistieken die we produceren, die data uit een steekproef samenvatten
-> geen onzekerheid, want het zijn allemaal feiten
Inferentiële statistieken: een conclusie over de populatie trekken op basis van de steekproef ->
onzekerheden. Altijd sprake van een sampling error -> verschil tussen steekproefstatistieken en
populatiegemiddelden. Deze onzekerheid moet je laten blijken.
Causaliteit: A -> B (statistieke resultaten bevestigen niet per definitie causaliteit) -> goed onderzoek
moet causaliteit bewijzen
De meeste statistieke resultaten bewijzen alleen correlatie, geen causaliteit (kan bijna alleen bij
wetenschappelijke experimenten en dit is niet altijd mogelijk). Echter kan het bewijzen van een
correlatie helpen bij testen van hypotheses en het bevestigen van onderliggende causaliteit. Je moet
oppassen voor ‘onechte relaties’.
Cases: zijn data-eenheden (individuen, bedrijven etc.)
Variabelen: eigenschappen die tussen de cases verschillen (geslacht, leeftijd etc.)
Welke waarden kunnen je variabelen hebben, dit hangt af van het meetniveau: bijv. uren kan
gemeten worden in uren, geslacht kan niet op die manier gemeten worden.
Categoriale variabelen zijn maatstaven waarbij verschillende gevallen tot een of meerdere
categorieën kunnen behoren -> ze zijn discreet, ze kunnen niet overlappen (bijv. geslacht)
Een continue variabele kan elke waarde aannemen (leeftijd)
Er zijn vier verschillende meetniveaus: nemen toe in informatie
Categoriaal: nominaal (elke categorie verschilt van de ander, je kunt ze niet ranken), ordinaal
(je kunt ze ordenen).
Continu: interval (zelfde afstand tussen categorieën, geen nulpunt), ratio (echt nulpunt, je
kunt de waarden vermenigvuldigen en delen).
1
, Verschillende maatstaven voor centrale tendentie/gemiddelden:
Mean (gemiddelde): alle waarden optellen en delen door
het aantal gevallen. Wordt aangegeven met een M of x-bar
als het een gemiddelde is voor een steekproef. Als we
praten over een populatie wordt µ (mu)gebruikt.
Gewogen gemiddelde: alle gemiddelden optellen en deze
vermenigvuldigen met de frequentie en delen door het
aantal gevallen.
Mediaan: middelste waarde van een reeks gevallen
Modus: meest voorkomende waarde
Variabiliteit
Standaarddeviatie (meest belangrijke maatstaf voor variabiliteit): beschrijft hoe je data verspreid is.
Hoe groter de standaarddeviatie hoe groter de verschillen. Standaarddeviatie is de gemiddelde
afstand van iedere observatie tot het gemiddelde. Om niet op 0 uit te komen, moeten we dingen
kwadrateren.
Als we een populatie hebben, delen we door N.
Als we een steekproef hebben, delen we door n-1: dit staat voor de onzekerheid
door de steekproef.
Variantie is de gekwadrateerde standaarddeviatie: het houdt meer rekening met grotere afwijkingen
van het gemiddelde. Alleen betekent het kwadrateren dat het niet meer in dezelfde eenheden staat
als de variabele.
Standaarddeviatie: zal altijd in originele eenheden worden berekend, het is makkelijker te begrijpen.
Bereik: afstand tussen Xmax en Xmin -> wordt vooral gebruik voor het controleren van fouten in de
data.
Normale verdeling: klokcurve: we moeten de hoogte en de breedte van de verdeling weten.
Mean (centrale tendentie): bepaalt waar de piek ligt
Standaarddeviatie (spreiding): bepaalt de breedte
De normale verdeling is symmetrisch.
Het gemiddelde, mediaan en modus zijn allemaal gelijk
De staarten zijn asymptotisch
De gebieden onder verschillende delen van de curve zijn altijd gelijk - > de empirische regel. Het
grootste gebied ligt tussen 1 standaarddeviatie boven en onder het gemiddelde. Bijna alle scores
liggen tussen 2 standaarddeviatie boven en onder het gemiddelde. Scores boven of onder
standaarddeviatie van 3 is zeldzaam. Als we uit kunnen gaan dat een variabele normaal verdeeld is,
kunnen we de empirische regel gebruiken om deze variabele te beschrijven.
Proportie en waarschijnlijkheid vallen beiden tussen 0 en 1. Proportie is deel delen door geheel.
Percentage is proportie x 100%. Waarschijnlijkheid bereken je ook als deel delen door geheel.
Waarschijnlijkheid dat een student man is -> p(male) = aantal mannen / aantal studenten -> p(male)
= = 0.45
Voor deze drie dingen, gebruiken we verschillende notaties/termen.
De normale verdeling beschrijft alle mogelijke uitkomsten en de waarschijnlijkheid dat die
uitkomsten voorkomen = empirische regel.
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lieskezijlstra2002. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.