In dit document staan aantekeningen van alle kennisclips die toebehoren tot de leerstof van het theoriedeel van statistiek I. Dit is de leerstof van de Vrije Universiteit van Amsterdam.
Inhoudsopgave
Week 1 ............................................................................................................................................................. 2
Waar zijn wij mee bezig? ................................................................................................................................... 2
Variabelen in beeld ............................................................................................................................................ 3
Verdelingen – centrum en spreiding ................................................................................................................. 4
Populaties en steekproeven ............................................................................................................................... 6
Week 2 ............................................................................................................................................................. 7
Normale verdeling ............................................................................................................................................. 7
Twee variabelen in beeld ................................................................................................................................... 9
Week 3 ........................................................................................................................................................... 10
Correlatie ......................................................................................................................................................... 10
Lineaire regressie deel 1 .................................................................................................................................. 11
Lineaire regressie deel 2 .................................................................................................................................. 13
,Week 1
In het Reids Open Acces boek staat het theoriedeel van het vak.
https://digitalcommons.buffalostate.edu/oer/1/
Waar zijn wij mee bezig?
Criminologische vragen worden opgelost door middel van empirisch onderzoek. Er wordt een
vraag gesteld, waarbij een hypothese kan worden opgesteld. Daarna wordt bepaald hoe je gaat
onderzoeken en of deze hypothese klopt klopt, hierbij verzamel je gegevens en doe je analyses.
Als laatste verklaar je de resultaten en trek je de conclusie. We verzamelen, beschrijven en
analyseren data om vragen te beantwoorden.
Twee mogelijkheden om data te analyseren
• Beschrijvende (descriptieve) statistiek
o Hoeveel criminaliteit was er in 2019?
• Inductieve (beslissende, inferentiële) statistiek
o Worden ex-gevangenen minder vaak aangenomen?
Variabelen (geven informatie over elementen)
• Kenmerken, overlast
• Kwalitatief versus Kwantitatief
• Kwalitatief
o Elementen in twee of meer categorieën plaatsen
o Nominaal (geen volgorde tussen waarden)
o Ordinaal (natuurlijke ordening)
▪ Bij schalen mag je er kwantitatief mee rekenen (interval)
• Kwantitatief
o Numerieke waarden (aantallen)
o Interval (continu – heeft geen nulpunt)
o Ratio (discreet – natuurlijke nulpunt aanwezig)
Hoe ziet ‘data’ eruit?
• Elementen/subjects scoren op variabelen
• Coderen van data
• Let op:
o Missing waardes ook coderen (bijv. 999)
o SPSS – data matrix (scores in cellen)
▪ Rijen = subjects (elementen
▪ Kolommen = variabelen
2
,Variabelen in beeld
Variabelen
• Kwalitatief
o Nominaal (niet gerangschikt)
o Ordinaal (gerangschikt)
• Kwantitatief
o Interval (geen nulpunt, denk aan temperatuur)
o Ratio (nulpunt, denk aan toetscijfer)
Variabelen en Experimenten
• Twee of meer groepen met verschillende ‘behandeling’
• Meet en vergelijk uitkomsten van de groepen
• Onafhankelijke variabelen versus Afhankelijke variabelen
o Onafhankelijke variabelen: bijvoorbeeld behandeling
o Afhankelijke variabelen: bijvoorbeeld recidive
o Afhankelijke variabele is afhankelijk van onafhankelijke variabele
Grafieken: exploratieve analyse
• Belangrijke eerste stap
o Breng variabelen in beeld
o Snelle manier om bijzonderheden te zien
o Maar kies de juiste grafiek
Kwantitatieve variabelen
• Groeperen in klasse-intervallen
• Overzichtelijker maar informatie verlies
• Stamdiagram: overzichtelijk, geen informatie verlies
3
,Verdelingen – centrum en spreiding
Verdelingen
• Vorm van een verdeling
o In beeld met histogram
• Centrum en spreiding van een verdeling
o Beschrijven met et cijfers
Centrum
Centrale tendentiematen
• Modus
o Zinvol bij nominale variabelen
• Mediaan
o Zinvol bij ordinale en kwantitatieve variabelen
o Niet gevoelig voor uitbijters of scheve verdelingen – resistent
• Gemiddelde (mean)
o Statistisch sterk maar gevoelig voor uitbijters – niet resistent
Vorm en centrum:
• Positief scheef (rechtsscheef)
o Mediaan en gemiddelde liggen rechts van de modus (vallen niet samen).
• Symmetrisch (normale verdeling)
o Modus, mediaan en gemiddelde vallen samen.
• Negatief scheef (linksscheef)
o Mediaan en gemiddelde liggen links van modus (vallen niet samen).
Mediaan en kwartielen
• Mediaan
o Precies 50e percentiel
• Kwartielen – Q1 en Q3
o 25e en 75e percentielen
o Kwartielen worden gebruikt om aan te geven hoe verspreid een verdeling is.
▪ Liggen ze ver uit elkaar, is je verdeling verspreid.
▪ Liggen ze dicht op elkaar, is je verdeling niet verspreid.
Percentielen: berekenen
• ll = lower limit = exacte ondergrens van het
interval (de klasse) waar het percentiel punt invalt
• n = het totaal aantal scores
• p = proportie die correspondeert met het gewenste percentiel
• cf = cumulatieve frequentie van de scores onder het interval (de klasse) waar het
percentielpunt invalt
• fi = frequentie van de scores in het interval (aantal mensen in de klasse) waar het
percentielpunt invalt.
• w = width= de breedste van het interval (klasse)
4
, Boxplot: 5 getallen samenvatting
• Min
• Q1
• Mediaan
• Q3
• Max
• (Uitschieters)
Interkwartielafstand (IKA)
• IKA = Q3 – Q1
• Criterium voor uitschieters
o IKA x 1,5
• Reasonable Lower Boundary
o RLB = Q1 - 1.5(IKA)
• Reasonable Upper Boundary
o RUB = Q3 + 1.5(IKA)
• Als de variabele onder de RLB ligt of boven de RUB, is het een uitschieter
Het (rekenkundige) gemiddelde
• Populatiegemiddelde (parameter, warden die gehele populatie beschrijven)
• Steekproefgemiddelde (statistiek of grootheid)
• Dichotome variabelen (0 of 1) – gemiddelde gelijk aan proportie score 1
o Dichotome variabelen = nominale variabelen met twee categorieën
• Som van de afwijkingen van gemiddelde = 0
• Het gemiddelde is niet resistent (uitschieter heeft groot effect op gemiddelde)
Variantie
• Gebruik samen met gemiddelde (om verdeling te beschrijven)
• Verschillende formules mogelijk
• s2 = steekproefgrootheid / s2 (sigma) = populatieparameter
Standaarddeviatie
• Ook standaardafwijking genoemd
• Wortel van de variantie -> vergelijkbaar met variabelen waarden
• Verschillende formules mogelijk
• s = steekproefgrootheid (sigma) =
populatieparameter)
• Hoe kleiner de variantie, hoe minder
de verdeling is verspreid
• Hoe groter de variantie, hoe meer de
verdeling is verspreid
• Niet resistent – uitschieter heeft grote invloed
Welke maten?
• Kijk eerst naar vorm van de verdeling (histogram)
• Scheve verdeling/uitschieters -> vijf-getallen-samenvatting
• Redelijk normaal verdeeld, zonder uitschieters -> x̅, s2 en s
5
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rechtsgeleerdheidstudentje. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,00. Je zit daarna nergens aan vast.