In dit document staan aantekeningen van alle kennisclips die toebehoren tot de leerstof van het theoriedeel van statistiek I. Dit is de leerstof van de Vrije Universiteit van Amsterdam.
Inhoudsopgave
Week 1 ............................................................................................................................................................. 2
Waar zijn wij mee bezig? ................................................................................................................................... 2
Variabelen in beeld ............................................................................................................................................ 3
Verdelingen – centrum en spreiding ................................................................................................................. 4
Populaties en steekproeven ............................................................................................................................... 6
Week 2 ............................................................................................................................................................. 7
Normale verdeling ............................................................................................................................................. 7
Twee variabelen in beeld ................................................................................................................................... 9
Week 3 ........................................................................................................................................................... 10
Correlatie ......................................................................................................................................................... 10
Lineaire regressie deel 1 .................................................................................................................................. 11
Lineaire regressie deel 2 .................................................................................................................................. 13
,Week 1
In het Reids Open Acces boek staat het theoriedeel van het vak.
https://digitalcommons.buffalostate.edu/oer/1/
Waar zijn wij mee bezig?
Criminologische vragen worden opgelost door middel van empirisch onderzoek. Er wordt een
vraag gesteld, waarbij een hypothese kan worden opgesteld. Daarna wordt bepaald hoe je gaat
onderzoeken en of deze hypothese klopt klopt, hierbij verzamel je gegevens en doe je analyses.
Als laatste verklaar je de resultaten en trek je de conclusie. We verzamelen, beschrijven en
analyseren data om vragen te beantwoorden.
Twee mogelijkheden om data te analyseren
• Beschrijvende (descriptieve) statistiek
o Hoeveel criminaliteit was er in 2019?
• Inductieve (beslissende, inferentiële) statistiek
o Worden ex-gevangenen minder vaak aangenomen?
Variabelen (geven informatie over elementen)
• Kenmerken, overlast
• Kwalitatief versus Kwantitatief
• Kwalitatief
o Elementen in twee of meer categorieën plaatsen
o Nominaal (geen volgorde tussen waarden)
o Ordinaal (natuurlijke ordening)
▪ Bij schalen mag je er kwantitatief mee rekenen (interval)
• Kwantitatief
o Numerieke waarden (aantallen)
o Interval (continu – heeft geen nulpunt)
o Ratio (discreet – natuurlijke nulpunt aanwezig)
Hoe ziet ‘data’ eruit?
• Elementen/subjects scoren op variabelen
• Coderen van data
• Let op:
o Missing waardes ook coderen (bijv. 999)
o SPSS – data matrix (scores in cellen)
▪ Rijen = subjects (elementen
▪ Kolommen = variabelen
2
,Variabelen in beeld
Variabelen
• Kwalitatief
o Nominaal (niet gerangschikt)
o Ordinaal (gerangschikt)
• Kwantitatief
o Interval (geen nulpunt, denk aan temperatuur)
o Ratio (nulpunt, denk aan toetscijfer)
Variabelen en Experimenten
• Twee of meer groepen met verschillende ‘behandeling’
• Meet en vergelijk uitkomsten van de groepen
• Onafhankelijke variabelen versus Afhankelijke variabelen
o Onafhankelijke variabelen: bijvoorbeeld behandeling
o Afhankelijke variabelen: bijvoorbeeld recidive
o Afhankelijke variabele is afhankelijk van onafhankelijke variabele
Grafieken: exploratieve analyse
• Belangrijke eerste stap
o Breng variabelen in beeld
o Snelle manier om bijzonderheden te zien
o Maar kies de juiste grafiek
Kwantitatieve variabelen
• Groeperen in klasse-intervallen
• Overzichtelijker maar informatie verlies
• Stamdiagram: overzichtelijk, geen informatie verlies
3
,Verdelingen – centrum en spreiding
Verdelingen
• Vorm van een verdeling
o In beeld met histogram
• Centrum en spreiding van een verdeling
o Beschrijven met et cijfers
Centrum
Centrale tendentiematen
• Modus
o Zinvol bij nominale variabelen
• Mediaan
o Zinvol bij ordinale en kwantitatieve variabelen
o Niet gevoelig voor uitbijters of scheve verdelingen – resistent
• Gemiddelde (mean)
o Statistisch sterk maar gevoelig voor uitbijters – niet resistent
Vorm en centrum:
• Positief scheef (rechtsscheef)
o Mediaan en gemiddelde liggen rechts van de modus (vallen niet samen).
• Symmetrisch (normale verdeling)
o Modus, mediaan en gemiddelde vallen samen.
• Negatief scheef (linksscheef)
o Mediaan en gemiddelde liggen links van modus (vallen niet samen).
Mediaan en kwartielen
• Mediaan
o Precies 50e percentiel
• Kwartielen – Q1 en Q3
o 25e en 75e percentielen
o Kwartielen worden gebruikt om aan te geven hoe verspreid een verdeling is.
▪ Liggen ze ver uit elkaar, is je verdeling verspreid.
▪ Liggen ze dicht op elkaar, is je verdeling niet verspreid.
Percentielen: berekenen
• ll = lower limit = exacte ondergrens van het
interval (de klasse) waar het percentiel punt invalt
• n = het totaal aantal scores
• p = proportie die correspondeert met het gewenste percentiel
• cf = cumulatieve frequentie van de scores onder het interval (de klasse) waar het
percentielpunt invalt
• fi = frequentie van de scores in het interval (aantal mensen in de klasse) waar het
percentielpunt invalt.
• w = width= de breedste van het interval (klasse)
4
, Boxplot: 5 getallen samenvatting
• Min
• Q1
• Mediaan
• Q3
• Max
• (Uitschieters)
Interkwartielafstand (IKA)
• IKA = Q3 – Q1
• Criterium voor uitschieters
o IKA x 1,5
• Reasonable Lower Boundary
o RLB = Q1 - 1.5(IKA)
• Reasonable Upper Boundary
o RUB = Q3 + 1.5(IKA)
• Als de variabele onder de RLB ligt of boven de RUB, is het een uitschieter
Het (rekenkundige) gemiddelde
• Populatiegemiddelde (parameter, warden die gehele populatie beschrijven)
• Steekproefgemiddelde (statistiek of grootheid)
• Dichotome variabelen (0 of 1) – gemiddelde gelijk aan proportie score 1
o Dichotome variabelen = nominale variabelen met twee categorieën
• Som van de afwijkingen van gemiddelde = 0
• Het gemiddelde is niet resistent (uitschieter heeft groot effect op gemiddelde)
Variantie
• Gebruik samen met gemiddelde (om verdeling te beschrijven)
• Verschillende formules mogelijk
• s2 = steekproefgrootheid / s2 (sigma) = populatieparameter
Standaarddeviatie
• Ook standaardafwijking genoemd
• Wortel van de variantie -> vergelijkbaar met variabelen waarden
• Verschillende formules mogelijk
• s = steekproefgrootheid (sigma) =
populatieparameter)
• Hoe kleiner de variantie, hoe minder
de verdeling is verspreid
• Hoe groter de variantie, hoe meer de
verdeling is verspreid
• Niet resistent – uitschieter heeft grote invloed
Welke maten?
• Kijk eerst naar vorm van de verdeling (histogram)
• Scheve verdeling/uitschieters -> vijf-getallen-samenvatting
• Redelijk normaal verdeeld, zonder uitschieters -> x̅, s2 en s
5
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller rechtsgeleerdheidstudentje. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.34. You're not tied to anything after your purchase.