OIM-B aantekeningen
Hoorcollege 1 – basisbeginselen stati sti ek, beschrijvende stati sti ek
Als je een grote steekproef hebt, is de kans bij kleine verschillen dat het niet significant is.
altijd te maken met onzekerheid in je schatting. Daarom zit deze altijd in een range ipv een specifiek
getal.
Conceptuele achtergronden
- De cijfers spreken NOOIT voor zich
- Initiële observatie (we vinden iets interessant/opmerkelijk) theorie hypothese
dataverzameling analyse (dit doe je vooral bij OIMB, beginnen dus pas bij stap 5 eigenlijk)
uitspraak (inference)
OZ-vraag: waarom is er in sommige landen/gemeenten meer verzet tegen komst asielzoekers dan in
andere?
1. Identificeren van de afhankelijke variabele meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (variantie) = als iedereen dezelfde mening heeft kun je er
niks over zeggen en heb je er niks aan
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren mate van geluk, angst
voor misdaad
4. Modellen opstellen die deze spreiding kunnen wegenemen
je kan bijna nooit de hele populatie onderzoeken, dus je werkt met een steekproef. Het werken met een
steekproef zorgt wel voor onzekerheid omdat je niet naar het geheel kijkt.
Typen gegevens/data
Kwalitatieve gegevens (categorisch)
- Nominaal meetniveau (geslacht, nationaliteit) duidelijk verschil, geen midden
- Ordinaal meetniveau (opleidingsniveau) je kunt ook in het midden vallen
Kwantitatieve gegevens (continue)
- Interval meetniveau (IQ; temperatuur) geen nul-punt
- Ratio meetniveau (inkomen; leeftijd) duidelijk nul-punt
Frequentie tabel SPSS, drie dingen:
- Welke scores zijn er mogelijk?
- Hoe vaak komen deze scores voor in absolute zin?
- Hoe vaak komen deze scores voor in relatieve zin?
,Fijnste data is zoals weergegeven in de spreiding van bovenstaand plaatje.
Centrale tendentie
- Gemiddelde
- Mediaan middelste waarneming
- Modus welk getal komt het vaakst voor
N = nominaal, O = ordinaal, I = interval, R = ratio
Interkwartiel range =
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2. Verdeelt data in 4 kwarten
3. Interkwartiel afstand = Q3 – Q1
Boxplots visuele weergave van de interkwartiel range
Standaarddeviatie =
goed opletten op n-1!!!! bij sigma (populatie) gewoon normale
N
SLIDE 42 !!!!!!!!!!!!!!!
Vorm
- Scheefheid
- Spitsheid
, Hoorcollege 2 (09/02) – bouwstenen van de verklarende stati sti ek
Verdelingen
1. Frequentieverdeling (frequency distribution) = overzicht van de mogelijke scores op variabele(n) en
hoe vaak die scores voorkomen
2. Kansverdeling (probability (density) distribution) = overzicht van mogelijke scores op variabele(n)
en de kans op deze scores. De kans dat deze voorkomen (normale verdeling)
Discrete kansverdelingen (altijd afgerond, kan geen halven)
- binomiale verdeling
*Wel of niet op kamers gaan?
*50% wel, de proportie is 50%. P=50
*Frequentie = bij een steekproef van 100 verwacht ik dat er 100 wel op kamers gaan.
- poisson verdeling
Continue kansverdelingen (scoor je onder een bepaald interval)
- uniforme verdeling
- normale verdeling
*klokvormig, symmetrisch
*gemiddelde, mediaan en modus zijn gelijk in het midden
*heeft (in theorie) een oneindige range
Z = (x – gemiddelde) / standaarddeviatie
Gemiddelde = µ
Standaarddeviatie = σ
- exponentiele verdeling
Steekproefverdeling (overzicht van alle mogelijke steekproefgemiddelden
Kenmerken:
- theoretische verdeling van alle steekproefgemiddelden bij het trekken van een oneindig aantal
steekproeven
- als de steekproef groot genoeg is (n > 30) dan zal de steekproevenverdeling van x-gemiddeld
normaal verdeeld zijn met de volgende twee eigenschappen.
- µ(x gemiddeld) = µ
- centrale limietstelling
verschillende soorten Z-scores
- standaarddeviatie = maat voor hoe ver een individuele waarneming zich bevindt van het
(steekproef)gemiddelde
- Standaardfout = maat voor hoe ver een steekproef-gemiddelde zich bevindt van het
populatiegemiddelde
basisbeginselen verklarende statistiek
Uitgangspunt verklarende statistiek:
Vanuit een steekproef (met bekende parameters) uitspraken proberen te doen over parameters in de
populatie. Omdat je gaat infereren (uitspraken doen over populatie die je niet in zijn geheel hebt
kunnen onderzoeken) is er altijd sprake van mate van onzekerheid.
Je wil desalniettemin iets kunnen zeggen over de kwaliteit van je uitspraken, hoe zuiver en hoe
efficiënt is de schatting
Intervallen
van beschrijven naar schatten
- In de praktijk zijn we zelden in staat om meer dan een steekproef te trekken
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jonnaotterman. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.