OIM-B aantekeningen
Hoorcollege 1 – basisbeginselen stati sti ek, beschrijvende stati sti ek
Als je een grote steekproef hebt, is de kans bij kleine verschillen dat het niet significant is.
altijd te maken met onzekerheid in je schatting. Daarom zit deze altijd in een range ipv een specifiek
getal.
Conceptuele achtergronden
- De cijfers spreken NOOIT voor zich
- Initiële observatie (we vinden iets interessant/opmerkelijk) theorie hypothese
dataverzameling analyse (dit doe je vooral bij OIMB, beginnen dus pas bij stap 5 eigenlijk)
uitspraak (inference)
OZ-vraag: waarom is er in sommige landen/gemeenten meer verzet tegen komst asielzoekers dan in
andere?
1. Identificeren van de afhankelijke variabele meningen over migratie (attitude-meting)
2. Bepalen van de mate van spreiding (variantie) = als iedereen dezelfde mening heeft kun je er
niks over zeggen en heb je er niks aan
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren mate van geluk, angst
voor misdaad
4. Modellen opstellen die deze spreiding kunnen wegenemen
je kan bijna nooit de hele populatie onderzoeken, dus je werkt met een steekproef. Het werken met een
steekproef zorgt wel voor onzekerheid omdat je niet naar het geheel kijkt.
Typen gegevens/data
Kwalitatieve gegevens (categorisch)
- Nominaal meetniveau (geslacht, nationaliteit) duidelijk verschil, geen midden
- Ordinaal meetniveau (opleidingsniveau) je kunt ook in het midden vallen
Kwantitatieve gegevens (continue)
- Interval meetniveau (IQ; temperatuur) geen nul-punt
- Ratio meetniveau (inkomen; leeftijd) duidelijk nul-punt
Frequentie tabel SPSS, drie dingen:
- Welke scores zijn er mogelijk?
- Hoe vaak komen deze scores voor in absolute zin?
- Hoe vaak komen deze scores voor in relatieve zin?
,Fijnste data is zoals weergegeven in de spreiding van bovenstaand plaatje.
Centrale tendentie
- Gemiddelde
- Mediaan middelste waarneming
- Modus welk getal komt het vaakst voor
N = nominaal, O = ordinaal, I = interval, R = ratio
Interkwartiel range =
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2. Verdeelt data in 4 kwarten
3. Interkwartiel afstand = Q3 – Q1
Boxplots visuele weergave van de interkwartiel range
Standaarddeviatie =
goed opletten op n-1!!!! bij sigma (populatie) gewoon normale
N
SLIDE 42 !!!!!!!!!!!!!!!
Vorm
- Scheefheid
- Spitsheid
, Hoorcollege 2 (09/02) – bouwstenen van de verklarende stati sti ek
Verdelingen
1. Frequentieverdeling (frequency distribution) = overzicht van de mogelijke scores op variabele(n) en
hoe vaak die scores voorkomen
2. Kansverdeling (probability (density) distribution) = overzicht van mogelijke scores op variabele(n)
en de kans op deze scores. De kans dat deze voorkomen (normale verdeling)
Discrete kansverdelingen (altijd afgerond, kan geen halven)
- binomiale verdeling
*Wel of niet op kamers gaan?
*50% wel, de proportie is 50%. P=50
*Frequentie = bij een steekproef van 100 verwacht ik dat er 100 wel op kamers gaan.
- poisson verdeling
Continue kansverdelingen (scoor je onder een bepaald interval)
- uniforme verdeling
- normale verdeling
*klokvormig, symmetrisch
*gemiddelde, mediaan en modus zijn gelijk in het midden
*heeft (in theorie) een oneindige range
Z = (x – gemiddelde) / standaarddeviatie
Gemiddelde = µ
Standaarddeviatie = σ
- exponentiele verdeling
Steekproefverdeling (overzicht van alle mogelijke steekproefgemiddelden
Kenmerken:
- theoretische verdeling van alle steekproefgemiddelden bij het trekken van een oneindig aantal
steekproeven
- als de steekproef groot genoeg is (n > 30) dan zal de steekproevenverdeling van x-gemiddeld
normaal verdeeld zijn met de volgende twee eigenschappen.
- µ(x gemiddeld) = µ
- centrale limietstelling
verschillende soorten Z-scores
- standaarddeviatie = maat voor hoe ver een individuele waarneming zich bevindt van het
(steekproef)gemiddelde
- Standaardfout = maat voor hoe ver een steekproef-gemiddelde zich bevindt van het
populatiegemiddelde
basisbeginselen verklarende statistiek
Uitgangspunt verklarende statistiek:
Vanuit een steekproef (met bekende parameters) uitspraken proberen te doen over parameters in de
populatie. Omdat je gaat infereren (uitspraken doen over populatie die je niet in zijn geheel hebt
kunnen onderzoeken) is er altijd sprake van mate van onzekerheid.
Je wil desalniettemin iets kunnen zeggen over de kwaliteit van je uitspraken, hoe zuiver en hoe
efficiënt is de schatting
Intervallen
van beschrijven naar schatten
- In de praktijk zijn we zelden in staat om meer dan een steekproef te trekken
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller jonnaotterman. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.89. You're not tied to anything after your purchase.