Conceptuele achtergronden:
- De cijfers spreken nooit voor zich
- Initiële observatie theorie hypothese datavezameling analyse uitspraak
- Bijv. onderzoeksvraag: waarom is er in sommige landen of gemeenten meer verzet tegen de
komst van een AZC dan in andere?
1. Identificeren van de afhankelijke variabele (meningen over migratie)
2. Bepalen van de mate van spreiding (variantie)
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren (bijv. mate van
geluk, angst voor misdaad)
4. Modellen opstellen die deze spreiding kunnen wegnemen (factoren worden in model
gezet en kijken of spreiding weggenomen wordt)
Gebruik en misbruik van statistiek:
- Asylym trends, rapportage Eurostat
- Welk Europees land behandelde in 1e helft 2015 relatief gezien de meeste asielaanvragen?
o In relatie tot grootte van een land
o In relatie tot bevolkingsgrootte
o In relatie tot BNP
Brengt bepaalde mate van onzekerheid met zich mee, vanwege steekproef of meetfouten
Basis van iedere statistische analyse is de datamatrix:
- Factoren staan in de kolommen
- Onderzoekseenheden staan in de rij
- Er staan alleen getallen in, waarden moeten vertaald worden naar getallen
Typen gegevens/data
- Kwalitatieve gegevens (categorisch)
o Nominaal meetniveau (geslacht, nationaliteit)
o Ordinaal meetniveau (opleidingsniveau) > wel rang aan te brengen
- Kwantitatieve gegevens (continue)
o Interval meetniveau (IQ, temperatuur) > afstand tussen de waarden van belang
o Ratio meetniveau (inkomen, leeftijd) > er is een nulpunt
Eigenschappen data
, - Data heeft de neiging om zich tot één bepaald punt te concentreren
- Data heeft een mate van spreiding om die centrale tendentie
- De verdeling heeft een bepaalde vorm
Casus facebook:
Steekproef (n) van 200 Nijmeegse middelbare scholieren naar:
- Aantal facebook posts per week
- Aantal facebook vrienden
- Aantal likes per week
Eerste eigenschap van een verdeling: centrale tendentie
Maat Populatie Steekproef Type data
Modus (meest voorkomende waarneming - - N/O/I/R
Mediaan (middelste waarneming M M O/I/R
Gemiddelde µ X streepje erboven I/R
N = nominaal / O = ordinaal / I = interval / R = ratio
- Eigenschappen data: centrummaten
Tweede eigenschap van een verdeling: variantie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ2 S2 I/R
Standaarddeviatie σ S I/R
Range = hoogste – laagste getal
,Spreiding: interkwartiel range:
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de mediaan)
2. Verdeelt data in vier
3. Interkwartiel afstand = Q3 - Q1
Boxplot heeft aan waar het midden ligt, en de lijn die eruit steekt is de uitloop naar boven en binnen.
De middelste lijn is dan de mediaan
Spreiding: standaarddeviatie
Maat Populatie Steekproef Type data
Bereik - - O/I/R
Interkwartiel range IQR IQR O/I/R
Variantie σ2 S2 I/R
Standaarddeviatie σ S I/R
Gemiddelde en standaarddeviatie:
- Centrale tendentie
- Friends: aantal vrienden
- Lijst respondenten
Let goed op de berekeningen van standaarddeviatie en
gemiddelde
Belangrijk om te kwadrateren, komt altijd een positief getal uit
De gekwadrateerde kolom is de kwadrantie
De wortel daarvan nemen is de standaarddeviatie
, Gemiddelde en standaarddeviatie
Spreiding
- Friends: aantal vrienden
Betekenis standaarddeviatie: empirische regel
Voorwaarde: frequentieverdeling is heuvelvormig en symmetrisch
Casus: facebook
Variabele: aantal facebook vrienden
- Ervan uitgaande dat we heir met een normale verdeling te maken hebben, kunnen we
stellend dat:
1. 68% van de scholieren tussen 113-274 vrienden heeft
2. 95% van de scholieren tussen de 32 en 355 vrienden heeft
3. Waarden onder de 32 en de 355 uitzonderlijk zijn
Variabele aantal Likes
- Onze outsider, respondent nr. 42 heeft 63 likes
- Vraag: hoe uitzonderlijk is deze waarde?
- Hoeveel standaarddeviaties bevindt deze waarde zich van het gemiddelde?
- Z = (63 – 27.5) / 12.27 = 2.893 > dus deze persoon vindt zich bijna 2.9 standaarddeviatie van
het gemiddelde.
Derde eigenschap van een verdeling: vorm scheefheid
- Maat = scheefheid (skewness)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller Thijs96. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.43. You're not tied to anything after your purchase.