Hoorcollege 1. Basisbeginselen statistiek, beschrijvende statistiek (31 jan. )
Inleiding:
Doelstellingen cursus OIM-B:
- basiselementen en procedures uit de beschrijvende en verklarende statistiek
adequaat kunnen toepassen, met behulp van SPSS (of R).
- resultaten van statistische procedures adequaat kunnen interpreteren;
- keuzes bij het uitvoeren van statistische procedures en de interpretatie van de
resultaten kunnen onderbouwen
Toetsing = 60 meerkeuzevragen (100% van het eindcijfer)
SPSS (aan te schaffen via Surfspot) menugestuurd of syntax
Conceptuele achtergronden
- Data zijn altijd cijfers. Maar de cijfers spreken nooit voor zich
- Initiële observatie→ theorie→ hypothese→ dataverzameling→ analyse→uitspraak
(inference)
Wat zijn de stappen als we statistiek gebruiken?
1. Identificeren van de afhankelijke variabelen
2. Bepalen van de mate van spreiding (variantie)
3. Op zoek naar factoren die deze spreiding mogelijk kunnen verklaren → de kern van
wat we gaan doen met statistiek; kunnen we verklaren waar die spreiding vandaan
komt?
4. Modellen opstellen die deze spreiding kunnen wegnemen.
Beschrijvende statistiek: wat is onze populatie? Je kan als populatie alle Nederlanders
nemen of alle studenten van de universiteit. Maar je kan nooit iedereen vragen, dus daarom
gebruiken we maar een deel→ de steekproef.
Verklarende statistiek (inferential statistics): Steekproef→ je doet een uitspraak over de hele
populatie via een deel van de populatie die je hebt geselecteerd.
Datamatrix→ er worden cijfers gegeven aan bepaalde categorieën: bijv. geslacht (1 of 2)
Hoe kunnen meningen worden beïnvloed?
- Bijv: hoe gelukkig ben je, hoe bezorgd ben je etc.
,Hoe zien mijn data eruit? → eigenschappen (kwantitatieve) data
Centrale tendentie → waar zitten mijn data, waar zitten de meeste data? Gemiddeld,
mediaan, modus
Spreiding → hoe is de data verdeeld? wat is het bereik? Kwartielafstand, variantie,
standaarddeviatie
Vorm→ Wat is de scheefheid; linksscheef / rechtsscheef? Spitsheid?
Spreiding, gemiddelde, mediaan en modus hangen samen met elkaar en zijn van elkaar
afhankelijk.
Centrale tendentie
Interkwartiel range
1. Maat voor spreiding in de middelste 50% van de waarnemingen (rondom de
mediaan)
2. Verdeeld data in 4 kwarten:
3. Interkwartiel afstand (middelste 50% = Q3-Q1)
Spreiding: standaarddeviatie bij een steekproef
,Variabele: Aantal volgers (μ = 1932, σ = 807)
Ervan uitgaande dat we hier met een normale verdeling te maken hebben, kunnen we
stellen dat:
1. 68% van de politici tussen 1125 en 2739 volgers heeft
2. 95% van de politici tussen de 318 en 3546 volgers heeft
3. waarden onder de 318 en boven de 3546 uitzonderlijk zijn..
Z waarde: hoe waarschijnlijk is de waarde die ik heb?
Vorm scheefheid
Maat= scheefheid
Vraag: wat zijn de (twee) belangrijkste gevolgen van scheve verdeling?
- Gemiddelde wordt ‘meegetrokken’ door extreme waarden
- Spreidingsmaten in sterke mate beïnvloed door extreme waarden
Vorm spitsheid
Maat= kurtosis
Van frequentie naar kansverdeling
Vraag: Wat is de kans op waarnemingen meer dan twee standaarddeviaties
van gemiddelde?
, Conclusie:
Statistiek is een middel om onderzoeksvragen mee te beantwoorden.
- Statistiek begint bij het grondig inspecteren van je data
- Meestal zal men gebruik maken van verschillende statistische maten van centrale
tendentie, spreiding, en vorm (scheefheid en spitsheid).
- De relatieve locatie van een waarneming in een verdeling geeft inzicht in de
waarschijnlijkheid van die uitkomst.
Hoorcollege 2. Bouwstenen van de verklarende statistiek (7 feb.)
x→y
x heeft invloed op y
Wat geeft ons de basis om schattingen te doen van Y?
1. Verdelingen
De ideale data is normaal verdeeld.
Verschillende soorten ‘verdelingen’
- Frequentieverdeling (frequency distribution): overzicht van de mogelijke scores op
variabele en hoe vaak die scores voorkomen.
- Kansverdeling (probability (density) distribution): overzicht van mogelijke scores op
variabele en kans op deze scores.
Voorbeeld:
Zelftest: Bij het spel mens-erger-je-niet werp je slechts met een dobbelsteen.
Vraag: Hoe ziet de kansverdeling van het spel mens- erger-je-niet er uit?
De kans bij de dobbelsteen is gelijk.
Vraag: Hoe ziet de frequentieverdeling eruit, bij een n van 3000 worpen?
De binomiale verdeling→ maar 2 mogelijke scores (wel of niet op kamers)
Kans is 50% , wordt uitgedrukt in proportie (p). De proportie uitwonende studenten = 50
Frequentie: In aselecte steekproef van 100 studenten, verwacht ik 50 uitwonende studenten
aan te treffen.
Afhankelijke variabele: woonsituatie
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper roosverhagen2004. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,66. Je zit daarna nergens aan vast.