Hoorcollege 1.1
Alles van statistiek 1 komt ook in het tentamen.
Een variabele is een eigenschap die kan variëren tussen personen in een steekproef of populatie.
Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen worden
Variabelen hebben elk een eigen meetniveau.
Meetniveau van gewicht → RATIO
Meetniveau van de variabele studierichting → nominaal
Meetniveau aantal appelen in een zak → RATIO
Meetniveau somscore op de angst vragenlijst → interval / ordinaal
Nominaal en ordinaal → categorisch
De meeste methoden voor interval en ratio → parametrische methoden.
Beschrijvende statistiek
Hoe kan je data beschrijven?
- Je probeert meestal de data samen te vatten middels tabellen en figuren
- Je kan voor elke variabele de verdeling plotten etc.
- Je kan het ook doen voor meerdere variabelen tegelijk en kijk je naar de samenhang
- In alle gevallen is het onderscheidt tussen categorisch en kwantitatief van belang
- Zorg er altijd voor dat je altijd eerst exploreert voordat je werkelijk gaat analyseren.
De ALFA is de kans dat H0 ten onrechte
wordt verworpen.
Voor kwantitatieve data
- Histogrammen
- Frequentiediagrammen
- Stem – and – leafplots
Bimodale verdeling:
- Verdeling met twee toppen.
Gemiddelde zegt niet alles!
Beschrijving van data variabiliteit
- Range (verschil tussen max en min)
- Deviatie: (y1 – ygemiddelde)
- Kwadratensom: Σ(yi − y¯) 2 .
- Variantie: s 2 = Σ(yi − y¯) 2 / n − 1 .
- Standaard deviatie:
,Histogram en variabiliteit:
- Manier om naar variabiliteit te kijken
- Manier om SD te bepalen is bolletjes gebruiken, om de score van elke persoon in de steekproef
neer te zetten.
Een andere manier van kijken naar spreiding is classificeren
- Kwartielen: hakken data in 4 gelijke delen
- Interkwartiel afstand: verschil tussen 1e en 3e kwartiel
- Outlier: als score 1.5 x IQR boven / onder 3e/1e kwartiel
Kansverdelingen:
- Kans: de kans dat een observatie een bepaalde waarde aanneemt
- Random variabele: elke mogelijk waarde van variabele heeft een bepaalde kans
- Kansverdeling: alle mogelijk waardes van variabele en hun kansen
Discrete kansverdelingen:
- Elke mogelijke waarde heeft een kans
- Histogram, met op de y-as de kansen
Continue kansverdelingen:
- Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
- Figuur met kans = oppervlakte onder de curve
Voorbeeld discrete kansverdelingen
- Twee variabelen
o Inzet (weinig, middelmatig, veel)
o Prestatie (onvoldoende, voldoende en goed)
Voorbeeld continue kansverdelingen:
- Reactietijd onderzoek
- De kans op een bepaalde kans is dan de oppervlakte onder de curve
Kansverdelingen in statistiek:
- Verdelingen van variabelen in de populatie
- Verdelingen van variabelen in de steekproef
- Verdelingen van steekproefgrootheden
o Sample statistics
o Parameter die je schat
o Bijv: steekproefgemiddelde
- Sommige kansverdelingen benaderen de wereld goed
- Sommige kansverdelingen zijn belangrijk omdat ze bij het
bedrijven van statistiek handig zijn
- In beide gevallen speelt de normaalverdeling een belangrijke rol
Populatieverdeling van IQ scores →
Z-scores:
- Om kans voor y te bepalen, gebruik z = (y- u) / o, daarna kans in z-tabel opzoeken
- Om y-waarde te vinden voor gegeven kans, gebruik y = u + zx o
- Als ruwe data normaal verdeeld, conversie naar z geeft standaard normaalverdeling
- Als ruwe data niet normaal verdeeld, dan z-score ook niet.
Voorbeeld:
Hoeveel % van de volwassenen haalt score hoger dan 120 op een IQ-test (µ = 100; σ = 15)? z = (120 − 100)/15 = 1.33.
Opzoeken in z-tabel: Kans=.0918. Dus: ongeveer 9% van de volwassen bevolking heeft een IQ hoger dan 120.
, Populatieverdeling: populatiegemiddelde µ is (vaak onbekende) parameter.
Steekproefverdeling: steekproefgemiddelde ¯y is steekproefgrootheid (’sample statistic’).
Steekproevenverdeling: verdeling van steekproefgrootheid over steekproeven heen
Doel statistiek: op basis van een steekproef uitspraak over populatie.
Uitspraak meestal over gemiddelde of proportie.
- Stel: grote bak met knikkers (rood en blauw); op basis van een steekproef 2 knikkers schat
proportie blauw.
- Stel: Jullie zijn de populatie, bepalen hoe slim jullie zijn op basis van 2 willekeurige studenten die
IQ-test maken.
Weinig vertrouwen, want door kleine steekproef kan schatting nogal afwijkend zijn.
Naarmate je meer observaties ziet heb je
steeds meer vertrouwen, maar hoeveel is
genoeg?
Het gemiddelde van de
steekproevenverdeling van y-dakje is u
(latijns).
De standaarddeviatie van de
steekproevenverdeling van ¯y is de
standaardfout: σy¯ = σ √ n
De steekproevenverdeling van ¯y
vertoont minder spreiding dan de
verdeling waaruit de steekproef
getrokken is, omdat:
- Extreme waarden een kleinere kans hebben om getrokken te worden dan centralere waarden.
- Het trekken van veel extreme waarden nog onwaarschijnlijker is.
- Deze extreme waarden dan wel extreem moeten zijn aan ´e´en kant.
- Extreme waarden worden meestal gecompenseerd door een centralere waarde of een extreme
waarde van de tegengestelde kant.
Hoorcollege 1.2
Doel statistiek: op basis van een steekproef uitspraak over populatie
Hoe groter steekproef → steeds minder afwijking in steekproefgemiddeldes
Hoe meer proefpersonen , hoe kleinere de kans dat extreme waarden toevalling niet gecompenseerd
worden.
De verdeling wordt smaller naarmate we meer proefpersonen hebben.
Centrale limietstelling en de normale verdeling:
- Ongeact de verdeling van een variabele in de populatie, ligt bij toenemende N de
steekproevenverdeling van ydakje steeds dichter bij mu en lijkt de verdeling steeds meer op de
normaalverdeling. Daarom gebruiken we de normaalverdeling zo vaak.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper elizavermeulen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.