Hoorcollege 1.1
Alles van statistiek 1 komt ook in het tentamen.
Een variabele is een eigenschap die kan variëren tussen personen in een steekproef of populatie.
Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen worden
Variabelen hebben elk een eigen meetniveau.
Meetniveau van gewicht → RATIO
Meetniveau van de variabele studierichting → nominaal
Meetniveau aantal appelen in een zak → RATIO
Meetniveau somscore op de angst vragenlijst → interval / ordinaal
Nominaal en ordinaal → categorisch
De meeste methoden voor interval en ratio → parametrische methoden.
Beschrijvende statistiek
Hoe kan je data beschrijven?
- Je probeert meestal de data samen te vatten middels tabellen en figuren
- Je kan voor elke variabele de verdeling plotten etc.
- Je kan het ook doen voor meerdere variabelen tegelijk en kijk je naar de samenhang
- In alle gevallen is het onderscheidt tussen categorisch en kwantitatief van belang
- Zorg er altijd voor dat je altijd eerst exploreert voordat je werkelijk gaat analyseren.
De ALFA is de kans dat H0 ten onrechte
wordt verworpen.
Voor kwantitatieve data
- Histogrammen
- Frequentiediagrammen
- Stem – and – leafplots
Bimodale verdeling:
- Verdeling met twee toppen.
Gemiddelde zegt niet alles!
Beschrijving van data variabiliteit
- Range (verschil tussen max en min)
- Deviatie: (y1 – ygemiddelde)
- Kwadratensom: Σ(yi − y¯) 2 .
- Variantie: s 2 = Σ(yi − y¯) 2 / n − 1 .
- Standaard deviatie:
,Histogram en variabiliteit:
- Manier om naar variabiliteit te kijken
- Manier om SD te bepalen is bolletjes gebruiken, om de score van elke persoon in de steekproef
neer te zetten.
Een andere manier van kijken naar spreiding is classificeren
- Kwartielen: hakken data in 4 gelijke delen
- Interkwartiel afstand: verschil tussen 1e en 3e kwartiel
- Outlier: als score 1.5 x IQR boven / onder 3e/1e kwartiel
Kansverdelingen:
- Kans: de kans dat een observatie een bepaalde waarde aanneemt
- Random variabele: elke mogelijk waarde van variabele heeft een bepaalde kans
- Kansverdeling: alle mogelijk waardes van variabele en hun kansen
Discrete kansverdelingen:
- Elke mogelijke waarde heeft een kans
- Histogram, met op de y-as de kansen
Continue kansverdelingen:
- Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
- Figuur met kans = oppervlakte onder de curve
Voorbeeld discrete kansverdelingen
- Twee variabelen
o Inzet (weinig, middelmatig, veel)
o Prestatie (onvoldoende, voldoende en goed)
Voorbeeld continue kansverdelingen:
- Reactietijd onderzoek
- De kans op een bepaalde kans is dan de oppervlakte onder de curve
Kansverdelingen in statistiek:
- Verdelingen van variabelen in de populatie
- Verdelingen van variabelen in de steekproef
- Verdelingen van steekproefgrootheden
o Sample statistics
o Parameter die je schat
o Bijv: steekproefgemiddelde
- Sommige kansverdelingen benaderen de wereld goed
- Sommige kansverdelingen zijn belangrijk omdat ze bij het
bedrijven van statistiek handig zijn
- In beide gevallen speelt de normaalverdeling een belangrijke rol
Populatieverdeling van IQ scores →
Z-scores:
- Om kans voor y te bepalen, gebruik z = (y- u) / o, daarna kans in z-tabel opzoeken
- Om y-waarde te vinden voor gegeven kans, gebruik y = u + zx o
- Als ruwe data normaal verdeeld, conversie naar z geeft standaard normaalverdeling
- Als ruwe data niet normaal verdeeld, dan z-score ook niet.
Voorbeeld:
Hoeveel % van de volwassenen haalt score hoger dan 120 op een IQ-test (µ = 100; σ = 15)? z = (120 − 100)/15 = 1.33.
Opzoeken in z-tabel: Kans=.0918. Dus: ongeveer 9% van de volwassen bevolking heeft een IQ hoger dan 120.
, Populatieverdeling: populatiegemiddelde µ is (vaak onbekende) parameter.
Steekproefverdeling: steekproefgemiddelde ¯y is steekproefgrootheid (’sample statistic’).
Steekproevenverdeling: verdeling van steekproefgrootheid over steekproeven heen
Doel statistiek: op basis van een steekproef uitspraak over populatie.
Uitspraak meestal over gemiddelde of proportie.
- Stel: grote bak met knikkers (rood en blauw); op basis van een steekproef 2 knikkers schat
proportie blauw.
- Stel: Jullie zijn de populatie, bepalen hoe slim jullie zijn op basis van 2 willekeurige studenten die
IQ-test maken.
Weinig vertrouwen, want door kleine steekproef kan schatting nogal afwijkend zijn.
Naarmate je meer observaties ziet heb je
steeds meer vertrouwen, maar hoeveel is
genoeg?
Het gemiddelde van de
steekproevenverdeling van y-dakje is u
(latijns).
De standaarddeviatie van de
steekproevenverdeling van ¯y is de
standaardfout: σy¯ = σ √ n
De steekproevenverdeling van ¯y
vertoont minder spreiding dan de
verdeling waaruit de steekproef
getrokken is, omdat:
- Extreme waarden een kleinere kans hebben om getrokken te worden dan centralere waarden.
- Het trekken van veel extreme waarden nog onwaarschijnlijker is.
- Deze extreme waarden dan wel extreem moeten zijn aan ´e´en kant.
- Extreme waarden worden meestal gecompenseerd door een centralere waarde of een extreme
waarde van de tegengestelde kant.
Hoorcollege 1.2
Doel statistiek: op basis van een steekproef uitspraak over populatie
Hoe groter steekproef → steeds minder afwijking in steekproefgemiddeldes
Hoe meer proefpersonen , hoe kleinere de kans dat extreme waarden toevalling niet gecompenseerd
worden.
De verdeling wordt smaller naarmate we meer proefpersonen hebben.
Centrale limietstelling en de normale verdeling:
- Ongeact de verdeling van een variabele in de populatie, ligt bij toenemende N de
steekproevenverdeling van ydakje steeds dichter bij mu en lijkt de verdeling steeds meer op de
normaalverdeling. Daarom gebruiken we de normaalverdeling zo vaak.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller elizavermeulen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.57. You're not tied to anything after your purchase.