An Introduction to Statistical Methods and Data Analysis
Samenvatting van Statistics 2 Wageningen Universiteit (WUR). MAT-15403. Geschreven in het Nederlands. Met formules, stappenplannen en overzichtelijke weergave soorten statistische toetsen en bijbehorende formules. Samenvatting van lectures en tutorials.
Populatie: gehele groep elementen waarover informatie wordt gewenst
Steekproef: gedeelte van de populatie dat feitelijk wordt onderzocht om informatie te vergaren
Eenheden: elementen van steekproef waaraan gegevens worden verzameld
Variabele: eigenschap van element uit steekproef die wordt bepaald
Kwantitatieve variabele
Continu; iets om te meten
Discreet; heel aantal
Kwalitatieve variabele
Nominaal; gegeven niet te ordenen
Ordinaal; gegevens te ordenen
Visualisatie resultaten
Histogram: alle mogelijke waarden (tussen hele getallen in) worden behaald
→ veel waarnemingen → steeds kleinere klassenbreedten in histogram → curve wordt kansdichtheidsfunctie
Staafdiagram: discrete variabelen met beperkt aantal mogelijke uitkomsten
Transformatie y ~ N(µ,σ)σ)) → Z ~ N(0,σ)1)
y = µ + z σ) → Z = (y-μ)/σ)/σ)
QQ-plot
Waarnemingen uit steekproef rond rechte lijn; populatie normaal verdeeld
Waarnemingen met kromming naar rechts → verdeling scheef naar rechts (in curve top aan linkerkant)
Waarnemingen uitlopend in tegengestelde richting aan uiteinden → normaalverdeling met dikkere staarten
Centrale limietstelling
Enkelvoudig Aselecte Steekproef van omvang n,σ) populatie met verwachting µ y en standaardafwijking σ)y.
σy
Verdeling steekproefgemiddelde: y ~ N (µy ,σ) )
√n
→ steekproefgemiddelde bij benadering normaal verdeeld
Verdeling som: y ~ N (n µy,σ) √ n σ)y) ∑
Tutorial 2
ŷ (gemiddelde) is consistente schatter voor µy: hoe groter de steekproef,σ) hoe dichterbij hij komt
→ ŷ : puntschatting voor µy
Betrouwbaarheidsinterval: informatie nauwkeurigheid schatting
Betrouwbaarheidscoëfficient 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat geeft mate van vertrouwen weer; 1- α geeft mate van vertrouwen weer; 1-α = 95%; kans dat = 95%; kans dat
betrouwbaarheidsinterval µy bevat = 0.95
1-6
, Tabel 2; voor 1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ; right-tail p: 0.025 → df = inf → za/2 = 1.960
σy
Grenzen betrouwbaarheidsinterval ŷ ± za/2
√n
σ): populatie standaardafwijking; schatten door s: steekproef standaardafwijking
σ s
σ y= y =
√n √n
Standaardfout: maat voor nauwkeurigheid steekproefgemiddelde als schatter voor populatiegemiddelde
s
SE =
√n
Door schatten van σ) extra onnauwkeurigheid
Standaard normale verdeling → t-verdeling met bepaald aantal vrijheidsgraden
σ) bekend σ) onbekend
(1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ (1-α geeft mate van vertrouwen weer; 1-α = 95%; kans dat ) betrouwbaarheidsinterval voor µ
σy s
ŷ ± za/2 ŷ ± ta/2
√n √n
za/2 uit N(0,σ)1)-verdeling ta/2 uit t(n-1)-verdeling
[df=inf.,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2] [df=n-1,σ) right-tail p = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat /2,σ) tabel 2]
Tutorial 3
Toets procedure
1. H0 en Ha opstellen
2. Kiezen ToetsingsGrootheid TG
3. Kansverdeling van TG onder H0
4. Gedrag TG onder Ha; kleiner/groter/kleiner of grotere waarden
5. Zijdigheid P-waarde; rechtszijdig,σ) linkszijdig,σ) tweezijdig
6. Berekenen TG
7. P-waarde bepalen
8. Conclusie; ook in niet statistische bewoordingen; ga uit van Ha!
Z-toets; onder Z ~ N(0,σ)1)
Toetsingsgrootheid; y: aantal eenheden uit populatie dat voldoet aan gebeurtenis
P-waarde: kans -berekend onder de aanname dat H0 waar is- dat toetsingsgrootheid een waarde zou aannemen
die even extreem is als feitelijk waargenomen uitkomst; hoe kleiner P-waarde hoe sterker bewijs tegen H 0
Significantieniveau; onbetrouwbaarheidsdrempel: waarde die nauwkeurigheid bewijs bepaalt
P-waarde ≤ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 verworpen en Ha aangetoond
P-waarde ≥ α geeft mate van vertrouwen weer; 1-α = 95%; kans dat → H0 niet verworpen en Ha niet aangetoond
Kritiek gebied: KG: uitkomsten van toetsingsgrootheid waarvoor H 0 verworpen wordt
KG bepalen: [tabel 2]: tα geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau,σ) x df let op; bij tweezijdig KG t(α geeft mate van vertrouwen weer; 1-α = 95%; kans dat =significantieniveau)/2 ,σ) x df
Fout type I: H0 ten onrechte verworpen kans = α geeft mate van vertrouwen weer; 1-α = 95%; kans dat
Fout type II: H0 ten onrechte niet verwerpen kans = β
2-6
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller maryse5. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.27. You're not tied to anything after your purchase.