100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Statistiek 2: Vrije Universiteit Amsterdam, Hoorcolleges en Boek, Alan Agresti & Barbara Finlay. Statistical Methods For The Social Sciences. $6.41
Add to cart

Summary

Samenvatting Statistiek 2: Vrije Universiteit Amsterdam, Hoorcolleges en Boek, Alan Agresti & Barbara Finlay. Statistical Methods For The Social Sciences.

3 reviews
 222 views  9 purchases
  • Course
  • Institution
  • Book

Met behulp van deze samenvatting hebben wij voor ons tentamen een 7,2 en een 9,6 gehaald. In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit in Amsterdam (schooljaar 2018/2019). Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barba...

[Show more]

Preview 4 out of 84  pages

  • No
  • 10 t/m 14
  • March 16, 2019
  • 84
  • 2018/2019
  • Summary

3  reviews

review-writer-avatar

By: sjane • 4 year ago

review-writer-avatar

By: ibtissamyo25 • 4 year ago

review-writer-avatar

By: mkkooistra • 4 year ago

avatar-seller
Inleiding
__________________________________________________________________________________

In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit
in Amsterdam (schooljaar 2018/2019).
Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barbara Finlay (2009). Statistical
Methods For The Social Sciences. Pearson Education International. Samengevat.

Ook worden heel kort in twee colleges de stof uit de hoofdstukken 1 t/m 9 herhaald. Hiervan hebben
wij al eerder een samenvatting gemaakt die je kunt kopen.

Veel succes met het leren voor het tentamen!

,Hoorcolleges gekoppeld aan Agresti, Statistiek 2
Hoorcollege 1.1

Variabelen en hun meetniveau
Een variabele is een eigenschap die kan variëren tussen personen in een steekproef of populatie.
Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen worden.
Variabelen hebben elk een eigen meetniveau.
Meetniveaus: nominaal: categorische variabelen (studierichting), ordinaal: geordende categorieën,
interval: gelijke meeteenheden en ratio: absoluut nulpunt (gewicht, appelen in een zak).

Continue variabelen: oneindig aantal waarnemingen
Discrete variabelen: aantal broers of zussen, afgeronde eenheden/niks tussen

Meeste methoden voor interval en ratio (parametrische methoden).
Nonparametrische methoden minder bekend en gebruikt (bv. WIlcoxon of Friedman.
In praktijk tot vaak parametrische methoden gebruikt voor ordinale en discrete data met veel
mogelijke waardes (bv. Likert-schalen).

Beschrijvende statistiek:
Het samenvatten van de data middels tabellen en figuren.
Samenvatten per variabele (verdeling), samenvatten voor meerdere variabelen (samenhang).
verschillende beschrijvende statistieken voor categorische versus kwantitatieve data.
Zorg ervoor dat je data altijd eerst exploreert voordat je werkelijk gaat analyseren.

Beschrijvende statistiek -voor categorische data
Frequenties en staafdiagrammen. Vul aan De alpha is de kans dat H0 ten onrechte wordt verworpen.
-voor kwantitatieve data (Continue waardes)
Frequenties, histogram en stem-and-leaf plot.

Verdelingen in woorden gaan beschrijven
4 type verdelingen die je in je data terug kunt zien: normaal verdeling (meeste waardes rond het
gemiddelde), u-vormige verdeling (bijna niks rond het gemiddelde, juist rond extreme kanten. Denk
aan debat vaccinatie), scheve verdeling: naar rechts (onderzoek naar psychopathologieën, meeste
rond gemiddelden, sommigen wijken er extreem vanaf) en scheef naar links (hoe goed kan iemand
een tekst schrijven).

Beschrijven van data centrum: gemiddelde, mediaan en modus.
Gemiddelde zegt niet alles, je wilt de variantie weten. Door bijv. de range te geven (verschil tussen
max en min). Deviatie (yi-ybar). Kwadraatsommen M(yi-ybar)2. Variantie en standaarddeviatie.

De empirische regel. Als het histogram van de data ongeveer klokvormig is. Dan ligt:
Ongeveer 68% van de waarnemingen tussen 1 sd onder en boven gemiddelde
Ongeveer 95% van de waarnemingen tussen 2sd onder en boven gemiddelde
bijna alle waarnemingen tussen 3 sd onder en boven gemiddelde

Classificeren
kwartelen: hakken data in vier gelijke delen
interkwartielafstand (IQR): verschil tussen eerste en derde kwartiel
Outlier: als score 1,5* IQR boven/onder 3 de/1ste kwartiel.

,Kans: de kans dat een variabele een bepaalde waarde aanneemt
random variabele: elke mogelijke waarde van variabele heeft een bepaalde kans.
Kansverdeling: alle mogelijke waardes van variabelen en hun kansen.

-Discrete kansverdelingen:
Elke mogelijke waarde heeft een kans.
histogram, met op de y-as kansen
-continue verdelingen:
Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
figuur met kans = …

3 verschillende type kansverdelingen
-verdelingen van variabelen in de populatie &in de steekproef
-verdelingen van steekproefgrootheden.

IQscores Nederlandse bevolking:
Meerdere steekproeven getrokken, proefpersonen maken IQ-test. IQ is verdeeld met mu=…
 Thuis kijken


Hoorcollege 1.2.
Categorische variabelen: beschrijven door proporties en percentages
continue/kwantitatieve variabelen: waarde omzetten in intervallen

Frequentieverdelingen: gemiddelde, centrummaten, spreiding, positiematen (range, kwartielen in
data) beschrijven.

Voorbeeld uit de wetenschapswereld: herhalen van studies (studies die waar zijn), sommige zijn
terug naar originele studies gegaan, op dezelfde manier herhalen: je verwacht in 5% van de studies
dat de scores afwijken. Maar blijken veel meer te zijn. 100 studies herhaalt, meer dan de helft niet
repliceerbaar. Waarom is het goed dat dit aan het licht kwam: veel transparanter met data omgaan,
hoe analyseren, hoe steekproef getrokken en op basis daarop beslissingen zijn gemaakt. Subsidie
wordt gegeven aan replicatieonderzoek, dat is mooi.

Normaal verdeeld als je steekproef voldoende omvang heeft: steekproevenverdeling. Het
gemiddelde daarvan is ongeveer het populatiegemiddelde, een goede schatting van
populatieparameter. Je kunt er ook spreiding, variatie in zien (standaarderror, standaardafwijking in
je steekproevenverdeling . Dit noem je fout: dat is je marge waarmee je er in je steekproef naast kunt
zitten. Mu is populatieverdeling. Spreiding in de steekproevenverdeling (populatie) is de


standaardfout.
Weinig spreiding in je populatie, wordt deze kleiner.
Twee andere termen voor Alpha zijn: significantieniveau en type 1 fout.
Betrouwbaarheidsintervallen (meer info, waarbinnen ligt populatieparameter) zijn informatiever dan
significantietoetsen (wel/niet sig).
Voor toetsen van gemiddelde wordt de t-toets gebruikt. Z-toets bij proporties.

In een steekproef van 30 tijdens de zwangerschap zwaar rokende vrouwen is de gemiddelde lengte
van de kinderen 50 cm met een standaardafwijking van 1 cm.
-schat het gemiddelde (populatie van alle kinderen van zwaarrokende vrouwen)

, -bepaal betrouwbaarheidsinterval gemiddelde (hoe zeker hiervan, zit er foutenmarge in?)
-toets of gevonden gemiddelde van lengte in algemene populatie kinderen afwijkt. (van niet-
rokende)

Schatten gemiddelde: (op basis van onze steekproef)
-puntschatting: de beste gok die je kunt doen over populatieparameter
Vooral kijken naar gemiddelden. Een schatter is een teekproeffunctie op basis waarvan een
populatieparameter wordt geschat.
De kwaliteit van een schatter wordt uitgedrukt in: zuiverheid (unbaised), doeltreffendheid (efficiënt)

-intervalschatting: een interval om de puntschatting waarbinnen met vermoedt dat parameter ligt.
-boek: proporties/gemiddelden. Nu richten op gemiddelden.

 Schat het gemiddelde: is dus 50, weten dat het steekproefgemiddelde een zuivere, efficiënte
schatter is van de mu (populatiegemiddelde). Maar we weten ook dat het een steekproef is..
Betrouwbaarheidsinterval rondom schatten: foutenmarge aan beide kanten rondom je puntschatter.
Hoe groot moet het interval zijn:
-een betrouwbaarheidsinterval voor een parameter is een interval van getallen waarvan met gelooft
dat parameter daarin ligt.
-het betrouwbaarheidsinterval is de kans dat methode resulteert in interval dat parameter bevat.
Meestal is deze 95% of 99%.
-bevat het betrouwbaarheidsinterval geen 0-> verwerp de H0.

-basis voor BI is teekproevenverdeling van puntschatting. Vaak is deze normaal verdeeld (centrale
limietstelling). We kennen de waarschijnlijkheid vd schatting gegeven de parameter. Ongeveer 95%
vd verdeling ligt binnen twee standaardfouten van parameter (empirische regel). De breedte van het
BI: -neemt toe als de betrouwbaarheid stijgt. -neemt af als de steekproef groter wordt.

Met een betrouwbaarheidsniveau van 0.95, is er een kans van 5% dat het interval rondom de
puntschatter de parameter niet bevat. Voor één steekproef is onbekend of populatiewaarde in
interval ligt. Het betrouwbaarheidsniveau is dus lange termijn proportie correct!




s = standaardafwijking
Moeten we sigma uit de data schatten met s op basis van onzekere ybar. Niet langer
normaalverdeling gebruiken voor toetsing! Maar t- verdeling die wel lijkt op normaalverdeling, maar
met dikkere staarten. Gelijkenis hangt af van n en aantal vrijheidsgraden.

Vrijheidsgraden, degrees of freedom in het Engels (df):
-belangrijk bij kleine steekproeven. Ook bij variantieanalyse en andere procedures later in cursus.
-Bij parameterschatten (zoals de SD), df afhankelijk van de restricties op de observaties. Eén df
verdwijnt voor iedere restrictie. – bij bestuderen verklarende kracht (kijken naar residuele variantie)
rekening houden met aantal parameters gebruikt. Dat verlies je op je N.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller Orthopedagoog4. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.41. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

55628 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$6.41  9x  sold
  • (3)
Add to cart
Added