100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Statistiek 2: Vrije Universiteit Amsterdam, Hoorcolleges en Boek, Alan Agresti & Barbara Finlay. Statistical Methods For The Social Sciences. €5,99   In winkelwagen

Samenvatting

Samenvatting Statistiek 2: Vrije Universiteit Amsterdam, Hoorcolleges en Boek, Alan Agresti & Barbara Finlay. Statistical Methods For The Social Sciences.

3 beoordelingen
 222 keer bekeken  9 keer verkocht

Met behulp van deze samenvatting hebben wij voor ons tentamen een 7,2 en een 9,6 gehaald. In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit in Amsterdam (schooljaar 2018/2019). Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barba...

[Meer zien]

Voorbeeld 4 van de 84  pagina's

  • Nee
  • 10 t/m 14
  • 16 maart 2019
  • 84
  • 2018/2019
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (12)

3  beoordelingen

review-writer-avatar

Door: sjane • 4 jaar geleden

review-writer-avatar

Door: ibtissamyo25 • 4 jaar geleden

review-writer-avatar

Door: mkkooistra • 4 jaar geleden

avatar-seller
Orthopedagoog4
Inleiding
__________________________________________________________________________________

In deze samenvatting wordt gebruik gemaakt van de colleges van Statistiek 2 aan de Vrije Universiteit
in Amsterdam (schooljaar 2018/2019).
Ook zijn de hoofdstukken 10 t/m 14 van het boek Alan Agresti & Barbara Finlay (2009). Statistical
Methods For The Social Sciences. Pearson Education International. Samengevat.

Ook worden heel kort in twee colleges de stof uit de hoofdstukken 1 t/m 9 herhaald. Hiervan hebben
wij al eerder een samenvatting gemaakt die je kunt kopen.

Veel succes met het leren voor het tentamen!

,Hoorcolleges gekoppeld aan Agresti, Statistiek 2
Hoorcollege 1.1

Variabelen en hun meetniveau
Een variabele is een eigenschap die kan variëren tussen personen in een steekproef of populatie.
Het meetniveau van een variabele bepaalt de statistische methoden die gebruikt kunnen worden.
Variabelen hebben elk een eigen meetniveau.
Meetniveaus: nominaal: categorische variabelen (studierichting), ordinaal: geordende categorieën,
interval: gelijke meeteenheden en ratio: absoluut nulpunt (gewicht, appelen in een zak).

Continue variabelen: oneindig aantal waarnemingen
Discrete variabelen: aantal broers of zussen, afgeronde eenheden/niks tussen

Meeste methoden voor interval en ratio (parametrische methoden).
Nonparametrische methoden minder bekend en gebruikt (bv. WIlcoxon of Friedman.
In praktijk tot vaak parametrische methoden gebruikt voor ordinale en discrete data met veel
mogelijke waardes (bv. Likert-schalen).

Beschrijvende statistiek:
Het samenvatten van de data middels tabellen en figuren.
Samenvatten per variabele (verdeling), samenvatten voor meerdere variabelen (samenhang).
verschillende beschrijvende statistieken voor categorische versus kwantitatieve data.
Zorg ervoor dat je data altijd eerst exploreert voordat je werkelijk gaat analyseren.

Beschrijvende statistiek -voor categorische data
Frequenties en staafdiagrammen. Vul aan De alpha is de kans dat H0 ten onrechte wordt verworpen.
-voor kwantitatieve data (Continue waardes)
Frequenties, histogram en stem-and-leaf plot.

Verdelingen in woorden gaan beschrijven
4 type verdelingen die je in je data terug kunt zien: normaal verdeling (meeste waardes rond het
gemiddelde), u-vormige verdeling (bijna niks rond het gemiddelde, juist rond extreme kanten. Denk
aan debat vaccinatie), scheve verdeling: naar rechts (onderzoek naar psychopathologieën, meeste
rond gemiddelden, sommigen wijken er extreem vanaf) en scheef naar links (hoe goed kan iemand
een tekst schrijven).

Beschrijven van data centrum: gemiddelde, mediaan en modus.
Gemiddelde zegt niet alles, je wilt de variantie weten. Door bijv. de range te geven (verschil tussen
max en min). Deviatie (yi-ybar). Kwadraatsommen M(yi-ybar)2. Variantie en standaarddeviatie.

De empirische regel. Als het histogram van de data ongeveer klokvormig is. Dan ligt:
Ongeveer 68% van de waarnemingen tussen 1 sd onder en boven gemiddelde
Ongeveer 95% van de waarnemingen tussen 2sd onder en boven gemiddelde
bijna alle waarnemingen tussen 3 sd onder en boven gemiddelde

Classificeren
kwartelen: hakken data in vier gelijke delen
interkwartielafstand (IQR): verschil tussen eerste en derde kwartiel
Outlier: als score 1,5* IQR boven/onder 3 de/1ste kwartiel.

,Kans: de kans dat een variabele een bepaalde waarde aanneemt
random variabele: elke mogelijke waarde van variabele heeft een bepaalde kans.
Kansverdeling: alle mogelijke waardes van variabelen en hun kansen.

-Discrete kansverdelingen:
Elke mogelijke waarde heeft een kans.
histogram, met op de y-as kansen
-continue verdelingen:
Oneindig aantal mogelijke waardes, kans voor gekozen intervallen van waardes
figuur met kans = …

3 verschillende type kansverdelingen
-verdelingen van variabelen in de populatie &in de steekproef
-verdelingen van steekproefgrootheden.

IQscores Nederlandse bevolking:
Meerdere steekproeven getrokken, proefpersonen maken IQ-test. IQ is verdeeld met mu=…
 Thuis kijken


Hoorcollege 1.2.
Categorische variabelen: beschrijven door proporties en percentages
continue/kwantitatieve variabelen: waarde omzetten in intervallen

Frequentieverdelingen: gemiddelde, centrummaten, spreiding, positiematen (range, kwartielen in
data) beschrijven.

Voorbeeld uit de wetenschapswereld: herhalen van studies (studies die waar zijn), sommige zijn
terug naar originele studies gegaan, op dezelfde manier herhalen: je verwacht in 5% van de studies
dat de scores afwijken. Maar blijken veel meer te zijn. 100 studies herhaalt, meer dan de helft niet
repliceerbaar. Waarom is het goed dat dit aan het licht kwam: veel transparanter met data omgaan,
hoe analyseren, hoe steekproef getrokken en op basis daarop beslissingen zijn gemaakt. Subsidie
wordt gegeven aan replicatieonderzoek, dat is mooi.

Normaal verdeeld als je steekproef voldoende omvang heeft: steekproevenverdeling. Het
gemiddelde daarvan is ongeveer het populatiegemiddelde, een goede schatting van
populatieparameter. Je kunt er ook spreiding, variatie in zien (standaarderror, standaardafwijking in
je steekproevenverdeling . Dit noem je fout: dat is je marge waarmee je er in je steekproef naast kunt
zitten. Mu is populatieverdeling. Spreiding in de steekproevenverdeling (populatie) is de


standaardfout.
Weinig spreiding in je populatie, wordt deze kleiner.
Twee andere termen voor Alpha zijn: significantieniveau en type 1 fout.
Betrouwbaarheidsintervallen (meer info, waarbinnen ligt populatieparameter) zijn informatiever dan
significantietoetsen (wel/niet sig).
Voor toetsen van gemiddelde wordt de t-toets gebruikt. Z-toets bij proporties.

In een steekproef van 30 tijdens de zwangerschap zwaar rokende vrouwen is de gemiddelde lengte
van de kinderen 50 cm met een standaardafwijking van 1 cm.
-schat het gemiddelde (populatie van alle kinderen van zwaarrokende vrouwen)

, -bepaal betrouwbaarheidsinterval gemiddelde (hoe zeker hiervan, zit er foutenmarge in?)
-toets of gevonden gemiddelde van lengte in algemene populatie kinderen afwijkt. (van niet-
rokende)

Schatten gemiddelde: (op basis van onze steekproef)
-puntschatting: de beste gok die je kunt doen over populatieparameter
Vooral kijken naar gemiddelden. Een schatter is een teekproeffunctie op basis waarvan een
populatieparameter wordt geschat.
De kwaliteit van een schatter wordt uitgedrukt in: zuiverheid (unbaised), doeltreffendheid (efficiënt)

-intervalschatting: een interval om de puntschatting waarbinnen met vermoedt dat parameter ligt.
-boek: proporties/gemiddelden. Nu richten op gemiddelden.

 Schat het gemiddelde: is dus 50, weten dat het steekproefgemiddelde een zuivere, efficiënte
schatter is van de mu (populatiegemiddelde). Maar we weten ook dat het een steekproef is..
Betrouwbaarheidsinterval rondom schatten: foutenmarge aan beide kanten rondom je puntschatter.
Hoe groot moet het interval zijn:
-een betrouwbaarheidsinterval voor een parameter is een interval van getallen waarvan met gelooft
dat parameter daarin ligt.
-het betrouwbaarheidsinterval is de kans dat methode resulteert in interval dat parameter bevat.
Meestal is deze 95% of 99%.
-bevat het betrouwbaarheidsinterval geen 0-> verwerp de H0.

-basis voor BI is teekproevenverdeling van puntschatting. Vaak is deze normaal verdeeld (centrale
limietstelling). We kennen de waarschijnlijkheid vd schatting gegeven de parameter. Ongeveer 95%
vd verdeling ligt binnen twee standaardfouten van parameter (empirische regel). De breedte van het
BI: -neemt toe als de betrouwbaarheid stijgt. -neemt af als de steekproef groter wordt.

Met een betrouwbaarheidsniveau van 0.95, is er een kans van 5% dat het interval rondom de
puntschatter de parameter niet bevat. Voor één steekproef is onbekend of populatiewaarde in
interval ligt. Het betrouwbaarheidsniveau is dus lange termijn proportie correct!




s = standaardafwijking
Moeten we sigma uit de data schatten met s op basis van onzekere ybar. Niet langer
normaalverdeling gebruiken voor toetsing! Maar t- verdeling die wel lijkt op normaalverdeling, maar
met dikkere staarten. Gelijkenis hangt af van n en aantal vrijheidsgraden.

Vrijheidsgraden, degrees of freedom in het Engels (df):
-belangrijk bij kleine steekproeven. Ook bij variantieanalyse en andere procedures later in cursus.
-Bij parameterschatten (zoals de SD), df afhankelijk van de restricties op de observaties. Eén df
verdwijnt voor iedere restrictie. – bij bestuderen verklarende kracht (kijken naar residuele variantie)
rekening houden met aantal parameters gebruikt. Dat verlies je op je N.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Orthopedagoog4. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 75632 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,99  9x  verkocht
  • (3)
  Kopen