100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting 'Statistical Methods for the Social Sciences' 4.4 tot en met 8.4 €5,49   In winkelwagen

Samenvatting

Samenvatting 'Statistical Methods for the Social Sciences' 4.4 tot en met 8.4

2 beoordelingen
 101 keer bekeken  9 keer verkocht
  • Vak
  • Instelling
  • Boek

Dit is een samenvatting van het Engelse statistiek boek 'Statistical Methods for the Social Sciences', geschreven door Alan Agresti, vanaf hoofdstuk 4.4 tot en met hoofdstuk 8.4 (tentamenstof voor tentamen statistiek 1B voor RUG sociologie studenten jaar 1) De samenvatting is geschreven in het Nede...

[Meer zien]

Voorbeeld 3 van de 27  pagina's

  • Nee
  • H4.4 tm h8.4
  • 8 januari 2020
  • 27
  • 2019/2020
  • Samenvatting

2  beoordelingen

review-writer-avatar

Door: leonvanesveld6 • 1 jaar geleden

review-writer-avatar

Door: mmjonas0 • 3 jaar geleden

avatar-seller
Samenvatting statistiek 1B : Hoofdstukken 4.4 tot en met 8.4

HOOFDSTUK 4: Probability distributions
4.4 Steekproevenverdelingen beschrijven hoe statistieken variëren
Een probability distribution is een verdeling. Een verdeling geeft de
kansen op bepaalde uitkomsten van een variabele weer. Een
veelvoorkomende verdeling is de normale verdeling.
Als er een enkele steekproef gedaan wordt, kunnen de resultaten van
deze steekproef worden weergegeven in een steekproefverdeling =
de waarschijnlijkheidsverdeling die waarschijnlijkheden specificeert
voor de mogelijke waarden die de statistiek kan aannemen.
Steekproefverdelingen geven de steekproefvariabiliteit weer die
optreedt bij het verzamelen van gegevens en het gebruik van
steekproefstatistieken om parameters te schatten. Het gemiddelde van een steekproefverdeling, het
steekproefgemiddelde, is jouw beste idee van het populatiegemiddelde.

Er zijn een aantal kenmerken van zowel een populatie als een steekproefverdeling, die elk met eigen symbolen
en kenmerken te maken hebben:

POPULATIE STEEKPROEF
σ2 = Σ ¿¿ S2 = Σ ¿ ¿
Gaat om parameters (constanten) Gaat om statistieken (variabelen)
μ is het populatiegemiddelde ȳ is het steekproefgemiddelde
σ 2 is de populatievariantie S2 is de steekproefvariantie
N is de populatiegrootte n is de steekproefgrootte
Xi is de observatie yi is de observatie

Elke steekproef kent zijn eigen steekproefverdeling. Vaak is het zo dat er voor een onderzoek meerdere
steekproeven getrokken worden. Het is dan onoverzichtelijk om heel veel verschillende verdelingen van enkele
steekproeven apart van elkaar te bekijken. Daarom worden van dezelfde steekproeven één
steekproevenverdeling gemaakt. Voor het gemiddelde wordt dan het symbool Ŷ en voor de standaardfout
wordt σŶ gebruikt.

4.5 Steekproevenverdelingen van verzamelde gemiddelden
De standaardfout van een steekproevenverdeling is de standaarddeviatie van alle steekproeven
samengenomen. Het beschrijft hoeveel het steekproevengemiddelde varieert van steekproef tot steekproef, dus
de spreiding rondom het steekproevengemiddelde. Het gaat hier om een fout, omdat we het gemiddelde van
de populatie (ohm) gaan schatten op basis van het gemiddelde van een steekproef waarin niet de gehele
populatie meegenomen is. Deze onzekerheid moeten we compenseren aan de hand van de standaardfout.
De formule voor de standaardfout is als volgt:

σ
σŶ =
√n
Er gelden een aantal dingen voor deze standaardfout:
- De standaardfout wordt kleiner naarmate de steekproefgrootte n groter wordt.
- Hoe kleiner de standaardfout, hoe kleiner de spreiding en hoe preciezer de schatting
Dus: n groter  hoe kleiner de standaardfout  hoe smaller de spreiding  hoe preciezer de schatting

Er geld dat wanneer een populatie normaal verdeeld is, elke verdeling van deze populatie ook automatisch
normaal verdeeld is. Wanneer een populatie niet normaal verdeeld is, is dat dus niet het geval. Om deze reden
is er de centrale limietstelling = voor willekeurige steekproeven met een grote steekproefgrootte n, is de
steekproefverdeling van het steekproefgemiddelde ȳ normaal verdeeld.
Er wordt aangenomen dat een steekproefgrootte van 30 groot genoeg is om van een niet-normaal verdeelde
populatie toch een normaal verdeelde steekproefverdeling te krijgen.

,4.6 De populatie, steekproefverdeling en steekproevenverdeling
Het onderscheid tussen drie verschillende verdelingen is belangrijk. Er zijn drie belangrijke verdelingen:
1. Population distribution = populatie verdeling
Dit is de verdeling van waaruit we een steekproef trekken. Deze verdeling is meestal onbekend. We proberen
meestal conclusies te trekken over de kenmerken ervan, zoals de parameters µ en de standaarddeviatie.
2. Sample data distribution = steekproefverdeling
Dit is de verdeling van de data die we daadwerkelijk observeren. Het is een verdeling van de
waarden/observaties van één steekproef.
We beschrijven de statistieken met het steekproefgemiddelde ȳ en standaarddeviatie s. Hoe groter de
steekproefgrootte n, hoe dichter de steekproefverdeling lijkt op de populatieverdeling en hoe dichter de
steekproefstatistieken komen te liggen bij de populatie parameters.
3. Sampling distribution = steekproevenverdeling
Dit is een kansverdeling voor de mogelijke waarden van een steekproefstatistiek, zoals ȳ. Een
steekproevenverdeling beschrijft de variatie die optreedt in de waarde van de statistiek over steekproeven die
keer op keer herhaald worden, met elk dezelfde steekproefgrootte. Deze verdeling bepaalt de
waarschijnlijkheid dat de statistiek binnen een bepaalde afstand van de populatieparameter valt.

4.7 Chapter Summary
 De kans van een bepaalde uitkomst is de hoeveelheid keren dat de uitkomst zou optreden in een zeer
lange reeks observaties.
 Het gemiddelde van een verdeling wordt ook wel de verwachte waarde genoemd.
 De normale verdeling heeft een grafiek die een symmetrische, klokvormige curve is. Het kent het
gemiddelde µ en standaarddeviatie σ . Voor elke z is de kans die binnen z standaarddeviaties van het
gemiddelde valt hetzelfde voor elke normale verdeling.
 In een verdeling is de formule voor een z-score:
( y −µ)
Z=
σ
Deze z-score meet het aantal standaarddeviaties dat y af ligt van het populatiegemiddelde µ. Voor een
normale verdeling hebben de z-scores de standaard normale verdeling, die gemiddelde = 0 en
standaarddeviatie = 1 heeft. Dus aan de hand van het berekenen van z-scores, kan een normale verdeling
omgezet worden naar een standaard normale verdeling, waarvan we alle kansen al kennen (tabel A).
 Een steekproevenverdeling is een kansverdeling voor de mogelijke waarden van een steekproefstatistiek.
Het bepaalt de waarschijnlijkheid dat een statistiek binnen een bepaalde afstand van een
populatieparameter valt.
 De standaarddeviatie van een steekproevenverdeling wordt de standaardfout genoemd.
 De centrale limietstelling stelt dat voor een grote willekeurige steekproef van een variabele, de
steekproefverdeling van het steekproefgemiddelde ongeveer een normale verdeling is.

HOOFDSTUK 5: Statistical Inference ; Estimation
5.1 Punt- en intervalschatters
We kunnen dus steekproefgegevens gebruiken om populatiegegevens te schatten. Er zijn twee typen om deze
gegevens te schatten:
 Puntschatter = een enkel nummer dat onze beste gok van de populatie parameter is.
De term schatter wordt vaak als korte term gebruik voor het woord puntschatter.
 Intervalschatter = een interval van getallen rondom de puntschatting die volgens ons de parameterwaarde
bevat.  dit interval wordt ook wel het betrouwbaarheidsinterval genoemd.

De puntschatter
Puntschatters zijn de meest gebruikte statistische ‘conclusies’ die gebruikt worden in de media. Het is een
schatter en geen parameter, omdat de uitspraak gebaseerd is op een steekproef en niet op een gehele
populatie.
Voor elke populatie parameter bestaan er meerdere puntschatters. Zo kent een normale verdeling een
mediaan en een gemiddelde. Dit zijn twee mogelijke schatters voor de populatiemediaan en het
populatiegemiddelde.

, Een goede puntschatter heeft een steekproevenverdeling die:
1. Gecentreerd is rondom de parameter
Een puntschatter kan ‘unbiased’ en ‘biased’ zijn:
- ‘unbiased estimator’ = een onbevooroordeelde puntschatter
Een schatter is onbevooroordeeld als steekproevenverdeling van deze schatter zich concentreert rondom de
parameter. Het geeft dus een goed beeld van de parameter.
- ‘biased estimator’ = een bevooroordeelde puntschatter
Een schatter is bevooroordeeld als deze de neiging heeft om de parameter gemiddeld te onderschatten, of
deze gemiddeld te overschatten.
 Bv. de range van een steekproevenverdeling kan niet hoger groter zijn dan de range van een
populatie, omdat het minimum en maximum van een steekproevenverdeling niet hoger of lager
kunnen zijn dan die van een populatie.

2. Een kleine standaardfout heeft (zo klein mogelijk)
Wanneer een schatter een kleinere standaardfout heeft dan andere schatters, noemen we deze puntschatter
efficiënt. Een efficiënte schatter zou dichter bij de parameter liggen dan andere schatters.

Dus: een goede schatter is ‘unbiased’ en efficiënt.
Een voorbeeld van een goede schatter is het steekproefgemiddelde, deze wordt dan ook vaak gebruikt om een
populatie parameter te schatten. Een schatter van een parameter wordt vaak aangeduid met een dakje : “^”.

Het betrouwbaarheidsinterval
Om echt goede informatie te verschaffen, zou een uitspraak over een parameter niet alleen een puntschatter
moeten geven, maar moet ook een indicatie geven van hoe dichtbij de schatter waarschijnlijk ligt bij de
parameter die we willen vinden.
De informatie over de precisie van een puntschatting bepaalt de breedte van een intervalschatting van de
parameter. Dit bestaat uit een interval van getallen rond de puntschatting. Omdat intervalschattingen de
parameter met een zekere mate van betrouwbaarheid bevatten, worden ze betrouwbaarheidsintervallen
genoemd.
Betrouwbaarheidsinterval van een parameter = een interval van getallen waarbinnen wordt aangenomen dat
de parameter valt. De waarschijnlijkheid voor deze methode produceert een interval dat de parameter bevat,
wordt het betrouwbaarheidsniveau genoemd. Dit is een getal dat bijna één is, zoals 0,95 of 0,99 (95% of 99%).
De sleutel tot het construeren van een betrouwbaarheidsinterval is de steekproevenverdeling van de
puntschatter. Vaak is de steekproefverdeling ongeveer normaal. De normale verdeling bepaalt vervolgens de
kans dat de schatter binnen een bepaalde afstand van de parameter valt. Met een waarschijnlijkheid van
ongeveer 0,95 valt de schatter binnen twee standaardfouten. Om een betrouwbaarheidsinterval te
construeren, voegen we aan de puntschatter een veelvoud van de z-score toe van de standaardfout. Dit is de
foutenmarge : kritieke z-waarde * standaardfout

Betrouwbaarheidsinterval = puntschatter +/- foutenmarge
= puntschatter +/- (kritieke z-waarde * standaardfout)

5.2 Betrouwbaarheidsinterval voor een proportie
Om categorische data samen te vatten gebruiken we proporties of percentages van observaties van
categorieën. Elke populatie proportie geven we weer met π, deze valt tussen 0 en 1 en wordt vaak gegeven als
een breuk. De puntschatter van een proportie is steekproef proportie, wat we weergeven met π^.
De kansen van proporties zijn als volgt:
P(1) = π en P(0) = 1 – π
De standaarddeviatie van een kansverdeling van een proportie is:
σ 2=√ π ( 1−π)
Net zoals bij de standaardformule voor de standaardfout, wordt ook hier de standaardfout verkregen door de
standaarddeviatie te delen door de steekproefgrootte n :
π (1−π)
standaardfout=
√ n

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper cadeboer. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 77764 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,49  9x  verkocht
  • (2)
  Kopen