100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Colleges 'Practicum en data-analyse $7.61
Add to cart

Class notes

Colleges 'Practicum en data-analyse

 1 view  1 purchase
  • Course
  • Institution

Dit is een samenvatting van alle colleges (1 t/m 7) van practicum en data-analyse. Inclusief plaatjes en formules.

Preview 3 out of 28  pages

  • January 13, 2025
  • 28
  • 2024/2025
  • Class notes
  • Caspar j. van lissa
  • All classes
avatar-seller
Practicum data-analyse
College 1: Schatten en toetsen
Schatten = op basis van een steekproef een gok doen over een waarde in de populatie
Toetsen = vaststellen of de populatieparameter (waarschijnlijk) afwijkt van een verwachte
waarde
- Voor beiden gebruik je een steekproef/sample

Populatieparameters schatten op basis van de sample:
- Als de sample representatief is voor de populatie, dan kunnen we een ‘’geïnformeerde
gok’’ doen over populatieparameters
- Als een sample random is, dan is het meestal representatief (iedereen even grote kans
om getrokken te worden)
- Samples zijn in de praktijk zelden willekeurig, dus denk na over manieren waarop jouw
sample verschilt van de populatie en daarom wellicht een misleidend beeld geeft

Schatting
- De gemiddelde lengte in de sample (M), weten we nu exact. Hier is geen onzekerheid
over
- Dit gemiddelde is ook onze beste gok voor de gemiddelde lengte in de ‘’populatie’’ (u)
- Dit noem je een schatting
- Er is altijd onzekerheid over schattingen

Sampling error = het verschil tussen de schatting (M) en de populatieparameter (u)

Stel je voor dat je alle mogelijke steekproeven van 5 studenten uit de zaal zou trekken en voor
elke steekproef de gemiddelde lengte zou berekenen:
- Elke steekproef heeft een ander gemiddelde
- Er is een verdeling van steekproefgemiddelden
- Het gemiddelde van ALLE steekproeven is het werkelijke populatiegemiddelde
- De standaardafwijking van deze sampling distribution kan je interpreteren als ‘’de
gemiddelde afwijking van steekproefgemiddelden tov het populatiegmiddelde’’. Ofwel
‘’hoe ver zit ik er gemiddeld genomen naast als ik een steekproef trek uit deze
populatie.
- Dit heet de standard error en het is een maat van onzekerheid over je schatting

Standaardfout schatten
Probleem: we kunnen de standard error niet uitrekenen op basis van één steekproef
- Oplossing: we schatten de standard error op basis van de sample




Standaardafwijking VS standard error
Standaardafwijking
- ‘’Gemiddelde’’ afwijking van observaties t.o.v. het gemiddelde
- Geeft weer hoe gespreid je data is
- Notatie
Standard error
- ‘’Gemiddelde’’ afwijking van steekproefgemiddelden t.o.v. het populatie gemiddelde
- Geeft weer hoe onzeker we zijn over onze schatting van het populatiegemiddelde, op
basis van de steekproef
- Notatie

,Betrouwbaarheidsinterval = een ‘’venster’’ om de schatting, gebaseerd op SE, waarbinnen
de populatieparameter waarschijnlijk valt




Interpretatie
- Als je 100 identieke samples zou trekken, en voor elk een 95%
betrouwbaarheidsinterval zou berekenen, dan bevat 95% van die interval de
populatieparameter. Je weet nooit zeker of dit betrouwbaarheidsinterval de
populatiewaarde bevat of waar die valt

Je kan een betrouwbaarheidsinterval ook gebruiken om te toetsen…
- De interval bevat 95% zekerheid de populatieparameter, dus elke waarde buiten het
interval kan verworpen worden (als nulhypothese) met een foutmarge van 5%

NOIR meetniveau
1. Nominaal = categorisch, verschilt enkel in naam (mannen en vrouwen)
2. Ordinaal = categorieën met volgorde (SES groepen)
3. Interval = continu met betekenisvolle afstanden (stap 1 tot 2 is net zo groot als 2 tot 3)
4. Ratio = heeft een absoluut 0-punt en daarom zijn verhoudingen ook betekenisvol

We gebruiken toetsen wanneer we een uitspraak willen doen over de waarschijnlijke waarde
in de populatie. Omdat we geen data hebben over de gehele populatie, is het onmogelijk om
te bewijzen dat, bijvoorbeeld, het populatiegemiddelde groter is dan 0. Dus we draaien de
boel om: we tonen aan dat het heel onwaarschijnlijk is om onze data te verkrijgen, als het
populatiegemiddelde 0 zou zijn.
- Wat is de kans om data te observeren die ‘’minstens zo extreem zijn’’ als onze
steekproef, als de nulhypothese waar zou zijn dat het populatiegemiddelde 0 is?

Stappenplan toetsen
1. Hypotheses formuleren
- H0: het populatiegemiddelde van lengte is kleiner of gelijk aan
- Ha: het populatiegemiddelde van lengte is groter dan 0
2. Test-statistiek berekenen
- Deze beschrijft hoeveel standaarderrors het steekproefgemiddelde afligt van het
gemiddelde onder de nulhypothese
3. P-waarde uitrekenen (kans op deze data of nog extremer, als H0 waar is)
4. Conclusie trekken over nulhypothese

Hypothese = een toetsbare verwachting over een populatieparameter
- Ha: alternatieve hypothese = wat we denken dat er echt aan de hand is
- H0: nulhypothese = dat er ‘’niets aan de hand is’’
- We proberen de nulhypothese t verwerpen

Non-directionele/ongerichte hypothese
- H0: het gemiddelde van mannen en vrouwen verschilt niet
- Ha: het gemiddelde van mannen en vrouwen verschilt
Directionele/gerichte hypothese
- H0: het gemiddelde van mannen is gelijk of kleiner dan het gemiddelde van vrouwen
- Ha: het gemiddelde van mannen is groter dan het gemiddelde van vrouwen

, Teststatistiek = een waarde die aangeeft hoeveel SE’s je geobserveerde data afliggen van
de verwachting onder de nulhypothese




De standaardfout is



Dan kijken we hoe ‘’ver’’ onze geobserveerde steekproefgemiddelde (M) is t.o.v. de
nulhypothese:




Wanneer we vinden dat de kans op de data onder de nulhypothese zo klein is, dat we H0
kunnen verwerpen?
- We moeten een drempelwaarde afspreken. Als de kans (p-waarde) kleiner is dan deze
drempelwaarde verwerpen we H0
 Significantieniveau (alfa)

De drempel waarde voor het verwerpen van H0 noemen we alfa. In de sociale wetenschappen
hanteren we meestal alfa = .05.

Bij een non-directionele hypothese is alfa = .05 verdeeld over beide staarten van de sampling
distribution.




Bij een directionele hypothese ligt alfa = .05 volledig in één staart van de sampling
distribution.




Met een eenzijdige toets heb je meer power om een nulhypothese te verwerpen als het effect
in de verwachtte richting is. Je hebt echter geen power om de nulhypothese te verwerpen bij
een effect in de omgekeerde richting.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller eviedonk. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $7.61. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

59063 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling
$7.61  1x  sold
  • (0)
Add to cart
Added