100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Hoofdstuk 2 - Discovering Statistics - Andy Field $4.31   Add to cart

Summary

Samenvatting Hoofdstuk 2 - Discovering Statistics - Andy Field

 15 views  0 purchase
  • Course
  • Institution
  • Book

Hoofdstuk 2 van Discovering Statistics, the SPINE of statistics. Samenvatting in het Nederlands

Preview 2 out of 6  pages

  • No
  • H2
  • January 7, 2023
  • 6
  • 2022/2023
  • Summary
avatar-seller
Discovering statistics using IBM SPSS statistics – Andy Field
Samenvatting van Rianne Weijts – Erasmus Universiteit Rotterdam


CHAPTER 2: THE SPINE OF STATISTICS


De meeste statistische modellen zijn een variatie op het idee van het voorspellen van een uitkomst van
één of meer voorspellende variabelen. Verder hebben de meeste statische modellen een aantal dingen
gemeen en als je dat begrijpt ben je al een heel eind, de SPINE van statistiek.
S: standaard error
P: parameters
I: Interval estimates (betrouwbaarheids interval)
N: Null hypothesis significance tests
E: Estimation (schatting)

2.3 Statistical Models
Wetenschappers gebruiken over het algemeen een lineair model, een model gebaseerd op een rechte
lijn. Het statistische model zou de verzamelde data zo goed mogelijk moeten representeren. De mate
waarin een statistisch model de data representeert wordt ook wel de fit van het model genoemd.

In principe zijn alle statistische modellen terug te brengen tot één
simpele vergelijking. Deze vergelijking houdt in dat de data die
we observeren voorspelt kan worden door het model dat we kiezen plus een bepaalde hoeveelheid
error. De kleine i refereert aan de i’de score. Het betekent dat de waarde van de uitkomst en de error
verschillend zullen zijn voor elke persoon. We voorspellen een uitkomst variabele vanuit een model,
maar zullen dit niet perfect doen dus we voegen ook wat error toe.

Een populatie kan heel breed zijn (alle mensen) of heel specifiek (alle mannelijke roodharige katten
die Bob heten). Over het algemeen kijken wetenschappers vaak naar algemene populaties. Omdat we
vaak niet iedereen in een populatie kunnen ondervragen verzamelen we data uit een deel van de
populatie, we nemen dus een sample. Dit gebruiken we vervolgens om conclusies te trekken over de
populatie in zijn geheel.

2.5 P is for Parameters
Parameters zijn niet iets wat ‘gemeten’ wordt, in tegenstelling tot variabelen, het zijn constructen
waarvan gedacht wordt dat een fundamentele waarheid beschrijven over de relaties tussen variabelen
in een model. Voorbeelden van parameters zijn de gemiddeldes (mean en mediaan), en de correlatie en
regressie coëfficiënten. Verschillende parameters krijgen vaak verschillende
namen en symbolen (X, r, b), maar het is veel simpeler om voor de
parameter altijd b te gebruiken. De onderdelen tussen de haakjes in de
vergelijking staan dus voor ‘het model’ oftewel het statistische model wat we toepassen.
We kunnen waarden van een uitkomstvariabele voorspellen op basis van een model. De vorm van het
model verandert, maar er zal altijd een fout in de voorspelling zijn en er zullen altijd parameters zijn
die ons vertellen over de shape of vorm van het model. We gebruiken de data uit het sample om de
parameters in de populatie in te schatten (parameter estimates).

, 2.5.1. The mean as a statistical model
Het gemiddelde is een hypothetische waarde, het is een model dat is
gecreëerd om de data samen te vatten en er zal altijd error zijn in deze
voorspelling. Wanneer je een vergelijking ziet met een hoedje → dan
betekent dit alleen dat dit estimates zijn die een schatting van de
populatie voorstellen.

2.5.2 Assessing the fit of a model: sums of squares and variance revisited
Het is belangrijk om te kijken hoe goed de fit van een statistisch model is, omdat we moeten weten
hoe representatief het is voor de populatie. De deviance (afwijking) is een ander woord voor error.
De error voor een specifieke entiteit is geobserveerde score – de voorspelde score.
Deze vergelijking laat zien dat we de sum of squares ook
kunnen gebruiken om de totale error in een model te bepalen.
Deze vergelijking laat zien hoe je de gemiddelde error in de
populatie kan berekenen. Hierbij gebruiken we degrees of
freedom (df), dat is het aantal scores dat is gebruikt om het
totaal te berekenen, gecorrigeerd voor het feit dat we proberen de populatiewaarde te schatten. De
mean squared error staat ook wel bekend als de variantie.

2.6 E is for estimating parameters
De vergelijking voor het gemiddelde is ontworpen om die parameter te schatten om de error te
minimaliseren. Met andere woorden, het is de waarde met de minste error. Dit betekent niet
noodzakelijkerwijs dat de waarde goed bij de gegevens past, maar het past beter dan elke andere
waarde die er mogelijk is gekozen. Hoewel de vergelijkingen voor het schatten van deze parameters
verschillen van die van het gemiddelde, zijn ze gebaseerd op dit principe van het minimaliseren van
errors: ze geven je de parameter met de minste error vanuit de data die je hebt. Dit betekent overigens
niet dat deze parameter accuraat, niet biased, of representatief is voor de populatie.

2.7 S is for standard error
Sampling variation of steekproef variatie betekent dat steekproeven variëren omdat ze verschillende
mensen uit de populatie bevatten. Een sampling distribution of steekproef distributie, is de frequentie
distributie van de steekproef gemiddelden uit dezelfde populatie. Deze distributie verteld ons iets over
hoe de steekproeven van de populatie zich gedragen en deze is gecentreerd rondom dezelfde waarde
als het gemiddelde van de populatie.
De standaarddeviatie van de steekproef gemiddelden is de standard error of the mean
(SE) of standard error. Als onze steekproef groot genoeg is (>30) kunnen we deze
vergelijking gebruiken om de standaard error te schatten. Een grote standaard error (SE) betekent dat
er veel variatie is tussen de gemiddelden van de verschillende steekproeven en het steekproef
gemiddelde is daarom wellicht niet representatief voor de populatie.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller rvw999. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $4.31. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

67096 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$4.31
  • (0)
  Add to cart