100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Inleiding Statistiek €6,99   In winkelwagen

Samenvatting

Samenvatting Inleiding Statistiek

1 beoordeling
 59 keer bekeken  1 keer verkocht

In deze samenvatting staat alle theorie en formules die je moet kennen voor het tentamen. Bij iedere formule zijn ook voorbeelden van de colleges toegevoegd om te laten zien hoe je deze moet toepassen.

Voorbeeld 4 van de 33  pagina's

  • 25 mei 2023
  • 33
  • 2022/2023
  • Samenvatting
Alle documenten voor dit vak (25)

1  beoordeling

review-writer-avatar

Door: Evelienneleman • 9 maanden geleden

avatar-seller
terraarends
H1 Introductie tot de statistiek
1.1 Statistiek, wetenschap en observaties

De term statistiek wordt gebruikt om te verwijzen naar methoden voor het organiseren,
samenvatten en interpreteren van informatie (data). Statistiek dient voor:
• Het organiseren en samenvatten van informatie zodat de onderzoeker kan zien wat
er gebeurt in het onderzoek en het kan door communiceren naar anderen.
• Het helpen van de onderzoeker om onderzoeksvragen te beantwoorden door een
conclusie te trekken op de verkregen resultaten.

Een populatie is een set aan individuen waarin een
desbetreffend onderzoek geïnteresseerd in is. Doordat
een populatie vaak erg groot is, gebruiken onderzoekers
vaak steekproeven om informatie te verkrijgen over de
populatie. Een steekproef is een set individuen die
geselecteerd zijn van de populatie en deze dus ook
representeren.

Data zijn metingen of observaties. Een dataset is een
collectie van metingen of observaties. Een datum is een
enkele meting of observatie en wordt meestal een score
of een ruwe score genoemd.

Een parameter is een (numerieke) waarde die een populatie beschrijft. Deze wordt vaak
afgeleid van metingen van de individuelen in de populatie. Een statistiek is een (numerieke)
waarde, die een sample beschrijft. Deze wordt vaak afgeleid van metingen van de
individuelen in de sample. Het natuurlijk voorkomende verschil (discrepantie) tussen een
statistiek en een parameter wordt een steekproeffout genoemd.

Er zijn twee soorten statistiek:
1. Beschrijvende statistiek = wordt gebruikt voor het beschrijven van data en gaat vaak
via samenvattende statistieken, zoals modus, mediaan, gemiddelde etc.
2. Inferentiële statistiek = wordt gebruikt om op basis van data inferenties
(gevolgtrekking) te maken van de steekproef naar de populatie.

1.2 Data structuren, onderzoeksmethoden en statistieken

Correlationele methode = methode waarbij twee variabelen worden onderzocht om te kijken
of er een relatie tussen de twee is. Het gaat dus niet over oorzaak-gevolg.

Experimentele methode = methode waarbij een oorzaak-gevolg wordt onderzocht tussen
variabelen. De onafhankelijke variabele wordt hierbij gemanipuleerd en de afhankelijke
variabele wordt gemeten. Om vast te stellen dat er een echt oorzaak-gevolgverband is,
voegen onderzoekers vaak controlecondities toe waarbij de onderzochten geen behandeling
krijgen of een placebo. Deze controlegroep kan worden vergeleken met de experimentele
conditie voor het aantonen van een echt effect.

In een niet-experimentele studie kan een onderzoeker de deelnemers niet aan groepen
toewijzen en dus ook niet aan levels van de variabelen. In zulke niet-experimentele studies
wordt de onafhankelijke variabele, die wordt gebruikt om de groepsverschillen van de scores
aan te tonen, vaak quasi-afhankelijke variabele genoemd.

,1.3 Variabelen en metingen

Constructen zijn interne attributen of kenmerken die niet direct kunnen worden
waargenomen, maar die nuttig zijn voor het beschrijven en verklaren van gedrag. Om een
construct te kunnen meten wordt deze geoperationaliseerd. Een operationele definitie is een
meetprocedure die gedrag kan meten waarna de resultaten van dit gedrag het construct
representeren.

De twee soorten variabelen:
• Discrete variabele = variabele die uit een beperkt aantal categorieën bestaan. Deze
categorische waarden zijn niet deelbaar. Zo kan er bv. geen waarde bestaan tussen
1 of 2 huisdieren.
• Continue variabele = variabele die alle waarden tussen punten kunnen aannemen.
Een waarde van een continue variabele is een interval, denk bv. aan lengte. De
grenzen die intervallen van elkaar scheiden, worden echte limieten genoemd. Elke
score heeft twee echte limieten. De bovenste reële limiet bevindt zich bovenaan het
interval en de onderste reële limiet bevindt zich onderaan.

De soorten meetniveaus:
• Nominaal = geeft onderscheid tussen categorieën.
• Ordinaal = geeft onderscheid en geeft een volgorde aan.
• Interval = geeft onderscheid, geeft volgorde aan en bestaat uit even grote
intervallen tussen de waardes.
• Ratio = geeft onderscheid, geeft volgorde aan, heeft even grote intervallen en heeft
een nulpunt.

1.4 Statistische notaties
Zie bijlage

H2 Frequentie distributies
2.1 2.1 Frequentieverdelingen en frequentietabellen

Het doel van beschrijvende statistieken is om de organisatie en presentatie van gegevens te
vereenvoudigen. Een beschrijvende techniek is om de gegevens in een
frequentieverdelingstabel of -grafiek te plaatsen die precies laat zien hoeveel individuen (of
scores) zich in elke categorie op de meetschaal bevinden. Een frequentieverdelingstabel
somt de categorieën op die de meetschaal vormen in één kolom. Dit wordt vaak aangeduid
als de X-waarde (zoals hier links onder te zien is). Naast elke X-waarde, in een tweede
kolom, staat de frequentie of het aantal personen in die categorie. Hieronder zijn twee
voorbeelden weergeven hoe zulke tabellen eruit kunnen zien.




Wanneer sprake is van een grote N is het handig om proporties te berekenen in de
frequentietabel. Om de proportie te berekenen deel je de frequenties door het aantal
mensen. Ook kan je in een frequentietabel de percentages van de proporties zetten. Dit doe
je door dezelfde som uit te rekenen, maar dan maal 100.

,2.2 Gegroepeerde frequentieverdelingstabel

Bij discrete variabelen is zo’n bovenstaande tabel erg handig, maar bij continue variabelen is
dit minder handig doordat bepaalde waardes minder vaak voorkomen. Denk bv. aan
inkomen; dit verschilt heel erg van persoon tot persoon. Een oplossing hiervoor zijn
gegroepeerde frequentieverdelingen. Hierbij worden enkele waarde bereiken samen
gebundeld. Hieronder staat een voorbeeld weergeven van zo’n verdeling die gaat over
inkomen.




Er zijn een aantal richtlijnen voor het maken van een goede gegroepeerde
frequentieverdeling (ofwel class intervals):
1. Gebruik ongeveer 10 class intervals.
2. De wijdte van iedere class interval moet een simpel getal zijn, dus geen decimalen.
3. De vloerscore moet beginnen met een tiental. Bijvoorbeeld als je vloerscore 12 is,
begint de tabel met 10.
4. Alle intervallen moeten dezelfde wijdte hebben, er moeten geen gaten vallen of
overlappingen zijn.

2.3 Frequentieverdelingsgrafiek

Een frequentietabel kan worden omgezet naar een frequentiegrafiek. Een grafiek biedt een
makkelijke weergave van de data. Belangrijk is dat de intersectie van de assen van de
grafiek bij 0 moet starten en de grafiek moet zodanig worden weergegeven dat de hoogte (y-
as) ongeveer twee derde tot driekwart van de lengte (x-as) zijn, anders kan de afbeelding
een vertekend beeld geven. Er zijn twee soorten grafieken voor interval- en ratio data:
• Histogram = voor het creëren moet je eerst de numerieke scores op de x-as plaatsen.
Hierboven teken je balken boven de waarden van x. De hoogte van de balken
corresponderen met de frequentie in die categorie. Voor continue variabelen strekt de
breedte van de balk zich uit tot de werkelijke limieten van de categorie. Voor discrete
variabelen strekt elke balk zich precies uit over de helft van de afstand tot de
aangrenzende categorie aan elke kant (zie afbeelding). Een aangepaste histogram
gebruikt blokjes om de waardes weer te geven, dit maakt het erg makkelijk om de
waarde af te lezen. Hierdoor is er ook geen y-as meer nodig.




• Polygon = voor het creëren van een polygon start je met de numerieke scores op de
x-as te plaatsen. Hierna plaats je punten die corresponderen met de frequenties,
waarna je een lijn trekt door alle punten. Als laatste verbind je het eerste en laatste
punt met de grafiek door een lijn te trekken vanaf de punten aansluitend op de x-as.
Deze aansluitingen moeten overeenkomen met de laagste en hoogste score.

, Staafgrafieken = kan worden gebruikt voor nominale of ordinale data. Dit is hetzelfde als een
histogram, behalve dat er ruimte tussen de balken zit. Dit geeft bij een nominale schaal aan
dat het aparte categorieën zijn en bij een ordinale schaal dat de categorieën even groot zijn.




Relatieve frequenties = worden vaak gebruikt als de grafiek betrekking heeft tot grote
populaties. Hierbij geef je aan of iets hoger of lager is, afhankelijk van het verschil. Dit kan in
de vorm van een staafdiagram worden aangegeven, zoals in de middelste afbeelding
hierboven.
Wanneer een populatie bestaat uit numerieke scores van een interval- of ratioschaal, wordt
vaak een smooth curve gebruikt. Je verbindt hierbij geen puntjes (exacte scores), maar laat
de relatieve verandering tussen scores zien. Dit zie je vaak bij een normaalverdeling; vaak
zal gerefereerd worden aan een verdeling van scores.

Bij een grafiek wordt vaak naar drie dingen gekeken: vorm, centrale neiging en variabiliteit.
Voor de vorm kun je naar verschillende dingenkijken. In een symmetrische verdeling kun je
een verticale lijn door het midden tekenen, op zo’n manier dat de ene helft een spiegeling is
van de ander (zie de normaal verdeling rechtsboven). In een skewed verdeling hebben de
scores de neiging om aan één kant van de schaal te gaan zitten (denk aan vloer- en
plafondeffecten). Het gedeelte waar de scores afnemen is de tail of the distribution. Een
verdeling met de tail rechts is positively skewed, omdat de tail naar het positieve gedeelte
(boven 0) van de x-as komt. Als de tail aan de linkerkant zit, is het negatively skewed.

2.4 Percentielen, percentielrangschikkingen en interpolatie

Percentielen en percentielrangschikkingen worden gebruikt om de positie van individuele
scores binnen een verdeling aan te geven. Percentielrang geeft het cumulatieve percentage
weer dat aan een bepaalde score is gekoppeld. Een score die wordt geïdentificeerd door zijn
rang, wordt een percentiel genoemd.

Het uitrekenen van een percentielrang kan door het cumulatief percentage te berekenen.
Hierbij doe je hetzelfde als bij percentage uitrekenen, maar tel je alles hierna cumulatief bij
elkaar op. Hoe lees je een percentielrank/percentage en percentiel af? Stel je wilt deze
gegevens weten van 3x dan is de percentielrank/percentage 95.17%. Het percentiel is hierbij
dan het 95e percentiel.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper terraarends. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 73918 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€6,99  1x  verkocht
  • (1)
  Kopen