100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Statistiek 3, Klinische Leerlijn VU (Tentamencijfer (9,5) $8.18   Add to cart

Summary

Samenvatting Statistiek 3, Klinische Leerlijn VU (Tentamencijfer (9,5)

 25 views  0 purchase
  • Course
  • Institution
  • Book

Met behulp van deze samenvatting en de samenvatting van statistiek 2 heb ik een 9,5 behaald op het tentamen. Deze samenvatting bevat alle nieuwe informatie die wordt gebracht in statistiek 3. De samenvatting van statistiek 2 bevat betere informatie over de onderwerpen die in statistiek 3 alleen her...

[Show more]

Preview 3 out of 29  pages

  • No
  • Alle hoofdstukken die nodig waren voor het tentamen
  • March 11, 2024
  • 29
  • 2022/2023
  • Summary
avatar-seller
Week 1
Lecture 1
Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van numerieke feiten,
dat data wordt genoemd. Dit bestaat uiteindelijk uit een paar stappen.
- Er moet data verzameld worden uit een populatie.
- Er moet besloten worden of een steekproef representatief is.
- Beschrijvende of inferentiele statistiek.
- Het meetniveau en de type variabele moet bepaald worden.
- De juiste statistische analyse moet gekozen worden.
- Aan de hand van de experimentele of het non-experimentele design wordt er een verband gezocht.

Statistiek is gebaseerd op verschillende methodes voor het analyseren en verzamelen van data. Hier
kan gelet worden op:
- Het design
- Wat het beschrijft
- Inferenties maken

De beschrijvende statistiek doet vooral aan het samenvatten van data, zoals door gemiddeldes,
tabellen en figuren te gebruiken. Er moet wel altijd goed gekeken worden naar de data, door een
snelle blik kunnen eventuele fouten al zichtbaar worden, zoals de verdeling man/vrouw. Iemand
moet dan voorzichtig zijn met het doen van uitspraken.
Inferentiële statistiek (inductief) is de statistiek die voorspellingen probeert te doen aan de hand van
de data. Men probeert de uitkomsten van de steekproef te generaliseren over de doelpopulatie, dit
brengt enige onzekerheid met zich mee. Tijdens de statistiek probeert men ook rekening te houden
met die onzekerheid.

Onderzoek doen gebeurt op basis van data, dit wordt gewonnen door observaties en
karakteristieken. Een populatie is de totale groep mensen die relevant zijn voor een
onderzoeksvraag. Een sample is de groep mensen waar de data van verzameld wordt.

Betrouwbaarheid van data komt voor als er uit verschillende metingen ongeveer dezelfde uitkomst
komt, de uitkomsten zijn enigszins consistent. De uitkomsten zijn betrouwbaar. Een grotere
steekproef leidt vaak tot een grotere betrouwbaarheid. De betrouwbaarheid is gerelateerd aan de
precisie van het onderzoek.
Validiteit geeft aan in welke mate je steekproef representatief is voor de populatie. Mensen moeten
bijvoorbeeld random gekozen zijn. Men moet nagaan of het gene dat gemeten wordt, ook echt
representatief is voor het construct dat men wil meten. De validiteit is gerelateerd aan de bias van
het onderzoek.




Er kunnen verschillende meetniveau`s worden onderscheiden:
- Nominaal: Dit is vooral categoriseren, er is een identiteit. De categorieen moeten arbitrair zijn. De
categorieen zijn wederzijds uitsluitend, zo kan iemand bijvoorbeeld alleen maar in één categorie
geplaatst worden. Zo is iemand man of vrouw, iemand is het één of het ander
- Ordinaal: Dit is een natuurlijke rangorde van laag naar hoog in één dimensie. Er is sprake van

,transitiviteit, er kunnen aannames gemaakt worden op basis van de rangorde. Als je weet dat 0<1 en
1<2, dan weet je ook dat 0<2.
- Interval: Er is een gelijke ruimte tussen verschillende schaalpunten, kwantiteit. Verschillen tussen
mensen kunnen gegeven worden in bepaalde meeteenheden met gelijke intervallen. Deze
meeteenheden zijn vaak universeel geaccepteerd. Ook zijn de meeteenheden vaak deelbaar en
kunnen in andere eenheden worden omgezet, zoals van centimeter naar meter. Er is hier wel sprake
van een relatief nulpunt, hier betekent de nul niet dat er niks is, zo kan het -5 graden celsius zijn en
betekent het bij 0 graden dat water bevriest.
- Ratio: Er is een absoluut nulpunt, er is dan een afwezigheid van de eigenschap. Bij nul is er niks, als
de afgelegde afstand nul is betekent dit dat iets niet is verplaatst. Dit komt in de psychologie
nauwlijks voor, de eigenschappen van mensen zijn vaak beschreven in een spectrum. Zo is de
eigenschap extraversie of intelligentie ook onderdeel van een spectrum, deze is nooit helemaal nul.




De nominale en ordinale variabelen gaat over categorische variabele, de ene is ongeordend en de
ander is geordend. De interval en ratio variabelen vallen onder de kwantitatieve variabelen.

Een range kan dicreet of continu zijn, iets dat discreet is bestaat uit eenheden die ondeelbaar zijn.
Continue variabelen zijn oneindig deelbaar en zijn daarom vaak kommagetallen.

Er kunnen verschillende centrummaten worden onderscheiden:
- Gemiddeld
- Modus
- Mediaan
Het gemiddelde is niet altijd even representatief. Bij scheve verdelingen, zoals inkomen, geeft het
gemiddelde vaak een vertekend beeld. Men kan dan gebruikmaken van de modus of de mediaan.
Het gemiddelde is wel altijd het middelpunt van een weegschaal, als elk datapunt even zwaar
meeweegt.
De modus is het meest voorkomende getal in je dataset. Het kan in elk type data gebruikt worden.
De mediaan is het middelste getal in een geordende reeks. Bij een oneven reeksaantal is dit letterlijk
het middelste getal. Bij een even reeksaantal is dit de middelste twee waarden bij elkaar opgeteld
delen door 2. De mediaan is fijner in gebruik bij een skewed verdeling en kan gebruikt worden op
ordinaal niveau.




De spreiding van de data kan weergegeven worden met de:
- Standaarddeviatie
- Variantie
- Inter kwartielafstand

, Een percentielscore wordt vaak gebruikt en geeft een bepaalde frequentie weer in groepjes van
gelijke grootte. Een percentielscore geeft aan hoeveel procent van de onderzochte groep onder of op
een bepaalde waarde zit. Het geeft dus informatie over de positie van een specifiek datapunt, ten
opzichte van de andere datapunten.
Hier kan uit afgelezen worden hoeveel procent onder of boven een bepaalde score zit. Het gaat hier
wel altijd om niet-lineaire transformaties.
De percentielscores kunnen verdeeld worden in groepen. Zo is P1 het eerste percentiel en heeft 99%
hetzelfde of hoger gescoord dan jijzelf en P50 is de mediaan. Stel dat iemand P40 haalt, dan zal 40%
een lagere score of dezelfde score halen dan deze persoon. Als je wilt weten hoeveel procent hoger
heeft gescoord, is dit wel dezelfde score of hoger.
P25 en P75 worden ook wel genoteerd als Q1 en Q3. De afstand hiertussen wordt de inter
kwartielafstand genoemd en bevat 50% van je data. De inter kwartieafstand is niet gevoelig voor
outliers, het gaat puur om de positie van je data. De Q2 scheidt 50% van de data aan weerszijde en is
hetzelfde als de mediaan.




Het doel is altijd om de uitkomst van de steekproef zo dicht mogelijk te laten komen bij de
parameter. De steekproef zou in het ideale geval niet moeten verschillen van de populatie om een
goede conclusie te kunnen trekken. Er zijn alleen wel veel voorkomende problemen:
- Steekproeffout (sampling error): Puur toevallige steekproefvariatie, dit ontstaat vaak tussen
verschillende steekproeven. Dit kan men verkleinen door een grotere steekproef te nemen. De
uitkomst van de steekproef is in dat geval niet representatief voor de populatie, maar een
uitzondering. Sampling error = gevonden uitslag – parameter. Bij grotere steekproeven is de margin
error vaak kleiner, de veiligheidsmarge tussen de gevonden data en de parameter.
- Steekproefvertekening (sampling bias): Als er selectief proefpersonen worden getrokken,
proefpersonen hebben dan niet allemaal een even grote kans om gekozen te worden.
- Meetfout (response bias): Meetfouten door verkeerde instrumenten of een slechte vragenlijst. Dit
kan komen door onduidelijke vragen of er wordt niet gemeten wat men wil meten.
- Selectieve respons (non-response bias): Niet iedereen doet even goed mee, dit geeft een
vertekenend beeld van de steekproef. Sommige dingen worden bijvoorbeeld niet gedaan of niet
ingevuld.

Error gaat over problemen met de betrouwbaarheid en de bias gaat over problemen met de
validiteit.

Oplossingen zijn aselecte steekproeven, dit kan bijvoorbeeld gedaan worden door oversampling in
de eerste instantie. Je gaat er dan al een beetje van uit dat een groot deel niet komt opdagen.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller davyhickmann. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.18. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

80364 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$8.18
  • (0)
  Add to cart