Samenvatting Statistiek 3, Klinische Leerlijn VU (Tentamencijfer (9,5)
25 vues 0 fois vendu
Cours
Statistiek 3 (P_BSTAT3KL)
Établissement
Vrije Universiteit Amsterdam (VU)
Book
Applied Statistics II - International Student Edition
Met behulp van deze samenvatting en de samenvatting van statistiek 2 heb ik een 9,5 behaald op het tentamen. Deze samenvatting bevat alle nieuwe informatie die wordt gebracht in statistiek 3. De samenvatting van statistiek 2 bevat betere informatie over de onderwerpen die in statistiek 3 alleen her...
Week 1
Lecture 1
Statistiek is de wetenschap van het verzamelen, organiseren en interpreteren van numerieke feiten,
dat data wordt genoemd. Dit bestaat uiteindelijk uit een paar stappen.
- Er moet data verzameld worden uit een populatie.
- Er moet besloten worden of een steekproef representatief is.
- Beschrijvende of inferentiele statistiek.
- Het meetniveau en de type variabele moet bepaald worden.
- De juiste statistische analyse moet gekozen worden.
- Aan de hand van de experimentele of het non-experimentele design wordt er een verband gezocht.
Statistiek is gebaseerd op verschillende methodes voor het analyseren en verzamelen van data. Hier
kan gelet worden op:
- Het design
- Wat het beschrijft
- Inferenties maken
De beschrijvende statistiek doet vooral aan het samenvatten van data, zoals door gemiddeldes,
tabellen en figuren te gebruiken. Er moet wel altijd goed gekeken worden naar de data, door een
snelle blik kunnen eventuele fouten al zichtbaar worden, zoals de verdeling man/vrouw. Iemand
moet dan voorzichtig zijn met het doen van uitspraken.
Inferentiële statistiek (inductief) is de statistiek die voorspellingen probeert te doen aan de hand van
de data. Men probeert de uitkomsten van de steekproef te generaliseren over de doelpopulatie, dit
brengt enige onzekerheid met zich mee. Tijdens de statistiek probeert men ook rekening te houden
met die onzekerheid.
Onderzoek doen gebeurt op basis van data, dit wordt gewonnen door observaties en
karakteristieken. Een populatie is de totale groep mensen die relevant zijn voor een
onderzoeksvraag. Een sample is de groep mensen waar de data van verzameld wordt.
Betrouwbaarheid van data komt voor als er uit verschillende metingen ongeveer dezelfde uitkomst
komt, de uitkomsten zijn enigszins consistent. De uitkomsten zijn betrouwbaar. Een grotere
steekproef leidt vaak tot een grotere betrouwbaarheid. De betrouwbaarheid is gerelateerd aan de
precisie van het onderzoek.
Validiteit geeft aan in welke mate je steekproef representatief is voor de populatie. Mensen moeten
bijvoorbeeld random gekozen zijn. Men moet nagaan of het gene dat gemeten wordt, ook echt
representatief is voor het construct dat men wil meten. De validiteit is gerelateerd aan de bias van
het onderzoek.
Er kunnen verschillende meetniveau`s worden onderscheiden:
- Nominaal: Dit is vooral categoriseren, er is een identiteit. De categorieen moeten arbitrair zijn. De
categorieen zijn wederzijds uitsluitend, zo kan iemand bijvoorbeeld alleen maar in één categorie
geplaatst worden. Zo is iemand man of vrouw, iemand is het één of het ander
- Ordinaal: Dit is een natuurlijke rangorde van laag naar hoog in één dimensie. Er is sprake van
,transitiviteit, er kunnen aannames gemaakt worden op basis van de rangorde. Als je weet dat 0<1 en
1<2, dan weet je ook dat 0<2.
- Interval: Er is een gelijke ruimte tussen verschillende schaalpunten, kwantiteit. Verschillen tussen
mensen kunnen gegeven worden in bepaalde meeteenheden met gelijke intervallen. Deze
meeteenheden zijn vaak universeel geaccepteerd. Ook zijn de meeteenheden vaak deelbaar en
kunnen in andere eenheden worden omgezet, zoals van centimeter naar meter. Er is hier wel sprake
van een relatief nulpunt, hier betekent de nul niet dat er niks is, zo kan het -5 graden celsius zijn en
betekent het bij 0 graden dat water bevriest.
- Ratio: Er is een absoluut nulpunt, er is dan een afwezigheid van de eigenschap. Bij nul is er niks, als
de afgelegde afstand nul is betekent dit dat iets niet is verplaatst. Dit komt in de psychologie
nauwlijks voor, de eigenschappen van mensen zijn vaak beschreven in een spectrum. Zo is de
eigenschap extraversie of intelligentie ook onderdeel van een spectrum, deze is nooit helemaal nul.
De nominale en ordinale variabelen gaat over categorische variabele, de ene is ongeordend en de
ander is geordend. De interval en ratio variabelen vallen onder de kwantitatieve variabelen.
Een range kan dicreet of continu zijn, iets dat discreet is bestaat uit eenheden die ondeelbaar zijn.
Continue variabelen zijn oneindig deelbaar en zijn daarom vaak kommagetallen.
Er kunnen verschillende centrummaten worden onderscheiden:
- Gemiddeld
- Modus
- Mediaan
Het gemiddelde is niet altijd even representatief. Bij scheve verdelingen, zoals inkomen, geeft het
gemiddelde vaak een vertekend beeld. Men kan dan gebruikmaken van de modus of de mediaan.
Het gemiddelde is wel altijd het middelpunt van een weegschaal, als elk datapunt even zwaar
meeweegt.
De modus is het meest voorkomende getal in je dataset. Het kan in elk type data gebruikt worden.
De mediaan is het middelste getal in een geordende reeks. Bij een oneven reeksaantal is dit letterlijk
het middelste getal. Bij een even reeksaantal is dit de middelste twee waarden bij elkaar opgeteld
delen door 2. De mediaan is fijner in gebruik bij een skewed verdeling en kan gebruikt worden op
ordinaal niveau.
De spreiding van de data kan weergegeven worden met de:
- Standaarddeviatie
- Variantie
- Inter kwartielafstand
, Een percentielscore wordt vaak gebruikt en geeft een bepaalde frequentie weer in groepjes van
gelijke grootte. Een percentielscore geeft aan hoeveel procent van de onderzochte groep onder of op
een bepaalde waarde zit. Het geeft dus informatie over de positie van een specifiek datapunt, ten
opzichte van de andere datapunten.
Hier kan uit afgelezen worden hoeveel procent onder of boven een bepaalde score zit. Het gaat hier
wel altijd om niet-lineaire transformaties.
De percentielscores kunnen verdeeld worden in groepen. Zo is P1 het eerste percentiel en heeft 99%
hetzelfde of hoger gescoord dan jijzelf en P50 is de mediaan. Stel dat iemand P40 haalt, dan zal 40%
een lagere score of dezelfde score halen dan deze persoon. Als je wilt weten hoeveel procent hoger
heeft gescoord, is dit wel dezelfde score of hoger.
P25 en P75 worden ook wel genoteerd als Q1 en Q3. De afstand hiertussen wordt de inter
kwartielafstand genoemd en bevat 50% van je data. De inter kwartieafstand is niet gevoelig voor
outliers, het gaat puur om de positie van je data. De Q2 scheidt 50% van de data aan weerszijde en is
hetzelfde als de mediaan.
Het doel is altijd om de uitkomst van de steekproef zo dicht mogelijk te laten komen bij de
parameter. De steekproef zou in het ideale geval niet moeten verschillen van de populatie om een
goede conclusie te kunnen trekken. Er zijn alleen wel veel voorkomende problemen:
- Steekproeffout (sampling error): Puur toevallige steekproefvariatie, dit ontstaat vaak tussen
verschillende steekproeven. Dit kan men verkleinen door een grotere steekproef te nemen. De
uitkomst van de steekproef is in dat geval niet representatief voor de populatie, maar een
uitzondering. Sampling error = gevonden uitslag – parameter. Bij grotere steekproeven is de margin
error vaak kleiner, de veiligheidsmarge tussen de gevonden data en de parameter.
- Steekproefvertekening (sampling bias): Als er selectief proefpersonen worden getrokken,
proefpersonen hebben dan niet allemaal een even grote kans om gekozen te worden.
- Meetfout (response bias): Meetfouten door verkeerde instrumenten of een slechte vragenlijst. Dit
kan komen door onduidelijke vragen of er wordt niet gemeten wat men wil meten.
- Selectieve respons (non-response bias): Niet iedereen doet even goed mee, dit geeft een
vertekenend beeld van de steekproef. Sommige dingen worden bijvoorbeeld niet gedaan of niet
ingevuld.
Error gaat over problemen met de betrouwbaarheid en de bias gaat over problemen met de
validiteit.
Oplossingen zijn aselecte steekproeven, dit kan bijvoorbeeld gedaan worden door oversampling in
de eerste instantie. Je gaat er dan al een beetje van uit dat een groot deel niet komt opdagen.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur davyhickmann. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €7,48. Vous n'êtes lié à rien après votre achat.