100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Collegenotities statistiek deel 2 €2,99   In winkelwagen

College aantekeningen

Collegenotities statistiek deel 2

 30 keer bekeken  1 keer verkocht
  • Vak
  • Instelling

Dit document bevat uitgebreide lesnotities van alle lessen van statistiek deel 2.

Voorbeeld 4 van de 136  pagina's

  • 2 juni 2022
  • 136
  • 2021/2022
  • College aantekeningen
  • Iven van mechelen
  • Alle colleges
avatar-seller
1. Inleiding
Goede motivering (redenering, werkwijze, veronderstellingen) is belangrijk

Recapitulatie statistiek 1:
Voorbeeld p.1:




2 dingen die je kan doen:
1. De gegevens ordenen/ samenvatten
= beschrijvend
--> Bv. Frequentiefunctie van intelligentie bepalen
2. Vanuit de 80 experimentele eenheden een populatie-uitspraak willen doen
= inductief

,P.2:
Figuur 1.1: voorbeeld van simpel geval van 1 bediende trekken uit populatie
We vertrekken van de populatie (bv. Populatie van alle mogelijke bedienden/ populatie van alle
mogelijke sollicitanten)
• We hebben een toevalsexperiment en dat betekent dat we een aantal vaste regels gaan
volgen, waarbij je bv. Eerst begint met op een bepaalde manier een trekking te doen, in dit
geval van een steekproef van n = 1 (1 bediende trekken uit de populatie van alle bedienden)
• We voeren het toevalsexperiment uit bv. Voor de bediende in kwestie het IQ bepalen --> alle
informatie die je bekomt en bijhoudt door dit toevalsexperiment uit te voeren resulteert in 1
puntje in de uitkomstenverzameling omega (verwijst naar outcome)
• Je gaat een toevalsvariabele X op de informatie loslaten, wat betekent dat je uit al de
bijgehouden informatie een stukje informatie gaat uitplukken
--> om hier straks kansuitspraken over te kunnen doen, heb je nood aan een statistisch model
= veronderstellingen over de kansmassa/dichtheidsfunctie van die toevalsvariabele in kwestie
--> als de toevalsvariabele discreet moet zijn, dan moet je voor elke waarde aangeven hoe
groot de kans is dat die optreedt --> de kansmassafunctie/ pi x gaat weergeven hoe groot bv.
De kans is om een IQ te hebben van 110?
--> als de toevalsvariabele continu moet zijn, dan krijg je een dichtheidsfunctie en die helpt je
om uitspraken te doen hoe groot de kans is om een IQ te hebben tussen bv. 110 en 120

Figuur 1.2: wat er gebeurt als je een steekproef trekt van > 1 bediende (bv. n = 80)
• In 1 punt van de uitkomstenverzameling zit dan alle informatie die we bij hebben gehouden
over de 80 bedienden (bv. Deelscores achter een IQ, tijd die een bediende nodig had om een
intelligentietest af te werken,… --> deze informatie staat allemaal in de
uitkomstenverzameling)
• Op al deze informatie kunnen we dan 80 toevalsvariabelen loslaten, waarbij uit al de
informatie die er beschikbaar is over de bedienden, bv. x4 er het IQ van de 4e bediende eruit
plukt
• Wat er dan in het 2e venndiagram staat Rn = dat betekent hier geordende 80tallen --> wat er
dan als eindpunt van zo'n pijl staat in dit venndiagram is niets anders als de eerste kolom die
we voordien hebben getekend --> deze 80 getallen is dan 1 geordend 80tal en dat zou dan 1
punt zijn in dat venndiagram




• Als we nu een uitspraak willen doen over het gemiddelde IQ in de populatie, dan gaan we
gebruik maken van de gegevens die je hebt in Rn --> je laat er een operatie op los bv.
Bereken het steekproefgemiddelde door de 80IQ's op te tellen en dan krijg je R
--> als je die pijlen na elkaar gaat toepassen, dan krijg je X streep (dit is een statistiek, waarbij
deze statistiek alle informatie over de steekproef omzet in 1 enkel getal) --> het gaat over een
grote X streep want het gaat over een toevalsvariabele
• Voor zo'n toevalsvariabele kan je gaan kijken hoe het zit met de dichtheids- of
kansmassafunctie en deze wordt hier steekproefverdeling genoemd --> je hebt alle
mogelijke steekproeven van 80 bedienden en die worden telkens per steekproef omgezet in
een getal (namelijk gemiddeld IQ) en de kansmassafunctie die zegt bv. Hoe groot de kans is

, om die bepaalde waarde voor het gemiddelde te bekomen/ hoe groot de kans is om in dat
interval terecht te komen --> waarbij het elke keer gaat over een kansuitspraak over alle
steekproeven DUS hoe groot is de kans dat je een steekproef hebt die een gemiddelde IQ van
113.2 oplevert/ Hoe groot is de kans om een steekproef te hebben die ligt tussen de 110 en
150?


Opzet en inhoud van deel 2:
Nieuw voorbeeld:
Voorbeeld uit klinische psychologie: soort gesprekstherapie die wordt aangeboden aan depressieve
cliënten: de vraag is "haalt de therapie iets uit?"
--> groep patiënten onderwerpen aan de therapie --> voor elke patiënt de stemmingsscore na de
therapie min stemmingsscore voor de therapie doen




We kunnen dan zowel positieve, nul als negatieve uitkomsten hebben
• Als hogere waarden een positieve stemming betekenen, dan is een positieve uitkomst dat
stemming voor lager is dan stemming na --> de cliënt is er dan op vooruit gegaan
• Score 0 = 0 cliënt is hetzelfde gebleven, status quo
• Negatieve uitkomst, dan is de 1e score beter dan de 2e --> de cliënt is erop achteruit gegaan

--> je kan hier echter geen causale verklaring uit trekken, want er spelen nog andere variabelen mee
(mensen kunnen automatisch verbeteren, je weet niet of je de vooruitgang kan toeschrijven dan de
therapie)

De psychologische vraag moeten we vertalen in een statistische vraag en daarvoor hebben we een
soort canvas nodig, een soort ondergrond om op basis daarvan de inhoudelijke vraag in een
statistische vraag te vertalen
--> we gaan een uitspraak doen over het statistische model van X = we gaan een veronderstelling
maken over hoe dat de kansmassa/dichtheidsfunctie van X eruit ziet
--> we zouden kunnen kijken naar eerdere onderzoeken waarbij we de proportiefunctie in kaart
hebben gebracht en op basis daarvan zou je kunnen zeggen dat het niet zo gek is om voor de
dichtheidsfunctie van de variabele X volgende vorm te postuleren

, Het idee is dus dat de dichtheidsfunctie dit soort VORM heeft, maar het is niet helemaal
gespecifieerd --> het kan meer naar rechts of links liggen --> de plaats van de top bv. Is dus een
onbekende parameter

Dit is dus een mogelijk model voor de toevalsvariabele (hier een continue toevalsvariabele) --> we
zijn erg geïnteresseerd in waar de mu gelegen is

Stel dat je vind dat er een behoorlijk grote kans is dat de mu positief is, mogen we dan spreken van
een goede therapie?
--> mu geeft weer hoe het zit met de gemiddelde patiënt, maar wat als de patiënt niet bij dit
gemiddelde zit??
--> we willen dat de meeste patiënten vooruit gaan
• Bv. Kans van .90 om vooruit te gaan --> We kunnen naar kwantiel .10 kijken = eerste deciel --
> Als het eerste deciel positief is dan weet je dat de kans dat de patiënt vooruit gaan,
minstens 90% is --> de kans om onder het kwantiel .10 te zitten = 10% en je weet dat de 90%
positief zijn, dan gaat minstens 90% vooruit als het kwantiel .10 positief zou zijn

We laten dat eerste deciel even voor wat het is en werken verder met mu
De vraag "haalt de therapie iets uit?" kan je op 2 mogelijke manieren vertalen:
1. Ik wil mu kennen --> mu is een karakteristiek op niveau van de populatie en de populatie in
zijn geheel kennen gaat niet --> we moeten dus een schatting maken --> we gaan mu
schatten en hopen dat die positief is
2. We kunnen ook vertrekken vanuit een veronderstelling (bv. Ik ben een farmaceut en ben
pessimistisch over die therapie, dus volgens mij is mu 0 --> dit is een pessimistische
veronderstelling en we moeten zien of dit wel compatibel is met de gegevens)

Onze oorspronkelijke uitgangsvraag kunnen we nu vertalen in een statistische vraag --> er zijn 2
types statistische vragen:
1. Schatting maken van een onbekende parameter (bv. Mu, eerste deciel,…)
2. Veronderstelling maken en toetsen van hypothese (om te toetsen of de veronderstelling
compatibel is met de gegevens)

1. We zijn begonnen met een inhoudelijke uitgangsvraag
2. We hebben gezocht naar een statistisch canvas
3. We hebben een veronderstelling gemaakt voor hoe het model van de gegevens eruit ziet
4. Gewapend met dat model hebben we de oorspronkelijke inhoudelijke vraag in een
statistische vraag kunnen vertalen
--> de vraag is hoe je de statistische vraag gaat beantwoorden
--> we hebben hiervoor gegevens nodig --> om op de gegevens een beroep te doen, zullen we deze
gegevens om gaan zetten in een getal = we gaan een statistiek kiezen die ons gaat helpen een
uitspraak te doen over de mu (in termen van schatting/ hypothesetoetsing)

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper tinneduckaert. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 71498 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€2,99  1x  verkocht
  • (0)
  Kopen