1. Inleiding
Goede motivering (redenering, werkwijze, veronderstellingen) is belangrijk
Recapitulatie statistiek 1:
Voorbeeld p.1:
2 dingen die je kan doen:
1. De gegevens ordenen/ samenvatten
= beschrijvend
--> Bv. Frequentiefunctie van intelligentie bepalen
2. Vanuit de 80 experimentele eenheden een populatie-uitspraak willen doen
= inductief
,P.2:
Figuur 1.1: voorbeeld van simpel geval van 1 bediende trekken uit populatie
We vertrekken van de populatie (bv. Populatie van alle mogelijke bedienden/ populatie van alle
mogelijke sollicitanten)
• We hebben een toevalsexperiment en dat betekent dat we een aantal vaste regels gaan
volgen, waarbij je bv. Eerst begint met op een bepaalde manier een trekking te doen, in dit
geval van een steekproef van n = 1 (1 bediende trekken uit de populatie van alle bedienden)
• We voeren het toevalsexperiment uit bv. Voor de bediende in kwestie het IQ bepalen --> alle
informatie die je bekomt en bijhoudt door dit toevalsexperiment uit te voeren resulteert in 1
puntje in de uitkomstenverzameling omega (verwijst naar outcome)
• Je gaat een toevalsvariabele X op de informatie loslaten, wat betekent dat je uit al de
bijgehouden informatie een stukje informatie gaat uitplukken
--> om hier straks kansuitspraken over te kunnen doen, heb je nood aan een statistisch model
= veronderstellingen over de kansmassa/dichtheidsfunctie van die toevalsvariabele in kwestie
--> als de toevalsvariabele discreet moet zijn, dan moet je voor elke waarde aangeven hoe
groot de kans is dat die optreedt --> de kansmassafunctie/ pi x gaat weergeven hoe groot bv.
De kans is om een IQ te hebben van 110?
--> als de toevalsvariabele continu moet zijn, dan krijg je een dichtheidsfunctie en die helpt je
om uitspraken te doen hoe groot de kans is om een IQ te hebben tussen bv. 110 en 120
Figuur 1.2: wat er gebeurt als je een steekproef trekt van > 1 bediende (bv. n = 80)
• In 1 punt van de uitkomstenverzameling zit dan alle informatie die we bij hebben gehouden
over de 80 bedienden (bv. Deelscores achter een IQ, tijd die een bediende nodig had om een
intelligentietest af te werken,… --> deze informatie staat allemaal in de
uitkomstenverzameling)
• Op al deze informatie kunnen we dan 80 toevalsvariabelen loslaten, waarbij uit al de
informatie die er beschikbaar is over de bedienden, bv. x4 er het IQ van de 4e bediende eruit
plukt
• Wat er dan in het 2e venndiagram staat Rn = dat betekent hier geordende 80tallen --> wat er
dan als eindpunt van zo'n pijl staat in dit venndiagram is niets anders als de eerste kolom die
we voordien hebben getekend --> deze 80 getallen is dan 1 geordend 80tal en dat zou dan 1
punt zijn in dat venndiagram
• Als we nu een uitspraak willen doen over het gemiddelde IQ in de populatie, dan gaan we
gebruik maken van de gegevens die je hebt in Rn --> je laat er een operatie op los bv.
Bereken het steekproefgemiddelde door de 80IQ's op te tellen en dan krijg je R
--> als je die pijlen na elkaar gaat toepassen, dan krijg je X streep (dit is een statistiek, waarbij
deze statistiek alle informatie over de steekproef omzet in 1 enkel getal) --> het gaat over een
grote X streep want het gaat over een toevalsvariabele
• Voor zo'n toevalsvariabele kan je gaan kijken hoe het zit met de dichtheids- of
kansmassafunctie en deze wordt hier steekproefverdeling genoemd --> je hebt alle
mogelijke steekproeven van 80 bedienden en die worden telkens per steekproef omgezet in
een getal (namelijk gemiddeld IQ) en de kansmassafunctie die zegt bv. Hoe groot de kans is
, om die bepaalde waarde voor het gemiddelde te bekomen/ hoe groot de kans is om in dat
interval terecht te komen --> waarbij het elke keer gaat over een kansuitspraak over alle
steekproeven DUS hoe groot is de kans dat je een steekproef hebt die een gemiddelde IQ van
113.2 oplevert/ Hoe groot is de kans om een steekproef te hebben die ligt tussen de 110 en
150?
Opzet en inhoud van deel 2:
Nieuw voorbeeld:
Voorbeeld uit klinische psychologie: soort gesprekstherapie die wordt aangeboden aan depressieve
cliënten: de vraag is "haalt de therapie iets uit?"
--> groep patiënten onderwerpen aan de therapie --> voor elke patiënt de stemmingsscore na de
therapie min stemmingsscore voor de therapie doen
We kunnen dan zowel positieve, nul als negatieve uitkomsten hebben
• Als hogere waarden een positieve stemming betekenen, dan is een positieve uitkomst dat
stemming voor lager is dan stemming na --> de cliënt is er dan op vooruit gegaan
• Score 0 = 0 cliënt is hetzelfde gebleven, status quo
• Negatieve uitkomst, dan is de 1e score beter dan de 2e --> de cliënt is erop achteruit gegaan
--> je kan hier echter geen causale verklaring uit trekken, want er spelen nog andere variabelen mee
(mensen kunnen automatisch verbeteren, je weet niet of je de vooruitgang kan toeschrijven dan de
therapie)
De psychologische vraag moeten we vertalen in een statistische vraag en daarvoor hebben we een
soort canvas nodig, een soort ondergrond om op basis daarvan de inhoudelijke vraag in een
statistische vraag te vertalen
--> we gaan een uitspraak doen over het statistische model van X = we gaan een veronderstelling
maken over hoe dat de kansmassa/dichtheidsfunctie van X eruit ziet
--> we zouden kunnen kijken naar eerdere onderzoeken waarbij we de proportiefunctie in kaart
hebben gebracht en op basis daarvan zou je kunnen zeggen dat het niet zo gek is om voor de
dichtheidsfunctie van de variabele X volgende vorm te postuleren
, Het idee is dus dat de dichtheidsfunctie dit soort VORM heeft, maar het is niet helemaal
gespecifieerd --> het kan meer naar rechts of links liggen --> de plaats van de top bv. Is dus een
onbekende parameter
Dit is dus een mogelijk model voor de toevalsvariabele (hier een continue toevalsvariabele) --> we
zijn erg geïnteresseerd in waar de mu gelegen is
Stel dat je vind dat er een behoorlijk grote kans is dat de mu positief is, mogen we dan spreken van
een goede therapie?
--> mu geeft weer hoe het zit met de gemiddelde patiënt, maar wat als de patiënt niet bij dit
gemiddelde zit??
--> we willen dat de meeste patiënten vooruit gaan
• Bv. Kans van .90 om vooruit te gaan --> We kunnen naar kwantiel .10 kijken = eerste deciel --
> Als het eerste deciel positief is dan weet je dat de kans dat de patiënt vooruit gaan,
minstens 90% is --> de kans om onder het kwantiel .10 te zitten = 10% en je weet dat de 90%
positief zijn, dan gaat minstens 90% vooruit als het kwantiel .10 positief zou zijn
We laten dat eerste deciel even voor wat het is en werken verder met mu
De vraag "haalt de therapie iets uit?" kan je op 2 mogelijke manieren vertalen:
1. Ik wil mu kennen --> mu is een karakteristiek op niveau van de populatie en de populatie in
zijn geheel kennen gaat niet --> we moeten dus een schatting maken --> we gaan mu
schatten en hopen dat die positief is
2. We kunnen ook vertrekken vanuit een veronderstelling (bv. Ik ben een farmaceut en ben
pessimistisch over die therapie, dus volgens mij is mu 0 --> dit is een pessimistische
veronderstelling en we moeten zien of dit wel compatibel is met de gegevens)
Onze oorspronkelijke uitgangsvraag kunnen we nu vertalen in een statistische vraag --> er zijn 2
types statistische vragen:
1. Schatting maken van een onbekende parameter (bv. Mu, eerste deciel,…)
2. Veronderstelling maken en toetsen van hypothese (om te toetsen of de veronderstelling
compatibel is met de gegevens)
1. We zijn begonnen met een inhoudelijke uitgangsvraag
2. We hebben gezocht naar een statistisch canvas
3. We hebben een veronderstelling gemaakt voor hoe het model van de gegevens eruit ziet
4. Gewapend met dat model hebben we de oorspronkelijke inhoudelijke vraag in een
statistische vraag kunnen vertalen
--> de vraag is hoe je de statistische vraag gaat beantwoorden
--> we hebben hiervoor gegevens nodig --> om op de gegevens een beroep te doen, zullen we deze
gegevens om gaan zetten in een getal = we gaan een statistiek kiezen die ons gaat helpen een
uitspraak te doen over de mu (in termen van schatting/ hypothesetoetsing)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller tinneduckaert. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.30. You're not tied to anything after your purchase.