100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Toetsende Statistiek: Uitgebreide Samenvatting: Statistics The Art of Science of Learning from Data $6.49   Add to cart

Summary

Toetsende Statistiek: Uitgebreide Samenvatting: Statistics The Art of Science of Learning from Data

13 reviews
 499 views  51 purchases
  • Course
  • Institution
  • Book

Uitgebreide samenvatting van Hoofdstuk 10 (2 groepen vergelijken) t/m Hoofdstuk 15 (non parametrische testen) met vele voorbeelden, alle formulen, tabellen en uitwerkingen ter verduidelijking

Preview 6 out of 105  pages

  • No
  • H10, h11, h12, h13, h14, h15
  • March 4, 2018
  • 105
  • 2017/2018
  • Summary

13  reviews

review-writer-avatar

By: shanti3310 • 4 year ago

review-writer-avatar

By: lhmprinsen • 4 year ago

review-writer-avatar

By: juliahoman • 4 year ago

review-writer-avatar

By: janettepelled • 4 year ago

review-writer-avatar

By: dharsythuraisamy • 4 year ago

review-writer-avatar

By: Charlotteseelen • 5 year ago

review-writer-avatar

By: xniienkex • 5 year ago

Show more reviews  
avatar-seller
Toetsende Statistiek




Statistics
The Art and Science of Learning from Data
Hoofdstuk 10 t/m 15




©V.P. Veraar

,Inhoud
Hoofdstuk 10: Vergelijking van twee groepen........................................................................................3
10.1 Categorische respons: het samenbrengen van twee verhoudingen...........................................4
10.2 Kwantitatieve response: het vergelijken van twee gemiddelden..............................................12
10.3 Andere manieren om gemiddelde en proporties te vergelijken................................................17
10.4 Afhankelijke steekproeven analyseren......................................................................................20
10.5 Het aanpassen van effecten van andere variabele....................................................................24
Hoofdstuk 11: Het analyseren van het verband (associatie) tussen twee categorische variabelen......29
11.1 Onafhankelijk en afhankelijk (associatie)..................................................................................29
11.2 Testen van categorische variabelen op onafhankelijkheid........................................................30
11.3 Bepalen van de sterkte van de associatie.................................................................................36
11.4 Residuen gebruiken om het associatie patroon te laten zien....................................................38
11.5 Kleine steekproefgrootte: Fisher’s Exact Test............................................................................40
Hoofdstuk 12: Analyseer van de associatie tussen kwantitatieve variabelen: Regressie Analyse.........41
12.1 Model voor hoe twee variabelen gerelateerd zijn....................................................................42
12.2 Beschrijf de sterkte van associatie............................................................................................46
12.3 Inferenties maken over de associaties......................................................................................51
12.4 Hoe varieert de data rondom de regressielijn...........................................................................53
12.5 Exponentiële regressie: Een model voor non-lineariteit...........................................................57
13 Meervoudige regressie....................................................................................................................59
13.1 Gebruik van verschillende variabelen om een respons te voorspellen.....................................59
13.2 Uitbreiden van de correlatie r en R² voor een meervoudige regressie.....................................62
13.3 Gebruiken van meervoudige regressie om inferenties te maken..............................................64
13.4 Nakijken van een regressiemodel door een residu plot te gebruiken.......................................69
13.5 Regressie en categorische voorspellers....................................................................................70
13.6 Modeleren van categorische response.....................................................................................72
Hoofdstuk 14: Groepen vergelijken: Analyseren v. variantie methodes................................................78
14.1 One-way ANOVA: voor het vergelijken van verschillende gemiddelden...................................78
14.2 Schatten van verschillen in groepen voor één factor................................................................84
..........................................................................................................................................................85
14.3 Two-way ANOVA.......................................................................................................................89
Hoofdstuk 15 Niet parametrische statistieken......................................................................................95
15.1 Het vergelijken van twee groepen door ranking/ ordenen.......................................................95
2
©V.P. Veraar

, 15.2 Niet parametrische methoden voor verschillende groepen en voor matched pairs...............100


Hoofdstuk 10: Vergelijking van twee groepen

Voorbeeld 1
Zinvol maken van studies die twee groepen vergelijken

Stel het scenario voor
In de afgelopen jaren wordt het voor ons steeds belangrijker om onze tanden zo veel mogelijk te laten
schijnen en zo wit mogelijk te maken, zoals mensen die op televisie komen of in bladen. Producten
om tanden te witte kan je tegenwoordig zowel bij de tandarts laten doen of bij een apotheek halen.
Er zijn zoveel producten op de markt dat er heel veel claims/beweringen zijn over dat een bepaald
product het beste is. Sommige beweringen zijn gebaseerd op schijn wetenschappelijk onderzoek,
hierdoor is het moeilijk om de producten te sorteren of zij goed werken of helemaal niet.

Studies die claims/beweringen onderzoeken zoals gewichtsverlies, tanden witten of drinkgedrag
hebben betrekking op twee groepen of twee behandelingen, zoals (voor en na gewicht, voor en na
tanden witten, of vergelijken van mannen en vrouwen hun drinkgedrag).

Vragen om te onderzoeken:

 Hoe kunnen we gegevens uit een experiment gebruiken, om het bewijsmateriaal van de
claims/beweringen van tandbleek fabrikanten samen te vatten?
 Hoe kunnen we op basis van de gegevens beslissen of de claims/beweringen al dan niet
geloofwaardig zijn.

Vooruit denken
Dit hoofdstuk laat zien hoe je twee groepen kunt vergelijken op een categorische of kwantitatieve
uitkomst. Om dit te doen, zullen we de inferentiële statistische methoden gebruiken -
betrouwbaarheidsintervallen en significantietests.

 Voor categorische variabelen, vergelijken de inferenties verhoudingen/ proporties.
 Voor kwantitatieve variabelen, vergelijken de inferenties gemiddelden.

Hoeveel geloofwaardigheid je moet geven aan claims die in verhalen in de krant zijn gedaan?
Dergelijke verhalen rapporteren bijna altijd alleen 'statistisch significante' resultaten.

 Zo nu en dan kan een dergelijk rapport een type 1-fout zijn, waarbij een effect wordt
beweerd dat feitelijk niet bestaat in de populatie.
 Sommige voorspellen mogelijk dat effecten groter zijn dan ze in die populatie zijn.

Bivariate analyses: een responsvariabele en een binaire verklarende variabele
Overweeg een studie die vrouwelijke en mannelijke studenten vergelijkt met de proporties die zegt
dat ze hebben deelgenomen aan alcoholmisbruik. De twee groepen die worden vergeleken, vrouwen
en mannen, zijn de categorieën van een binaire variabele (twee vergelijkingen die elkaar uitsluiten/
waar/ niet waar, ja/nee, man/vrouw) . De algemene categorie statistische methode die wordt
gebruikt wanneer we twee variabelen hebben, wordt bivariate methoden genoemd. Hier worden


3
©V.P. Veraar

,twee groepen vergeleken, waarbij een van de twee variabelen de uitkomstvariabele is en de andere
een binaire variabele die de categorieën specificeert.
De uitkomstvariabele waarop vergelijkingen worden gemaakt, wordt de responsvariabele
genoemd. De binaire variabele die de groepen specificeert, is de verklarende variabele. Herhaal dat
een binaire variabele twee mogelijke uitkomsten heeft. In het vorige voorbeeld, met geslacht,
zouden de twee uitkomsten mannelijk of vrouwelijk zijn. Statistische methoden analyseren hoe de
uitkomst van de respons variabel is of wordt verklaard door de waarde van de verklarende variabele.
In ons voorbeeld is deelname aan binge drinking (ja of nee) de responsvariabele en is gender de
verklarende variabele. Onze interesse ligt in het bestuderen van hoe binge-drinken afhangt van
gender, niet hoe geslacht afhankelijk is van binge drinkig.

 Response variabele: de constante, afhankelijk hier wordt een antwoord op gebaseerd
 Explanatory verklarende variabele:binaire variabele die de groepen specificeert,
onafhankelijk

Afhankelijke en Onafhankelijke steekproef
Onafhankelijke steekproef:
De meeste vergelijkingen van groepen gebruiken onafhankelijke steekproeven uit de groepen. De
waarnemingen in één steekproef zijn onafhankelijk van die in de andere steekproef.
- Gerandomiseerde experimenten die willekeurig onderwerpen aan twee behandelingen
toewijzen (placebo/ geen placebo)
- Observatie studie scheidt onderwerpen in groepen op basis van hun waarde voor een
verklarende variabele (onafhankelijke), zoals de rookstatus (rokers/ niet rokers).

Afhankelijke steekproef:
Wanneer de twee steekproeven dezelfde onderwerpen hebben zijn ze afhankelijk.
- Matched pairs/ overeenkomende paren
elke proefpersoon in één steekproef is gematcht met een proefpersoon in het andere
steekproef. Een voorbeeld zijn getrouwde stellen, waarbij de mannen in een steekproef zijn
en de vrouwen in de andere.
- Als het onderwerp tweemaal wordt waargenomen, dus de steekproeven hebben dezelfde
persoon (dieetstudie waarin het gewicht van de proefpersonen voor en na het dieet wordt
gemeten. Het gewicht van een bijzonder persoon voor en na het dieet, zoals (144 lb, 127 lb),
vormt een gekoppeld paar.

Gegevens van afhankelijke samples hebben verschillende statistische methoden nodig dan gegevens
uit onafhankelijke samples.

10.1 Categorische respons: het samenbrengen van twee verhoudingen
Voor een categorische responsvariabele, vergelijken inferenties groepen in termen van hun
populatieproporties (percentage) in een bepaalde categorie. Laat p1 de populatieproportie voor de
eerste groep voorstellen en p2 de populatieproportie voor de tweede groep. We kunnen de groepen
met hun verschil vergelijken (p1-p2). Dit wordt geschat op basis van het verschil in de steekproef
verhoudingen, ( pp 1 – pp 2). Laat n1 en n2 de steekproefgrootten voor de twee groepen aanduiden.

 Populatieproportie groep 1: p1
 Populatieproportie groep 2: p2
 Steekproefgrootten van twee groepen: n1 en n2
4
©V.P. Veraar

,  Antwoordvariabele: wel/ niet overlijden of aanslaan van een techniek/methode


Voorbeeld 2

Aspirine, het wondermiddel

Stel het scenario voor
Hier zijn twee recente titels van krantenartikelen over gunstige effecten van aspirine:
1. "Kleine dosis aspirine kunnen het risico op hartaanvallen verlagen"
2. "Aspirine kan het risico op darmkanker verlagen"
Een meta-analyse combineert de resultaten van verschillende onderzoeken die een reeks verwante
statistische vragen behandelen.
Na analyse van de afzonderlijke onderzoeken veronderstelden de onderzoekers omtrent de
nuttigheid van aspirine dat de verschillende onderzoeken hetzelfde effect meten. Alle gebruikte
experimentele onderzoeken waren gerandomiseerd en dubbelblind. De gecombineerde resultaten
leverden bewijs dat dagelijkse aspirine het aantal sterfgevallen als gevolg van verschillende algemene
kankers tijdens en na de proeven verminderde.
We zullen enkele van deze resultaten onderzoeken.
Tabel 10.1 toont de studieresultaten.
Van de totaal 25.570 onderzochte personen stierven 347 van degenen in de controle/placebogroep
aan kanker, terwijl 327 in de aspirinebehandeling binnen 20 jaar na het onderzoek aan kanker
stierven.

Tabel 10.1 Patiënt stierf wel of niet-patiënt aan kanker voor behandelingsgroepen voor placebo en
aspirine.
Overleden aan kanker
Group Yes No Total
Placebo 347 11,188 11,535
Aspirin 327 13,708 14,035


a. wat is de responsvariabele en wat zijn de groepen om te vergelijken?
b. wat zijn de twee populatieparameters om te vergelijken? Schat het verschil tussen hen met
behulp van de gegevens in tabel 10.1.

a. In tabel 10.1 is de responsvariabele/proefpersonen al dan niet overleden aan kanker, met de
categorieën ja/nee. Groep 1 zijn de personen die placebo namen en groep 2 die aspirine
heeft ingenomen. Dit zijn de categorieën van de verklarende variabele.
b. Voor de populatie waarvan deze sample werd genomen, wordt het deel dat aan kanker is
overleden weergegeven door p1 voor het nemen van placebo en p2 voor het nemen van
aspirine.

De steekproef verhoudingen van de dood van kanker waar
- p1: Placebo  n1 = 11.535
PP1 = 347/11535 = 0.030
- p2: Asprine  n2 = 14.035
PP2 = 327/14035 = 0.023

Aangezien (pp 1 – pp 2) = 0,030 - 0,023 = 0,007, was het aandeel van degenen die aan kanker stierven
0,007 hoger voor degenen die placebo namen, dus 0,07% (minder dan 1%)
5
©V.P. Veraar

, Door middel van inferentie kunnen we een uitspraak doen over de populatie. Om een inferentie te
krijgen over het verschil in populatie proportie, (p1 - p2), moeten we leren hoeveel verschil ( pp1 – pp2)
tussen de steekproef proporties zou kunnen variëren uit meerdere steekproeven. Dit wordt
beschreven door de standaardfout van de steekproefverdeling voor het verschil tussen de steekproef
proporties.

Probeer oefening 10.2 en 10.3, deel a

De standaardfout voor het vergelijken van twee proporties
- Net als 1 steekproefproportie een standaardfout heeft die
beschrijft hoe goed het een populatieproportie schat, hebben 2
steekproefproporties dit ook (pp 1 – pp2)
- Deze schatting zou van studie tot studie variëren.
- De standaardfout beschrijft de variatie rond het gemiddelde, van
de gemiddelden van de steekproevenverdeling (zie marge figuur)
Het wordt geïnterpreteerd als de standaarddeviatie van de
schattingen (pp 1 – pp 2) van verschillende gerandomiseerde
experimenten met een bepaalde steekproefomvang.


Voorbeeld 3

a. Wat is de standaardfout van deze schatting (zie vorig voorbeeld)?
b. Hoe moeten we deze standaardfout interpreteren?

a. De formule voor de standaardfout van (pp1 – pp2) is:




b. Het verschil (pp 1 – pp 2)tussen de steekproefverhoudingen van sterfgevallen door kanker zou niet
altijd gelijk zijn aan 0.007, maar zou van steekproef tot steekproef verschillen. Samengevat, de
standaarddeviatie van (pp 1 – pp 2)van de steekproeven is 0.002.

Merk nu op dat als je een van de twee voorbeelden (en de helft van deze formule) negeert, je de
gebruikelijke standaardfout krijgt voor één deel:

- SE neemt af/ wordt kleiner naarmate n1 en n2 toenemen.
- SE neemt toe/ wordt groter naarmate n1 en n2 afnemen.
- In bovenstaande voorbeeld is de SE klein omdat de n (steekproeven) groot zijn

probeer oefening 10.3, deel b




6
©V.P. Veraar

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller vveraar. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.49. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

61001 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling

Recently viewed by you


$6.49  51x  sold
  • (13)
  Add to cart