Inleiding tot de biostatistiek: volledige samenvatting van de hoorcolleges, werkzittingen, en opgeloste examenvragen.
Uitgeschreven weblectures en toevoeging van de hoorcolleges.
HOOFDS TUK 2: SURVEYS , BESPROKEN AAN DE H AND V AN BELGI AN HE AL TH INTERVIEW SURVEY
ACHTERGRO ND
• Surveys zijn steekproeven genomen uit een populatie om een representatief beeld te krijgen van die populatie.
• Belgian Health Interview Survey:
− De verschillende regeringen wilden peilen naar de subjectieve gezondheid van de Belgische bevolking.
− Bedenkingen:
➢ Subjectieve gezondheid: de gezondheid zoals die beleefd wordt door de respondenten.
Objectieve gezondheid: zoals vastgesteld wordt door de hulpverleners.
➢ De populatie is de “Belgische bevolking”. Maar wie is er relevant om in de populatie te worden opgenomen? Dit is gekoppeld aan
een temporeel aspect met een welgedefinieerd tijdskader, namelijk 1 jaar. Waarom 1 jaar?
o Omvat alle seizoenen zo kan seizoensgebonden gezondheidsproblematiek (pollenallergie, griep) in kaart worden gebracht.
o Als we de hele studie zouden baseren op 1 tijdstip, geeft een te grote variabiliteit/ruis/spreiding. Het ruisniveau kan naar
beneden gehaald worden door een langere periode te nemen.
o Het is organisatorisch meer haalbaar door de langere periode.
− De studie werd uitgevoerd in 1997, 2001 en 2004.
− In opdracht van?
➢ Federale regering: bevoegd voor bv Infrastructuur en regelgevend kader.
➢ Vlaamse, Franse en Duitse gemeenschappen: bevoegd voor bv ambulante sector in de geestelijke gezondheidszorg.
➢ Waals en Brussels gewest: bevoegd voor bv regionale ziekenhuizen.
− Door wie uitgevoerd?
➢ Wetenschappelijk instituut Volksgezondheid - Louis Pasteur.
➢ Nationaal Instituut voor de Statistiek.
➢ Universiteit Hasselt.
• Doelen:
− Subjectieve gezondheid, vanuit het perspectief van de respondent.
− Identificatie van gezondheidsproblemen.
− Informatie die niet kan worden verkregen van zorgverleners, zoals schatting van prevalentie en verdeling van gezondheidsindicatoren.
Voorspellende veranderlijke: geslacht, leeftijd, lifestyle, eetgedrag, drinkgedrag…
− Analyse van sociale ongelijkheid in gezondheid en toegang tot gezondheidszorg.
− Studie van mogelijke trends in de gezondheidstoestand van de bevolking.
• Domeinen:
− Klachten en symptomen .
− Gezondheidstoestand.
− Gebruik van gezondheidsdiensten.
− Levensstijl.
− Socio-economische variabelen.
Informatie over wat je wil weten EN over elementen waartussen je verbanden wil gaan aantonen.
1
,OVERZICHT VAN MOGELI JKE PROBLEMATISCHE F ACTOREN
• De figuur is geen overzicht van alle elementen in de survey,
maar een selectie van categorieen waar gedurende de eerste 3
jaar niet op dezelfde manier mee is omgegaan.
➢ Bv enkel in 2001 een vevraging over acute aandoeningen.
➢ Aanpassingen van vragen doorheen de jaren, weliswaar
vergelijkbare vragen.
Dit leidt tot discontinuiteiten in de data!
Veranderingen kunnen, maar met mate en in zoverre dat zij
functioneel zijn en niet vermeden kunnen worden.
• Er bestaan 3 vormen van vragenlijsten:
− Vragenlijst op het niveau van het huishouden: het huishouden wordt als geheel ondervraagd. Zo moet sommige informatie niet aan alle
afzonderlijke leden gevraagd worden en is meestal 1 voldoende ( (bv hoeveel slaapkamers er zijn, of er een douche of een bad is…).
− Face-to-face interview: persoonlijk interview tussen interviewer en een persoon.
➢ Dit kan via mail, brief, mondeling… Maar welke manier is de beste?
➢ Gezondheid is een technische materie met specifieke terminologie, wat kan leiden tot misvattingen. Dus de vragen moeten
voldoende eenvoudig zijn en er kan een gestandaardiseerde verduidelijking worden gegeven.
➢ In ons land is een vragenlijst die door interviewer wordt afgenomen in termen van gezondheid, niet zo’n probleem omdat er niet
zo heel veel taboes meer leven rond gezondheid. Er bestaan er wel nog: aids, HIV, condooms. Zeker als er nog andere gezinsleden
aanwezig zijn. Daarvoor is deze drop-off vragenlijst voorzien, die wordt achtergelaten en later moet worden opgestuurd.
Maar gaan correspondenten dit ook effectief invullen? Meestal ja, want ze hebben al heel veel tijd gestoken in dat interview ervoor
en anders zou dat allemaal voor niks geweest. Mochten ze dit niet doen, is dat ook niet erg, want er bestaat ook een correlatie
tussen de vragen ervoor en erna gesteld zullen worden.
− Drop-off vragenlijst
2
,OVERZICHT VAN HET DE SIGN
• Regionale en provinciale stratificatie: steekproef bestond uit 10.000 respondenten.
− Regionaal: Die 10.000 zijn gestratifieerd naar 3 regio’s: Vlaanderen, Wallonië en Brussel.
− Provinciaal: Verder onderverdeeld in verschillende provincies.
− Hier er daar is er overrepresentatie, bv in Limburg en Luxemburg was er een grotere steekproef op een bepaald moment.
De steekproef wordt opgedeeld in verschillende steekproeven.
• De sampling gebeurt in 3 fasen:
− Primaire sampling units (PSU): gemeenten: evenredig met grootte.
− Secundaire sampling units (SSU): huishoudens.
− Tertiaire sampling units (TSU): individuen.
• Sampling wordt gedaan in 4 kwartalen: Q1, Q2, Q3, Q4.
• Regionale stratificatie in 1997:
− Vlaanderen heeft ongeveer uit 6 miljoen inwoners, Wallonië 3 miljoen en Brussel 1 miljoen. Logisch zou zijn om de 10.000
respondenten te partitioneren als 6000-3000-1000. Toch zijn er andere cijfers (± 3500, 3500, 3500) omdat:
➢ Bij formele vergelijkingen tussen deelgebieden, is een gelijke steekproef in de deelgebieden de meest optimale vorm om tot
goede resultaten te komen. Als je Vlaanderen met Brussel wil vergelijken is 6000-1000-spliting minder goed dan 3500-3500.
➢ Als je de 3 regio’s wil afzetten tegenover een standaard en je komt tot besluit dat Vlaanderen significant boven die standaard ligt
en Brussel erronder. Maar als je er betrouwbaarheidsintervallen opzet, dan zie je dat Vlaanderen klein betrouwbaarheidsinterval
heeft en Wallonië een veel groter. Namelijk hoe groter steekproef, hoe kleiner betrouwbaarheidsinterval.
− Wanneer je vergelijkingen wil doen tussen deelgebieden, zijn ongelijke steekproeven nadelig. Dus even grote groepen zijn interessanter!
➢ 3500 zouden perfect representatief zijn voor Vlaanderen, Wallonie en Brussel afzonderlijk, MAAR deze steekproef is niet
representatief voor de hele bevolking van Belgie. Daarom worden er gewichten geintroduceerd: Vlaanderen is met 6000, maar
wordt gerepresenteerd door 3500, dus krijgen een gewicht van ongeveer 2. In Brussel een gewicht van 1/3. Gewichten kunnnen
die ongelijke selectiekansen reduceren.
− In 2004 worden de ‘ouderen’ toegevoegd aan het design. Geen probleem, mits er gewichten gebruikt worden om de steekproef weer
richting de populatie te vertalen, want anders kloppen de proporties niet meer. De gewichten maken de proporties in de steekproef
gelijk aan de proporties in de populatie.
• Provinciale stratificatie in 1997:
− Er zijn 11 provinciale entiteiten. De steekproef genomen binnen de
provincies is proportioneel aan de provincies. Antwerpen als grootste en
Limburg als kleinste in inwonersaantal (verhouding 2:1).
− Binnen elke regio zien we dat de steekproefproporties en populatieproporties
ongeveer gelijk zijn.Maar als je Vlaanderen met Wallonie vergelijkt zie je dat
Vlaanderen ondervertegenwoordigd is en opgewogen moet worden. Wallonië
is normaal vertegenwoordigd, Brussel oververtegenwoordigd.
− Welke provincie heeft het grootste bevolkingsaandeel? Henegouwen is 40%
binnen Wallonie. Antwerpen is 26% binnen Vlaanderen. Het feit dat de steekproef zo groot is binnen Henegouwen is het gevolg dat
Vlaanderen en Wallonie even grote steekproeven hebben, hoewel ze in een verhouding 2:1 zouden moeten zitten.
3
,• Provinciale stratificatie in 2001:
− De populatie van Antwerpen is 1,5 miljoen inwoners, dit is 27% in de populatie. Dat geeft een theoretisch aantal van 969 interviews.
Die getallen werden vervolgens afgerond naar een veelvoud van 50, maar wel zo dat de som binnen een regio nog altijd klopte (bij de
ene provincie wat meer en bij de andere wat minder). Om praktische redenen een veelvoud van 50 binnen één gemeente zodat de
interviewers zich tot 1 gemeente kunnen beperken.
− Antwerpen was nog eens kandididaat voor een oversampling: er kwamen 350 interviews bij 1300 interviews.
− In Antwerpen werden er echter 19 gemeentes geselecteerd, maar er zijn eigenlijk 26 groepen. De reden hiervoor is dat de stad
Antwerpen 7 keer werd geselecteerd wegens de grootte. De grotere gemeenten werden meer dan 1 keer opgenomen.
− De laatste kolom geeft de rate per duizend aan. Bv in Luik werd er 1 persoon per duizend inwoners opgenomen.
In Vlaanderen zit men overal wat onder 1, omdat Vlaanderen ondervertegenwoordigd is.
In Wallonie schommelt het rond de 1, behalve Luxemburg waar je een zeer zware overspecificatie hebt.
In de Duitstalige gemeenschap van Luik ook een veel groter aantal, omdat je met 70.000 inwoners, maar 70 interviews werden
gerealiseerd. Maar men dacht dat de statistiek met zo’n kleine steekproef niet betrouwbaar was, en men er minstens 300 nodig had.
OVERZICHT VAN STRATIFICATIE
• 2 reden om te stratifiëren:
− Om deelgebieden als dusdanig te bestuderen en met elkaar te vergelijken. Daar is het ideaal gelijke aantallen te hebben. Bij gelijke
stratificatie wordt de vergelijking tussen groepen vergemakkelijkt en verbeterd.
− Te zorgen dat er geen toevallige schommelingen ontstaan en dan is het beste om proportioneel te stratifieren. Als deze stratificatie
goed wordt uitgevoerd, verhoogt het de precisie.
MAAR dit gaat niet samen! Je kan de regio’s niet stratifiëren op een gelijke en proportionele manier Er wordt gekozen voor de gelijke
manier op regionaal niveau en dan met gewichten die het op nationaal niveau weer in orde brengen.
• De provincies binnen de regio’s waren niet aan de orde, er is geen directe interesses in de provincies. Dus er werd gewoon proportioneel
gestratifieerd naar provincies toe. In 2001 en 2004 zijn er wel provinvies die een groter aantal hebben gekregen, maar dat is dus via
toevoeging van extra interviews gebeurd.
4
, MULTI -STAGE SAMPLING
PRIMAIRE SAMPLING UNIT S
• Primaire sampling units: gemeenten
− In 2001 voor Vlaams-Brabant: 600 interviews daar te realiseren. Deze kunnen homogeen over de kaart worden gespreid door
willekeurige 650 personen te kiezen in die provincie. Die liggen dan mooi verspreid, maar dit geeft een logistiek probleem voor de
interviewers: veel afstand tussen interviews! Om deze reden is er gekozen om gemeenten te kiezen uit de lijst van gemeenten en dan
eens gekozen, ze een groep van 50 toe te wijzen.
Je moet het zien als een lijstuk: iedere inwoner stelt een mm voor. De grote gemeentes hebben een groter deel van het lijnstuk. Het
gehele lijnstuk wordt gedeeld door het aantal interviews dat nodig is (13 hier) en zo worden de gemeentes gekozen waar interviews
worden afgelegd.
− Voor de provincie Antwerpen is er een langer lijnstuk. De stad Antwerpen neemt een veel groter stuk lijn in en er wordt bij het kiezen
van gemeentes, meerdere keer in Antwerpen geland (7 keer).
− Deze techniek heet systematische steekproefneming (systematic sampling). Het gebeurt nog steeds willekeurig, omdat de startplek
steeds willekeurig gekozen wordt. Maar er worden wel steeds grote, middelgrote en kleine gemeentes uitgenomen. Om zo verschillen
tussen die gemeentes allemaal op te nemen (socio-economisch, urbaan vs ruraal…).
• In 1997, representatie van de grote steden:
− Antwerpen krijgt 6 groepen.
− Luik: 4 groepen
− Charleroi: 4 groepen.
− Gent: 3 groepen.
− Bergen en Namen: elk 2 groepen.
− In Brussel werden elk van de 19 gemeenten opgenomen, waarvan sommigen relatief iets kleiner. Maar Brussel had wel een grotere
steekproef relatief ten opzichte van zijn gewicht.
• In 2001: De lijst men gemeentes die minstens 1 keer geselecteerd zijn:
− Voor Antwerpen: Met de systematische sampling kan berekend worden
dat er minstens 7 groepen gaan zijn, maar dat zegt tegelijkertijd dat er 7
+ 1 gaan zijn. Er is altijd een verschil van 1 mogelijk.
− Als je het verwachte aantal groepen gaat berekenen, kan je op 7,83
uitkomen. 83% van gevallen 8 groepen, 17% van de gevallen 7 groepen.
− Er zijn een aantal steden die slechts 1 keer geselecteerd zijn, maar die
toch in de zekerheidsgroep zitten. Brugge is 1 keer geselecteerd.
− Ook een kleinere gemeente zoals Kinrooi ook 1 keer geselecteerd, alleen
zijn hier de mogelijkheden 0 of 1. Bij Bruggen 1 of 2. Brugge is er zeker bij, of er een tweede groep bijkomt, is variabel.
5
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller THKmaster. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $43.35. You're not tied to anything after your purchase.