Samenvatting Syllabus Statistische Methoden (GEO2-3054) 2020 - Deel 1
23 views 0 purchase
Course
Statistische Methoden (GEO23054)
Institution
Universiteit Utrecht (UU)
Samenvatting syllabus statistische methoden (GEO2-3054) hoofdstuk 1 tot en met 9. Syllabus van: De Vocht. Ook met alle formules. Dit is voor het eerste tentamen.
3 fasen van empirisch onderzoek:
1. Voorbereidingsfase (onderzoeksplan + onderzoeksvraag)
2. Empirische fase (verzameling en analyse van gegevens = data-analyse)
3. Rapportage (presentatie relevante uitkomsten)
1 Onderzoeksplan
In een onderzoeksplan wordt vastgesteld hoe men een onderzoek gaat uitvoeren en worden de keuzes verantwoord. Het
onderzoeksplan is opgebouwd uit verschillende onderdelen.
● Doelstelling (wetenschappelijke/ maatschappelijke relevantie)
● Centrale onderzoeksvraag (+ centrale vraag wordt opgedeeld in deelvragen)
- Doelstelling + centrale onderzoeksvraag = probleemstelling
● Theoretisch kader (veronderstelde samenhang tussen de variabelen worden schematisch weergeven in een
conceptueel model)
● Onderzoekshypothesen (= formuleren verwachte relaties → toetsing)
● Operationalisering (= het vertalen van theoretische concepten naar concreet meetbare variabelen: welke
varabiale(n) zijn representatief voor het betreffende begrip?)
● Methoden van gegevensverzameling (afhankelijk van de centrale onderzoeksvraag en beschikbaarheid van
gegevens → zelf gegevens verzamelen: kwantitatief (enquête), kwalitatief (diepte-interviews) of observatie
(kwalitatief of kwantitatief).
● Onderzoekseenheden (over wie/wat worden uitspraken gedaan?)
● Populatie of steekproef (worden alle onderzoekseenheden (“populatie”) of alleen mensen in een steekproef
betrokken. Er wordt een onderscheid gemaakt tussen een aselecte steekproef (= statistische toetsing, inductieve
statistiek) en geen toevalssteekproef (= beschrijvende statistiek, generalisatie is niet mogelijk).
2 Empirische onderzoeksfase
(= uitvoering van het onderzoek)
Stappenplan:
1. Gegevens verzamelen;
2. Gegevens invoeren (en bewerken);
3. Analyse van de gegevens;
4. Antwoord op onderzoeksvragen.
Als gevonden verbanden voor de hele populatie, kan er gesproken worden van significante verbanden.
We onderscheiden twee begrippen die iets zeggen over de kwaliteit van de uitkomsten: betrouwbaarheid en geldigheid
(validiteit).
● Betrouwbaarheid:
- De nauwkeurigheid van de meting;
- Bij herhaalde meting, volgen dezelfde uitkomsten;
- Wel: toevallige meetfouten (door bijvoorbeeld schattingen) → Meetfouten kunnen elkaar nog
uitmiddelen, het hoeft niet tot ongeldige uitkomsten te leiden. Wel kan er ruis ontstaan (:
onderzoeksresultaten minder nauwkeurig).
● Geldigheid:
- Juistheid van het meetinstrument;
- Problematiek ontstaat bij abstracte en complexe begrippen (= constructen);
- Systematische meetfouten (bijv.: er wordt continu een ander antwoord gegeven dan dat de onderzoeker
bedoeld) → ongeldige uitkomsten.
→ Een goede operationalisatie is een voorwaarde voor geldige en betrouwbare onderzoeksresultaten.
1
,Hoofdstuk 1: Statische basisbegrippen
Statistiek houdt zich bezig met het verzamelen, bewerken en presenteren van gegevens, en met het toetsen van uitkomsten
op hun algemene geldigheid.
Er wordt een onderscheid gemaakt tussen beschrijvende statistiek en inductieve statistiek
Beschrijvende statistiek (descriptieve statistiek)
● Het ordenen en presenteren van gegevens in tabellen en grafieken;
● Hoe zijn de gegevens samengesteld? (→ frequentietabel);
● Het samenvatten van gegevens door middel van statische maten;
- Soorten statische maten (kengetallen)
1. Centrummaten (= middelpunt van de gegevens → bijv.: rekenkundig gemiddelde);
2. Spreidingsmaten (= beeld van de verdeling van de gegevens, ze zeggen iets over de vorm van
de verdeling → bijv.: standaarddeviatie);
3. Scheefheid Maten.
● Statistische samenhang (kruistabel): De sterkte van de samenhang kan worden uitgedrukt in een associatiemaat. De
bekendste associatiematen zijn C ramér's V en de correlatiecoëfficiënt.
Inductieve statistiek
● Als de hele onderzoeksgroep of populatie te groot is om in zijn geheel te onderzoeken, maken we gebruik van een
steekproef;
● Aselecte steekproef;
● Statistische toetsing (steekproefuitkomsten geldig voor de hele populatie? → significant, hoe groot is de kans op
toeval?);
● Betrouwbaarheidsinterval (= en gebied schatten waartussen het echte rekenkundig gemiddelde (of een andere
statistische maat) ligt).
Het zal duidelijk zijn dat je altijd begint met beschrijvende statistiek. We willen immers eerst weten hoe de verzamelde
gegevens eruit zien. Het maakt daarbij niet uit of het om populatie- of steekproef gegevens gaat.
Inductieve statistiek is niet altijd nodig. Je gebruikt inductieve statistiek alleen als je beschikt over steekproefgegevens, die
afkomstig zijn van een aselecte (representatieve) steekproef. Alleen dan is het mogelijk om te toetsen of de gevonden
uitkomsten significant zijn voor de hele populatie.
→ Toetsen heeft geen zin als het niet gaat om een aselecte steekproef.
● Effect size.
Populatie en steekproef
Populatie = de totale groep onderzoekseenheden waarop het onderzoek zich richt. De populatie wordt afgebakend op basis
van één of enkele gemeenschappelijke kenmerken. Onderzoekseenheden hoeven niet per se personen te zijn.
Er zijn verschillende redenen om een steekproef te gebruiken:
1. De hele populatie onderzoeken is te duur;
2. De hele populatie onderzoeken kost te veel tijd;
3. De populatie is niet bekend;
4. Esthetische redenen (vrijwillige aanmeldingen).
Aselecte en gerichte steekproeven
Er wordt een onderscheid gemaakt tussen aselecte en gerichte steekproeven:
Aselecte steekproef: (kanssteekproef)
● Elke onderzoekseenheid u it de populatie een gelijke kans om getrokken te worden;
2
, ● Steekproefkader is nodig (= lijst met alle eenheden van de populatie);
● Random → representatieve afspiegeling van de populatie (toetsen op geldigheid);
Gerichte steekproef (niet-kanssteekproef)
● Geen steekproefkader;
● De onderzoekseenheden worden niet op basis van toeval getrokken, maar op basis van beschikbaarheid of
willekeur (passantenonderzoek);
● Statistische toetsing op geldigheid voor de hele populatie is niet toegestaan;
● goodness-of-fit toets (= Komt de verdeling van de steekproef overeen met die van de populatie?);
● Representatief voor sleutelkenmerken? → met nodige voorzichtigheid alsnog statisch toetsen.
Datamatrix: onderzoekseenheden en variabelen
Verzamelde onderzoeksgegevens worden weergegeven in een datamatrix. Een datamatrix bestaat uit onderzoekseenheden,
variabelen e n waarden.
Onderzoekseenheden (cases)
= De groep waarvoor we in het onderzoek uitspraken willen doen. Ze zijn afgebakend op basis van 1 of enkele
gemeenschappelijke kenmerken. (Rijen)
Variabelen
= Variabelen zijn de gemeten kenmerken o f eigenschappen van de onderzoekseenheden. Ze verschillen (‘variëren’) per
onderzoekseenheid (Kolommen). Onderscheid:
- Kwalitatieve variabelen;
- Kwantitatieve variabelen (numerieke gegevens (getallen)).
Waarden
= Elke variabele heeft een aantal mogelijke uitkomsten of waarden. Zo zijn bij de variabele geslacht, ‘man’ en ‘vrouw’ de
waarden. De gemeten waardes (scores) verschillen per onderzoekseenheid.
Als er gegevens ontbreken, spreken we van missing values. Missing values doen zich voor als een respondent een vraag
weigert te beantwoorden, als hij een antwoord niet weet, of als een vraag niet van toepassing is.
Een datamatrix (SPSS) is een gegevenstabel. Dit is een rechthoekige tabel waarin de onderzoekseenheden in de rijen staan
(horizontaal), en de variabelen in de kolommen (verticaal). In de cellen van de tabel staan de gemeten waarden (verzamelde
gegevens).
Bronvermelding: de titel staat altijd boven de tabel. De bron mag achter de titel of onder de tabel worden gezet.
Typen variabelen: meetschalen
Elke variabele heeft een eigen meetschaal. De meetschaal geeft informatie over het type gegevens en bepaalt welke
statistische technieken er gebruikt mogen worden. Er worden vier soorten meetschalen onderscheiden:
1. Nominale Schaal;
2. Ordinale Schaal;
3. Intervalschaal;
4. Ratioschaal.
→ De vier meetschalen vormen een oplopende reeks: als een techniek bij een bepaalde schaal gebruikt mag worden, dan is
dat ook toegestaan bij een hogere meetschaal, maar niet bij een lager schaalniveau.
1 Nominale meetschaal
Nominale variabelen bestaan uit een beperkt aantal categorieën, die allesomvattend ( iedere waarneming kan worden
ingedeeld in een categorie), en wederzijds uitsluitend zijn (iedere waarneming kan uitsluitend worden ingedeeld in één
categorie). Alle categorieën zijn gelijkwaardig.
→ Bijvoorbeeld: type huishouden en geslacht.
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ambervdvliet. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.34. You're not tied to anything after your purchase.