Statistische Modellen Voor Communicatie Onderzoek (77522101AY)
Institution
Universiteit Van Amsterdam (UvA)
Dit geeft een hele uitgebreide samenvatting (41 pagina's) van het online werkboek per hoofdstuk voor SMCO. Ook omschrijft alles wat je nodig hebt qua SPSS. Het geeft veel voorbeelden, waardoor je het beter begrijpt.
Statistische Modellen Voor Communicatie Onderzoek (77522101AY)
All documents for this subject (6)
1
review
By: provoostbabette • 1 year ago
Seller
Follow
annyckbentvelsen
Reviews received
Content preview
Hoofdstuk 1 – Sample verdeling: hoe anders had mijn sample kunnen zijn?
Statistiek is een instrument voor wetenschappelijk onderzoek
- Controleren of uitspraken ondersteund kunnen worden door gegevens die zijn verzameld
- Wetenschappelijke theorieën → algemene uitspraken
o Op veel situaties toepasbaar
- Met zo min mogelijk data, conclusies kunnen trekken over een grotere set
o Om kosten en tijd te besparen
Inferentiële statistiek → biedt technieken voor het doen van uitspraken over een grote reeks
waarnemingen uit gegevens die zijn verzameld uit een kleinere reeks waarnemingen
- Reeks waarover we een uitspraak willen doen heet de populatie
- Kleinere reeks waarnemingen wordt een sample genoemd
- We willen een verklaring over de steekproef generaliseren naar een verklaring over de
populatie waaruit de steekproef is getrokken
Statistische gevolgtrekking is een veralgemening van de gegevens die in een aselecte steekproef zijn
verzameld naar de populatie waaruit de steekproef is getrokken
- Focus van het boek → meest gebruikte type gevolgtrekking
- Onjuiste statistische gevolgtrekking herkennen of voorkomen
Het aantal gele snoepjes is een voorbeeld van steekproefstatistiek
- Één waarde die de kenmerk van de sample omschrijft
- Alle mogelijke uitkomstscores vormen de steekproefruimte
- Het is een toevalsvariabele → score is afhankelijk van toeval
o Sommige waarden komen vaker voor dan anderen
o Kan je zien door heel veel steekproeven te trekken
o Dit wordt de verdeling van de uitkomstscores van heel veel steekproeven genoemd
Kans hangt af van de waarde in de populatie
- Als frequenties in de sample verdeling veranderen in verhoudingen, krijgen we de
kansverdeling van de steekproefstatistiek
- Uitkomst tussen 0 en 1
Discrete kansverdeling → slechts een beperkt aantal uitkomsten mogelijk is
- Vertelt welke uitkomsten we wel kunnen verwachten
- Kansverdeling is steekproefverdeling alleen dan met kansen (zoals 0.1 ipv absolute getallen)
- Als het aantal gele snoepjes in de populatie 0.2 is, is het te verwachten dat we 0, 1, 2, 3 of 4
gele snoepjes vinden, maar een zak met 6 of 7 snoepjes zou heel zeldzaam zijn en 10 uiterst
ondenkbaar
- Populatie is dus 0.2, dus de meest verwachte waarde zullen 2 snoepjes zijn
- Verwachte waarde = het gemiddelde van de steekproefverdeling van een aselecte variabele
o Het steekproefaandeel is een onbevooroordeelde schatter van het aandeel in de
populatie
o Als verwachte waarde gelijk is een populatiestatistiek (=parameter)
o Het werkelijke aantal snoepjes is geen onbevooroordeelde schatter
▪ Populatie is groter, dus zou meer gele snoepjes moeten bevatten dan de
steekproef
▪ De schatting wordt neerwaarts bevooroordeeld; het is te laag
▪ Standaarddeviatie en variantie in de steekproef op een speciale manier
berekenen om een onbevooroordeelde schatting van de standaarddeviatie
en variantie van de populatie te verkrijgen
,Een steekproef is representatief voor de populatie als variabelen in de steekproef op dezelfde manier
worden verdeeld als in de populatie
- Kan verschillen als gevolg van toeval → niet representatief in strikte zin
- Mogen wel zeggen “in principe representatief”
Gewicht is een continue variabele
- Er is altijd nog een waarde tussen te vinden → tussen 0.01 en 0.02 ligt de waarde 0.015
- Geïnteresseerd in het gemiddelde gewicht van snoepjes
o Als we de waarschijnlijkheid willen van een snoepzakje van 2.8 gram is dat erg lastig,
want gewicht kan altijd nieuwe waarde aannemen
o Precies 2.8 gram is zeer onwaarschijnlijk
- Bij continue steekproefstatistiek kijken we naar een bereik van waarden in plaats van 1
waarde
o We kiezen een drempel, bijvoorbeeld <2.8 gram
o Je kan ook een bereik kiezen, bijvoorbeeld tussen de 2.75
gram en 2.85 gram
o Waarschijnlijkheid weergeven als een gebied tussen de
horizontale as en een kromme → deze curve wordt
kansdichtheidsfunctie genoemd
▪ Label verticale as: waarschijnlijkheidsdichtheid
▪ Kansdichtheidsfunctie kan ook de waarschijnlijkheid geven tussen van
waarden tussen 2 drempels
• Linkerkans: waarschijnlijkheid van waarden tot (en inclusief) een
drempelwaarde
• Rechter waarschijnlijkheid: waarschijnlijkheid van waarden van
(en inclusief) een drempelwaarde
Kansen tellen altijd op tot 1
- Hoe waarschijnlijk of hoe onwaarschijnlijk is het dat …?
Hoofdstuk 2 – Waarschijnlijkheidsmodellen: Hoe krijg ik een steekproefverdeling?
De bootstrap benadering
- Deze manier is gebaseerd op het idee om een groot aantal samples te trekken
- Je trekt 1 steekproef uit een populatie waarvoor gegevens verzameld worden
- Als volgende stap trek je een groot aantal sample uit je eerste sample → bootstrapsamples
- Ontwikkeld door Bradley Efron
- Meestal 5.000 bootstrap-samples voor de sample distributie
Verschillende mogelijkheden in bootstrapping:
- Bootstrap zonder vervanging
o Als een persoon (willekeurig) wordt gekozen voor onze steekproef, plaatsen we de
persoon niet terug in de populatie zodat hij of zij opnieuw kan worden gekozen
o Alle respondenten nemen maar 1 keer deel aan het experiment
o Het berekenen van waarschijnlijkheden wordt lastiger
▪ Verschillen negeren als de populatie veel groter is dan de steekproef
- Bootstrap met vervanging
o Dezelfde persoon kan meer dan eens voorkomen in het sample
o Stelt in staat om verschillende bootstrapsamples van het oorspronkelijke sample te
verkrijgen
, o In het geval van gele snoepjes: er wordt vanuit gegaan dat de kans op een geld
snoepje 0.2 is → als je het eerste gele snoepje hebt gepakt, doe je hem terug en blijft
de kans op een snoepje 0.2
- In een empirisch onderzoek wordt gewerkt ‘zonder vervanging’ maar in de statistische
software wordt het berekent ‘met vervanging’
Beperkingen bij bootstrapping:
- Steekproef die wij uit de populatie hebben getrokken moet min of meer representatief zijn
voor de bevolking
o Kan een vertekend beeld geven van de werkelijkheid
- Steekproef is waarschijnlijk representatief als die willekeurig is getrokken en groot is
Voordeel bij bootstrapping:
- Kunnen een steekproefverdeling krijgen voor elke steekproefstatistiek waarin we
geïnteresseerd zijn
o Elke statistiek die we kunnen berekenen voor onze oorspronkelijke steekproef kan
ook worden berekend voor elke bootstrap sample
o Steekproefverdeling is slechts verzameling van de steekproefstatistieken die van alle
bootstrapmonsters zijn berekend
- Enige manier om een sample verdeling voor de mediaan te krijgen, bijvoorbeeld mediane
gewicht voor snoepjes in een sample
In SPSS:
Er wordt gebruik gemaakt van een independent sample t-test (analyse → compare means)
- Rechts staat optie: bootstrap
o Vink ‘perform bootstrapping’ aan
o Zet ‘number of samples’ op 5.000
o Het ‘interval level’ moet 95% zijn
Resultaten analyseren:
Bovenaan staat een tabel met bootstrap specificaties → check of het correct is
- In de tabel ‘group statistics’ staat rechts een kolom met bootstrapping
o 95% betrouwbaarheidsinterval is belangrijk
- In de tabel ‘bootstrap for independent samples test’
o Betrouwbaarheidsinterval volgens de bootstrap
Exacte benadering:
- Het is de echte verdeling zelf → niet via een steekproef verkregen
- Alle mogelijke combinaties tellen
- Alleen met discrete of categorische variabele
o Verhoudingen zijn gebaseerd op frequenties → zijn discreet
- Associatie tussen twee categorische (nominale of ordinale) variabelen in een
contigentietabel
o Komen sommige combinaties van waarden voor de twee variabelen relatief vaak
voor?
o Zijn gele snoepjes vaker plakkerig dan rode snoepjes? → twee categorische variabele
▪ Fisher-exact test voor associatie tussen twee categorische variabelen
In spss:
- Analyse → nonparametric test → legacy dialogs → crosstabs (meest gebruikt)
- Exact button rechtsboven
o Select exact
, - Statistics:
o Welke toets moet SPSS gaan uitvoeren?
o Phi and Cramers V
Resultaten analyseren:
- Chi square tabel
o Fisher exact test
o Kijken onder: exact sig (2-tailed)
▪ Lager dan 0,05? → statistisch significant
- Symmetric measures tabel
o Hoe sterk/zwak is het verband tussen … en …?
Theoretische benadering
- Bootstrapping en exacte benadering vergen wat rekentijd → vooral voor computertijd
- Veel steekproefverdelingen lijken op wiskundige formules
o Normale verdeling
▪ Koppelt continue scores aan een rechter of linker kant
▪ De waarschijnlijkheid om ten minste of maximaal deze score te vinden
▪ Kansdichtheidfunctie
o T-verdeling
Reden voor een normale verdeling
- Het moet symmetrisch zijn
- Waarschijnlijk dat de sample een gewicht heeft wat in de buurt komt van het werkelijke
gewicht in de populatie
- Extreem zwaar of licht kan voorkomen, maar is zeer zeldzaam
- Hoe meer respondenten, hoe smaller de normale verdeling is
- Je mag een normale verdeling gebruiken als
o Kans op steekproefgrootte x steekproefgrootte < 5
▪ Kans om geel snoepje te trekken: 0.2
▪ Steekproefgrootte: 30
▪ 0.2 x 30 = 6 → 6 is groter dan 5
▪ Kans op een niet-geel snoepje: 0.8
• Gebruikt 0.2 → alleen om te kijken of je aan de voorwaarden voldoet
Vuistregels die betrekking hebben op de bevolking → niet makkelijk controleerbaar
- Want als je het al zou weten, waarom nog een steekproef?
- Gaan er vanuit dat de populatie normaal verdeeld is
Steekproefverdeling van het verschil tussen 2 gemiddelden
- T-verdeling
o Moet wel aan de voorwaarden van een t-verdeling gedaan worden
- Geen twee afzonderlijke steekproefverdelingen
o Een steekproefverdeling voor de statistiek van belang
o Wel vergelijken van twee afzonderlijke steekproeven
o Onderscheid tussen twee populaties maken
o Onmogelijk om sample voor de tweede meeting onafhankelijk te trekken van de
sample van de eerste meeting, omdat we herhaalde metingen willen vergelijken
▪ Statistisch afhankelijk → gepaarde samples
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller annyckbentvelsen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.40. You're not tied to anything after your purchase.