Aantekeningen van alle colleges van Statistiek 1. Tijdens deze colleges zijn alle onderwerpen behandeld en is het boek Statistical Methods for the Social Sciences gebruikt. Alle verplichte onderwerpen worden behandeld.
Hoorcollege 1 (31-10-2022):
Binnen de statistiek is het vooral belangrijk om te kunnen toepassen en minder om te kennen
Kansrekening gaat veelal uit van deductie, d.w.z. gegeven dat we alle details weten van een
bepaalde populatie, hoe waarschijnlijk is dan een bepaalde (steekproef-)uitkomst?
(i.e. algemeen specifiek).
- algemeen specifiek, populatie steekproef, model data
Statistiek gaat veelal uit van inductie, d.w.z. gegeven een bepaalde (steekproef-) uitkomst, wat
kunnen we dan met welke waarschijnlijkheid zeggen over de populatie? (i.e. specifiek algemeen).
- algemeen specifiek, populatie steekproef, model data
Statistiek: de wetenschap van het verzamelen, organiseren en interpreteren van numerieke feiten,
die gegevens of data worden genoemd
- Beschrijvende statistiek: vat steekproef- of populatiegegevens samen met getallen, tabellen
en grafieken hierin zit geen onzekerheid!
- Inferentiële statistiek: voorspellingen doen over populatieparameters op basis van
steaekproefgegevens
Populatie: de totale set van deelnemers, relevant voor de onderzoeksvraag
- Parameter: hoe is het echt in de wereld als je het aan iedereen voorlegt (die weten we nooit)
Steekproef: een deel van de populatie waarover data verzameld is
Betrouwbaar: als je tweemaal meet, krijg je dan hetzelfde resultaat?
Valide: meet je wat je wil meten?
Variabele: gemeten karakteristiek die kan verschillen tussen subjecten
- Soorten: gedrags-, stimulus-, subject-, fysiologische-variabelen
Meetniveaus (NOIR):
- Categorische/kwalitatieve variabelen
o Nominaal: ongeordende categorieën (kleur ogen)
o Ordinaal: geordende categorieën (opleiding niveau)
- Kwantitatieve/numerieke variabelen
o Interval: gelijke afstand tussen opeenvolgende waarden (°C)
o Ratio: gelijke afstand en absoluut nulpunt (K)
Waardenbereik:
- Discreet: eindig ondeelbaar meeteenheid (# broers/zussen)
- Continu: oneindig deelbare meeteenheid (lichaamslengte)
Hoorcollege 2 (02-11-2022):
De statistische wetenschap bevat methoden voor:
- Design: plannen hoe data te verzamelen voor een onderzoek om vragen van interesse te
onderzoeken
- Description: data samenvatten die verkregen worden in een studie
- Interference: voorspellingen maken gebaseerd op de data, om ons te helpen dealen met
onzekerheid op een objectieve manier
Problemen bij steekproeven:
- Steekproeffout (sampling error): de fout die optreedt wanneer we een op een steekproef
gebaseerde statistiek gebruiken om de waarde van een populatieparameter te voorspellen
- Steekproefvertekening (sampling bias) treedt op bij het gebruik van niet-kanssteekproeven,
zoals selectiebias die inherent is aan steekproeven van vrijwilligers
- Meetfout (response bias): doet zich voor wanneer de proefpersoon een onjuist antwoord
geeft (bijvoorbeeld door te liegen), of de bewoording van de vraag of de manier waarop de
interviewer de vraag stelt verwarrend of misleidend is
- Selectieve respons (non-responsive bias): treedt op wanneer sommige proefpersonen niet
kunnen worden bereikt of weigeren deel te nemen of sommige vragen niet beantwoorden,
deze niet-respondenten kunnen afwijken van de respondenten
o Betrouwbaarheid = error, bias = validiteit
,Steekproefmethoden:
- Enkelvoudige aselecte steekproef:
1. Stel steekproef kader vast (lijst met alle personen in een populatie)
2. Trek aselect steekproef van n deelnemers
- Systematische aselecte steekproef:
1. Stel steekproefkader vast
2. Bepaal stapgrootte k=N/n “skip number”
Bijv. steekproef n=4, populatie N=20, k=20/4=5
3. Kies eerste deelnemer aselect en bepaald vervolgens deelnemers met deze stapgrootte k
- Gestratificeerde steekproef:
1. Stel steekproefkader op
2. Verdeel populatie in strata
3. Trek aselect uit ieder stratum
- Cluster steekproef:
1. Stel steekproefkader op
2. Verdeel populatie in clusters
3. Trek aselect aantal clusters
4. Kies alle deelnemers in getrokken clusters
- Getrapte steekproef:
1. Stel steekproefkader op
2. Verdeel populatie in clusters
3. Trek aselect een aantal clusters
4. Trek aselect binnen gekozen cluster
In het beschrijven van data zijn 3 dimensies van belang:
- Centrum: typische observatie
- Variatie: spreiding van observaties
- Positie: relatieve positie van observaties
Beschrijvende statistiek (univariaat) voor categorische/kwalitatieve variabelen (nominaal/ordinaal):
- Tabel: frequenteverdeling
- Grafiek: staafdiagram of taartdiagram
- Centrummaat: modus (meest voorkomende waarde)
Beschrijvende statistiek voor kwantitatieve variabele (interval/ratio):
- Tabel: frequentieverdeling
- Grafiek: histogram of stam-en-blad-diagram
- Centrummaten: (gewogen) gemiddelde, mediaan, of modus
- Spreidingsmaten: bereik, standaarddeviatie of interkwartielafstand
- Positiematen: percentielscore of kwartiel (25%, 50%, 75%)
Box plot: centrum, spreiding en posities in een figuur
- De box vertegenwoordigt het interkwartielbereik (IQR) dat de middelste 50%
van de records bevat
- De snorharen zijn lijnen die zich uitstrekken van de boven- en onderrand van
de doos tot de hoogste en laagste waarden die niet groter zijn dan 1,5 keer de
IQR
- Een lijn over het vak geeft de mediaan aan
- Uitbijters zijn gevallen met waarden tussen 1,5 en 3 keer de IQR, d.w.z. buiten
de snorharen
- Extremen zijn gevallen met waarden van meer dan 3 keer de IQR
- Het gemiddelde wordt aangegeven met een x, net boven de mediaan
, Hoorcollege 3 (07-11-2022):
Kansberekening-regels:
- P(A): kans dat uitkomst A plaatsvindt
- P(niet A) = 1 – P(A): kans dat uitkomst A niet plaatsvindt
Variabelen in kansverdeling
- Discrete variabelen: hebben een beperkte set aan mogelijke waarde
o De kans voor elk van deze aparte waarden kan berekend worden
- Continue variabelen: hebben een oneindig aantal mogelijke waarden
o De kans voor intervallen van waarden kans berekend worden
- Variabele S: de som van het aantal ogen van twee dobbelstenen
De verdelingen:
- Populatieverdeling: een kans-/ of frequentieverdeling van de verschillende
uitkomstmogelijkheden van een variabele, zoals deze in de totale populatie wordt
waargenomen beschrijft variabele in populatie (parameters)
o Gemiddelde μ
o Standaarddeviatie σ
o Omvang N
- Steekproefverdeling: een kans-/ of frequentieverdeling van de verschillende
uitkomstmogelijkheden van een variabele, zoals deze in een specifieke steekproef wordt
waargenomen beschrijft variabele in steekproef (statistieken)
o Gemiddelde ȳ
o Standaarddeviatie s
o Omvang n
- Steekproevenverdeling: de kansverdeling voor de verschillende
waarden van een steekproefgrootheid (oftewel, een statistiek), die
ontstaat wanneer een (groot) aantal willekeurige steekproeven van
een bepaalde omvang willekeurig wordt getrokken uit de populatie
beschrijft hoe statistiek varieert over steekproeven
o Gemiddelde
o Standaarddeviatie
o Omvang
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller sem10. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.20. You're not tied to anything after your purchase.