Craig, B: Introduction to the Practice of Statistics
Hele concrete en duidelijke samenvatting! Dit document is een samenvatting van het boek "Introduction to the Practice of Statistics" geschreven door Moore. Het document bevat de aantekeningen van alle hoorcolleges en is aangevuld met informatie uit het boek. Ook zijn er oefenopgaven inclusief uitwe...
Hoofdstuk 1 t/m 4 en paragrafen 5.1 en 5.2
November 7, 2022
66
2022/2023
Summary
Subjects
statistiek
statistiek 1a
psba1 05
moore
david moore
psychologie
statistics
statistic
spss
introduction to the practice of statistics
rijksuniversiteit groningen
Connected book
Book Title:
Author(s):
Edition:
ISBN:
Edition:
More summaries for
Extensive summary Craig, B: Introduction to the Practice of Statistics - Statistics
Summary Lectures and Readings: Statistics 1 - Introduction (FSWPE1-032)
Detailed Summary: Lectures and Readings STATISTICS 2.2 FSWPE2-022
All for this textbook (11)
Written for
Rijksuniversiteit Groningen (RuG)
Psychologie
Statistiek 1 (PSBA105)
All documents for this subject (4)
1
review
By: AnoukVos08 • 1 year ago
Seller
Follow
juliazwanev
Reviews received
Content preview
Samenvatting Statistiek 1a – Alle hoorcolleges
Hoorcollege 1
Hoe kun je een onderzoeksvraag beantwoorden?
• Wat wordt er bedoeld met bepaalde begrippen?
• Hoe kun je deze begrippen meten?
• Operationaliseren.
Operationalisatie
• Omvat de operationalisatie wat ik wil onderzoeken?
• Hoe verhoudt mijn operationalisatie zich tot die van andere onderzoekers?
• Is er een standaard manier?
• In mijn operationalisatie eenvoudig meetbaar?
Meetniveaus van variabelen
• De gebruiker/onderzoeker kiest het meetniveau
- Kies het hoogst mogelijk zinvolle (mbt inhoud) meetniveau
Meetniveaus van variabelen
• Verschillende meetniveaus
- Nominaal: ongeordende categorieën (bijv. identity/labels: geslacht, politieke
voorkeur)
- Ordinaal: geordende categorieën (bijv. categorical: schaal: er slecht, voldoende, erg
goed)
- Interval: kwantitatief: zonder nulpunt waarin 0 niks betekend. Bijvoorbeeld
temperatuur of tijdstip.
- Ratio: kwantitatief: met een absoluut nulpunt wat dan ook ‘niks’ betekend.
Bijvoorbeeld gewicht, lengte en inkomen.
Discrete vs. continue metingen
• Een ander belangrijk kenmerk is of de data discreet of continu is.
• Discrete data:
- Getallen “ertussenin” hebben geen betekenis
• Continue data:
- Getallen “ertussenin” hebben wel betekenis
Nominaal en ordinaal zijn vaak discreet.
Interval en ratio kunnen beide zijn.
Data set met meerdere getallen (bijv. subset van lengtes van studenten) →
sample/steekproef.
Data (sample) analyse
- Twee (complementary) aanpakken van data analyse:
• Grafische weergave van de data
• Vat kenmerken van de data numeriek samen
• De keuze van een bepaalde plot/grafiek is afhankelijk van het meetniveau van je
variabele.
,Histogram
- Elke staaf is een klasse
- Er is een klasse voor elke range van getallen in de data
- Alle klassen hebben dezelfde breedte
- De hoogte van de klasse is het aantal waarnemingen in de klasse
- Er zit geen ruimte/gaten tussen de klassen! (Dit is een verschil met een
staafdiagram!!!)
Doel van grafieken
- Meestal het helpen begrijpen van de data
- Kijk altijd naar het algemene patroon en naar opvallende afwijkingen van dat
patroon
- Te stellen vragen bij het bekijken van een grafiek:
• Waar ligt het ‘centrum’ van de data? (center)
• Waar zie je een clustering/ophoping van de data? (center)
• Hoe is de spreiding van de data? (spread)
• Is de verdeling symmetrisch? (shape, outliers)
Samenvattingsmaten
- Te stellen vragen bij het bekijken van een grafiek:
• Waar ligt het ‘centrum’ van de data?
➢ Central tendency: median, mean
• Waar zie je een clustering/ophoping van de data?
➢ Modus/mode
• Hoe is de spreiding van de data?
➢ Spreiding: range; variantie; standaarddeviatie, interquartile range
(IQR).
• Is de verdeling symmetrisch?
➢ Vorm: outliers/uitbijters
Central tendency
- Waar ligt het ‘centrum’ van de data?
• Wat is het “middelste” getal → mediaan
• Wat is het “gemiddelde” getal → mean
• Wat is het meest voorkomende getal? Waar is een clustering van de data? →
modus
Centrum: mean/gemiddelde
- Het steekproefgemiddelde is de meest belangrijke centrummaat (measure of central
tendency)
- Dit is het punt waarbij de som van alle afwijkingen hiervan gelijk is aan 0.
- Kan gezien worden als een “balanspunt” van de steekproef.
- Het gemiddelde van de waarnemingen wordt weergegeven als x met een streepje
erboven.
,Spreiding:
Hoe verspreid is de data? Hoe verschillend zijn de waarnemingen van elkaar?
▪ Range = max - min
▪ Variantie
▪ Standaarddeviatie
▪ Interkwartielafstand / Interquartile range (IQR)
Spreiding: Interquartile range (IQR)
• Bepaal de kwartielen op een vergelijkbare manier als de mediaan.
- Eerste kwartiel (Q1): mediaan van de laagste 50% van de waarnemingen.
- Tweede kwartiel (Q2): mediaan van de waarnemingen
- Derde kwartiel (Q3): mediaan van de hoogste 50% van de waarnemingen.
• IQR is de range van de middelste 50% van de data.
- Bepaal Q1 en Q3
- Het verschil tussen Q1 en Q3 is de interquartile range
, Five number summary
We kunnen elke verdeling weergeven met vijf
getallen: de range en de kwartielen → Dit noemen we de five-number summary.
▪ Eerste getal: minimum, kleinste waarneming
▪ Tweede getal: eerste kwartiel
▪ Derde getal: mediaan/tweede kwartiel
▪ Vierde getal: derde kwartiel
▪ Vijfde getal: maximum, grootste waarneming
➢ De five number summary heeft ook een grafische
➢ vorm: box plot
Waarom boxplots?
- Snel een goed overzicht van de belangrijke kenmerken van de steekproef.
- Boxplots kunnen makkelijker op een klein stuk papier.
Vorm: Outliers
- Hoe outliers vinden?
• Gebruik histogram en boxplot
• 1,5 x IQR rule
➢ Een waarneming die verder af ligt dan 1,5 x IQR
➢ = onder het 1e kwartiel
➢ = boven het 3e kwartiel
• Eigen inzicht is belangrijk: er is geen harde beslisregel
Hoorcollege 2
Nog even over college 1:
• Onderzoeksvraag:
- Operationalisatie van concepten
- Meten (kies zelf het meetniveau: nominaal/ordinaal/interval/ratio; discreet vs.
continu)
• Data verzameling (steekproef/sample)
Inspecteer de data voor elke variabele:
- Grafisch
- Numeriek
➢ Centrum: mediaan, gemiddelde, modus
➢ Spreiding: range, IQR, variantie, standaarddeviatie
➢ Vorm: outliers
Lineaire transformaties
• Lijkt een losstaand stukje theorie en is vrij wiskundig
• We zullen dit vaak (onbewust) toepassen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller juliazwanev. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.29. You're not tied to anything after your purchase.