Blok 1.3 Statistiek I: samenvatting Introduction to the Practice of Statistics hoofdstuk 1 t/m 5
44 views 1 purchase
Course
Blok 1.3 Statistiek I
Institution
Erasmus Universiteit Rotterdam (EUR)
Book
Craig, B: Introduction to the Practice of Statistics
Nederlandse samenvatting van het boek Introduction to the Practice of Statistics (Moore, McCabe & Craig, 2017) hoofdstuk 1 t/m 5.
Hoofdstuk 1: Looking at Data - distributions
Hoofdstuk 2: Looking at Data - Relationships
Hoofdstuk 3: Producing Data
Hoofdstuk 4: Probability: The Study of Randomness
H...
Extensive summary Craig, B: Introduction to the Practice of Statistics - Statistics
Summary Lectures and Readings: Statistics 1 - Introduction (FSWPE1-032)
Detailed Summary: Lectures and Readings STATISTICS 2.2 FSWPE2-022
All for this textbook (11)
Written for
Erasmus Universiteit Rotterdam (EUR)
Pedagogische Wetenschappen En Psychologie
Blok 1.3 Statistiek I
All documents for this subject (3)
Seller
Follow
0970722
Reviews received
Content preview
Samenvatting literatuur
Bijeenkomst 1
Introduction to the practice of statistics
Hoofdstuk 1
1.1 Data
- Statistiek is de wetenschap van het leren van data
o Data nummerieke of qualitatieve beschrijvingen van de objecten die we
willen bestuderen
- We construeren gegevens (data) door eerst te bepalen welke cases of units we willen
bestuderen
o Voor elke case of unit verzamelen we informatie (= variabelen)
- Begrippen
o Case onderwerp/voorwerp/persoon die bestudeerd wordt
o Label speciale variabele die wordt gebruikt om verschillende cases van
elkaar te onderscheiden
o Variabele kenmerk van een case
o Waarde wat de case scoort bij een variabele (bv man/vrouw, 20 jaar, 6
punten)
o Data alle verzamelde gegevens
- Verschillende soorten variabelen
o Categorisch verdeelt de case in groepen of categorieën
Kan omgezet worden naar kwantitatief (bv toetsscore A naar 4 en B
naar 3 etc)
o Kwantitatief geeft een nummer waarmee je dingen kan berekenen zoals
het gemiddelde
- Belangrijk om bij onduidelijkheid te vermelden in welke eenheid wordt gemeten
- Belangrijke vragen om te stellen als je een statistische studie van een ander bekijkt
om de achtergrond informatie te begrijpen en een volledig beeld te creëren (= key
characteristics)
o Wie
Welke case
Hoeveel cases
o Wat
Hoeveel variabelen
Precieze definities van de variabelen
Met welke eenheden wordt er gemeten
o Waarom
Welk doel heeft de data
Is de data geschikt voor de conclusies die we willen trekken
Welke specifieke vragen willen we beantwoorden
- Het is belangrijk om goede variabelen te kiezen voor je onderzoek, zorg ervoor dat
deze variabelen meten wat je moet weten
o Bij het kiezen van te weinig of verkeerde variabelen kan je verkeerde
conclusies trekken
, o Bv school A heeft 200 geslaagden en school B 100 betere variabele zou zijn
dat school A 50% geslaagden heeft en school B 100%
School A heeft hierbij 400 leerlingen en school B 100
o Je kan het ene variabele gebruiken om een ander variabele te berekenen
bij het vb is dit ook gedaan
1.2 Displaying Distributions with Graphs
- Denk als een ontdekkingsreiziger eerst beschrijven wat je ziet (= exploring data
analysis)
o Eerst elke variabele los bekijken, daarna relaties tussen de variabelen gaan
bekijken
o Begin met een grafiek en ga van daaruit verder werken
- Categorische variabelen
o Taartdiagram
Geeft aan hoeveel procent
Alle categorieën moeten worden gebruikt (evt sommige samenvoegen
als overig), want de taartdiagram moet in totaal 100% zijn
o Staafdiagram
Hoogte geeft aan hoeveel procent of een aantal
Geen vaste volgorde
- Het gebruiken van een categorie overig kan handig zijn, maar pas er wel mee op je
wilt geen belangrijke informatie in de overige categorie stoppen
- Kwantitatieve variabelen
o Bladdiagram
Werkt het best bij kleine hoeveelheden data die allemaal boven de 0
zijn
Steel kan heel veel cijfers bevatten, maar het blad bestaat altijd uit
slechts 1 cijfer
Toont alle waarden
Rug tegen rug bladdiagram
Steel in het midden en aan beide kanten een blad
Handig om 2 sets data mee te vergelijken
Splitten bij veel date
2x bv 1 in de steel en dan bovenste blad eenheden 0 t/m 4 en
onderste blad eenheden 5 t/m 9
Bij veel decimalen eerst afronden en daarna een bladdiagram maken
o Histogram
Handiger bij grotere datasets
Geeft niet elke afzonderlijke waarden weer, maar aantallen of
procenten
Deel de individuele waarden op in groepen, zorg dat je telkens even
grote sprongen maakt (bv steeds sprongen van 10 als één groep)
Elke waarde moet precies in 1 groep vallen
Tel hoeveel waarden er in elke groep zitten (= frequentie) zit dit in
een tabel (= frequentietabel)
Teken het histogram staven tegen elkaar aan
X-as waardes
, Y-as aantal of procenten
o Gebruik een histogram met procenten als je een
vergelijking wilt maken zoals in het voorbeeld van
school A en B
Extreme waarden worden weergegeven in een staart
Staart aan links lage extreme waarden
Staart aan rechts hoge extreme waarden
- Verschillen tussen staafdiagrammen en histogrammen
o Histogram geeft verschillende waardes weer over één variabele, staafdiagram
geeft verschillende variabelen weer
o Histogram zit aan elkaar vast, staafdiagram heeft witruimte om de
verschillende variabelen aan te tonen
- Als je je data begrijpt kan je het ‘plotten’, vervolgens bekijk je de geplotte data om te
kijken voor een patroon en voor uitschieters
- Na het maken van een grafiek stel je jezelf de vraag wat je ziet
o Het maken van een grafiek is namelijk geen doel, maar een middel
o Patroon kan je ontdekken door te kijken naar de vorm, midden en spreiding
van de grafiek
Let op outliers losse uitschieter
Niet altijd maximum of minimum, moet ver van de overige
scores vandaan liggen
Belangrijk om te zoeken waar de outlier vandaan komt, kan bv
ook door technisch mankement komen en dus onjuiste
informatie geven
o Dingen om op te letten bij het aflezen van de grafiek
Eén of meerdere pieken (= modes)?
Eén unimodel
Symmetrisch of overhangend naar één zijde?
Overhangend naar rechts hogere waarden
Overhangen naar links lagere waarden
- Als er veel tijd verstrijkt tussen het verzamelen van de gegevens is het belangrijk dit
te verwerken in de grafiek om onjuiste conclusies te voorkomen door bv nieuwe
technologie kan er sprake zijn van een andere situatie
o Timeplot
X-as tijd
Y-as waarde
1.3 Describing Distributions with Numbers
- Nummerieke analyses geven meer specifieke details dan grafieken
o Bij categorische variabelen gebruiken we de getallen/procenten uit de
taartdiagram of staafdiagram om mee te rekenen
- Korte beschrijving van een kwantitatieve variabele zou informatie moeten bevatten
over de vorm en zou cijfers moeten geven die informatie brengen over de
mediaan/gemiddelde en verspreiding
o Vorm aan de hand van histogram of steelbladdiagram
o Mediaan/gemiddelde en verspreiding dmv berekeningen
- We kunnen the center op 2 manieren berekenen
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller 0970722. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.94. You're not tied to anything after your purchase.