Statistiek (Moore, McCabe en Graig hoofdstuk 1 -3 en Passer Hoofdstuk 1 en 4) - Samenvatting
220 views 0 purchase
Course
Statistiek
Institution
Erasmus Universiteit Rotterdam (EUR)
Book
Craig, B: Introduction to the Practice of Statistics
Deze samenvatting is gebaseerd op de eerste drie hoofdstukken van het boek van Moore, McCabe en Graig en twee hoofdstukken uit het boek van Passer (Research methods). Het is geschreven in 2018 i.v.m. het vak statistiek cursus 1.3. op de Erasmus Universiteit voor de Premaster Pedagogische wetenschap...
Extensive summary Craig, B: Introduction to the Practice of Statistics - Statistics
Summary Lectures and Readings: Statistics 1 - Introduction (FSWPE1-032)
Detailed Summary: Lectures and Readings STATISTICS 2.2 FSWPE2-022
All for this textbook (11)
Written for
Erasmus Universiteit Rotterdam (EUR)
Pedagogische wetenschappen
Statistiek
All documents for this subject (7)
Seller
Follow
ReneeMWD
Reviews received
Content preview
Samenvatting Statistiek 1 (pedagogische wetenschappen bachelor jaar 1).
Een variabele geeft een waarde weer in de statistiek van individuen of units (cases). Een
case kan worden ingedeeld in verschillende variabelen:
Case: student 1
Variabelen: examen 1, examen 2, huiswerk gemaakt, geen huiswerk gemaakt etc.
Bij het onderzoeken van data stel je jezelf de volgende vragen:
1) Waarom? Welk doel heeft deze data? Hopen we hiermee specifieke vragen te
kunnen beantwoorden? Willen we conclusies trekken over individuen?
2) Wie? Wat voor individuen/ untis worden er beschreven?
3) Hoeveel? Hoeveel variabelen bevat de data? Wat zijn de exacte definities van deze
variabelen? Sommige variabelen kennen eenheden (gewicht, liters). Voor zulke data
is het belangrijk de bedoelde eenheden te kennen voordat je kunt starten met je
analyse.
Je hebt verschillende soorten variabelen. Categorische variabelen (deze soort plaatst een
individu in twee of meer groepen of ook wel categorieën). Kwantitatieve variabelen (deze
soort neemt numerieke waarden aan waarvoor rekenkundige bewerkingen zoals optellen of
aftrekken, delen en vermenigvuldigen zinvol zijn).
Een verdeling van een variabele vertelt ons welke waarde de variabele aanneemt en hoe
vaak deze waarde door de variabele voor komt.
Let op: een marginale keuze van variabele kan leiden tot verkeerde conclusies.
Bijvoorbeeld een onderzoek naar verkeersdoden. Wanneer je ervoor kiest
autobestuurders niet onderscheidt van motorbestuurders kan dit een verkeerd beeld
geven van het aantal verkeersdoden. Neem je de twee samen komt er een ander
gemiddelde uit dan wanneer je de twee onderscheidt. Onderscheiding vertelt meer
over de veiligheid in het verkeer. Op de motor heb je wellicht meer kans om te komen
bij een ongeluk dan met de auto. Het opstellen van meer variabele leidt dus tot een
betere conclusie over de risico’s in het verkeer.
Een verdeling van een variabele is gemakkelijk inzichtelijk te maken in een grafiek. Je hebt
twee basisstrategieën bij het onderzoeken van data. Data dien je te organiseren. Dit kun je
doen door:
- De individuele variabelen onderzoeken om vervolgens de relatie tussen de variabelen
te onderzoeken;
- Een diagram maken (of een grafiek) om daarna de numerieke samenvattingen toe te
voegen (of specifieke aspecten van de data).
Categorische data is visueel te maken door percentages of tellingen (counts). Een
staafdiagram kan hierbij handig zijn. Een taartdiagram laat zien welke verhouding één
categorie (een part) heeft ten opzichte van het geheel. Een taartdiagram is alleen te
gebruiken wanneer je alle waarden of percentages van de categorieën weet.
Grafieken zijn nodig om kwantitatieve data te begrijpen.
Extreme waarden komen voor in de staarten van de grafieken. De staarten zijn de uiteinde
van de verdeling. Hoge waarden komen voor in de rechterstaart en lage waarden komen
voorin de linker staart.
,Wanneer je een grafiek hebt gemaakt aan de hand van je data kan je starten met de
analyse. Belangrijke punten waar je op let:
- Het algehele patroon;
- Opvallende vertrekpunten;
- Uitschieters (extreme waarden).
Een “stemplot” geeft een vlug beeld van de vorm van de verdeling met de numerieke
waarden. Deze soort grafiek werkt het beste voor kleine getallen of voor kleine observaties.
In de stam plaats je tientallen en de “leafs” de bijbehorende waarden bij de gegeven
tientallen. Bij grotere getallen kan je er ook voor kiezen in de stam honderdtallen te plaatsen.
De bladeren van de grafiek veranderen dan in tientallen. Bij het vergelijken van twee
verdelingen kan de ook een rug-aan-rug stemplot maken. De bladeren van de stam komen
dan voort uit dezelfde stam.
0 358
1
2 11689
3 233599
4
5 78
Een andere veelvoorkomende grafiek is een histogram. Een histogram geeft tellingen weer
van variabelen. Het laat de frequenties zien tegenover de waarden van een alleenstaande
variabele.
Bij de analyse let je ook op de:
- Spreiding;
- Centrum.
Het centrum van de verdeling kan je beschrijven als het middelpunt. De spreiding is
gemakkelijk te geven door de laagste en de hoogste waarde te geven.
Een verdeling is symmetrisch wanneer de modus en de mediaan gelijk zijn. Bij een
symmetrische verdeling zijn na het middelpunt de hoogste en laagste waarden elkaars
spiegelbeeld. Het middelpunt is als het ware een spiegel voor de waarden aan de linkerkant
en rechterkant.
Een verdeling is scheef naar rechts als de rechterstaart langer is dan de linker staart. Er is
sprake van grote/ hoge waarden.
Wanneer je uitschieters in je data constateert zoek je ook naar de reden van deze
uitschieters. Zijn deze te verklaren?
Als je data analyseert die bestaat uit observaties dien de je tijden waarin de observaties zijn
waargenomen erbij te vermelden, zodat de verschillende tijden (en de andere observaties
die daar uit voorkomen) niet misleidend zijn voor je latere conclusies. Bij dit soort observaties
kan je bijvoorbeeld trends waarnemen of seizoen variatie (bijvoorbeeld de omzet van een
dorpssupermarkt, deze kan in de zomermaanden lager liggen dan normaal, omdat er in deze
periode meer mensen met vakantie zijn).
, Je kunt het centrum van de verdeling op verschillende manieren beschrijven. Je kunt het
gemiddelde berekenen (mean) of je kunt de mediaan (de waarde van de middelste
observatie) noteren. De mediaan is gemakkelijk te bereken door: (n+1)/2.
De “n” staat hierbij voor het aantal observaties. Het gemiddelde en de mediaan gedragen
zich anders. Het gemiddelde is te bereken door alle observaties bij elkaar op te tellen en dit
te delen door het totaal aantal observaties. Het gemiddelde is hierdoor erg beïnvloedbaar
voor uitschieters. De mediaan is dit niet. Wat de waarde van de uitschieter ook is, de
mediaan blijft hetzelfde. Bij een scheve verdeling ligt het gemiddelde meer in de lange staart
dan de mediaan. Door dit soort verschijningen zijn naast grafieken cijferreeksen in de
statistiek ook belangrijk.
De spreiding is eveneens belangrijk in de analyse. Wanneer je bijvoorbeeld het inkomen
van een bepaald land wilt vergelijken is het handig om te weten hoever het hoogste en het
laagste inkomen van elkaar verwijderd liggen. Een manier om de spreiding te noteren is door
de five- number- summary te geven.
Five- number- summary
Minimum- Q1- Mediaan- Q3- Maximum
Q1 = (eerste kwartiel, de mediaan van de eerste helft van de data)
Q3 = (laatste kwartiel, de mediaan van de tweede helft van de data)
Bij het visualiseren is een boxplot een handige grafiek om op te stellen. De verdeling van de
box wordt gevormd door Q1 en Q3. De lijn in de box is de mediaan. De lijnen buiten de box
geven de laagste en de hoogste waarden.
Extreem hoge waarden zeggen niet altijd iets over de algehele spreiding, maar de spreiding
tussen Q1 en Q3 zeggen soms meer over de verdeling. Je kunt daarom de
interquartilerange (interkwartielbereik) afkorting is IQR gebruiken om uitschieters te
detecteren. De IQR wordt als volgt berekent:
Q3-Q1= IQR
Om vervolgens te kunnen bepalen of een bepaalde waarde een uitschieter naar boven of
beneden is vermenigvuldig je de IQR met 1.5. Een observatie is een uitschieter wanneer
deze onder Q1-IQR ligt of boven Q3 +IQR ligt. Soms lijken waarden op uitschieters, maar
wanneer je deze onderwerpt aan de IQR regel kan er naar voren komen dat dit niet het geval
is volgens deze regel.
Standaardafwijking
De standaardafwijking (SD) of de sigma (de afwijking in een populatie) is de wortel van de
variatie. Net zoals een verdeling een gemiddelde heeft, hebben de spreidingen in deze
verdeling ook een gemiddelde. Een variatie is de gemiddelde spreiding van alle observatie
van hun modus/ gemiddelde (mean). We nemen de wortel van de variatie om deze naar
hetzelfde niveau te tillen als het gemiddelde. De SD laat de gemiddelde spreiding zien van
alle individuen van het gemiddelde. De som van alle afwijkingen is altijd nul (als je alle
afwijkingen van het gemiddelde bij elkaar optelt).
Als de observaties wijdt verspreid zijn in de verdeling is de SD groot. Deze is klein wanneer
alle observaties dicht bij hun modus liggen.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ReneeMWD. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.40. You're not tied to anything after your purchase.