100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Statistiek (Moore, McCabe en Graig hoofdstuk 1 -3 en Passer Hoofdstuk 1 en 4) - Samenvatting €4,10
In winkelwagen

Samenvatting

Statistiek (Moore, McCabe en Graig hoofdstuk 1 -3 en Passer Hoofdstuk 1 en 4) - Samenvatting

 220 keer bekeken  0 keer verkocht

Deze samenvatting is gebaseerd op de eerste drie hoofdstukken van het boek van Moore, McCabe en Graig en twee hoofdstukken uit het boek van Passer (Research methods). Het is geschreven in 2018 i.v.m. het vak statistiek cursus 1.3. op de Erasmus Universiteit voor de Premaster Pedagogische wetenschap...

[Meer zien]

Voorbeeld 3 van de 17  pagina's

  • Nee
  • H1, h2, h3
  • 15 augustus 2018
  • 17
  • 2017/2018
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (7)
avatar-seller
ReneeMWD
Samenvatting Statistiek 1 (pedagogische wetenschappen bachelor jaar 1).
Een variabele geeft een waarde weer in de statistiek van individuen of units (cases). Een
case kan worden ingedeeld in verschillende variabelen:
Case: student 1
Variabelen: examen 1, examen 2, huiswerk gemaakt, geen huiswerk gemaakt etc.
Bij het onderzoeken van data stel je jezelf de volgende vragen:
1) Waarom? Welk doel heeft deze data? Hopen we hiermee specifieke vragen te
kunnen beantwoorden? Willen we conclusies trekken over individuen?
2) Wie? Wat voor individuen/ untis worden er beschreven?
3) Hoeveel? Hoeveel variabelen bevat de data? Wat zijn de exacte definities van deze
variabelen? Sommige variabelen kennen eenheden (gewicht, liters). Voor zulke data
is het belangrijk de bedoelde eenheden te kennen voordat je kunt starten met je
analyse.
Je hebt verschillende soorten variabelen. Categorische variabelen (deze soort plaatst een
individu in twee of meer groepen of ook wel categorieën). Kwantitatieve variabelen (deze
soort neemt numerieke waarden aan waarvoor rekenkundige bewerkingen zoals optellen of
aftrekken, delen en vermenigvuldigen zinvol zijn).
Een verdeling van een variabele vertelt ons welke waarde de variabele aanneemt en hoe
vaak deze waarde door de variabele voor komt.

Let op: een marginale keuze van variabele kan leiden tot verkeerde conclusies.
Bijvoorbeeld een onderzoek naar verkeersdoden. Wanneer je ervoor kiest
autobestuurders niet onderscheidt van motorbestuurders kan dit een verkeerd beeld
geven van het aantal verkeersdoden. Neem je de twee samen komt er een ander
gemiddelde uit dan wanneer je de twee onderscheidt. Onderscheiding vertelt meer
over de veiligheid in het verkeer. Op de motor heb je wellicht meer kans om te komen
bij een ongeluk dan met de auto. Het opstellen van meer variabele leidt dus tot een
betere conclusie over de risico’s in het verkeer.

Een verdeling van een variabele is gemakkelijk inzichtelijk te maken in een grafiek. Je hebt
twee basisstrategieën bij het onderzoeken van data. Data dien je te organiseren. Dit kun je
doen door:
- De individuele variabelen onderzoeken om vervolgens de relatie tussen de variabelen
te onderzoeken;
- Een diagram maken (of een grafiek) om daarna de numerieke samenvattingen toe te
voegen (of specifieke aspecten van de data).
Categorische data is visueel te maken door percentages of tellingen (counts). Een
staafdiagram kan hierbij handig zijn. Een taartdiagram laat zien welke verhouding één
categorie (een part) heeft ten opzichte van het geheel. Een taartdiagram is alleen te
gebruiken wanneer je alle waarden of percentages van de categorieën weet.
Grafieken zijn nodig om kwantitatieve data te begrijpen.
Extreme waarden komen voor in de staarten van de grafieken. De staarten zijn de uiteinde
van de verdeling. Hoge waarden komen voor in de rechterstaart en lage waarden komen
voorin de linker staart.

,Wanneer je een grafiek hebt gemaakt aan de hand van je data kan je starten met de
analyse. Belangrijke punten waar je op let:
- Het algehele patroon;
- Opvallende vertrekpunten;
- Uitschieters (extreme waarden).
Een “stemplot” geeft een vlug beeld van de vorm van de verdeling met de numerieke
waarden. Deze soort grafiek werkt het beste voor kleine getallen of voor kleine observaties.
In de stam plaats je tientallen en de “leafs” de bijbehorende waarden bij de gegeven
tientallen. Bij grotere getallen kan je er ook voor kiezen in de stam honderdtallen te plaatsen.
De bladeren van de grafiek veranderen dan in tientallen. Bij het vergelijken van twee
verdelingen kan de ook een rug-aan-rug stemplot maken. De bladeren van de stam komen
dan voort uit dezelfde stam.


0 358
1
2 11689
3 233599
4
5 78


Een andere veelvoorkomende grafiek is een histogram. Een histogram geeft tellingen weer
van variabelen. Het laat de frequenties zien tegenover de waarden van een alleenstaande
variabele.
Bij de analyse let je ook op de:
- Spreiding;
- Centrum.
Het centrum van de verdeling kan je beschrijven als het middelpunt. De spreiding is
gemakkelijk te geven door de laagste en de hoogste waarde te geven.
Een verdeling is symmetrisch wanneer de modus en de mediaan gelijk zijn. Bij een
symmetrische verdeling zijn na het middelpunt de hoogste en laagste waarden elkaars
spiegelbeeld. Het middelpunt is als het ware een spiegel voor de waarden aan de linkerkant
en rechterkant.
Een verdeling is scheef naar rechts als de rechterstaart langer is dan de linker staart. Er is
sprake van grote/ hoge waarden.
Wanneer je uitschieters in je data constateert zoek je ook naar de reden van deze
uitschieters. Zijn deze te verklaren?
Als je data analyseert die bestaat uit observaties dien de je tijden waarin de observaties zijn
waargenomen erbij te vermelden, zodat de verschillende tijden (en de andere observaties
die daar uit voorkomen) niet misleidend zijn voor je latere conclusies. Bij dit soort observaties
kan je bijvoorbeeld trends waarnemen of seizoen variatie (bijvoorbeeld de omzet van een
dorpssupermarkt, deze kan in de zomermaanden lager liggen dan normaal, omdat er in deze
periode meer mensen met vakantie zijn).

, Je kunt het centrum van de verdeling op verschillende manieren beschrijven. Je kunt het
gemiddelde berekenen (mean) of je kunt de mediaan (de waarde van de middelste
observatie) noteren. De mediaan is gemakkelijk te bereken door: (n+1)/2.
De “n” staat hierbij voor het aantal observaties. Het gemiddelde en de mediaan gedragen
zich anders. Het gemiddelde is te bereken door alle observaties bij elkaar op te tellen en dit
te delen door het totaal aantal observaties. Het gemiddelde is hierdoor erg beïnvloedbaar
voor uitschieters. De mediaan is dit niet. Wat de waarde van de uitschieter ook is, de
mediaan blijft hetzelfde. Bij een scheve verdeling ligt het gemiddelde meer in de lange staart
dan de mediaan. Door dit soort verschijningen zijn naast grafieken cijferreeksen in de
statistiek ook belangrijk.
De spreiding is eveneens belangrijk in de analyse. Wanneer je bijvoorbeeld het inkomen
van een bepaald land wilt vergelijken is het handig om te weten hoever het hoogste en het
laagste inkomen van elkaar verwijderd liggen. Een manier om de spreiding te noteren is door
de five- number- summary te geven.
Five- number- summary
Minimum- Q1- Mediaan- Q3- Maximum



Q1 = (eerste kwartiel, de mediaan van de eerste helft van de data)
Q3 = (laatste kwartiel, de mediaan van de tweede helft van de data)
Bij het visualiseren is een boxplot een handige grafiek om op te stellen. De verdeling van de
box wordt gevormd door Q1 en Q3. De lijn in de box is de mediaan. De lijnen buiten de box
geven de laagste en de hoogste waarden.
Extreem hoge waarden zeggen niet altijd iets over de algehele spreiding, maar de spreiding
tussen Q1 en Q3 zeggen soms meer over de verdeling. Je kunt daarom de
interquartilerange (interkwartielbereik) afkorting is IQR gebruiken om uitschieters te
detecteren. De IQR wordt als volgt berekent:
Q3-Q1= IQR
Om vervolgens te kunnen bepalen of een bepaalde waarde een uitschieter naar boven of
beneden is vermenigvuldig je de IQR met 1.5. Een observatie is een uitschieter wanneer
deze onder Q1-IQR ligt of boven Q3 +IQR ligt. Soms lijken waarden op uitschieters, maar
wanneer je deze onderwerpt aan de IQR regel kan er naar voren komen dat dit niet het geval
is volgens deze regel.
Standaardafwijking
De standaardafwijking (SD) of de sigma (de afwijking in een populatie) is de wortel van de
variatie. Net zoals een verdeling een gemiddelde heeft, hebben de spreidingen in deze
verdeling ook een gemiddelde. Een variatie is de gemiddelde spreiding van alle observatie
van hun modus/ gemiddelde (mean). We nemen de wortel van de variatie om deze naar
hetzelfde niveau te tillen als het gemiddelde. De SD laat de gemiddelde spreiding zien van
alle individuen van het gemiddelde. De som van alle afwijkingen is altijd nul (als je alle
afwijkingen van het gemiddelde bij elkaar optelt).
Als de observaties wijdt verspreid zijn in de verdeling is de SD groot. Deze is klein wanneer
alle observaties dicht bij hun modus liggen.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ReneeMWD. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €4,10. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 53022 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€4,10
  • (0)
In winkelwagen
Toegevoegd