Ik heb de aantekeningen gemaakt aan de hand van de hoorcolleges. Alle voorbeelden die de professor heeft gegeven zijn opgenomen in het document (in het paars). Met deze aantekeningen heb ik de eerste kans een 8.4 gehaald.
Ook heb ik mijn eigen denkstappen uitgeschreven, waardoor er veel oefenma...
Populatie: het totaal aantal personen/ elementen waarin je geïnteresseerd bent. Het hoeven
geen personen te zijn, maar kunnen ook landen, etc. zijn
Steekproef: omdat de populatie groot is, neem je een steekproef uit de populatie. een stukje uit
je populatie die je gaat meten.
Variabele: iets wat varieert en hetgeen wat je gaat meten, deze kun je indelen in:
Categorische variabele: je kunt hem indelen in categorieën, zoals geslacht/ haarkleur.
De tussenliggende waarden hebben geen betekenis. Soms kun je het wel ordenen, zoals
een opleidingsniveau.
Kwantitatieve variabele: de tussenliggende hebben wél een betekenis, zoals bij leeftijd.
de cijfers hebben hierbij een numerieke betekenis. Deze kun je weer indelen..
o Discrete variabele: een vaste waarde, zonder de tussenliggende waarden. Zoals
het aantal kinderen die je hebt: kan 2 of 3 zijn, maar niet 2.2 kinderen.
o Continue variabele: alle mogelijke waarden vormen een continuüm. Bijvoorbeeld
als je lengte gaat meten: 170 cm, maar ook 170.48 cm.
Het is belangrijk om dit onderscheid te maken, omdat het type variabele bepaalt welke soorten
analyse je mag maken.
Wooclap vraag: we meten of 3.5 jarige kinderen vijf blokjes correct kunnen tellen (ja/nee) →
categorisch
2 samenvattingen voor je data zijn:
Statistic (steekproefwaarde): een samenvattende waarde, zoals een gemiddelde of een
mediaan, die hoort bij de steekproef.
Parameter: deze heeft betrekking tot je populatie, het beschrijft de populatie.
Beschrijvende statistiek: gaat voornamelijk over de steekproef. Je wil patronen zien over de
data.
Toetsende statistiek (inductieve): het gebruiken van de statistic om iets te zeggen over die
parameter/ populatie. Met hoeveel zekerheid kun je nu zeggen dat de gegevens iets zeggen
over iedereen.
Beschrijvende statistiek voor één variabele:
we kunnen onze data grafisch weergeven
wat is nou een goede centrummaat? Dit is een representatieve maat om je gemiddelde
weer te geven, zoals een mediaan.
we kunnen ook naar spreidingsmaten gaan kijken
Je kunt categorische variabelen weergeven dmv:
Cirkeldiagram:
Staafdiagram: hierbij kun je kiezen of je de werkelijke frequentie op de Y-as laat zien of
een percentage. Je herkent een staafdiagram adhv de ruimte tussen de staafjes, want bij
een categorische variabele is er géén tussenwaarde.
Frequentietabel: (itt grafisch weergeven): kan ook met percentages erin
o Categorische variabelen frequentietabel:
, Deze tabel kun je gebruiken om data te gaan samenvatten. Kijk naar de correcte
categorie. De correcte categorie noemen we het een modale categorie (alleen
bij categorische variabele). Dat is de categorie waarin de meeste waarden zitten!
Kwantitatieve variabelen frequentietabel:
Hierbij gaat het dus dan echt om het aantal. We gebruiken de modus minder
vaak; liever bijvoorbeeld de mediaan of de gemiddelde.
Mediaan: dit is een centrummaat. Om een mediaan te bepalen ga je je data eerst ordenen van
klein naar groot (of andersom). Je gaat dus eerst alle scores op volgorde zetten. Daarna ga je
het in tweeën delen en het middelste getal is de mediaan. Het is niet altijd representatief, omdat
je alleen de middelste waarde pakt. Je kunt beter het gemiddelde gebruiken.
Gemiddelde: (zie formule in formuleboek). → kijk even naar slide nummer 29
Gemiddelde van een frequentieverdeling: → slide 30; frequentie * de waarde : aantal
observaties.
Mediaan vs gemiddelde
Wanneer gebruik je een mediaan en wanneer een gemiddelde? Gebruik de verdeling van de
waarden.
→
Bij een scheve verdeling ga je dus wel kiezen voor een mediaan!
Als de data scheef verdeeld is, kan je zeggen dat het gemiddelde niet zo correct weergegeven
wordt als dat de data is… Het gemiddelde wordt dus teveel naar de scheve kant getrokken. Bij
een normaal verdeling gebruiken we gewoon het gemiddelde.
Let op! Ook is soms het gemiddelde beter dan een mediaan, als je maar weinig discrete waarde
hebt, zoals: 0-0-0-0-10-10-10 → hierbij zou je dan als mediaan een 0 hebben, maar bij
gemiddelde 10. Dat is representatiever.
Hoe kun je een kwantitatieve variabelen weergeven?
,Hierbij heb je een numerieke verdeling. We maken vaak gebruik van histogrammen bij
kwantitatieve variabelen. Ook kan (volgens het boek) dotplots en steelblad diagrammen gebruikt
worden.
Het gebruik van een staafdiagram is handig omdat je bij kwantitatieve variabelen intervallen
hebt. Hierbij is het vaak een goed idee om als centrummaat het gemiddelde te pakken.
, Hoorcollege 2: paragraaf 2.4 t/m 2.6
Vanuit een statistic kan je iets zeggen over de parameter. Dit zegt iets over de steekproef of
populatie.
Een centrummaat geeft geen informatie over de spreiding.
Bereik (range): dit is het verschil tussen de maximale en de minimale score: hoogste - laagste
score = range.
Interkwartielafstand: Q3-Q1= hierbij ga je meerdere percentielen met elkaar combineren: Q1 =
25%, Q2 = mediaan, 50%, Q3 = 75% →
FORMULE INTERKWARTIEL IS Q3-Q1 = de interkwartielafstand!!!
Percentielen: dit deelt je data op in allerlei stukjes. p50 = dan de mediaan, 50%.
Mogelijke uitschieters:
Berekening is….
Q1 - 1.5 x IKA
Q3 + 1.5 x IKA
Dus alles wat onder die Q1 ligt is een uitschieter naar beneden, en boven de Q3 is een
uitschieter naar boven.
Voorbeeld met Wooclap:
00 - 1.5 x 9 = -13,5
0 + 0 x 1.5 = 22.5, dus alles wat daarboven ligt heeft mogelijke uitschieters. dat zijn hier dus de
24 + 25
Op het plaatje zie je de mogelijke uitschieter aan de bovenkant, dat noem je de snorhaar. Aan
de onderkant zie je die niet zitten. Deze bereken je dus door q1 - 1.5 x IKA of Q3 + 1.5 x IKA.
De interkwartielafstand wordt voornamelijk gebruikt bij scheef verdeelde verdelingen, omdat die
wordt gebruikt bij de mediaan. Bij een normaalverdeling kiezen we sneller het gemiddelde.
VOORBEELD:
We gaan kijken in welke mate er onderzoeksmatig wordt gewerkt onder de leerkrachten. We
hebben dus een steekproef en die gaan we eerst beschrijven → eerst het gemiddelde (als
representatieve maat) en dan ook een spreidingsmaat berekenen.
Als spreidingsmaat kunnen we de deviate gebruiken! Wat is nou een deviatie?...
Eerst pakken we het gemiddelde en dan gaan we voor elke
waarde bepalen wat de afstand is tot dat gemiddelde
Deviatie:
Waarde = x
Gemiddelde = x met streepje
Hier zie je een dotplot met 10 rondjes, dus ook
10 deelnemers, want een kenmerk van een dotplot
is dat alle observaties erin worden weergegeven.
We gaan nu bij elke waarde kijken wat de afstand van
de waarde tot het gemiddelde is.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sannejansssen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.