Beschrijvende Statistiek, alle hoorcolleges in 1 document
15 keer bekeken 0 keer verkocht
Vak
Beschrijvende Statistiek (7082S033AY)
Instelling
Universiteit Van Amsterdam (UvA)
Boek
Statistics: The Art and Science of Learning from Data
Alle hoorcolleges van het vak Beschrijvende Statistiek worden in dit document behandeld. Er worden regelmatig verwezen naar de pokerpoints, hierbij is de slide met uitleg toegevoegd.
Samenvatting Beschrijvende en Inferentiele statistiek (BIS)
Alles voor dit studieboek (1)
Geschreven voor
Universiteit van Amsterdam (UvA)
Pedagogische Wetenschappen
Beschrijvende Statistiek (7082S033AY)
Alle documenten voor dit vak (40)
Verkoper
Volgen
jodywiersma
Ontvangen beoordelingen
Voorbeeld van de inhoud
Alle hoorcolleges Beschrijvende Statistiek | 2021-2022
Hoorcollege 1
Populatie: totaal aantal elementen of personen waarin je geïnteresseerd bent (zo specifiek
mogelijk)
Steekproef: stukje uit de populatie, kleiner deel van de populatie die je uiteindelijk gaat
meten
Variabele: bepaald kenmerk of eigenschap van de steekproef/populatie dat varieert. Dit kan
allemaal waarden aannemen.
Categorische variabele: indelen in categorieën, bijvoorbeeld geslacht of haarkleur (alle
typen haarkleur krijgen in SPSS een code, willekeurige gekozen) Je kan niet rekenen met
deze getallen, de getallen hebben geen betekenis
Kwantitatieve variabele: cijfers hebben wel betekenis. Hierbij representeert de waarde
hoeveel je van iets hebt, bijvoorbeeld leeftijd. Hier kan je mee rekenen.
Discrete variabele: aantal vaste waarden. Geen tussenwaarden. Bijvoorbeeld het
aantal kinderen per gezin, je kan geen 1,3 kind hebben. Vaak hele getallen.
Continue variabele: tussenwaarden hebben ook betekenis, bijvoorbeeld lengte
170,456 cm. Oneindig veel waarden.
Statistic: steekproefwaarde. Dit is een samenvatting van de data in de steekproef.
Bijvoorbeeld een gemiddelde. We proberen met de statistic de populatieparameter te gaan
schatten.
Parameter: dit een samenvatting van de data in de populatie.
Beschrijvende statistiek: samenvatten en beschrijven van data, en grafisch weergeven
ervan.
Toetsende statistiek: wat zeggen de gegevens over de populatie waarna we willen
generaliseren. Wordt ook wel inferentiële of inductieve statistiek genoemd.
Beschrijvende statistiek voor 1 variabele
Grafische weergave
Centrummaten: 1 waarde die representatief is om je steekproef weer te geven.
Bijvoorbeeld een gemiddelde.
Beschrijvende statistiek categorische variabele
Grafische weergave (categorisch)
Cirkeldiagram (taartpunten)
Staafdiagrammen (in frequenties of in percentages) (staafjes staat niet tegen elkaar
aan)
Tabellen of in SPSS
Modus: meest voorkomende categorie
Modale categorie: categorie die het meest voorkomt (bijv correct, zie dia 25)
Modus wordt meestal bij categorisch gebruikt en minder bij kwantitatief
Beschrijvende statistieken kwantitatieve variabele
Mediaan en gemiddelde wordt vaker bij kwantitatieve variabelen gebruikt.
, Alle hoorcolleges Beschrijvende Statistiek | 2021-2022
Mediaan: data ordenen van groot naar klein of van klein naar groot. De volgorde delen door
twee en de middelste score is de mediaan. Bij oneven is het het gemiddelde tussen de twee
getallen waar het omgaat. Bij 5-6-7-8, is het 6,5. Je kan hierbij makkelijk naar de cumalatieve
procent kijken waar die 50% is.
Gemiddelde
Mediaan vs gemiddelde
Het hangt af van de waarde van steekproef welke je gebruikt.
Scheef naar linkse verdeling: zie die 41. Gemiddelde gaat richting de staart.
Scheef naar rechts verdeling: dia 42. Gemiddelde gaat meer naar rechts (staart)
Als je verdeling scheef is, is het representatiever om de mediaan te gebruiken. Dit is
representatiever voor het grootste gedeelte van de steekproef. Bij symmetrische verdeling is
het beter om het gemiddelde te gebruiken. Gemiddelde is heel gevoelig voor uitschieters.
Centrummaat (modus, mediaan, gemiddelde) wil altijd het grootste gedeelte van de
steekproef beschrijven.
Bij dia 43 kan je beter gemiddelde gebruiken.
Beschrijvende statistiek kwantitatieve variabele
Grafische weergave
Histogram (alle staafjes tegen elkaar aan), intervallen van gelijke grootte
Dia 50: potentiële outliner, potentiële uitschieter
Hoorcollege 2
Bij histogram (zie dia 6) hoort de 1 niet bij het staafje, die hoort pas bij het volgende staafje.
Het bereik (de range)
Het bereik, ook wel range of variatiebreedte genoemd, geeft weer binnen welke afstand van
elkaar alle geobserveerde waarden zich bevinden. Het wordt berekend door: maximum –
minimum.
Interkwartielafstand
De interkwartielafstand is:
IQR = Q3 – Q1, waarbij Q3 overeenkomt met P75 en Q1 overeenkomst met P25.
Percentielen
Het Pde percentiel is de waarde waarvoor geldt dat p procent van de waarnemingen kleiner
is, of er gelijk aan is. Bijvoorbeeld: de waarde waarvoor de helft van alle waarnemingen
kleiner of gelijk is, heet het 50ste percentiel. Deze wordt genoteerd als P50 en wordt ook wel
de mediaan genoemd.
, Alle hoorcolleges Beschrijvende Statistiek | 2021-2022
Summary boek:
Bepaal de mediaan: Q2
Bepaal dan de mediaan tot Q2: Q1
Bepaal dan de mediaan na Q2: Q3
Mogelijke uitschieters:
- Q1 – 1,5 x IKA (interkwartielafstand)
- Q3 + 1,5 x IKA
Zie dia 37 voor boxplot. De zwarte strepen zijn de snorharen. Als Q1 0 is, dan heb je maar
een snorhaar.
Deviatie
X – xgemiddelde
Variantie (de schatter voor de populatie in kwadraat)
Zie dia 43
Standaardvariantie (de schatter voor de populatie-waarde x) is
Zie dia 50
Empirische regel
68% van alle waarden binnen xgemiddelde +/- 1s
95% van alle waarden binnen xgemiddelde +/- 2s
Bijna alle waarden binnen xgemiddelde +/- 3s
Potentiële uitschieters als het meer dan 3 s boven xgemiddelde ligt.
Z-score (voor potentiële uitschieters)
De Z-score, of standaardscore (zie dia 60)
Aantal standaarddeviaties dat een score afligt van de gemiddelde score
Geeft aan hoe extreem/bijzonder een waarde is (mogelijke uitschieter?)
Onafhankelijk van meetschaal (gestandaardiseerd)
Hoorcollege 3
Samenhang categorische variabelen
Is er een samenhang tussen sekse en gepest worden?
Hierbij moet je eerst gebruik maken van het maken van een kruistabel (continuous tabel)
van je steekproef. Dit kan bijvoorbeeld met SPSS.
Sekse is de afhankelijke variabelen, de verklarende variabele (explanetory variabele)
Wel of niet gepest worden is de onafhankelijke variabele
Niveaus van onafhankelijke variabele in de rijen en die van de afhankelijke variabele in de
kolommen. De frequenties komen in de tabel.
De celfrequenties zijn alle mogelijke combinaties: het vierkantje op dia 5.
De randfrequenties of marginale frequenties: het totaal per categorie van elke variabele
De totale frequentie: totale aantal mensen in je steekproef (complete totaal), rode
vierkantje in dia 5
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jodywiersma. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor $6.75. Je zit daarna nergens aan vast.