Dataset
Regio = Nominaal
Doden = Discreet
Minuten = Continue
Histogram Distribution (hoe vaak komt elke waarde voor).
Unimodal (komt het meest voor)
Bimodal verschillend gedacht (doodstraf).
Unimodal = vaak scheef (skewed to the right)
Tot the left bijvoorbeeld bij sterftecijfer mensen.
Outlier Iets wijkt heel erg af.
- Gemiddelde = sommatie observatie / aantal observaties.
- Mediaan. Middenpunt. 1) Ordenen, dan 2) Middelste getal
- Modus. Waarde die het vaakst voorkomt.
- Spreiding. Afwijking van gemiddelde.
o Meer spreiding Meer onzekerheid.
o Standaarddeviatie Hoeveel er gemiddeld wordt afgeweken van het gemiddelde.
Voorbeeld van 7 mannen. Om Standaarddeviatie te berekenen doe je de afwijkingen in het kwadraat.
Hoe groter de SD Hoe groter de spreiding.
Percentiel Hoeveel procent onder een bepaald punt valt (vaak bij toelatingstoetsen).
p.de percentiel.
IQR
Vaak gebruikt: 25e, 50e, 75e .
Q1, Q2(mediaan), Q3
IQR = Q3 – Q1
Outliers: 1,5 . IQR
Q1 – 60 = 30 en Q3 + 60 = 190
Voorbeeld cyberpestgedrag.
Quiz.
College 2
Skewed to the right Gemiddelde rechts van de mediaan.
Bivariate Twee variabelen.
Explanatory/independent Dependent/Response
X Y
Associatie: waarde van X hangt samen met de waarde van Y (bijv. Leren Tentamen)
Groentekweek.
Conditionele proportie (0.23) alleen kijkend naar bepaalde conditie.
Marginale proportie (0.73) kijken naar verschillende condities.
Scatterplot (puntjes)
GDP & Internetgebruik.
Hoe hoger X Hoe hoger Y.
Lineair verband als je ruw een rechte lijn kunt trekken.
Correlatie: beschrijft de sterkte van het lineaire verband. Symbool: r. Range: -1 – 1
Negatieve/Positieve correlatie.
Onafhankelijk van meeteenheden.
Correlatie drukt associatie uit in een getal.
-3 en + 3 geen significante correlatie.
Regressie = door middel van X Y voorspellen.
Y(hat) =a + bx
Voorspelde y intercept slope(helling)
Voorbeeld.
Aantal observaties liggen niet op de lijn. Verschil tussen geobserveerde y en voorspelde Y =
voorspellingsfout (RESIDU)
Method of least squares Zo klein mogelijk is beter.
, Als er een associatie bestaat tussen variabelen, dan betekent dat nog niet dat er ook causaliteit is.
Causaliteit: A leidt tot B.
Aan welke voorwaarden moet voldaan zijn?
- A en B hebben een associatie met elkaar.
- A gaat vooraf in tijd aan B.
- Als het theoretisch plausibel is, als alternatieve verklaringen zijn uitgesloten.
Probeer altijd rekening te houden met confounders (alternatieve variabele) Beïnvloedt de associatie
tussen X en Y.
In je onderzoek ga je al opzoek naar mogelijke confounders (vb. cyberpesten, misschien
leeftijd[mogelijk beïnvloeden ze de relatie])
Confounders wel gemeten in studie (je houdt er rekening mee)
Lurking variable: Potentiële confounder. Kan ook X en Y verstoren, maar is niet gemeten in de
studie.
Kansberekening.
P(probability) = hoe vaak komt de ‘juiste uitkomst’ voor van het totaal aantal uitkomsten?
2.
- P(A of B) = Overlapping. P (A) + P(B) – P(A en B)
- Zonder overlap (disjoint): P (A of B) = P(A) + P(B)
3. P (A en B)
A en B zijn onafhankelijk: P( A en B) = P (A) x P(B)
A en B zijn afhankelijk: P(A en B) = P(A) x P(B | A)
P ( A| B) is een conditionele kans.
HOe weet je of kansen afhankelijk of onafhankelijk zijn?
Checken van onafhankelijkheid:
1. Is P(A|B) = P(A)?
2. Is P(B|A) = P(B)?
3. Is P( A and B) = P(A) x P(B)?
College 3
Disjoint: Kans = P(A) + P(B)
Intercept is de waarde van Y als x=0 (Aantal studie uren invloed op tentamencijfer).
Slope geeft aan hoeveel die lijn stijgt of misschien wel daalt. Dus als x 1 stap om hoog gaat, hoeveel
gaat Y dan omhoog/omlaag.
Method of Least squares: zo klein mogelijke RSS.
Positief residu: Geobserveerde Y is hoger dan de Voorspelde Y.
Inferentiële statistiek: voorspellen.
De sterke van een verband wordt uitgedrukt met correlatie.
Associatie betekent verband.
Causaliteit: A leidt tot B.
IQR: Inter Quartile Range (Q1 – Q3)
Vraag 4: Skewness naar links.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper gjdekker. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,48. Je zit daarna nergens aan vast.