100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
College aantekeningen MAT-15301 Statistics 1 (MAT15303) €5,49   In winkelwagen

College aantekeningen

College aantekeningen MAT-15301 Statistics 1 (MAT15303)

 10 keer bekeken  1 keer verkocht

College aantekeningen van het vak Statistiek 1

Voorbeeld 2 van de 11  pagina's

  • 3 februari 2022
  • 11
  • 2020/2021
  • College aantekeningen
  • Eric boer
  • Alle colleges
Alle documenten voor dit vak (5)
avatar-seller
valentinevinagredossantosdionisio
Tutorial 1: Population, sample, variables, frequency table

Voordat je een onderzoek gaat doen moet je eerst verschillende dingen definiëren, zoals;
o Research question
o Population
o Unit
o Sample
o Variable (= property of an unit from the sample)

Population: every member of a group (persons, objects, etc.) for which we would like to collect
information.
Research question: question that we want to answer
Sample: part of the population that we will study and collect information for.
 Why sample? Too expensive or time consuming to study whole population, so we draw a
sample.
 We want to draw conclusions about the population, so sample should be representative of
the population.
Units: the elements of a sample from which we collect the information.
Variable: measured property of an element of the sample.
↳ Quantitative variable (continuous/discrete)
 Height, weight at birth (c = alle waarden kunnen gemeten worden, heel nauwkeurig)
 Number of children in a household, number of diseased plants in a field, number of
cigarettes each day for a pregnant woman (d = een specifiek aantal)
↳ Qualitative variable (nominal/ordinal)
 Hair colour, bachelor program, province, place of residence (n = een interpretatie, geen
getallen / je kan ze niet op een bepaalde volgorde zetten)
 Grade of eggs, highest level of education completed, annual salary (o = een interpretatie,
geen getallen dus niet mee rekenen, wél op volgorde)

Simple Random Sampling (SRS):
In SRS, units are drawn at random from a population. Every sample has equal chance to be selected.

Bias: certain parts of the population might be overrepresented as compared to other parts.
↳ Undersampling: certain groups are excluded from the sample. For example, not all
women give birth in the hospital, some from home. So hospital records aren’t enough for
a research about women giving birth.
↳ Non-response: not participating, or not successfully contacted
↳ Voluntary participation: might result in particularly positive or negative answers
↳ Response bias: social desirability bias (self-reported personal traits, questions about
income). There is a big chance that people will give a socially correct anwser instead a
honest answer.

Observational study: observe the unit/process without influencing it.
Experimental study: apply a treatment to the unit in order to observe a reaction.
↳ A cause-effect relationship can only be concluded from an experimental study.


Frequency: an absolute number
Relative frequency (fraction) = frequency / total
↳ advantage: easier to compare data

, Tutorial 2 – Numerical summary of data: measures of centre and dispersio, probability, the
law of large numbers, consistency


Mean (=gemiddelde): first add all the values and then divide by the amount of how many values
there are.

Median (M): first order the data from smallest to largest. With an odd number of data the median is
the midpoint/value. [e.g. 1,3,4,6,7,7,8]
With an even number of data the median is the mean of the two values in the middle. [e.g.
1,3,4,5,6,7,7,8 =5.5 ]
↳ The difference between the mean and median is; the median doesn’t react on the effect of
outliers and the mean does.
[e.g. 4,5,6,7,9  M=6, mean=6,2 | but when the last value changes 4,5,6,7,110  M=6, mean=26.4]

Standard deviation (sd=standaardafwijking): je rekent het verschil uit tussen de waarde en het
gemiddelde, dat kwadrateren, daarna plus precies hetzelfde bij de andere waardes. Hoe ver een
observatie gemiddeld af ligt van het gemiddelde. Als het dicht bij elkaar ligt dan is het een kleine
deviatie, ver van elkaar af is het een grote deviatie.
s = √ variance Variance: s2=¿ ¿ ¿
Range (=bereik/spreidingsbreedte): the difference between the maximum and minimum.

First quartile (Q1/lower quartile/25th percentile) = the middle value between the minimum and
median.
Third quartile (Q3/upper quartile/75th percentile) = the middle value between the median and
maximum
Interquartile range (IQR = Q3 – Q1) = box  kwartielafstand
↳ The interquartile range is not sensitive to outliers in contrast to the variance, and therefore
also in contrast to the standard deviation.

The pth percentile of a set of n ordered observations (from smallest to largest) is the value where at
most p% of the observations are smaller than it and at most (100-p)% of the observations are larger.
[e.g. 15 values in total. = 1 of the 15 values is lower than 1.83, so 1/15= 0.0667= 6.67% |13 of the 15
values are higher than 1.83, so 13/15= 0.8667= 86.67%]
Q1= a maximum of 25% below the value and a maximum of 75% above the value= nr. 4
Nr. Value % below % above
1 1.78 0.00 93.33
2 1.83 6.67 86.67
3 1.98 13.33 80.00
4 2.04 20.00 73.33
- Five-number summary
1. The sample minimum (=smallest observation)
2. The lower quartile (=first quartile/Q1)
3. The median (=middle value/second quartile/Q2)
4. The upper quartile (=third quartile/Q3)
5. The sample maximum (=largest observation)
Law of large numbers: relative frequencies stabilize if an experiment is repeated very often.
Statistical notation:
 n = sample size = number of persons in the sample
 y = number of persons that are relevant
 p = probability / chance

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper valentinevinagredossantosdionisio. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 73918 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€5,49  1x  verkocht
  • (0)
  Kopen