This summary consists of all the information and theory given in the lectures and notes of the Data Statistics course in 2020/2021. This theory forms an important basis for anything related to statistics. So, this summary will not only help you pass the Data Statistics exam, it will also be a usefu...
Lieve Göbbels
Data Statistics (JBM010)
Semester 1, 2020-2021
Data Statistics (JBM010)
Probability Theory 2
Introduction 2
Important de nitions 2
Rules for sets / events 3
Historical de nitions of probability theory 3
Conditional probabilities 4
Rules for counting 4
Different sampling methods 4
Probability distributions 5
Functions of random variables 7
Expectation, variance and standard deviation (std) 7
Rules for expectation and variance 8
Covariance and correlation 9
Quantiles 9
Sampling Theory 11
Population and sample statistics 11
Sampling methods 11
Inferential Statistics 12
Sample statistics and estimators 12
Random sampling with replacement 12
Random sampling without replacement 13
Pdf of a sample mean 13
Central Limit Theorem 13
Consequences of the CLT 13
Properties of S-squared and S 14
Standard errors 14
Statistical procedures 14
Hypothesis testing for mu when sigma is known 15
Hypothesis tests and p-values for mu when sigma is known 17
Inference about mu when sigma is unknown 17
Common formats 19
, Probability Theory
In short:
• Introduction
• Important de nitions
• Rules for sets / events
• Historical de nitions of probability theory
• Conditional probabilities
• Rules for counting
• Different sampling setups
• Probability distributions
• Functions of random variables
• Expectation, variance and standard deviation
• Rules for expectation and variance
• Covariance and correlation
• Quantiles
Introduction
In data science, one measures speci c sets of objects. The set of objects that is under investigation,
is called the population. The objects in this population are called elements. Measurements (data) are
made on these elements and re ect a certain characteristic. Usually, due to the largeness of
populations, merely a sample of elements of this population is used for statistical measurements.
This sample represents the larger population. Statistics consists of four sub- elds:
- probability theory;
- sampling theory (methods of sampling and their properties);
- descriptive statistics (summarizing and presenting the data);
- inferential statistics (methods to draw conclusions about distinctive numbers of the whole
population of interest by considering data from a sample).
Important de nitions
Random experiment = an experiment/phenomenon for which the outcome is determined by
chance
Outcome = possible results of an experiment
Sample space (Ω) = all the possible outcomes of an experiment
Event = subsets of the sample space (Ω)
Partition = collection of subsets of the sample space if mutually disjoint and the
union is Ω
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Lieve12. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,74. Je zit daarna nergens aan vast.