College
Introduction to statistics
Statistics: een manier om informatie uit gegevens te halen. Je verzamelt, analyseert en
interpreteert data om inzicht te krijgen in een bepaald fenomeen om je te kunnen helpen in
besluitvormingsprocessen. Stellingen vormen over werkelijke wereldse fenomenen.
Populatie: set van alle interessante onderdelen in een statistisch probleem waar je als
onderzoeker onderzoek naar wilt doen
Parameter: beschrijvende maatstaf van een populatie (%, gemiddelde lengte…)
Steekproef: deel van de populatie waar je je onderzoek op uitvoert, om vervolgens iets over
het geheel te kunnen zeggen
Statistic: beschrijvende maatstaf van de steekproef
Beschrijvende vs. inferentiële statistiek
Beschrijvend: toepassen op populatie of een steekproef (meestal steekproef) en eerste
stap naar inferentiële statistiek
Presenteren en samenvatten van data op een effectieve (compact, inzichtelijk om juiste
snelle conclusies te trekken) manier
Beschrijven via: tabellen en grafische gereedschappen en numerieke samenvattende maten
(mediaan, gemiddelde, etc…)
Inferentiële: conclusies trekken over de populatie (parameters) gebaseerd op steekproef
(statistics). Informatie van het kleine deel proberen toe te passen op het grote geheel
(gevolgtrekkende statistiek)
Onzekerheid groot → kansrekening wordt gebruikt om te meten of uitspraken betrouwbaar
zijn of niet
De keuze van de juiste statistische techniek hangt af van het meetniveau (of type) van de
geanalyseerde variabelen
Variabele: kenmerk van de populatie waar ik onderzoek naar wil doen (of interest to us)
Kwalitatief vs kwantitatief
Kwalitatief: kenmerken die gemeten worden waarbij
de uitkomst in een categorie ingedeeld kan worden
Meetniveaus:
- Nominaal: wederzijds uitsluitende categorieën,
labelen/naamgeving
- Ordinaal: natuurlijke rangordening mogelijk
Kwantitatief: kenmerken die gemeten worden waarbij
de uitkomst numeriek zijn (resultaat van meetproces of
telproces)
, Statistiek
- Interval: natuurlijke afstand toegevoegd (schoenmaat, temperatuur)
- Ratio: absoluut nulpunt (verhoudingen kunnen bepaald worden)
Descriptive techniques for quantitative data:
Frequency tables and histograms
Data verzamelen → frequentie distributie voorbereiden → histogram maken
Frequentieverdeling: tabel waarbij de waarneming in niet-overlappende intervallen of
klassen worden ingedeeld en van elk klasse/interval het aantal observatie wordt genoteerd
Intervalgrenzen goed aangeven! Keller: bovengrens bij de volgende klasse rekenen en de
ondergrens hoort bij de vorige klasse (0 wordt wel meegenomen bij volgende/eerste klasse)
Hoeveel klassen gebruik je?
Klassen breedte = range (grootste - kleinste observatie) / #klassen
Bin (bovengrens van een bepaalde klasse) naast frequentie (aantal observaties) →
histogram
Vormen van een histogram
- Symmetrisch: observaties zijn in balans (bij benadering gelijk)
- Scheefheid (skewness): positief (hoge piek links en uitloop naar rechts) en negatief
(hoge piek rechts en uitloop naar links)
Modale klasse: de klasse met het hoogste aantal observaties (met gelijke klassenbreedte)
één modale klasse → unimodal histogram en twee modale klassen → bimodal histogram
- Bell shaped histogram: normaalverdeling
Cumulative relative frequencies and ogives
Ogives: grafische weergave van een cumulatieve relatieve frequentieverdeling
Frequentie → voor iedere klassen tellen hoeveel observaties er kleiner dan of gelijk aan de
bovengrens zijn (alle voorgaande klassen ook meenemen) → cumulatieve frequentie →
alle cumulatieve frequenties delen door het aantal observaties → cumulatieve relatieve
frequentie (percentage/frequentie op y-as 0-1.00) (→ vermenigvuldigen met 100 voor de
cumulatieve relatieve percentages)
Stem-and-leaf-display (steel-bladdiagram): individuele uitkomsten zijn zichtbaar gebleven
- Grafische weergave gebruikt bij voorlopige analyse
- Alternatief voor histogram
Bepaal wat de stam en blad zijn (bijv. links van komma is steel en rechts is blad)
Linkergrens (.0) wordt bij klassen genomen
, Statistiek
Descriptive techniques for qualitative data
- Pie charts (taartdiagram): benadrukken de proportie van het voorkomen van
verschillende categorieën (relatieve aantallen/proporties)
Vaak populair voor nominale gegevens → grootte van de klassen is proportioneel
met het percentage/aantal graden dat de schijf beschrijft (/100*360)
- Bar charts (staafdiagrammen): benadrukken de frequentie van het voorkomen van
verschillende categorieën (voor absolute aantallen)
Frequentie van elke categorie is gerepresenteerd door een verticale staaf
Wanneer de volgorde/rangorde van kwalitatieve data betekenis hebben (ordinale
gegevens)
Describing time-series data
Data kan geclassificeerd worden door de tijd waarop ze zijn gemeten
- Cross-sectional (dwarsdoorsnede): data is allemaal op dezelfde tijd verzameld
- Time-series (tijdreeks): data dat op opeenvolgende tijdstippen is verzameld
Weergeven via een lijndiagram → tijdseenheid op x-as en variabele op y-as (helling
gebruiken voor conclusies)
Graphical excellence and deception
Excellent (or effective) graphical techniques are informative and concise, and provide a clear
presentation of the data → important to be able to evaluate critical information presented by
graphical techniques
Things to be cautious about: is there a missing scale on one axis? Do not be influenced by a
graph’s caption! Are changes presented in absolute values only, or in percent form too?
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ilsadejoode. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.97. You're not tied to anything after your purchase.