Een paar basisbegrippen van statistiek:
Population: de complete groep (bestaande uit losstaande ‘elements’) die onderzocht wordt
Sample: een voorbeeld (groepje) van/uit de originele populatie dat men gebruikt om
representatieve informatie te onderzoeken van een onmeetbaar grote groep`
Measurements/data: de meetgegevens van de groep over het te bestuderen verschijnsel
Data (van samples) moeten worden verzameld en opgesomd, pas daarna gaat men
onderzoeken welke conclusies er voor de hele populatie getrokken kunnen worden
Elements: de objecten die in het onderzoek gebruikt worden (bijvoorbeeld mensen of
evenementen) en deze objecten kunnen aan de hand van een karakteristiek met elkaar
vergeleken worden (bijvoorbeeld leeftijd)
Metingen worden uitgedrukt in (population) variabelen die de waarde van de karakteristiek
weergeven en die van waarde veranderen als de uitkomst van de meting verandert.
Metingen worden ook wel observatie(waardes) , of data(punten) genoemd
Het principe van Inferential statistics stelt dat je bij het bekijken van een zeer grote groep
een ‘sample’ moet nemen en aan de hand daarvan een conclusie voor de hele groep moet
trekken.
Descriptive statistics:
Het verzamelen en ordenen van data, om deze vervolgens weer te geven in tabellen of
grafieken en er ‘distinctive numbers’ (oftewel statistics) mee te bepalen (bijvoorbeeld de
variantie berekenen). Statistics meten iets van de gehele groep.
Probability (theory):
Bestudeert het gedrag en de regels van kansberekening, waarbij er in experimenten vaak
meerdere uitkomsten met bijbehorende kansen mogelijk zijn. Als je bijvoorbeeld een
methode voor het verzamelen van data wilt kiezen, kijk je naar de methode met in dit geval
de grootste kans op een volledige en goede meting.
Sampling theory:
Bestudeert de verschillende methodes om uit een grote groep een voorbeeld groepje te
selecteren, bijvoorbeeld ‘random sampling’, waarbij ieder individu uit de populatie een
gelijke kans heeft om als voorbeeld gekozen te worden.
Inferential statistics:
Verstrekt en bestudeert de mogelijkheden om conclusies te trekken over de gehele populatie
aan de hand van ‘distinctive numbers’ (zoals het gemiddelde) van de voorbeeldgroep.
,‘Qualitative/categorical variable’:
Een variabele die niet met getallen meet, maar in vastgelegde categorieën (bijvoorbeeld
kledingmaten), een variabele met twee categorieën wordt een alternatieve/’dichotomous’
variabele genoemd en een variabele met categorieën één en nul heet een dummy variabele
Kwalitatieve variabelen kunnen onderverdeeld worden in twee soorten: nominal
(categorieën zijn niet boven of onder elkaar te rangschikken) en ordinal (categorieën zijn wel
te rangschikken, zoals kledingmaten)
Een ‘Quantitative/numerical variable’ meet wel in getallen en niet in categorieën, de dummy
variabele zit dus tussen qualitative en quantitative in.
Variabelen meten de waarde van een individu en geven geen kennis over de gehele groep
, Discreet/continu:
Een discrete variabele verandert stapsgewijs doordat er bijvoorbeeld alleen maar hele
getallen als waarde mogelijk zijn. Bij een continue variabele zijn alle waardes mogelijk,
waardoor alle waardes vloeiend in elkaar overlopen (bij een grafische weergave). Er wordt
binnen de statistische wetenschap aangenomen dat onderzochte waarden meestal continu
zijn, de waardes zijn dus te meten in meer dan twee decimalen.
Interval- of ratio--variabele:
Een interval--variabele is een variabele waarvan de ratio van twee verschillende waarden van
een kwantitatieve variabele betekenisloos is en een ratio--variabele is een variabele waarbij
dit ratio van twee variabelen wel wat betekent.
Census:
Een onderzoek waarbij alle elementen van de populatie onderzocht worden, de dataset
wordt dan een population dataset genoemd (als er alleen een sample wordt gebruikt, is er
sprake van een sample dataset)
Parameters:
Statistics van de populatie worden ook wel zo genoemd als deze statistic bepaald is aan de
hand van een klein deel van de totale populatie
Notatie:
Een statistic wordt vaak met een Griekse letter weergegeven
De grootte van de populatie wordt met N weergegeven en de grootte van ‘samples’ wordt
met n weergegeven
Hoofdstuk 2: Tables and graphs:
Nominale variabelen:
De (absolute) frequentie is het aantal keer dat een waarde voorkomt in de dataset, de
relatieve frequentie is de absolute frequentie gedeeld door het totaal aantal waarnemingen
en het percentage t.o.v. van het totaal is de relatieve frequentie maal 100
Een frequentie distributie is het kwantitatieve overzicht van de spreiding van de frequenties,
dit kan ook voor de relatieve frequentie
Een bar chart geeft in een staafdiagram de spreiding weer van de dataset, hierbij
representeert zowel de hoogte als de oppervlakte van de staven de (relatieve) frequentie
Pie charts geven ook een overzicht over de grootte van verschillende categorieën door iedere
categorie een bepaald aandeel van de totale cirkel te geven aan de hand van de relatieve
grootte van die categorie
Een legend bevat informatie over de kleuren en het arceren van weergegeven diagrammen
Ordinale variabelen:
Ook hier kan weer de verdeling van de (relatieve) frequenties weergegeven worden met een
bar of pie chart, maar de frequenties zijn nu ook te ordenen, waardoor ook de cumulatieve
frequentie berekend kan worden door de relatieve frequenties tot aan die categorie op te
tellen (je weet dan hoeveel procent in die categorie en de lagere categorieën valt)
Het overzicht van de spreiding van verschillende waarden met hun (relatieve) frequenties,
wordt hier dan de cumulatieve (relatieve) frequentie verdeling genoemd
De Likert scale gebruikt vijf punten die de respondent in het onderzoek kan kiezen om zijn
tevredenheid weer te geven (de Likert scale is dus een schaal bestaande uit vijf categorieën)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller EmilioOchieng. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for £12.25. You're not tied to anything after your purchase.