Gedownload door: Julesvanoutryve | jules.6vanoutryve@gmail.com
Dit document is auteursrechtelijk beschermd, het verspreiden van dit document
is strafbaar.
,Formules niet vanbuiten kennen formularium op examen!!!
Samenvatting Statistiek
Hoofdstuk 1: Algemene begrippen
1.1. Wat is statistiek?
Studie van gegevens (data).
Dit houdt in: verzamelen, samenvatten, analyseren en interpreteren.
1.2. Kernbegrippen
Populatie (population):
o Alle individuen (elementen) die voor onderzoek in aanmerking komen
Variabele (variable):
o Eigenschap die wordt onderzocht (voorgesteld door X,Y, …)
o Vb. lengte, gewicht, geslacht, woonplaats, kleur, kostprijs, …
Steekproef (sample):
o Deel van de populatie
o Wanneer de hele populatie onderzoeken onmogelijk is
• Te duur, tijd, te groot
Populatieparameter (a parameter):
o Parameter i.v.m. populatie (Griekse letter µ ->populatiegemiddelde, σ-> populatievariantie)
o Is een constante
Steekproefparameter (a statistic):
o Parameter i.v.m. steekproef (alfabet X , s)
o Waarde die wordt berekend uit alle elementen van een steekproef
o Is een variabele
!!Griekse letter gaat altijd over populatieparameter, alfabet over steekproefparameter!!
Steekproefparameters maken schattingen voor de populatieparameters
1.3. Statistische methoden Statistische methoden
Opmerking:
Bij verklarende statistiek wordt de numerieke Beschrijvende Verklarende
statistiek statistiek
methode ook de schattingstheorie genoemd en de
grafische methode de toetsingstheorie.
Numerieke Grafische Numerieke Grafische
methoden methoden methoden methoden
Populatie en steekproef:
Statistische inferentie = overstap van je
beschrijvende waarden naar de verklarende waarden
1. Formuleer de onderzoekshypothesen
2. Omschrijf de populatie
3. Trek een aselecte steekproef uit populatie
4. Verzamel gegevens (variabelen)
5. Bereken de steekproefparameters
6. Maak simulaties van steekproefparameters
7. Trek conclusie over onderzoekshypothesen
Onderzoekshypothesen …
.
, Hebben betrekking op ganse populatie
Kunnen nooit met zekerheid verworpen of niet verworpen worden
Hebben een conclusie die gebaseerd is op de (berekeningen van) steekproefresultaten
Vereisen de juiste methode (meetniveau)
Worden geformuleerd met een betrouwbaarheid van XX%
Gemeten resultaten liggen binnen een interval. Ligt de hypothese hier niet in? Verwerpen!
Wil je een kleiner interval? Verlaag de betrouwbaarheid. 100% betrouwbaarheid: [0;+∞[
Univariaat = studie van 1 variabele vb. gemiddelde huidige salaris is €34 500
Bivariaat = studie v/d samenhang tussen 2 variabelen vb. gem. huidige salaris man = vrouw
Multivariaat = studie van de samenhang tussen meerdere variabele (zie OP3)
Hoofdstuk 2: Gegevens verzamelen
2.1. Type variabelen
Kwalitatief (categorisch): niet meetbaar
Variabele
o Vb. Geslacht, politieke voorkeur,
Kwantitatief Kwalitatief
burgerlijke staat, schaal van Beaufort, (Numeriek) (categorisch)
evaluatie cursus, militaire rang.
o Mag je niet mee rekenen
Kwantitatief: meetbaar Discreet Continu
(sprongsgewijs) (geleidelijk)
o Discreet: uitkomsten kunnen een
discreet (eindig of oneindig maar
aftelbaar) aantal waarden aannemen. Alle soorten “aantallen”.
vb. kinderen in gezin
o Continue: uitkomsten kunnen alle reële waarden aannemen tussen 2 intervalgrenzen
vb. gewicht, volume, afstand, tijd, temperatuur, …
2.2. Meetniveau
Variab
Nominaal: ele
o Uitkomsten niet in vaste volgorde Kwantitat Kwalitati
o Aan uitkomsten kunnen getallen worden ief ef
gekoppeld zonder numerieke betekenis
o DICHOTOOM: slechts 2 categorieën Discre Conti Nomina
o Geen rekenkundige bewerkingen mee maken et nu al
o Vb. geslacht, burgerlijke staat, bloedgroep
Interv Interv Ordina
Ordinaal: al al al
o Uitkomsten in een vaste volgorde
o Aan de uitkomsten kunnen getallen Rati Rati
worden gekoppeld waarbij volgorde van o o
belang is MAAR het verschil tussen 2
waarden heeft geen betekenis
o Vb. LIKERT schaal, hoogst verworven diploma, grootte aardbeving schaal Richter
Interval:
o Rangorde is belangrijk
o Verschil tussen twee uitkomsten is belangrijk
Verschil tussen zeer slecht en slecht is gelijk aan het verschil tussen goed en
zeer goed
o Ratio (verhouding) tussen 2 uitkomsten is zinloos: vandaag 2°C, morgen 6°C. Je kan
niet zeggen dat het morgen 3 keer warmer wordt dan vandaag
.