OOW - Schakelprogramma
,Inhoudsopgave
1. Wat is statistiek? ................................................................................................................................. 1
2. Data en de datamatrix ......................................................................................................................... 2
3. Frequentieverdeling van een variabele ............................................................................................... 3
4. Visualisatie........................................................................................................................................... 4
5. Parameters .......................................................................................................................................... 5
6. De (standaard-)normaalverdeling ..................................................................................................... 12
7. Z-scores.............................................................................................................................................. 16
8. Steekproeftheorie ............................................................................................................................. 18
9. Inferenties en betrouwbaarheidsintervallen .................................................................................... 24
10. Script................................................................................................................................................ 28
Samenvatting gemaakt op basis van:
De Maeyer, S., van Daal, T. en Vandervieren E. (2017). Univariate Statistiek voor de
menswetenschappen: Een Openleerpakket in R - 2017. Uitgeverij: AcademiaPress.
1. Wat is statistiek?
Definitie:
Statistiek is de wetenschap van het verzamelen, organiseren, presenteren, analyseren en
interpreteren van gegevens of data volgens een numerieke logica.
Toepassingen:
• Beschrijven:
o Beschrijvingen geven van de realiteit
o Op basis van een vereenvoudiging van de complexe realiteit
o Vb. Aantal leerlingen in een bepaalde studierichting
• Verklaren
o Statistisch model als grove vereenvoudiging van de realiteit met gemiddelde termen
o Bepaalde fenomenen en situaties verklaren en veralgemenen
o Vb. Causaliteit tussen roken en longkanker
• Voorspellen
o Formuleren van voorspellingen over wat er kan gebeuren
o Geen exacte voorspellingen -> Kansen
o Vb. Opwarming van de aarde in 2100
1
,2. Data en de datamatrix
2.1 Data en variabelen
Data: informatie-eenheden die we bekomen via observatie (metingen)
Variabele: Geobserveerd kenmerk (vb. geslacht, jaar, richting)
-> Constante: Variabele die slechts één waarde aanneemt
Soorten observatie:
• Open observatie: een open bevraging, zonder standaardantwoorden (vb. Interview)
• Gesloten observatie: een bevraging met standaardantwoorden (vb. 5 punt-likertschaal)
2.2 Meetniveau van variabelen
Categorische variabelen:
• Variabele waarbij we enkel kunnen indelen in klassen (kwalitatieve variabelen)
• Meten = indelen volgens kenmerk (kunnen ook cijfers zijn)
• Factor
Numerieke variabelen:
• Variabele waarbij categorieën die we onderscheiden getallen zijn (kwantitatieve variabelen)
• Getallen met een betekenis
• Numeriek
Onderverdeling van variabelen:
• Totale orde = rangorde tussen de eenheden
• Meeteenheid = verschillen in waarden zijn dezelfde verschillen in intensiteit
• Absoluut nulpunt = een waarde (0) die de afwezigheid van het kenmerk weergeeft
Categorische variabelen Numerieke variabelen
Kwalitatief Kwantitatief
Meetniveau Nominaal Ordinaal Interval Ratio
Totale orde - v v v
Meeteenheid - - v v
Absoluut nulpunt - - - v
Voorbeeld Geslacht Aantal sterren Temperatuur Leeftijd
Kwantitatieve/Numerieke variabelen: Continu of discreet?
Discreet Continu
Geen “oneindig” aantal tussenwaarden “Oneindig” aantal tussenwaarden
Afronding: context – ideologie Afronding: notatie vergemakkelijken
2
, Schaalscore
- Latente (verborgen) variabelen (vb. Tevredenheid) -> vaak in sociale wetenschappen
-> in kaart brengen adhv manifeste (zichtbare) representanten (steeds meerdere)
Je berekent het gemiddelde van verschillende items
-> Intervalgeschaalde schaalscore
(omzetting van categorische naar numerieke variabele)
3. Frequentieverdeling van een variabele
3.1 Absolute frequentie
-> Aantal keer dat een bepaalde meetwaarde voorkomt
• Notatie: ni
• Som van alle absolute frequenties is aantal respondenten
• Formule:
De som van alle ni waarbij i gaat van 1 tot p. i is de index, 1 de ondergrens en p de bovengrens
3.2 Relatieve frequentie
-> Aantal keer dat een bepaalde meetwaarde voorkomt, uitgedrukt in procenten
• Notatie: fi
• Som van alle relatieve frequenties is 100%
• Formule:
Quotiënt van de absolute frequentie en het aantal respondenten
3.3 Absolute cumulatieve frequentie
Het aantal keer dat een bepaalde waarde of lagere/voorgaande waarde voorkomt in de gegevens
• Absolute cumulatieve frequentie van hoogste waarde = Het aantal waarnemingen (n)
• Notatie: ci = ci-1 + ni
3.4 Relatieve cumulatieve frequentie
Absolute cumulatieve frequentie, maar dan uitgedrukt in procenten
• Relatieve cumulatieve frequentie van hoogste waarde = 100%
• Notatie: ci = ci-1 + fi
3