SAMENVATTING DATA-
ANALYSE
Bultinck Ilona – 1BDW
,Inhoudsopgave
Hoofdstuk 0 - Inleiding ................................................................................................................................... 3
1. Wat is statistiek? P3 ....................................................................................................................................... 3
2. Basisbegrippen ............................................................................................................................................... 3
3. Soorten variabelen.......................................................................................................................................... 4
4. Meetniveaus ................................................................................................................................................... 5
Hoofdstuk 1 – de centrummaten .................................................................................................................... 6
1. Het rekenkundig gemiddelde .......................................................................................................................... 6
2. De modus of modale waarde p32 ................................................................................................................. 10
3. De mediaan .................................................................................................................................................. 12
4. Kwantielen .................................................................................................................................................... 14
5. Symmetrische verdeling en scheve verdeling van de gegevens .................................................................... 15
Hoofdstuk 2 – de spreidingsmaten ................................................................................................................ 17
1. Variatiebreedte of spreidingsbreedte ........................................................................................................... 17
2. Gemiddelde afwijkingen tov het rekenkundig gemiddelde .......................................................................... 18
3. Variantie ....................................................................................................................................................... 18
4. Standaardafwijking – standaarddeviatie ..................................................................................................... 19
5. De variatiecoëfficiënt.................................................................................................................................... 20
Hoofdstuk 3 – Centrum-en spreidingsmaten met Excel ................................................................................... 23
1. Frequentietabel, centrummaten en spreidingsmaten met excel .................................................................. 23
Functies centrummaten in Excel........................................................................................................................ 25
Functies spreidingsmaten in Excel (statisch!) .................................................................................................... 26
Centrum- en spreidingsmaten met hulpprogramma gegevensanalyse ............................................................. 27
2. De boxplot – Box-and-whisker) ..................................................................................................................... 29
Hoofdstuk 4 – Verhoudingsgetallen percentages en indexcijfers ................................................................... 30
1. Regel van drie................................................................................................................................................ 30
2. Verhoudingcijfers en percentages ................................................................................................................. 30
3. Indexcijfers .................................................................................................................................................... 31
Enkelvoudig indexcijfer (=I)-> 1 variabele .................................................................................................... 32
Samengesteld indexcijfer -> meerdere variabelen ....................................................................................... 32
Hoofdstuk 5 – Correlatie en regressieanalyse .................................................................................................. 34
Excel .................................................................................................................................................................. 37
Deel 2 – De normaalverdeling ........................................................................................................................ 39
Bul$nck Ilona 1BDW 1
,Bul$nck Ilona 1BDW 2
, Hoofdstuk 0 - Inleiding
1. Wat is sta)s)ek? P3
Sta$s$ek hee6 betrekking op het resultaat van een onderzoek dat weergegeven wordt in een
tabel of grafiek.
Sta$s$ek is het vakgebied dat zich bezighoudt met het verzamelen, ordenen, samenvaEen,
analyseren en interpreteren van gegevens.
Onderscheid tussen beschrijvende en verklarende sta$s$ek
Beschrijvende sta$s$ek hee6 tot taak het waarnemingsmateriaal te ordenen en te
bewerken zodat er een samenvaEen beeld verkregen wordt.
Bv het maken van grafieken en het opstellen van frequen$etabellen
Verklarende sta$s$ek is het generaliseren van betrouwbare conclusies over een geheel, we
spreken dan van generalisa$e.
De basis van de verklarende sta$s$ek is de waarschijnlijkheidsberekening (kansrekening).
Sta$s$ek is gemakkelijk te manipuleren we hebben dus nood aan:
1. Representa$eve steekproef: alle eigenschappen van de gehele popula$e moeten
teruggevonden worden MAAR door te focussen op een specifiek groepje kunnen we
iets bewijzen voor de geheel popula$e
2. Aselecte steekproef: een willekeurige steekproef waarbij elk element evenveel kans
hee6 om in de steekproef terecht te komen. Hierbij ook soms vertekend beeld omdat
mensen die aan een enquête meedoen meestal een uitgesproken mening hebben ->
vertekend beeld.
Slim-gekozen centrummaat is de centrummaat die het best past bij hetgeen wat je wilt
meten.
Bv ongelijke inkomens meten
De steekproef mag ook niet te klein zijn want dan speelt toeval een te grote rol.
Bv 75% v/d mensen wil de doodstraf
De variabele moet al$jd duidelijk gedefinieerd worden
Voorbeeld wanneer wordt een plantje als boom gezien
2. Basisbegrippen
De popula$e is de verzameling waarop het onderzoek/de steekproef betrekking hee6.
De popula$e is opera$oneel gedefinieerd d.w.z. dat men in de prak$jk duidelijk moet kunnen
bepalen of een bepaald element wel of niet binnen de popula$e valt.
Bv alle bomen in een bos
De variabele is het te onderzoeken kenmerk.
Vb. de omtrek van een boom
De steekproef is het aantal elementen van een bepaalde popula$e dat in het onderzoek
wordt opgenomen. Men kan niet de gehele popula$e onderzoeken want dit is $jdrovend en
duur. De steekproef moet dus wel representa$ef zijn en aselect. Ze mag ook niet te klein zijn.
Bul$nck Ilona 1BDW 3
ANALYSE
Bultinck Ilona – 1BDW
,Inhoudsopgave
Hoofdstuk 0 - Inleiding ................................................................................................................................... 3
1. Wat is statistiek? P3 ....................................................................................................................................... 3
2. Basisbegrippen ............................................................................................................................................... 3
3. Soorten variabelen.......................................................................................................................................... 4
4. Meetniveaus ................................................................................................................................................... 5
Hoofdstuk 1 – de centrummaten .................................................................................................................... 6
1. Het rekenkundig gemiddelde .......................................................................................................................... 6
2. De modus of modale waarde p32 ................................................................................................................. 10
3. De mediaan .................................................................................................................................................. 12
4. Kwantielen .................................................................................................................................................... 14
5. Symmetrische verdeling en scheve verdeling van de gegevens .................................................................... 15
Hoofdstuk 2 – de spreidingsmaten ................................................................................................................ 17
1. Variatiebreedte of spreidingsbreedte ........................................................................................................... 17
2. Gemiddelde afwijkingen tov het rekenkundig gemiddelde .......................................................................... 18
3. Variantie ....................................................................................................................................................... 18
4. Standaardafwijking – standaarddeviatie ..................................................................................................... 19
5. De variatiecoëfficiënt.................................................................................................................................... 20
Hoofdstuk 3 – Centrum-en spreidingsmaten met Excel ................................................................................... 23
1. Frequentietabel, centrummaten en spreidingsmaten met excel .................................................................. 23
Functies centrummaten in Excel........................................................................................................................ 25
Functies spreidingsmaten in Excel (statisch!) .................................................................................................... 26
Centrum- en spreidingsmaten met hulpprogramma gegevensanalyse ............................................................. 27
2. De boxplot – Box-and-whisker) ..................................................................................................................... 29
Hoofdstuk 4 – Verhoudingsgetallen percentages en indexcijfers ................................................................... 30
1. Regel van drie................................................................................................................................................ 30
2. Verhoudingcijfers en percentages ................................................................................................................. 30
3. Indexcijfers .................................................................................................................................................... 31
Enkelvoudig indexcijfer (=I)-> 1 variabele .................................................................................................... 32
Samengesteld indexcijfer -> meerdere variabelen ....................................................................................... 32
Hoofdstuk 5 – Correlatie en regressieanalyse .................................................................................................. 34
Excel .................................................................................................................................................................. 37
Deel 2 – De normaalverdeling ........................................................................................................................ 39
Bul$nck Ilona 1BDW 1
,Bul$nck Ilona 1BDW 2
, Hoofdstuk 0 - Inleiding
1. Wat is sta)s)ek? P3
Sta$s$ek hee6 betrekking op het resultaat van een onderzoek dat weergegeven wordt in een
tabel of grafiek.
Sta$s$ek is het vakgebied dat zich bezighoudt met het verzamelen, ordenen, samenvaEen,
analyseren en interpreteren van gegevens.
Onderscheid tussen beschrijvende en verklarende sta$s$ek
Beschrijvende sta$s$ek hee6 tot taak het waarnemingsmateriaal te ordenen en te
bewerken zodat er een samenvaEen beeld verkregen wordt.
Bv het maken van grafieken en het opstellen van frequen$etabellen
Verklarende sta$s$ek is het generaliseren van betrouwbare conclusies over een geheel, we
spreken dan van generalisa$e.
De basis van de verklarende sta$s$ek is de waarschijnlijkheidsberekening (kansrekening).
Sta$s$ek is gemakkelijk te manipuleren we hebben dus nood aan:
1. Representa$eve steekproef: alle eigenschappen van de gehele popula$e moeten
teruggevonden worden MAAR door te focussen op een specifiek groepje kunnen we
iets bewijzen voor de geheel popula$e
2. Aselecte steekproef: een willekeurige steekproef waarbij elk element evenveel kans
hee6 om in de steekproef terecht te komen. Hierbij ook soms vertekend beeld omdat
mensen die aan een enquête meedoen meestal een uitgesproken mening hebben ->
vertekend beeld.
Slim-gekozen centrummaat is de centrummaat die het best past bij hetgeen wat je wilt
meten.
Bv ongelijke inkomens meten
De steekproef mag ook niet te klein zijn want dan speelt toeval een te grote rol.
Bv 75% v/d mensen wil de doodstraf
De variabele moet al$jd duidelijk gedefinieerd worden
Voorbeeld wanneer wordt een plantje als boom gezien
2. Basisbegrippen
De popula$e is de verzameling waarop het onderzoek/de steekproef betrekking hee6.
De popula$e is opera$oneel gedefinieerd d.w.z. dat men in de prak$jk duidelijk moet kunnen
bepalen of een bepaald element wel of niet binnen de popula$e valt.
Bv alle bomen in een bos
De variabele is het te onderzoeken kenmerk.
Vb. de omtrek van een boom
De steekproef is het aantal elementen van een bepaalde popula$e dat in het onderzoek
wordt opgenomen. Men kan niet de gehele popula$e onderzoeken want dit is $jdrovend en
duur. De steekproef moet dus wel representa$ef zijn en aselect. Ze mag ook niet te klein zijn.
Bul$nck Ilona 1BDW 3