Hoofdstuk 2: verdelingen (zonder ICT)
De waarde van een statische variabele met de grootste frequentie heet de modus. Als de
waarden gerangschikt zijn in klassen, dan spreek je van de modale klasse. Ze je de waarden
die een statische variabele aanneemt op volgorde van klein naar root, dan heet de middelste
waarneming de mediaan. Modus, mediaan en gemiddelde heten centrummaten.
Gemiddelde = alle frequenties bij elkaar opgeteld : aantal waarnemingen ( x ¿
Modus = kijk welke frequentie het hoogste is
Mediaan = je zet alle getallen van laag naar hoog en kiest de middelste
Mediaan oneven aantal = kies de middelste (1, 3, 4, 6, 8 4 is de mediaan)
Mediaan even aantal = bereken het gemiddelde van de twee getallen in het midden
(1, 2, 6, 9, 12, 14 je hebt 6 getallen, dus pak je het 3de en 4de
getal, dus de mediaan is (6+9) : 2 = 7,5)
Je hebt drie verschillende soorten frequentietabellen:
Klokvormig
de verdeling is symmetrisch
Scheef met staart naar rechts en een uitschieter
de top ligt niet in het midden
Uniform
de staafjes zijn ongeveer even lang
Een interval notatie in een klasse kun je op twee verschillende manieren opschrijven:
[ of ] de grenswaarde hoort erbij
< of > de grenswaarde hoort er niet meer bij
Dus [ 1,5 ; 2,5 > betekent dus dat 1,5 er wel bij hoort maar 2,5 niet. 2,49 wel.
, De klasse breedte is de totale grootte van de klasse. Dus de zojuist benoemde klasse, [ 1,5 ;
2,5> heeft een klasse breedte van 1.
Ook heeft elke klasse een klasse midden. Bij de zojuist benoemde klasse is het klasse
midden 2.
De spreidingsbreedte is het verschil tussen de grootste en de kleinste waarneming.
De mediaan en de kwartielen, Q1 en Q3, verdelen de waarnemingsgetallen in vier
verschillende groepen. De kwartielen Q1 en Q3 bereken je door als het waren de mediaan
van de mediaan de berekenen. Als je mediaan eerst 10 was, dan is die bij Q1 5 en bij Q3 15.
Interkwartielafstand is het verschil tussen Q3 en Q1.
De spreiding geeft aan hoe de data verdeeld zijn over het gebied tussen de kleinste en de
grootste waarde. Een veel gebruikte spreidingsmaat is de standaardafwijking of
standaarddeviatie. De standaardafwijking zegt is over de spreiding rondom het gemiddelde.
De korte notatie voor de standaardafwijking is s of x.
De frequentieverdeling van een variabele kun je vaak benaderen met een klokvormige
grafiek. De belangrijkste kenmerken van zo’n grafiek zijn:
De grafiek is symmetrisch
De symmetrie as ligt precies bij het gemiddelde
Gemiddelde en mediaan vallen samen
De standaardafwijking s is de afstand van de symmetrie as tot de huigpunten van de
kromme.
Er gelde de volgende drie vuistregels:
1. Van de data ligt ongeveer 68% tussen x – s of x + s
2. Van de data ligt ongeveer 95% tussen x – 2s of x + 2s
3. Van de data ligt ongeveer 100% tussen x – 3s of x + 3s
De ideale klokvormige verdeling wordt de normale verdeling
genoemd. Een variabele waarvan de frequentieverdeling
benaderd kan worden door de normale verdeling heet
normaal verdeeld.
Voorbeeld:
S=3
Gemiddelde = 53
Aantal waarnemingen = 100
Hoeveel waarnemingen zitten tussen de 50 tot 56?
100 x 0,68 = 68 waarnemingen 47 50 53 56 59