Samenvatting statistiek
1. Normaal, niet normaal en Z-verdeling, bepalen van de kwartielen + boxplot aflezen.
2. Steekproeven en de bijbehorende verdelingen.
3. Toetsing theorie + typen fouten + power + een/tweezijdig toetsen.
4: tweesteekproeven t-toets, gepaard + ongepaard + verschil afhankelijk/onafhankelijk.
5: one-way ANOVA + meansquares + F-waarde
6. Regressie + correlatie + toetsen op correlatie + correlatie naar regressive
7. Binomiale verdeling + proporties (1 en 2) + chi
overig: standaard skills.
- typen variables
- BHI en de berekeningen (betrouwbaarheidsintervallen.)
,1: Normaal, Niet normaal en Z verdelingen.
1.1. De normaalverdeling
de normaalverdeling is een
standaardverdeling die de meeste data
zullen volgen. (Oranje lijn)
Bij een normaalverdeling kun je de kans makkelijk aflezen, die is namelijk de
oppervlakte.
• De totale oppervlakte = kans = 1
• 50% van de studenten heeft lengte 180 cm
• De kans dat je een student waarneemt met lengte 180 cm is 50%
• Een normaalverdeling gaat nooit naar 0, het raakt dus nooit de x-as (limiet lengte
infinity)
met:
x: waarde van een waarneming
: gemiddelde van de waarnemingen
n: aantal waarnemingen
, : de standaarddeviatie (breedte van de curve)
: het populatie gemiddelde
Voorbeeldberekening:
1. Aantal waarnemingen bepalen: 5
2. Populatiegemiddelde berekenen: 166,6
3. Iedere waarneming min gemiddelde, x -
4. Kwadrateer (x - )2
5. Tel alle kwadraten bij elkaar op (x - )2: 141,2
6. Deel deze som door het aantal waarnemingen (x -
)2 / n: 28,24
7. Neem de wortel: 5,31
1.2 Z-verdeling
Je kunt van een normaalverdeling
een 1. Verminder alle waarden x
met , zodat z = 0 -> x -
2. Deel deze x - waarden door ,
zodat z = 1 -> (x - )/
Uit een z-tabel kun je verschillende
gegevens aflezen, namelijk de z- Z-verdeling
waarde, wat gelijk staat aan de x-as.
Ook kun je de p-waarde aflezen, want gelijk staat aan de oppervlakte
• 1.3 Nietbijnormale
Zoek gegevenverdelingen
z-waarde de p-waarde. Bijv. z = 0,44 -> p = 0,67
• Zoek bij gegeven p-waarde de z-waarde. Bijv. p = 0,77 -> z = 0,74
, Mediaan: Middelste waarneming van alle waarnemingen
Modus: Piek van de verdeling, waarde met hoogste frequentie
Volgorde van gemiddelde, mediaan en modus bij scheve verdelingen is altijd zoals
hierboven aangegeven.
de mediaan bepaal je als volgt:
- Sorteer de waarnemingen van lage naar hoge waarde
- Bij oneven aantal waarnemingen is de mediaan het middelste getal: 1, 3, 5, 6, 9,
10, 12
- Bij even aantal waarnemingen is de mediaan het gemiddelde van de twee
middelste getallen: 1, 3, 5, 6, 9, 10 -> mediaan is 5,5
2. Steekproeven en de bijbehorende verdelingen.
2.1 steekproef*
en
Met:
x = het gemiddelde van de steekproef
(dit is dus een schattig van ). Deze wijkt
echter vaak af
s = de standaarddeviatie van de steekproef
(dit is dus een schattig van )
*een conclusie trekken op basis van een steekproef en s
valt onder inferentiële statistiek
2.2 Steekproefvariatie:
• De variatie in de steekproefgemiddelden heet de SEM: Standard Error of the
Mean (standaardfout van het gemiddelde)