Inleiding Statistiek
Inhoudsopgave
Chapter 1: Grafieken 4
- kwantitatieve/categorische variabelen, continu/discreet, plots, histogram, taartdiagram, staafdiagram
- unimodaal, binomiaal, scheve verdelingen, uitschieters
Chapter 2: Numerieke beschrijvingen 6
- mediaan, gemiddelde, SD, interkwartiel afstand
Chapter 3: Spreidingsdiagram en correlatie 10
- spreidingsdiagram, correlatiecoëfficient
Chapter 4: Regressie 13
Lineaire verbanden
- regressielijn (constante/helling), r2 determinantiecoëfficiënt, sluimerende (derde) variabelen, SPSS tabel aflezen.
Chapter 5: Kruistabellen 21
Categorische verbanden
- kruistabel, marginale/ joint/ conditionele verdelingen, simpon’s paradox, sluimerende (derde variabelen)
Chapter 9: Kans 25
- Random variabele, discreet kansmodel, gebeurtenis, uitkomstenruimte, waarschijnlijkheidsregels, risk (risico)/odds
(kans), continu waarschijnlijkheidsmodel
Chapter 11: Normaalverdeling - Continu kansverdeling 29
- Z-scores (table B): cumulatieve kansen, top 10%, inverse normale berekening, gebied tussen twee z-waarden,
unstandardize z-score
- 68-95-99,7 regel, QQ plot
Chapter 12: Binomiale verdeling - Discrete kansverdeling 35
- Binomiale verdeling, binomiale verdeling Normaal benaderen, gemiddelde en variantie/ SD bij binomiale verdeling
Chapter 13 Statistische gevolgtrekking 39
- Parameters steekproefverdeling en populatieverdeling, steekproefverdeling, standaardiseren Z-score Normale
steekproefverdeling, populatieproportie p̂ , centrale limietstelling, wet van de grote getallen
Chapter 14 45
Statistische gevolgtrekking
1. (%) betrouwbaarheidsintervallen (u onbekend, SD bekend), schatten, schatting + foutmarge
2. hypothese toetsen, nul-alternatieve, een-tweezijdig, p-waarde, significantieniveau a, toets u bij SD bekend
Chapter 15 55
- Toetsen populatiegemiddelde met SD bekend: Z-toets (Table B), type I-II fout, power (effectgrootte,
onbetrouwbaarheid, steekproefgrootte, populatie SD), statistische significantie, p-waarde.
- Betrouwbaarheidsinterval, steekproefgrootte voor de gewenste foutmarge
Chapter 17 63
- Toetsen populatiegemiddelde met SD onbekend (schatten), T-toets (Table C), een-steekproef T-statistiek,
vrijheidsgraden, gepaarde T-toets, robuustheid (ongevoelig)
Chapter 18 72
- twee-steekproef statistiek met twee onafhankelijk steekproeven, T-toets, vrijheidsgraden /
betrouwbaarheidsinterval, T-toets SPSS, robuustheid, gepoold
SPSS
,Overzicht
One-sample t procedure – 1-steekproef t-toets Inference about
Eén steekproef samengevat door zijn gemiddelde x̅ en standaard deviatie s.
Populatie parameters μ en σ onbekend, worden geschat aan de hand van je steekproef.
Je gaat kijken of het steekproefgemiddelde uit de steekproef die je neemt overeenkomt
met een waarde die je veronderstelt in je populatie.
Matched pairs t procedure – gepaarde t-toets Inference about
Twee gepaarde datasets (van een gematchend-paar ontwerp). Uit de n paarsgewijze
verschillen berekenen we:
Populatie parameters mdiff en sdiff onbekend.
Binnen die paren twee condities geven: controle en behandeling. Is het gemiddelde
verschil hetzelfde als 0? Je voert de toets uit op de verschillen hiertussen. Op het
verschil in de paren (die zijn allemaal wel afhankelijk van elkaar) doe je een 1 steekproef
t-toets.
Two-sample t procedure – t-toets voor 2 onafhankelijke steekproeven Inference about
Twee onafhankelijke steekproeven (niet-verwante personen in de twee steekproeven).
We vatten iedere steekproef afzonderlijk samen met:
Populatie parameters μ1, σ1 , μ2 , σ2 onbekend, deze worden geschat aan de hand van
de steekproef.
Twee steekproeven ieder afkomstig uit een eigen populatie. Je doet een toets over het
verschil tussen de twee populatiegemiddelde.
Ze kijken altijd in relatieve maat hoeveel je steekproef afwijkt van wat je in je nulhypothese veronderstelt.
sdiff = verschil tussen de beide standaarddeviaties
udiff = verschil tussen de beide gemiddelden
t* is geen x
t* is af te lezen uit Table C
Twee steekproeven:
Bovengrens= n1 + n2 -2 / Ondergrens= bijv. wanneer n1 de kleinste steekproef is neem je n1-1
Vrijheidsgraden hoef je in de toets niet uit te rekenen.
2
,3
, Chapter 1
− kan verschillende typen variabelen benoemen en onderscheiden
− begrijpt de verschillende figuren, waarin één variabele wordt weergegeven, en weet wanneer welk figuur
kan worden toegepast
Beschrijvende statistiek: getal, één grafiek → samenvatten
- Individuen zijn de objecten die worden beschreven door een set gegevens. Mensen, dieren, planten.
De eenheid waaraan jij onderzoek gaat verrichten
Soms zijn de individuen eigenlijk groepen, zoals een reeks landen, staten.
- Een variabele is een karakteristiek, eigenschap, kenmerk van een individu die van individu naar individu verschilt.
Een variabele kan verschillende waarden aannemen voor verschillende individuen. Zoals lengte, aantal bloembladen,
bloemkleur, geslacht, leeftijd.
Een kwantitatieve variabele neemt numerieke waarden aan waarvoor rekenkundige bewerkingen, zoals optellen en
vermenigvuldigen, zinvol zijn. De waarden van een kwantitatieve variabele worden gewoonlijk vastgelegd in een
meeteenheid (meeteenheid) zoals seconden of kilogrammen.
Een kwantitatieve variabele kan je een getal aan hangen wat iets zegt.
Kwantitatieve variabelen kunnen worden onderverdeeld in:
- Continue variabelen: kunnen elke reële numerieke waarde aannemen over een interval. (VB. Stamlengte,
leeftijd van dieren)
- Discrete variabelen: kunnen slechts een beperkt, eindig aantal waarden aannemen. Tussenliggende waarden
hebben geen betekenis (VB. Aantal bloemblaadjes in een bloem)
Kwantitatieve variabelen
o Dotplots: hebben het bijkomende voordeel dat zij de ruwe gegevens weergeven: zij tonen elk van de
waarden in de gegevensverzameling. Er is slechts één as (aslijn), dus die kan horizontaal of verticaal zijn.
Eenzijdige weergave.
o Timeplots: om verandering in de tijd weer te geven.
Een tijdplot van een variabele zet elke waarneming af tegen het tijdstip waarop ze werd gemeten. Zet de
tijd altijd op de horizontale schaal van je plot en de variabele die je meet op de verticale schaal. Het
verbinden van de datapunten door lijnen helpt om elke verandering in de tijd te benadrukken.
Bestudeer een tijdplot: zoek nogmaals naar een algemeen patroon en naar sterke afwijkingen van het
patroon.
Kijk naar een bepaalde trend,
fluctuaties
4