Samenvatting statistiek
Op examen:
Definities
- 5 definities
Zie extra blad
- Two way ANOVA
o Fixed type I
Inleiding o Type III
Het algemene principe van statistiek o Nested type III
- Verband model
- Chi of Kolmogrov
Data, hun voorstelling en de lukrake steekproef
Soorten data
• Kwalitatieve variabelen
o Nominale variabelen
o Ordinale variabelen
• Kwantitatieve variabelen
o Intervalschaal
o Ratioschaal
Hiërarchie van meetschalen
• Meest informatieve meetschaal: ratioschaal
• Gevolgd door: intervalschaal, ordinale meetschaal en nominale meetschaal
De data matrix
• Matrix:
o Rijen: elementen van steekproef
o Kolommen: verschillende gemeten variabelen
• Kleine dataset: rechtstreeks invoeren in script van R
• Grotere dataset: via bestand in Excel
o Opslaan als: “tab delimited txt” bestand
, • Gegevens ingeven in R
o Gevoelig voor spaties, hoofdletters… codes moeten heel correct zijn!
o Bij het plaatsen van een ‘#’ voor je iets schrijft, zal dit niet opgenomen worden in de
calculaties. Gemakkelijk als je (tussen) titels of andere dingen wil schrijven in R
o File --> new file --> R script
o Code laten werken: selecteren --> Run line or selection
o R gebruikt een punt als decimaal teken (geen komma)
Voorstelling van univariate kwantitatieve data
- Bestandtype moet ‘txt’ zijn
- Om het bestand te linken met RStudio:
- Dit bestand moet vervolgens gelinkt worden aan een ‘object’ (soort geheugen).
- Vervolgens moeten de gegevens gelinkt worden adhv ‘attach()’, deze stap zeker doen!!!
Wanneer het bestand gelinkt is, zal dit rechtsboven te zien zijn als:
- Extra: indien een cijferreeks gelinkt wordt aan een object, heet dit een ‘vector’.
vb. b<-c(1,2,5,3.5,6,10)
Stengelblad diagram
Code voor R: stem()
,Staafdiagram
Code voor R:
- Table()
- Plot()
Voorbeeld
xlab en ylab: titel voor X en Y-as
main: titel voor histogram
Histogram
Code voor R: hist()
Voorbeeld
Empirische cumulatieve frequentieverdeling
Code voor R:
- Ecdf()
- Plot()
Voorbeeld
, Voorstelling van bivariate data
• Optie 1: kruistabel maken → table()
• Optie 2: scatterplot maken → plot()
Lukrake steekproef
1. Onafhankelijk
2. Representatief
3. Unbiased (niet vertekend)
4. Nauwkeurig
a. Vuistregel: 30-300 regel
b. Tel aantal stappen tussen minimum en maximum waarde → tss 30 en 300:
accuraatheid voldoende en niet te gedetailleerd
c. Voorbeeld:
i. koolmezen tussen 16 en 21g, 5 stappen nodig om van min. naar max. te gaan
op 1g nauwkeurig→ onvoldoende nauwkeurig
ii. op 0.01g nauwkeurig: 500 stappen nodig → te gedetailleerd
iii. op 0.1g nauwkeurig: 50 stappen nodig → goede keuze
Opdrachten lukrake steekproef
Bespreek van onderstaande voorbeelden het design van het experiment rekening houdend met de 4
criteria die hierboven overlopen werden.
1) Een bioloog wilt nagaan of er een verschil is in tarsuslengte van kokmeeuwen in Scandinavië
en het Iberisch schiereiland. Hij reist naar Stockholm en meet daar de tarsus van 10
meeuwen tot op een halve cm nauwkeurig en doet hetzelfde voor 10 meeuwen in Lissabon.
o Niet nauwkeurig genoeg (halve cm niet gedetailleerd genoeg)
o Op verschillende locaties onderzoeken (niet alleen in steden)
2) Om na te gaan wat het effect is van temperatuur (25 vs 28 graden) en CO2 gehalte (hoog vs.
laag) op de groei van populieren kweekt een bioloog in totaal 40 populierenplantjes op van
eenzelfde kloon. Hij heeft 4 klimaat kasten. In 2 daarvan stelt hij de temperatuur in op 28
graden en houdt hij een hoog CO2 niveau aan. In de twee andere kasten wordt de
temperatuur op 25 graden gehouden bij een laag CO2 gehalte.
o Alles zeer afhankelijk van hypothese die je wil testen
o Hier wordt één kloon getest: wil je algemeen over populieren onderzoeken →
meerdere klonen onderzoeken + random steekproef
o Hier worden niet alle combinaties getest (bv. er bestaan ook situaties hoge T en hoge
CO2) → hangt opnieuw af van wat je wil meten
3) Een arts wil nagaan wat het effect is van roken op de kans om vroegtijdig te sterven. Hij volgt
200 jongeren, waarvan er 90 roken, gedurende 25 jaar op.
o Bepaalde factoren kunnen een rol spelen
o Is 25j lang genoeg om conclusies te trekken?
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jeliencornelis. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,66. Je zit daarna nergens aan vast.