Kwantitatieve en Theoretische Biologie (BB1KWBI20)
Institution
Universiteit Utrecht (UU)
Dit document bevat alle aantekeningen van alle hoorcolleges en het boek voor deeltoets 1 én deeltoets 2! Hiermee heb je met 1 bestand gelijk alle informatie voor 2 deeltoetsen!
Kwantitatieve en Theoretische Biologie (BB1KWBI20)
All documents for this subject (8)
1
review
By: fjonker • 9 months ago
Seller
Follow
yanniekvos
Reviews received
Content preview
Theoretische Biologie – aantekeningen – Yanniek Vos
Statistiek
Overzicht creëren:
1. Gegevens samenvatten in een tabel
2. Gegevens visualiseren (grafieken, diagrammen)
3. Gegevens samenvatten met kengetallen (ligging, spreiding)
Variabelen: een eigenschap van individuen, die
varieert binnen een populatie
Numeriek: in getallen wordt weergegeven.
Categoriaal: in categorieën wordt verdeeld.
Continu: denk aan gewicht en lengte, elke waarde
Discreet: gehele getallen, volgorde
Nominaal: namen, geen getallen en geen natuurlijke volgorde zit hierin.
Ordinaal: het zijn geen getallen maar er zit wel een natuurlijke volgorde in.
Frequentietabellen: Dit zijn tabellen waarin wordt aangegeven hoevaak bepaalde waarde voorkomen
in het experiment.
1. Categoriaal, nominale variabele: hierin worden de verschillende categoriën genoemd met
daarbij de frequentie.
2. Numeriek, discrete variabele: hierbij moeten bepaalde intervallen gemaakt moeten worden
om te kijken hoevaak bepaalde waardes in het interval voorkomen.
Visualiseren van categoriale data:
1. Staafdiagram: op de x-as de categoriën en de y-as de frequentie. De oppervlakte van de staaf
houdt in wat de frequentie van de categorie is. Belangrijk is dat de y-as altijd op 0 moet laten
beginnen en dat de staven los van elkaar moeten staan en daarbij even breed moeten zijn
(zodat deze niet in elkaar overlopen).
2. Taartdiagram: deze kunnen laten zien welke fractie van het geheel een bepaalde categorie
aanneemt.
Visualiseren van numerieke data:
1. Histogram: hier staan de categoriën (intervallen) op de x-as en de frequentie op de y-as.
Hierbij zitten de staven aan elkaar omdat de categoriën aan elkaar overlopen en
de x/y-as moeten op 0 beginnen.
a. Uniform: alle waarde op ongeveer gelijke hoogtes
b. Klokvorm: symmetrisch
c. Scheef: assymetrisch met meer waardes aan de ene
kant van de top. In de afbeelding is deze links scheef
omdat de staart aan de linkerkant uitgerekt is.
d. Bimodaal: twee toppen zijn er aanwezig.
Ligging: alle waardes zijn naar rechts verschoven maar de
spreiding is hetzelfde (vorm).
Spreiding: de plaats op de x-as is hetzelfde (ligging) maar de
waardes zijn meer verdeeld waardoor het breder is en er dus
een andere spreiding is.
,Theoretische Biologie – aantekeningen – Yanniek Vos
Maten van de ligging van (nummerieke) gegevens:
1. (rekenkundig) gemiddelde: hierbij worden alle getallen
opgeteld en gedeeld door het aantal getallen. Hierbij
zijn n het aantal getallen in de steekproef en staat i voor
het getal waarmee je begint en doorgaat tot je getal n
gebruikt.
2. Mediaan: het middelste getal na het sorteren. Bij een
even aantal is er geen middelste getal dus pak je de
middelste twee en neem je daar het gemiddelde van.
3. Modus: de piek van de histogram waar de frequentie
het hoogst is.
De mediaan is veel minder gevoelig voor ‘uitbijters’ dan het gemiddelde. Als er een enorme
uitschieter is, zal dit veel invloed op het gemiddelde hebben.
Maten voor de spreiding van numerieke data:
1. Range: het verschil tussen de grootste en kleinste
getal.
2. Standaarddeviatie of standaardafwijking: dit is de
wortel van de variantie om de eenheid gelijk te
krijgen.
3. Variantie: hierbij ga je van elk datapunt het
gemiddelde aftrekken en krijg je de afwijking van
het gemiddeld (zodat hij positief wordt) en tel je
dit voor elk punt op en deel je door het aantal
waardes – 1.
4. Interkwartielafstand (IQR): hierbij kijk je naar de
mediaan en splitst je de linker- en rechterhelft
opnieuw in tweeën. De afstand tussen het 1e en
3e kwartiel is de interkwartiel range. Vaak ook genoreerd als Q 1/Q2/Q3 of P25/P50/P75.
5. Variatiecoëfficiënt (VC): Hierbij deel je de standaarddeviatie door het gemiddelde. Dit heeft
geen eenheid.
Grofweg is de standaarddeviatie de s weergegeven in de afbeelding hieronder.
, Theoretische Biologie – aantekeningen – Yanniek Vos
Visualiseren van de gegevens: Boxplot
1. Berekenen van de mediaan: hier zet je een
streep op de hoogte van de mediaan.
2. Het eerste en derde kwartiel berekenen : dit
vormt samen een box met daarin de
mediaan. Als de mediaan heel schreef in de
box ligt is hierin de verdeling van de
getallen scheef.
3. Bereken van de interkwartielafstand (IQR):
4. Uitbijters uitzoeken: de IQR x 1,5 en dan
teken je die waardes als sterretjes boven
de boxplot
5. Whiskers bepalen: Het laatste datapunt dat
geen uitbijter is, wordt gebruikt als
uiteindes (whiskers).
Populatie: groep, die meedoen aan het experiment.
Variabele: een eigenschap die je kan meten bij iedern individu in de populatie.
Verdeling: geeft aan hoe de variabele verdeeld is over de populatie.
Parameter: een eigenschap van de verdeling (bijv. gemiddelde lengte)
Verschillende steekproeven zullen andere uitkomsten hebben, omdat dit maar over een deel van de
populatie is.
Variabelen in de populatie komt doordat er variatie van de individuen en meetfouten zijn.
Schatten:
Schatting:
Precisie: deze laat zien hoe groot de toevallige afwijking is. (dicht bij elkaar
is heel precies)
Zuiverheid of juistheid: deze laat zien hoe groot de systematische afwijking
is. (midden van bulleye of niet)
We willen kwantificeren hoe precies en hoe zuiver een schatting is.
Oplossing betrouwbaarheidsinterval:
Een betrouwbaarheidsinterval (bhi): is een interval rondom een schatter
dat waarschijnlijk de populatieparamter bevat. Een 95%-bhi voor een populatieparameter
bevat met 95% zekerheid de waarde van de parameter.
‘op basis van de steekproef van 10 student is het 95%-bhi voor de gemiddelde lengte gelijk is
aan 172,2 cm met 3,8 cm afwijking’.
Bhi voor een schatting van het gemiddelde:
Als n>500, dan is het getal 1,96
Als n<500, dan opzoeken in een tabel
Eenvoudige aselecte steekproef:
Hierbij is de kans gelijk dat ieder individu een gelijke kans heeft en onafhankelijk van elkaar in
het experiment kan komen.
Stelt je in staat een zuivere schatting te maken
Stelt je in staat te kwantificeren hoe precies je schatting
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller yanniekvos. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $9.63. You're not tied to anything after your purchase.