100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Practice of Statistics in the Life Sciences, ISBN: 9781319187606 Statistiek $6.96   Add to cart

Summary

Samenvatting Practice of Statistics in the Life Sciences, ISBN: 9781319187606 Statistiek

 7 views  0 purchase
  • Course
  • Institution
  • Book

Samenvatting van het boek The Practice of Statistics in the Life Science voor de volgende hoofdstukken: 1-2-3-4-5--

Preview 4 out of 42  pages

  • No
  • H1-2-3-4-5-6-9-11-12-13-14-15-17-18
  • January 12, 2022
  • 42
  • 2021/2022
  • Summary
avatar-seller
SAMENVATTING STATISTIEK PER BIJEENKOMST

Bijeenkomst 1:
Boek: The Practice of Statistics in the Life Sciences
Chapter 1: Picturing Distributions with Graphs

Elke set gegevens bevat informatie over een bepaalde groep individuen. De informatie is
georganiseerd in variabelen. De technieken van beschrijvende statistiek die in deel I van dit boek
worden behandeld, zijn zowel van toepassing op datasets die zijn verkregen uit een bepaalde
populatie (de hele groep individuen waarover we informatie willen) als op data-sets die zijn verzameld
van alleen die individuen in een kleinere steekproef.

Individuen zijn de objecten (of eenheden) die worden beschreven door een reeks
gegevens. Individuen kunnen mensen zijn, maar het kunnen ook dieren, planten of dingen zijn. Een
variabele is elk kenmerk van een persoon. Een variabele kan verschillende waarden aannemen voor
verschillende individuen.

Zo bevat de plantendatabase van een botanicus gegevens over verschillende aspecten van de
onderzochte planten. De planten zijn de individuen beschreven door de database. Voor elk individu
(elke plant) bevatten de gegevens de waarden van variabelen zoals stengellengte, aantal
bloembladen en bloemkleur. Spreadsheetprogramma's met rijen en kolommen die direct beschikbaar
zijn, worden vaak gebruikt om gegevens op te slaan en eenvoudige berekeningen uit te voeren. Merk
op dat de individuen die in een dataset worden weergegeven soms eigenlijk groepen zijn, zoals een
set landen, staten of provincies, of zelfs een set mierenkolonies.

Een categorische variabele plaatst een persoon in een van meerdere groepen of categorieën
(man/vrouw). Een kwantitatieve variabele (leeftijd) neemt numerieke waarden aan waarvoor
rekenkundige bewerkingen zoals optellen en middelen zinvol zijn. De waarden van een kwantitatieve
variabele worden meestal vastgelegd in een maateenheid zoals seconden of kilogram.

Verdere onderscheidingen worden soms gemaakt in variabelen die verder gaan dan alleen
categorisch of kwantitatief. Sommige kwantitatieve variabelen, zoals stamlengte, zijn continue
variabelen die elke reële numerieke waarde over een interval kunnen aannemen. Discrete variabelen
daarentegen zijn kwantitatieve variabelen die slechts een beperkt, eindig aantal waarden kunnen
aannemen, zoals het aantal bloembladen in een bloem.' Categorische variabelen kunnen ook worden
onderverdeeld in nominale en ordinale variabelen. Nominale variabelen zijn puur kwalitatief en
ongeordend, zoals bloemkleur, terwijl ordinale gegevens kunnen worden gerangschikt, zoals
sterbeoordelingen. Hoewel ordinale gegevens kunnen worden gerangschikt, zijn het geen echte
kwantitatieve variabelen, omdat de intervallen tussen opeenvolgende rangen vaak niet identiek zijn.

Weinig wetenschappelijke publicaties tonen hun onbewerkte gegevens. In plaats daarvan moet
informatie over de individuen en variabelen van een onderzoek vaak worden opgehaald uit de
samenvatting, de sectie methoden of een figuurlegenda. Wanneer u gegevens van iemand anders
onderzoekt - of bij het plannen van uw eigen statistisch onderzoek - stel de volgende vragen
1. Wie of wat zijn de onderzochte personen? Hoeveel personen komen voor in de dataset?
2. Wat registreren we voor elk individu? Hoeveel variabelen bevatten de gegevens? Wat zijn
de exacte definities van deze variabelen? Zijn ze categorisch of kwantitatief? In welke
meeteenheden, indien aanwezig, wordt elke variabele geregistreerd? Lengtes kunnen
bijvoorbeeld worden vastgelegd in inches, in yards of in meters.
3. Waarom? Welk doel hebben de gegevens? Hopen we een aantal specifieke vragen te
beantwoorden? Willen we conclusies trekken over andere personen dan die waarvoor we
daadwerkelijk gegevens hebben? Zijn de variabelen geschikt voor het beoogde doel?

Hoewel woorden als "aantal", "telling", "aandeel" of "procent" kunnen worden gebruikt om
categorische gegevens samen te vatten, betekent het zien van deze woorden niet noodzakelijkerwijs
dat de geregistreerde variabele categorisch is. Dit is niet bijzonder ongebruikelijk. Sommige
wetenschappelijke publicaties combineren de bevindingen van een reeks verwante maar verschillende
onderzoeken. In dergelijke gevallen moet u elk onderzoek identificeren voordat u de specifieke
individuen en variabelen kunt bepalen die in het onderzoek worden behandeld.




1

,Statistische hulpmiddelen en ideeën helpen ons gegevens te onderzoeken, zodat we hun
belangrijkste kenmerken kunnen beschrijven. Dit onderzoek wordt verkennende data-analyse
genoemd. Net als een verkennende data-analyse van een ontdekkingsreiziger die onbekende landen
doorkruist, willen we eerst eenvoudig beschrijven wat we zien. Hier zijn twee principes die ons helpen
bij het organiseren van onze verkenning van een set gegevens.

GEGEVENS VERKENNEN
1. Begin met het onderzoeken van elke variabele op zich. Ga dan verder met het bestuderen
van de relaties tussen de variabelen.
2. Begin met een grafiek of grafieken. Voeg vervolgens numerieke samenvattingen toe van
specifieke aspecten van de gegevens.

De verdeling van een variabele vertelt ons welke waarden hij nodig heeft en hoe vaak hij deze
waarden nodig heeft. De waarden van een categorische variabele zijn labels voor de categorieën. De
verdeling van een categorische variabele geeft een overzicht van de categorieën en geeft ofwel het
aantal of het percentage individuen dat in elke categorie valt. Tellingen worden ook wel frequenties
genoemd en procenten relatieve frequenties. Afrondingsfouten wijzen niet op fouten in ons werk,
maar op het effect van afronding van resultaten.

Kolommen met getallen hebben tijd nodig om te lezen en te interpreteren. Cirkeldiagrammen (pie
chart) zijn lastig met de hand te maken, maar software zal het werk snel voor u doen. Een
cirkeldiagram kan slechts één variabele in één groep tegelijk vertegenwoordigen en moet alle
categorieën bevatten die samen een geheel vormen. We zouden ook een staafdiagram kunnen
maken dat elke infectieziekte vertegenwoordigt door middel van een staafdiagram ter hoogte van een
staaf. Staafdiagrammen zijn bijzonder bedreven in het aangeven van de volgorde en het relatieve
belang van de verschillende categorieën. Omdat de gegevens hier categorisch zijn, kunnen de balken
in de grafiek in elke gewenste volgorde worden gerangschikt.

Cirkeldiagrammen moeten alle categorieën bevatten waaruit ze bestaan. Een geheel (één variabele in
één groep), maar staafdiagrammen zijn flexibeler: ze kunnen worden gebruikt om groepen te
vergelijken en geven niet noodzakelijk alle mogelijke uitkomsten van een variabele weer. Houd er
rekening mee dat deze flexibiliteit impliceert dat staafdiagrammen vaak een grotere uitdaging zijn om
correct te interpreteren. De gestapelde staafgrafiek bestaat ook.

Kwantitatieve variabelen kunnen veel waarden aannemen. De verdeling van een variabele vertelt ons
welke waarden de variabele aanneemt en hoe vaak hij deze waarden aanneemt. Wanneer er meer
dan slechts een paar gegevenspunten zijn, is een grafiek van de verdeling vaak gemakkelijker te
interpreteren als waarden in de buurt worden gegroepeerd. De meest voorkomende grafiek van de
verdeling van één kwantitatieve variabele is een histogram

Volg deze stappen om een histogram te maken van de verdeling van een variabele:
STAP 1. Kies de klassen. Verdeel het bereik van de gegevens in klassen van gelijke breedte. In dit
voorbeeld hebben we ervoor gekozen om de ondergrens en neem de bovengrens op bij het maken
van de histogramklassen. In plaats daarvan kiezen voor het opnemen van de ondergrens en het
uitsluiten van de bovengrens zou ook een geldige optie zijn geweest. Het gaat erom de klassen
precies te specificeren, zodat elk individu in precies één klasse valt. U kunt de aard van de
klassengrenzen uitleggen in de legenda bij uw histogram.
STAP 2. Tel de individuen in elke klas.
STAP 3. Teken het histogram. Grafieken worden doorgaans gemaakt met statistische software in
plaats van met de hand getekend. Het principe is echter voor beide benaderingen precies
hetzelfde. Markeer de schaal voor de variabele waarvan u de verdeling op de horizontale as
weergeeft: de lichaamslengte van de haai in voet. De verticale as bevat ofwel de schaal van tellingen
of de schaal van procenten. Een histogram van in plaats van tellingen is handig als we verschillende
verdelingen willen vergelijken. Elke staaf in het histogram vertegenwoordigt een klasse.

Hoewel histogrammen in sommige opzichten op staafdiagrammen lijken, zijn hun details en gebruik
heel verschillend. Een histogram geeft de verdeling van één kwantitatieve variabele weer. De
horizontale as van een histogram wordt gemarkeerd in de maateenheden voor de variabele. Er moet
een histogram voor een continue kwantitatieve variabele worden getekend zonder extra ruimte tussen
opeenvolgende klassen, om aan te geven dat alle waarden van de variabele zijn gedekt. Een



2

,staafdiagram daarentegen vergelijkt verschillende items die op elke gewenste manier kunnen worden
gerangschikt. Om dit te benadrukken, moet een staafdiagram de items die worden vergeleken
scheiden door wat lege ruimte tussen de staven te laten.

Het maken van een statistische grafiek is geen doel op zich. Het doel van de grafiek is om ons te
helpen de gegevens te begrijpen. Vraag na het maken van een grafiek altijd: "Wat zie ik?" Nadat u
een distributie hebt weergegeven, kunt u de belangrijkste kenmerken als volgt zien.
EEN HISTOGRAM ONDERZOEKEN Zoek in een grafiek met gegevens naar het algemene patroon
en naar opvallende afwijkingen van dat patroon. U kunt het algemene patroon van een histogram
beschrijven aan de hand van de vorm, het middelpunt en de spreiding. Een belangrijk soort afwijking
is een uitbijter, een individuele waarde die buiten het algemene patroon valt.

SYMMETRISCHE EN SCHEEFDE VERDELINGEN Een verdeling is symmetrisch als de rechter- en
linkerkant van het histogram ongeveer spiegelbeelden van elkaar zijn. Een verdeling is scheef naar
rechts, of positief scheef, als de rechterkant van het histogram (met de helft van de waarnemingen
met grotere waarden) veel verder uitsteekt dan de linkerkant. Het is scheef naar links, of negatief
scheef, als de linkerkant van het histogram veel verder uitsteekt dan de rechterkant.

De algemene vorm van een verdeling geeft belangrijke informatie over een variabele. Sommige
variabelen hebben distributies met voorspelbare vormen. Veel distributies hebben onregelmatige
vormen die noch symmetrisch noch scheef zijn. Probeer de klassen van een histogram niet
kunstmatig te manipuleren, zodat de gegevens symmetrischer of regelmatiger lijken. Accepteer in
plaats daarvan dat niet alle gegevens een distributie hebben die een "netjes" patroon volgt, zelfs als je
een grotere dataset zou kunnen krijgen.

Histogrammen zijn niet de enige grafische weergave van kwantitatieve distributies. Dotplots worden
ook vaak gebruikt om de distributie van kwantitatieve gegevens weer te geven, vooral voor kleine
gegevenssets. Ze hebben het extra voordeel dat ze de onbewerkte gegevens weergeven; dat wil
zeggen, ze tonen elk van de waarden in de dataset. Om een dotplot te maken:
1. Sorteer de dataset en plot elke waarneming volgens zijn numerieke waarde langs een
gelabelde geschaalde as.
2. Identieke waarnemingen worden meestal gestapeld.

Een tijdplot van een variabele zet elke waarneming uit tegen het tijdstip waarop deze werd
gemeten. Zet de tijd altijd op de horizontale schaal van je plot en de variabele die je meet op de
verticale schaal. Door de gegevenspunten met lijnen te verbinden, wordt elke verandering in de loop
van de tijd benadrukt. Wanneer je een tijdgrafiek bekijkt, kijk dan nogmaals naar een algemeen
patroon en naar sterke afwijkingen van het patroon, bijvoorbeeld naar bepaalde cycli’s. Histogrammen
en tijdplots geven verschillende soorten informatie over een variabele. De tijdgrafiek in figuur 1.12(b)
geeft tijdreeksgegevens weer die de verandering in jaarlijkse mondiale temperatuurafwijkingen in de
loop van de tijd laten zien. Een histogram toont de distributie van gegevens, zoals de
temperatuurafwijkingen, ongeacht de tijd.

Data zijn de kern van statistiek, maar hoe leg je gegevens vast zodat ze gemakkelijk kunnen worden
geanalyseerd? En wat zijn enkele problemen waar u zich zorgen over zou moeten maken? Deze
opmerking geeft een paar aanwijzingen. Als u hier geen aandacht aan schenkt, kan dit tot rampzalige
resultaten leiden, variërend van het moeten uitvoeren van uw hele analyse, tot het verzamelen van
nieuwe gegevens of het moeten verzamelen van inconsequente bevindingen en het later weer
intrekken ervan. Wetenschappelijke onderzoeken moeten worden gedocumenteerd en u zult een
duidelijke, gedetailleerde registratie van uw bevindingen moeten bijhouden. Dit is een noodzakelijke
bescherming tegen oneerlijk gedrag, maar het is ook een grote hulp bij het invoeren en controleren
van gegevens. Om beschuldigingen van gegevensvervalsing of onenigheid over wie iets als eerste
heeft ontdekt te voorkomen, is het een goede gewoonte om gebonden notitieboekjes met
paginanummers en geschreven datums te gebruiken om gegevens vast te leggen. U kunt ook foto's
van uw bevindingen of werkelijke exemplaren bewaren. De discussie in hoofdstuk 1 over het omgaan
met uitbijters laat zien hoe de eerste stap na het identificeren van een uitbijter is om uw
gegevensrecords en opgeslagen bewijsmateriaal te controleren om te zien of de uitbijter een
typografische of andere eenvoudige fout bij het invoeren van gegevens kan zijn.




3

, Spreadsheetprogramma's zoals Microsoft Excel of LibreOffice Cale worden vaak voor dit doel gebruikt
omdat ze overal verkrijgbaar zijn en omdat ze het mogelijk maken om gegevens, notities en zelfs
afbeeldingen op één handige plek op te slaan. U kunt deze benadering beschouwen als het
elektronische equivalent van uw papieren notitieboekje. Een goede statistische analyse vereist echter
vaak dat uw gegevens op zeer specifieke manieren worden georganiseerd. Statistici zijn het er echter
over het algemeen over eens dat de beste manier om uw gegevens vast te leggen is om één rij voor
elk individu en één rij te gebruiken. Een kolom voor elke variabele.

Zorg er bij het invoeren van categorische waarden voor dat u consistent bent met uw
naamgevingsconventie. Ten slotte zullen er momenten zijn waarop u te maken krijgt met ontbrekende
gegevens. Maar hoe gaat u daarmee om in uw elektronische gegevensbestanden? Het antwoord
hangt helaas af van welke statistische software u gebruikt. Statistici raden soms aan om een speciale
code te gebruiken voor ontbrekende gegevens, zoals 0 of -99 (met verschillende codes voor
verschillende oorzaken voor de ontbrekende gegevens). Dit is een geweldige strategie als de
persoon die de gegevens vastlegt ook de persoon is die de gegevensanalyse uitvoert, maar het kan
desastreus zijn als de persoon die de gegevensanalyse uitvoert niet op de hoogte is van deze
conventie.

Gegevensinvoer stopt niet bij het aanmaken van een elektronisch bestand met gegevenswaarden. U
moet ervoor zorgen dat uw gegevens correct zijn. Zelfs data-entry professionals zijn niet 100%
accuraat. Zo nu en dan kunt u problemen verwachten zoals spellingsverschillen, typefouten of een
overgeslagen rij. Het echte probleem is ze te vangen. Al uw gegevenswaarden moeten realistisch zijn
of op zijn minst biologisch aannemelijk. De beste manier om een fout als een onmogelijke
hoogtewaarde op te vangen, is door uw gegevens te plotten. Stemplots, dotplots en histogrammen
zijn uitstekende manieren om ongebruikelijke of onwaarschijnlijke waarden te zien. Tijdgrafieken voor
gegevens die over een bepaalde periode zijn verzameld, zijn ook nuttig om gebeurtenissen te
onthullen die het gegevensverzamelingsproces hebben beïnvloed. Als uw gegevens categorisch zijn,
verkrijg dan een samenvattende frequentietabel.

Maak niet dezelfde fout. Als u uw gegevens niet plot en zorgvuldig controleert voordat u verdere
statistische analyses uitvoert, kunt u veel tijd en energie verspillen en, veel erger, tot verkeerde
conclusies komen. Wees slim. Plot uw gegevens!

SAMENVATTING
- Een dataset bevat informatie over een aantal personen. Individuen kunnen mensen, dieren of
dingen zijn. Voor elk individu geven de gegevens waarden voor een of meer variabelen. Een
variabele beschrijft een kenmerk van een persoon, zoals iemands lengte, geslacht of leeftijd.
- Sommige variabelen zijn categorisch en andere kwantitatief. Een categorische variabele
plaatst elk individu in een categorie, zoals mannelijk of vrouwelijk. Een kwantitatieve
variabele heeft numerieke waarden die een kenmerk van elk individu meten, zoals lengte in
centimeters of leeftijd in jaren.
- Verkennende data-analyse maakt gebruik van grafieken en numerieke samenvattingen om de
variabelen in een dataset en de relaties daartussen te beschrijven.
- Nadat u de achtergrond van uw gegevens (individuen, variabelen, meeteenheden) begrijpt, is
het eerste dat u bijna altijd moet doen, uw gegevens plotten.
- De verdeling van een variabele beschrijft welke waarden de variabele aanneemt en hoe vaak
deze deze waarden aanneemt. Cirkeldiagrammen en staafdiagrammen geven de verdeling
van een categorische variabele weer. Staafdiagrammen kunnen ook elke reeks
hoeveelheden vergelijken die in dezelfde eenheden zijn gemeten. Histogrammen en dotplots
geven de verdeling van een kwantitatieve variabele weer.
- Zoek bij het onderzoeken van een grafiek naar een algemeen patroon en naar opmerkelijke
afwijkingen van het patroon.
- Vorm, middelpunt en spreiding beschrijven het algemene patroon van de verdeling van een
kwantitatieve variabele. Sommige distributies hebben eenvoudige vormen, zoals symmetrisch
of scheef. Niet alle distributies hebben een eenvoudige algemene vorm. Het kan bijzonder
uitdagend zijn om de vorm van een verdeling te beschrijven wanneer er weinig waarnemingen
zijn.
- Uitbijters zijn waarnemingen die buiten het algemene patroon van een verdeling liggen. Zoek
altijd naar uitschieters en probeer deze te verklaren.




4

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller saapkelisannebakker. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.96. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

67474 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$6.96
  • (0)
  Add to cart