Samenvatting

Samenvatting HCO permutatie statistieken

Name: HCO permutatie statistieken
SKU: doc_403032
Rating: 4.25 (4 reviews)
Author: brittheijmans

4 beoordelingen

58 keer bekeken 0 keer verkocht

Vak
Systeembiologie

Instelling
Universiteit Utrecht (UU)

Dit is een samenvatting van het onderwerp permutatie statistieken. De volgende begrippen komen aan bod: statistiek, data permutatie, score, P-waarde, E-waarde etc.

[Meer zien]

Voorbeeld 1 van de 3 pagina's

Bekijk voorbeeld

Geupload op 3 maart 2018
Aantal pagina's 3
Geschreven in 2017/2018
Type Samenvatting

4 beoordelingen

Door: et98 • 6 jaar geleden

Door: bartodijk30 • 3 jaar geleden

Door: thibaudtegroen • 6 jaar geleden

Door: sanneejanssen • 6 jaar geleden

Volgen

brittheijmans Lid sinds 7 jaar 629 documenten verkocht

308

148

€2,99

Ook beschikbaar in voordeelbundel v.a. €10,49

Toegevoegd

In winkelwagen Op verlanglijstje

100% tevredenheidsgarantie
Direct beschikbaar na betaling
Zowel online als in PDF
Je zit nergens aan vast

Ook beschikbaar in voordeelbundel (1)

Systeembiologie deeltoets 1

(2)

€ 41,86 € 10,49

30x verkocht

14 items

1. Samenvatting - Hco inleiding bio-informatica
2. Samenvatting - Hco biologie als een datawetenschap
3. Samenvatting - Hco praten tegen computers
4. Samenvatting - Kennisclip afstand tussen vectoren
5. Samenvatting - Kennisclip file formats
6. Samenvatting - Hco dimensies in data
7. Samenvatting - Hco fylogenetische bomen
8. Samenvatting - Hco conservatie
9. Samenvatting - Hco kwantificeren van sequentie similarity
10. Samenvatting - Hco algoritmes voor sequentie alignments
11. Samenvatting - Hco heuristic searches
12. Samenvatting - Hco fylogenetische interferentie
13. Samenvatting - Hco permutatie statistieken
14. Samenvatting - Dwo opgaven kansberekening
Meer zien

HCO permutatie statistieken
Verwantschap virussen, in dit voorbeeld worden de virussen uit het bottum up
onderzoek van Bas Dutilh weer gebruikt. In dit voorbeeld wordt gekeken naar de
verwantschappen tussen de virussen van verschillende personen. Hier zie je 4
families bestaande uit een moeder (M) en twee tweelingdochters (T1 & T2). Hier is
onderzocht op crAssphage meer verwant was tussen personen uit dezelfde familie
of niet. In de boom is te zien dat sommige crAssphages inderdaad verwant zijn
binnen de families. Zo zie je dat F1 geheel samen geclusterd is en dat van de
andere twee families steeds 2 personen samen zitten. Het is moeilijk om met deze boom te bepalen
of crAssphages binnen families nauw verwant zijn of niet. De vraag is hier of ze meer verwant aan
elkaar zijn dan je zou verwachten.
Statistiek, als we het in statistiek over verwantschap hebben, zijn virussen ‘closely related’ als ze
meer verwant zijn dan verwacht. De nulhypothese zou zijn dat hetgeen wat je ziet niet te
onderscheiden is van een random verdeling. Zaken die hierbij belangrijk kunnen zijn, zijn het aantal
blaadjes in de boom, de vorm van de boom, het aantal families en familieleden in de analyse en
mogelijk nog vele alle andere variabelen. De vorm van de boom heeft invloed op de nulhypothese
doordat je bij een clumped boom bijvoorbeeld sneller een clustering kan verwachting dan bij een
single linkage clustering, omdat hierbij steeds één takje wordt toegevoegd en de clustering veel
minder duidelijk is. Om vragen als bovenstaand voorbeeld op te lossen, kan je data permutatie
gebruiken.
Data permutatie, hierbij hussel je de blaadjes van de boom een groot aantal keer. Je houdt de vorm,
het aantal families en het aantal familieleden dus hetzelfde, maar je husselt de blaadjes omdat je
vraag op de clustering van de blaadjes is gericht. Als je hierbij een willekeurige boom creëert, heb je
als het ware een nulhypothese opgesteld. Bij alle random bomen die dan naar voren zijn gekomen,
registreer je of de clustering van de familieleden beter is dan de originele boom of niet. Als ze in de
random bomen vaak beter clusteren, geeft dat aan dat ze origineel gezien niet zo goed clusterden. Als
je bijna nooit een betere clustering tegenkomt, suggereert dat dat de oorspronkelijke boom al goed
geclusterd was. Dit kan met meerdere zaken dan alleen de blaadjes van een boom gebeuren.
Score, om de bomen te vergelijken, heb je een score die de clustering beoordeelt nodig. Denk hierbij
bijvoorbeeld aan:
- Het aantal blaadjes wiens dichtstbijzijnde blaadje van dezelfde familie is.
- Het aantal takken dat je van een boom af kan breken die blaadjes van één familie bevatten.
- Het minimum aantal takken dat je moet verwisselen om de boom ‘perfect’ te maken.
- Etc…
Deze score noemen we de statistic. Voor sommige bio-informatische vragen zijn al robuuste
statistieken gemaakt, maar je kan ze ook zelf verzinnen.
Score & voorbeeld, als we weer teruggaan naar het voorbeeld moeten we aan elke random boom
een score toedienen. Hier kan je een scoreverdeling van maken en dat is rechts ook weergegeven.
Het is de bedoeling dat je hierbij een bel curve krijgt waarin de score soms laag of hoog is en over het
algemeen gemiddeld is.
P-waarde, als je dan in de bel curve aan gaat geven waar jouw originele boom
scoort, levert dat de P waarde op. Het oppervlakte van het paarse gedeelde geeft
de P-waarde aan, aangezien we ervan uit gaan dat het totale oppervlakte van de
bel curve 1 is (100%). De reden dat langs de Y-as de relatieve frequentie
aangegeven wordt, is omdat de som van alles gelijk is aan 1. De P-waarde geeft de
waarschijnlijkheid aan van het vinden van een even goede of betere score dan de
originele door kans. Als de random gepermuteerde data zelden een hogere score dan de originele
score heeft, is de P-waarde laag en is je observatie van significant belang. Als de P-waarde heel hoog
is, is je observatie van geen enkele betekenis. De clustering van de virusboom zou dan dus niet
significant meer zijn dan verwacht.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper brittheijmans. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 67866 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen

Populaire Universiteiten

Populaire Hogescholen

Populaire Scholen

Populaire samengevatte studieboeken voor Communicatie en Taal

Populaire samengevatte studieboeken voor Economie en Bedrijf

Populaire samengevatte studieboeken voor Exact en Informatica

Populaire samengevatte studieboeken voor Gedrag en Maatschappij

Populaire samengevatte studieboeken voor Gezondheid en Geneeskunde

Populaire samengevatte studieboeken voor Onderwijs en Opvoeding

Populaire samengevatte studieboeken voor Recht en Bestuur

De beste samenvattingen om je Wft-diploma te behalen

De beste samenvattingen om je theorie examens te behalen

De beste samenvattingen voor je cursus in de Veiligheidsbranche

De beste samenvattingen voor Gezondheid & Hygiëne cursussen

De beste samenvattingen voor zakelijke cursussen

De beste samenvattingen voor je PABO WisCAT cursus

Populaire vakken

Populaire vakken

Populaire vakken

Boekverslagen en samenvattingen

Samenvatting

Samenvatting HCO permutatie statistieken

Document informatie

Onderwerpen

Geschreven voor

4 beoordelingen

Verkoper

Ontvangen beoordelingen

Voorbeeld van de inhoud

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Snel en makkelijk kopen

Focus op de essentie

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?