Dit is een samenvatting van de kennisclip over het berekenen van afstanden tussen vectoren volgens verschillende methodes, zoals de Manhattan distance en Euclidean distance. Andere begrippen die naar voren komen, zijn afstandsmatrix, Pythagoras, vectoren, magnitude, patroon, correlatie, Pearson, si...
Kennisclip: afstand tussen vectoren
Hoeveelheid metingen, vaak wordt de expressie van genen of de
samenstelling van een microbioom onderzocht in de mens. Dit levert heel
erg veel data op. Zo is in de afbeelding een fractie van de resultaten van
een onderzoek geplaatst waarbij gekeken is naar de expressie van genen
in verschillende samples. Als je de overeenkomst tussen samples of genen
wil berekenen, moet je de afstanden bepalen tussen samples of genen.
Symmetrical distance matrix, door alle afstanden in de resultaten te
bepalen, krijg je een symmetrische afstandsmatrix. De matrix van de resultaten is rechts
weergegeven.
Afstand berekenen, je bepaalt de afstand tussen twee genen door ze bijvoorbeeld op twee
assen weer te geven zoals met g004 en g011 is gedaan in sample 1 en 2. De punten zijn
bepaald door eerst langs de as van sample 1 te kijken en daarna verticaal omhoog te gaan
langs de sample 2 as. M.b.v. de theorie van Pythagoras kan je dan
de afstand bepalen.
Pythagoras, simpel gezegd luidt zijn formule als volgt:
A 2 + B2=C 2 . Als je dit toe gaat passen op de situatie is dat dus
2 2 2
gelijk aan: (Y a−Y b) +( X a− X b ) =d ab . Het maakt hierbij niet
uit of Ya groter is dan Yb, want door het kwadraat wordt de uitkomst
positief. De uiteindelijke formule voor de afstand is dus:
√(Y a −Y b )2 +( X a −X b )2=d ab
Manhattan distance, het is niet altijd het geval dat je via een rechte
lijn de afstand af kan leggen en dan komt de Manhattan distance van
pas. Hierbij wordt het gedeelte van de x as als het ware opgeteld bij
dat van de y as. In de plattegrond is dit weergegeven en hier hoort
de volgende formule bij: d ab =| X a− X b|+|Y a−Y b| .
Vectoren, als je de expressie wil bekijken in meer dan 2 samples,
is het handig om de representatie van deze genen in een
multidimensionale ruimte te kijken. Je ziet dat er nu 3 samples
gebruikt worden en dit moet je in je hoofd dan ook
multidimensionaal bekijken. Gen 004 wordt nu als een vector
i.p.v. een punt getekend, omdat we dan makkelijker de afstanden
tussen verschillende genen kunnen berekenen. In de afbeelding
zijn g004, g011 en g078 weergegeven in sample 1, 2 en 3. Als je
dit in meer samples wil bekijken, komen er steeds meer assen bij
(zwarte pijlen). De expressie is ook nog eens weergegeven in een
grafiek.
Magnitude, als je de genen wil vergelijken is het belangrijk om te bepalen op welke
manier je ze wil bekijken. Als je naar de magnitude (hoeveelheid) kijkt, kom rood en
paars overeen in veel samples. Als we hoeveelheden vergelijken, kunnen we de
afstand berekenen met de Euclidean en Manhattan distance.
Patroon, je kan ook naar het expressiepatroon kijken en dan zijn rood en blauw
erg hetzelfde. In het assen systeem is dit te zien, doordat rood en blauw
dezelfde kant op wijzen. Als je correlatie gaat bekijken, kan je de Pearson
methode gebruiken.
Euclidean distance, Euclid heeft de theorie van Pythagoras naar meerdere
dimensies uitgebreid. Hierbij is de afstand tussen twee punten de wortel van
het kwadraat van de afstand tussen deze punten in elke dimensie. Dat ziet er als
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller brittheijmans. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.21. You're not tied to anything after your purchase.