« Formel för klackhöjd | Main | Ny Technorati-beta »

mars 21, 2004

Fylogenetiska träd

I veckans Vetenskapsradion (cirka 21:46 minuter in i programmet) har Per Helgesson en krönika om likheter mellan biologisk evolution och språklig evolution, och den nytta forskare inom de olika fälten kan ha av varandra.

Tack Peter Lindberg för påminnelse och pek till programmet. Peter skrev tidigare idag Using Evolutionary Ideas in Linguistics som troligen var inspirerad av samma program.

Både i programmet och i Peters anteckning nämns forskaren Russell Gray som analyserat de indoeuropeiska språkens utveckling och byggt upp släktschema för dessa språk.

Lite mer om Russell Gray finns här:
Russell Current Research Projects
Publications.
På sidan Russell Gray's Data finns datafiler från Russell Gray och Quentin Atkinson Language-tree divergence times support the Anatolian theory of Indo-European origins (PDF).


Fylogenetiska träd
De släktschema, evolutionära träd, som Gray använt kallas för fylogenetiska träd (phylogenetic trees). Jag kikade lite på dessa för några år sedan och samlade en del referenser varav några presenteras nedan.


Bakgrund till intresset
För en liten bakgrund: Intresset triggades troligen av en analys av kedjebrev (Charles Bennett, Ming Li, Bin Ma: Linking Chain Home Page) och som senare skrevs om i Kedjebrevsanalys. Det gjorde mig f.ö. även intresserad av det vidare området computational biology.

Till detta kom en gammal fascination av metriker för att mäta avstånd i datamängder. Se t.ex. Lord of the Strings som beskriver ett försök att mäta vilket naturligt språk som är närmast Tolkiens uppfunna språk.


Sajter och dokument
Här är några av de sajter och texter som då hittades. Den som har tips på nyare och bättre introduktionstexter i detta ämne får gärna höra av sig.

Phylogeny and Reconstructing Phylogenetic Trees med en Java Applet samt kod.

Phylogeny (PDF), från kursen Introduction to Computational Molecular Biology and Genomics.

Susan Holmes Phylogenesis - An overview (ps-fil). Holmes har nämnts tidigare i andra sammanhang, se t.ex. Diaconis om myntsingling, Redan de gamla grekerna höll på med kombinatorik samt Brian Arthur: Lock-in och El Farol.

The Tree of Life Web Project A collaborative Internet project containing information about phylogeny and biodiversity.


Icke-biologiska tillämpningar
Egentligen är jag inte så intresserad av ren biologisk data utan analys av annan data, t.ex. texter såsom kedjebrev och andra artefakter som snarare tillhör memetiken.

Phylogenetic methods for evolutionary economics

New methods of editing, exploring, and reading The Canterbury Tales

Länkar till fler icke-biologiska skrifter som använder liknande metoder finns på Phylogenetics Everywhere


Program
Det finns naturligtvis en mängd program för att analysera och simulera sådana träd. Några som har tittats på:

Statistiksystemet R har paket för manipulation av sådana träd. Se paketlistan (obs stor fil!) och sök på "phylogenetic".

PHYLIP, PHYLogeny Inference Package med dess dokumentation och exempel.


Slutnot
Dessa fylogenetiska träd har länge legat i bakhuvudet och inte en gång utan flera gånger de senaste månaderna har de dykt upp, t.ex. att försöka skapa träd för att visa hur olika nyheter på webben/bloggarna utvecklas (jämför med Hur nyheter sprids på Internet), eller visa "släktskapen" mellan de svenska bloggarna genom att titta på länkar och vilka nyheter som citeras mellan dem.

Posted by hakank at mars 21, 2004 09:15 EM Posted to Memetik | Statistik/data-analys

Comments

Jag samlar länkar om computational biology på min hemsida http://www.ifm.liu.se/~hallen Det är ett spännande men inte helt definierat område. Kan kallas beräkningsbiologi, systembiologi och ibland även det gamla hederliga bioinformatik. Här samlas folk med olika bagrunder, bioinformatiker, dataloger, matematiker, biologer, ingenjörer mm.

Vad det gäller fylogenetiska träd så gjorde jag ett över föreläsarna vid en träff på institutionen. Det baserades på nyckelord de använde och man fick faktiskt rätt fina (forskar)gruppsindelningar och kopplingar mellan grupper.

Posted by: Kristofer at mars 22, 2004 08:22 FM

Tack för länken, Kristofer.

[För den som inte vet bloggar Kristofer också på den trevliga bloggen Explikation, http://explikation.blogspot.com/ som pingar weblogs.se.]

Ditt träd över föreläsarna låter som något helt i min smak.

I går kollade jag faktiskt på både din hemsida och Explikation om det fanns något speciellt skrivet om fylogenetiska träd, men hittade där inget. Där finns ju mycket annat intressant.

En fråga när du ändå är på tråden:
Har du någon bra bok (eller bättre länk än de nämnda) att rekommendera vad gäller specifikt dessa träd eller bioinformatik i allmänhet? Gärna med inriktning mot icke-biologer, t.ex. dataloger.

Jag har redan några böcker i ämnet, men det är alltid intressant med tips från någon som är insatt i ämnet.

Böcker som inköpts och fläckvis lästs:
Pierre Baldi, Sören Brunak: "Bioinformatics - The machine learning approach", 1998
Joao Setubal, Joao Meidanis: "Introduction to
Computational Molecular Biology", 1997
Attwood, Parry-Smith: "Introduction to Bioinformatics", 1999


Posted by: Håkan Kjellerstrand at mars 22, 2004 09:13 FM

Två böcker som innehåller både bioinfo och träd är:

Biological Sequence Analysis http://www.binf.ku.dk/users/krogh/books.html
med kapitel som Building phylogenetic trees och Probabilistic approaches to phylogeny

Warren J. Ewens & Gregory J. Grant: StatisticaL Methods in Bioinformatics. http://www.amazon.com/gp/reader/0387952292/ref=sib_int_redir/002-9669572-6614428?v=look-inside&s=books#reader-link innehåller ett kapitel om träd.

Phylip har ju mycket länkar. http://evolution.genetics.washington.edu/phylip.html

Trädet med klustrade föreläsare gjordes på skämt men jag kan lägga upp det om intresse finns.

Posted by: Kristofer at mars 22, 2004 09:49 FM

Tack för boktipsen, Kristofer. Jag ska kika på dem.

Det vore skoj om du lade upp trädet. Om det finns möjlighet får du får gärna lägga upp datafilerna också. I alla fall jag är intresserad av dem.


(Personligen tycker jag att forskning som görs "på skämt" kan vara minst lika intressant som annan forskning...)

Posted by: Håkan Kjellerstrand at mars 22, 2004 10:03 FM