Projektbeskrivelse
Et fylogenetisk (eller evolutionært) træ gengiver den evolutionære historie for en række organismer. Med andre ord repræsenterer det en teori om hvilke arter og/eller gener der er tættest beslægtet med hinanden, og hvilke der er mere fjernt beslægtede. Fylogenetiske træer kan blandt andet konstrueres på basis af molekylære data, f.eks. DNA-sekvensen af et givet gen fra en række arter. Der findes en række beregningsmæssige metoder til at løse dette problem. To vigtige metoder er de såkaldt afstandsbaserede metoder og maximum likelihood.
Kort fortalt virker afstandsmetoder ved først at beregne afstanden mellem de sekvenser man analyserer (hvor afstanden mellem to sekvenser betyder antallet af mutationer der skal til at ændre den ene sekvens til den anden) og derefter konstruere et træ således at alle de parvise afstande mellem sekvenserne målt langs træet er så tæt som muligt på de beregnede afstande (på grund af støj i data er det ikke altid muligt præcist at opnå dette). Maximum likelihood er baseret på en statistisk model for hvordan sekvenser ændres (disse modeller har bl.a. parametre for hvor hurtigt nukleotider muterer til andre slags nukleotider) og træet findes ved hjælp af forskellige former for statistisk model fitning.
Projektforslag
Baggrundsmateriale
Introduktion til molekylær evolution på CBS
Beskrivelse af FASTA-formatet:
Introduktion til sekvensalignment:
Sekvensalignmentdefinitioner
Se projektet om Alignment af DNA- og proteinsekvenser
Vejledning til ClustalW:
Metoder til trækonstruktion (på engelsk):
Værktøjer
ClustalW, multiple sekvensalignment
PHYLIP, afstandsbaserede metoder til trækonstruktion.
fastDNAml, maximum likelihood metode til trækondtruktion for DNA
PhyML, maximum likelihood metode til trækonstruktion for DNA eller protein.
Datasæt
Sekvenser fra diverse hvaler + ko, flodhest og kamel
Sekvenser fra hominoider
Kontaktperson
Anders Gorm Pedersen
Ansvarlig:
...